mb_strcut函數的基本用法是什麼？教你輕鬆掌握多字節字符串截取技巧

gitbox 2025-05-26

在PHP中，處理多字節字符串（如中文、日文、韓文等）時，普通的字符串函數可能會出現截斷亂碼的問題。為了解決這一難題，PHP提供了mb_strcut函數，它專門用於多字節字符串的截取。本文將詳細介紹mb_strcut的基本用法，並通過示例幫你輕鬆掌握多字節字符串的截取技巧。

什麼是mb_strcut函數？

mb_strcut函數是PHP多字節字符串函數庫中的一員，主要作用是從字符串的指定字節位置開始截取指定長度的字節數，適合處理多字節字符集。它的截取是基於字節的，但會保證不會把多字節字符截成半個，從而避免亂碼。

其函數簽名如下：

 mb_strcut(string $str, int $start, ?int $length = null, ?string $encoding = null): string

$str ：要截取的字符串。
$start ：起始位置，單位是字節。
$length ：截取的長度，單位是字節。如果省略，則截取到字符串末尾。
$encoding ：字符串的編碼，默認是內部編碼（通常是UTF-8）。

mb_strcut與mb_substr的區別

雖然mb_strcut和mb_substr都能截取多字節字符串，但它們的邏輯不同：

mb_substr按字符數截取字符串（例如截取第3個字符開始的5個字符）。
mb_strcut按字節數截取字符串（避免截斷多字節字符導致亂碼）。

舉個例子，假如字符串中包含中文，一個中文字符在UTF-8編碼中佔3個字節，使用mb_strcut指定的字節範圍更細粒度，截取時不會出現字符拆開的情況。

mb_strcut基本用法示例

下面是一個簡單的示例，展示如何用mb_strcut截取中文字符串。

 <?php
$text = "你好，世界！"; // 這是一句中文，含有多字節字符
// 按字節截取，起始位置0，長度6位元組
$result = mb_strcut($text, 0, 6, 'UTF-8');
echo $result; // 輸出 "你好"
?>

解釋：

中文“你”和“好”各佔3個字節，截取6個字節正好是2個完整漢字。
如果用substr函數截取6個字節，可能會截斷字符導致亂碼。

實際應用中的技巧

避免亂碼：在處理含有多字節字符的字符串時，優先使用mb_strcut ，確保截取結果不會破壞字符結構。
指定編碼：建議始終指定編碼參數，通常為UTF-8 ，防止因默認編碼不同引起的問題。
結合strlen使用：若要截取字符串的前半部分，可以先用mb_strlen獲取字符長度，再用mb_strcut確定對應的字節長度。

結合URL示例

假設你要從一個多字節字符串中截取並拼接一個URL，可以這樣寫：

 <?php
$text = "訪問我們的官網：";
$url = "https://gitbox.net/path/to/resource";
$result = mb_strcut($text, 0, 12, 'UTF-8'); // 截取6个中文字符的位元組長度
echo $result . $url;
?>

輸出：

 訪問我們的官網：https://gitbox.net/path/to/resource

總結

mb_strcut是處理多字節字符串截取的理想函數，按字節截取且不會截斷字符。
它適合處理UTF-8編碼的中文、日文等字符串，避免亂碼。
使用時建議明確指定編碼參數，確保兼容性。
結合實際應用，可以輕鬆截取字符串並拼接URL或其他內容。

掌握了mb_strcut ，你就能更好地處理多字節字符串，提升PHP程序的健壯性和用戶體驗。