PHP 中mb_get_info 函數怎麼用？用它來查看和處理文件編碼的方法詳解

gitbox 2025-05-11

在處理多語言文本或需要確保字符編碼一致性的PHP 項目中， mbstring擴展扮演了關鍵角色。而其中的mb_get_info()函數，是一個非常實用的工具，它能讓你快速查看當前mbstring的配置信息，為排查字符編碼問題提供重要參考。

一、mb_get_info() 是什麼？

mb_get_info()是PHP 中mbstring擴展提供的一個函數，用於獲取當前多字節字符串環境的配置信息。

文法:

 mb_get_info(string $type = null): array|string|false

$type ：可選參數，指定要獲取的信息類型。如果為空，則返回所有信息（以關聯數組形式返回）。
返回值：當指定$type時，返回一個字符串；如果未指定，返回關聯數組。

示例輸出：

 print_r(mb_get_info());

輸出類似如下內容：

 Array
(
    [internal_encoding] => UTF-8
    [http_input] => pass
    [http_output] => pass
    [input_encoding] => UTF-8
    [output_encoding] => UTF-8
    [language] => neutral
    [encoding_translation] => Off
)

這表示當前腳本中，PHP 使用的字符編碼為UTF-8。

二、如何使用mb_get_info 來檢查文件編碼

雖然mb_get_info()本身不會直接讀取文件的編碼，但我們可以將它與其他函數（如mb_detect_encoding() ）結合使用，來處理文本文件的編碼判斷與轉換。

步驟1：讀取文件內容

$content = file_get_contents('sample.txt');

步驟2：檢測編碼類型

$encoding = mb_detect_encoding($content, mb_list_encodings(), true);
echo "原始編碼：$encoding\n";

步驟3：必要時轉換為統一編碼（例如UTF-8）

 if ($encoding !== 'UTF-8') {
    $content = mb_convert_encoding($content, 'UTF-8', $encoding);
    file_put_contents('sample_utf8.txt', $content);
    echo "已轉換為 UTF-8 並保存到新文件。\n";
}