PHPによる文字列から漢字を除去する方法の詳細な説明

gitbox 2025-08-07

中国の弦は何ですか？

漢字を削除する方法を説明する前に、まず中国の弦の定義を理解してください。中国の文字列は、漢字で構成される文字列です。通常、各漢字は2バイトを占有し、Unicodeでエンコードされます。これは、文字列を扱う際にキャラクターエンコードの問題に特に注意が必要です。

PHPで中国の弦を削除する方法

正規表現を使用して漢字を削除します

正規表現は、文字列の漢字に一致して削除できます。これは、正規表現を使用して中国語を削除する方法を示すサンプルコードです。

 $str = "Hello, こんにちは！";
$str = preg_replace('/[\x{4e00}-\x{9fa5}]/u', '', $str);
echo $str; // 出力: Hello, !

分析：ここでの正規表現はすべての漢字と一致し、UTF-8エンコーディングサポートはUパラメーターを使用して有効になります。 preg_replace関数は、一致した中国語を空の文字列に置き換えて、削除関数を実現する責任があります。

MB_Substr関数を使用して、中国の弦を削除します

MB_SUBSTRは、マルチバイト文字列インターセプト関数です。中国語を直接除去することはできませんが、特定の傍受技術を通じて除去効果を達成することもできます。例は次のとおりです。

 $str = "Hello, こんにちは！";
$str = mb_substr($str, 0, 0, 'UTF-8') . mb_substr($str, 0, 0, 'UTF-8');
echo $str; // 出力: Hello, !

分析：このメソッドは、文字列の長さを0にインターセプトし、空の文字列を返します。この例のコード効果は限られていますが、実際の開発では正規表現方法がより推奨されます。

preg_replace_callback関数を使用して、漢字を削除します

preg_replace_callback関数は、一致する文字列のカスタム処理を可能にし、漢字を削除するために使用できます。例は次のとおりです。

 $str = "Hello, こんにちは！";
$str = preg_replace_callback('/[\x{4e00}-\x{9fa5}]/u', function($matches) {
    return "";
}, $str);
echo $str; // 出力: Hello, !

分析：この関数は、コールバックメカニズムを使用して、一致する漢字を空の文字列に置き換えて、中国語を除去する効果を実現します。

要約します

この記事では、PHPの文字列の漢字を削除する3つの方法、つまり、MB_Substrとの傍受、Preg_replace_callbackコールバック処理に基づくpreg_replaceを紹介します。実際のアプリケーションでは、正規表現方法はより簡潔で効率的であるため、最初に使用することをお勧めします。操作するときは、文字列のエンコード形式に注意を払う必要があります。これは、UTF-8エンコードが文字化けされたコードを避けるために使用されるようにします。