Aktueller Standort: Startseite> Neueste Artikel> Kann Convert_cyr_string sauberer Text konvertieren? Versuchen Sie, die Reinigung mit str_replace zu codieren

Kann Convert_cyr_string sauberer Text konvertieren? Versuchen Sie, die Reinigung mit str_replace zu codieren

gitbox 2025-09-17

In PHP sind die Codierungsumwandlung und Reinigung von Saiten sehr häufig. Wie man die Richtigkeit und Konsistenz von Zeichen beibehält, ist eine Herausforderung, wenn es um Text in verschiedenen Codierungsformaten geht, insbesondere wenn plattformübergreifende Anwendungen oder externe Datenquellen beteiligt sind. convert_cyr_string und str_replace sind beide nützliche Werkzeuge in PHP. Heute werden wir untersuchen, wie sie zusammenarbeiten, um Codierungsreinigung und Textnormalisierung zu erreichen.

Übersicht über die Funktion convert_cyr_string

convert_cyr_string ist eine Funktion in PHP für die cyrillische Codierungsumwandlung. Cyrillic ist ein Buchstabensystem, das in vielen osteuropäischen Sprachen verwendet wird. convert_cyr_string ist besonders nützlich, wenn Sie sich mit Text, der russische oder andere kyrillische Buchstaben enthält, zu tun hat.

Der Prototyp dieser Funktion ist:

 <span><span><span class="hljs-title function_ invoke__">convert_cyr_string</span></span><span> ( </span><span><span class="hljs-keyword">string</span></span><span> </span><span><span class="hljs-variable">$str</span></span><span> , </span><span><span class="hljs-keyword">string</span></span><span> </span><span><span class="hljs-variable">$from</span></span><span> , </span><span><span class="hljs-keyword">string</span></span><span> </span><span><span class="hljs-variable">$to</span></span><span> ) : </span><span><span class="hljs-keyword">string</span></span><span>
</span></span>
  • $ str : Die zu konvertierte Zeichenfolge.

  • $ von : Source Coding, kann 'koi8-r' , 'win-1251' usw. sein.

  • $ to : Zielcodierung, wie 'KOI8-R' , 'UTF-8' , usw.

Nehmen wir beispielsweise an, wir haben ein in KOI8-R codiertes Text, das wir über convert_cyr_string in UTF-8-Codierung konvertieren können:

 <span><span><span class="hljs-variable">$text</span></span><span> = </span><span><span class="hljs-string">"Привет мир"</span></span><span>; </span><span><span class="hljs-comment">// KOI8-R Codierung</span></span><span>
</span><span><span class="hljs-variable">$converted_text</span></span><span> = </span><span><span class="hljs-title function_ invoke__">convert_cyr_string</span></span><span>(</span><span><span class="hljs-variable">$text</span></span><span>, </span><span><span class="hljs-string">'koi8-r'</span></span><span>, </span><span><span class="hljs-string">'utf-8'</span></span><span>);
</span><span><span class="hljs-keyword">echo</span></span><span> </span><span><span class="hljs-variable">$converted_text</span></span><span>; </span><span><span class="hljs-comment">// Ausgabe:Привет мир</span></span><span>
</span></span>

Verwenden Sie Str_Replace , um unnötige Zeichen zu reinigen

Zusätzlich zur Codierungskonvertierung müssen wir auch unnötige Zeichen in der Zeichenfolge aufräumen, z. B. Sonderzeichen, Zeilenpausen oder andere nicht erkannte Codierungen. In diesem Fall kann Str_Replace uns helfen, diese Zeichen zu ersetzen oder zu entfernen.

Die Funktion str_replace ist ein Werkzeug, das in PHP verwendet wird, um Zeichenfolgen zu ersetzen. Sein Prototyp ist:

 <span><span><span class="hljs-title function_ invoke__">str_replace</span></span><span>( </span><span><span class="hljs-keyword">mixed</span></span><span> </span><span><span class="hljs-variable">$search</span></span><span> , </span><span><span class="hljs-keyword">mixed</span></span><span> </span><span><span class="hljs-variable">$replace</span></span><span> , </span><span><span class="hljs-keyword">mixed</span></span><span> </span><span><span class="hljs-variable">$subject</span></span><span> ) : </span><span><span class="hljs-keyword">mixed</span></span><span>
</span></span>
  • $ Search : Das Zeichen oder die Zeichenfolge, nach denen gesucht werden muss.

  • $ ersetzen : ein Zeichen oder eine Zeichenfolge, die zum Austausch verwendet wird.

  • $ Betreff : Die ursprüngliche Zeichenfolge, um den Ersatzvorgang durchzuführen.

Zum Beispiel können wir Str_Replace verwenden, um alle Newline -Zeichen in einer Zeichenfolge mit Leerzeichen zu ersetzen oder unnötige Räume zu löschen:

 <span><span><span class="hljs-variable">$text</span></span><span> = </span><span><span class="hljs-string">"Hello, \nWorld! \tThis is PHP."</span></span><span>;
</span><span><span class="hljs-variable">$cleaned_text</span></span><span> = </span><span><span class="hljs-title function_ invoke__">str_replace</span></span><span>(</span><span><span class="hljs-keyword">array</span></span><span>(</span><span><span class="hljs-string">"\n"</span></span><span>, </span><span><span class="hljs-string">"\t"</span></span><span>), </span><span><span class="hljs-string">' '</span></span><span>, </span><span><span class="hljs-variable">$text</span></span><span>);
</span><span><span class="hljs-keyword">echo</span></span><span> </span><span><span class="hljs-variable">$cleaned_text</span></span><span>; </span><span><span class="hljs-comment">// Ausgabe:Hello, World! This is PHP.</span></span><span>
</span></span>

convert_cyr_string und str_replace werden zusammen verwendet

convert_cyr_string und str_replace funktionieren gut zusammen, wenn wir gleichzeitig die Codierung und Reinigung unnötiger Zeichen konvertieren müssen. Angenommen, Sie haben einen Text, der kyrillische Zeichen enthält , und dieser Text enthält auch einige ungültige Zeichen, z. B. zusätzliche Zeilenpausen oder nicht gedruckte Zeichen.

Angenommen, Sie haben einen Text, der KOI8-R-Codierung enthält, mit Zeilenpausen und zusätzlichen Räumen, hier ein Beispiel für die Reinigung:

 <span><span><span class="hljs-variable">$text</span></span><span> = </span><span><span class="hljs-string">"Привет \nмир! \tЭто \tтестовый \nтекст."</span></span><span>;
</span><span><span class="hljs-comment">// Setzen Sie es an die erste Stelle KOI8-R Codierung转换为 UTF-8</span></span><span>
</span><span><span class="hljs-variable">$converted_text</span></span><span> = </span><span><span class="hljs-title function_ invoke__">convert_cyr_string</span></span><span>(</span><span><span class="hljs-variable">$text</span></span><span>, </span><span><span class="hljs-string">'koi8-r'</span></span><span>, </span><span><span class="hljs-string">'utf-8'</span></span><span>);
</span><span><span class="hljs-comment">// Dann verwenden str_replace Entfernen Sie zusätzliche Räume und Linienbrüche</span></span><span>
</span><span><span class="hljs-variable">$cleaned_text</span></span><span> = </span><span><span class="hljs-title function_ invoke__">str_replace</span></span><span>(</span><span><span class="hljs-keyword">array</span></span><span>(</span><span><span class="hljs-string">"\n"</span></span><span>, </span><span><span class="hljs-string">"\t"</span></span><span>), </span><span><span class="hljs-string">' '</span></span><span>, </span><span><span class="hljs-variable">$converted_text</span></span><span>);
</span><span><span class="hljs-keyword">echo</span></span><span> </span><span><span class="hljs-variable">$cleaned_text</span></span><span>; </span><span><span class="hljs-comment">// Ausgabe:Привет мир! Это тестовый текст.</span></span><span>
</span></span>

Verwenden Sie zuerst über die obige Methode konvert_cyr_string , um das Codierungsproblem zu lösen, und verwenden Sie dann Str_Replace , um nutzlose Zeichen zu löschen und schließlich einen sauberen und standardisierten Text zu erhalten.

Zusammenfassen

Obwohl Convert_Cyr_String selbst nicht direkt zum Reinigen von Text verwendet wird, kann es den Text effektiv reinigen und normalisieren, wenn sie mit anderen Funktionen wie str_replace verwendet werden, insbesondere wenn sie sich mit Zeichensätzen in verschiedenen Codierungsformaten befassen. Mit dieser Kombination können wir den Text leicht codieren und charakterieren, um die Konsistenz zwischen verschiedenen Systemen oder Plattformen sicherzustellen.

Hoffentlich hilft Ihnen die heutige Einführung besser zu verstehen, wie Sie konvert_cyr_string und str_replace verwenden, um mit Problemen mit Textcodierung und Reinigung umzugehen!