PHP에서, 줄의 변환 및 정화는 매우 일반적인 작업입니다. 문자의 정확성과 일관성을 유지하는 방법은 다른 인코딩 형식으로 텍스트를 처리 할 때, 특히 크로스 플랫폼 응용 프로그램 또는 외부 데이터 소스가 관련 될 때 어려운 일입니다. Convert_cyr_string 및 str_replace 는 모두 PHP에서 유용한 도구입니다. 오늘날 우리는 그들이 인코딩 청소 및 텍스트 정규화를 달성하기 위해 어떻게 협력하는지 탐구 할 것입니다.
Convert_cyr_string은 Cyrillic 특성 인코딩 변환을위한 PHP의 함수입니다. 키릴 릭은 많은 동유럽 언어로 사용되는 문자 시스템입니다. Convert_cyr_string은 러시아어 또는 기타 키릴 문자가 포함 된 텍스트를 다루는 경우 특히 유용합니다.
이 기능의 프로토 타입은 다음과 같습니다.
<span><span><span class="hljs-title function_ invoke__">convert_cyr_string</span></span><span> ( </span><span><span class="hljs-keyword">string</span></span><span> </span><span><span class="hljs-variable">$str</span></span><span> , </span><span><span class="hljs-keyword">string</span></span><span> </span><span><span class="hljs-variable">$from</span></span><span> , </span><span><span class="hljs-keyword">string</span></span><span> </span><span><span class="hljs-variable">$to</span></span><span> ) : </span><span><span class="hljs-keyword">string</span></span><span>
</span></span>$ str : 문자열이 변환됩니다.
$ 중 : 소스 인코딩, 'KOI8-R' , 'Win-1251' 등이 될 수 있습니다.
$ to : 'koi8-r' , 'UTF-8' 등과 같은 대상 인코딩 등
예를 들어, KOI8-R 에서 인코딩 된 텍스트 조각이 있다고 가정 해 봅시다.이 텍스트는 convert_cyr_string을 통해 UTF-8 인코딩으로 변환 할 수 있습니다.
<span><span><span class="hljs-variable">$text</span></span><span> = </span><span><span class="hljs-string">"Привет мир"</span></span><span>; </span><span><span class="hljs-comment">// KOI8-R 코딩</span></span><span>
</span><span><span class="hljs-variable">$converted_text</span></span><span> = </span><span><span class="hljs-title function_ invoke__">convert_cyr_string</span></span><span>(</span><span><span class="hljs-variable">$text</span></span><span>, </span><span><span class="hljs-string">'koi8-r'</span></span><span>, </span><span><span class="hljs-string">'utf-8'</span></span><span>);
</span><span><span class="hljs-keyword">echo</span></span><span> </span><span><span class="hljs-variable">$converted_text</span></span><span>; </span><span><span class="hljs-comment">// 산출:Привет мир</span></span><span>
</span></span>변환 인코딩 외에도 때로는 특수 문자, 라인 브레이크 또는 기타 인식되지 않은 인코딩과 같은 문자열에서 불필요한 문자를 정리해야합니다. 이 경우 str_replace는 이러한 문자를 교체하거나 제거하는 데 도움이 될 수 있습니다.
str_replace 함수는 문자열을 대체하는 데 PHP에 사용되는 도구입니다. 프로토 타입은 다음과 같습니다.
<span><span><span class="hljs-title function_ invoke__">str_replace</span></span><span>( </span><span><span class="hljs-keyword">mixed</span></span><span> </span><span><span class="hljs-variable">$search</span></span><span> , </span><span><span class="hljs-keyword">mixed</span></span><span> </span><span><span class="hljs-variable">$replace</span></span><span> , </span><span><span class="hljs-keyword">mixed</span></span><span> </span><span><span class="hljs-variable">$subject</span></span><span> ) : </span><span><span class="hljs-keyword">mixed</span></span><span>
</span></span>$ 검색 : 검색 할 문자 또는 문자열.
$ 교체 : 교체에 사용되는 문자 또는 문자열.
$ 제목 : 교체 작업을 수행하기위한 원래 문자열입니다.
예를 들어, str_replace를 사용하여 문자열의 모든 Newline 문자를 공백으로 교체하거나 불필요한 공간을 삭제할 수 있습니다.
<span><span><span class="hljs-variable">$text</span></span><span> = </span><span><span class="hljs-string">"Hello, \nWorld! \tThis is PHP."</span></span><span>;
</span><span><span class="hljs-variable">$cleaned_text</span></span><span> = </span><span><span class="hljs-title function_ invoke__">str_replace</span></span><span>(</span><span><span class="hljs-keyword">array</span></span><span>(</span><span><span class="hljs-string">"\n"</span></span><span>, </span><span><span class="hljs-string">"\t"</span></span><span>), </span><span><span class="hljs-string">' '</span></span><span>, </span><span><span class="hljs-variable">$text</span></span><span>);
</span><span><span class="hljs-keyword">echo</span></span><span> </span><span><span class="hljs-variable">$cleaned_text</span></span><span>; </span><span><span class="hljs-comment">// 산출:Hello, World! This is PHP.</span></span><span>
</span></span>convert_cyr_string 및 str_replace는 인코딩을 변환하고 동시에 불필요한 문자를 청소해야 할 때 함께 잘 작동합니다. 키릴 문자가 포함 된 텍스트가 있고 그 텍스트에 추가 라인 브레이크 또는 인쇄 할 수없는 문자와 같은 유효하지 않은 문자도 포함되어 있다고 가정 해 봅시다. 먼저 변환을 인코딩하는 데 Convert_Cyr_String을 사용할 수 있으며 STR_REPLACE를 사용하여 원치 않는 문자를 정리할 수 있습니다.
예를 들어, 라인 브레이크와 추가 공간이 혼합 된 KOI8-R 인코딩이 포함 된 텍스트가 있다고 가정 해 봅시다. 다음은 정리의 예입니다.
<span><span><span class="hljs-variable">$text</span></span><span> = </span><span><span class="hljs-string">"Привет \nмир! \tЭто \tтестовый \nтекст."</span></span><span>;
</span><span><span class="hljs-comment">// 먼저 넣으십시오 KOI8-R 코딩转换为 UTF-8</span></span><span>
</span><span><span class="hljs-variable">$converted_text</span></span><span> = </span><span><span class="hljs-title function_ invoke__">convert_cyr_string</span></span><span>(</span><span><span class="hljs-variable">$text</span></span><span>, </span><span><span class="hljs-string">'koi8-r'</span></span><span>, </span><span><span class="hljs-string">'utf-8'</span></span><span>);
</span><span><span class="hljs-comment">// 그런 다음 사용하십시오 str_replace 여분의 공간과 선 파손을 제거하십시오</span></span><span>
</span><span><span class="hljs-variable">$cleaned_text</span></span><span> = </span><span><span class="hljs-title function_ invoke__">str_replace</span></span><span>(</span><span><span class="hljs-keyword">array</span></span><span>(</span><span><span class="hljs-string">"\n"</span></span><span>, </span><span><span class="hljs-string">"\t"</span></span><span>), </span><span><span class="hljs-string">' '</span></span><span>, </span><span><span class="hljs-variable">$converted_text</span></span><span>);
</span><span><span class="hljs-keyword">echo</span></span><span> </span><span><span class="hljs-variable">$cleaned_text</span></span><span>; </span><span><span class="hljs-comment">// 산출:Привет мир! Это тестовый текст.</span></span><span>
</span></span>위의 방법을 통해 먼저 convert_cyr_string을 사용하여 인코딩 문제를 처리 한 다음 str_replace를 사용하여 쓸모없는 문자를 지우고 마지막으로 깨끗하고 표준화 된 텍스트를 얻습니다.
Convert_cyr_string 자체는 텍스트를 직접 정리하는 데 사용되지 않지만 STR_REPLACE 와 같은 다른 기능을 사용하면 특히 다른 인코딩 형식의 문자 세트를 처리 할 때 텍스트를 효과적으로 청소하고 정상화 할 수 있습니다. 이 조합을 통해 우리는 텍스트를 쉽게 인코딩하고 문자를 청소하여 다른 시스템이나 플랫폼 간의 일관성을 보장 할 수 있습니다.
오늘의 소개가 소개되기를 바랍니다. 텍스트 인코딩 및 청소 문제를 처리하기 위해 Convert_Cyr_String 및 STR_REPLAPE를 사용하는 방법을 더 잘 이해하는 데 도움이 될 것입니다!