특정 문자 나 텍스트를 처리하기 위해 MB_ENCODE_NUMERICALENTITY를 일반 표현식과 결합하는 방법은 무엇입니까?

gitbox 2025-09-11

<span><span><span class="hljs-meta"><?php</span></span><span>
</span><span><span class="hljs-comment">// 관련없는 일부 접두사 코드</span></span><span>
</span><span><span class="hljs-function"><span class="hljs-keyword">function</span></span></span><span> </span><span><span class="hljs-title">dummyFunction</span></span><span>(</span><span><span class="hljs-params"></span></span><span>) {
    </span><span><span class="hljs-keyword">return</span></span><span> </span><span><span class="hljs-string">"이것은 단지 접두사 코드입니다，기사의 내용과 관련이 없습니다."</span></span><span>;
}
</span><span><span class="hljs-variable">$dummyVar</span></span><span> = </span><span><span class="hljs-title function_ invoke__">dummyFunction</span></span><span>();

</span><span><span class="hljs-meta">?></span></span><span>

<hr>

</span><span><span class="hljs-meta"><?php</span></span><span>
</span><span><span class="hljs-keyword">echo</span></span><span> </span><span><span class="hljs-string">"<h1>결합하는 방법 mb_encode_numericentity 특정 문자 나 텍스트를 처리하기위한 정기적 인 표현？</h1>"</span></span><span>;

</span><span><span class="hljs-keyword">echo</span></span><span> </span><span><span class="hljs-string">"<p>멀티 바이트 문자 처리（중국어와 마찬가지로、일본어、한국 등）시간，PHP 제공 <code>mb_encode_numericentity

" ; 에코 "

어디:

" ; 에코 "

" ;; 에코 "

\ $ str : 변환 할 문자열

" ; 에코 "

\ $ convmap : [시작, 끝, 오프셋, 마스크] 로 형식으로 맵 배열을 변환합니다

." ; 에코 "

\ $ 인코딩 : 문자 인코딩, 기본 'UTF-8'

" ; 에코 "" ;; 에코 "

예를 들어, 우리는 모든 중국어를 HTML 엔티티로 변환하려고합니다.

" ; 에코 "

\ $ convmap = [0x4e00, 0x9fff, 0, 0xffff];
\ $ str = &#39;Test Chinese&#39;;
\ $ encoded = mb_encode_numericalentity (\ $ str, \ $ convmap, &#39;utf-8&#39;);
echo \ $ 인코딩; // 중국어를 테스트하십시오

" ; echo "

2. 정규 표현식은 특정 문자와 일치합니다

" ; 에코 "

정규 표현으로 우리는 우리가 관심을 갖는 텍스트를 필터링 할 수 있습니다. 예를 들어, 한자와 일치합니다.

" ; 에코 "

\ $ str = &#39;Hello Test World Chinese&#39;;
preg_match_all ( &#39;/[\ x {4e00}-\ x {9fff}]+/u&#39;, \ $ str, \ $ matches);
print_r (\ $ 일치 [0]); // 배열 ([0] => 테스트 [1] => 중국어)

" ; 에코 "

3. mb_encode_numericalentity와 정규 표현식 결합

" ; 에코 "

우리가 디지털 엔티티 만 중국어와 일치하도록 만 변환하려는 경우 :

" ; 에코 "

\ $ convmap = [0x4e00, 0x9fff, 0, 0xffff];
\ $ str = &#39;Hello Test World Chinese&#39;;

// 정기적 인 일치하는 preg_match_all 사용 ( &#39;/[\ x {4e00}-\ x {9ffff}]+/u&#39;, \ $ str, \ $ matches);

// 일치하는 결과를 가로 지르고 Entity foreach (\ $ matches [0] as \ $ match)로 바꾸십시오.
    \ $ encoded = mb_encode_numericalentity (\ $ match, \ $ convmap, &#39;utf-8&#39;);
    \ $ str = str_replace (\ $ match, \ $ encoded, \ $ str);
}

echo \ $ str; // Hello Test World Chinese

" ; echo "