Aktueller Standort: Startseite> Neueste Artikel> Wie kombinieren Sie MB_Encode_NumericalEntity mit regulären Ausdrücken, um bestimmte Zeichen oder Text zu verarbeiten?

Wie kombinieren Sie MB_Encode_NumericalEntity mit regulären Ausdrücken, um bestimmte Zeichen oder Text zu verarbeiten?

gitbox 2025-09-11
<span><span><span class="hljs-meta"><?php</span></span><span>
</span><span><span class="hljs-comment">// Einige irrelevante Präfixcode</span></span><span>
</span><span><span class="hljs-function"><span class="hljs-keyword">function</span></span></span><span> </span><span><span class="hljs-title">dummyFunction</span></span><span>(</span><span><span class="hljs-params"></span></span><span>) {
    </span><span><span class="hljs-keyword">return</span></span><span> </span><span><span class="hljs-string">"Dies ist nur der Präfixcode,Hat nichts mit dem Inhalt des Artikels zu tun"</span></span><span>;
}
</span><span><span class="hljs-variable">$dummyVar</span></span><span> = </span><span><span class="hljs-title function_ invoke__">dummyFunction</span></span><span>();

</span><span><span class="hljs-meta">?></span></span><span>

<hr>

</span><span><span class="hljs-meta"><?php</span></span><span>
</span><span><span class="hljs-keyword">echo</span></span><span> </span><span><span class="hljs-string">"<h1>Wie man kombiniert mb_encode_numericentity und reguläre Ausdrücke, um bestimmte Zeichen oder Text zu handhaben?</h1>"</span></span><span>;

</span><span><span class="hljs-keyword">echo</span></span><span> </span><span><span class="hljs-string">"<p>Verarbeitung von Multibyte -Zeichen(Wie auf Chinesisch、japanisch、Koreanisch usw.)Stunde,PHP Bereitgestellt <code>mb_encode_numericentity
" ; Echo "

Wo:

"
; Echo "
    "
; Echo "
  • \ $ str: Die zu konvertierte Zeichenfolge
  • "
    ; Echo "
  • \ $ concmap: MAP -Array konvertieren, formatiert als [Start, Ende, Offset, Maske]
  • "
    ; Echo "
  • \ $ codieren: Zeichencodierung, Standard 'UTF-8'
  • "
    ; Echo "" ; Echo "

    Zum Beispiel wollen wir alle chinesischen Charaktere in HTML -Entitäten umwandeln:

    "
    ; Echo "
    \ $ concmap = [0x4e00, 0x9fff, 0, 0xffff];
    \ $ str = &#39;Test Chinesisch&#39;;
    \ $ coded = mb_encode_numericalEntity (\ $ str, \ $ concmap, &#39;utf-8&#39;);
    echo \ $ codiert; // Chinesisch testen
    "
    ;
    Echo "

    2. reguläre Ausdrücke stimmen bestimmte Zeichen überein

    "
    ; Echo "

    Durch reguläre Ausdrücke können wir den Text herausfiltern, den uns wichtig sind. Zum Beispiel nur chinesische Charaktere übereinstimmen:

    "
    ; Echo "
    \ $ str = &#39;Hallo Testwelt Chinesisch&#39;;
    preg_match_all (&#39;/[\ x {4e00}-\ x {9fff}]+/u&#39;, \ $ str, \ $ Matches);
    print_r (\ $ übereinstimmt [0]); // Array ([0] => Test [1] => Chinesisch)
    
    "
    ;
    Echo "

    3. Kombinieren Sie MB_Encode_NumericalEntity und reguläre Ausdrücke

    "
    ; Echo "

    Wenn wir nur digitale Wesenheiten in die chinesischen Charaktere konvertieren möchten:

    "
    ; Echo "
    \ $ concmap = [0x4e00, 0x9fff, 0, 0xffff];
    \ $ str = &#39;Hallo Testwelt Chinesisch&#39;;
    
    // Verwenden Sie regelmäßig passende preg_match_all (&#39;/[\ x {4e00}-\ x {9ffff}]+/u&#39;, \ $ str, \ $ überein);
    
    // Durchqueren Sie das Matching -Ergebnis und ersetzen Sie es durch Entity foreach (\ $ Matches [0] als \ $ match) {
        \ $ coded = mb_encode_numericalEntity (\ $ match, \ $ convmap, &#39;utf-8&#39;);
        \ $ str = str_replace (\ $ Match, \ $ codiert, \ $ str);
    }
    
    echo \ $ str; // Hallo Testwelt Chinesisch
    "
    ;
    Echo "

    4. Praktische Anwendungsszenarien

    "
    ; Echo "

    Die Art und Weise, wie mb_encode_numericality und reguläre Ausdrücke für die folgenden Szenarien sehr geeignet sind:

    "
    ; Echo "
      "
    ; Echo "
  • Entkommen sicher einigen Sonderzeichen in der HTML -Ausgabe, um verstümmelte oder XSS zu verhindern.
  • "
    ; Echo "
  • Bei der Verarbeitung mehrsprachiger Inhalte werden nur Zeichen in der angegebenen Sprache konvertiert.
  • "
    ; Echo "
  • Wenn der Text analysiert oder gespeichert wird, konvertieren bestimmte Zeichen in ein einheitliches Format.
  • "
    ; Echo "" ; Echo "

    Zusammenfassung

    "
    ; Echo "

    Filter spezifische Zeichen durch reguläre Ausdrücke und verwenden Sie dann MB_Encode_NumericalEntity zur Konvertierung

    . ?> <?php // ein nicht verwandter Schwanzcode $ footervar = "Dies ist nur schwanzüberrelevante Code" ; Funktion Fußgängerfunktion ( ) { zurückkehren "Schwanzfunktion Beispiel" ; } ?>