Regelmäßige Ausdrücke sind ein leistungsstarkes String -Matching -Tool, das anhand von Zeichen, Wörtern oder Zeichenblöcken entspricht, die auf bestimmten Regeln basieren. Bei der PHP -Entwicklung werden regelmäßige Ausdrücke häufig bei der Datenerfassung, der Formatüberprüfung und anderen Szenarien verwendet. Hier sind einige häufig verwendete reguläre Ausdrucksbeispiele:
Englische Periode . Im regelmäßigen Ausdruck bedeutet dies, dass ein einzelner Zeichen außer Zeilenbrüchen entspricht. Zum Beispiel der Ausdruck '.' kann jedem Charakter übereinstimmen:
<span class="fun">'.' '</span>
Verwenden Sie quadratische Klammern [], um einen beliebigen Charakter in Klammern zu entsprechen. Zum Beispiel:
<span class="fun">[ABC]</span>
Passen Sie die Zeichen A, B oder c.
Wenn Sie eine bestimmte Zeichengruppe anpassen möchten, können Sie beispielsweise beispielhaft sind:
<span class="fun">[AZ]</span>
Zeigt an, dass alle englischen Kleinbuchstaben angepasst werden.
Qualifizierer können die Anzahl der angezeigten Zeichen steuern, die häufig verwendet werden.
Passen Sie beispielsweise eine Hexadezimalzahl von 1 bis 2 Ziffern an:
<span class="fun">[0-9a-fa-f] {1,2}</span>
Dieser Ausdruck entspricht den Zahlen 0-9 und dem Buchstaben AF (Fall unempfindlich) und erscheint ein- oder zweimal.
Die Curl -Bibliothek von PHP kann die Webseitendaten problemlos kriechen. Das folgende Beispiel zeigt, wie die Baidu -Homepage anfordert:
$curl = curl_init('http://www.baidu.com');
curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);
$html = curl_exec($curl);
curl_close($curl);
<p>echo $html;<br>
Im Code wird curl_init () die CURL -Sitzung initialisiert, curl_setopt () für die Rückgabe des Webseiteninhalts, curl_exec () führt die Anforderung aus und schließt schließlich die Sitzung.
Nachdem Sie die Webseite HTML erhalten haben, können Sie regelmäßige Ausdrücke verwenden, um bestimmte Inhalte zu extrahieren. Greifen Sie beispielsweise die Linkadresse und den Text in allen Tags ein:
preg_match_all('/<a href="(.*)" target="_blank">(.*)<\/a>/U', $html, $matches);
foreach ($matches[2] as $match) {
echo $match . '\n';
}
Die oben genannten regulären Übereinstimmung mit allen Tags, die den Kriterien erfüllen, und das HREF -Attribut und das Linktext im $ Matches -Array gespeichert werden. Alle Link -Text können durch Überqueren $ Matches [2] ausgegeben werden.
In ähnlicher Weise können Sie reguläre Ausdrücke verwenden, um URLs für alle Bilder in einer Webseite zu extrahieren:
preg_match_all('/<img src="(.*)" width=.* height=.*>/U', $html, $matches);
foreach ($matches[1] as $match) {
echo $match . '\n';
}
Hier entspricht der reguläre Ausdruck alle Tag und extrahieren Sie das SRC -Attribut $, $ passt [1] alle Bildlinks.
Zusätzlich zu Links und Bildern können regelmäßige Ausdrücke auch zum Extrahieren von Informationen wie E -Mails, Telefonnummern usw. verwendet werden, und flexibles Design von Ausdrücken kann unterschiedliche Anforderungen erfüllen.
Als leistungsstarke Tool für die String -Verarbeitung bieten regelmäßige Ausdrücke eine starke Unterstützung für die Realisierung der Datenerfassung und -überprüfung in PHP. Indem Webseitendaten ein vernünftiges Schreiben regelmäßiger Ausdrücke und die Kombination der Curl -Funktion von PHP werden, können sie effizient gekrabbelt und analysiert werden. Ich hoffe, dass der Inhalt dieses Artikels den Entwicklern helfen kann, die praktischen Fähigkeiten der regulären PHP -Ausdrücke zu verbessern.