Aktueller Standort: Startseite> Neueste Artikel> Regelmäßige Ausdrucksanwendung in PHP: Das Geheimnis der Datenerfassungsfähigkeiten

Regelmäßige Ausdrucksanwendung in PHP: Das Geheimnis der Datenerfassungsfähigkeiten

gitbox 2025-06-07

1. Einführung in die Grundlagen regulärer Ausdrücke

Regelmäßige Ausdrücke sind ein leistungsstarkes String -Matching -Tool, das anhand von Zeichen, Wörtern oder Zeichenblöcken entspricht, die auf bestimmten Regeln basieren. Bei der PHP -Entwicklung werden regelmäßige Ausdrücke häufig bei der Datenerfassung, der Formatüberprüfung und anderen Szenarien verwendet. Hier sind einige häufig verwendete reguläre Ausdrucksbeispiele:

1.1 Passen Sie einen beliebigen Charakter an

Englische Periode . Im regelmäßigen Ausdruck bedeutet dies, dass ein einzelner Zeichen außer Zeilenbrüchen entspricht. Zum Beispiel der Ausdruck '.' kann jedem Charakter übereinstimmen:

 <span class="fun">&#39;.&#39; &#39;</span>

1.2 Übereinstimmung mit dem angegebenen Zeichensatz

Verwenden Sie quadratische Klammern [], um einen beliebigen Charakter in Klammern zu entsprechen. Zum Beispiel:

 <span class="fun">[ABC]</span>

Passen Sie die Zeichen A, B oder c.

Wenn Sie eine bestimmte Zeichengruppe anpassen möchten, können Sie beispielsweise beispielhaft sind:

 <span class="fun">[AZ]</span>

Zeigt an, dass alle englischen Kleinbuchstaben angepasst werden.

1.3 Quantitätsqualifikation

Qualifizierer können die Anzahl der angezeigten Zeichen steuern, die häufig verwendet werden.

  • ? - Passen Sie den vorherigen Charakter 0 oder 1 Zeit an
  • * - Passen Sie den vorherigen Charakter von 0 oder mehrmals an
  • + - übereinstimmen dem vorherigen Charakter 1 oder mehrmals
  • {n} - genau übereinstimmen n mal
  • {n,} - mindestens n -mal übereinstimmen
  • {n, m} - übereinstimmen n bis M -Zeiten

Passen Sie beispielsweise eine Hexadezimalzahl von 1 bis 2 Ziffern an:

 <span class="fun">[0-9a-fa-f] {1,2}</span>

Dieser Ausdruck entspricht den Zahlen 0-9 und dem Buchstaben AF (Fall unempfindlich) und erscheint ein- oder zweimal.

2. Praktische Anwendung regulärer Ausdrücke in PHP: Datenerfassung

2.1 Verwenden Sie Curl, um Webseiteninhalte abzurufen

Die Curl -Bibliothek von PHP kann die Webseitendaten problemlos kriechen. Das folgende Beispiel zeigt, wie die Baidu -Homepage anfordert:

 
$curl = curl_init('http://www.baidu.com');
curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);
$html = curl_exec($curl);
curl_close($curl);
<p>echo $html;<br>

Im Code wird curl_init () die CURL -Sitzung initialisiert, curl_setopt () für die Rückgabe des Webseiteninhalts, curl_exec () führt die Anforderung aus und schließt schließlich die Sitzung.

2.2 Links von Webseiten extrahieren

Nachdem Sie die Webseite HTML erhalten haben, können Sie regelmäßige Ausdrücke verwenden, um bestimmte Inhalte zu extrahieren. Greifen Sie beispielsweise die Linkadresse und den Text in allen Tags ein:

 
preg_match_all('/<a href="(.*)" target="_blank">(.*)<\/a>/U', $html, $matches);
foreach ($matches[2] as $match) {
  echo $match . '\n';
}

Die oben genannten regulären Übereinstimmung mit allen Tags, die den Kriterien erfüllen, und das HREF -Attribut und das Linktext im $ Matches -Array gespeichert werden. Alle Link -Text können durch Überqueren $ Matches [2] ausgegeben werden.

2.3 Weitere Bild -URL extrahieren

In ähnlicher Weise können Sie reguläre Ausdrücke verwenden, um URLs für alle Bilder in einer Webseite zu extrahieren:

 
preg_match_all('/<img src="(.*)" width=.* height=.*>/U', $html, $matches);
foreach ($matches[1] as $match) {
  echo $match . '\n';
}

Hier entspricht der reguläre Ausdruck alle Tag und extrahieren Sie das SRC -Attribut $, $ passt [1] alle Bildlinks.

Zusätzlich zu Links und Bildern können regelmäßige Ausdrücke auch zum Extrahieren von Informationen wie E -Mails, Telefonnummern usw. verwendet werden, und flexibles Design von Ausdrücken kann unterschiedliche Anforderungen erfüllen.

3. Zusammenfassung

Als leistungsstarke Tool für die String -Verarbeitung bieten regelmäßige Ausdrücke eine starke Unterstützung für die Realisierung der Datenerfassung und -überprüfung in PHP. Indem Webseitendaten ein vernünftiges Schreiben regelmäßiger Ausdrücke und die Kombination der Curl -Funktion von PHP werden, können sie effizient gekrabbelt und analysiert werden. Ich hoffe, dass der Inhalt dieses Artikels den Entwicklern helfen kann, die praktischen Fähigkeiten der regulären PHP -Ausdrücke zu verbessern.