Les expressions régulières sont un puissant outil de correspondance de cordes qui correspond aux caractères, aux mots ou aux blocs de caractères basés sur des règles spécifiques. Dans le développement de PHP, les expressions régulières sont largement utilisées dans la collecte de données, la vérification du format et d'autres scénarios. Voici quelques exemples d'expression réguliers couramment utilisés:
Période anglaise . En expression régulière, cela signifie faire correspondre n'importe quel caractère unique sauf les ruptures de ligne. Par exemple, l'expression '.' peut correspondre à n'importe quel personnage:
<span class="fun">'.'</span>
Utilisez des crochets [] pour correspondre à n'importe quel caractère entre parenthèses. Par exemple:
<span class="fun">[abc]</span>
Correspondre aux personnages A, B ou C.
Si vous souhaitez correspondre à une certaine gamme de caractères, vous pouvez utiliser Hyphen - , comme:
<span class="fun">[AZ]</span>
Indique la correspondance de toutes les lettres anglaises minuscules.
Les qualifications peuvent contrôler le nombre de caractères apparaissant, couramment utilisés comprennent:
Par exemple, faites correspondre un numéro hexadécimal de 1 à 2 chiffres:
<span class="fun">[0-9A-FA-F] {1,2}</span>
Cette expression correspond aux nombres 0-9 et à la lettre AF (cas insensible) et apparaît une ou deux fois.
La bibliothèque Curl de PHP peut facilement explorer les données de la page Web. L'exemple suivant montre comment demander la page d'accueil de Baidu:
$curl = curl_init('http://www.baidu.com');
curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);
$html = curl_exec($curl);
curl_close($curl);
<p>echo $html;<br>
Dans le code, Curl_Init () initialise la session Curl, Curl_Setopt () définit pour renvoyer le contenu de la page Web, Curl_exec () exécute la demande et ferme enfin la session.
Après avoir obtenu la page Web HTML, vous pouvez utiliser des expressions régulières pour extraire du contenu spécifique. Par exemple, saisissez l'adresse et le texte du lien dans toutes les balises:
preg_match_all('/<a href="(.*)" target="_blank">(.*)<\/a>/U', $html, $matches);
foreach ($matches[2] as $match) {
echo $match . '\n';
}
Le régulier ci-dessus correspond à toutes les balises qui répondent aux critères et stocke respectivement l'attribut HREF et le texte de liaison dans le tableau $ correspond respectivement. Tout le texte du lien peut être sorti en traversant $ correspond [2] .
De même, vous pouvez utiliser des expressions régulières pour extraire les URL pour toutes les images d'une page Web:
preg_match_all('/<img src="(.*)" width=.* height=.*>/U', $html, $matches);
foreach ($matches[1] as $match) {
echo $match . '\n';
}
Ici, l'expression régulière correspond à tous TAG et extraire son attribut SRC, $ correspond [1] stocke tous les liens d'image.
En plus des liens et des images, les expressions régulières peuvent également être utilisées pour extraire des informations telles que les e-mails, les numéros de téléphone, etc., et la conception flexible des expressions peut répondre à différents besoins.
En tant qu'outil puissant pour le traitement des chaînes, les expressions régulières fournissent un soutien solide pour réaliser la collecte et la vérification des données dans PHP. En écrivant raisonnablement des expressions régulières et en combinant la fonction Curl de PHP, les données de la page Web peuvent être efficacement rampées et analysées. J'espère que le contenu de cet article peut aider les développeurs à mieux maîtriser les compétences pratiques des expressions régulières PHP.