PHPSPider est un cadre de robot de robot PHP léger et pratique qui capture rapidement des informations sur le réseau et les enregistre dans une base de données locale en écrivant des règles simples. Convient aux développeurs qui ont besoin de cibler des données pour des formats spécifiques, il peut simplifier considérablement le processus de développement des robots.
Avant d'utiliser PHPSPider, vous devez d'abord installer le cadre. PHPSPIDER utilise Composer pour gérer les dépendances, alors assurez-vous que le composer est installé dans votre environnement.
composer create-project phpspider/phpspider
Une fois l'installation terminée, vous pouvez confirmer si l'installation de Framework est réussie en exécutant le script de test:
cd phpspider
php tests/simple_test.php
PHPSPIDER prend en charge illimité les données de la page Web. Ce qui suit montre comment faire en sorte que les données à partir d'un simple site Web.
Tout d'abord, vous devez créer un nouveau projet. Exécuter la commande suivante, PHPSPider générera automatiquement le dossier de projet correspondant:
php phpspider startproject myproject
Une fois le projet créé, vous devez définir les règles rampantes et dire à PhpSpider comment extraire les données du site Web cible. Entrez le répertoire MyProject / Rules et créez une nouvelle règle.php . L'exemple de contenu est le suivant:
return [
'start_urls' => [
'http://www.example.com'
],
'rules' => [
[
'type' => 'regex',
'pattern' => '/(<a.*?>(.*?)<\/a><\/div>)/',
'id' => 1,
'fields' => [
[
'name' => 'title',
'selector' => 'text()',
],
[
'name' => 'link',
'selector' => '@href',
]
],
]
],
];
?>
Après la configuration des règles, vous pouvez exécuter PHPSPider pour les données rampant:
php phpspider run myproject
Grâce à cet article, je crois que vous avez maîtrisé les méthodes d'utilisation de base de PhPSPider, de l'installation à la création de projets, à l'écriture et à l'exécution des règles, il existe des étapes de fonctionnement claires. En tant que cadre du robot de robot PHP simple et efficace, PHPSPider est très approprié pour créer rapidement des projets de robots ciblés, vous aidant à obtenir facilement les données du réseau dont vous avez besoin.