Avec le développement rapide du commerce électronique, les achats en ligne sont devenus une partie indispensable de la vie des gens. En tant que plus grande plate-forme de commerce électronique de la Chine, TMALL et Taobao disposent de ressources d'informations sur les produits riches. Cet article partagera comment faire en sorte que les données des produits TMALL et TAOBAO via PHP vous aident à obtenir facilement les détails du produit.
Avant de commencer, vous devez installer deux bibliothèques PHP clés pour aider au développement du robot. Le premier est Guzzle, qui est un puissant client HTTP pour envoyer des demandes de réseau. Installer via le compositeur:
composer require guzzlehttp/guzzle
Deuxièmement, installez la bibliothèque Didom pour analyser les documents HTML pour faciliter l'extraction des informations requises dans la page:
composer require imangazaliev/didom
Étant donné que certaines données de produit de TMALL et Taobao doivent être connectées avant l'accès, vous devez d'abord obtenir un cookie de connexion valide. Après vous être connecté au compte, vous pouvez copier des informations sur les cookies via l'outil de développeur de navigateur pour simuler l'état de connexion pour faire des demandes.
Utilisez Guzzle pour envoyer une demande à la page Détails du produit pour obtenir le code source HTML de la page. Définissez des en-têtes d'agent utilisateur et de cookies lorsque vous demandez à simuler l'environnement du navigateur et à vous connecter:
use GuzzleHttp\Client;
$client = new Client();
$response = $client->get('https://detail.tmall.com/item.htm?id=123456789', [
'headers' => [
'User-Agent' => 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.82 Safari/537.36',
'Cookie' => 'your_cookie_value_here',
],
]);
$html = $response->getBody()->getContents();
Remplacez l'URL par le lien vers la page Détails du produit cible pour vous assurer que la demande revient normalement au contenu de la page.
Après avoir obtenu HTML, utilisez Didom pour analyser le document et extraire les données clés du produit, telles que le titre, le prix, la liaison d'image et la description du produit:
use DiDom\Document;
$document = new Document($html);
// Obtenir le titre du produit
$title = $document->find('.tb-detail-hd h1')[0]->text();
// Obtenez le prix du produit
$price = $document->find('.tm-price')[0]->text();
// Obtenez un lien d'image de produit
$imageUrl = $document->find('.tm-goldbox img')[0]->attr('src');
// Obtenir la description du produit
$description = $document->find('.tb-detail-content')[0]->text();
Le sélecteur CSS ci-dessus peut être ajusté en fonction de la structure de la page réelle pour localiser avec précision les éléments requis.
Combiné avec PHP, Guzzle et Didom, un rampage efficace des données de produit TMALL et TAOBAO peut être obtenu. Obtenez facilement les informations sur le titre du produit, le prix, l'image et la description en simulant les demandes et le contenu de la page d'analyse. Cette méthode convient à l'analyse du marché et à la collecte de renseignements concurrentielle et a une grande valeur pratique.
J'espère que ce contenu de cet article pourra vous aider à démarrer rapidement avec les données du commerce électronique et à améliorer l'efficacité du traitement des données.