လက်ရှိတည်နေရာ: ပင်မစာမျက်နှာ> နောက်ဆုံးရဆောင်းပါးများစာရင်း> Phpspider နှင့်အတူပေါင်းစပ်ထားသော PHP နှင့်အတူ crawling အတွက် crawling အတွက် tutorial ကိုပစ်မှတ်ထားဒေတာ

Phpspider နှင့်အတူပေါင်းစပ်ထားသော PHP နှင့်အတူ crawling အတွက် crawling အတွက် tutorial ကိုပစ်မှတ်ထားဒေတာ

gitbox 2025-06-27

နိဒါန်း

Phpspider သည်ပေါ့ပါးပြီးလက်တွေ့ PHP Crawler Frameway ဖြစ်သည်။ တိကျသောပုံစံများအတွက်အချက်အလက်များကိုပစ်မှတ်ထားရန်လိုအပ်သည့် developer များအတွက်သင့်တော်သည်မှာ၎င်းသည်တွားမြင်သူများ၏ဖွံ့ဖြိုးတိုးတက်မှုလုပ်ငန်းစဉ်ကိုသိသိသာသာရိုးရှင်းစေသည်။

pppspider ကို install လုပ်ပါ

PHPSPIDER ကိုမသုံးမီသင်မူဘောင်ကိုအရင် install လုပ်ရန်လိုအပ်သည်။ PHSPSPIDER သည်မှီခိုမှုကိုစီမံရန်တေးရေးဆရာကိုအသုံးပြုသည်။ ထို့ကြောင့်သင်၏ပတ်ဝန်းကျင်တွင်တေးရေးဆရာကိုတပ်ဆင်ထားပါ။

 composer create-project phpspider/phpspider

တပ်ဆင်မှုပြီးဆုံးသွားသောအခါစာမေးပွဲတပ်ဆင်ခြင်းဖြင့်ရှာဖွေခြင်းသည်အောင်မြင်မှုပုံစံကိုအောင်မြင်စွာလုပ်ဆောင်သည်ကိုသင်အတည်ပြုနိုင်သည်။

 cd phpspider
php tests/simple_test.php

0 က်ဘ်ဆိုက်ဒေတာကိုတွား

Phpspider သည် 0 က်ဘ်စာမျက်နှာဒေတာများကိုအကန့်အသတ်မဲ့စွာတောင့်တမှုကိုထောက်ခံသည်။ အောက်ပါတို့ကရိုးရှင်းသော 0 က်ဘ်ဆိုက်တစ်ခုမှအချက်အလက်များကိုမည်သို့တွားပုံကိုပြသသည်။

စီမံကိန်းတစ်ခုဖန်တီးပါ

ပထမ ဦး စွာသင်သည်စီမံကိန်းအသစ်တစ်ခုဖန်တီးရန်လိုအပ်သည်။ အောက်ပါ command ကို Execute လုပ်ပါ။ Phpspider သည်သက်ဆိုင်ရာစီမံကိန်းဖိုင်တွဲကိုအလိုအလျောက်ထုတ်လုပ်လိမ့်မည်။

 php phpspider startproject myproject

တွားတတ်သောစည်းမျဉ်းစည်းကမ်းတွေရေးပါ

စီမံကိန်းကိုဖန်တီးပြီးနောက်သင်တွားတတ်သောစည်းမျဉ်းများကိုသတ်မှတ်ပြီး Phpspider ကို Target ဝက်ဘ်ဆိုက်၏အချက်အလက်များကိုထုတ်ယူရမည်ကိုပြောပြရန်လိုအပ်သည်။ MyProject / Rules Directory ကိုရိုက်ထည့်ပြီး နည်းဥပဒေ အသစ်တစ်ခုဖန်တီးပါ။ ဥပမာအကြောင်းအရာမှာအောက်ပါအတိုင်းဖြစ်သည် -

 return [
    'start_urls' => [
        'http://www.example.com'
    ],
    'rules' => [
        [
            'type' => 'regex',
            'pattern' => '/(<a.*?>(.*?)<\/a><\/div>)/',
            'id' => 1,
            'fields' => [
                [
                    'name' => 'title',
                    'selector' => 'text()',
                ],
                [
                    'name' => 'link',
                    'selector' => '@href',
                ]
            ],
        ]
    ],
];
?>

ပြေးပြေးပြေး

စည်းမျဉ်းစည်းကမ်းတွေကိုပြုပြင်ပြီးနောက်သင် PhpsperPer ကိုတွားတတ်သောဒေတာအတွက် run နိုင်သည်။

 php phpspider run myproject

အကျဉ်းချုပ်

ဤဆောင်းပါးမှတစ်ဆင့် Phpspider ၏အခြေခံအသုံးပြုမှုနည်းလမ်းများကိုတည်ဆောက်ခြင်းမှစီမံကိန်းဖန်တီးမှုမှပြုလုပ်ရန်, အရေးအသားနှင့်အပြေးခြင်းအထိကျွမ်းကျင်မှုရှိကြောင်းကျွန်ုပ်ယုံကြည်သည်ဟုကျွန်ုပ်ယုံကြည်သည်။ ရိုးရိုးရှင်းရှင်းနှင့်ထိရောက်သော PHP Crawler Framework တွင် Phpspider သည်သင်လိုအပ်သည့်ကွန်ယက်အချက်အလက်များကိုအလွယ်တကူရယူရန်ကူညီခြင်းအတွက် Phpspider သည်အလွန်သင့်လျော်သည်။