အင်တာနက်ဖွံ့ဖြိုးတိုးတက်မှုနှင့်အတူဝက်ဘ်စာမျက်နှာ၏ပမာဏသည်သိသိသာသာတိုးတက်လာသည်။ လိုအပ်သောအချက်အလက်များကိုထိရောက်စွာနှင့်တိကျမှန်ကန်စွာဖမ်းဆီးနိုင်ပုံသည် developer များအတွက်အဓိကစိန်ခေါ်မှုတစ်ခုဖြစ်လာနိုင်သည်။ လူကြိုက်များသော Web Development ဘာသာစကားဖြင့် PHP သည် Phpspider Crawler Frameway နှင့်အချက်အလက်ထုတ်ယူခြင်းအတွက်ကြီးမားသောအဆင်ပြေစေရန်အဆင်ပြေပါသည်။
ဤဆောင်းပါးသည် PHP နှင့် PPSPADE နှင့်အတူမြေယာဖောက်ကားများကိုလျင်မြန်စွာတည်ဆောက်ရန်နှင့်ဖြန့်ချိသည့်ဝက်ဘ်ဆိုက်များကိုလျင်မြန်စွာတည်ဆောက်ရန်မည်သို့အဆင့်ဆင့်ကိုမိတ်ဆက်ပေးလိမ့်မည်။
ပထမ ဦး စွာ PHP ကို အခြေခံ. စွမ်းဆောင်ရည်မြင့်သောမျိုးခွက်မူဘောင်ဖြစ်သော Phpspider ကိုသင်တပ်ဆင်ရန်လိုအပ်သည်။ Composer Tool မှတဆင့် Execute:
<span class="fun">တေးရေးဆရာ Php-Spider / Phpspider လိုအပ်ပါတယ်</span>
ဖိုင် spider.php ကိုဖန်တီးပြီးဖိုင်ကိုအလိုအလျောက်ဖွင့်ရန် Phpspider ကိုမိတ်ဆက်ပါ။
<?php
require 'vendor/autoload.php';
<p>use phpspider\core\phpspider;</p>
<p>// တစ် ဦး crawler အရာဝတ်ထုဖန်တီးပါ<br>
$spider = new phpspider();</p>
<p>// စတင်ခြင်းစတင်ခြင်းURL<br>
$spider->add_start_url('<a rel="noopener" target="_new" class="" href="http://www.example.com">http://www.example.com</a>');</p>
<p>// စာမျက်နှာကိုထုတ်ယူရန်အတွက် callback function ကိုသတ်မှတ်ပါ<br>
$spider->on_extract_page = function($page, $data) {<br>
// ဤနေရာတွင်ထုတ်ယူခြင်းယုတ္တိဗေဒကိုရေးပါ<br>
return $data;<br>
};</p>
<p>// တွားသွား<br>
$spider->start();<br>
အထက်ဖော်ပြပါကုဒ်သည်တွား 0 င်မှုများကိုစတင်သည်,
calnback function တွင် Target Element သည်ပုံမှန်အသုံးအနှုန်း, XPath သို့မဟုတ် CSS selector ကို အသုံးပြု. နေရာချသည်။ ဤဥပမာသည်အောက်ပါအတိုင်းဖြစ်သည်, စာမျက်နှာခေါင်းစဉ်နှင့်ခန္ဓာကိုယ်စာသားကိုထုတ်ယူခြင်းသည်အောက်ပါအတိုင်းဖြစ်သည်။
$spider->on_extract_page = function($page, $data) {
// ခေါင်းစဉ်ကိုရယူပါ
$title = $page['raw']['headers']['title'][0];
// စာသား၏အကြောင်းအရာကိုရယူပါ
$content = $page['raw']['content'];
$data['title'] = $title;
$data['content'] = strip_tags($content);
return $data;
};
လွယ်ကူသောလုပ်ဆောင်မှုများအတွက်လွယ်ကူသောလုပ်ဆောင်ရန်အတွက်တွားသွားသည့်ဒေတာများကို local file သို့သိမ်းဆည်းပါ။
$spider->on_extract_page = function($page, $data) {
$title = $page['raw']['headers']['title'][0];
$content = $page['raw']['content'];
$data['content'] = strip_tags($content);
// စာသားဖိုင်မှနောက်ဆက်တွဲ
file_put_contents('extracted_data.txt', var_export($data, true), FILE_APPEND);
return $data;
};
ကုဒ်ကိုသိမ်းဆည်းပြီးနောက် command line တွင် execute လုပ်ပါ။
<span class="fun">PHP Spider.php</span>
တွား 0 တ္တရားသည်အချက်အလက်များကိုအလိုအလျောက်စောင်းဖွင့်ပြီး၎င်းကိုသိမ်းဆည်းရန်စည်းမျဉ်းများအရသတင်းအချက်အလက်များကိုထုတ်ယူလိမ့်မည်။
PHP မှ PHP မှတစ်ဆင့် PHPSPIDER မူဘောင်နှင့်အတူပေါင်းစပ်ထားသော PHPSPIDER BRAWLERS ကိုလျင်မြန်စွာတည်ဆောက်ထားပြီးအလိုအလျောက်ဒေတာထုတ်ယူမှုကိုလျင်မြန်စွာတည်ဆောက်နိုင်သည်။ ဤဆောင်းပါး၏ပုံသက်သေသည်တပ်ဆင်ခြင်း, ကုဒ်ရေးရေး, ဒေတာထုတ်ယူခြင်းနှင့်ရလဒ်ထိန်းသိမ်းခြင်း၏အဓိကဖြစ်စဉ်များကိုဖော်ပြထားသည်။ Grawling ထိရောက်မှုနှင့်ဒေတာအရည်အသွေးကိုတိုးတက်စေရန်စီမံကိန်းလိုအပ်ချက်များအရပိုမိုအဆင့်မြင့်သောစွမ်းဆောင်ချက်များကိုပြောင်းလဲစေနိုင်သည်။