<?PHP

 
( “内容类型:文本/ HTML;字符集= UTF-8”);
功能 GETPAGE( $网址 )
{
  $ T=的file_get_contents$网址);
  返回 mb_convert_encoding($ T “UTF-8”, “GBK”);
}
包括 “PhpQuery / phpQuery。PHP“
$网址=‘
$页= GETPAGE($网址);
//phpQuery :: newDocumentHTML($页);
phpQuery :: newDocumentFile($网址);
$第一Cate= PQ(“#allsort 。M’);
$标识= 0的的的的foreach$第一Cate  $第一){
    $标识 ++$顶部cate= PQ($ First) - >查找(“。山一“);
    //回声“************” 。$顶部cate->文本() 。“************ “;
    回声 $标识 。“#”foreach$顶部cate  $顶部){
        回声 PQ($ Top) - >文本() 。“#” 。“$ Top) - > ATTR(的 “href”) 。“ ’目标=‘ _空白“>” 。pq ($ Top) - >文本() 。“;
    }
    回声 “#0#1 
    $ Panies= PQ($ First) - >查找(“。MC DL“);
    $ PARENT_ID=$标识foreach$ Panies  $帕尼)
    {  
        $标识++$ Sparent_id=$标识回声 ’“ 。$标识 。“#” 。PQ($帕尼) - >查找( ‘DT’) - >文本() 。“#” 。 “$帕尼) - >查找( ’dt的一个‘) - > ATTR(的 “href”) 。“ ’目标=‘ _空白“>” 。PQ($帕尼) - >查找( ’DT‘) - >文本() 。“ #” 。$ PARENT_ID 。“#2 
$凯特= PQ($帕尼) - >查找( ’DD他们一个‘); foreach($凯特 $详细){ $标识++回声 ’“ 。 $标识 。“#” 。PQ($详细) - >文本() 。“#” 。“
$详细) - > ATTR(的 “href”) 。“ ’目标=' _空白“>” 。pq ($详细) - >文本() 。” #” 。$ Sparent_id 。“#3
"; } } } ?>

本文链接:php+phpquery简易爬虫抓取京东商品分类

您可能也会喜欢

友情链接:

大悲咒注音 经文 心经唱诵