最近在學着做數據爬蟲,經常遇到的一個問題是,經常要根據某個標籤的屬性值來獲取該表下面的內容,
後來找到了一個封裝的方法,挺好用的,下面看代碼:
/**
* $html-需要爬取的頁面內容
* $tag-要查找的標籤
* $attr-要查找的屬性名
* $value-屬性名對應的值
*/
public function get_tag_data($html,$tag,$attr,$value){
$regex = "/<$tag.*?$attr=\".*?$value.*?\".*?>(.*?)<\/$tag>/is";
preg_match_all($regex,$html,$matches,PREG_PATTERN_ORDER);
return $matches[1];
}
DONE!!!!!