php 根據標籤的屬性值來爬取內容的正則表達式

最近在學着做數據爬蟲,經常遇到的一個問題是,經常要根據某個標籤的屬性值來獲取該表下面的內容,

後來找到了一個封裝的方法,挺好用的,下面看代碼:

/**
	 * $html-需要爬取的頁面內容
	 * $tag-要查找的標籤
	 * $attr-要查找的屬性名
	 * $value-屬性名對應的值
	 */
	public function get_tag_data($html,$tag,$attr,$value){
		$regex = "/<$tag.*?$attr=\".*?$value.*?\".*?>(.*?)<\/$tag>/is";
		preg_match_all($regex,$html,$matches,PREG_PATTERN_ORDER);
		return $matches[1];
	}

DONE!!!!!
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章