python 開發之selenium

使用selenium和PhantomJS來模擬瀏覽器點擊下一頁,獲取頁面數據進行抓取分析
用python寫爬蟲的時候,主要用的是selenium的Webdriver來獲取頁面數據
使用webdriver需要安裝對應瀏覽器的driver,並加入到環境變量中
from selenium import webdriver
driver = webdriver.PhantomJS() 使用PhantomJS瀏覽器創建瀏覽器對象
driver.get("https://www.douyu.com/directory/all") 使用get方法加載頁面
driver.find_element_by_class_name("shark-pager-next").click() class="shark-pager-next"是下一頁按鈕,click() 是模擬點擊
利用BeatuifulSoup 對頁面信息進行提取
模擬點擊時需要安裝 https://bitbucket.org/ariya/phantomjs/downloads/phantomjs-2.1.1-windows.zip
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章