這是一篇使用Python模擬登陸##查網站的詳細介紹,##查網站上有許多的企業信息,因此抓取##查數據十分重要,本文使用selenium模擬登陸##查網站。
其實我之前就想寫這個python模擬登錄網站的,因爲之前爬蟲用的時候感覺還挺好用的,後來想學一下R爬蟲再來用R寫的,結果最近的爬蟲還是用的python,so,給大家用python講解咯。
今天給大家講的是模擬登錄“##查”這個網站,網站登錄頁面就是下面這樣。
我們用的工具就是PyCharm編譯器,類似於R裏面的RStudio;
還有就是用Firefox瀏覽器,這是爲了更好的展現結果,當你爬取的數據比較多的時候,建議用Phantomjs,這個無頭瀏覽器爬取速度更快。
首先,導入需要用到的包,這裏只有兩個,一個是selenium包裏面的webdriver函數,另一個則是time包。
然後,定義一個模擬登錄函數,這裏你需要準備的就是登錄所用的賬號密碼。(原諒我把賬號密碼馬賽克了一下)
最後,直接調用定義的登陸函數就OK啦。
做完這三個部分,就完成了模擬登錄。
我們下次再見,如果還有下次的話!!!
【新浪微博@516數據工作室】
歡迎關注微信公衆號:516數據工作室