[Python爬蟲]模擬登陸**查網站

這是一篇使用Python模擬登陸##查網站的詳細介紹,##查網站上有許多的企業信息,因此抓取##查數據十分重要,本文使用selenium模擬登陸##查網站。
其實我之前就想寫這個python模擬登錄網站的,因爲之前爬蟲用的時候感覺還挺好用的,後來想學一下R爬蟲再來用R寫的,結果最近的爬蟲還是用的python,so,給大家用python講解咯。

今天給大家講的是模擬登錄“##查”這個網站,網站登錄頁面就是下面這樣。

天眼查網站登陸頁面

我們用的工具就是PyCharm編譯器,類似於R裏面的RStudio;

還有就是用Firefox瀏覽器,這是爲了更好的展現結果,當你爬取的數據比較多的時候,建議用Phantomjs,這個無頭瀏覽器爬取速度更快。
首先,導入需要用到的包,這裏只有兩個,一個是selenium包裏面的webdriver函數,另一個則是time包。
然後,定義一個模擬登錄函數,這裏你需要準備的就是登錄所用的賬號密碼。(原諒我把賬號密碼馬賽克了一下)

模擬登陸代碼

最後,直接調用定義的登陸函數就OK啦。
做完這三個部分,就完成了模擬登錄。
調用代碼

歡迎添加個人微信號:liu2536036458。
想進入交流羣的,備註:數據分析交流羣

我們下次再見,如果還有下次的話!!!

【新浪微博@516數據工作室】
歡迎關注微信公衆號:516數據工作室
二維碼

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章