python核心編程:大神如何用15行Python代碼實現網易雲熱門歌單實例教程

這篇文章主要給大家介紹了關於利用15行Python代碼實現網易雲熱門歌單的相關資料,文中通過示例代碼介紹的非常詳細,對大家的學習或者使用python具有一定的參考學習價值,需要的朋友們下面來一起學習學習吧
0. 引言
馬上2.14情人節就要來了,是否需要一首歌來撫慰你,受傷或躁動的心靈。來吧,今天教你用15行代碼搞定熱門歌單。學起來並聽起來吧。

本文使用的是Selenium模塊,它是一個自動化測試工具,利用它我們可以驅動瀏覽器執行特定的動作,如點擊、下拉等等操作,對於一些 JavaScript 渲染的頁面來說,此種抓取方式非常有效。另外採用了Chrome瀏覽器配合Selenium工作。

下面話不多說了,來一起看看詳細的介紹吧

  1. 環境
    操作系統:Windows

Python版本:3.7.2

  1. 準備工作
    a. 若你的環境中沒有selenium模塊,直接使用pip安裝即可。
pip install selenium

b. 打開谷歌瀏覽器,檢查Chrome的版本:在瀏覽器地址中輸入 chrome://settings/help 回車即可看到。
在這裏插入圖片描述c. 打開ChromeDriver 的官方網站:
https://sites.google.com/a/ch…
尋找與你當前瀏覽器版本相對應的ChromeDriver下載。在這裏插入圖片描述d. 選擇你自己的操作系統類型進行下載即可。
在這裏插入圖片描述
e. 以Windows爲例,下載結束後,將ChromeDriver 放置在python安裝目錄下的Scripts文件夾即可。
在這裏插入圖片描述
推薦我們的Python學習扣qun:913066266 ,看看前輩們是如何學習的!從基礎的python腳本到web開發、爬蟲、django、數據挖掘等【PDF,實戰源碼】,零基礎到項目實戰的資料都有整理。送給每一位python的小夥伴!每天都有大牛定時講解Python技術,分享一些學習的方法和需要注意的小細節,點擊加入我們的 python學習者聚集地

準備工作完成,代碼寫起來吧~

  1. 迷你爬蟲的實現
    我們這次的目標是爬取熱門歌單,比如網易雲音樂中播放量大於1000萬的歌單信息(歌單名稱、鏈接)。

a. 我們先來打開網易雲的歌單第一頁:
https://music.163.com/#/disco…

b. 使用Chrome的開發者工具進行分析。在這裏插入圖片描述
我們想要拿的信息全在這裏:

msk,封面[mask]:有歌單的名稱及鏈接
nb,播放數[number broadcast]:135萬
c. 我們還需要遍歷所有的頁,使用工具繼續分析,找到“下一頁”的URL。在這裏插入圖片描述d. 切換至最後一頁,拿到最後一頁的URL在這裏插入圖片描述
e. 等我們爬取完所有符合的歌單信息後,將其保存在本地。

f. 全部工作結束,最後再通過下面的僞代碼回顧下整體思路。在這裏插入圖片描述
g. 爬取的效果如下:在這裏插入圖片描述
4. 總結

本文旨在安撫你因情人節受傷的小心靈,同時帶你入個爬蟲的門,感受下python的強大。

好了,以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對腳本之家的支持。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章