前言
應該也有一年了吧,之前也在簡書,CSDN上寫過爬取喜馬拉雅音頻的文章,經歷了一次喜馬拉雅的改版,同時也更新了一波代碼
最近爲了喜歡的雪中
,回去重新打算跑一下代碼下載音頻,這一跑不要緊,結果就發現喜馬拉雅又改版了
得,又得重新寫代碼,且這次還加了JS反扒的手段,讓我也好好學習了一把,嗯,下面進入正題
分析
初步分析
老樣子,首先來看看我們要爬取的目標https://www.ximalaya.com/youshengshu/2684034/
像這樣的882個音頻,共計30頁,每頁一般標準的有30個,最後要將這882個音頻保存到本地,那麼我們最需要的是找到音頻的源播放地址,我們不妨打開一個音頻來看看,同時按F12打開開發者工具
首先我看了看https://www.ximalaya.com/youshengshu/2684034/2725352
的網頁源代碼中,並沒有相關的播放地址,所以我開始在開發者工具中找