Python3解決新版喜馬拉雅音頻JS反爬

前言

應該也有一年了吧,之前也在簡書CSDN上寫過爬取喜馬拉雅音頻的文章,經歷了一次喜馬拉雅的改版,同時也更新了一波代碼

最近爲了喜歡的雪中,回去重新打算跑一下代碼下載音頻,這一跑不要緊,結果就發現喜馬拉雅又改版了

得,又得重新寫代碼,且這次還加了JS反扒的手段,讓我也好好學習了一把,嗯,下面進入正題

分析

初步分析

老樣子,首先來看看我們要爬取的目標https://www.ximalaya.com/youshengshu/2684034/


像這樣的882個音頻,共計30頁,每頁一般標準的有30個,最後要將這882個音頻保存到本地,那麼我們最需要的是找到音頻的源播放地址,我們不妨打開一個音頻來看看,同時按F12打開開發者工具

首先我看了看https://www.ximalaya.com/youshengshu/2684034/2725352的網頁源代碼中,並沒有相關的播放地址,所以我開始在開發者工具中找

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章