兔子IP解決日常使用過程中ip被封鎖IP被限制的幾種方法

原創

2018-12-07 20:35

兔子IP解決日常使用過程中ip被封鎖IP被限制的幾種方法

方法1
使用多IP：
1.IP必須需要，比如ADSL。如果有條件，其實可以跟機房多申請外網IP。
2.在有外網IP的機器上，部署代理服務器。
3.你的程序，使用輪訓替換代理服務器來訪問想要採集的網站。
好處：
1.程序邏輯變化小，只需要代理功能。
2.根據對方網站屏蔽規則不同，你只需要添加更多的代理就行了。
3.就算具體IP被屏蔽了，你可以直接把代理服務器下線就OK，程序邏輯不需要變化。

方法2.
有小部分網站的防範措施比較弱，可以僞裝下IP，修改X-Forwarded-for（貌似這麼拼。。。）即可繞過。、
大部分網站麼，如果要頻繁抓取，一般還是要多IP。
我比較喜歡的解決方案是國外VPS再配多IP，通過默認網關切換來實現IP切換，比HTTP代理高效得多，估計也比多數情況下的ADSL切換更高效。

方法3.
ADSL + 腳本，監測是否被封，然後不斷切換 ip 設置查詢頻率限制
正統的做法是調用該網站提供的服務接口。

方法4.
國內ADSL是王道，多申請些線路，分佈在多個不同的電信區局，能跨省跨市更好，自己寫好斷線重撥組件，自己寫動態IP追蹤服務，遠程硬件重置（主要針對ADSL貓，防止其宕機），其餘的任務分配，數據回收，都不是大問題。

方法5.
1 user agent 僞裝和輪換
2 使用代理 ip 和輪換
3 cookies 的處理，有的網站對登陸用戶政策寬鬆些
友情提示：考慮爬蟲給人家網站帶來的負擔，be a responsible crawler 😃

方法6.
儘可能的模擬用戶行爲：
1、UserAgent經常換一換；
2、訪問時間間隔設長一點，訪問時間設置爲隨機數；
3、訪問頁面的順序也可以隨機着來。

方法7.
網站封的依據一般是單位時間內特定IP的訪問次數.
我是將採集的任務按目標站點的IP進行分組
通過控制每個IP 在單位時間內發出任務的個數,來避免被封.
當然,這個前題是你採集很多網站.如果只是採集一個網站,那麼只能通過多外部IP的方式來實現了。

方法8.
對爬蟲抓取進行壓力控制；可以考慮使用代理的方式訪問目標站點。
降低抓取頻率，時間設置長一些，訪問時間採用隨機數
頻繁切換UserAgent（模擬瀏覽器訪問）
多頁面數據，隨機訪問然後抓取數據 -更換用戶IP。
需要兔子IP可以加企鵝167737487。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

兔子IP解決日常使用過程中ip被封鎖IP被限制的幾種方法

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

【2024-05-21】以茶會友

分享多開技術-實現單窗口單IP，多窗口多個不同IP的技術【電腦端】

利用蘋果手機試玩app軟件賺錢揭祕其原理機制

蘋果手機怎麼無限刷APP試玩？IPhone試玩app無限刷教程技術！

程序員的福利-爬蟲學習——爲什麼爬蟲要使用IP代理

兔子IP解決日常使用過程中ip被封鎖IP被限制的幾種方法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結