requests爬蟲使用的IP代理未生效（解決方法）

原創

小仙女的小跟班_fairy

2018-12-28 22:13

在通過requests代理進行網絡爬蟲，或者是scrapy進行網絡爬蟲時，不可避免用到IP代理方式一個IP多次訪問導致IP地址被封禁，結果無法獲取數據的尷尬。但是有時候出現IP代理無法失效的情況：

解決方法爲：

查看請求的url地址使用的協議時http還是https，我們設置的代理ip的協議也應該時相同的協議，否則代理不會生效的。

代理方法如下：

# 驗證ip地址是否正確，，
import requests
from lxml import etree

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.221 Safari/537.36 SE 2.X MetaSr 1.0",
}
url = 'http://ip.tool.chinaz.com/'
proxies = {
    "http": "http://120.78.185.175:8118"
}

wb_data = requests.get(url=url, headers=headers, proxies=proxies)
content = etree.HTML(wb_data.text)
print(content.xpath('//*[@id="rightinfo"]/dl/dd[1]/text()')[0])

我們可以在https://www.xicidaili.com得到ip列表（免費的ip代理，但是還是需要一個更快的的代理ip地址）

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

【SQL進階】CASE語句的使用

語法格式 case [列名] when [可能值1] then [目標值1] when [可能值2] then [目標值2] ... else [缺省值] end 注意的點 else最好寫上 end必須寫 when後面的和then後面的值

金大鑫要堅持

2024-05-30 14:29:54

blog-auto-publishing-tools博客自動發佈工具

https://github.com/ddean2009/blog-auto-publishing-tools

2024-05-30 14:28:04

微服務新體驗之Aspire初體驗

安裝aspire 查看vs版本我這的版本是17.9.7,不支持aspire，所以需要升級更新VS 點擊幫助->檢查更新點擊更新靜等安裝升級創建aspire項目項目創建成功，如下圖運行Aspire項目在Aspir

2024-05-30 14:28:04

第七節：RabbitMq延遲隊列實操(死信交換機+TTL)和死信插件的使用

一. 二. 三. ! 作者 : Yaopengfei(姚鵬飛) 博客地址 : http://www.cnblogs.com

2024-05-30 14:24:33

flask 配合 sqlite3 維護數據庫的數據方法

import json import sqlite3 con = sqlite3.connect("Test.db") cur = con.cursor() # ==https://blog.csdn.net/GuoQiZhang/arti

張博的博客

2024-05-30 14:22:53

C#去除時間格式化之後中間的T字母

需求是這樣的, 前後端傳參,然後後端序列化把字符串存在數據庫. 然後發現時間類型的字段,序列化之後 ,有個字母T, DateTime dt = DateTime.Parse("2024-05-28 23:49:43"); strin

2024-05-30 14:22:43

國外lead,聯盟常用名詞解釋

作者：Daniel鏈接：https://www.zhihu.com/question/534087082/answer/2777709520來源：知乎著作權歸作者所有。商業轉載請聯繫作者獲得授權，非商業轉載請註明出處。 EMU是什EMU麼

2024-05-30 14:22:03

python3.x中ORM框架SQLObject使用SQLite數據庫隨筆

1、如果未安裝SQLObject首先要安裝，在管理員CMD下，輸入如下命令：pip install sqlobject 2、創建數據庫文件，並建立數據庫連接，　　通過修改SQLObject內置的sqlhub的processConnecti

2024-05-30 14:21:53

npm error Cannot read properties of null (reading 'isDescendantOf')

這個錯誤通常是由於 npm 緩存或者依賴關係問題導致的。您可以嘗試清除 npm 緩存並重新安裝依賴來解決這個問題。具體操作可以參考以下步驟：清除 npm 緩存：運行命令 npm cache clean --force 刪除 node_

2024-05-30 14:18:13

error in ./node_modules/@intlify/core-base/dist/core-base.cjs

ERROR Failed to compile with 1 error

2024-05-30 14:18:13

optional install error: Error: Unsupported URL Type: npm:vue-loader@^16.1.0

/ [33/49] Installing lodash@^4.17.14[vue-loader-v16@npm:vue-loader@^16.1.0] optional install error: Error: Unsupported U

2024-05-30 14:18:13

request to https://registry.npm.taobao.org/cnpm failed, reason: certificate has expired

換華爲的，否則會出問題：cnpm confg set registry https://mirrors.huaweicloud.com/repository/npm/ npm ERR! code CERT_HAS_EXPIRED npm E

2024-05-30 14:18:13

nvidia-smi版本驅動不匹配，以及 cuda不可用兩個問題處理

重裝了nvidai cuda ，啓動了nvidia-fabricmanager CUDA initialization: Unexpected error from cudaGetDeviceCount()解決方法 $ python

2024-05-30 14:16:52

pdns部署

一、基礎配置 1.1 環境說明操作系統： Centos 7.6 PDNS： 4.1.11-1.el7 MariaDB： 5.5.65 1.2 關閉防火牆和selinux setenforce 0sed -i 's/SEL

2024-05-30 14:16:52

ubuntu安裝包工具apt-get相關問題

cuda nvidis等各種包的路徑 https://mirrors.cloud.tencent.com/nvidia-cuda/ubuntu2204/x86_64/ 安裝參考： https://blog.csdn.net/qq_4

2024-05-30 14:16:52

24小時熱門文章

【SQL進階】CASE語句的使用

最新文章

最新評論文章