第二章 urllib數據挖掘(爬蟲有道翻譯及關於AttributeError: module 'urllib.request' has no attribute 'parse'的問題)

爬取有道,一開始運行以下代碼出現了AttributeError: module ‘urllib.request’ has no attribute 'parse’的問題

from urllib import request
#import urllib.request as request
import urllib.parse
...
...
...

```python
data = request.parse.urlencode(formdata).encode(encoding='utf-8')

後來百度才知道request已經不是一個方法而是一個模塊了,所以我們必須用導入模塊的方法進行導入,

import urllib.request as request

而且parse是urllib裏面的一個方法,所以直接urllib.parse就可以調用parse了。
下面直接附上正確的代碼

import urllib.request as request#request作爲模塊導入
import urlli

#構造請求頭,僞裝成機器訪問
然後打開有道翻譯官網
在這裏插入圖片描述

header = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36 Edge/18.17763"}
key = input("請輸入需要翻譯的文字:")

我們開始查找請求正文
步驟如下:
在這裏插入圖片描述
在這裏插入圖片描述

fromdata={
"action":"FY_BY_REALTlME",
"bv":"908078567e4fa99e9a8b55bb7ca876a4",
"client":"fanyideskweb",
"doctype":"json",
"from":"AUTO",
"i":key,
"keyfrom":"fanyi.web",
"salt":15840040561109,
"sign":"28e7538ef947d7a398362bb9572267d5",
"smartresult":"dict",
"to":"AUTO",
"ts":"1584004056110",
"version":"2.1",
}

查找url
在這裏插入圖片描述注意爲了躲避反爬,我們還需要把“_o"去掉

url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule"
#經過urlencode()對key轉碼
data = urllib.parse.urlencode(fromdata).encode(encoding="utf-8")
req = request.Request(url,data=data,headers= header)
response=request.urlopen(req).read()
print(response)

然後運行就會出現以下信息,說明成功了
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章