Python進階：爬蟲---URL處理

原創

2020-06-26 17:06

URL編碼

發送請求(漢字)時需要進行轉碼例如：

原地址：http://www.oschina.net/search?scope=bbs&q=C語言
編碼後：http://www.oschina.net/search?scope=bbs&q=C%E8%AF%AD%E8%A8%80
語言：%E8%AF%AD %E8%A8%80 (三個%代表一個漢字)

URL拼接

urllib 的 urlencode() 接收的參數是一個字典：
wd = {"wd" : "奧特曼"}
urllib.urlencode(wd)
結果：wd=%E5%A5%A5%E7%89%B9%E6%9B%BC

URL拼接例子

import urllib
import urllib.request as urllib2

url = "http://www.baidu.com/s"                #就採用http吧
keyword = input("請輸入要查詢的字符串：")
wd = {"wd": keyword}                               #字典類型
#Python2： urllib.encode() == python3： urllib.parse.encode()
wd = urllib.parse.urlencode(wd)              #編碼轉換
fullurl = url + "?" + wd
headers = {"User-Agent": "Mozilla........."}
request = urllib2.Request(fullurl, headers = headers)
response = urllib2.urlopen(request)
print(fullurl)
# print(response.read().decode('utf-8'))

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

2019 版_Python 常見的 170 道面試題全解析：語言特性

語言特性談談對 Python 和其他語言的區別簡述解釋型和編譯型編程語言 Python 的解釋器種類以及相關特點？ Python3 和 Python2 的區別？ Python3 和 Python2 中 int 和 long 區

2020-07-07 21:39:58

Python進階7——字典與集合

1.創建字典的五種方式 d1=dict(one=1, two=2) d2={'one':1, 'two':2} d3=dict(zip(['one', 'two'], [1,2])) d4=dict([('two', 2), ('one

2020-07-07 11:05:39

學習筆記——Python的特殊方法

一、簡介： 1、python能夠將任意變量變成str是因爲任何數據類型的實例都有一個特殊方法：__str__() 2、python的特殊方法： (1).特殊方法定義在class中 (2).不需要直接調用 (3).python的某些函數或操

2020-07-07 03:58:10

【Python進階】進階小技巧

鏈式比較： >>> x = 5 >>> 1 < x < 10 True >>> 10 < x < 20 False >>> x < 10 < x*10 < 100 True >>> 10 > x <=9 True >>> 5 == x

2020-07-02 22:55:01

038_Python網絡編程

Python網絡編程1. 網絡通信概述2. TCP/IP 協議2.1 認識 TCP/IP2.2 IP 地址3. socket 編程3.1 網絡進程間的通信 (socket)3.2 UDP3.3 TCP3.3.1 認識 TCP3.3

煮面要加牛奶

2020-06-26 08:36:58

035_計算機網絡知識難點歸納

文章目錄計算機網絡相關知識點整理:1. OSI，TCP/IP，五層協議的體系結構，以及各層協議?2. TCP 和 UDP 是什麼?簡述它們有什麼區別?3. 請描述 TCP 三次握手的過程，爲什麼要三次握手?4. 請描述 TCP

煮面要加牛奶

2020-06-26 08:36:58

python命令行操作：Click包

0 前言在Python開發和測試過程中主要有兩種模式可以選擇：腳本模式、命令行模式。在代碼的開發和調試過程中使用腳本模式還是很方便的，尤其接觸pycharm、eclipse這類強大的IDE，或者配合vs code這種綜合的文本編

Lavi_qq_2910138025

2020-06-22 04:15:19

python程序的打包和安裝

0 前言我們經常會使用pip setup.py install 安裝一個源碼包，可是這個可以安裝的源碼包是怎麼生成的，這個setup.py又是怎麼生成的呢？這篇文章中，我們就來一探究竟。用來進行python程序打包的兩個常用工

Lavi_qq_2910138025

2020-06-22 04:15:19

python中的operator模塊

0 operator模塊簡介 operator 模塊提供了一套與Python的內置運算符對應的高效率函數。例如，operator.add(x, y) 與表達式 x+y 相同。許多函數名與特殊方法名相同，只是沒有雙下劃線。爲了向後

Lavi_qq_2910138025

2020-06-20 03:42:17

聊聊python中排序：sort與sorted

0 前言有時候我們需要自定義排序的規則，但是又不想自己再寫一遍排序函數，所以庫中的排序函數一般都支持我們自定排序規則，然後以函數的形式傳遞給排序函數，就完成了自定義排序的需求。之前一直用C++，知道C++中的排序函數sort是可

Lavi_qq_2910138025

2020-06-20 02:06:53

用Python爬取招聘網站數據，讓學習、求職信息公開透明化~

1、項目背景隨着科技的飛速發展，數據呈現爆發式的增長，任何人都擺脫不了與數據打交道，社會對於“數據”方面的人才需求也在不斷增大。因此瞭解當下企業究竟需要招聘什麼樣的人才？需要什麼樣的技能？不管是對於在校生，還是對於求職者來說，都顯得很

大咖爱爬虫

2020-06-16 06:07:13

Python進階5——切片

關於切片已經在Python知識點3——列表操作中簡要介紹，切片是序列類型的一部分，不僅列表能切片，元組，字符串也能切片切片會忽略區間的最後一個元素，也就是左閉右開。切片的一般形式是s[a:b:c]，其中a是起始下標，b是終止下標，

2020-06-16 02:08:05

Python進階4——元組與拆包

元組不僅不可變，而且可以通過拆包（取出元組的某些元素）來顯示某些信息 twodimpos=(10,20) x,y=twodimpos#拆包賦值 print(x,y) length, width, height=(4,5,6)#拆包取出三

2020-06-16 02:08:05

Python進階6——序列操作

1.序列的拼接和複製 Python中使用+對序列進行拼接，使用*對序列進行復制 s=str(1234) l=list(range(2,13)) print(s,l) print('----------------') print(s*2

2020-06-16 02:08:05

Django系列(3)-統一封裝Response消息體

親測，直接拷貝我代碼用就好，有問題請留言～定義常見code # 響應成功，狀態碼200 CODE_SUCCESS = '000000' MSG_SUCCESS = '成功' # token失效或權限認證錯誤，狀態碼401 COD

2020-06-15 19:42:30

24小時熱門文章

最新文章

最新評論文章