urlparse模塊（python模塊）

原創

老鷹a

2019-07-12 14:27

一、urlparse模塊簡介

urlparse模塊主要是把url拆分爲6部分，並返回元組。並且可以把拆分後的部分再組成一個url。主要有函數有urljoin、urlsplit、urlunsplit、urlparse等。

二、urljoin函數使用

urljoin主要是拼接URL，它以base作爲其基地址，然後與url中的相對地址相結合組成一個絕對URL地址。函數urljoin在通過爲URL基地址附加新的文件名的方式來處理同一位置處的若干文件的時候格外有用。需要注意的是，如果基地址並非以字符/結尾的話，那麼URL基地址最右邊部分就會被這個相對路徑所替換。如果希望在該路徑中保留末端目錄，應確保URL基地址以字符/結尾。

輸入代碼：

import urlparse

#urljoin函數是合併域名和相對路徑的
urljoin = urlparse.urljoin('http://www.sina.cn/cc','file/down.php')
print urljoin

urljoin1 = urlparse.urljoin('http://www.sina.cn/cc/','file/down.php')
print urljoin1

代碼運行結果：

C:\Python27\python.exe C:/Users/Lee/Desktop/d/PycharmProjects/untitled/test.py

http://www.sina.cn/file/down.php

http://www.sina.cn/cc/file/down.php

三、urlparse函數和urlsplit函數使用

主要是分析urlstring，返回一個包含5個字符串項目的元組：協議、位置、路徑、查詢、片段。allow_fragments爲False時，該元組的組後一個項目總是空，不管urlstring有沒有片段，省略項目的也是空。urlsplit()和urlparse()差不多

輸入代碼：

import urlparse

url = 'http://www.baidu.com/good/index.php?id=18'

#urlsplit函數是把一個url查分出對應部分
result = urlparse.urlsplit(url)
print result
#顯示協議
print result.scheme
#顯示域名
print result.netloc
#顯示相對路徑
print result.path
#顯示查詢參數
print result.query

代碼運行結果：

C:\Python27\python.exe C:/Users/Lee/Desktop/d/PycharmProjects/untitled/test.py

SplitResult(scheme='http', netloc='www.baidu.com', path='/good/index.php', query='id=18', fragment='')

http

www.baidu.com

/good/index.php

id=18

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

urlparse模塊（python模塊）

高效率使用windows

智能決策新時代：可視化大屏是否能夠超越傳統白板？

python 發送郵件小程序

Android反編譯(一) 之反編譯JAVA源碼

隨機生成UserAgent的python庫（fake-useragent庫）

STAR雲安全評估

python使用IP代理示例及出錯解決方法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結