Python基礎知識——urllib模塊在爬蟲中的應用

原創

2018-08-21 22:22

以一個小例子引入urllib模塊

import urllib.request
#urlretrieve('要爬取的網址','想要將網頁保存在本地的地址')，該方法可將網頁直接保存在本地，無需read()及寫入操作
a=urllib.request.urlretrieve('http://www.hellobi.com',filename='D:/python學習/1.html')

#urlcleanup可清除urlretrive產生的緩存
urllib.request.urlcleanup()

#info展示當前環境信息
file=urllib.request.urlopen('http://www.hellobi.com')
file.info()

#getcode獲取網頁狀態碼：200爲正常狀態     
file.getcode()
#geturl獲取網頁的名字
file.geturl()

——來自韋瑋老師課堂筆記及所悟

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Python基礎知識——urllib模塊在爬蟲中的應用

工作中用到的腳本合集

微服務實踐Aspire項目發佈到遠程k8s集羣

通過f-string編寫簡潔高效的Python格式化輸出代碼

[轉帖]20個常用的Linux工具命令

[轉帖]PostgreSQL從小白到高手教程 - 第46講：poc-tpch測試

24-5-18 X

SQL查詢性能優化

會員(用戶)數據化運營——指標介紹

會員(用戶)數據化運營——分析模型

dataframe行列查詢

Python基礎知識——作用域、函數、模塊

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結