python reptile(爬蟲)[一]

原創

2018-11-21 01:52

使用request獲取網頁資源

#導入
import requests
from bs4 import BeautifulSoup
# 獲取
res = requests.get("https://www.sina.com.cn/")
#指定編碼
res.encoding = "utf-8"

使用beautifulsoup獲取指定資源

# 轉化request對應爲soup , 並指定html解釋器
soup = BeautifulSoup(res.text,"html.parser")
# 獲取指定id內容--: 以#開頭
for news in soup.select("#ad_45976"):
    print(news.text)
# 獲取指定html標籤內容 直接使用標籤名
for news in soup.select("a"):
    print(news.text)
# 獲取指定class內容 --: 以.開頭
soup.select(".top-nav")[0].text  # 獲得目標class的內容
# 組合查詢 子級
print(soup.select(".top-nav .tn-title")[0].text) # 在class top-nav下的 class tn-title的內容 
# 組合查詢 屬性
print(soup.select('a[target="_blank"]')) #target屬性爲_blank的a標籤
# 自核查詢 直接子標籤
print(soup.select("i > em"))

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

三星S5安裝google play

對於國內的安卓手機玩家而言，玩點歐美一線大作往往都會比較痛苦，因爲不少國外遊戲都會只在Google Play商店中上架、而且要求手機安裝Google服務框架纔可以運行。恰恰，國內市場上大部分安卓手機的出廠ROM中是不包含這部分內容的。有的

2020-07-04 14:01:21

悟已往之不諫，知來者之可追；實迷途其未遠，覺今是而昨非

今天發現以前都沒有認認真真的寫博客，每次都是瞎幾把亂寫，然後現在發現博客沒質量而且最關鍵的是，我他媽的做過的知識點又忘記了，所以從今天起我決定

2020-07-04 14:01:19

2020年太多太多的事情發生

今天是2020年6月28日，2020年已經過去了一半。焦慮慢慢在心裏聚集。 2019年四月份，我從上海回到長沙開始創業，從辦公場地的選址，到公司註冊，從初創團隊的組建，到公司規章制度的建立，都親力親爲一手給置辦了過來，到今年6月份，公司

2020-07-04 14:01:17

比絕望之谷更可怕的是遲遲未到達愚昧之巔

2020-07-04 14:01:17

對於任意字符串，按照字節數來截取字符串長度

這個題目出自java程序員面試寶典，我看了半天覺得代碼有點小問題，做了點小修改，同時覺得這個題目蠻有意思，在此貼出來給大家討論下：描述：編寫一個截取字符串的函數，輸入爲一個字符串和字節數，輸出爲按字節截取的字符串。但是要保證漢字不被截

2020-07-02 13:51:43

記錄一個oracle誤刪表drop的回滾處理。

誤刪表名： T12 查看recyclebin的信息 SQL> col origninal_name format a15; SQL> col type format a15; SQL> select object_name,or

2020-06-28 09:01:42

大三第一次面試---字節跳動前端實習面試總結

就在前天晚上的時候，忽然收到了字節的hr打來的電話，昨天面試完了，然後整個人都不好了。今天湊空寫個總結吧一天潦草的準備 hr給我打電話的時候問我有沒有時間，說邀請我參加他們的面試（哪兒是邀請啊，自己巴心不得參加）然後hr電

2020-06-27 15:44:47

KKT (LICQ)

文章目錄基本內容LICQ 假設KKT 定理KKT定理的證明引理AFarkas 引理推論KKT定理的證明 H. E. Krogstad, TMA 4180 Optimeringsteori KARUSH-KUHN-TUCKER

2020-06-22 14:15:12

Bayesian Optimization with a Finite Budget: An Approximate Dynamic Programming Approach

文章目錄概主要內容 Lam R, Willcox K, Wolpert D H, et al. Bayesian Optimization with a Finite Budget: An Approximate Dynamic

2020-06-22 11:32:46

雜學——密碼學、中國餘數定理、韓信點兵法、取模運算

目錄大綱密碼學專業術語參考文章，簡單學習學習時，要知道的相關時事密碼學密碼學是研究編制密碼和破譯密碼的技術科學。研究密碼變化的客觀規律，應用於編制密碼以保守通信祕密的，稱爲編碼學；應用於破譯密碼以獲取通信情報的，稱爲破譯學，總

2020-06-21 17:37:29

雜學——硬件：MIPI，壓/速/頻信號、並行轉串行，SDI，PPM，單片機及開發板，交流直流，電容電阻，總線，RS485

MIPI（移動產業處理器接口）： MIPI DSI協議介紹攝像頭的MIPI接口、DVP接口和CSI接口（百度知道） MIPI接口資料彙總（精）串行接口、並行接口、低壓差分信號、差分佈線： Altium差分佈線和等長方法差分信號

2020-06-21 17:37:29

360使用--關掉彈窗推送

僅做記錄 1.右鍵360圖標，選擇設置： . 2.找到彈窗設置 3.找到產品推薦提示，這些默認都是沒有勾選的，太噁心了，勾上，保存完工。

2020-06-21 09:22:21

闂茬潃鏃犺亰鍐欑偣浠�涔�

// // Created by LCBHSStudent on 2020/2/25. // #ifndef SLOT_SIGNAL_BASE_FUNCTION_H #define SLOT_SIGNAL_BASE_FUNCTI

黑色低级高中生

2020-06-19 22:28:02

計算機網絡 c++17+ 基於asio2的protocol6(選擇重傳)udp異步模擬通信樣例 [廢棄，原模板工程實現請看《烤全羊啊嗯》]

開發環境 vs2019 c++"latest" with asio2config.htimer.h（棄用？）main.cppProtocolApp.hprotocolApp.cpp TODO\color{red}{TODO}TOD

黑色低级高中生

2020-06-19 16:27:52

golang程序發送http請求在socks代理下無效的解決方法(Win10)

在使用golang向某些網站發送http請求時，發現它在沒有進行設置的情況下並不能直接使用正在運行的socks代理(SSR等)發送數據。起初我認爲是終端不走代理的原因… 首先使用Privoxy將socks5代理轉化爲本地htt

黑色低级高中生

2020-06-19 14:26:25

24小時熱門文章

最新文章

最新評論文章