python+selenium小結16:導入Beautiful Soup ,獲取表格中指定列的數據

Beautiful Soup 是一個可以從HTML或XML文件中提取數據的Python庫.它能夠通過你喜歡的轉換器實現慣用的文檔導航,查找,修改文檔的方式.Beautiful Soup會幫你節省數小時甚至數天的工作時間.

安裝:$ pip install beautifulsoup4

Beautiful Soup 的介紹,具體參考文檔:https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html

導入BeautifulSoup,獲取網頁源碼中某一屬性的值,用得最多的方法就是find,find_all

獲取表格中指定列的數據,具體參照如下:

 

 

#!/usr/bin/env python 
# -*- coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup
import time

a_url = 'http://31f.cn/'
html = requests.get(a_url)
pagesource = html.text
soup = BeautifulSoup(pagesource, 'html.parser')

#獲取表格中指定列的數據
trs = soup.find('table', class_='table table-striped').find_all('tr')#先查找出來所有行
for tr in trs: #循環所有行
    for td in tr.find_all('td')[1:3]: #在行中查找第2列,第3列的值
        print(td.getText()) #打印值

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章