pandas讀取html頁面中的表格數據

原創

2020-04-02 22:00

說明：直接調用pands中的pd.read_html(url)函數，如果頁面中有表格，那麼表格數據會以DataFrame格式存儲下來。

比如我要獲取下面的數據：

調用代碼：

import pandas as pd
pd.set_option('display.width',1000)
pd.set_option('display.max_row',1000)
pd.set_option('display.max_column',1000)

html=pd.read_html('http://www.hbzwfw.gov.cn/art/2019/11/28/art_21290_7313.html')
print(html[1])

取出表格的數據是這樣的：

這樣就省去了用爬蟲爬去再取篩選td/tr標籤了，還是比較方便的。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Python的while循環

1.while循環的格式 while 條件: 條件滿足時，做的事情1 條件滿足時，做的事情2 條件滿足時，做的事情3 ...(省略)... demo

2023-10-10 11:37:31

python初識第二天

認識現實世界與虛擬世界的橋樑感受python帶來的魔力數據類型 Python裏，最常用的數據類型有三種——字符串(str)、整數(int)和浮點數(float) 字符串，字符串英文string，簡寫str 字符串的識別方式非常簡單—

2023-02-01 22:01:30

Python 的十大特性

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

Rupam Choudhary

2021-12-16 16:04:03

Python開發工程師[金融方向] Remote/Singapore (20k - 45k)

簡單介紹：要做的事：同交易員一起開發交易相關係統；能力要求：能獨立解決問題，完成項目開發，有較強的學習能力（技術和業務）品格正直，較強的心裏承壓能力；職業前景：能提供給你完全不同於互聯網公司的報酬上限，職業途徑；與一流交易員溝通機會，瞭解他

2021-12-09 17:53:05

JavaScript 瀏覽器統治地位不保？Python 有望取代

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-02 17:58:57

安裝筆記本應用商店的pycharm，再安排pandas等模塊，說是沒有打包工具?

大家好，我是Python進階者。一、前言前幾天在Python最強王者交流羣【斌】問了一個Python庫安裝的問題。求教大佬：華爲筆記本，麒麟系統，安裝筆記本應用商店的pycharm，再安排pandas等模塊，說是沒有打包工具，再安裝

2024-05-25 10:02:28

Python爬蟲技術與數據可視化：Numpy、pandas、Matplotlib的黃金組合

前言在當今信息爆炸的時代，數據已成爲企業決策和發展的關鍵。而互聯網作爲信息的主要來源，網頁中蘊含着大量的數據等待被挖掘。Python爬蟲技術和數據可視化工具的結合，爲我們提供了一個強大的工具箱，可以幫助我們從網絡中抓取數據，並將其可視

2024-04-29 23:26:28

五一假期暢遊指南：Python技術構建的熱門景點分析系統解讀

導言五一假期即將到來，作爲一名熱愛旅遊的技術達人，我總是希望能夠通過技術手段更好地規劃我的旅行路線。在這篇文章中，我將向大家介紹一款基於Python技術的熱門景點分析系統，幫助您在五一假期中游玩得更加盡興！ 1. 系統概述熱門景點

2024-04-16 23:25:46

從靜態到動態化，Python數據可視化中的Matplotlib和Seaborn

本文分享自華爲雲社區《Python數據可視化大揭祕：Matplotlib和Seaborn高效應用指南》，作者：檸檬味擁抱。安裝Matplotlib和Seaborn 首先，確保你已經安裝了Matplotlib和Seaborn庫。如果沒有

2024-03-25 11:01:41

05-快速理解SparkSQL的DataSet

1 定義一個數據集是分佈式的數據集合。Spark 1.6增加新接口Dataset，提供 RDD的優點：強類型、能夠使用強大lambda函數 Spark SQL優化執行引擎的優點可從JVM對象構造Dataset，然後函數式轉換（map

2024-03-25 02:48:38

大模型推理框架：從理論到實踐的全面解析

在數據驅動的時代，深度學習技術已經滲透到各個行業，從圖像識別到自然語言處理，從推薦系統到智能客服，其應用無處不在。然而，深度學習模型的訓練和推理過程往往涉及大量數據和複雜計算，傳統的計算框架難以滿足需求。因此，大模型推理框架應運而生，成爲解

2024-03-23 00:31:01

盤點一個Pandas處理json數據的實戰案例

大家好，我是Python進階者。一、前言前幾天在Python最強王者交流羣【黑科技·鼓包】問了一個Pandas處理json數據的問題。問題如下：大佬們請教下一個很簡單的問題，因爲我半瓢水也不知道該怎麼解決，問AI好像也寫不好描述，麻煩幫

2024-03-06 22:16:06

微博數據可視化分析：利用Python構建信息圖表展示話題熱度

1. 引言隨着社交媒體的迅速發展，微博已成爲人們交流觀點、表達情感的重要平臺之一。微博評論數據蘊含着豐富的信息，通過對這些數據進行分析和可視化，我們可以深入瞭解用戶對特定話題的關注程度和情感傾向。本文將介紹如何利用Python進行微博

2024-02-20 00:22:15

盤點一個txt文檔合併的實戰需求（方法三）

大家好，我是皮皮。一、前言前幾天在Python最強王者交流羣【FiNε_】問了一個Pandas數據合併的問題。問題如下圖所示：上一篇文章中我們已經看到了3個方法，這一篇文章我們一起來看看另外一個方法。二、實現過程這裏【吳超建】斗

2024-02-04 21:53:00

盤點一個txt文檔合併的實戰需求（方法一）

大家好，我是皮皮。一、前言前幾天在Python最強王者交流羣【FiNε_】問了一個Pandas數據合併的問題。問題如下圖所示：二、實現過程這裏【隔壁😼山楂】給了一個指導，如下所示：並給出瞭如下代碼： from pathlib

2024-02-02 21:54:46

24小時熱門文章

最新文章

最新評論文章