數據可視化
Matplotlib
Python中存在一個繪圖庫matplotlib()方法。使用matplot繪圖的基本方式爲:
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
df.plot.bar(stacked=True)
#顯示所繪製的圖
plt.show()
matplotlib可以繪製直方圖,散點圖等,但是在繪製時需要執行座標軸等信息,十分繁瑣,因此,常見的我們使用pandas自帶的plot方法進行繪製
Pandas繪圖
在pandas中主要運用的繪圖函數爲plot函數,常用的繪圖圖形有:
圖形 | 函數 |
---|---|
條形 | bar() |
堆積條形圖 | bar(stacked=True) |
水平堆積條形圖 | barh(stacked=True) |
直方圖 | plot.hist(bins=20) |
每列繪製不同的直方圖 | hist(bins=20) |
直方圖 | hist |
盒型圖 | boxplot |
區域塊圖形 | area |
散點圖 | plot.scatter(x=‘a’, y=‘b’) |
DataFrame.plot函數指定很多的屬性
參數 | 說明 |
---|---|
subplots | 將各個DataFrame列繪製到單獨的subplot中 |
sharex | 如果subplots=True,則共用同一個x軸,包括刻度和界限 |
sharey | 如果subplots=True,則共用同一個Y軸 |
figsize | 表示圖像大小的元組 |
title | 表示圖像標題的字符串 |
legend | 添加一個subplot圖例(默認爲True) |
sort_columns | 以字母表順序繪製各列,默認使用當前列順序 |
Series.plot方法的參數如下
參數 | 說明 |
---|---|
label | 用於圖例的標籤 |
ax | 要在其上進行繪製的matplotlib subplot對象.如果沒有設置,則使用當前matplotlib subplot |
style | 將要傳給matplotlib的風格字符串(如’ko–’) |
alpha | 圖表的填充不透明度(0到1之間) |
kind | 可以是’line’, ‘bar’, ‘barh’, ‘kde’ |
logy | 在y軸上使用對數標尺 |
use index | 將對象的索引用作刻度標籤 |
rot | 旋轉刻度標籤(0到360) |
xticks | 用作x軸刻度的值 |
yticks | 用作y軸刻度的值 |
xlimx | 軸的界限(例如[0,101]) |
ylimy | 軸的界限 |
grid | 顯示軸網格線(默認打開) |