機械學習基礎(2)數據可視化

數據可視化

Matplotlib

Python中存在一個繪圖庫matplotlib()方法。使用matplot繪圖的基本方式爲:

import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
df.plot.bar(stacked=True)
#顯示所繪製的圖
plt.show()

matplotlib可以繪製直方圖,散點圖等,但是在繪製時需要執行座標軸等信息,十分繁瑣,因此,常見的我們使用pandas自帶的plot方法進行繪製

Pandas繪圖

在pandas中主要運用的繪圖函數爲plot函數,常用的繪圖圖形有:

圖形 函數
條形 bar()
堆積條形圖 bar(stacked=True)
水平堆積條形圖 barh(stacked=True)
直方圖 plot.hist(bins=20)
每列繪製不同的直方圖 hist(bins=20)
直方圖 hist
盒型圖 boxplot
區域塊圖形 area
散點圖 plot.scatter(x=‘a’, y=‘b’)

DataFrame.plot函數指定很多的屬性

參數 說明
subplots 將各個DataFrame列繪製到單獨的subplot中
sharex 如果subplots=True,則共用同一個x軸,包括刻度和界限
sharey 如果subplots=True,則共用同一個Y軸
figsize 表示圖像大小的元組
title 表示圖像標題的字符串
legend 添加一個subplot圖例(默認爲True)
sort_columns 以字母表順序繪製各列,默認使用當前列順序

Series.plot方法的參數如下

參數 說明
label 用於圖例的標籤
ax 要在其上進行繪製的matplotlib subplot對象.如果沒有設置,則使用當前matplotlib subplot
style 將要傳給matplotlib的風格字符串(如’ko–’)
alpha 圖表的填充不透明度(0到1之間)
kind 可以是’line’, ‘bar’, ‘barh’, ‘kde’
logy 在y軸上使用對數標尺
use index 將對象的索引用作刻度標籤
rot 旋轉刻度標籤(0到360)
xticks 用作x軸刻度的值
yticks 用作y軸刻度的值
xlimx 軸的界限(例如[0,101])
ylimy 軸的界限
grid 顯示軸網格線(默認打開)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章