Python快速入門5--Python數據分析工具

Python數據挖掘相關擴展庫

擴展庫 簡介
Numpy 提供數組支持,以及相應的高效的處理函數
Scipy 提供矩陣支持,以及矩陣相關的數值計算模塊
Matplotlib 強大的數據可視化工具、作圖庫
Pandas 強大、靈活的數據分析和探索工具
StatsModels 統計建模和計量經濟學,包括描述統計、統計模型估計和推斷
Scikit-Learn 支持迴歸、分類、聚類等強大的機器學習庫
Keras 深度學習庫,用於建立神經網絡以及深度學習模型
Gensim 用來做文本主題模型的庫,文本挖掘可能用到

Numpy

import numpy as np#一般以np作爲numoy的別名
a=np.array([2,0,1,5])#創建數組
print(a)#輸出數組
print(a[:3])#引用前三個數字(切片)
print(a.min())#輸出a的最小值
a.sort()#將a的元素從小到大排序,此操作直接修改a,因此這時候a爲[0,1,2,5]
b=np.array([[1,2,3],[4,5,6]])#創建二維數組
print(b*b)#輸出數組的平方陣,即[[1,4,9],[16,25,36]]

Matplotlib

import numpy as np
import matplotlib.pyplot as plt#導入Matplotlib

x=np.linspace(0,10,1000)#作圖的變量自變量
y=np.sin(x)+1#因變量y
z=np.cos(x**2)+1#因變量z

plt.figure(figsize=(8,4))#設置圖像大小
plt.plot(x,y,label='$\sin x+1$',color='red',linewidth=2)#作圖,設置標籤
plt.plot(x,z,'b--',label='$\cos x^2+1$')#作圖,設置標籤、線條類型
plt.xlabel('Time(s)')#x軸名稱
plt.ylabel('Volt')#y軸名稱
plt.title('A Simple Example')#標題
plt.ylim(0,2.2)#顯示的y軸範圍
plt.legend()#顯示圖例
plt.show()#顯示作圖結果

Scikit-Learn

1.所有模型提供的接口有:
model.fit():訓練模型,對於監督模型來說是fit(X,y),對於非監督模型是fit(X)
2.監督模型提供的接口有:
model.predict(X_new):預測新樣本
model.predict_proba(X_new):預測概率,僅對某些模型有用(比如LR)
model.score():得分越高,fit越好
3.非監督模型提供的接口有:
model.transform():從數據中學到新的“基空間”
model.fit_transform():從數據中學到新的基並將這個數據按照這組“基”進行轉換

from sklearn.linear_model import LinearRegression
model=LinearRegression()
print(model)

from sklearn import datasets
iris=datasets.load_iris()
print(iris.data.shape)

from sklearn import svm

clf=svm.LinearSVC()
clf.fit(iris.data,iris.target)
clf.predict([[5.0,3.6,1.3,0.25]])
clf.coef_
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章