原创 Numpy對數組的操作:創建/變形(升降維等)/計算/取值/複製/分割/合併

1. 簡介 NumPy(Numerical Python) 是 Python 語言的一個擴展程序庫,支持大量的維度數組與矩陣運算,此外也針對數組運算提供大量的數學函數庫。最主要的數據結構是ndarray數組。 NumPy 通常與

原创 sklearn的DecisionTreeRegressor 迴歸樹

DecisionTreeRegressor class sklearn.tree.DecisionTreeRegressor (criterion=’mse’, splitter=’best’, max_depth=None

原创 Pandas的基礎操作:介紹/創建/查看數據/賦值/刪除/常用函數接口

剛剛使用Python學習進行數據分析,分享一些概念和想法,希望可以大家一起討論,如果理解或者表達有不準確的地方,請多多指點,不吝賜教,非常感謝~~ Pandas是一個第三方庫,主要功能是提供了 DataFrame這個數據結構,

原创 Numpy的屬性及接口(求和/排序/均值/標準差/中位數等)

1. 探索屬性 在做數據分析之前,我們需要了解我們的數據,那麼如何查看數據的屬性,操作如下: a=np.arange(8) print(a) # 打印數組 print(a.ndim) # 秩 1 print(a

原创 python3基礎語法——對list基本操作(創建/添加元素/取值/刪除/修改/常用函數)

序列是Python中最基本的數據結構。是任意對象的有序集合,可以嵌套也不必數據類型一致;操作包括索引,切片,加,乘,檢查成員等。下面將詳細介紹: 1. 創建 可以嵌套;可以不必數據類型一致(數字,字符串,列表,元組,集合或者字典等

原创 python3基礎語法——對String基本操作(拼接/切片/分割/連接/統計次數/檢驗是否包含/大小寫/刪除字符/格式化輸出)

1. 拼接(包含字符串拼接數字) (1)使用 “+” 作爲字符串的拼接運算符 (2)字符串與數字進行拼接時,需要將數字轉換成字符串:使用 str() 或 repr() 函數 str1 = "這是:" str2 = "Funny"

原创 python3基礎語法——對字典基本操作(創建/添加/修改/複製/取值/刪除)

剛剛使用Python進行數據分析,分享一些概念和想法,希望可以大家一起討論,如果理解或者表達有不準確的地方,請多多指點,不吝賜教,非常感謝~~ 字典是什麼? menu = {"oatmeal": 3, "avocado

原创 Pandas的基礎操作:常用函數(求均值,方差,求和,衆數,統計元素個數等)/分組運算groupby操作/透視表

剛剛使用Python進行數據分析,分享一些概念和想法,希望可以大家一起討論,如果理解或者表達有不準確的地方,請多多指點,不吝賜教,非常感謝~~ 本文將介紹Pandas操作的最後一個部分,前兩篇分別是: 《Pandas的基礎操作

原创 Pandas的基礎操作:合併數據.merge()函數的使用

剛剛使用Python學習進行數據分析,分享一些概念和想法,希望可以大家一起討論,如果理解或者表達有不準確的地方,請多多指點,不吝賜教,非常感謝~~ 上一篇介紹《Pandas的基礎操作:介紹/創建/查看數據/賦值/刪除》:htt

原创 Numpy生成隨機數

說明: numpy包中可以生成隨機數,也可以生成隨機分佈;本文針對隨機數的生成講述,之後會結合matplotlib模塊,單獨寫一下分佈函數的使用及繪製 np.random.seed()的作用:使得隨機數據可預測 當我們設置

原创 Numpy生成隨機分佈函數“二項分佈”+“正態分佈”,使用matplotlib展示概率質量函數(PMF)/概率密度函數(PDF)

numpy.random.binomial(n,p,size):產生size個符合(n,p)的二項分佈隨機數 即,相當於進行size次實驗,每次實驗都投擲n枚硬幣/每次實驗都將一枚硬幣投擲n次,記錄size次實驗中,正面朝上

原创 DecisionTreeClassifier的參數criterion 與 splitter/使用紅酒數據集創建一個樹

剛剛使用SKLearn學習機器學習進行數據分析,分享一些概念和想法,希望可以大家一起討論,如果理解或者表達有不準確的地方,請多多指點,不吝賜教,非常感謝~~ 本文將介紹sklearn的決策樹模塊 涉及到的理論知識,請轉至上篇《

原创 使用matplotlib製作“散點圖”:pyplot.scatter(X,Y,alpah,s,c,cmap,maker,linewidths,edgecolors)+ RGB 三元組顏色

在繪圖的時候,關於顏色的參數總是很模糊,可以使用"c"也可以使用“cmap”但是不知道區別在哪裏,本文除了介紹散點圖的參數外,還會詳細的介紹一下“顏色”參數相關內容 散點圖:plt.scatter() 常用參數說明: X,

原创 Pandas的基礎操作:排序/設置行索引

剛剛使用Python進行數據分析,分享一些概念和想法,希望可以大家一起討論,如果理解或者表達有不準確的地方,請多多指點,不吝賜教,非常感謝~~ 本文將介紹Pandas操作的最後一個部分,前兩篇分別是: 《Pandas的基礎操作

原创 sklearn的DecisionTreeClassifier的參數random_state

剛剛使用SKLearn學習機器學習進行數據分析,分享一些概念和想法,希望可以大家一起討論,如果理解或者表達有不準確的地方,請多多指點,不吝賜教,非常感謝~~ 本文將繼續介紹sklearn的決策樹模塊的其他參數 涉及到的理論知識