原创 用戶行爲分析模型-(行爲事件分析、用戶留存分析、漏斗分析、行爲路徑分析、用戶分羣、點擊分析)

最近有些忙,但是看到了很好的分析模型也要跟大家分享的,這篇博客有些粗糙,主要是po上一些鏈接供大家學習,有時間的話,我也會寫出自己關於用戶行爲分析的理解的。 下面是關於用戶行爲分析常見的分析維度,有助於爲新手入門找到方向。 1.行爲事件分

原创 特徵計算 - Jaccard 相似係數與 Python 代碼實現

Jaccard 相似係數又稱爲Jaccard相似性度量(Jaccard係數,Jaccard 指數,Jaccard index)。用於比較有限樣本集之間的相似性與差異性。Jaccard係數值越大,樣本相似度越高。定義爲相交的大小除以樣本集合

原创 用心整理了一份國內985/211大學名單及其一流學科

國內985/211大學名單,但其中未包含港澳臺的學校,比如香港中文大學,香港理工大學等。 類型 地區 學校名稱 一流學科建設名單 985 北京 清華大學 法學、政治學、馬克思主義理論、數學、物理學、化學、生物學、力學、機械工程、儀器科學與

原创 Matplotlib - 箱線圖、箱型圖 boxplot () 所有用法詳解

目錄 基本用法   水平箱線圖,顯示均值 改變箱線圖的形狀(箱體的形狀notch、異常值的形狀sym) 改變箱線圖的顏色(箱體邊框的顏色、箱體填充色)  相較散點圖和折線圖,柱狀圖、餅圖、箱線圖(箱型圖)是另外 3 種數據分析常用的圖形,

原创 Pyecharts - 動態地圖 geo()/ map() - 安裝與用法詳解

目錄 安裝Pyecharts 安裝對應的地圖拓展: 準備數據 使用 pyecharts 模塊中的 Geo 函數: 使用 pyecharts 模塊中的 map 函數: 把一些地域性比較明顯的數據顯示在一張地圖上,遠比給別人一個 Excel

原创 Matplotlib - 餅圖 pie() & 多重餅圖 subplots() 用法大全

相較散點圖和折線圖,柱狀圖、餅圖、箱線圖是另外 3 種數據分析常用的圖形,主要用於分析數據內部的分佈狀態或分散狀態。餅圖主要用於查看各分組數據在總數據中的佔比。 Matplotlib 中繪製餅圖的函數爲 pie () ,使用語法如下: p

原创 Matplotlib - 柱狀圖、直方圖 bar() 用法大全

相較散點圖和折線圖,柱狀圖(直方圖)、餅圖、箱線圖是另外 3 種數據分析常用的圖形,主要用於分析數據內部的分佈狀態或分散狀態。 柱狀圖(直方圖)主要用於查看各分組數據的數量分佈,以及各個分組數據之間的數量比較。 Matplotlib 中繪

原创 Matplotlib - 折線圖 plot() 用法大全

散點圖和折線圖是數據分析中最常用的兩種圖形。其中,折線圖用於分析自變量和因變量之間的趨勢關係,最適合用於顯示隨着時間而變化的連續數據,同時還可以看出數量的差異,增長情況。 Matplotlib 中繪製散點圖的函數爲 plot() ,使用語

原创 Python 畫圖常用點的形狀,Matplotlib 設置參數marker的值 - o + - ★☆►◁ - 夠用

marker type 含義 “.” point 點 “,” pixel 像素 “o” circle 圓 “v” triangle_down 下三角 “^” triangle_up 上三角 “<” triangle_left 左三角 “>

原创 數據建模SPSS - 非線性迴歸案例 - 按步驟詳解 -(SPSS)

在上一篇時間序列的文章中,偶然發現另一份數據的整體趨勢很符合非線性迴歸關係,那麼就順勢寫一篇非線性迴歸案例的文章吧。 準備工作:SPSS - 中文版 SPSS 22.0 軟件下載與安裝教程 - 【附產品授權許可碼,永久免費】 數據解釋:原

原创 Python 畫圖常用顏色 - 單色、漸變色、混色 - 夠用

單色    裝了seaborn擴展的話,在字典seaborn.xkcd_rgb中包含所有的xkcd crowdsourced color names。如下: plt.plot([1,2], lw=4, c=seaborn.xkcd_r

原创 Matplotlib - 散點圖 scatter() 用法大全

目錄  基本用法 散點的大小不同(根據點對應的數值) 散點的顏色不同(指定顏色或者漸變色) 散點圖和折線圖是數據分析中最常用的兩種圖形,他們能夠分析不同數值型特徵間的關係。其中,散點圖主要用於分析特徵間的相關關係,折線圖則用於分析自變量和

原创 數據預處理 - 遍歷求值提速 6 萬倍 lambda...if...else(if...else...) +map() 對比 iterrows() - Python代碼

Python 進行 DataFrame 數據處理的過程中,需要判斷某一列中的值(條件),然後對其他兩列或三列進行求和(均值/最值)等運算,並把運算結果存儲在新的一列中。幹說可能覺得比較暈,我們來看一個例子: 下表 data_base 中,

原创 數據建模 - 時間序列案例 -(SPSS)

時間序列簡單的說就是各時間點上形成的數值序列,通過觀察歷史數據的變化規律預測未來的值。在這裏需要強調一點的是,時間序列分析並不是關於時間的迴歸,它主要是研究自身的變化規律的。 第一步:導入數據 路徑:【文件】--【打開】--【數據】--【

原创 數據預處理 - Python連接MySQL數據庫(pymysql),DataFrame寫入 MySQL(create_engine)- Python代碼

模塊安裝 使用以下命令安裝 PyMySQL: $ pip install PyMySQL 若系統不支持 pip,還可以這樣安裝: $ git clone https://github.com/PyMySQL/PyMySQL $ cd