原创 Pyecharts 靜態圖片輸出&ppt中動態圖表

pyecharts 簡介 pyecharts 是一個用於生成 Echarts 圖表的類庫。Echarts 是百度開源的一個數據可視化 JS 庫。用 Echarts 生成的圖可視化效果非常棒,pyecharts可以與 Python

原创 音頻轉文字分析

音頻轉文字分析 工作裏面需要用到音頻轉成文字做數據分析,自己就想着測試下看看,現在Python音頻轉文字的方法用很多種,其中比較常用的有: 1.調用百度AI,科大訊飛,google等api 2.自己做數據挖掘,利用神經網絡等算法訓

原创 創建這個博客的初衷

我是一個半路出家的數據小哥,之前大學裏學的機械電子工程,工作一年裏接觸了很對數據相關的工作,偶然間知道了還有數據分析,數據挖掘的工作,開始了自己的學習和了解,經過一段時間呢,我發現這個行業其實是非常適合我的,包括自己有編程方面的興

原创 基於聚類的精準營銷項目

總體思路 基於聚類的精準推薦總體 先基於聚類: 把用戶分羣,對每一個客戶都標記上標籤值。 生成推薦規則: 在用戶沒買過的商品中,同類客戶總購買次數(平均購買次數)最多的商品,就是這類客戶最喜歡的商品 數據清洗 優

原创 詞雲圖分析微博評論

微博評論詞雲圖 最近小豬在5月20號發佈了一篇對周揚青的小作文,我正好也想做一個詞雲圖的項目, 所以爬取了這條微博的評論,做個詞雲圖來看看大家都在說些什麼, PS:有些信息只能脫敏 #導包 import pandas as p

原创 超超級強的分類算法SVM-支持向量機

SVM-支持向量機-(Support Vector Machine) SVM 原理 對於機器學習算法來說,svm 的算法原理是非常複雜的,涵蓋非常多的數學原理,構建起來很難,但是理解起來很簡單。 先從二維空間來看下,如左圖可以用一

原创 基於RFM模型的客戶分析

客戶RFM模型分類 客戶類型 最近一次交易距離觀測窗口的天數(黏性) 累計交易頻次(忠誠度) 累計交易成交額(消費能力) 對應場景 重要價值客戶 + + + RFM都很大,優質客戶 重要召回客戶 - + + 成交

原创 電商數據基於聚類的精準營銷項目

總體思路 基於聚類的精準推薦總體 先基於聚類: 把用戶分羣,對每一個客戶都標記上標籤值。 生成推薦規則: 在用戶沒買過的商品中,同類客戶總購買次數(平均購買次數)最多的商品,就是這類客戶最喜歡的商品 數據清洗 優

原创 電子遊戲銷售分析

Video Game Sales電子遊戲銷售分析 定義問題: 特徵分析: 1.遊戲平臺分析 2.遊戲類型分析 3.地區對比 預測分析: 未來的銷售趨勢預測 # 導包 import pandas as p

原创 基於協同過濾的電影推薦系統

推薦系統 推薦系統是一種信息過濾系統,可以提高搜索結果的質量,並提供搜索項或者與用戶的搜索歷史相對應的內容。通常運用於預測用戶對某項商品的評價或者偏好,國內很多的公司都有使用到,淘寶,京東使用它來向用戶推薦商品,愛奇藝,優酷,使用

原创 人人都在用的機器學習算法-決策樹

決策樹(DecisionTree) 這裏說幾個決策樹有關的概念: 貪心算法:是指在對問題求解時,總是做出在當前看來是最好的選擇。不考慮總體的最優解,以每一步的局部最優解來模擬全局最優解。決策樹是典型的貪心算法,現在衆多的決策樹算

原创 說一下最簡單的機器學習模型KNN(k-近鄰),入門機器學習必備!!!

KNN(k-NearestNeighbor)-K最近鄰 KNN雖然是最簡單的算法,但是對剛剛開始機器學習的夥伴確是最好的入門算法,我就從算法本身實現開始,說一些基本概念。 先簡單說一下要用到的一些專業用語: 特徵(features

原创 Python的運算順序

記錄一下Python的運算順序 按箭頭指向依次降低(乘、除、取餘優先級最高,括號內同級): 算術運算符: (*,/,%)→(+,-) ↓ 位運算符(左移動,右移動): (<

原创 分享一下Python內存的小知識

深淺複製 先給案例 from copy import deepcopy l1 = [1,[1,1,2]] l2 = l1.copy() #淺複製 l3 = l1 #直接等於 l4=deepcopy(l1)

原创 數學期望的簡便算法

數學期望的簡便算法 引用自 Dawn Griffiths著:<<深入淺出的統計學>>,P234頁