一、引言:
機器學習(machine learning):從數據中提取知識。分爲:監督學習(supervised learning)和無監督學習(unsupervised learning)。
二、監督機器學習應用:
1、識別信封上面的手寫的郵政編碼。
2、基於醫學影像判斷腫瘤是否爲良性。
3、檢測信用卡交易中的詐騙行爲。
三、無監督機器學習應用:
1、確定一系列博客文章的主題。
2、將客戶分成具有相似偏好的羣組。
3、檢測網站的異常訪問模式。
四、構建機器學習解決方案過程中的思考:
1、要回答的問題是什麼?已收集到的數據能夠回答這個問題嗎?
2、要將我的問題表示成機器學習問題,用哪種方法最好?
3、我收集的數據是否足夠表達我想要解決的問題?
4、我提取了數據的哪些特徵?這些特徵能否實現正確的預測?
5、如何衡量應用是否成功?
6、機器學習解決方案與我的研究或商業產品中的其他部分是如何相互影響的?
五、編程環境Anaconda3.4.2+(python3.5+)
anaconda安裝遇到的問題請查看
conda httperror http none none for url none Anaconda更新失敗解決辦法 https://www.jianshu.com/p/c74668743932
pandas==0.18.1
matplotlib==1.5.1
numpy==1.11.1
scipy==0.17.1
scikit-learn==0.18