楊桃的Python機器學習1——引言:什麼是“學”、“習”,爲什麼要用機器來學習

本人CSDN博客專欄:https://blog.csdn.net/yty_7

Github地址:https://github.com/yot777/

 

Hello 大家好,感謝大家關注楊桃在CSDN博客上的專欄。

通過Python基礎教程和進階講座之後,相信您一定對Python這門編程語言有了大致的瞭解,也通過一些例子有了感性認識。

本人的教程和講座只是一個提綱挈領,Python還有很多細節地方沒有面面俱到,請大家發揚自己動手豐衣足食的精神,不懂就百度一下、CSDN一下嘛!

好了,言歸正傳,我們開始新一個篇章——機器學習。

什麼是“學”、“習”

請注意,我的標題是“學”、“習”,不是學習。爲什麼呢?因爲在中國古漢語,“學”、“習”是兩個完全不同的詞,到了近代,“學”、“習”才成了一個詞“學習”。

那麼“學”、“習”各自是什麼意思呢?聖人孔子《論語》的一句話,就是最好的解答。

孔子曰:“學而時習之,不亦說乎?”(這句話如果你沒學過,自己面壁半小時)

譯文:孔子說:“學到知識後按時溫習並實踐練習,不是一件令人心生喜悅的事嗎?”

聖人就是聖人,把“學”、“習”的事就這麼簡明扼要的說清楚了:三個關鍵點:學到知識按時溫習實踐練習

回憶一下,你在上學的時候,是不是也就是這麼過來的?

學到知識:老師在課堂上講一元二次方程的求解方法,推導出公式:

按時溫習:在課後照着書本理解公式的含義

通過多次溫習將公式記憶在腦海中。如果記憶得不對,反覆回憶推導過程。

實踐練習:在考試中將記憶在腦海中的公式應用在實踐計算中。如果這時候記憶得不對,就會影響考試成績,代價就有點大。

 

我們對自己的“學”、“習”過程是很清楚的,那麼機器呢?完全類似!

學到知識:通過大量訓練數據進行數學建模,讓機器“學”到數據的某種規律。

按時溫習:通過已經建好的模型運行測試數據(測試數據的量一般是訓練數據的20%~30%),驗證“學”到的那些規律是否正確。如果正確,進入實踐環境。如果不正確,返回第一步讓機器繼續“學”。注意:正確一般不是指100%完全的正確率,是有一個閾值,根據應用場景的不同有99%、95%、90%等不同正確率。一旦達到這個閾值,就表明達到效果可以運用到實踐中。

實踐練習:將機器“學”到數據的模型應用到實際場景下來解決問題,比如分類、預測、聚類等。如果在實踐環節出現了達不到正確率閾值的情況,應該視爲程序缺陷,需要對第一步進行重新訓練並建模。

爲什麼要用機器來進行學習

解釋這個問題之前,我們對比一下人類學習和機器學習存在哪些顯著差異:

(1)由於原始數據的多樣性和複雜性,人類在認知新事物的速度遠不如機器,很多數學建模人工是根本不可能完成的。

(2)由於人的主觀狀態起伏很大,在身體、精神、情緒等因素的影響下,人不能夠在任何情況下都記得住已經驗證好的模型,例如一元二次方程的求根公式

在狀態不好的臨場考試很有可能忘記。機器則不同,在任何情況下,只要你需要,它都能準確的使用已經驗證好的模型。

(3)機器沒有主觀色彩,全是程序化的輸入輸出,可以做到真正的“鐵面無私”。人類始終無法做到這一點,就像很多體育比賽的裁判員打分,總有一部分“印象分”,這其實是有可操作的空間你懂的。

機器學習也不是萬能的。要記住,機器可以代替一部分人類的思考,但永遠代替不了人類的情感。理智+情感纔是完整的人類。但我們必須提前要有危機意思,謹防出現《終結者》那樣的人類悲劇,必須給機器加上牢固的枷鎖,讓它只能在人類的控制之下爲人類服務。

總結

“學習”是孔聖人的“學而時習之”的意思,三個關鍵點:學到知識按時溫習實踐練習

機器和人的學習步驟是完全類似的,同樣三個關鍵詞:訓練數據測試數據實際場景

機器學習相比人類有顯著優勢,但必須對機器加上牢固的枷鎖,讓它只能在人類的控制之下爲人類服務。

 

本人CSDN博客專欄:https://blog.csdn.net/yty_7

Github地址:https://github.com/yot777/

如果您覺得本篇本章對您有所幫助,歡迎關注、評論、點贊!Github歡迎您的Follow、Star!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章