零基礎掃盲:什麼是人工智能

原文地址

http://mp.weixin.qq.com/s?__biz=MzIzNjA0OTExNQ==&mid=501836342&idx=1&sn=2cb6eefaef10e395abe75731ecebc25e&chksm=70c00d8247b784942d7c0a3e6d48c3cb54b8d368eed779d2444b650e3b8bc999e5e43b4fb62b#rd

讓人焦慮的時代

物聯網、雲計算、大數據、人工智能,這些術語成爲各大媒體這幾年吹捧的熱門詞彙,包括最近很多商業大咖常說的賦能,AI給物聯網賦能、新零售賦能啥的,更讓人云裏霧裏。對於大部分人來說,基本上都是“知其名而不知其意”,在媒體的狂轟濫炸和資本追逐中,越來越多的商業術語和技術詞彙被創造出來,讓人感到焦慮,彷彿已經被時代拋棄、落伍的感覺。今天就參看網上相關資料,跟大家一起了解一下什麼是人工智能。


人工智能浪潮從上世紀50年代開始,就已經搞了好幾波了,但都沒有搞起來。究其原因,還是硬件、軟件等方面還不足以支撐人工智能的發展。如今,隨着互聯網和雲計算的快速發展,GPU算力的快速提升,以及積累的大數據,再次把人工智能推到風口,這次能不能飛起來,還真不好說。


什麼是人工智能呢?按照圖靈機測試:如果一臺機器它能像人類一樣思考,那麼它就是人類。比如索菲亞機器人,按照圖靈機測試,她應該就是人類了,而且已經拿到了沙特戶籍,是世界上第一個拿到戶口的機器人:

v2-502b5c78f5d8cbcc7549cf4c1860f571_b.jpg

除了索菲亞機器人,Google的AlphaGo也很有名,它自己學習下圍棋,自學成才,戰勝了世界圍棋冠軍。蘋果手機的Siri,可以通過跟她對話,讓她幫你查詢天氣、打開微信、打開QQ等,非常方便。上面這些其實都可以看作人工智能的具體應用,那這些智能產品到底是怎麼實現的呢?人工智能到底是什麼?


農場雞的故事


以一個農場雞的故事爲例,來給大家解釋什麼是人工智能。

一個農場裏養了500只雞,其中有一隻雞特別聰明,被稱爲雞羣中的戰鬥雞:科學家。這隻雞注意到一個現象:每天早上,養雞場的食槽裏會準時出現食物和水。作爲一隻雞,它可能永遠也想不明白人類爲什麼要飼養他,就像我們也許永遠也想不明白人類爲什麼在這個宇宙中存在一樣,有外星人嗎?農場外面還有別的雞羣嗎?雞和人類一樣有困惑,很焦灼。但是我們會觀察啊,這隻雞也是一樣,作爲一個優秀的歸納法信徒,這隻雞並不急於得出結論,而是開始全面觀察做記錄:試圖發現這個現象是否在不同的條件下都成立。


晴天時是這樣,下雨時也是這樣;星期一是這樣,星期二也是這樣;樹葉發芽時是這樣,樹葉變黃時還是這樣;天冷時是這樣,天熱時也是這樣。每天的觀察讓它越來越興奮,在這種雞的心中,它感覺離真相越來越近。直到有一天,這隻雞再也沒有觀察到新的環境變化,而到了當天早上,雞舍的門打開,它跑到食槽邊,發現食物和水依然準時出現!


這隻雞太興奮了,它當着所有的雞自信地宣佈:我預測,每天早上,食槽裏的水和食物都會自動出現,我們再也不用擔心餓死了!


經過好幾天,小夥伴們都驗證了這個預言,驗證了這隻雞說得是對的,並把這隻戰鬥雞說的話當作真理:早起的雞兒有食喫。大家都圍着這隻雞興奮地咯咯地叫着,驚動了農場主。農場主宰了這隻雞、並跟着買來的兩瓶啤酒一起下了肚。

v2-8f80021ed273c2cd5aa8ded20921ae3b_b.jpg

這隻科學家,雞羣中的戰鬥雞,於午飯時間,卒於農場。


在這個故事中,這隻雞也叫羅素雞(Bertrand Russell’s chicken):只對現象進行統計和歸納,而不對原因進行推理。


這其實跟我們目前主流的機器學習,特別是深度學習很相似,通過大量的數據、案例進行分析、總結、歸納,發現規律,並對新的事務進行預測、作出行動。這其實就是我們人工智能的概念了。


什麼是人工智能?


在上面故事中,這隻戰鬥雞,其實就是一個人工智能實例。首先,它根據每天大量的觀察、大量的數據去總結歸納爲什麼每天早上食槽裏會自動出現水和食物這一現象,並得出結論的過程,其實就是人工智能通過大數據不斷學習、總結規律並進一步對未來做出預測和指導的過程。


由於目前科學技術的侷限,人類還無法搞清楚整個大腦的工作原理、工作流程,就像這隻雞無法想明白水和食物爲什麼會準時出現一樣。如果我們想讓機器跟我們一樣思考,最簡單的方法就是我們搞清楚大腦的工作原理,然後賦能給機器就可以了,但是目前我們還沒搞清楚大腦自身原理,那怎麼辦?很簡單,學學這隻雞唄,做一個忠實的歸納法信徒:依靠大量的數據,然後使用各種算法不斷去分析、歸納、總結,找出規律,形成學習能力,進而通過“人工”達到“智能”的目的。


AI和大數據、雲計算、物聯網的關係


通過前面的學習,我們已經明白了:人工智能目前主流的方向:機器學習其實就是依靠大量的數據進行分析,發現一些隱藏的規律、現象、原理等,進而通過這些分析結果做出預測或指導行爲,比如無人駕駛、自動醫學診斷等。對數據的分析和處理需要大量的運算,早期的計算機算力不行,而且也沒有現在互聯網時代累積的大量數據,因此沒有搞起來,現在不同了,互聯網、物聯網的快速發展,積累了大量的用戶數據、傳感器數據,而且GPU算力的提高,都爲人工智能的這次浪潮奠定了基礎。


v2-7db52f9fcaa1a48636d23287aca5cb16_b.jpg
圖片來自知乎網友,侵刪


人工智能不能孤立存在,需要大數據和強勁的計算力做支撐。人工智能、大數據、雲計算和物聯網的關係如上圖所示:首先通過互聯網和物聯網積累了大量的用戶數據、傳感器數據(如溫度、溼度等),通過網絡就匯聚成大數據樣本。這些數據是人工智能的數據基礎,數據收集好以後肯定得找個服務器存儲起來。你可以自己買臺電腦、購買各種軟件和服務構建自己的服務器,然後再招一個運維人員負責管理維護這些設備。但是這樣下來,就增加了很多額外的成本,那怎麼辦?很簡單,租一個服務器就可以了。


雲計算通俗點理解,就是一個服務器租賃平臺,提供存儲、計算等服務。你想搭建一個網站,如果還要自己購買電腦服務器、裝各種正版軟件、安全防護軟件等,成本就大了去了。你直接到阿里雲、騰訊雲這些雲計算平臺購買服務就可以了:操作系統、各種數據庫軟件、服務都給你搭建好了。你購買了服務,分配給你一個賬號,不必再操心這些軟硬件問題,直接登錄就可以使用。比如前幾天剛剛上映的《流浪地球》,有大量的特效製作,渲染一個視頻特效,如果在普通的電腦上可能需要幾萬個小時,而使用雲計算平臺,就可以很快完成,大大提升了工作效率。


雲計算主要依靠虛擬化和分佈式存儲技術來實現。通過虛擬化,我們可以在一個服務器上虛擬出運行不同操作系統的各種虛擬機、虛擬出一個個硬件配置。對於用戶來說,你花錢購買一個雲虛擬主機實例,其他用戶也購買一個雲虛擬主機服務,各分配一個不同的賬號,用戶使用各自的賬號登錄享受服務,就感覺這臺服務器就是自己的,其實很多虛擬主機可能運行在同一個物理服務器上。而通過分佈式存儲,我們可以將多臺服務器連接起來,構成一個強大功能的雲計算平臺。這些服務器可能分佈在不同的地方,但是通過分佈式技術可以將它們組合關聯在一起,協同工作。像微軟雲、Amazon、Google雲計算、騰訊雲、阿里雲等雲計算廠商光服務器可能就有上千上百萬臺,分佈在全球的各個地方。像微軟雲的服務器據說放在海底,有助於散熱,而蘋果、騰訊雲、阿里雲等據說部分服務器放置在貴州的山洞裏,那裏常年低溫,有助於散熱、節省電力消耗。我們平時看的圖片、下載的音樂、電影有很大一部分都是存儲在海底、存儲在這些山洞裏。


海量的數據上傳到雲計算平臺後,自然而言就需要對這些數據進行分析和挖掘了,這就是大數據要做的事情:將幾千輛車的位置信息綜合起來就可以分析出某條路段的交通擁擠狀況,你使用滴滴打車時,使用大數據可以給你安排最近的車輛。


大數據是基於海量數據進行分析從而發現一些隱藏的規律、原理、現象等。而人工智能則是在大數據的基礎上更進一步:不僅會分析數據、找出規律,還會根據分析結果做出預測和各種行動。如無人駕駛、醫學自動診斷等。


什麼是人工智能?


在上面《農場雞的故事》中,這隻雞其實就是人工智能的一個實例:首先它是一隻雞,但是它可以通過學習、模仿人類的思考,通過大量的訓練,變成了一隻具備了學習思考能力的“智能雞”。所謂人工智能,就是讓機器像人類一樣思考。按照圖靈機測試的說法,如果機器能夠像人類一樣思考,那麼它們就是人類。比如索菲亞機器人,世界上第一個拿到戶口和身份證的機器人。


v2-c8f75dca0b5299ed5ebd802b747ba1d7_b.jpg


除此之外,另一個比較有名的是Google公司的AlphaGo,AlphaGo通過自己學習下圍棋,不斷地反覆訓練,提高技能,最終戰勝了世界圍棋冠軍柯潔。

那如何讓機器能夠像人類一樣思考呢? 很簡單,爲了解決某個特定問題,通過特定的算法和模型,對海量的數據進行分析,從而找出隱藏的規律、原理和現象,進而再針對新出現的環境和事務做出預測和行動。


v2-64e0c5cdf98cf0fb29a7f6384d6a70dd_b.jpg
圖片來自網絡


從上圖可以看到,人工智能最核心就是算法。以大數據爲基礎,針對不同的問題,使用不同的AI算法和技術對大數據進行分析,找出規律。這些AI算法實現需要深厚的數學功底,如高等數學、概率論、數值分析等。如果你不懂底層的數學怎麼辦,不用擔心,現在很多流行的AI框架已經把常用的算法封裝成框架,對於應用開發者來說,可以不用關心底層的算法如何實現,直接通過這些框架接口再結合具體的技術,就可以開發出解決某個具體問題的人工智能應用,比如:能聊天的機器人、AI音箱、會下棋的機器人、能識別蘋果的機器人等。


什麼是機器學習?


一般來講,爲了解決某個特定問題,我們需要專門的AI算法和模型,傳統的算法包括:決策樹學習、推導邏輯規劃、聚類、分類、迴歸、強化學習和貝葉斯網絡等。其實這些還不算真正的“人工智能”,只能算是弱人工智能。而機器學習就是要讓機器像人類一樣思考、學習。機器學習與傳統的爲解決特定任務,特定的算法、軟硬件程序不同,機器學習是用大量的數據來訓練,通過各種算法從數據中學習如何完成任務、解決某個問題。一個機器就跟一個剛出生的嬰兒一樣,腦子裏一片空白,除了哭和嘬奶頭外,什麼都不會,需要後天不斷的學習、訓練才能說話、唱歌、跳舞。


大腦的學習原理


人類的大腦褶皺皮層大約有300億個神經元,每一個神經元可以通過突觸與其它神經元進行連接。對於個人而言,不同的連接方式從而構成人類不同的記憶、情感、技能和主觀經驗。人與人之間的根本差別在於大腦皮層之間不同的神經元連接方式,連接越多越強,人的記憶、技能就越好。


v2-9ea24dfc89afafd1cb9cbaa910798696_b.jpg


以嬰兒爲例。剛出生的嬰兒什麼都不會,大腦還處於待開發狀態,神經元之間的連接較少。如果我們想讓嬰兒識別什麼是蘋果、什麼是桔子,就要不斷反覆地去教他、去訓練。當嬰兒看到蘋果,並被告知:這是一個蘋果時,大腦皮層的衆多神經元中對紅色敏感的神經元就會與對“蘋果”這個聲音敏感的神經元建立配對、連接、關聯。通過不斷反覆地訓練,這種連接就會加強,這種連接加強到一定程度,嬰兒再看到蘋果時,通過這種突觸關聯,就會想到“蘋果”的發音,在通過其它連接,最後通過嘴巴發音:蘋果。恭喜你,你的baby會認蘋果了。這種連接在大腦中會不斷加強、穩定,最終跟其他神經元連接一起。大腦在嬰兒2~3歲的發育過程中會逐漸網絡化,也是嬰兒學習的黃金期。


v2-ef29f6ccafed111e3d96fb808523914d_b.jpg



神經元就像英文23個字母一樣,通過不同的組合、連接就構成了心理圖像的物體和行爲,就好像字母可以組成一個滿是單詞的詞典一樣。什麼是心理圖像呢,黑暗中盯着你的手機屏幕,然後閉上眼,手機屏幕在你視網膜上的短暫停留就類似於心理圖像。能力越強、記憶越好的人對於某一個事物構建的心理圖像就越細膩。心理圖像可以通過更多的神經突觸串聯在一起,組成任意數量的關聯順序(特別是做夢時),進而形成世界觀、情緒、性格以及行爲規範。這就好像單詞可以組成各種無限可能的句子、段落和章節一樣。


人的學習和記憶過程,其實就是大腦皮層神經元之間不斷建立連接、關聯的過程。隨着關聯連接不斷加強,你對某項技能的掌握也就越來越熟練、越來越精通。不同的神經元之間、心理圖像之間互相關聯構成一個巨大的神經網絡。



v2-d47a70b0b2d2c28839e4f09c852326c9_b.gif



人工神經網絡


人工神經網絡(ANN),顧名思義,就是使用計算機程序來模擬大腦的神經網絡。人工神經網絡的本質是數據結構。這種人工神經網絡對於特定的AI算法、AI模型而言,它的牛逼之處在於:它是一個通用的模型,像嬰兒的大腦一樣,可以學習任何東西:說話、唱歌、作曲、聊天、下棋、繪畫、圖形識別。


典型的人工神經網絡是由數千個互連的人工神經元組成,它們按順序堆疊在一起,構成一個層。然後以層的形式形成數百萬個連接。人工神經網絡與大腦的不同之處在於,在很多情況下,層僅通過輸入和輸出與它們之前和之後的神經元層互連,而大腦的互連是全方位的,神經元之間可以任意連接。


v2-6809fb3189128c200b8656e87edb3859_b.jpg


我們教嬰兒認識蘋果,可以通過各種各樣的蘋果(大的、小的、各種顏色的)來訓練嬰兒。同樣的道理,我們訓練人工神經網絡,也是通過向其輸入大量的標籤數據,幫助它學習如何分析和解讀數據、找出規律、最後輸出分析結果。


由於人工智能和計算機技術的限制,以及人類還沒完全搞清楚大腦的整個工作原理等原因,目前我們只能模擬出大腦的一部分。比如卷積神經網絡(CNN,其實只是模擬了人類的視網膜神經網絡),可以用來實現圖像識別,一個沒有訓練的CNN就像一個嬰兒的大腦一樣弱智,那我們該如何訓練它呢?


神經網絡的訓練過程


卷積神經網絡(CNN),分爲很多層,每個層對輸入的數據進行分析,完成不同的功能。CNN通常有以下神經元層:

  • 輸入層:輸入圖像數據
  • 卷積層:
  • 激活層
  • 池化層:
  • 完全連接層
  • 輸出層:輸出分析結果


輸入層主要用來輸入圖像數據,卷積層用來分析輸入的圖片數據。卷積層中成千上萬的神經元充當過濾器的功能,分別去搜尋識別輸入圖像數據的不同特徵。比如有的神經元專注於識別蘋果的“顏色”這一特徵,有的神經元去識別蘋果的“形狀”這一特徵,在卷積層中,沒有價值的元素會被丟棄,有價值的特徵元素被傳輸到下一層。


在激活層和池化層會對圖像信息再一遍一遍地過濾和處理,具體細節不表,最後的處理結果就是圖像被池化的特徵。在完全連接層,這些圖像被池化的特徵,連接到表徵神經網絡正在學習識別的事物的輸出節點(神經元)上。如果我們正在訓練我們的神經網絡去學習如何識別蘋果和梨子,那麼這個神經網絡就有2個輸出節點,一個用於蘋果,一個用於桔子。蘋果和桔子這兩個工作節點都會對傳輸來的特徵圖進行投票,根據特徵圖判斷這幅圖片是蘋果或桔子的概率。最後的輸出結果可能就是:這幅圖片90%的可能是一個蘋果、10%的可能是一個桔子。


預測失敗了怎麼辦?


前面已經講過,剛開始神經網絡是很弱智的,剛開始它的預測結果可能是:這圖片10%的可能是一個蘋果、90%的可能是一個桔子,這就跟我們的預期不符,需要不斷調整,不斷嘗試,這個調整的過程稱爲“反向傳播”,以增加下一次將這幅圖像預測成蘋果的概率。


反向傳播將輸出結果反饋到上一層的節點,告訴它反饋結果差了多少,然後該層再向上上層傳遞,直到它回到卷積層,重新不斷調整,不斷嘗試,不斷提高預測成功的概率,直到預測結果的成功概率不能再提升。這個過程我們就稱爲神經網絡的訓練過程。


神經網絡的訓練過程需要對海量的數據作爲樣本進行處理,需要大量的計算,因此一般都是在雲上進行。



什麼是深度學習?


2012年,人工智能科學家吳恩達教授,通過對人工智能進行訓練,實現了讓神經網絡可以成功地識別貓。在吳教授的實驗裏,輸入數據是一千萬youtube視頻當中的圖像。吳教授的突破在於:將這些神經網絡從基礎上顯著地增大了,層數變得非常多,而不是簡單的4層,神經元也非常多。吳教授把這次實驗定義爲:深度學習(deep learning),這裏的深度是指神經網絡變得更加複雜了,有更多的層。經過深度學習訓練過的神經網絡,在圖像識別方面甚至比人類做得更好,識別正確率達到99%以上。



什麼是邊緣計算?


人工神經網絡兩個重要的工作就是:訓練和推理。訓練需要巨大的計算量,一般會放到雲上進行,訓練完畢後,在去結合具體問題做應用:推理。


在雲上訓練神經網絡也有弊端:一是貴,二是對網絡的依賴性高。比如汽車自動駕駛,當汽車鑽入山洞、隧道等無線網絡信號不太好的地方,就可能斷網、有延遲等,這就給汽車自動駕駛帶來了安全隱患。現在我們可以把一些訓練工作放到汽車本地進行,這就是邊緣計算的概念。邊緣計算是指在靠近物或數據源頭的一側,採用網絡、計算、存儲、應用爲一體的開發平臺,就近提供最近端服務。其應用程序在邊緣側發起,產生更快的網絡服務響應、滿足行業的實時業務、安全與隱私保護等方面的基本需求。


比如現在手機處理器裏就集成了支持AI運算的NPU/TPU等IP,支持本地邊緣計算。還有物聯網跟AI的結合應用等,物聯網產生的數據可以直接在應用端完成訓練和推理的過程。當然你也可以在雲上訓練,然後賦能給物聯網,美名其曰:AI給物聯網賦能;5G給物聯網提供更快更低延時的網絡服務,美名其曰:5G給物聯網賦能;我打了你一巴掌,對你做了功,美名其曰:我給你賦能。AI+IOT、嵌入式人工智能也是人工智能的一個發展方向,爲嵌入式、電子工程師帶來新的工作機遇。



索菲亞騙局


人工智能目前發展到了什麼程度呢?其實人工智能目前仍在很低級的階段。一般做法應該是先攻克人類大腦工作原理,然後再進行模擬。但目前的人工智能和神經網絡根本還是兩回事。因此不要太迷信神經網絡,它是很傻的方法,通過海量數據訓練人工智能和神經網絡應該是最後一步,或然率計算,讓決策必須收斂在人工智能很重要。目前的神經元網絡還在小孩級階段,如果真要做到強人工智能可能還需要十年,可能很多技術在神經元網絡之外正在發生。比如前面視頻中的索菲亞機器人,其實並不是真正的人工智能。


目前人工智能機器人還做不到如此智能。索菲亞機器人本質就是一個帶喇叭的木偶:在各種大會上的發言和採訪的內容都是人工撰寫的,外加主持人配合,然後用語音合成軟件輸出,被包裝成“人工智能”的自主意識言論。



大堂機器人


包括現在網上很火的大堂機器人,對答如流,有的竟然還會說川話、方言,簡直要逆天。

其實這也不是真正的人工智能,弱人工智能都算不上,還不如索菲亞。是真人在遠程語言:機器人前面有個攝像頭,真人在遠程看着你傻笑,聽着你說話,然後再用變音或者語音合成軟件跟你聊天。沙特是把AI當人,這是把人當成AI......


未來的人工智能可能是什麼樣?


未來的人工智能,應該是強人工智能,在人類攻克自身大腦工作原理的基礎上,然後進行模擬,甚至機器人會超過人類大腦,具有自主意識和主觀性。當我們愛一個人,爲什麼不受控制,而且還可能會移情別戀?原因很簡單,神經元將人類的愛保存爲感知神經元的輸出集合。這些輸出來自一線神經元,一線神經元在接收到某種特定輪廓、光波、聲波、氣味或觸感信號(你愛人被你卷積處理後的特徵)時,會釋放出自己的信號。這些描述愛的輸出集合是一個維定的思維,一旦建立,作爲某些單位化學神經強度集合的一部分,任意激發狀態的感知神經元都可以激發其它感知神經元。沒有一個神經元知道我們的愛人長什麼樣。相反,有大量神經元作爲連接的穩定輸出組合代表了我們的愛人。因爲她重要,大腦會增加這些神經連接的神經化學強度,對於不重要的人或事物,神經連接的神經化學強度會越來越弱,直到最後像蜘蛛網一樣煙消雲散。這也就解釋了:愛一個人是不受控制的,微觀神經元的自主連接讓我們愛上這個人,愛一個人也不是永恆的,隨着新的連接的加強和舊的連接的減弱,移情別戀就會自然發生。主觀性是每個人連接更高級神經元模式的獨特方式,這些神經元就像腳手架,構建了我們人類的思想大廈、包括愛,一起構成了一個人的獨特人格魅力。


小結:當機器人真正具備了人的智能時,也會產生愛,愛是最終形式的人工智能


  • 參考資料:
  • 1) 人工智障:你看懂的AI和智能無關
  • 2)喫瓜羣衆一圖看懂人工智能、物聯網等技術的關係
  • 3)終於搞清楚了,AI與大數據原來是這樣的關係!
  • 4)人工智能、機器學習和深度學習之間的區別和聯繫
  • 5)一文看懂神經網絡工作原理
  • 6)Neural networks made so easy
  • 7)《虛擬人》、《愛》、《人工智能的未來》

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章