AI前瞻 | 思考機器學習的方法

我們現在已經有四到五年的機器學習時間,而且幾乎每個人都聽說過它。這不僅僅是初創公司每天都在形成,或者大型科技平臺公司正在圍繞它重建自己 - 科技之外的每個人都閱讀了“經濟學人”或“商業週刊”的封面故事,許多大公司都在進行一些項目。我們知道這是下一件大事。

更進一步,我們大多理解神經網絡可能是什麼,理論上,我們得到的可能是模式和數據。機器學習讓我們可以在數據中找到隱含和概率(因此“推斷”)而不是顯式的數據模式或結構,以前只有人而非計算機才能找到。它們解決了以前“難以爲計算機而且對人們而言容易”的一類問題,或者更有用的是,“人們難以向計算機描述”。我們已經看到一些很酷(或令人擔憂,取決於你的觀點)的演講和視覺演示。 

但是,我不認爲我們對機器學習意味着什麼 - 它對科技公司或更廣泛的經濟中的公司意味着什麼,如何從結構上思考它能夠實現的新事物,或者什麼機器學習對我們所有其他人來說意味着什麼,以及它實際上可以解決的重要問題。

“人工智能”一詞並沒有幫助,“人工智能”一旦開始就會結束任何談話。一旦我們說'AI',就好像2001年初的黑色巨石已經出現了,我們都變成了猿猴尖叫着,搖着我們的拳頭。你無法分析'AI'。 v

實際上,我認爲可以提出一系列無益的方式來討論機器學習的當前發展。例如:

數據是新油

谷歌和中國(或Facebook,或亞馬遜,或BAT)擁有所有數據

AI將承擔所有工作

而且,當然,說AI本身。

或許,更有用的話題可能是: 

自動化

啓用技術層

關係數據庫。 

爲何選擇關係數據庫?它們是一個新的基礎支持層,改變了計算可以做的事情。在關係數據庫出現在20世紀70年代後期之前,如果您希望您的數據庫向您展示,例如,“購買此產品並居住在這個城市的所有客戶”,那通常需要一個自定義工程項目。數據庫不是用結構構建的,任何任意交叉引用的查詢都是一件容易的,常規的事情。如果你想問一個問題,有人必須建立它。數據庫是記錄保存系統; 關係數據庫將它們轉變爲商業智能系統。 

這改變了可以用於重要方式的數據庫,從而創建了新的用例和新的十億美元公司。關係數據庫給了我們甲骨文,但他們也給了我們SAP,SAP及其同行爲我們提供了全球即時供應鏈 - 他們給了我們Apple和星巴克。到了20世紀90年代,幾乎所有的企業軟件都是關係型數據庫 - PeopleSoft和CRM以及SuccessFactors等幾十種都運行在關係型數據庫上。沒有人看過SuccessFactors或Salesforce,並說“由於Oracle擁有所有數據庫,這將永遠不會奏效” - 相反,這項技術成爲了一切可能的一部分。

因此,今天考慮ML這是一個很好的基礎方式 - 這是我們可以用計算機做的一個步驟改變,這將是許多不同公司的許多不同產品的一部分。最終,幾乎所有東西都會在內部的任何地方都有ML,沒有人會關心。 

兩者之間重要的相似之處在於,儘管關係數據庫具有規模效應,但別忘了網絡是有限的,或者說“贏家通吃”的效應,機器學習也一樣。如果 B 公司和 A 公司一樣,從同一家供應商購買相同的數據庫軟件,那麼 A 公司使用的數據庫並不會因此變得更好。機器學習實際上也是差不多的情況:機器學習都是數據相關的,但是特定應用的需要的數據卻是不同的。更多的手寫數據會使手寫體識別器變得更好,而更多的燃氣輪機數據也會使系統更好地預測燃氣輪機的故障,但是其中一套數據對另一個系統卻毫無幫助。記住,數據是不可替代的。

這就是談論機器學習時最常見的誤解的核心 - 它在某種程度上是單一的,通用的東西,在通往HAL 9000的道路上,而谷歌或微軟各自建立*一個* ,或谷歌'擁有所有數據',或者IBM有一個名爲'Watson'的實際內容。真的,這一直是看自動化的錯誤:隨着每一波自動化,我們想象我們正在創造擬人化的東西或具有一般智能的東西。在二十世紀二十年代和三十年代,我們想象鋼鐵工人在工廠裏走來走去拿着錘子,在20世紀50年代,我們想象着人形機器人在廚房裏走動做家務。我們沒有得到機器人僕人 - 我們有洗衣機。

洗衣機機器人,但它們並不“聰明”。他們不知道什麼是水或衣服。此外,即使在狹窄的洗滌領域,它們也不是通用的 - 你不能把餐具放在洗衣機裏,也不能把衣服放在洗碗機裏(或者更確切地說,你可以,但你不會得到你想要的結果) 。它們只是另一種自動化,在概念上與傳送帶或取放機器沒有什麼不同。同樣,機器學習可以讓我們解決的問題,電腦不能有效解決之前,但每個這些問題將需要不同的實現,以及不同的數據,對市場不同的路線,而且往往不同的公司。它們中的每一個都是自動化的一部分。他們每個人都是一臺洗衣機。

因此,談論機器學習的一個挑戰是找到一方面對數學的機械解釋和另一方面對一般AI的幻想之間的中間立場。機器學習不會創建HAL 9000(至少,現場很少有人認爲它會很快就會這樣做),但將其稱爲“僅統計數據”也沒有用。回到與關係數據庫的相似之處,這可能就像在1980年談論SQL一樣 - 你如何從解釋表連接到思考Salesforce.com?這一切都非常好地說“這可以讓你問這些新題型”,但它並不總是很明顯的是什麼的問題。你可以做出令人印象深刻的語音識別和圖像識別演示,但同樣,普通公司會做些什麼呢?正如美國一家大型媒體公司的團隊不久前對我說的那樣:'好吧,我們知道我們可以使用ML來指導我們的人才採訪運動員的十年視頻 - 但我們還在尋找什麼呢?

那麼,對於真正的公司來說,機器學習的洗衣機是什麼?我認爲有兩套工具可供考慮。首先是根據數據類型和問題類型的方式進行思考:  

機器學習可能會爲您已經提出的有關已有數據的問題提供更好的結果,只需作爲分析或優化技術。例如,我們的投資組合公司Instacart建立了一個系統,通過雜貨店優化其個人購物者的路由,提高了50%(這是由三位工程師使用Google的開源工具Keras和Tensorflow構建的)。

通過機器學習,您可以詢問已有數據的新問題。例如,進行發現的律師可能會搜索“憤怒”的電子郵件,或“焦慮”或異常的線程或文檔集羣,以及進行關鍵字搜索, 

第三,機器學習開闢了新的數據類型進行分析 - 計算機無法真正讀取音頻,圖像或視頻,現在越來越多,這將是可能的。 

在這一點上,我發現成像是最令人興奮的。只要我們有計算機,計算機就可以處理文本和數字,但圖像(和視頻)大部分是不透明的。現在,他們將能夠“看到”他們能夠“閱讀”的相同意義。這意味着圖像傳感器(和麥克風)成爲一種全新的輸入機制 - 而不是一種新的,功能強大且靈活的傳感器,它可以生成(可能)機器可讀數據流。各種各樣的事情將成爲今天看起來不像計算機視覺問題的計算機視覺問題。 

這不是關於識別貓圖片。我最近遇到了一家爲汽車行業供應座椅的公司,該公司已將神經網絡放在廉價的DSP芯片上,配備便宜的智能手機圖像傳感器,以檢測織物是否有皺紋(我們應該期待各種類似的用途)機器學習在非常小,便宜的小部件,只做一件事,如這裏所述)。將其描述爲“人工智能”是沒有用的:它是以前無法實現自動化的任務的自動化。一個人不得不看。

這種自動化感是思考機器學習的第二個工具。發現織物是否有皺紋不需要20年的經驗 - 它真的只需要哺乳動物的大腦。事實上,我的一位同事建議,機器學習將能夠做任何你可以訓練狗做的事情,這也是思考AI偏見的有用方法(究竟什麼有狗了嗎?培訓數據中有什麼?你確定嗎?你怎麼問?),但也有限,因爲狗確實具有一般的智能和常識,不像我們知道如何構建的任何神經網絡。Andrew Ng建議ML能夠在不到一秒的時間內做任何你能做的事情。談論ML確實傾向於尋找隱喻,但我更喜歡這個比喻,它給你無限的實習生,或者,也許是無限的十歲孩子。

五年前,如果你給計算機一堆照片,它除了按尺寸排序外,還做不了多少。一個十歲的孩子可以把它們分成幾個男人和一個女人,一個十五歲的孩子變得冷靜和不冷靜,一個實習生可以說'這個真的很有趣'。今天,憑藉ML,計算機將匹配十歲,也許十五歲。它可能永遠不會到實習生。但是,如果你有一百萬十五歲的孩子來查看你的數據,你會怎麼做?您會聽到什麼電話,您會看到什麼圖像,以及您會檢查哪些文件傳輸或信用卡付款?

也就是說,機器學習不需要匹配專家或數十年的經驗或判斷。我們不是自動化專家。相反,我們要求'聽取所有電話並找到憤怒的電話'。'閱讀所有電子郵件,找到焦慮的電子郵件'。“看看十萬張照片,找到那些很酷(或至少很奇怪)的人。” 

從某種意義上說,這就是自動化總是如此; Excel沒有給我們人工會計師,Photoshop和Indesign沒有給我們人工圖形設計師,而且蒸汽機確實沒有給我們人造馬。(在早期的'AI'浪潮中,國際象棋電腦沒有給我們一個脾氣暴躁的中年俄羅斯人。)相反,我們大規模地自動化了一項離散任務。 

這個隱喻被打破的地方(正如所有隱喻所做的那樣)在某種意義上說,機器學習不僅可以找到我們已經認識到的東西,而且可以找到人類無法識別的東西,或找到模式,推論或這意味着沒有十歲(或50歲)的人會認出來。這是最好看的Deepmind的AlphaGo。AlphaGo不會像國際象棋電腦一樣下棋 - 通過按順序分析每一個可能的動作樹。更確切地說,它被賦予了規則和董事會,並試圖自己制定戰略,在人生中可以做很多生活時間來玩自己的遊戲。也就是說,這不是一千名實習生,因爲一個實習生非常快,你給你的實習生1000萬張圖像然後他們回來說'這是一件有趣的事情,但是當我看到第三百萬張圖像時,這種模式真的開始出現'。那麼,哪些領域足夠窄,我們可以告訴ML系統規則(或給它一個分數),但足夠深,看着所有數據,如人類所能做到的,都不會帶來新的結果?

我花了很多時間與大公司見面並談論他們的技術需求,他們通常對機器學習有一些非常明顯的低成果。有很多明顯的分析和優化問題,以及很多清晰的圖像識別問題或音頻分析問題。同樣,我們談論自動駕駛汽車和混合現實的唯一原因是因爲機器學習(可能)使他們能夠實現 - ML爲汽車提供瞭解決他們周圍事物以及人類駕駛員可能會做什麼的途徑,並提供混合現實的方式制定出什麼我應該看到,如果我想找雖然一副眼鏡是什麼都有。但在我們談到呼叫中心的面料皺紋或情緒分析之後,這些公司往往會坐下來問“好吧,還有什麼?” 這會帶來什麼其他的東西,以及它會發現什麼未知的未知數?我們可能需要十到十五年才能開始變得無聊。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章