AI+對話,可知可解

從1956年被認爲是全球人工智能研究起點的學術會議,到2016年,AIphaGo與世界頂級圍棋高手李世石的人機世紀對戰,掀起了人工智能浪潮的新高潮。人工智能似乎離我們越來越近,並在許多方面服務人類。但必須承認的是,人工智能要通過自然語言處理與人類自如交流還是一個“終極挑戰”。如何應對這些挑戰,以及當下的人機交互實踐,今天這篇文章由香儂科技創始人兼CEO李紀爲老師爲大家詳細解答。

AI+對話,可知可解

人工智能的終極難題之一:人機對話

人機對話,是人工智能領域的一個子方向,通俗的講就是讓人可以通過人類的語言(即自然語言)與計算機進行交互。作爲人工智能的終極難題之一,一個完整的人機對話系統涉及到的技術極爲廣泛,例如計算機科學中的語音技術,自然語言處理,機器學習,規劃與推理,知識工程,甚至語言學和認知科學中的許多理論在人機對話中都有所應用。當下,我們都使用過小度或者siri,給大家最直觀的感受就是很弱智,我們想要解決的問題就是如何讓對話系統變得不弱智。

在現實生活中,對話就是我們平時的聊天,內容會依據環境、心情、目的、年齡等不斷變化,我們的願景是希望機器可以像人一樣聊天的人工智能。但人工智能從上世紀50年代萌芽,由圖靈測試的猜到如今的siri,發展到今天,機器依然不能處理複雜對話。如美國的一個真人秀演員在節目裏調戲siri,跟siri聊天,想讓大家看siri有多智能、多聰明。當他讓siri寫一個節目,siri會發現一個問題,當問siri稍微複雜點的問題時,它不懂就會搜索,會問什麼意思,要搜點什麼。從這個例子中看出,整個對話缺少整個事件或者聊天的人,siri並不知道它是誰、後面包含是什麼特質,也不知道要做什麼。因此,siri目前是比較弱智的,它出現的這些錯誤究其背後是算法框架的錯誤。對話系統裏,有匹配說話的觸發詞,會觸發數據庫規定的某些場景,這些場景最重要的是要明白這句話的目的是什麼,最後由分類器把說的話連起來,再根據上下文觸發後面的對話。

人工智能的人工:對話系統

對話系統被認爲是整個人工智能的人工,它涉及到兩個部分,理解和生成。這兩個涵蓋了自然語音處理的所有任務。目前這兩個任務都沒有很徹底的被解決掉。基於此,對話系統整個處理方式把整個框架分成兩個模塊,也是理解和生成。當然除了這幾點還有很多其他的方面,如跟人聊天,每個人都有自己的語義,有自己的說話方式;另一方面,爲了能讓談話持續下去,應是交互性的讓人家願意聊,互相在氣氛中找到自己想要談話的慾望。

歷史上過去50年間,自從圖靈測試被提出後,如何解決這個問題。美國開發了Eliza,它是人工智能裏面非常重要,且出現在上個世紀60年代,人工智能剛剛興起的時間。它是在邏輯、專家系統知識系統背景下提出的對話模型,這個對話模型引起了很大震動,它想去模擬作爲心理醫生,要跟有抑鬱的人做輔助治療,這個提出也通過圖靈測試。這樣的系統,在那個時代給我們帶來很大的衝擊,後來這個系統被真正的心理指導人去用,一直持續40年的時間。直到上個世紀末,依然有人認爲我在跟Eliza聊天。

AI+對話,可知可解

從產品的角度看出Eliza沒有用非常複雜的算法但是解決了痛點,說明不復雜的算法也能解決現實問題。這個圖代表了現有的包括小度的框架系統。第一步ASR,語句進來先把聲波變成字。下面涉及到兩個框架,一個是NLP,理解這句話是什麼,下面一個模塊就是基於理解的這句話,去產生一句話,到最後輸出。 其中對於理解語義併產出,是從系統裏的語料庫裏去挑選,如果目標語句不在語料庫裏,需要自己生成的時候,催生出機器翻譯。

機器翻譯是經典傳統的自然語言處理任務,有很長的歷史,基本在人工智能出現之後就有這個任務,同樣解決辦法也是跟人工智能流派相關。在六七十年代,人們嘗試解決機器翻譯。在90年代發明了IBM model,這是第一次在早年把統計機器模型引到自然語音處理裏,通過大量的平行語料,不需要字典就能學出詞和詞的對應關係。這個模型用了大概20年,直到2014年底才被神經網絡模型徹底取代。

目前,人機對話仍在高速發展,小度、siri等智能機器人的發展,表明人工智能開始從科學家的實驗室“飛入尋常百姓家”。每個人,都是此次媒介變革和科技創新的見證者。同時也是中國人工智能和機器人研究能力的飛躍。

提問環節

提問:想請問有沒有研究過結合的。
李紀爲:只是基於不同的進來的信息,進來的是一個圖象,用CN把圖象編碼,機器翻譯是基於我前面一句話,你要翻譯,機器對話系統是基於上下文,本質上基本沒有區別。

提問:如果基於原本圖片有的標籤,得到的結果是比較單一的,我們考慮使用深層對話網絡,深層對話網絡結果有隨機性,應該是可以產生對圖片的描述。
李紀爲:並沒有廣泛的應用是有原因的,語言是不連續的。

提問:看到兩篇文章,我覺得對這方面的研究不是很多。這個方向是不是可以進一步研究。
李紀爲:是一個好的方向,我會認爲自然語言,應該是一個大的發展方向,這個東西所有人都會認爲應該用。

李紀爲,香儂科技創始人兼CEO,百度獎學金獲得者。著名青年 AI 學者,主要研究領域爲自然語言處理、深度學習、機器學習。斯坦福大學計算機專業歷史上第一位僅用三年時間就獲得博士的人。在近日由劍橋大學研究員 Marek Rei 發佈的一項統計中,李紀爲博在最近三年世界所有人工智能研究者中,以第一作者發表的頂級會議文章數量高居第一位。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章