AI+對話，可知可解

從1956年被認爲是全球人工智能研究起點的學術會議，到2016年，AIphaGo與世界頂級圍棋高手李世石的人機世紀對戰，掀起了人工智能浪潮的新高潮。人工智能似乎離我們越來越近，並在許多方面服務人類。但必須承認的是，人工智能要通過自然語言處理與人類自如交流還是一個“終極挑戰”。如何應對這些挑戰，以及當下的人機交互實踐，今天這篇文章由香儂科技創始人兼CEO李紀爲老師爲大家詳細解答。

人工智能的終極難題之一：人機對話

人機對話，是人工智能領域的一個子方向，通俗的講就是讓人可以通過人類的語言（即自然語言）與計算機進行交互。作爲人工智能的終極難題之一，一個完整的人機對話系統涉及到的技術極爲廣泛，例如計算機科學中的語音技術，自然語言處理，機器學習，規劃與推理，知識工程，甚至語言學和認知科學中的許多理論在人機對話中都有所應用。當下，我們都使用過小度或者siri，給大家最直觀的感受就是很弱智，我們想要解決的問題就是如何讓對話系統變得不弱智。

在現實生活中，對話就是我們平時的聊天，內容會依據環境、心情、目的、年齡等不斷變化，我們的願景是希望機器可以像人一樣聊天的人工智能。但人工智能從上世紀50年代萌芽，由圖靈測試的猜到如今的siri，發展到今天，機器依然不能處理複雜對話。如美國的一個真人秀演員在節目裏調戲siri，跟siri聊天，想讓大家看siri有多智能、多聰明。當他讓siri寫一個節目，siri會發現一個問題，當問siri稍微複雜點的問題時，它不懂就會搜索，會問什麼意思，要搜點什麼。從這個例子中看出，整個對話缺少整個事件或者聊天的人，siri並不知道它是誰、後面包含是什麼特質，也不知道要做什麼。因此，siri目前是比較弱智的，它出現的這些錯誤究其背後是算法框架的錯誤。對話系統裏，有匹配說話的觸發詞，會觸發數據庫規定的某些場景，這些場景最重要的是要明白這句話的目的是什麼，最後由分類器把說的話連起來，再根據上下文觸發後面的對話。

人工智能的人工：對話系統

對話系統被認爲是整個人工智能的人工，它涉及到兩個部分，理解和生成。這兩個涵蓋了自然語音處理的所有任務。目前這兩個任務都沒有很徹底的被解決掉。基於此，對話系統整個處理方式把整個框架分成兩個模塊，也是理解和生成。當然除了這幾點還有很多其他的方面，如跟人聊天，每個人都有自己的語義，有自己的說話方式；另一方面，爲了能讓談話持續下去，應是交互性的讓人家願意聊，互相在氣氛中找到自己想要談話的慾望。

歷史上過去50年間，自從圖靈測試被提出後，如何解決這個問題。美國開發了Eliza，它是人工智能裏面非常重要，且出現在上個世紀60年代，人工智能剛剛興起的時間。它是在邏輯、專家系統知識系統背景下提出的對話模型，這個對話模型引起了很大震動，它想去模擬作爲心理醫生，要跟有抑鬱的人做輔助治療，這個提出也通過圖靈測試。這樣的系統，在那個時代給我們帶來很大的衝擊，後來這個系統被真正的心理指導人去用，一直持續40年的時間。直到上個世紀末，依然有人認爲我在跟Eliza聊天。

從產品的角度看出Eliza沒有用非常複雜的算法但是解決了痛點，說明不復雜的算法也能解決現實問題。這個圖代表了現有的包括小度的框架系統。第一步ASR，語句進來先把聲波變成字。下面涉及到兩個框架，一個是NLP，理解這句話是什麼，下面一個模塊就是基於理解的這句話，去產生一句話，到最後輸出。其中對於理解語義併產出，是從系統裏的語料庫裏去挑選，如果目標語句不在語料庫裏，需要自己生成的時候，催生出機器翻譯。

機器翻譯是經典傳統的自然語言處理任務，有很長的歷史，基本在人工智能出現之後就有這個任務，同樣解決辦法也是跟人工智能流派相關。在六七十年代，人們嘗試解決機器翻譯。在90年代發明了IBM model，這是第一次在早年把統計機器模型引到自然語音處理裏，通過大量的平行語料，不需要字典就能學出詞和詞的對應關係。這個模型用了大概20年，直到2014年底才被神經網絡模型徹底取代。

目前，人機對話仍在高速發展，小度、siri等智能機器人的發展，表明人工智能開始從科學家的實驗室“飛入尋常百姓家”。每個人，都是此次媒介變革和科技創新的見證者。同時也是中國人工智能和機器人研究能力的飛躍。

提問環節

提問：想請問有沒有研究過結合的。
李紀爲：只是基於不同的進來的信息，進來的是一個圖象，用CN把圖象編碼，機器翻譯是基於我前面一句話，你要翻譯，機器對話系統是基於上下文，本質上基本沒有區別。

提問：如果基於原本圖片有的標籤，得到的結果是比較單一的，我們考慮使用深層對話網絡，深層對話網絡結果有隨機性，應該是可以產生對圖片的描述。
李紀爲：並沒有廣泛的應用是有原因的，語言是不連續的。

提問：看到兩篇文章，我覺得對這方面的研究不是很多。這個方向是不是可以進一步研究。
李紀爲：是一個好的方向，我會認爲自然語言，應該是一個大的發展方向，這個東西所有人都會認爲應該用。

李紀爲，香儂科技創始人兼CEO，百度獎學金獲得者。著名青年 AI 學者，主要研究領域爲自然語言處理、深度學習、機器學習。斯坦福大學計算機專業歷史上第一位僅用三年時間就獲得博士的人。在近日由劍橋大學研究員 Marek Rei 發佈的一項統計中，李紀爲博在最近三年世界所有人工智能研究者中，以第一作者發表的頂級會議文章數量高居第一位。

AI+對話，可知可解

詐騙（殺豬盤）網站進行滲透測試

Python 潮流週刊#50：我最喜歡的 Python 3.13 新特性！

外行也能讀懂的網絡硬件設備功能原理速成

簡單搜索--Paddle Mobile的技術實現和業務落地

首場百度大腦開放日來襲 | 全新開放24項AI技術

AI Studio教育版評測：AI真的能夠進入校園嗎？

百度獻禮高校開學季：AI Studio教育版上線！

百度 PaddlePaddle開源視頻分類模型Attention Cluster，曾奪挑戰賽冠軍

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結