語音識別技術25年:它的過去、現在和未來

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"本文的觀點都是個人的反思和觀察,其中一些可能看起來有點固執己見或錯誤的,如有異議,歡迎加入評論。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"1994年,我還是劍橋大學的研究生,我的老師Steve Young和Tony Robinson開發出了當時世界上最好的語音識別系統。在最初的幾天,我看到了一件從早期版本的“DragonDictate”(早期的語音識別系統,說話者在說話時需要在單詞間停頓)身上永遠也猜不到的事情。他們攻克了一個難題,一臺配置一般的計算機就可以將連續的自然語音轉換成文本,準確率約爲95%。也就是說,除了訓練有素的專業人員之外,這項技術已經好過所有人。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"爲什麼語音識別直到最近幾年才被廣泛應用於日常生活中呢?這項技術有很多隱藏的工業應用,但作爲日常的實時用戶接口(例如與電腦對話),其採用速度慢得令人難以置信。90年代的一項逆向圖靈測試證明了其中的一個原因。志願者們認爲他們是在和一臺電腦對話,但實際上是由一個人在“簾子後面”輸入答案。經過觀察和隨後的採訪表明,在那個時候,人們不喜歡語音識別。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"問題出在哪裏?"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}}]}
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章