語音交互設計的一點認知

語音用戶界面(或VUI)是一種交互模型,在該模型中,人與機器進行交互,並至少部分通過使用語音來執行一組任務。

實際上,這種方式的交互式語音應答(IVR)系統在銀行業和旅遊業中已經得到了廣泛的應用。這些系統主要依賴於語音生物識別來識別用戶並使用語音作爲主要交互模式完成的任務集。隨着亞馬遜Echo、蘋果的siri 等產品的誕生,VUI發生爆炸,各大公司也開始嘗試多媒體交叉設備的體驗。

“治學先治史”,瞭解語音技術的過去點滴,大概會有些幫助。

穿越時間走廊

早在1961年,IBM設計了一個名爲Shoebox的實驗裝置,是由William C.Dersch開發的,大概是早期的語音識別設備。機器把聲音轉換成電脈衝可以識別出16個單詞。在1962年西雅圖舉行的世界博覽會上首次展示,這可能是自動語音識別(ASR)和自然語言理解(NLU)的起點,但只涉及第一部分的聲音識別。對於純語音用戶界面,機器生成人聲早在1939年或更早的時候就有了。

霍默·達德利(在新澤西的貝爾電話實驗室)的Voder是第一款能夠產生連續人聲的電子化設備。1939年,阿爾登·P·阿瑪涅克在《大衆科學》雜誌上寫下了關於這一裝置的文章。它是用真空管和電路製成的,是爲了複製人類的聲音。爲了進行對話,機器操作員使用了一個像風琴一樣的鍵盤。十三個黑白鍵產生了所有的元音和輔音,另一把鍵控制着合成聲音的揚聲器響度。腳踏板改變了音調,使同一句話可以陳述句或疑問。大約一年的培訓,操作員就能使機器說話,想起來也是一個有意思的東西。

2000年初,IVR系統成爲主流。任何有電話的人都可以預訂飛機航班,在賬戶間轉賬,查找當地電影時間,聽交通信息,所有這些都只使用普通電話和人聲。

語音交互、增強現實和虛擬現實等技術或許已經存在或研究了相當長的時間。令人興奮的是,它們最終在市場上廣泛商用了,這就需要設計師和工程師來承擔開發場景以解決用戶日常問題的挑戰。

爲什麼是語音助理

語音助理已經風靡各地,爲什麼呢?它的優勢有:

  • 自然

  • 解放雙手

  • 快速響應

  • 個性化

語音是人們交流的基本手段。其他形式的交流方式如寫作、面部表情或手語,在所有文化中也都同樣具有表達力,但人們主要還是通過語音來說服、告知和建立關係。語音助理能夠在不同的場景和渠道中保持一致。

理解對話

用戶通常會就手頭的特定任務進行語音對話。交互通常很短,來回的交互也很少。用戶可以通過對話來完成一項任務,即使他們不忙,不能總是全神貫注。用戶在通過GUI執行相同任務時會感覺到很多延遲或不爽,而對話將有助於減輕這種體驗。

在語音識別中,得到對話所有的上下文幾乎是不可能的。上下文大約分成三類:

  • 物理上下文

  • 情感上下文

  • 對話的上下文

從物理、情感和會話上下文中,可以創建一個關於會話內容的推理或得出結論,得出一個擬人化的結果。

對話的意圖大約有兩種,一種是目標反饋確定的,一種是不確定的,對於不確定的意圖需要更多的用戶選擇。也就是說,大約可以分爲基於意圖的對話和隨機問答。基於意圖的對話是爲了完成一個目標或完成一個任務而進行的對話。心裏有一個意圖,需要助手的回答,這時只想完成一項任務。隨機問答是指用戶與助手進行交互時沒有特定的意圖。他們只是想和助手聊天,談興趣,也許是想更多的彼此瞭解,建立一種關係。

當然,語音交互有着自己的侷限。在IVR中,很難暫停系統,相反,用戶必須不斷地進行交互,而視覺組件可以讓用戶以更輕鬆的方式繼續交互。另外,是在公共場所使用方面的限制。用戶可能不能在某些公共空間使用語音,因爲這樣做會侵犯用戶的隱私。

語音交互的部分關注點

人的一種主要行爲,就把人的情緒聯繫起來,試圖理解一個複雜的物體。不過,大多數消費者的底線是,更願意與一個溫暖的身體交談,而不是與一臺冰冷的電腦交談,因而需要關注語音應答的多樣性。

逐步披露是人機交互中常用的一種交互設計技術,通過減少混亂、混亂和認知工作量,幫助保持用戶注意力的焦點。這通過只提供手頭任務所需的最小數據來提高可用性。一般使用猶豫標記,或者增加短語詢問。

給語音助理賦予人性化,可能需要一些因素:

  • 經驗的開放性,這可能包括對藝術、情感、冒險、不尋常的想法、好奇心和各種體驗的欣賞。

  • 責任心,可以是高效/有組織的,或者隨和/無關緊要的態度。

  • 外向傾向於表現爲外向、健談、精力充沛的行爲,而內向則表現爲較爲保守和孤獨的行爲。

  • 令人愉快的對話,體現善良、同情、合作、熱情和體貼的個人行爲特徵。

  • 神經質,可能是驚喜,也可能是驚嚇。

模仿的行爲可以與另一個人更相似,感知到的相似性可以作爲基礎。

基於語音的交互或語音檢測依賴於一個設備,該設備有一個性能良好的麥克風來捕捉/記錄用戶的指令,可以參考過去一篇文字。

多方式交互的HCI

VUI與GUI成爲人機交互規範的時候非常相似,設計人員需要清理混亂的邏輯,簡化數據,並向用戶提供更容易掌握的流程和解決方案。以電視遙控器爲例,設備上有20-30個按鈕時,操作起來就會非常困難,一個人很難理解所有按鈕的作用。沒有好的設計,技術就很難甚至不可能得到應用。

用戶體驗設計圍繞着整個用戶旅程展開,即回答用戶對特定用例可以做什麼,然後理解用戶能夠以無障礙和愉快的方式滿足需求的最佳方式。

從一開始就不能決定只使用一個模態,但是設計者必須理解用戶根據系統的輸入和輸出模態完成特定任務的需求。

對於具有圖形用戶界面的數字助理,當有動畫選項時,這變得更有趣。在這裏,助理會表現得像人一樣;會傾聽你的問題,思考,回答,開個玩笑,唱歌,表達悲傷和憤怒,還有很多其他的情緒。

多交互方式並存,形成了人機交互的領域。人機交互(HCI)已經存在了相當長的一段時間了。在20世紀50年代初,用穿孔卡片存儲數據和輸入,隨着個人電腦的引入而發生了顛覆性的變化。20世紀80年代後期,幾乎使世界上的每個人都成爲潛在的計算機用戶,也暴露了關於可用性的問題。

HCI整合了認知心理學、人工智能和思維哲學,以闡明系統化和科學化的應用,稱爲認知工程。它使具有概念、技能和遠見的人能夠滿足人機交互的實際需求。

交互設計的一些原則

HCI 的設計有很多的經驗和原則,對於VUI同樣有着參考意義。例如,Ben Shneiderman 關於界面設計的8條金規:

  • 爭取一致性

  • 允許用戶使用快捷方式

  • 提供信息反饋

  • 設計對話以實現閉環

  • 提供錯誤預防和簡單的錯誤處理

  • 允許輕鬆逆轉操作

  • 支持內部控制點

  • 減少短期內存負載

又例如,Donald Norman的七個設計原則:

  • 在頭腦中運用現實世界和知識

  • 簡化任務結構

  • 使事物可見;縮小執行和評估之間的差距

  • 正確繪製地圖

  • 利用自然和人工約束的力量

  • 面向錯誤的設計

  • 當所有其他方面都失敗時,標準化

還有現在廣泛使用的Nielsen啓發式UI/UX設計原則:

  • 系統狀態的可視性

  • 與系統和現實世界相匹配

  • 用戶控制和自由

  • 一致性和標準

  • 靈活性和效率

  • 錯誤預防

  • 錯誤報告、診斷和恢復

  • 美學和極簡設計

  • 識別而不是回憶

  • 幫助和文檔

創建一個平滑無縫且自然的 VUI 對於使用的人工智能產品來說至關重要。對VUI而言,也有着自己的設計技巧:

  1. 瞭解智能引擎的背後,成功與否取決於真正爲體驗提供動力的內部架構。

  2. 構建自己的設計工具棧,Adobexd非常適合用於線框用戶流程圖,語音工具包括Walkie, Botframe 和 Mockabot等。

  3. 個性在設計中表現出來,而不是交給設備。個性表現在設計決策和獨特的工作流程,堅持利益相關者的有效執行。

  4. 少即是多。設備所說的實際語言必須清楚地滿足其用戶的需求,剩下的纔是措辭,句子結構,音調,甚至聲音本身的音調變化等。

  5. 在配音的時候要專業一點。專業的錄製最好有TTS的客戶經驗,爲人工智能對話設計音頻與製作音樂甚至是傳統的配音有很大的不同。

  6. 在 VUI 之外保持角色的一致性。如果圖形元素不能和諧地補充語音元素,那麼創建一個殺手級的 VUI 將被證明是徒勞的。 

  7. 讓語音設備保持親密狀態。有競爭力的產品是需要儘可能多地挖掘 。

  8. 鼓勵嘗試。場測和錯誤驗證,再加上可靠的用戶研究,無論多麼細緻,都不會讓你成功地將最微妙的特質融入到你的語音交互體驗中。

  9. 一切都是達到目的的手段。歸結爲一件事,數據是人工智能的全部。個設計良好的 VUI 應該通過成爲習慣的具有啓發性的交互體驗來補充這個過程。

  10. 設計的分享。目標、需求、最佳實踐、技術、技術、工具集和行業每天都在不斷變化。知識和經驗的擴散是揭開人工智能個性設計的神祕面紗並使之標準化的最佳途徑。

然而,“大道易得,小術難求”。行勝於言,努力去學習和實踐才能得到更多的理解和認識。

(本文圖片來自網絡,如有侵權,聯繫作者刪除)

參考資料

  • https://ai.googleblog.com/2018/05/duplex-ai-system-for-natural-conversation.html

  • http://www.speechtechmag.com/Articles/Editorial/Feature/Its-a-Persona-Not-a-Personality-36311.aspx

  • https://www.forbes.com/sites/mnewlands/2017/08/25/10-essential-tips-on-voice-user-interface-design-for-ai/#29f764dc2422

  • https://www.theatlantic.com/science/archive/2017/12/the-secret-lifeof-um/547961/

  • http://www.csun.edu/science/courses/671/bibliography/preece.html

  • Nielsen, 1995, https://www.nngroup.com/articles/ten-usability-heuristics/

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章