DuerOS的零編程技能實現

我們正在步入智能語音時代,而DuerOS正在爲生產和生活中的智能語音賦能。開發者可以使用DuerOS提高的Bot SDK,像開發Web應用程序那樣完成智能語音技能的開發。

從終端用戶的視角來看,技能就是一個個具體的智能語音應用;從開發者的視角來看,技能就是支撐智能語音交互的後臺應用。程序員改變世界,那麼,如何沒有編程能力能否實現智能語音應用呢?

在DuerOS Bot Platform(DBP,https://dueros.baidu.com),答案是肯定的。

目前,DBP平臺提供了4種零編程就可以實現的智能語音技能,只要你會一般的計算機操作,就可以無需編碼實現智能語音技能,進而在小度系列的智能語音產品上享受自己的成果。

小技能

小技能是DuerOS 平臺自動爲用戶生成的技能,在限定交互場景之後,開發者只需提供內容,即可在小度系列的智能語音設備上播放這些內容。

目前小技能功能包括話術類、音頻類,圖片類和視頻類的小技能,播放方式約定爲順序播放,隨機播放和播放一個之後關閉。

話術類小技能

話術小技能是指開發者僅在技能開放平臺上配置文本內容,DuerOS就可以生成對應的小技能,將文本內容播報出來。

在開放平臺上面填寫文本內容。每個技能最多支持100條文本。支持在線填寫和批量導入兩種方式。開發者還可以爲每條文本內容配置背景音樂和圖片。

應用場景示例:小知識、小笑話等。

音頻類小技能

音頻類小技能是指開發者在技能開放平臺上配置音頻資源後,DuerOS自動生成將音頻資源按照配置的方式進行播放的技能。

配置音頻包括配置音頻資源,選擇播放模式和配置音頻切換話術。當選擇順序播放和隨機播放模式時,可以配置切換話術支持用戶主動切換音頻。系統默認配置了一些切換話術,也支持添加自定義切換話術。

應用場景示例:場景音樂,個性化祝福,自定義歌單等。

圖片類小技能

圖片類小技能是指開發者在技能開放平臺上配置圖片資源後,DuerOS自動生成將圖片資源按照配置的方式進行圖片播放的技能。

上傳圖片,支持本地添加和資源管理添加兩種方式。本地添加的資源也會展現在資源管理中,目前只支持PNG或JPG格式。在沒有用戶表達的時候,圖片會進行自動的輪播切換。

應用場景示例:家庭相冊,旅遊記憶等。

視頻類小技能

視頻類小技能是指開發者在技能開放平臺上配置視頻資源後,DuerOS自動生成將視頻資源按照配置的方式進行播放的技能。

配置視頻包括配置視頻資源,選擇播放模式和配置視頻切換。在選擇順序播放和隨機播放模式時,如果不配置視頻切換,在當前視頻播放完後,會繼續播放下一個視頻,用戶無法主動切換視頻。

應用場景示例:聚會紀念的MV,觀光風景,小紀錄片等。

需要注意的是,音頻類資源目前只支持MP3格式,視頻類資源目前僅支持MP4格式。小度智能音箱只支持話術類小技能和音頻類小技能,在小度有屏設備上支持所有類型的小技能。

內容播報類技能

通過內容播報類技能,用戶可以通過技能訂閱新聞資源和有聲資源。其中新聞資源包含時政、財經、社會、娛樂等,這類資源的時效性較強,更新頻率比較快。有聲資源包含脫口秀、小說、廣播劇、歷史、人文、有聲書等,這類資源時效性不強,更新頻率相對較慢。

以新聞數據爲例,在這類技能中,開發者僅需將資源按照新聞數據的格式提供到DuerOS平臺中即可。新聞數據不僅僅會被技能名稱調起,在開發者授權後,也會被推薦到DuerOS的其它新聞渠道中。

新聞數據既可以手動上傳資源文件,也可以通過XML的形式來提高數據源,具體XML 的格式參見。文件要求是UTF-8格式,即encoding="UTF-8"。每個文件要小於10M,且每個文件中記錄不能超過50000條。如果文件大於10M,或者記錄數超過50000條,需要將文件進行拆分,並保證拆分後的每個文件滿足上述條件。最後將拆分後的文件的URL地址,整理成一個新的文件即可。 

相對於小技能而言, 內容播報類技能提供了持續的內容更新能力。

故事探索類技能

故事探索類技能在DuerOS平臺上是固定角色扮演的對話式遊戲,通過遊戲編輯器(故事工廠)無需編程就可以實現此類的技能。

遊戲編輯器把此類技能抽象爲爲場景、狀態和關係三個部分。

場景通過圖片、文字和語音描述了故事的環境、事件、人物、對話等內容。場景通過遊戲編輯器中的節點編輯它的內容信息,主要是配置場景中所要播報的語音,有屏設備展示和無屏設備展示可以配置場景所需的標題、文本、圖片等內容。

狀態是故事中人或物的屬性,用來描述故事分支劇情的多樣性。在故事的開始設置各個狀態的初始值。

關係是場景之間的鏈接,涵蓋了進入的條件和進入新場景後的狀態更新。Query條件是主動進入條件,用戶通過Query與故事互動來進入下一個場景。狀態條件指在當前場景中狀態滿足某條件時才能進入下一個場景。

具體的操作示例可以參考故事工廠在DuerOS技能開發中的應用——百度2019AI開發者大會DuerOS公開課摘要解讀之四

自定義內容回覆技能

開發者可以創建自定義技能爲用戶提供各種服務,如提供天氣預報、百科常識、互動遊戲、訂購物品等。用戶只需要語音交互就可以獲得相應的服務。 

自定義的技能涉及到交互模型的建立,具體可以參考

針對指定的意圖,開發者可給出“自定義回覆”,將回復的邏輯託管的DuerOS平臺,從而實現零編程的自定義技能。

自定義回覆可以是文本,也可以是開發者預先錄製好的音頻。DuerOS回家自定義的文本通過TTS技術在智能語音設備上播放出來,對錄製好的音頻的音頻可以直接播放。

小結

文中給出了4種技能生產方式:小技能、內容播報技能、故事探索類技能和自定義回覆技能。這四種類型的技能都是可以零編程實現,無需部署,完全建立在DuerOS Bot Cloud 之上,開發者只需攜帶着自己的內容和創意,就可以在DuerOS 開放平臺上定製出豐富多彩的智能語音服務。

隨着DuerOS 不斷演進,更多的零編程技能類型,以及更多高效的技能編程方式將不斷湧現,敬請期待。

關聯閱讀

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章