【聲入人心:音頻新體驗】

在過去的一年中,我們可以看到多媒體特別是音視頻技術的能力在嚴峻的挑戰下,爲各行各業帶來了巨大的變化。疫情過後,又會有哪些多媒體新技術、新實踐呈現在大衆的視野當中?爲行業的發展與應用帶來哪些新的趨勢與機會?


10月29日-30日LiveVideoStackCon 2021 音視頻技術大會 北京站,一同探討視頻行業與技術發展的挑戰與更多機會。

文末福利:往屆(部分)精彩演講視頻及內容整理




. 聲入人心:音頻新體驗 .

從K歌、遊戲、電影到音樂教學,更好的聲音表現力將給用戶體驗帶來質的提升。本專題將討論最新的音頻方案,涉及全景聲、語音合成、語音識別、回聲消除等。

. 講師與議題 .


SPEAKER

of 2021

喬寧博 / 

騰訊專家研究員

微信通話音頻技術負責人

2011年畢業於四川大學,從事音頻實用技術研發十餘年。加入騰訊後主導了微信等產品的音頻技術研發,目前主要負責微信音頻通話、語音消息、短視頻等各類音頻相關業務的技術研發和團隊管理,擁有豐富的音頻技術研究與互聯網產品業務實踐經驗。團隊研發的音頻技術,除應用於微信通話外,在遊戲語音通話中也有廣泛應用。 


TOPIC:

.微信億級通話的音頻技術優化之路.

微信通話系統的語音質量提升歷程分享。從信源和信道質量保障上,本次演講將詳細介紹打造高品質語音通話的關鍵路徑,爲億級用戶提供優質通話服務。講解端到端各節點可能遇到的問題,以及相應解決方案。


SPEAKER

of 2021

沈俊聰/ 

荔枝  音頻技術負責人

2010年7月到2013年3月,在華爲擔任音頻算法工程師,負責華爲手機的語音增強等模塊。2013年4月到現在,在荔枝擔任音頻技術負責人,先後帶領團隊完成了幾個重要項目:手機端音頻節目錄制工具,讓用戶低門檻錄製高音質音頻節目;高音質音頻直播引擎,讓用戶很容易就能在手機上進行高清語音直播;AI聲音理解後臺,能對不同聲音事件進行快速分類;

TOPIC:

.荔枝語音直播中的高音質技術實踐.

荔枝在語音直播中,用到了多種音頻處理技術,譬如結合場景檢測的智能降噪技術,能大大提升音樂等場景音質;自研的回聲抑制技術,雙講性能得到很大提升。智能語音加減速技術,讓延時較低的情況下保持聲音自然清晰;在線機型匹配等技術,讓機型適配更高效。



SPEAKER

of 2021

高月潔/ 

網易雲音樂  

高級音頻算法工程師

主要研究領域爲歌唱評價與嗓音分析。負責音街(網易雲旗下K歌app)的綜合評分系統設計與算法研發,參與音街歌手能力圖譜項目,參與Look直播、雲音樂嗓音相關算法研發。


TOPIC:

.K歌中的歌唱評價與嗓音分析.

音樂專家在評價歌唱行爲時,可通過生理機能與演唱完成度兩個層面對演唱者進行分析。傳統的歌唱評價算法只對音準進行打分,維度較爲片面。作爲國內首創的綜合評分功能,音街的綜合評分系統可對用戶的音準、節奏、氣息、顫音、滑音、情感等維度進行綜合評價,這些多維度評分在增加演唱趣味性的同時,也可爲作品分發提供可用的標籤。同時,對用戶嗓音、演唱行爲進行綜合分析,可建立歌手能力圖譜,依據用戶嗓音條件,爲他推薦適合演唱的歌曲。本次分享將圍繞歌唱與嗓音分析,介紹相關的體系與算法實現。



SPEAKER

of 2021

張俊博/ 

小米  語音技術專家

博士畢業於中國科學院聲學研究所,多年從事智能語音技術的研究和應用,在語音識別、發音評測、語音合成等領域都做過深入的工作,在頂級會議和期刊發表論文10餘篇。目前在小米負責若干項語音新技術的研發。


TOPIC:

.聲音成分的檢測與分離.

本次演講將詳細介紹語音技術中聲音成分檢測與分離的應用與實踐。





點擊 閱讀原文 瞭解更多大會相關信息,
獲取往屆(部分) 精彩演講視頻 內容整理

本文分享自微信公衆號 - LiveVideoStack(livevideostack)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章