AI嘯叫檢測領域在全球范圍內首個公開發(fā)表的研究成果
時間:2022-04-26 22:33:01 | 來源:行業(yè)動態(tài)
時間:2022-04-26 22:33:01 來源:行業(yè)動態(tài)
。
當揚聲器和話筒之間的聲學耦合產生正反饋時,嘯叫便會產生。傳統(tǒng)的公共廣播系統(tǒng)和助聽器設備利用傳統(tǒng)的嘯叫功能檢測和抑制嘯叫。然而,實時通信(RTC)中的傳統(tǒng)嘯叫功能會受到非線性和不確定性的影響,如各種揚聲器/麥克風響應、多種非線性音頻處理、不穩(wěn)定的網(wǎng)絡傳輸抖動、聲學路徑變化和環(huán)境影響等。在嘯叫檢測中,使用特定時間-頻率特征的信號處理方法對RTC場景是無效的。
云信音頻實驗室提出了一種基于卷積遞歸神經網(wǎng)絡(CRNN)的方法,用于RTC應用中的嘯叫檢測,實現(xiàn)了出色的準確性和低誤報率。該篇文章使用不同的移動設備收集和標記嘯叫數(shù)據(jù)集用于模型訓練,并選擇對數(shù)梅爾譜作為輸入特征,實現(xiàn)了 89.46% 的檢測率和 0.40% 的誤報率。 此外,所提出方法的模型大小僅為 121kB,并且已在實時運行的移動設備中實現(xiàn)。
作為行業(yè)內首批音視頻 AI 實驗室之一,網(wǎng)易云信音頻實驗室不斷探索AI 音頻前沿技術方向,連續(xù)取得業(yè)界權威認可。2021年,實驗室在AI 音頻降噪和 AI 音樂檢測的研究成果被第 50 屆國際噪聲控制工程會議(INTER-NOISE 2021)收錄,自建的國內行業(yè)中首個 AI 音樂檢測模型受到了高度關注。本次AI嘯叫檢測成果被 ICASSP 2022接收,再次證明了網(wǎng)易云信在音頻技術領域的頂尖研究實力。
未來,網(wǎng)易云信音頻實驗室將持續(xù)引領新技術發(fā)展方向,并將先進的算法模型應用于產品和場景中,為全球用戶打造極致聽覺體驗。