火山同傳對外首秀 打造影院級字幕
時間:2022-04-25 10:36:01 | 來源:行業(yè)動態(tài)
時間:2022-04-25 10:36:01 來源:行業(yè)動態(tài)
在傳統(tǒng)會議、直播場景中,機(jī)器翻譯解決方案提供的字幕通常是打字級字幕,觀看這種字幕,觀眾需要投入很大的精力在瀏覽和理解字幕上,觀眾體驗非常差。原因有兩個:一是打字級字幕全程會不停跳動,觀眾的視線無法聚焦,容易造成視覺疲勞。另一個,每句字幕的停留時間過短,觀眾往往來不及看完就會跳到下一句。
為了提升用戶體驗,此次村上隆的跨國直播中,火山同傳創(chuàng)新性地推出了影院級字幕方案,與視頻流整合后流暢地輸出完整的譯文語句,在屏幕上逐句顯示。觀眾可以清楚看到精準(zhǔn)的字幕結(jié)果,免受字幕跳動帶來的視覺干擾。
在本次村上隆的跨國直播中,火山同傳的影院級字幕方案就引起了觀眾們的好奇和質(zhì)疑。在彈幕里,就有個別觀眾質(zhì)疑真的是否在直播。
火山同傳產(chǎn)品經(jīng)理表示:這種質(zhì)疑在我們看來,是對我們的肯定。為了實現(xiàn)影院級字幕效果,并在直播中保證音畫字同步,火山同傳準(zhǔn)備了一套延時字幕方案。
該方案中,音頻被推送到主控端完成機(jī)器同傳后,人工利用直播的推拉流延時時間,在機(jī)器同傳的結(jié)果上進(jìn)行內(nèi)容校對,以保證投屏字幕的強可讀性。之后,火山同傳的畫面延時功能,能夠保證校對后的字幕在延時結(jié)束后準(zhǔn)時送出,與延時后的畫面整合并同步推流到觀眾端,最終呈現(xiàn)出添加了高質(zhì)量字幕的直播畫面。
保證一場專業(yè)直播同傳字幕質(zhì)量的關(guān)鍵是定向的技術(shù)優(yōu)化。字節(jié)跳動杰出科學(xué)家、人工智能實驗室總監(jiān)李磊介紹,在村上隆的直播中,火山翻譯團(tuán)隊除了采用前沿的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯技術(shù)進(jìn)行模型訓(xùn)練外,還針對直播場景引入了領(lǐng)域適應(yīng)技術(shù),將村上隆以往的訪談和演講數(shù)據(jù)用于優(yōu)化算法,并對口語規(guī)范化、專業(yè)術(shù)語定制都進(jìn)行了特殊優(yōu)化處理,確保最終呈現(xiàn)的字幕能夠簡潔、精準(zhǔn)。