技術(shù)升級:上線共感模型、全雙工語音和實時視覺
時間:2022-03-31 08:12:01 | 來源:行業(yè)動態(tài)
時間:2022-03-31 08:12:01 來源:行業(yè)動態(tài)
從誕生之初,微軟就一直強調(diào)要讓小冰擁有足夠的EQ,這是讓她與人類愉快玩耍的基本前提。因為要讓一個智能機器人不把天聊死,就要讓她擁有可以控制與人類的對話全程的能力。
為此,微軟在去年第五代小冰中引入了生成模型,使得小冰可以在互動中更好地聯(lián)系上下文,并自創(chuàng)回復(fù),而不需要從已有的對話語料庫中檢索得到答案
而在此次發(fā)布會上,微軟又基于生成模型上線了全新的共感模型,進一步提高小冰對于對話內(nèi)容、領(lǐng)域和節(jié)奏的控制力,通過自創(chuàng)回應(yīng)牽引對話向她所希望的方向進行。在對話過程中,小冰會在回應(yīng)中應(yīng)用自己的策略,主動觀察并不斷求證,試圖找到人類在話題中的興趣點,在對話中帶動節(jié)奏。
微軟小冰負責人李笛表示:目前,微軟已經(jīng)完成了共感模型的測試,并正式在小冰所覆蓋的5個國家正式上線。
此外,同樣是在第五代小冰發(fā)布會上,微軟還完成了全雙工語音交互感官的產(chǎn)品化,并在打電話和智能音箱設(shè)備兩個場景中落地。
基于此,此次微軟又融合了共感模型的對話引擎、全雙工語音和實時視覺三個類別的全新感官,讓小冰在與人的互動中擁有視覺,可以看到對方的一舉一動。
在發(fā)布會現(xiàn)場,微軟放置了用于體驗的測試設(shè)備。通過該測試設(shè)備,小冰可以通過視覺、語音的實時連續(xù)交互,指揮用戶完成面容檢測,并在上述過程中進行開放域的對話。
據(jù)微軟預(yù)計,該感官將于一年內(nèi)完成全部產(chǎn)品化工作。