Meta翻譯新模型 水平幾近信達雅

Meta運用AI推動「無縫溝通」即時傳譯模型。Meta

Meta早在今年8月發布了多模態人工智能(AI)驅動的翻譯模型SeamlessM4T,支持近100種文本語言和36種語音。現在推出v2架構的更新,Meta繼續擴展這一工具,使對話翻譯更加自然和富有表現力,而後者正是跨語言真實對話所缺少的關鍵。

「無縫溝通」(Seamless Communication)套件的兩項新功能中的第一項是「無縫表達」(Seamless Expressive),顧名思義,就是將您的表情移植到翻譯語音中。其中包括音調、音量、情感基調(興奮、悲傷或低語)、語速和停頓。考慮到在此之前,翻譯後的語音聽起來總是像機器人一樣,這一突破可能會改變我們的日常生活和內容製作。支持的語言包括英語、西班牙語、德語、法語、意大利語和漢語,但演示頁面尚還缺少意大利語和漢語。

第二項功能是「無縫串流」(Seamless Streaming),可以在說話者說話時就開始同聲傳譯,僅有不到2秒的短暫延遲,不用等到說完一句話。據Meta公司說,期間的挑戰在於不同的語言有不同的句子結構,因此必須開發一種專門用於研究部分音頻輸入的算法,以決定是否已有足夠的語境來開始生成翻譯輸出,還是繼續聽下去。

科技網站Engadget點評稱,Meta在「無縫溝通」套件上的最新進展,初步顯示比谷歌和三星等公司提供的移動翻譯工具更令人印象深刻。雖然目前還不知道公眾何時能使用這些新功能,但已經可以想象,Meta總有一天會將這些功能融入其積極研發的智能眼鏡中,讓它們變得更實用。

科技-三藩市版