AI新工具讓蒙娜麗莎開口說話

AI工具可令「蒙娜麗莎」開口說話。微軟

VASA-1將人物硬照創建出說話面孔。微軟

微軟亞洲研究院(Microsoft Research Asia)研發一款名為VASA-1的新型實驗性人工智能(AI)工具,可以利用一張人物的靜態圖像或繪圖,以及現有的音頻檔案,即時創建栩栩如生的說話面孔。

科技網站Engadget報道,該工具還能為現有的靜態圖像生成面部表情和頭部動作,以及匹配語音或歌曲的適當嘴唇動作。研究人員在專案頁面上傳了大量示例,結果看起來非常逼真,足以讓人誤認為是真人。

雖然仔細觀察後會發現,示例中的嘴唇和頭部動作仍然有點機械化並且不同步,該技術很明顯可能被濫用,使人輕鬆快速地創建模仿真人的深度偽造影片。研究人員意識為此決定不發布「網上演示、API、產品、其他實施細節或任何相關產品」,直到確定該技術「將會被負責任地使用,並遵守適當的規定。」

他們沒有透露是否計劃實施某些保護措施,以防止不肖人士將其用於邪惡目的,例如製作深偽色情或假訊息等。

研究人員相信,該技術將帶來不少益處,比如提高教育平等性,改善那些有溝通困難的人,可透過虛擬化身與外界交流;或者為需要陪伴和治療支持的人提供幫助,比如用於提供AI角色與人交談的程式。

研究人員報告,VASA-1利用VoxCeleb2資料集進行了訓練,該資料集包含從YouTube視頻提取的「6112位名人的超過100萬條短語」,儘管以真實面孔進行訓練,也適用於如《蒙娜麗莎》等藝術照片。▍本報訊 ▍

科技-三藩市版