AI新工具讓蒙娜麗莎開口說話

2024-04-23 05:59:00

AI工具可令「蒙娜麗莎」開口說話。微軟

VASA-1將人物硬照創建出說話面孔。微軟

微軟亞洲研究院（Microsoft Research Asia）研發一款名為VASA-1的新型實驗性人工智能（AI）工具，可以利用一張人物的靜態圖像或繪圖，以及現有的音頻檔案，即時創建栩栩如生的說話面孔。

科技網站Engadget報道，該工具還能為現有的靜態圖像生成面部表情和頭部動作，以及匹配語音或歌曲的適當嘴唇動作。研究人員在專案頁面上傳了大量示例，結果看起來非常逼真，足以讓人誤認為是真人。

雖然仔細觀察後會發現，示例中的嘴唇和頭部動作仍然有點機械化並且不同步，該技術很明顯可能被濫用，使人輕鬆快速地創建模仿真人的深度偽造影片。研究人員意識為此決定不發布「網上演示、API、產品、其他實施細節或任何相關產品」，直到確定該技術「將會被負責任地使用，並遵守適當的規定。」

他們沒有透露是否計劃實施某些保護措施，以防止不肖人士將其用於邪惡目的，例如製作深偽色情或假訊息等。

研究人員相信，該技術將帶來不少益處，比如提高教育平等性，改善那些有溝通困難的人，可透過虛擬化身與外界交流；或者為需要陪伴和治療支持的人提供幫助，比如用於提供AI角色與人交談的程式。

研究人員報告，VASA-1利用VoxCeleb2資料集進行了訓練，該資料集包含從YouTube視頻提取的「6112位名人的超過100萬條短語」，儘管以真實面孔進行訓練，也適用於如《蒙娜麗莎》等藝術照片。▍本報訊 ▍

科技-三藩市版

OpenAI推出瀏覽器Atlas 全面融合ChatGPT

編碼代理Claude Code 全新網頁介面使用更普及

排泄物反映人體健康馬桶增加智能監測器

X推出交易平台付費用戶可換帳號

互聯網文章無數 AI創作量超越真人

Pinterest推出新工具限制AI內容

Anthropic推出Claude 技能

本田將推出騎乘式機器人割草機

生成式AI光譜千倍提速材料品測

一千兆瓦時全球最大粘土磚製加熱電池投入使用

更多