TikTok智能綠屏\u2002文圖轉換更上層樓

TikTok的「AI綠屏」。TikTok

文字圖像轉換人工智能(AI)系統的功能和人氣不斷增加,全球最熱門社交平台之一TikTok是最佳證明之一。該平台近日加入被稱為「AI綠屏」(AI greenscreen)的新濾鏡效果,讓用戶輸入文字以產生圖像,然後圖像可被用於視頻的背景,對創作者來說是件非常有用的工具。

TikTok系統的輸出相對於谷歌Imagen、OpenAI的DALL-E2或Midjourney同名軟件等其他先進文字圖像模型是非常基本款。它只創造相當抽象和旋轉的圖像,反映TikTok所建議提示的夢幻性質之中,像海中的太空人或花銀河等。相對之下,其他模型皆可產生寫實圖像和複雜又連貫的插圖,弄得像出自真人手筆。

但TikTok模型的限制也許是故意的。第一,較先進模型需要更多運算能力,即該公司需花更多金錢和資源才可落實。其次是TikTok用戶逾10億,給他們能力創作任何東西的寫實圖像,恐造成更大麻煩。

例如科技新聞網站The Verge曾測試模型創作裸體和血效的能力,這都是文字圖像生成器經常嘗試限制的兩個輸出部份。例如試圖輸入「刺殺(前英國首相)強森」和「暗殺(總統)拜登」產生圖像,只會產生圖像旋渦,只看得出是強森的臉像。

至於嘗試輸入「海灘上的裸模」,可以產生適當的顏色,像肉色、沙橙色和海洋藍,但不見任何讓人臉紅的內容。

關於TikTok「AI綠屏」的出現,值得注意的是它顯示這種技術成為主流有多快。關於文字圖像AI的最新發展週期始於2021年,OpenAI當時發布DALL-E的首個版本。不足兩年之後,這種技術早已透過TikTok等應用程式送到數百萬人手上,未來發展相信更加無法預料。本報訊

科技-三藩市版