最新開源圖像生成模型 號稱速度更快功能更強

開源圖像生成模型Stable Cascade生成的一些圖片。Stability AI

人工智能公司Stability AI推出了最新的開源圖像生成模型Stable Cascade,承諾比業界領先的前代產品Stable Diffusion更快、更強大。後者是目前許多文本生成圖像AI工具的基礎。

Stable Cascade可以生成圖片,並給生成的圖片創建不同的變體,亦可用於提高現有圖片的分辨率。其他文本到圖片的編輯功能還包括對圖片的特定部分進行畫內和畫外補充,以及通過canny edge,用戶可以利用現有圖片的邊緣製作一張新圖片。

新模型在開源編碼平台GitHub上可供研究人員使用,但不能用於商業用途。在谷歌、蘋果等公司發布自己的圖像生成模型之際,新模型也能帶來更多選擇。

與Stability的旗艦產品Stable Diffusion模型不同,Stable Cascade並不是一個大型語言模型,而是三個依賴於Wurstchen架構的不同的模型,第一階段Stage C將文本提示壓縮成潛碼(lantent,即較小的代碼片段),然後傳遞給Stage B和Stage A解碼,據稱此舉有效縮短圖片生成時間,從當前模型的22秒減至只需10秒。本報訊

科技-三藩市版