快手(1024)自研大模型可靈AI正式發布新產品「可靈O1」,為全球首個統一多模態創作工具,並獲形容為「AI影片的Nona Banana」,以及「像P圖一樣P視頻」,目前已在可靈App及官網開放體驗。
據內媒報道,可靈O1基於全新的影片與影像模型,以自然語言作為語意骨架,搭配影片、圖片、主體等多模態描述,將所有生成與編輯任務融合於一個引擎之中,為使用者搭建全新的多模態創作流,實現從靈感到成品的一站式閉環。
報道提到,使用者上傳的圖片、影片、主體、文字在可靈O1中,皆是指令;同時,模型打破了模態限制,能夠綜合理解一張照片、一段影片或一個主體,甚至一個角色的不同視角,精準生成各種細節。