熱門看點:可靈AI發(fā)布O1視頻大模型 支持多模態(tài)輸入與對話式編輯
2025-12-02 10:32:36    網易科技報道


(相關資料圖)

12月2日消息,據了解,可靈AI于12月1日正式宣布,其自主研發(fā)的O1視頻大模型正式面向公眾全量開放。該模型被定位為一款統(tǒng)一的多模態(tài)創(chuàng)作工具,支持用戶通過單一輸入框融合文字、圖像、視頻指令進行視頻生成與編輯。

據悉,可靈O1模型采用MVL(多模態(tài)視覺語言)統(tǒng)一交互架構,結合Chain-of-Thought推理技術,能夠處理文生視頻、圖生視頻、局部編輯、鏡頭延展等多種任務,無需在不同功能模塊間切換。該技術通過多視角主體構建方法,旨在解決視頻生成中人物或物體在鏡頭切換時出現的特征漂移問題,以提升畫面連貫性。

目前,可靈O1模型已在可靈App及官網開放體驗,支持生成3至10秒時長的視頻,主要面向短視頻創(chuàng)作者、廣告團隊及個人用戶。公司表示后續(xù)將開放API接口,供第三方平臺集成。(袁雪麗)

本文來自網易科技報道,更多資訊和深度內容,關注我們。

關鍵詞: 模態(tài) 可靈 輸入框