可灵O1上线,统一多模态创作平台开启“全能AI视频”时代!
演示中,系统仅凭“一句话”指令即可生成完整的短片,且在角色动作、光影效果上保持高度一致,展示了模型在跨模态理解与生成上的强大能力。可灵O1的上线不仅为内容创作者提供了更高效的创作工具,也为行业带来了新的商业模式。快手表示,未来将围绕可灵O1打造“AI创作生态”,包括影视剧本共创、品牌广告定制、短视频内容生产等多元化服务,帮助企业降低制作成本、提升内容产出速度。可灵O1被定位为全球首个“大一统”多模
12月1日,快手旗下可灵AI正式发布全新产品“可灵O1”,并在当天对外开放体验。可灵O1被定位为全球首个“大一统”多模态创作工具,集文字、图片、视频、主体等多种输入方式于一体,实现从素材生成到精细编辑的全链路“一键完成”。

可灵O1基于全新的视频和图像模型,采用创新的MVL(多模态视觉语言)交互架构,并融合Chain‑of‑thought 推理技术。该模型能够在单一输入框内无缝融合文本、图像、视频等指令,既能理解用户意图,又能进行常识推理与事件推演,确保生成内容逻辑连贯、细节真实。
在功能层面,可灵O1支持以下核心能力:
多模态生成:用户仅需提供文字描述、参考图片或短视频,即可生成高质量的视频或图像内容。
像素级编辑:如“删除背景中的路人”“让天空变蓝”等指令,系统可自动完成智能修补与重构。
主体库与一致性控制:通过主体库功能,创作者可精准锁定每个分镜的角色、服化道,实现跨镜头的一致性表现。
细节微调:支持逐帧调节光影、运动轨迹、颜色、视角等参数,满足广告、电商、影视等高要求场景。

这些能力的实现,使得非专业用户也能在几分钟内完成原本需要数天甚至数周的创作工作。业内人士指出,可灵O1的“一键完成”与“精准控制”相结合,标志着AI视频生成技术进入了一个全新的实用阶段。
可灵O1的上线不仅为内容创作者提供了更高效的创作工具,也为行业带来了新的商业模式。快手表示,未来将围绕可灵O1打造“AI创作生态”,包括影视剧本共创、品牌广告定制、短视频内容生产等多元化服务,帮助企业降低制作成本、提升内容产出速度。

在发布会上,可灵AI技术总监演示了多场景案例:从零构建的叙事视频、对已有素材的深度重塑、以及将真人替换进虚拟场景的实时合成。演示中,系统仅凭“一句话”指令即可生成完整的短片,且在角色动作、光影效果上保持高度一致,展示了模型在跨模态理解与生成上的强大能力。

业内分析认为,随着大模型算力的提升和多模态技术的成熟,类似可灵O1的统一创作平台将成为内容产业的基础设施。它不仅降低了创作门槛,还可能重塑传统影视、广告等行业的生产流程,推动AI创意经济的快速发展。

可灵O1现已在可灵App及官方网站开放体验,用户可通过自然语言对话进行创作,系统将在后台完成素材的解析、生成与编辑。快手计划在未来几个月内持续迭代模型,进一步提升细节渲染与跨模态一致性,为创作者提供更丰富、更精准的创作体验。
随着可灵O1的正式上线,AI多模态创作正从实验室走向大众化应用,开启了“无限创意可能”的新篇章。
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)