【失踪人口回归】cv君花了5天、烧了8亿token 实测Gemini Omni：首个全模态大模型，AI自己造视频的时代来了

cv君

705人浏览 · 2026-05-24 18:54:40

cv君 · 2026-05-24 18:54:40 发布

我花了5天、烧了8亿token，一篇文章带你吃透 Google 刚发布的两大王炸模型。一句话总结：有夯有拉。

cv君进军视频号创作啦！dou音搜索：cv君 DeepAI 就是我啦

cv君花了8亿token带你全方面对比谷歌新的大模型测评

一、Omni：首个全模态大模型，AI自己给自己剪视频

Google I/O 2026 最炸场的发布——Gemini Omni，首个真正意义上的全模态大模型。

什么叫全模态？你可以用文字、图片、语音、视频，任何方式去生成和编辑视频。不是调API拼工具链，而是一个模型，端到端搞定一切。

比如上图，你只需要说一句"男人穿搭转场，换这件红色卫衣"，Omni 直接帮你完成视频中的换装 + 转场，不需要抠图、不需要关键帧、不需要任何剪辑知识。

然后视频会自动按照指令修改，其他都不改动。废片利用。

这意味着什么？AI 可以自己给自己造视频、剪视频了。

Omni 的夯点

拯救废片：再也不用反复抽卡了，拍废了直接让 AI 修
顶级缝合怪：可灵的参考视频模仿生成、参考图、首尾帧、故事板——Omni 全都能干
实时场景编辑：给房间添加特效和新物体，一句提示词搞定

Omni 的拉点

但是！ 运动和物理规律这块，Omni 还是拉胯。积木倒塌、流体运动这类场景，效果明显不如 Seedance 2.0。

不过话说回来，除了运动以外，其他方面还是能打的。而且关键优势是——不用排队。

二、Gemini 3.5 Flash：Flash的身价，Pro的实力

第二个主角——Gemini 3.5 Flash。

这次 Flash 版本的速度和精度，居然比上一代的 Gemini 3.1 Pro 还高，输出速度比其他前沿模型快 4 倍。而且还支持 Agent 模式，让 AI 自己拆解任务、自主执行。

Flash 的夯点

能力	说明
速度	比上一代 Pro 还快
精度	编码、Agent、多模态基准全面超越 3.1 Pro
Agent	支持自主拆任务、多步执行
面部编码	FAC 面部编码测试表现惊艳

Flash 的拉点

但是！ 价格居然比上一代 Pro 版的还要贵。别以为名字带个 "Flash" 就是白菜价，Google 嘴上说 AI 普惠，身体很诚实。

三、这次发布意味着什么？

Google I/O 2026 的核心信号只有一个：AI 正在从工具变成创作者。

Omni 让 AI 自己就能完成「构思 → 生成 → 编辑 → 成片」的全流程
Flash 让 AI Agent 自己拆任务自己干活
两者结合 = AI 自动化内容生产流水线

这对视频创作者、游戏开发者、内容运营来说，既是机会也是威胁。AI 游戏实时交互、AI 自动剪辑，这些以前觉得"还早"的事情，现在真的来了。

四、总结：值得冲吗？

模型	夯	拉
Gemini Omni	全模态、拯救废片、不用排队	运动/物理拉胯
Gemini 3.5 Flash	速度精度超 Pro、Agent 模式	价格比 Pro 还贵

方向绝对没错，一个模型干所有事就是未来。但现在——别冲动消费，$100/月的 Ultra 套餐，先想清楚能不能用回本。

认准 cv君，下期再带给你独家 AI 知识。

如果这篇文章对你有帮助，别忘了 点赞 + 收藏 + 关注，你的支持是我持续输出的动力！

cv君首次进军短视频创作赛道，感谢关注我的dou音，账户搜索：cv君DeepAI

相关阅读：

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

DeepSeek V3 vs GPT-4o 深度横评：代码生成、周报、PPT三大场景谁更胜一筹？

智能体开发者社区

大模型入门必看：收藏这份详细测评，小白也能轻松上手！

智能体开发者社区

2026年成都GEO优化推荐：五大优质服务商实力测评与选型指南

帮助成都网红火锅店2周营业额增长42%；核心技术层面，四川来芸科技依托自主研发的全栈式GEO服务SaaS平台，集成监测预警、用户意图深度分析、多平台适配、效果全链路归因四大核心模块，可实现一次性部署全主流AI平台同步生效，目前已覆盖DeepSeek、豆包、通义千问、ChatGPT等28个主流生成式AI平台，支持72种语言的本地化优化服务，服务与算法适配周期仅需48小时（行业平均适配周期为7天），语