【失踪人口回归】cv君花了5天、烧了8亿token 实测Gemini Omni:首个全模态大模型,AI自己造视频的时代来了
我花了5天、烧了8亿token,一篇文章带你吃透 Google 刚发布的两大王炸模型。一句话总结:有夯有拉。
cv君进军视频号创作啦!dou音搜索:cv君 DeepAI 就是我啦
cv君花了8亿token带你全方面对比谷歌新的大模型测评
一、Omni:首个全模态大模型,AI自己给自己剪视频
Google I/O 2026 最炸场的发布——Gemini Omni,首个真正意义上的全模态大模型。


什么叫全模态?你可以用文字、图片、语音、视频,任何方式去生成和编辑视频。不是调API拼工具链,而是一个模型,端到端搞定一切。

比如上图,你只需要说一句"男人穿搭转场,换这件红色卫衣",Omni 直接帮你完成视频中的换装 + 转场,不需要抠图、不需要关键帧、不需要任何剪辑知识。


然后视频会自动按照指令修改,其他都不改动。废片利用。

这意味着什么?AI 可以自己给自己造视频、剪视频了。
Omni 的夯点
- 拯救废片:再也不用反复抽卡了,拍废了直接让 AI 修
- 顶级缝合怪:可灵的参考视频模仿生成、参考图、首尾帧、故事板——Omni 全都能干
- 实时场景编辑:给房间添加特效和新物体,一句提示词搞定
Omni 的拉点
但是! 运动和物理规律这块,Omni 还是拉胯。积木倒塌、流体运动这类场景,效果明显不如 Seedance 2.0。

不过话说回来,除了运动以外,其他方面还是能打的。而且关键优势是——不用排队。

二、Gemini 3.5 Flash:Flash的身价,Pro的实力
第二个主角——Gemini 3.5 Flash。
这次 Flash 版本的速度和精度,居然比上一代的 Gemini 3.1 Pro 还高,输出速度比其他前沿模型快 4 倍。而且还支持 Agent 模式,让 AI 自己拆解任务、自主执行。
Flash 的夯点
| 能力 | 说明 |
|---|---|
| 速度 | 比上一代 Pro 还快 |
| 精度 | 编码、Agent、多模态基准全面超越 3.1 Pro |
| Agent | 支持自主拆任务、多步执行 |
| 面部编码 | FAC 面部编码测试表现惊艳 |
Flash 的拉点
但是! 价格居然比上一代 Pro 版的还要贵。别以为名字带个 "Flash" 就是白菜价,Google 嘴上说 AI 普惠,身体很诚实。
三、这次发布意味着什么?
Google I/O 2026 的核心信号只有一个:AI 正在从工具变成创作者。
- Omni 让 AI 自己就能完成「构思 → 生成 → 编辑 → 成片」的全流程
- Flash 让 AI Agent 自己拆任务自己干活
- 两者结合 = AI 自动化内容生产流水线
这对视频创作者、游戏开发者、内容运营来说,既是机会也是威胁。AI 游戏实时交互、AI 自动剪辑,这些以前觉得"还早"的事情,现在真的来了。

四、总结:值得冲吗?
| 模型 | 夯 | 拉 |
|---|---|---|
| Gemini Omni | 全模态、拯救废片、不用排队 | 运动/物理拉胯 |
| Gemini 3.5 Flash | 速度精度超 Pro、Agent 模式 | 价格比 Pro 还贵 |
方向绝对没错,一个模型干所有事就是未来。但现在——别冲动消费,$100/月的 Ultra 套餐,先想清楚能不能用回本。

认准 cv君,下期再带给你独家 AI 知识。
如果这篇文章对你有帮助,别忘了 点赞 + 收藏 + 关注,你的支持是我持续输出的动力!
cv君首次进军短视频创作赛道,感谢关注我的dou音,账户搜索:cv君DeepAI
相关阅读:
更多推荐





所有评论(0)