大家好,我是鲁工。

谷歌的超级图像模型Nano Banana Pro发布快一个月了,网上的各种创新玩法还在不断涌现。

以至于,今天OpenAI发布了GPT Image 1.5,甚至没搅出一丁点水花。Sam Altman自己心里也清楚,之所以命令为1.5,不敢直接上2.0,是因为这玩意能力根本打不过香蕉Pro。

Nano Banana Pro效果好到令人发指,那本身也是模型能力太强。从一款生图产品角度来看,谷歌甚至都没怎么用心。

所以,当我们用Nano生成一张图后,甚至都没有二次编辑的入口,只能继续发提示词,修改起来也不那么精准。

Nano生成一张图后,右上角只有分享、复制和下载三个功能选项。

但实际上,Nano是有二次改图的入口的,只是这个入口被谷歌隐藏得很深,大多数人难以发现。

具体操作方法是,用Nano生成完一张图后,把这张图下载到本地,然后再上传到Gemini,或者是上传一张需要修改的图。关键操作在于,上传后,不要写完提示词就点提交,先等一下,点击上传的图像到放大页面。

在图像放大页面的正下方,就有图像二次编辑功能,包括涂鸦和新增文本描述的功能。

这样,就相当于Nano具备了二次编辑的能力了。修改后的效果:

从产品角度来看,上述体验实在不好。按照正常的逻辑,我生成了一张图,觉得需要优化,用二次编辑的方式定点修改。而不是我生成了一张图,觉得效果不好,但我需要把这张图先下载下来,再上传到Gemini,然后再二次编辑这张图后发给模型修改。

这产品逻辑简直倒反天罡。

你看即梦的生图,出完图后右下角一堆二次编辑的功。这才是正常的生图和二次修改的逻辑。

除此之外,谷歌还在他们最新的IDE产品Antigravity中提供了免费的Nano Banana Pro的生图以及二次编辑方法。

对于开发者来说,也算是一个多了使用Antigravity的理由。

感谢您阅读我的文章。我是鲁工,八年AI算法老兵,AI全栈开发者。目前正在全面拥抱大模型和AIGC。感兴趣的小伙伴可以加我微信(louwill_)交个朋友。

图片

>/ 作者:louwill

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐