最近的AI圈如同过年般一样热闹。

Gemini 3.0 Pro刚刚发布,谷歌就迫不及待地把Nano Banana 2也端上了桌。

图片

新版本正式代号为Gemini 3 Pro Image,也即大家口中的Nano Banana 2。

原本以为Nano Banana已经够强,没想到Nano2的实测效果比想象中还要惊艳,直接碾压一众AI绘图模型!堪称火力全开!

下图是Nano Banana 2的中文海报生成案例:

图片

漫画生成案例:
图片

甚至,它还能伪造出逼真的游戏界面:

图片
图片
在这里插入图片描述

监控录像画面:

图片

顶刊科研配图:
图片

总之,万物皆可生成!

▶ Nano Banana 2使用方法

话不多说,先放上国内可用的Nano Banana 2使用入口:

deepsider.ai

DeepSider是一款浏览器插件,安装到浏览器后,国内也可以直接访问Nano Banana 2/Gemini3.0/GPT-5.1等等几十款AI大模型。

read-normal-img

DeepSider的生成效果如下图所示,再复杂的中文界面,都能轻而易举拿下:
在这里插入图片描述
在这里插入图片描述

无论是速度,还是质量上,效果都非常好。
DeepSider对于国内AI玩家来说,应该是最方便的渠道之一了。
在这里插入图片描述

DeepSider使用方法:
①打开Edge浏览器,打开扩展商店;

②搜索deepsider,安装插件到浏览器;

③打开deepsider侧边栏,切换到Nano Banana 2模型。

在这里插入图片描述

▶ Nano Banana 2新版本功能

①与传统图像模型不同,Nano Banana 2是一款推理模型,在生成图像前会进行内部推理;

②更高的图像质量、更高的准确性、更好的多语言长文本渲染能力;

③可输出1K、2K、4K分辨率图像;

④最多可将14张输入图像组合为1张输出图像;

⑤擅长高事实准确性的创意工作、需要最新知识支持的图像创作。

简单来说,就是更牛x了。

在这里插入图片描述

Nano Banana 2不仅会自动推理,思考用户给出的提示词,还会自动补完用户的深层次需求,并根据自己的最新知识库进行填充。

比如你只需要给出一句话:生成某个食物制作的插画教程。

它就能自动进行检索和思考,填补上所有的细节。

在这里插入图片描述

物理、化学、数学、地理、生物、历史等各个领域的知识,就更不必说。

所以说,通过Nano Banana 2来画科研配图、技术路线图、教学插画、儿童绘本、电商配图等等,完全不在话下。

在这里插入图片描述

如果你也想快速上手Nano Banana 2,现在就可以直接安装DeepSider插件了。

装完插件后,在任何网页上点击右上角的DeepSider图标,就能打开侧边栏选择你需要的模型。

在这里插入图片描述

它专为中文用户设计,无需特殊网络,无需海外账户,支持的模型包括:

GPT5,GPT4.1全系列(包括GPT-4o绘图,GPT5-Codex)

Claude全系列(包括Claude Opus)

Gemini 2.5 Pro全系列;

Grok全系列;

Nano Banana(包括高清图片生成模式)

Sora 2(包括最长25秒视频生成模式)

在这里插入图片描述

你可以一边在网页上刷视频,一边让DeepSider的各个模型在旁边替你画图、写代码、解析文档,非常便捷。

在这里插入图片描述

除了Nano Banana 2,你还可以用DeepSider中的Sora 2一键成片,生成的无水印视频也能直接下载:

在这里插入图片描述

平时这些AI模型官网一个会员就至少要几十上百美元一个月,接入大模型的API费用也相当高。

相对其他方法,DeepSider一个插件就能体验多款热门AI大模型,对国内用户来说更流畅、更方便。

欢迎大家分享你的Nano Banana 2生成结果哦,一起来探索更多好玩实用的案例吧~

国内直连官网地址:deepsider.ai

附完整教程示例:

import requests
import base64
from PIL import Image
from io import BytesIO

# -------------------------- 1. 基础配置(需替换为你的信息) --------------------------
GOAPI_KEY = "8a7b6c5d-4e3f-2g1h-0i9j-8k7l6m5n4o3p"  # 替换为 GoAPI 控制台获取的 API Key
ORIGINAL_IMAGE_PATH = "girl.jpg"  # 原始图片路径(如本地的人物图片)
OUTPUT_IMAGE_PATH = "girl_with_dog.jpg"  # 编辑后图片保存路径
# GoAPI 完整请求地址
GOAPI_URL = "https://api.goaigc.vip/v1beta/models/gemini-2.5-flash-image-preview:generateContent"


# -------------------------- 2. 工具函数:本地图片转为 Base64 字符串 --------------------------
def image_to_base64(image_path, mime_type="image/jpeg"):
    """
    将本地图片转为模型可识别的 Base64 字符串(去掉前缀)
    :param image_path: 本地图片路径
    :param mime_type: 图片类型(jpeg/png,与图片格式匹配)
    :return: 包含 mime_type 和 data 的字典
    """
    try:
        with open(image_path, "rb") as image_file:
            # 读取图片字节并编码为 Base64(解码为字符串,避免二进制乱码)
            base64_str = base64.b64encode(image_file.read()).decode("utf-8")
        return {"mime_type": mime_type, "data": base64_str}
    except Exception as e:
        print(f"图片转 Base64 失败:{str(e)}")
        raise  # 抛出异常,中断流程(避免后续请求出错)


# -------------------------- 3. 构造请求参数 --------------------------
# 1. 处理原始图片:转为 Base64
image_base64 = image_to_base64(ORIGINAL_IMAGE_PATH)

# 2. 构造 Body 体(需求配置)
request_body = {
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "Add a small white dog next to the girl in the picture, with the dog sitting on the ground, and the color of the dog matches the warm tone of the original picture"  # 详细提示词(提升编辑效果)
                },
                {
                    "inline_data": image_base64  # 原始图片数据
                }
            ]
        }
    ],
    "generationConfig": {
        "width": 1024,
        "height": 768,
        "quality": "high",
        "numImages": 1
    },
    "responseModalities": ["image"]  # 固定返回图片
}

# 3. 构造 Header 头
request_headers = {
    "Content-Type": "application/json",
    "Accept": "application/json"
}

# 4. 构造 Query 参数(API Key)
request_params = {
    "key": GOAPI_KEY
}


# -------------------------- 4. 发送请求并处理响应 --------------------------
try:
    # 发送 POST 请求到 GoAPI
    response = requests.post(
        url=GOAPI_URL,
        json=request_body,
        headers=request_headers,
        params=request_params,
        timeout=30  # 超时时间(图片处理耗时较长,建议设为 30-60 秒)
    )

    # 检查请求状态码:200 表示成功
    if response.status_code == 200:
        response_data = response.json()
        # 提取编辑后图片的 Base64 数据(响应结构与模型官方一致)
        edited_image_base64 = response_data["contents"][0]["parts"][0]["inline_data"]["data"]
        
        # Base64 解码为图片并保存/显示
        edited_image_bytes = base64.b64decode(edited_image_base64)
        edited_image = Image.open(BytesIO(edited_image_bytes))
        
        # 保存图片
        edited_image.save(OUTPUT_IMAGE_PATH)
        # 显示图片(可选)
        edited_image.show()
        
        print(f"图片编辑成功!结果已保存至:{OUTPUT_IMAGE_PATH}")
    
    # 处理错误状态码
    else:
        print(f"请求失败,状态码:{response.status_code}")
        print(f"错误信息:{response.text}")  # 打印详细错误(便于排查,如 API Key 无效、配额不足)

except Exception as e:
    print(f"请求过程异常:{str(e)}")  # 捕获网络异常、超时等问题


Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐