在这里插入图片描述
在这里插入图片描述

通过调用各种大模型可以完成对文生文,文生图,图片理解,文生视频,音频识别,文转音频等需求。

#方法一
import os
from openai import OpenAI

# 初始化客户端
client = OpenAI(
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

# 构造请求
completion = client.chat.completions.create(
    model="qwen-vl-max-latest",  # 使用支持图像理解的模型
    messages=[
        {
            "role": "user",
            "content": [
                {"type": "image_url", "image_url": {"url": "https://wx3.sinaimg.cn/mw690/006i0nC8ly1hss7s32z03j31da2yo1is.jpg"}},
                {"type": "text", "text": "用20个字左右来描写图片里的内容"},
            ],
        }
    ],
)

# 输出结果
print(completion.choices[0].message.content)


#方法二
from openai import OpenAI

# 初始化客户端(直接写入API_KEY)
client = OpenAI(
    api_key="替换为你的实际API_KEY", 
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

# 构造请求
completion = client.chat.completions.create(
    model="qwen-vl-max-latest",  # 使用支持图像理解的模型
    messages=[
        {
            "role": "user",
            "content": [
                {"type": "image_url", "image_url": {"url": "https://wx3.sinaimg.cn/mw690/006i0nC8ly1hss7s32z03j31da2yo1is.jpg"}},
                {"type": "text", "text": "用20个字左右来描写图片里的内容"},
            ],
        }
    ],
)

# 输出结果
print(completion.choices[0].message.content)

#方法三 识别本地图片
import base64
from openai import OpenAI

def encode_image(image_path):
    with open(image_path, "rb") as image_file:
        return base64.b64encode(image_file.read()).decode("utf-8")

client = OpenAI(
    api_key="your-api",
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

base64_image = encode_image("1.jpg")


# 构造请求
completion = client.chat.completions.create(
    model="qwen-vl-max-latest",  # 使用支持图像理解的模型
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {
                        "url": f"data:image/jpeg;base64,{base64_image}"  # 指定图片格式(如 jpeg/png)
                    },
                },
                {"type": "text", "text": "什么风格的室内设计"},
            ],
        }
    ],
)

# 输出结果
print(completion.choices[0].message.content)
Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐