一、介绍

本文通过Dify搭建和实现一款智能图片生成式应用,用户可以通过向大模型发送想要的图片描述,然后大模型生成对应图片作为反馈,下面将详细介绍实现步骤。

Dify私有化部署见:https://blog.csdn.net/2401_84926677/article/details/154205900

二、智能体Agent介绍

智能体(Agent)是人工智能领域中能感知环境、自主决策并执行动作以达成目标的软件或软硬件结合实体,常被看作具备一定自主能力的 “数字体”。它以大语言模型(LLM)为核心基础,搭配规划、记忆、工具使用等能力,能适配多种场景完成复杂任务。

Dify 中的智能体是依托平台低代码 / 零代码能力构建的、具备自主决策与任务执行能力的 AI 实体,既能满足普通用户快速搭建简单智能助手的需求,也能支撑开发者打造适配企业复杂业务的定制化智能体

1. 核心特性

  • 多模型灵活适配作为智能体的 “核心大脑”,Dify 的智能体可无缝集成 100 余种主流语言模型,涵盖 OpenAI 的 GPT 系列、Llama3、Mistral 等开源模型,同时支持火山方舟等国产模型接入。开发者可根据智能体的应用场景和成本预算灵活选择,还能通过 OneAPI 协议以统一接口调用不同模型,大幅提升开发效率。
  • 强知识库与 RAG 能力加持内置智能 RAG 引擎,支持上传 PDF、Markdown 等多种格式文档构建私有知识库,还独创 “高质量 / 经济” 双模式文档分段技术。面对金融报告这类对准确性要求高的场景,高质量模式可精细分段保障理解精度;而普通场景用经济模式能平衡效率与成本,有效降低智能体的 “幻觉” 问题。此外,还支持 Notion 数据同步,方便快速整合外部知识资源。
  • 丰富工具与工作流编排智能体内置 50 多种工具,包括 Google 搜索、Stable Diffusion 等,同时支持对接企业 API 接口和自定义插件开发。搭配平台可视化拖拽画布,可轻松编排复杂工作流,比如串联 “数据检索 - 分析计算 - 报告生成 - 消息推送” 等节点,还能通过条件分支实现动态流程控制,适配多样化任务需求。
  • 完善的企业级保障支持 Docker 容器化一键部署,同时兼容云托管与私有化部署两种模式,满足金融等敏感行业的数据安全与合规需求。此外,具备 LLMOps 监控、多租户权限体系、审计日志等企业级功能,可实现智能体运行状态监控、操作追溯等,适配生产环境的稳定运行。

2. 标准开发流程

    • 基础配置先在 Dify 平台完成环境部署,比如通过 Docker Compose 克隆仓库并启动容器集群。随后根据需求选择适配的语言模型,配置对应的 API 密钥或本地模型的网络端口等参数。
    • 定义核心能力通过提示词工程明确智能体的角色定位与任务边界,比如将其定义为 “电商售后客服”,限定处理订单退款、物流查询等相关任务。接着上传售后政策、常见问题等文档构建专属知识库,为智能体提供精准回答的依据。
    • 编排流程与集成工具在可视化画布中拖拽节点,搭建智能体的工作流。例如售后客服智能体可设置 “用户咨询接收 - 知识库检索 - 常规问题自动回复 - 复杂问题转人工” 的流程,同时集成物流查询 API 等工具,实现实时数据调用。
    • 优化与部署上线配置记忆模块保障多轮对话的连贯性,通过异常处理节点设置重试机制等。完成后可通过 API 将智能体集成到网站、企业微信等载体,也能借助嵌入式组件快速植入业务系统,后续还可通过用户交互日志持续优化智能体效果。

    三、实现步骤

    Stability工具(收费但有免费额度)

    1. 获取Stability API密钥

    访问stability.ai,注册账号并登录,获取api-key

    链接如下:

    Stability AI

    点击Deployment --> Platform API,进入开发者平台

    进入开发者平台后点击Login登录:

    在这个页面进行注册登录或者使用谷歌登录:

    然后点击右上角你的头像,就可以看到已经为你生成了一个Api-Key,复制这个Api-Key!!!

    2. 登录Dify并安装Stability插件

    登录访问Dify控制台,选择工具-Stability

    在工具栏找到Stability后点击安装:

    安装后可以在已有工具栏看到:

    3. 授权Stability插件

    点击这个Stability,在右侧弹出下方内容:

    点击API Key 授权配置,使用刚才复制好的api-key密钥进行授权!

    授权成功!!!

    4. 创建智能体应用

    5. 添加Stability插件

    在工具栏加入Stability插件:

    6. 配置提示词

    7. 调试与预览

    但是这里我的账户没有调用点数需要充值:

    如果你使用谷歌账号登录这个领取密钥,应该会有一定的免费额度。

    如果有额度生成效果应该如下:

    如果你没有额度,那么我们换一个工具!!!

    8. 切换绘图工具

    搜索并安装这个绘图插件

     CogView工具(免费)

    1. 申请智谱 AI 账号

    打开智谱 AI 官网(https://open.bigmodel.cn/),注册并登录账号(支持手机号 / 邮箱注册)。

    2. 获取 API Key

    复制这个api-key

    3. 授权配置

    将刚才新建的api-key粘贴进去,点击保存

    • 在 “ZhipuAI base URL” 输入框中填写官方默认地址:https://open.bigmodel.cn/api/paas/v4/

    组织ID自己找,我这没找到,找到了填进去应该就可以用了

    我这里再换一个工具

    阶跃星辰绘画(免费)

    1. 访问官网

    进入阶跃星辰开放平台官网:https://platform.stepfun.com,使用个人 / 企业账号登录(若无账号需先注册)。

    2. 获取API Key并配置授权

    按照上面的步骤配置和授权

    3. 编写提示词

    可以使用AI大模型根据你的需求生成编排

    4. 配置工具参数

    5. 通过Apifox进行文生图接口测试

    curl https://api.stepfun.com/v1/images/generations \
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer $STEP_API_KEY" \
    -d '{
    "model": "step-1x-medium",
    "prompt": "采菊东篱下,悠然见南山。",
    "seed":945758,
    "response_format":"b64_json"
    }'

    配置请求头,填入密钥

    格式:"Authorization: Bearer $STEP_API_KEY"

    三、实现效果

    Logo

    火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

    更多推荐