5个关键步骤，打造高效Agent：2024年Anthropic最佳实践

在LLM（大型语言模型）驱动的系统中，工作流和智能体是两个重要的概念，但它们有显著的不同。工作流是指在预定义代码路径中，LLM和工具按照固定顺序进行协调。这意味着任务的每个步骤都已经事先设定，LLM按照这些步骤执行任务。工作流适用于那些步骤已知且任务明确的场景。智能体则是指LLM在执行过程中，根据当前的情况和进展动态决定如何使用工具，并根据实际需求作出调整。这种方式适用于那些任务路径不可预知、复杂

程序员维他命

1004人浏览 · 2025-01-03 11:19:04

程序员维他命 · 2025-01-03 11:19:04 发布

在人工智能（AI）技术迅速发展的今天，智能体（Agent）已成为推动社会变革的重要力量。随着2024年末Anthropic公司发布的《Building effective agents》一文总结了开发智能体的最佳实践，许多业界领袖，如吴恩达等，都认为智能体将是AI赋能社会的最大机会之一。那么，如何创建有效的智能体(Agent)呢？本文将通过提问和解答的方式，带您深入理解智能体的创建、应用和未来潜力。

1. 什么是工作流（Workflow）与智能体（Agent）的区别？

在LLM（大型语言模型）驱动的系统中，工作流和智能体是两个重要的概念，但它们有显著的不同。

工作流是指在预定义代码路径中，LLM和工具按照固定顺序进行协调。这意味着任务的每个步骤都已经事先设定，LLM按照这些步骤执行任务。工作流适用于那些步骤已知且任务明确的场景。
智能体则是指LLM在执行过程中，根据当前的情况和进展动态决定如何使用工具，并根据实际需求作出调整。这种方式适用于那些任务路径不可预知、复杂且动态变化的场景。简单来说，智能体具备自主决策能力，可以根据实际情况选择工具和任务步骤。

工作流 vs. 智能体

|
特点

工作流

智能体

|
| — | — | — |
|

任务的可预测性

任务步骤已知，路径固定

任务步骤不可预见，路径动态调整

|
|

执行方式

固定步骤，LLM按顺序执行

动态决策，LLM根据情况选择工具和步骤

|
|

适用场景

任务明确，步骤固定

任务复杂或开放，需要动态决策

自主的智能体

2. 何时使用智能体系统（工作流或智能体），何时使用更简单的LLM实现？

选择工作流或智能体系统，需要考虑任务的复杂性、可预测性以及所需的灵活性：

使用工作流：当任务步骤明确、可预测时，工作流能够提供高效和一致的执行。工作流通过将任务拆分成多个子任务，降低了复杂度，确保高精度的同时，也提高了任务执行的可控性。
使用智能体：当任务复杂、开放且路径不可预测时，智能体系统能够灵活地做出决策，选择适当的工具和执行步骤。尽管智能体的灵活性带来了较高的延迟和潜在错误，但它适用于那些需要不断调整和决策的任务。
简单LLM实现：如果任务简单且不需要复杂的工具或多步决策，使用单一的LLM模型足以完成。例如，单纯的文本生成、情感分析等任务。

建议：始终从最简单的解决方案开始，优化单个LLM调用。只有当任务复杂到无法用简单方法解决时，再考虑使用智能体或工作流系统。

3. LLM工作流的常见模式

在实际开发中，LLM工作流常见的模式包括：

提示链（Prompt Chaining）：将任务拆解成多个步骤，每一步使用LLM处理前一步的输出，并加入中间检查。适用于可以分解为固定子任务的场景。例子：将营销文案翻译成多种语言。
路由（Routing）：根据输入分类，将任务指派给不同的子任务。适用于任务分类明确且需要不同处理方式的场景。例子：客户支持的不同路径，如退货问题与技术问题。
并行化（Parallelization）：同时处理多个子任务，最终汇总结果。适用于任务可以并行处理的场景。例子：独立检查不当内容与处理用户查询，或让多个审核员并行评审代码漏洞。
协调者-工人模式（Orchestrator-Workers）：一个中心LLM负责将任务拆解并分派给多个子任务，再汇总结果。适用于复杂任务，任务步骤不可预见。例子：编码智能体在多个文件中做出复杂修改。
评估-优化模式（Evaluator-Optimizer）：一个LLM生成响应，另一个LLM进行评估并提供反馈，进行迭代优化。适用于有明确评估标准并且需要迭代改进的任务。例子：文学翻译或复杂搜索任务。

4. 智能体的有效性与局限性

4.1 智能体在何时最有效，局限性又是什么？

智能体最有效的场景包括：

开放性问题：当任务的步骤不可预见时，智能体能够自主选择执行路径和工具。尤其是需要与用户进行对话并做出实时响应的任务，如客户支持。
任务多变：任务的复杂性和变化要求智能体根据上下文做出灵活决策。例如，编程智能体需要根据不同的代码库情况做出相应的修复。

然而，智能体的局限性包括：

更高的成本和延迟：由于其动态决策的性质，智能体通常需要更多的计算资源，并可能导致较长的响应时间。
潜在的错误积累：智能体在执行过程中可能会遇到错误，并且错误可能会在多个步骤中积累，导致最终结果的偏差。
高需求的信任度：由于智能体的自主决策过程，开发者需要对其决策过程高度信任。

4.2 创建智能体系统的关键构建模块是什么？

智能体系统的核心构建模块是增强型LLM。增强型LLM通过集成信息检索、工具使用（如API调用）和记忆（记录历史互动）等功能，使LLM能够执行比简单文本生成更复杂的任务。

4.3 工具文档的重要性，以及如何构建良好的工具？

工具文档对于确保智能体有效执行任务至关重要。良好的工具应该具备以下特性：

清晰的描述和参数：文档中应清楚列出工具的功能、可接受的输入格式以及输出结果。
使用示例和边界定义：提供实际的使用示例，并明确工具的限制，避免与其他工具产生冲突。
简洁易用的格式：文档格式应易于LLM生成，避免复杂的格式要求，并尽量匹配训练数据中的样式。

4.4 成功构建LLM智能体的核心原则是什么？

简洁性：智能体设计应保持简单，仅在必要时引入复杂性。
透明性：明确展示智能体的决策过程，让开发者和用户都能理解智能体的操作逻辑。
小心设计的接口：Agent-Computer Interface（ACI）需要经过精心设计和测试，以确保工具的高效使用和用户的良好体验。

5. 智能体在现实中的应用实例

通过与客户合作，我们发现智能体在以下两个领域展现了巨大潜力：

A. 客户支持

智能体在客户支持中的应用，结合了传统聊天机器人和强大的工具集成，能够处理多样化的客户需求，如：

智能体能根据客户的输入动态选择相关工具，如查询订单、更新工单或进行退款处理；
通过与外部数据库和知识库的结合，提供及时、准确的解决方案；
成功的客户支持互动通常可以通过客户定义的解决方案来衡量，确保智能体的有效性。

B. 编程智能体

在软件开发领域，智能体已从代码补全进化为自主问题解决系统。智能体能够根据GitHub上的Pull Request描述，自动分析并提出解决方案。例如：

编码问题通过自动化测试验证，确保解决方案的功能性；
反馈循环帮助智能体根据测试结果不断优化解决方案；
人工复核仍然是必要的，以确保智能体的解决方案符合整体系统要求。

编码智能体的大致流程

6. 总结

智能体在许多任务中提供了无与伦比的灵活性和高效性，尤其是在复杂、开放且多变的任务中。尽管智能体具有很大的潜力，但其局限性也不容忽视——尤其是在成本、延迟和错误控制方面。因此，创建有效的智能体需要精心设计、清晰的工具文档、以及透明的决策流程。随着技术的不断进步，智能体将在更多行业中发挥重要作用，我们期待它们在未来为各行各业带来更多创新和价值。

如何学习AI大模型？

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓

CSDN粉丝独家福利

这份完整版的 AI 大模型学习资料已经上传CSDN，朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】

读者福利： 👉👉CSDN大礼包：《最新AI大模型学习资源包》免费分享 👈👈

（👆👆👆安全链接，放心点击）

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

👉1.大模型入门学习思维导图👈

要学习一门新的技术，作为新手一定要先学习成长路线图，方向不对，努力白费。

对于从来没有接触过AI大模型的同学，我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线，大家跟着这个大的方向学习准没问题。（全套教程文末领取哈）
在这里插入图片描述

👉2.AGI大模型配套视频👈

很多朋友都不喜欢晦涩的文字，我也为大家准备了视频教程，每个章节都是当前板块的精华浓缩。

在这里插入图片描述

👉3.大模型实际应用报告合集👈

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。（全套教程文末领取哈）

在这里插入图片描述

👉4.大模型落地应用案例PPT👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。（全套教程文末领取哈）

在这里插入图片描述

👉5.大模型经典学习电子书👈

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。（全套教程文末领取哈）

在这里插入图片描述

👉6.大模型面试题&答案👈

截至目前大模型已经超过200个，在大模型纵横的时代，不仅大模型技术越来越卷，就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道，我总结了大模型常考的面试题。（全套教程文末领取哈）

在这里插入图片描述
👉学会后的收获：👈
• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习

CSDN粉丝独家福利

这份完整版的 AI 大模型学习资料已经上传CSDN，朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】

读者福利： 👉👉CSDN大礼包：《最新AI大模型学习资源包》免费分享 👈👈

（👆👆👆安全链接，放心点击）

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

Chess用户界面设计：Tailwind CSS样式系统和组件库

GitHub推荐项目精选中的ch/chess是一个类似chess.com的多人在线象棋平台，它采用现代化的前端技术栈构建，尤其在用户界面设计上通过Tailwind CSS样式系统和组件库实现了优雅且功能丰富的交互体验。本文将深入探讨该项目如何利用Tailwind CSS打造一致的设计语言和高效的组件系统，为象棋爱好者提供沉浸式的游戏界面。## 🎨 Tailwind CSS样式系统：构建统一视

火山引擎 ADG 社区

终极指南：GPT-Engineer如何通过AI自动发现代码问题并提升质量

GPT-Engineer是一款强大的AI驱动代码工具，它能帮助开发者自动检测潜在代码问题、优化代码质量，让编程效率提升3倍以上。无论是新手还是资深开发者，都能通过这款工具轻松发现代码中的隐藏缺陷，减少调试时间，释放更多精力在创造性工作上。## 一键发现代码问题：GPT-Engineer的AI审查魔力GPT-Engineer的核心能力在于其内置的智能代码分析系统。通过集成Python代码格式

火山引擎 ADG 社区

SatDump中的纠错编码技术：从RS码到Turbo码的完整实现指南

在卫星数据传输过程中，信号往往会受到各种干扰，导致数据错误。SatDump作为一款通用卫星数据处理软件，集成了多种先进的纠错编码技术，确保从卫星接收到的数据能够准确解码。本文将深入解析SatDump中从Reed-Solomon（RS）码到Turbo码的实现细节，帮助读者理解这些技术如何保障卫星通信的可靠性。## 为什么纠错编码对卫星数据至关重要？卫星与地面站之间的通信链路面临着空间辐射、大