5个关键步骤,打造高效Agent:2024年Anthropic最佳实践
在LLM(大型语言模型)驱动的系统中,工作流和智能体是两个重要的概念,但它们有显著的不同。工作流是指在预定义代码路径中,LLM和工具按照固定顺序进行协调。这意味着任务的每个步骤都已经事先设定,LLM按照这些步骤执行任务。工作流适用于那些步骤已知且任务明确的场景。智能体则是指LLM在执行过程中,根据当前的情况和进展动态决定如何使用工具,并根据实际需求作出调整。这种方式适用于那些任务路径不可预知、复杂
在人工智能(AI)技术迅速发展的今天,智能体(Agent)已成为推动社会变革的重要力量。随着2024年末Anthropic公司发布的《Building effective agents》一文总结了开发智能体的最佳实践,许多业界领袖,如吴恩达等,都认为智能体将是AI赋能社会的最大机会之一。那么,如何创建有效的智能体(Agent)呢?本文将通过提问和解答的方式,带您深入理解智能体的创建、应用和未来潜力。
1. 什么是工作流(Workflow)与智能体(Agent)的区别?
在LLM(大型语言模型)驱动的系统中,工作流和智能体是两个重要的概念,但它们有显著的不同。
-
工作流是指在预定义代码路径中,LLM和工具按照固定顺序进行协调。这意味着任务的每个步骤都已经事先设定,LLM按照这些步骤执行任务。工作流适用于那些步骤已知且任务明确的场景。
-
智能体则是指LLM在执行过程中,根据当前的情况和进展动态决定如何使用工具,并根据实际需求作出调整。这种方式适用于那些任务路径不可预知、复杂且动态变化的场景。简单来说,智能体具备自主决策能力,可以根据实际情况选择工具和任务步骤。
工作流 vs. 智能体
|
特点
|
工作流
|
智能体
|
| — | — | — |
|
任务的可预测性
|
任务步骤已知,路径固定
|
任务步骤不可预见,路径动态调整
|
|
执行方式
|
固定步骤,LLM按顺序执行
|
动态决策,LLM根据情况选择工具和步骤
|
|
适用场景
|
任务明确,步骤固定
|
任务复杂或开放,需要动态决策
|

自主的智能体
2. 何时使用智能体系统(工作流或智能体),何时使用更简单的LLM实现?
选择工作流或智能体系统,需要考虑任务的复杂性、可预测性以及所需的灵活性:
-
使用工作流:当任务步骤明确、可预测时,工作流能够提供高效和一致的执行。工作流通过将任务拆分成多个子任务,降低了复杂度,确保高精度的同时,也提高了任务执行的可控性。
-
使用智能体:当任务复杂、开放且路径不可预测时,智能体系统能够灵活地做出决策,选择适当的工具和执行步骤。尽管智能体的灵活性带来了较高的延迟和潜在错误,但它适用于那些需要不断调整和决策的任务。
-
简单LLM实现:如果任务简单且不需要复杂的工具或多步决策,使用单一的LLM模型足以完成。例如,单纯的文本生成、情感分析等任务。
建议:始终从最简单的解决方案开始,优化单个LLM调用。只有当任务复杂到无法用简单方法解决时,再考虑使用智能体或工作流系统。
3. LLM工作流的常见模式
在实际开发中,LLM工作流常见的模式包括:
-
提示链(Prompt Chaining):将任务拆解成多个步骤,每一步使用LLM处理前一步的输出,并加入中间检查。适用于可以分解为固定子任务的场景。例子:将营销文案翻译成多种语言。

-
路由(Routing):根据输入分类,将任务指派给不同的子任务。适用于任务分类明确且需要不同处理方式的场景。例子:客户支持的不同路径,如退货问题与技术问题。

-
并行化(Parallelization):同时处理多个子任务,最终汇总结果。适用于任务可以并行处理的场景。例子:独立检查不当内容与处理用户查询,或让多个审核员并行评审代码漏洞。

-
协调者-工人模式(Orchestrator-Workers):一个中心LLM负责将任务拆解并分派给多个子任务,再汇总结果。适用于复杂任务,任务步骤不可预见。例子:编码智能体在多个文件中做出复杂修改。

-
评估-优化模式(Evaluator-Optimizer):一个LLM生成响应,另一个LLM进行评估并提供反馈,进行迭代优化。适用于有明确评估标准并且需要迭代改进的任务。例子:文学翻译或复杂搜索任务。

4. 智能体的有效性与局限性
4.1 智能体在何时最有效,局限性又是什么?
智能体最有效的场景包括:
-
开放性问题:当任务的步骤不可预见时,智能体能够自主选择执行路径和工具。尤其是需要与用户进行对话并做出实时响应的任务,如客户支持。
-
任务多变:任务的复杂性和变化要求智能体根据上下文做出灵活决策。例如,编程智能体需要根据不同的代码库情况做出相应的修复。
然而,智能体的局限性包括:
-
更高的成本和延迟:由于其动态决策的性质,智能体通常需要更多的计算资源,并可能导致较长的响应时间。
-
潜在的错误积累:智能体在执行过程中可能会遇到错误,并且错误可能会在多个步骤中积累,导致最终结果的偏差。
-
高需求的信任度:由于智能体的自主决策过程,开发者需要对其决策过程高度信任。
4.2 创建智能体系统的关键构建模块是什么?
智能体系统的核心构建模块是增强型LLM。增强型LLM通过集成信息检索、工具使用(如API调用)和记忆(记录历史互动)等功能,使LLM能够执行比简单文本生成更复杂的任务。
4.3 工具文档的重要性,以及如何构建良好的工具?
工具文档对于确保智能体有效执行任务至关重要。良好的工具应该具备以下特性:
-
清晰的描述和参数:文档中应清楚列出工具的功能、可接受的输入格式以及输出结果。
-
使用示例和边界定义:提供实际的使用示例,并明确工具的限制,避免与其他工具产生冲突。
-
简洁易用的格式:文档格式应易于LLM生成,避免复杂的格式要求,并尽量匹配训练数据中的样式。
4.4 成功构建LLM智能体的核心原则是什么?
-
简洁性:智能体设计应保持简单,仅在必要时引入复杂性。
-
透明性:明确展示智能体的决策过程,让开发者和用户都能理解智能体的操作逻辑。
-
小心设计的接口:Agent-Computer Interface(ACI)需要经过精心设计和测试,以确保工具的高效使用和用户的良好体验。
5. 智能体在现实中的应用实例
通过与客户合作,我们发现智能体在以下两个领域展现了巨大潜力:
A. 客户支持
智能体在客户支持中的应用,结合了传统聊天机器人和强大的工具集成,能够处理多样化的客户需求,如:
-
智能体能根据客户的输入动态选择相关工具,如查询订单、更新工单或进行退款处理;
-
通过与外部数据库和知识库的结合,提供及时、准确的解决方案;
-
成功的客户支持互动通常可以通过客户定义的解决方案来衡量,确保智能体的有效性。
B. 编程智能体
在软件开发领域,智能体已从代码补全进化为自主问题解决系统。智能体能够根据GitHub上的Pull Request描述,自动分析并提出解决方案。例如:
-
编码问题通过自动化测试验证,确保解决方案的功能性;
-
反馈循环帮助智能体根据测试结果不断优化解决方案;
-
人工复核仍然是必要的,以确保智能体的解决方案符合整体系统要求。

编码智能体的大致流程
6. 总结
智能体在许多任务中提供了无与伦比的灵活性和高效性,尤其是在复杂、开放且多变的任务中。尽管智能体具有很大的潜力,但其局限性也不容忽视——尤其是在成本、延迟和错误控制方面。因此,创建有效的智能体需要精心设计、清晰的工具文档、以及透明的决策流程。随着技术的不断进步,智能体将在更多行业中发挥重要作用,我们期待它们在未来为各行各业带来更多创新和价值。
如何学习AI大模型 ?
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓
CSDN粉丝独家福利
这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】
读者福利: 👉👉CSDN大礼包:《最新AI大模型学习资源包》免费分享 👈👈
对于0基础小白入门:
如果你是零基础小白,想快速入门大模型是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。
👉1.大模型入门学习思维导图👈
要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。
对于从来没有接触过AI大模型的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。(全套教程文末领取哈)
👉2.AGI大模型配套视频👈
很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,每个章节都是当前板块的精华浓缩。


👉3.大模型实际应用报告合集👈
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(全套教程文末领取哈)

👉4.大模型落地应用案例PPT👈
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。(全套教程文末领取哈)

👉5.大模型经典学习电子书👈
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。(全套教程文末领取哈)

👉6.大模型面试题&答案👈
截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道,我总结了大模型常考的面试题。(全套教程文末领取哈)

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习
CSDN粉丝独家福利
这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】
读者福利: 👉👉CSDN大礼包:《最新AI大模型学习资源包》免费分享 👈👈
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)