目录

一、整体说明

二、具体解读

1、作者

2、问题介绍

3、概念

(1)智能体

(2)问题

4、方法

​编辑(1)类型

(2)策略

(3)通讯

(4)编排

(5)小结

5、应用

6、问题

(1)发展

(2)综合评估和基准测试

(3)安全

三、总结


一、整体说明

这是一篇关于MAS设计的综述。

二、具体解读

1、作者

2、问题介绍

现有的LLM在一些方面能力很强,但是存在内在限制如幻觉、自回归性质、scaling law。一个方法是将LLM引入MAS。MAS有很大的好处在于,可以分布式部署Agent,然后汇总所有Agent的结果,从而获得更好的结果。

目前已有的研究过于浅显,主要在于:

- 仅涉及表明上的协同。

- 没有具体设计架构。

- 协同过于单一,没有从通用的角度解决问题。

3、概念

(1)智能体

一般化的定义,agent由其架构、记忆、适配器构成,LLM-based Agent的架构是LLM,记忆本文中指的是systemt prompt,适配器是LLM的增强工具。Agent的目标是,基于环境,根据输入,最小化输出和真实答案的差距。LLM-based Agent,这里的环境是context,输入输出都是文本。

在MAS中,区别在于,目标可以存在总的目标,也存在分配的目标。环境存在共享的,也有私有的。另外最重要的一点,就是agent之间需要基于这些进行交互。

(2)问题

委派任务到具体的Agent,定义协同的方法,给出最终的决策。

4、方法

(1)类型

- 合作。每个agent被分配的目标是一致方向的。

- 竞争。Agent的目标是对立或有冲突的,但是竞争的发展方向是一致的。类似一般deep learning中的对比学习。

- 竞合。较新的概念,合作和竞争的结合。类似LLM中的MoE架构。

(2)策略

- 基于规则。预定义规则,限制Agent的输出。提供效率,可预测。但是缺乏适用性,任务复杂或变动需要额外添加规则集。

- 基于角色。指定Agent的功能和任务,模仿人类。模块化、可复用,但是需要明确的角色设定。

- 基于模型。感知环境,引入不确定性,使用概率模型进行分析。可以在复杂和部分可观测的环境中,基于信念优化策略。但是会有更高的计算成本。

(3)通讯

- 集中式。星状结构。参与-服务。结构类似联邦学习,可以考虑联邦学习中的部分方法。

- 分散式。去中心化。使用动态有向无环图是有效的,最佳通讯结构应该是随具体任务变化的。

- 层次。分层架构,agent交互在层内以及相邻交互。网络可以是动态的,设置额外的agent对于网络结构进行动态优化。

(4)编排

- 静态架构。依靠特定领域知识和预定义规则构建。

- 动态架构。适应变化和演变的环境。动态分配角色,设定任务节点。

(5)小结

MAS是来源于其他领域的一般方法,MAS有很好的效果,但是一直有个问题是,原本的LLM是单独训练的,没有专门对MAS进行训练。

有效的MAS设计会超过单独的Agent,而不合理的设计会不如强大的prompt。现在的一个趋势是,动态的通讯和网络会优于静态的设计,同时引入信念设置会使得MAS更适用于不确定的复杂环境。

5、应用

- 5G/B6G和工业5.0。可以设计多模态的模块。

- 问答/自然语言生成。可以构建Agent-as-a-Judge。可以用Agent生成数据。

- 社会和文化。增强传统社会计算的方法,但是不是完美的通用解决方案。

6、问题

(1)发展

- 统一治理。需要考虑整体效率。需要考虑故障和恢复,即弹性和可靠性。

- 共同决策。连贯和准确的集体决策。

- 数字物种。LLM不是为协作设计的,需要设计额外的机制。

- 可扩展性和资源维护。管理的困难。

- 泛化。从系统中提取集体智能。

(2)综合评估和基准测试

很多评估是基于单独LLM的,需要额外的用于评估Agent尤其是MAS的方法。

(3)安全

LLM的幻觉有害,具体源于过度自信和误解。LLM也存在欺骗人类的现象。

三、总结

我觉得这可能不是一篇很好的论文。在已经掌握了LLM-based Agent大部分知识之后,这篇论文几乎没有新的东西。论文水话有点多,多个章节似乎也没有经过统一协调,可能是每个作者就只写自己的一部分,因而存在重复和套话。一些具体的内容,对于ai研究者也不是那么在乎。部分内容也不足够新和足够正确(例如,agent框架竟然没有提到langgraph,评测基准没有具体说明)。

论文有效的地方,就是用数学公式表明了一般的MAS的研究方法,用目标的角度思考架构设计。论文大部分内容都在几张表中可以体现。

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐