多智能体深度强化学习算法对比

多智能体路径规划综述(万字长文解读)--2022-CSDN博客

一些经典案例

多智能体强化学习 |带代码的论文

视频教程

多智能体强化学习 MADDPG 纯白板逐行代码Python实现_哔哩哔哩_bilibili

PettingZoo官网

PettingZoo 文档

- PettingZoo 是一个简单的 pythonic接口,能够表示一般的多智能体强化学习MARL问题。

- PettingZoo 包括各种参考环境、有用的实用程序和工具,用于创建您自己的自定义环境。

- AEC API 支持基于顺序轮次的环境,而并行 API 支持具有同步作的环境。

- PettingZoo 可以使用与 Gymnasium 类似的界面与环境进行交互。

文献

CTDE框架 MADDPG---[1706.02275] Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments

所有agent共享critic网络---[1705.08926] Counterfactual Multi-Agent Policy Gradients

确定性决策的MDP---Deterministic Policy Gradient Algorithms - Archive ouverte HAL

环境

python3.8

pip install pettingzoo
pip install "pettingzoo[butterfly]"

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐