多智能体深度强化学习算法-MADDPG-PettingZoo环境-01学习资料
PettingZoo 是一个简单的 pythonic接口,能够表示一般的多智能体强化学习MARL问题。- PettingZoo 包括各种参考环境、有用的实用程序和工具,用于创建您自己的自定义环境。所有agent共享critic网络---- PettingZoo 可以使用与。CTDE框架 MADDPG---支持基于顺序轮次的环境,而。类似的界面与环境进行交互。支持具有同步作的环境。确定性决策的MDP
多智能体深度强化学习算法对比
多智能体路径规划综述(万字长文解读)--2022-CSDN博客
一些经典案例
视频教程
多智能体强化学习 MADDPG 纯白板逐行代码Python实现_哔哩哔哩_bilibili
PettingZoo官网
- PettingZoo 是一个简单的 pythonic接口,能够表示一般的多智能体强化学习MARL问题。
- PettingZoo 包括各种参考环境、有用的实用程序和工具,用于创建您自己的自定义环境。
- AEC API 支持基于顺序轮次的环境,而并行 API 支持具有同步作的环境。
- PettingZoo 可以使用与 Gymnasium 类似的界面与环境进行交互。
文献
CTDE框架 MADDPG---[1706.02275] Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments
所有agent共享critic网络---[1705.08926] Counterfactual Multi-Agent Policy Gradients
确定性决策的MDP---Deterministic Policy Gradient Algorithms - Archive ouverte HAL
环境
python3.8
pip install pettingzoo
pip install "pettingzoo[butterfly]"
更多推荐

所有评论(0)