强化学习库比较

强化学习库比较#

在本节中,我们将提供Isaac Lab支持的强化学习库的概述,以及对各个库的性能基准测试。

支持的库有:

特性比较#

特性

RL-Games

RSL RL

SKRL

Stable Baselines3

算法包含

PPO, SAC, A2C

PPO

详细列表

扩展列表

矢量化训练

分布式训练

ML 框架支持

PyTorch

PyTorch

PyTorch, JAX

PyTorch

多智能体支持

PPO

PPO

PPO + Multi-Agent 算法

外部项目支持

文档

全面

广泛

社区支持

小型社区

小型社区

小型社区

大型社区

在 Isaac 实验室中的可用示例

训练性能#

我们在同一个 Isaac-Humanoid-v0 环境下,使用单个RTX 4090 GPU和 --headless 进行了每个RL库的训练,并记录了每个RL库在65.5M步的总训练时间。

RL 库

时间(秒)

RL-Games

216

RSL RL

215

SKRL

321

table-Baselines3

6320