强化学习库比较

强化学习库比较#

在本节中,我们将提供Isaac Lab支持的强化学习库的概述,以及对各个库的性能基准测试。

支持的库有:

特性比较#

特性

RL-Games

RSL RL

SKRL

Stable Baselines3

算法包含

PPO, SAC, A2C

PPO, Distillation

详细列表

扩展列表

矢量化训练

分布式训练

ML 框架支持

PyTorch

PyTorch

PyTorch, JAX

PyTorch

多智能体支持

PPO

PPO

PPO + Multi-Agent 算法

外部项目支持

文档

全面

广泛

社区支持

小型社区

小型社区

小型社区

大型社区

在 Isaac 实验室中的可用示例

训练性能#

我们使用每个RL库在相同的 Isaac-Humanoid-v0 环境中进行了训练,在单个RTX PRO 6000 GPU上使用4096个环境并启用 --headless 模式,记录了每个RL库完成65.5M步训练的总时间。

RL 库

时间(秒)

RL-Games

207

SKRL

208

RSL RL

199

table-Baselines3

322