强化学习库比较#
在本节中,我们将提供Isaac Lab支持的强化学习库的概述,以及对各个库的性能基准测试。
支持的库有:
特性比较#
训练性能#
我们使用每个RL库在相同的 Isaac-Humanoid-v0
环境中进行了训练,在单个RTX PRO 6000 GPU上使用4096个环境并启用 --headless
模式,记录了每个RL库完成65.5M步训练的总时间。
RL 库 |
时间(秒) |
---|---|
RL-Games |
207 |
SKRL |
208 |
RSL RL |
199 |
table-Baselines3 |
322 |