@pufferlib
PufferLib 是一个高性能强化学习库,专为快速并行环境模拟和训练而设计。它通过优化的矢量化、本机多代理支持和高效的 PPO 实现 (PuffeRL) 实现每秒数百万步的训练。该库提供了包含 20 多个环境的 Ocean 套件,并与 Gymnasium、PettingZoo 和专门的 RL 框架无缝集成。
PufferLib 是一个高性能强化学习库,专为快速并行环境模拟和训练而设计。它通过优化的矢量化、本机多代理支持和高效的 PPO 实现 (PuffeRL) 实现每秒数百万步的训练。该库提供了包含 20 多个环境的 Ocean 套件,并与 Gymnasium、PettingZoo 和专门的 RL 框架无缝集成。