📦

通用工具

强化学习

@reinforcement-learning

该技能为使用现代生态系统（2024-2025）在 Python 中实施强化学习提供了全面的指导。 Gymnasium 已取代 OpenAI Gym 成为标准环境接口。建议使用 Stable-Baselines3 (SB3) 进行原型设计，使用 RLlib 进行生产/分布式训练，使用 CleanRL 进行研究。

包含技能

1 个

📦

强化学习

@aznatkoiny/zai-skills/reinforcement-learning

该技能为使用现代生态系统（2024-2025）在 Python 中实施强化学习提供了全面的指导。 Gymnasium 已取代 OpenAI Gym 成为标准环境接口。建议使用 Stable-Baselines3 (SB3) 进行原型设计，使用 RLlib 进行生产/分布式训练，使用 CleanRL 进行研究。

安装