@hugging-face-model-trainer
在完全托管的 Hugging Face 基础设施上使用 TRL(变压器强化学习)训练语言模型。无需本地 GPU 设置 - 模型在云 GPU 上进行训练,结果会自动保存到 Hugging Face Hub。