📚

文档 & 知识

史莱姆 Rl 训练

@slime-rl-training

slime 是清华大学 THUDM 团队的 LLM 后培训框架，为 GLM-4.5、GLM-4.6 和 GLM-4.7 提供支持。它将 Megatron-LM 与 SGLang 连接起来进行训练，以实现高吞吐量的部署生成。

包含技能

1 个

📚

史莱姆 Rl 训练

@zechenzhangagi/ai-research-skills/slime-rl-training

slime 是清华大学 THUDM 团队的 LLM 后培训框架，为 GLM-4.5、GLM-4.6 和 GLM-4.7 提供支持。它将 Megatron-LM 与 SGLang 连接起来进行训练，以实现高吞吐量的部署生成。

安装