📚
文档 & 知识

史莱姆 Rl 训练

@slime-rl-training

slime 是清华大学 THUDM 团队的 LLM 后培训框架,为 GLM-4.5、GLM-4.6 和 GLM-4.7 提供支持。它将 Megatron-LM 与 SGLang 连接起来进行训练,以实现高吞吐量的部署生成。

包含技能

1 个
📚
史莱姆 Rl 训练
@zechenzhangagi/ai-research-skills/slime-rl-training

slime 是清华大学 THUDM 团队的 LLM 后培训框架,为 GLM-4.5、GLM-4.6 和 GLM-4.7 提供支持。它将 Megatron-LM 与 SGLang 连接起来进行训练,以实现高吞吐量的部署生成。

🚀 如何安装技能包 请下载安装 AiOffice 客户端,
如果已下载AiOffice,
请在 AiOffice 的技能广场页面进行一键安装。