🤖
AI & 大模型

训练 Llms 威震天

@training-llms-megatron

Megatron-Core 通过先进的并行策略在 H100 GPU 上训练从 2B 到 462B 参数的 LLM,模型 FLOP 利用率高达 47%。

包含技能

1 个
🤖
训练 Llms 威震天
@zechenzhangagi/ai-research-skills/training-llms-megatron

Megatron-Core 通过先进的并行策略在 H100 GPU 上训练从 2B 到 462B 参数的 LLM,模型 FLOP 利用率高达 47%。

🚀 如何安装技能包 请下载安装 AiOffice 客户端,
如果已下载AiOffice,
请在 AiOffice 的技能广场页面进行一键安装。