📚
文档 & 知识

使用 Trl 进行微调

@fine-tuning-with-trl

TRL 提供了使语言模型与人类偏好保持一致的训练后方法。

包含技能

1 个
📚
使用 Trl 进行微调
@zechenzhangagi/ai-research-skills/fine-tuning-with-trl

TRL 提供了使语言模型与人类偏好保持一致的训练后方法。

🚀 如何安装技能包 请下载安装 AiOffice 客户端,
如果已下载AiOffice,
请在 AiOffice 的技能广场页面进行一键安装。