🤖
AI & 大模型

模型微调

@model_finetuning

TRL 提供了使语言模型与人类偏好保持一致的训练后方法。

包含技能

1 个
🤖
模型微调
@vuralserhat86/antigravity-agentic-skills/model_finetuning

TRL 提供了使语言模型与人类偏好保持一致的训练后方法。

🚀 如何安装技能包 请下载安装 AiOffice 客户端,
如果已下载AiOffice,
请在 AiOffice 的技能广场页面进行一键安装。