🤖

AI & 大模型

模型微调

@model_finetuning

TRL 提供了使语言模型与人类偏好保持一致的训练后方法。

包含技能

1 个

🤖

模型微调

@vuralserhat86/antigravity-agentic-skills/model_finetuning

TRL 提供了使语言模型与人类偏好保持一致的训练后方法。

安装