📚
文档 & 知识

辛波培训

@simpo-training

SimPO 是一种无参考偏好优化方法,无需参考模型即可优于 DPO。

包含技能

1 个
📚
辛波培训
@zechenzhangagi/ai-research-skills/simpo-training

SimPO 是一种无参考偏好优化方法,无需参考模型即可优于 DPO。

🚀 如何安装技能包 请下载安装 AiOffice 客户端,
如果已下载AiOffice,
请在 AiOffice 的技能广场页面进行一键安装。