🤖
AI & 大模型

评估安全带

@eval-harness

评估驱动开发 (EDD) 是一种在实施之前或实施同时定义评估的方法,确保成功标准从一开始就是明确的、可衡量的和可测试的。

包含技能

1 个
🤖
评估安全带
@mhylle/claude-skills-collection/eval-harness

评估驱动开发 (EDD) 是一种在实施之前或实施同时定义评估的方法,确保成功标准从一开始就是明确的、可衡量的和可测试的。

🚀 如何安装技能包 请下载安装 AiOffice 客户端,
如果已下载AiOffice,
请在 AiOffice 的技能广场页面进行一键安装。