🤖
AI & 大模型

法官法学硕士

@llm-as-a-judge

构建可靠的自动评估器,使用 LLM 来判断另一个 LLM 管道的输出。每个判断的目标都是在错误分析过程中识别出的单一二元(通过/失败)故障模式。

包含技能

1 个
🤖
法官法学硕士
@maragudk/evals-skills/llm-as-a-judge

构建可靠的自动评估器,使用 LLM 来判断另一个 LLM 管道的输出。每个判断的目标都是在错误分析过程中识别出的单一二元(通过/失败)故障模式。

🚀 如何安装技能包 请下载安装 AiOffice 客户端,
如果已下载AiOffice,
请在 AiOffice 的技能广场页面进行一键安装。