🤖
AI & 大模型

评估 Llms 工具

@evaluating-llms-harness

lm-evaluation-harness 使用标准化提示和指标跨 60 多个学术基准评估法学硕士。

包含技能

1 个
🤖
评估 Llms 工具
@zechenzhangagi/ai-research-skills/evaluating-llms-harness

lm-evaluation-harness 使用标准化提示和指标跨 60 多个学术基准评估法学硕士。

🚀 如何安装技能包 请下载安装 AiOffice 客户端,
如果已下载AiOffice,
请在 AiOffice 的技能广场页面进行一键安装。