📚
文档 & 知识

评估代码模型

@evaluating-code-models

BigCode 评估工具可跨 15 多个基准评估代码生成模型,包括 HumanEval、MBPP 和 MultiPL-E(18 种语言)。

包含技能

1 个
📚
评估代码模型
@zechenzhangagi/ai-research-skills/evaluating-code-models

BigCode 评估工具可跨 15 多个基准评估代码生成模型,包括 HumanEval、MBPP 和 MultiPL-E(18 种语言)。

🚀 如何安装技能包 请下载安装 AiOffice 客户端,
如果已下载AiOffice,
请在 AiOffice 的技能广场页面进行一键安装。