@pydantic-evals
Pydantic Evals 使用 Pydantic 模型的代码优先方法为 AI 代理和 LLM 输出提供严格的测试和评估。它支持“评估驱动开发”(EDD),其中评估套件与应用程序代码一起存在,并受版本控制和 CI/CD 的约束。
Pydantic Evals 使用 Pydantic 模型的代码优先方法为 AI 代理和 LLM 输出提供严格的测试和评估。它支持“评估驱动开发”(EDD),其中评估套件与应用程序代码一起存在,并受版本控制和 CI/CD 的约束。