输入一个热词,快速查看术语含义、常见场景和相关概念。
集中展示常见热词解释,方便按概念和场景继续浏览。
MBPP 是评估 AI 代码生成能力的经典数据集之一,包含约 974 道 Python 编程任务,覆盖字符串操作、数学计算、列表处理等基础场景。它和 HumanEval 并称为大模型编程能力的「标尺」。
近期常被查询的 AI 概念。