输入一个热词,快速查看术语含义、常见场景和相关概念。
集中展示常见热词解释,方便按概念和场景继续浏览。
GSM8K是一个包含8000道小学数学题的基准数据集,用于测试AI模型(尤其是大语言模型)的多步数学推理能力,已成为衡量模型逻辑性能的重要标尺。
近期常被查询的 AI 概念。