AI热词解释列表页

首页/AI热词解释

AI 热词解释

输入一个热词，快速查看术语含义、常见场景和相关概念。

工具入口

大语言模型大模型 RAG 智能体扩散模型 AIGC 代码生成向量数据库

热词列表

集中展示常见热词解释，方便按概念和场景继续浏览。

热词解释 · 2026-06-02

MATH Benchmark：大模型数学推理能力试金石

MATH Benchmark是当前评估大语言模型数学推理能力的主流基准之一，包含5000道从初中到竞赛难度的数学题，覆盖代数、几何、数论、概率等7个领域。它比传统问答更难，要求模型展示完整推导过程而非仅猜答案，已成为衡量模型“高级推理”水平的标尺。

热门热词

近期常被查询的 AI 概念。