输入一个热词,快速查看术语含义、常见场景和相关概念。
集中展示常见热词解释,方便按概念和场景继续浏览。
LongBench 是一个专门用于评估大语言模型在长上下文场景下表现的多任务评测基准,涵盖单文档问答、多文档摘要、长文本生成等任务,帮助研究者客观比较模型对长序列信息的理解与利用能力。
近期常被查询的 AI 概念。