游乐游手机版

AI 热词解释

首页/AI热词解释/热词详情

长上下文:让AI一次读懂整本书的突破性技术

类型:技术概念2026-06-01
长上下文(Long Context)是指大语言模型能够一次性处理的文本长度上限。过去模型只能记住几千字,现在主流模型已支持数十万甚至百万token,让AI可以同时分析整部小说、完整代码库或长篇对话,大幅提升复杂任务的处理能力。

本次查询:长上下文

中文解释:长上下文

常见场景:当需要AI阅读长篇文档 / 进行多轮对话或分析大规模代码时 / 长上下文技术让模型无需外部检索就能保持全局理解。

一句话解释

长上下文是大语言模型能一次性‘看到’和理解的文本总长度,单位通常是token(约0.75个汉字)。比如支持100万token的模型,可以一口气读完《三体》三部曲。

为什么会被关注

过去模型上下文有限,处理长文档时必须将文本切碎,导致信息碎片化、丧失全局连贯性。企业需要AI分析合同、论文或代码库时,长上下文直接提升准确性和便利性。

2024年主流模型纷纷将上下文窗口从8k扩展到128k、1M甚至10M token,直接推动了AI助手的应用场景从简单问答进化到深度文档分析。

核心逻辑

长上下文的核心挑战在于注意力机制的二次方复杂度——每增加一个token,计算量呈平方增长。当前解决方案包括稀疏注意力(只关注关键位置)、旋转位置编码(RoPE)、以及FlashAttention等显存优化技术。

此外,模型通过位置编码的插值或扩展来使原有架构适应更长序列,同时保持对远距离依赖关系的建模能力,避免‘迷失在长文本中’的问题。

常见场景

法律与合规:AI一次性审阅数百页合同,找出冲突条款。软件开发:将整个代码仓库作为上下文,让AI理解项目全貌并精准修复bug。学术研究:分析长篇论文、技术白皮书或医学文献,辅助综述撰写。

多轮对话:客服机器人可记住整段对话历史(上千条消息),无需用户重复背景信息。媒体与出版:对整本小说进行风格分析、角色关系梳理或内容摘要生成。

容易混淆的点

不要把‘上下文窗口大小’等同于‘模型知识量’。长上下文只是模型能处理的输入长度,并非永恒记忆,每次对话独立,关闭后即丢失。

也不是越长越好。超长上下文可能导致模型‘淹没’在无关信息中,目前需要结合检索增强(RAG)或滑动窗口来精准定位关键内容。此外,支持长上下文的模型推理成本更高、速度更慢。

来源:AI 热词解释频道整理
上一篇Router Loss:网络延迟与AI智能运维的核心指标 下一篇百万Token上下文是什么?一篇文章看懂长文本处理新突破

相关热词

继续查看关联概念解释。

最新热词

最近新增和整理过的热词内容。