
2月11日,有用户注意到DeepSeek正在进行灰度测试,新版模型可支持长达100万token的上下文处理能力,这一数字远超去年8月发布的V3.1版本所支持的128K上限。当用户向模型询问其身份及上下文处理能力时,系统明确回复:当前版本确实具备100万token的超长文本处理功能。同时,模型内置知识库已更新至2025年5月,这意味着即使在离线状态下,它也能准确生成涉及2025年4月新闻的相关内容。
目前该版本仍为纯文本模型,暂不支持图像等多模态输入,仅能处理文本及语音信息。根据此前披露的信息,新一代旗舰模型DeepSeek V4计划于2月中旬农历新年期间正式发布,将重点强化代码理解与生成能力。
