游乐游手机版
首页/科技数码/文章详情

DeepSeek开源OCR模型:少量视觉token高效压缩文本

时间:2025-12-06 16:39
10 月 20 日消息,今天上午,DeepSeek-AI 团队发布《DeepSeek-OCR:Contexts Optical Compression》论文,提出利用视觉模态压缩长文本上下文的新方

10月20日上午,DeepSeek-AI 团队发布最新研究成果《DeepSeek-OCR:Contexts Optical Compression》技术论文,提出了一种利用视觉模态压缩长文本上下文的全新方法。Hugging Face 平台信息显示,这一创新模型的参数量为 30亿。

DeepSeek 团队开源新模型 DeepSeek-OCR:少量视觉 token 完成海量文本压缩

根据技术文档介绍,此次开源的 DeepSeek-OCR 系统由两大核心模块构成:专为视觉编码设计的 DeepEncoder 与基于混合专家架构的解码器 DeepSeek3B-MoE-A570M。其中,DeepEncoder 针对高分辨率输入场景进行了专门优化,既能有效降低计算复杂度,又能实现极高的压缩比率,从而将视觉 token 数量控制在可控范围内。实验数据表明,当文本 token 数量不超过视觉 token 10倍时,模型的 OCR 识别准确率可达到惊人的 97%;即便将压缩比提升至 20倍,其准确率依然保持在 60% 左右。这一表现充分证明了该方法在历史文档长上下文压缩与大语言模型记忆机制研究领域的巨大潜力。DeepSeek-OCR 在实用性与部署效率方面展现出显著优势。

在权威评测基准 OmniDocBench 的测试中,DeepSeek-OCR 仅使用 100 个视觉 token 就超越了 GOT-OCR2.0(每页需 256 个 token)的表现,而不到 800 个视觉 token 的输入就优于 MinerU2.0(平均每页超过 6000 个 token)的处理效果。

在实际生产环境中,DeepSeek-OCR 仅需单张 A100-40G 显卡即可实现每日超过 20 万页的大语言模型/视觉语言模型训练数据处理能力。

DeepSeek 团队开源新模型 DeepSeek-OCR:少量视觉 token 完成海量文本压缩

DeepSeek 团队开源新模型 DeepSeek-OCR:少量视觉 token 完成海量文本压缩

项目相关资源链接如下:

GitHub:https://github.com/deepseek-ai/DeepSeek-OCR

Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-OCR

来源:https://www.ithome.com/0/890/839.htm
上一篇熊本研发设施竣工 台积电1纳米芯片设备投入先进制程 下一篇美光高管Sadana:2026年DRAM内存供应或趋紧
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。