DeepSeek-OCR发布3B模型：高效压缩视觉文本的新方案_游乐游手机版

首页/科技数码/文章详情

DeepSeek-OCR发布3B模型：高效压缩视觉文本的新方案

时间：2025-12-06 14:45

10月20日，DeepSeek-AI团队发布题为DeepSeek-OCR：Contexts Optical Compression的研究论文，提出一种通过视觉模态实现长文本上下文压缩的新方法。该模型

DeepSeek-OCR发布：3B参数模型实现高效视觉文本压缩

10月20日，DeepSeek-AI团队正式发布了题为《DeepSeek-OCR：Contexts Optical Compression》的研究论文，创新性地提出了一种通过视觉模态对长文本上下文进行压缩的全新解决思路。目前，该模型已在Hugging Face平台面向公众开放，模型参数量为30亿级别。

该技术方案由两大核心模块构成：分别是作为核心编码器的DeepEncoder与解码器DeepSeek3B-MoE-A570M。其中，DeepEncoder专门针对高分辨率输入进行了优化设计，在维持较低计算激活量的同时，实现了高效的视觉信息压缩，从而将视觉token数量有效控制在合理范围内。实验数据显示，当文本token数量不超过视觉token的10倍时（即压缩比低于10倍），系统的OCR识别准确率可达97%；即使将压缩比提升至20倍，准确率仍能维持在约60%的水平，展现出在处理历史文档长上下文及支持大语言模型记忆机制研究方面的显著潜力，同时具有较强的实用价值。

在OmniDocBench基准测试中，DeepSeek-OCR仅使用100个视觉token就超越了GOT-OCR2.0（每页使用256个token）的表现；当视觉token使用量不超过800个时，其性能已优于MinerU2.0（平均每页消耗超过6000个token）。这一结果充分体现了该模型在信息密度和处理效率方面的突出优势。

在实际部署层面，该模型可在单张A100-40G显卡上稳定运行，每日可生成超过20万页的训练数据，适用于大规模视觉语言模型或大语言模型的数据生产流程，展现出良好的工程落地能力。

相关项目资源现已对外开放，用户可通过指定平台获取使用。

来源：https://ai.zol.com.cn/1066/10665991.html

上一篇捷达全网寻找3000万公里老友，共启温情新篇章 下一篇嫦娥六号揭秘月幔玄机：月球水或来自外星系陨石

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容，方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

谷歌升级Google Cloud机密计算产品

科技数码 · 2026-07-07

谷歌升级Google Cloud机密计算产品

IT之家 7 月 6 日消息，谷歌宣布对旗下 Google Cloud 机密计算（Confidential Computing）产品进行升级，新增基于英伟达 Blackwell GPU 的机密虚拟机、开源 AI 提示词加密工具 Prompt Encryption SDK，同步升级 Confident

谷歌要放大招? Gemini 3.5 Pro传7月17日发布，前端碾压Fable 5

科技数码 · 2026-07-07

谷歌要放大招? Gemini 3.5 Pro传7月17日发布，前端碾压Fable 5

谷歌在大模型竞赛中憋出一张重磅底牌。据泄露信息，Gemini 3 5 Pro将于7月17日正式发布，其前端与视觉代码生成能力据称出现跨越式跃升，在多项测试中压制Anthropic的Fable 5，但在硬核推理与复杂工程任务上仍落后于对手。这款姗姗来迟的旗舰模型背后，是一次更为彻底的技术重构。据科技媒

年电池续航最长的荣耀手机别错过

科技数码 · 2026-07-07

年电池续航最长的荣耀手机别错过

在挑选2026年电池续航最长的手机时，许多人关注的不仅仅是实验室测试中的几分钟优势，更看重一天高强度使用后还能剩下多少电量。按照这个标准来看，荣耀X80 Pro Max确实很有代表性，它将大容量电池与真实日常场景紧密结合，是该需求下非常值得优先考虑的一款机型。荣耀X80 Pro Max直接搭载了一块

年高性价比手机推荐同预算选机更看重长期体验

科技数码 · 2026-07-07

年高性价比手机推荐同预算选机更看重长期体验

在2026年性价比高的手机推荐榜单中，同价位机型往往更看重长期使用的综合体验。如果仅仅追求低价，很容易忽视续航、耐用性、屏幕素质与通信质量这些日常高频使用的核心维度。荣耀X80 Pro Max的主要竞争力，在于将11000mAh超大电池、军工级防护、万级亮度屏幕以及AI智能体验，全部集成到2000元

小米17系列销量超550万台 Ultra版约23.07万部

科技数码 · 2026-07-07

小米17系列销量超550万台 Ultra版约23.07万部

探讨小米17系列最新销量表现。据数码博主曝光的行业追踪数据，截至2026年第26周（即6月22日至6月28日），小米17系列全系累计销量已成功突破550万台大关。具体数据方面，系列总销量约为554 01万台。其中，定位顶配的小米17 Ultra贡献了约23 07万部。值得关注的是，面向中端市场的1