游乐游手机版
首页/科技数码/文章详情

DeepSeek开源OCR模型:少量视觉token高效压缩文本

时间:2025-12-06 16:39
10 月 20 日消息,今天上午,DeepSeek-AI 团队发布《DeepSeek-OCR:Contexts Optical Compression》论文,提出利用视觉模态压缩长文本上下文的新方

10月20日上午,DeepSeek-AI 团队发布最新研究成果《DeepSeek-OCR:Contexts Optical Compression》技术论文,提出了一种利用视觉模态压缩长文本上下文的全新方法。Hugging Face 平台信息显示,这一创新模型的参数量为 30亿。

DeepSeek 团队开源新模型 DeepSeek-OCR:少量视觉 token 完成海量文本压缩

根据技术文档介绍,此次开源的 DeepSeek-OCR 系统由两大核心模块构成:专为视觉编码设计的 DeepEncoder 与基于混合专家架构的解码器 DeepSeek3B-MoE-A570M。其中,DeepEncoder 针对高分辨率输入场景进行了专门优化,既能有效降低计算复杂度,又能实现极高的压缩比率,从而将视觉 token 数量控制在可控范围内。实验数据表明,当文本 token 数量不超过视觉 token 10倍时,模型的 OCR 识别准确率可达到惊人的 97%;即便将压缩比提升至 20倍,其准确率依然保持在 60% 左右。这一表现充分证明了该方法在历史文档长上下文压缩与大语言模型记忆机制研究领域的巨大潜力。DeepSeek-OCR 在实用性与部署效率方面展现出显著优势。

在权威评测基准 OmniDocBench 的测试中,DeepSeek-OCR 仅使用 100 个视觉 token 就超越了 GOT-OCR2.0(每页需 256 个 token)的表现,而不到 800 个视觉 token 的输入就优于 MinerU2.0(平均每页超过 6000 个 token)的处理效果。

在实际生产环境中,DeepSeek-OCR 仅需单张 A100-40G 显卡即可实现每日超过 20 万页的大语言模型/视觉语言模型训练数据处理能力。

DeepSeek 团队开源新模型 DeepSeek-OCR:少量视觉 token 完成海量文本压缩

DeepSeek 团队开源新模型 DeepSeek-OCR:少量视觉 token 完成海量文本压缩

项目相关资源链接如下:

GitHub:https://github.com/deepseek-ai/DeepSeek-OCR

Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-OCR

来源:https://www.ithome.com/0/890/839.htm
上一篇熊本研发设施竣工 台积电1纳米芯片设备投入先进制程 下一篇美光高管Sadana:2026年DRAM内存供应或趋紧
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
宫本茂亲签3DS XL拍卖价破两万美元
科技数码 · 2026-05-29

宫本茂亲签3DS XL拍卖价破两万美元

今天来说一件挺有意思的事:2015年任天堂世界锦标赛冠军约翰·戈德堡,近日将他当年夺冠时赢得的宫本茂亲笔签名版3DS XL掌机放上了拍卖平台。截至2026年5月29日,这台签名掌机的竞拍价已突破两万美元,并且价格还在持续攀升。戈德堡在社交媒体上发布声明表示,经过相当长时间的慎重考虑,他决定将这台对自

七彩虹隐星P16 Pro游戏本新配置仅售7799元
科技数码 · 2026-05-29

七彩虹隐星P16 Pro游戏本新配置仅售7799元

七彩虹近期推出隐星P16Pro游戏本新配置,售价7799元。其搭载酷睿i9-13900HX处理器与RTX5060显卡,配备16英寸2 5K高刷电竞屏及高效散热系统。存储组合为16GB内存与1TB固态硬盘,支持后续扩展。该配置主打高性能性价比,适合预算有限但追求强劲性能的游戏玩家与轻度创作者。

苹果iPhone Hikawa握把支架448元重新上架
科技数码 · 2026-05-29

苹果iPhone Hikawa握把支架448元重新上架

苹果公司重新上架了与艺术家贝利·桧川及PopSockets合作设计的iPhone专用握把支架。该配件采用磁吸设计,兼具握持与支架功能,旨在通过人性化设计降低握持负担,并提供三种配色可选,售价448元。

苹果体育应用扩展至170市场 为2026世界杯引入对阵图
科技数码 · 2026-05-29

苹果体育应用扩展至170市场 为2026世界杯引入对阵图

苹果体育应用新增覆盖90多个国家和地区,全球可用市场总数超过170个。为迎接2026年世界杯,应用加入了完整的赛程对阵图和可视化阵型卡片,方便用户追踪赛事与战术。同时,应用支持实时活动功能,可将比分固定在锁屏或表盘,并新增一键跳转至新闻的入口。目前该应用仍仅限iPhone用户使用。

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产
科技数码 · 2026-05-29

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产

据博主爆料,小米下一代自研玄戒芯片计划于今年6月正式进入量产阶段,此次将采用台积电3nm工艺。初代玄戒O1累计出货量已突破100万颗,量产验证十分扎实。新一代芯片的产能将显著提升,这意味着供货问题基本得到解决。 根据现有曝光信息,这颗迭代芯片极有可能命名为玄戒O3,首发搭载机型预计为小米MIX Fo