首页 游戏 软件 资讯 排行榜 专题
首页
AI
DeepSeek-OCR+2发布:AI如人类般精准解读复杂文档

DeepSeek-OCR+2发布:AI如人类般精准解读复杂文档

热心网友
11
转载
2026-01-27

1月27日,DeepSeek团队正式发布了题为《DeepSeek-OCR 2: Visual Causal Flow》的研究论文,并同步开源了DeepSeek-OCR 2模型。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

该模型采用了其创新的DeepEncoder V2新型编码器架构,能够依据图像语义动态调整视觉信息的处理顺序,使模型在进行文字识别前,先对视觉内容进行智能排序。这项技术突破源于对传统视觉语言模型处理方式的重新思考,旨在让机器的视觉阅读逻辑更贴近人类的阅读习惯。

DeepSeek-OCR 2发布:让AI像人一样“读懂”复杂文档

在传统的视觉语言模型中,图像通常被分割为若干视觉单元(token),并按照从左到右、从上到下的固定网格顺序送入模型处理。这种方式虽然实现简单,但与人类在阅读文档、表格或公式时,基于语义和逻辑关系进行跳跃式浏览的方式并不一致。

DeepSeek论文指出,尤其在版式复杂的文档场景中,视觉元素之间往往存在明确的逻辑先后关系,仅依赖空间顺序可能会限制模型对内容结构的理解能力。

为验证模型性能,研究团队在OmniDocBench v1.5基准上进行了全面评估。该基准涵盖了多种类型的中英文文档,包括学术论文、杂志、报告等,重点考察文本识别、公式解析、表格结构还原以及阅读顺序等指标。

测试结果显示,在视觉单元数量更受限的情况下,DeepSeek-OCR 2的整体得分达到了91.09%,相比上一代DeepSeek-OCR提升了3.73%。特别是在阅读顺序准确性方面,编辑距离从0.085降至0.057,表明新模型能够更合理地理解文档内容结构。

来源:https://tech.ifeng.com/c/8qFwtXrZzBO
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

谷歌推出Veo 3.1 Lite视频模型,每秒生成成本仅0.05美元
AI
谷歌推出Veo 3.1 Lite视频模型,每秒生成成本仅0.05美元

IT之家 4 月 1 日消息,谷歌 DeepMind 昨日推出 Veo 3 1 Lite 视频模型,是该公司迄今为止最实惠的视频生成工具。最新数据显示,Lite 版的生成速度和 Fast 版本保持一

热心网友
04.01
DeepSeek三天两发故障透露信号:V4版更新在即?
AI
DeepSeek三天两发故障透露信号:V4版更新在即?

今天傍晚,DeepSeek再度出现服务异常,社交平台上不少用户反馈,对话过程中频繁遭遇“请检查网络后重试”或“服务器繁忙”等提示。目前,服务已恢复正常。这是三天之内DeepSeek第二次发生服务故障

热心网友
04.01
DeepSeek编码风格巨变:连续“罢工”背后的大招是什么?
AI
DeepSeek编码风格巨变:连续“罢工”背后的大招是什么?

3月29日晚至30日上午,在经历长达12小时的宕机后,DeepSeek“崩”上热搜。大量用户反映网页端和App提示“服务器繁忙”或无法响应,据了解,这是DeepSeek有史以来最长的一次“罢工”。而

热心网友
04.01
雷军公布小米MiMo V2 Pro大模型Text Arena刷榜全球前五战绩
AI
雷军公布小米MiMo V2 Pro大模型Text Arena刷榜全球前五战绩

IT之家 3 月 31 日消息,小米创办人、董事长兼 CEO 雷军今日分享了 MiMo-V2-Pro 大模型最新“战绩”。在大模型权威评测榜单 Text Arena,MiMo-V2-Pro 凭借在复

热心网友
03.31
古尔曼披露:苹果Apple Intelligence在中国意外上线后下线
礼仪与书信
古尔曼披露:苹果Apple Intelligence在中国意外上线后下线

3月31日,苹果于今日凌晨开始分批推送国行Apple Intelligence Beta版,需升级至iOS 26 4及以上系统方可体验。彭博社记者马克·古尔曼今日发文称Apple Intellig

热心网友
03.31

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

OPPO A6k 手机上市:天玑 6300 + LCD 直屏 + 7000mAh 电池,定价 1999 元起
科技数码
OPPO A6k 手机上市:天玑 6300 + LCD 直屏 + 7000mAh 电池,定价 1999 元起

OPPO A6k手机重磅发布:天玑6300处理器、高清LCD直屏、7000mAh超大电池,售价仅1999元起 OPPO旗下广受欢迎的A系列再添实力新机。近日,备受期待的OPPO A6k正式上市发售。这款新品搭载了备受好评的天玑6300八核处理器,并配备了一块容量高达7000mAh的耐用长寿电池,成为

热心网友
04.06
《红色沙漠》熔化锁链的火焰任务攻略-支线任务完成方法详解
游戏攻略
《红色沙漠》熔化锁链的火焰任务攻略-支线任务完成方法详解

速览 在《红色沙漠》的广阔世界中,数量丰富的支线任务与主线剧情共同构筑了沉浸式的冒险体验。其中,“熔化锁链的火焰”任务作为瑟金斯家族剧情线的关键环节,其触发机制与主线进程紧密相连。任务并非随时可用,玩家需将主线故事推进到特定阶段后,任务才会自动添加至任务日志。本篇攻略将为你详解此支线任务的接取条件与

热心网友
04.06
《异种航员2》运动机制详解-战术移动与时间单位消耗
游戏攻略
《异种航员2》运动机制详解-战术移动与时间单位消耗

《异种航员2》运动机制深度解析 在《异种航员2》(Xenonauts 2)的策略战斗中,对“时间单位”(TU)的高效运用是取胜的核心。每个士兵的移动、射击乃至战术配合,都依赖于玩家对TU的精确规划。操作上手简单:选中单位后,直接使用鼠标左键点击目的地方格,系统便会清晰显示移动所需消耗的时间单位,帮助

热心网友
04.06
《异种航员2》封面机制详解-掩体闪避效果介绍
游戏攻略
《异种航员2》封面机制详解-掩体闪避效果介绍

速览 在《异种航员2》(Xenonauts 2)的战局中,掌握“战术规避”与精通“火力输出”同等关键。游戏全新设计的掩体系统,是提升你作战小队生存几率的战略性核心。简言之,战场上绝大多数可见的物体都能转化为你的战术屏障。无论是散落的木箱、残缺的矮墙,还是茂密的灌木丛与坚实的建筑物,巧妙地利用它们,就

热心网友
04.06
《红色沙漠》超凡建造物任务攻略-任务流程详解
游戏攻略
《红色沙漠》超凡建造物任务攻略-任务流程详解

速览 在开放世界大作《红色沙漠》中,庞大的支线任务系统为玩家提供了丰富的探索体验。其中,“超凡建造物”任务是阿方索家族势力任务线中的重要一环。要成功接取此任务,玩家必须首先完成其前置任务【枪械名门】。在此之后,任务的下一步关键操作是前往游戏中标注的特定建筑地点进行互动调查——这本质上是一个用于快速移

热心网友
04.06