游乐游手机版
首页/业界动态/文章详情

百度文心发布PaddleOCR-VL-1.6文档解析准确率突破96.33%刷新SOTA纪录

时间:2026-06-05 13:52
文档解析领域最近迎来了一位实力强劲的新选手。百度最新推出的PaddleOCR-VL-1 6,准确率一举提升至96 33%——在OmniDocBench v1 6评测中,全面超越Gemini-3-Pro、GPT-5 2等通用大模型及专业OCR模型,综合性能登顶全球第一。不仅如此,在面向真实复杂场景的R

文档解析领域最近迎来了一位实力强劲的新选手。百度最新推出的PaddleOCR-VL-1.6,准确率一举提升至96.33%——在OmniDocBench v1.6评测中,全面超越Gemini-3-Pro、GPT-5.2等通用大模型及专业OCR模型,综合性能登顶全球第一。不仅如此,在面向真实复杂场景的Real5-OmniDocBench测试中,总指标也达到了93.19%,比Gemini-3-Pro高出近4个百分点。

百度文心发布 PaddleOCR-VL-1.6:准确率突破 96.33%,刷新文档解析 SOTA

从具体表现来看,在权威测试集OmniDocBench v1.6上,PaddleOCR-VL-1.6的多项能力均刷新了SOTA。文本、公式、表格等核心识别任务全面领先当前主流开源与闭源方案,尤其在表格、古籍、生僻字等传统难点场景上提升显著。印章检测、Spotting、图表识别等关键能力也同步增强,基本将文档数字化所需的核心能力全面升级。

熟悉OCR技术圈的朋友可能知道,PaddleOCR基于文心大模型训练而来,是文心多模态能力体系的重要组成。此次1.6版本在1.5的基础上,引入模型驱动的数据构建机制和渐进式训练优化,在维持0.9B轻量化架构的前提下,进一步提升了准确率和复杂场景的适应能力。值得一提的是,两代模型结构完全一致,开发者无需额外适配即可平滑迁移,这对实际落地部署非常友好。

事实上,PaddleOCR在文档理解能力上已持续迭代多年,从PaddleOCR-VL到1.5再到如今的1.6,每一步都走得扎实稳健。1.5版本创新的异形框定位能力已在真实场景中展现了良好的解析表现。更值得关注的是,PaddleOCR项目在GitHub上的Star数已突破79.2K,超越谷歌开源的Tesseract OCR,成为全球最受开发者欢迎的开源OCR项目之一。

目前PaddleOCR-VL-1.6已正式上线官网,支持网页端直接体验和API调用,模型代码与权重也已同步开源至GitHub和Hugging Face。全球开发者均可直接上手,亲自验证这款被称为“文档解析新王”的产品究竟有多能打。

来源:https://www.ithome.com/0/958/734.htm
上一篇闪迪消费级存储产品荣膺2026红点奖 创新设计赋能数字生活 下一篇技嘉正式发布B850雕妹主板融合动漫美学与AI性能强化
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
中关村论坛年会AI未来论坛聚焦跃迁投资共生
业界动态 · 2026-06-30

中关村论坛年会AI未来论坛聚焦跃迁投资共生

3月30日,中关村国际创新中心成为人工智能领域瞩目的焦点——2026中关村论坛年会人工智能主题日的重要活动“AI未来论坛:跃迁·投资·共生”在此正式拉开帷幕。本次论坛传递出一个清晰的信号:人工智能正从技术突破迈向产业落地的关键阶段,而资本信心的背后,映射出产业演进的明确风向。海淀区明确表态,将以开放

泰国CP AXTRA与菜鸟合作复制中国闪购模式
业界动态 · 2026-06-30

泰国CP AXTRA与菜鸟合作复制中国闪购模式

3月27日,菜鸟集团与泰国正大集团旗下核心零售企业CP AXTRA正式签署战略合作协议。此次合作的核心目标十分明确:菜鸟将充分发挥自身在数字供应链技术、仓储自动化领域的技术优势,以及多年深耕海外仓的运营经验,全力支持CP AXTRA在泰国及东盟国家打造一套线上线下一体化的即时零售物流网络。 CP A

云英谷科技VTDR6135参评SID中国区显示行业奖
业界动态 · 2026-06-30

云英谷科技VTDR6135参评SID中国区显示行业奖

云英谷科技携国内首颗支持1 5KRealRGB显示的AMOLED驱动芯片VTDR6135参评SID中国区显示行业奖。该芯片已量产并用于高端手机,采用28nm制程,支持240Hz刷新率,集成自研APDBI技术与烧屏补偿机制。在ICDT2026大会C06展位展示。

马斯克警告柏林工厂扩张受外部干预需保自主
业界动态 · 2026-06-30

马斯克警告柏林工厂扩张受外部干预需保自主

3月1日消息,特斯拉CEO埃隆·马斯克向柏林工厂的员工传递了一个信号:如果工厂无法在“不受外界干扰”的环境下自主运转,那么后续的扩建计划可能需要延后。这番话源自一段提前录制的视频,由马斯克在得克萨斯州奥斯汀与格伦海德工厂厂长安德烈·蒂里格共同完成录制,随后在柏林超级工厂内部播放给员工观看。 这段视频

高通钱堃博鳌谈构建用户中心智能生态
业界动态 · 2026-06-30

高通钱堃博鳌谈构建用户中心智能生态

高通钱堃指出,AI正重塑人机交互,2026年称为智能体之年。6G被设计为AI原生系统,2026年为标准化关键年,高通已与近60家伙伴达成共识。高通构建以用户为中心的智能生态系统,通过端-边-云协同架构,结合5G 6G技术,并推出AI加速计划,推动个人、物理、工业AI规模化应用。