游乐游手机版
首页/科技数码/文章详情

百度PP-OCRv5超轻量模型:Hugging Face热度夺冠,超越GPT-4o与Qwen2.5-VL

时间:2025-09-19 20:31
近日,百度在海外最新账号介绍了最新轻量级文字识别模型PP-OCRv5。该模型仅0 07B参数,以千分之一参数量实现与700亿参数大模型相媲美的OCR精度。在多项OCR场景测试中,PP-OCRv5的表

百度近期通过海外社交账号展示了其全新轻量级文本识别模型PP-OCRv5。这款仅含0.07B参数的模型,在多项OCR任务测试中实现了与700亿参数大模型相当的识别准确度,仅用千分之一的参数量就超越了GPT-4o、Qwen2.5-VL-72B等知名视觉大模型的表现。特别值得注意的是,飞桨团队发布的技术博客内容持续一周稳居Hugging Face热门博客榜首,引发了开发者群体的热烈讨论。

超越GPT-4o及Qwen2.5-VL,百度超轻量模型PP-OCRv5

据官方资料显示,在2025年5月发布的PaddleOCR 3.0版本中,PP-OCRv5文字识别方案与PP-StructureV3通用文档解析方案、以及支持文心大模型4.5的PP-ChatOCRv4智能文档理解方案,共同组成了三大核心功能。自2020年开源以来,PaddleOCR的下载量已突破900万次,获得5900多个开源项目采用或引用,更是GitHub上唯一星标数突破5万的中国OCR项目。

超越GPT-4o及Qwen2.5-VL,百度超轻量模型PP-OCRv5

9月18日当天,Paddle OCR项目登上GitHub全球热度榜,在Python类目中排名第5,总榜位列第13名。

超越GPT-4o及Qwen2.5-VL,百度超轻量模型PP-OCRv5

技术博客中提到,目前通用视觉大模型(VLM)在OCR任务中仍存在文本定位不准确、边框偏差等问题,同时伴随高昂的计算成本和不稳定的"幻觉"输出。相较之下,PP-OCRv5采用的模块化双阶段检测识别架构,不仅保证了推理过程的高效轻量,还能输出更为精确的文本边界框。

测试数据显示,在印刷体中文、英文及手写英文等主要任务中,PP-OCRv5的准确率与Qwen2.5-VL-72B这样的百亿级大模型不相上下甚至更胜一筹;面对手写中文、汉语拼音等复杂场景时,同样展现出色的泛化能力。

超越GPT-4o及Qwen2.5-VL,百度超轻量模型PP-OCRv5

作为百度飞桨团队打造的全场景文本识别解决方案,PP-OCRv5突破了行业瓶颈,成为首款能够支持5种文字类型的超轻量级模型。

来源:https://www.leiphone.com/category/industrynews/WWfaI8xBjnPc33jn.html
上一篇比亚迪方程豹钛7重磅登场:17.98万起买5米硬派SUV 下一篇联想"青春有AI"校园行助力大学生数字能力培养
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
宇树验证具身智能新趋势核心战场不止于模型
科技数码 · 2026-07-01

宇树验证具身智能新趋势核心战场不止于模型

具身智能领域的竞争,正步入一个全新的发展阶段。近日,宇树科技正式发布了其WVLA2 0具身大模型,并公开展示了无需远程遥操的实机演示。这一举动向业界释放了一个明确信号:当前这场竞赛的核心壁垒,或许已不再是谁拥有更大的模型参数,而是谁的架构设计更为精巧、谁能更深度地实现软硬件一体化、谁能积累更海量的实

智元精灵G2机器人产线直播完成64828件成功率99.99%
科技数码 · 2026-07-01

智元精灵G2机器人产线直播完成64828件成功率99.99%

99 99%的任务成功率——这是智元机器人在6月23日至28日期间,将精灵G2机器人直接部署到真实的平板量产质检产线,并全程公开直播后,交出的最具说服力的答案。 让我们关注这场直播的硬核数据:连续64小时不间断作业,产线累计完成17625件产品检测,机器人累计执行64828次操作,任务成功率精确达到

纯电动Cayenne首秀保时捷驾驶中心全国路演
科技数码 · 2026-07-01

纯电动Cayenne首秀保时捷驾驶中心全国路演

保时捷正在加速推进其电动化转型战略。继纯电动Cayenne与Gen 3 Evo赛车在三亚街道赛共同亮相后,仅过了一周时间,这款全新纯电SUV便驶入中国专业赛道场景——这一次,地点换成了永久性专业赛道。 回顾2026年北京车展,保时捷首款纯电动Cayenne Turbo正式首发并公布了售价。新车提供两

AI工具能否成为高价志愿咨询纠纷的破局之道
科技数码 · 2026-07-01

AI工具能否成为高价志愿咨询纠纷的破局之道

广东高考成绩公布后,志愿填报这场“第二次大考”随即全面开启。对众多家庭而言,这或许比高考本身更令人心力交瘁——时间紧迫、信息庞杂、选项繁多,每一步都如履薄冰。教育部近日发布预警,严厉批评那些漫天要价的“志愿规划师”,直言其本质上就是忽悠。然而每年踩坑的案例仍屡见不鲜,网上信息真假混杂,不同机构给出的

头部企业全产业链布局锂电池回收循环
科技数码 · 2026-07-01

头部企业全产业链布局锂电池回收循环

近年来,伴随新能源汽车产业的爆发式增长,早期投入使用的动力电池正迎来集中退役高峰,锂电池回收行业因此进入一个至关重要的“窗口期”。这些退役电池中富含锂、钴等珍贵金属资源——尤其是被誉为“白色石油”的锂,正从地下矿藏逐渐转向我们身边的“城市矿山”,从“一次性使用”的线性消耗模式,迈向“循环再生”的可持