百度飞桨PaddleOCR登GitHub榜首:最受欢迎中文开源OCR工具
3月31日消息,近日,百度文心衍生模型PaddleOCR在GitHub上的Star数突破73.3K,首次超越谷歌旗下开源OCR标杆产品Tesseract OCR(73.2K),成为全球Star数最高的OCR项目。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
Tesseract OCR诞生于1985年,最初由惠普实验室研发,2005年开源后由Google接手维护并持续迭代,是OCR领域延续近四十年的技术标杆,长期位居GitHub OCR项目Star数榜首。
此次被PaddleOCR超越,标志着这一标杆正在被新一代技术体系改写,也是大模型驱动下中国开源项目首次在OCR领域超越谷歌主导的标杆产品。

PaddleOCR基于文心大模型训练而来,是文心大模型多模态能力的重要部分,支持超100种语言识别,用户覆盖160个国家和地区。1月29日,新一代文档解析模型PaddleOCR-VL-1.5在 OmniDocBench V1.5 榜单中取得了全球SOTA成绩。
近年来,大模型成为OCR赛道增长的重要动力。Star History数据显示,PaddleOCR在GitHub上的Star自2024年起呈现爆发式增长。2025年以来,OCR更成为大模型厂商布局的重点方向,DeepseekOCR、HunyuanOCR、GLM OCR等产品相继发布。
此外,PaddleOCR同步升级服务能力:正式免费每日解析页数由1万提升至2万,用户还可通过OpenClaw直接调用PaddleOCR Skill,免费获取高精度PDF解析能力。
与此同时,PaddleOCR OCEAN生态联盟正式成立,面向核心开源贡献者、深度企业用户及全球平台伙伴开放,首批成员包括Hugging Face、Dify、RAGFlow、Cherry Studio、Milvus等全球平台伙伴,将共同推动OCR技术在更广泛场景中的应用落地。
ps.OCR(Optical Character Recognition,光学字符识别)是指通过光学设备(如扫描仪、摄像头)获取图像中的文本信息,再通过计算机算法将其转化为可编辑、可检索、可分析的数字文本的技术。简单来说,就是让计算机看见并读懂图像中的文字,实现 "图像文本→数字文本" 的精准转化。

相关攻略
智通财经APP获悉,华鑫证券发布研报称,百度集团-SW(09888)通过将OpenClaw深度融入其核心流量入口与产品生态,在AI智能体应用的普及阶段占据了先发优势。其“应用入口+云平台+模型生态”
3月31日消息,近日,百度文心衍生模型PaddleOCR在GitHub上的Star数突破73 3K,首次超越谷歌旗下开源OCR标杆产品Tesseract OCR(73 2K),成为全球Star数最高
3月27日,据国家工业信息安全发展研究中心消息,2026年初,以OpenClaw为代表的开源智能体框架迅速引爆市场,智谱(02513 HK)AI、百度(BIDU US)、月之暗面、MiniMax等科
新京报贝壳财经讯(记者罗亦丹)3月27日,2026中关村论坛年会“人工智能+产业”论坛上,针对不少用户和企业对“龙虾”OpenClaw的安全性存在疑问这一痛点,百度智能云副总裁殷大伟介绍了百度推出的
3月27日,博鳌亚洲论坛2026年年会日程进入最后一天。和往届论坛相比,具身智能、未来机器人等话题备受各界关注。百度沈抖在博鳌论坛2026年年会上表示,具身智能目前尚有三大瓶颈需要突破。3月25日,
热门专题
热门推荐
PChome 3月31日消息,OPPO官微官宣,OPPOx哈苏影像新品联合发布会将于4月21日晚19:00在成都举办,Find X9s Pro、Find X9 Ultra等新品将至。据了解,OPPO
小红书网页版登录入口为https: www xiaohongshu com explore,支持扫码、手机号验证码及微信三种登录方式,首页默认瀑布流展示热门笔记,具备多维度内容检
两年前,谢添天发现自己的声音被一款APP“盗”走——用户输入文本,即可用他的音色生成以假乱真的AI声音。维权半年,因举证难度太高,最终以和解和对方致歉了结。两年后,一场大规模的联合发声,将AI盗声侵
来源:央广网3月28日至29日,以“发挥主流媒体引领力 激发多元主体创造力——共创繁荣网络内容生态”为主题的2026中国网络媒体论坛在河南郑州举行。网络媒体因技术而诞生,凭创新而繁荣。面对新一轮科技
当大语言模型与AgenticAI(智能体)从试验场进入企业级生产环境,SaaS行业的底层价值逻辑正面临系统性重估。这一轮变革的核心,正指向“AI CRM 2 0”的全面到来——它不再是传统CRM的功





