百度近期发布了一项重磅成果——正式推出并开源了一款端到端OCR模型,名为Unlimited OCR。消息公布后,该模型在发布次日便迅速登顶GitHub Daily Trending榜和Python榜;仅用5天时间,其GitHub Star数便突破1万。
不仅如此,在HuggingFace全球模型总趋势榜和多模态模型趋势榜上,它同样拿下了第一名的位置。GitHub与HuggingFace四大榜单全部登顶,这一成绩确实令人瞩目。
Unlimited OCR专为长文档解析场景设计,总参数量达到3B,但在推理时仅激活约570M参数——这一架构设计在效率上表现突出。
公开评测数据也极具说服力:在OmniDocBench v1.6基准测试中,该模型以93.92%的综合得分刷新了端到端OCR领域的最佳纪录。可以说,此次开源为文档解析领域注入了实实在在的推动力。
