智谱开源GLM-OCR模型:多领域性能对标Gemini Pro,小尺寸高精度
2月3日,智谱(02513.HK)官方微博宣布,其最新GLM-OCR模型已正式发布并开源。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据介绍,GLM-OCR是一款轻量级的专业级光学字符识别模型,参数量仅为0.9B。该模型支持通过vLLM、SGLang及Ollama等框架进行部署,便于开发者和企业灵活集成与应用。
公司指出,尽管GLM-OCR的参数量不大,但在权威文档解析评测榜单OmniDocBench+V1.5中,其以94.6分的成绩取得了当前最优(SOTA)性能。该模型在文本、公式、表格识别及信息抽取四大细分领域的表现均优于多款OCR专项模型,整体性能接近Gemini-3-Pro水平。

相关攻略
这项由百度千帆团队主导的研究发表于2026年3月17日的arXiv预印本平台(论文编号:arXiv:2603 13398v1),该研究推出了一个名为Qianfan-OCR的革命性文档智能模型,这个拥
2月12消息,上海人工智能实验室 OpenDataLab 团队、 DeepLink 团队及国产芯片厂家携手,于日前先后完成了昇腾、平头哥、沐曦、海光、燧原、摩尔线程、天数智芯、寒武纪、昆仑芯、太初元
2月3日,智谱(02513 HK)官微宣布正式发布并开源GLM-OCR。据介绍,作为一款轻量的专业级OCR模型,该模型仅0 9B参数规模,支持vLLM、SGLang和Ollama部署。公司表示,尽管
北京商报讯(记者 陶凤 王天逸)1月28日,优刻得云计算宣布,DeepSeek重磅升级DeepSeek-OCR-2后,优刻得已经完成接入,并限时免费。
新智元报道编辑:定慧【新智元导读】谷歌Google DeepMind刚刚推出新能力,用代码赋予Gemini 3 Flash「法眼」。没想到吧,Google DeepMind刚刚为Gemini 3 F
热门专题
热门推荐
3月30日消息,今晚除了手机之外,vivo还发布了全新的旗舰平板——vivo Pad6 Pro。行业首发13 2英寸4K原彩屏,分辨率3840×2160,347PPI,支持1-144Hz LTPS自
WPS表格中提取括号内容有四种方法:一、单对英文小括号用FIND+MID;二、中英文括号通用需SUBSTITUTE预处理;三、多对括号取最后一对需REVERSESTRING反向查找
3月30日,南京新街口核心商圈,苏豪大厦一楼广场上机器人迎宾起舞,充满科技感。由苏豪资产运营集团与南京新街口金融商务区管理委员会(以下简称“新街口管委会”)共同打造的“数智苏豪”新街口OPC社区揭牌
电 动 知 家消 息,近日,据外媒报道,据福特汽车日前发布的一份文件,该公司首席执行 官吉姆·法利2025年的总薪酬大幅增长了11%,达到约2752万美元(约1 9亿元人民币),这是其自2020年末
白宫里,一台人形机器人缓步走入东厅,与美国“第一夫人”并肩亮相,动作仍带着明显的机械感;仅仅一天后,国会山上,这种“会走路的机器”却被划为潜在安全威胁,写进立法提案。这是上周美国上演的荒诞一幕。两党





