2月3日,智谱(02513.HK)官方微博宣布,其最新GLM-OCR模型已正式发布并开源。
据介绍,GLM-OCR是一款轻量级的专业级光学字符识别模型,参数量仅为0.9B。该模型支持通过vLLM、SGLang及Ollama等框架进行部署,便于开发者和企业灵活集成与应用。
公司指出,尽管GLM-OCR的参数量不大,但在权威文档解析评测榜单OmniDocBench+V1.5中,其以94.6分的成绩取得了当前最优(SOTA)性能。该模型在文本、公式、表格识别及信息抽取四大细分领域的表现均优于多款OCR专项模型,整体性能接近Gemini-3-Pro水平。

