IBM推出Granite-Docling-258M模型:轻量级AI支持文档转换与中文处理
9月20日,IBM正式发布小型视觉语言模型Granite-Docling-258M,该模型专为端到端文档转换场景设计,采用Apache 2.0开源协议,目前已在Hugging Face平台对外开放(点击访问)。
据了解,这款参数量达2.58亿的轻量化模型专注于文档表格处理,不仅能准确保留原文档的排版样式、表格结构、数学公式、列表和代码块等元素,其识别精度相较传统OCR技术也有显著提升。
IBM研发团队称,Granite-Docling的核心技术是其独创的DocTags标签系统。这套由IBM Research开发的通用文档结构化标记语言,能够精确标注页面元素的类型、位置坐标、阅读流顺序及跨元素关联,同时实现了内容与版式结构的分离处理。采用"先划定元素区域再OCR识别"的方法后,转换结果可直接导出为Markdown、JSON、HTML等多种格式,还能对接Docling数据库进行后续处理。

当前Granite-Docling已支持中文、阿拉伯语和日语等语言处理,但IBM坦言其性能尚未达到企业级应用标准。官方表示后续将陆续扩展更多语言支持并持续优化模型可靠性。同时计划加强DocTags与watsonx.ai模型的兼容性,并将DocTags词汇表整合进Granite分词器和训练流程中。
热门专题
最新APP
热门推荐
10月26日消息,Intel原本计划在18A工艺节点大力发展外部代工,但进展非常不乐观,不得不改为内部使用,转而发展14A代工。终于迎来季度盈利后,Intel还简短披露了一个好消息:“外部客户对14
2025年10月25日,全球首款类脑智算体“智者一号(BI Explorer, BIE-1)”在横琴粤澳深度合作区正式发布。该设备由广东省智能科学与技术研究院孵化的两家科技企业——珠海横琴新近纪智能
近日,一位小米SU7 Pro车主分享了自己近一年的用车经历。提车仅一年时间,车辆行驶里程已突破21万公里,期间未出现任何故障,原装前轮胎也未曾更换。这一行驶数据意味着平均每天行驶接近540公里,对整
3D打印技术正以全新的姿态回归大众视野。从曾经的概念性产品到如今的地摊新宠,这项技术已悄然融入日常生活。夜市摊位上,3D打印的龙蛋、关节龙等创意摆件成为新一代网红商品,部分摊主半月收入突破万元,展现
云计算领域每一次技术变革,都深刻影响着产业格局与价值分配。当前,全球云计算市场正经历第三次范式转移,AI技术的爆发推动行业从资源提供者向智能引擎转型,主流厂商纷纷调整战略以应对新挑战。在PC互联网时
