IBM推出Granite-Docling-258M模型:轻量级AI支持文档转换与中文处理
9月20日,IBM正式发布小型视觉语言模型Granite-Docling-258M,该模型专为端到端文档转换场景设计,采用Apache 2.0开源协议,目前已在Hugging Face平台对外开放(点击访问)。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据了解,这款参数量达2.58亿的轻量化模型专注于文档表格处理,不仅能准确保留原文档的排版样式、表格结构、数学公式、列表和代码块等元素,其识别精度相较传统OCR技术也有显著提升。
IBM研发团队称,Granite-Docling的核心技术是其独创的DocTags标签系统。这套由IBM Research开发的通用文档结构化标记语言,能够精确标注页面元素的类型、位置坐标、阅读流顺序及跨元素关联,同时实现了内容与版式结构的分离处理。采用"先划定元素区域再OCR识别"的方法后,转换结果可直接导出为Markdown、JSON、HTML等多种格式,还能对接Docling数据库进行后续处理。

当前Granite-Docling已支持中文、阿拉伯语和日语等语言处理,但IBM坦言其性能尚未达到企业级应用标准。官方表示后续将陆续扩展更多语言支持并持续优化模型可靠性。同时计划加强DocTags与watsonx.ai模型的兼容性,并将DocTags词汇表整合进Granite分词器和训练流程中。
热门专题
热门推荐
《全面战争:中世纪3》:经典延续,如何平衡怀旧与创新? 近期,《全面战争:中世纪3》的项目负责人帕维尔·沃伊斯坦然指出,要打造一款真正优秀的续作,绝不能仅仅依赖对前作模式的简单复刻。这一观点引人深思——尽管《中世纪2:全面战争》至今仍在策略游戏爱好者心中占据着经典地位,但开发团队此次显然决心跳出“照
雷鸟X3 Pro斩获AWE艾普兰创新大奖,开启全民AR生活新篇章 在上海新国际博览中心隆重揭幕的2026年中国家电及消费电子博览会(AWE)上,前沿AI科技与未来生活愿景激情碰撞。全球消费级AR领导品牌雷鸟创新,以其里程碑式的表现,定义了行业发展的新方向。 通过“顶尖硬件科技+顶级文化IP”的双轨战
借力AWE2026“一展双区”,MOVA双区协同、震撼登场 备受瞩目的科技盛会——2026年中国家电及消费电子博览会(AWE),于3月12日至15日在上海盛大举办。本届AWE展会首次创新采用“一展双区”的展览模式,主会场位于上海新国际博览中心,分会场则设于上海东方枢纽国际商务合作区,两大展区高效联动
冰结师技能全解析 踏入2026年,《地下城与勇士》中的冰结师职业,其技能体系已构建得更为成熟与强大。无论是在副本中高效清理海量怪物,还是在决斗场与高手玩家周旋,这个职业都能凭借其独特的冰霜艺术掌控战局。刷图时,酷寒的范围法术可瞬间清屏;而在PVP竞技中,一套将冻结控制与瞬间爆发完美衔接的连招,往往让
iPhone 18 Pro系列模具不变,屏幕形态将与iPhone 17 Pro保持一致 备受期待的屏下Face ID组件小型化设计与灵动岛区域缩窄方案,预计将被推迟至后续迭代机型中正式应用。 近期,关于iPhone 18 Pro系列的技术传闻持续引发行业关注,尤其在显示与解锁设计领域传言甚多。多方消





