游乐游手机版
首页/科技数码/文章详情

Grab视觉语言模型新突破!攻克东南亚多语言文档识别难题

时间:2025-11-30 18:05
东南亚科技企业Grab近日宣布,其自主研发的视觉大型语言模型在文档处理领域取得突破性进展。这款专为东南亚多语言环境设计的模型,成功解决了传统技术处理非拉丁字母文档的难题,在身份证、驾照等关键证件识别

东南亚科技企业Grab近日宣布,其自主研发的视觉大语言模型在文档处理领域取得突破性进展。这款专为东南亚多语言环境设计的模型,成功解决了传统技术处理非拉丁字母文档的难题,在身份证、驾照等关键证件识别任务中展现出显著优势。

作为覆盖新加坡、马来西亚、印尼等八个国家的超级应用平台,Grab每日需处理海量多语言文档。工程技术团队发现,现有商业模型在解析东南亚语言时普遍存在两大缺陷:一是字符识别错误率居高不下,二是图像处理延迟严重。即使开源视觉模型在效率上表现优异,但面对复杂文档模板时仍难以保证准确性,这给客户身份验证等合规工作带来巨大挑战。

研发团队经过技术评估,最终选定阿里云Qwen2-VL模型的作为基础架构。该模型具备三大核心优势:支持东南亚多语言处理、可动态适配不同分辨率图像,且模型体积适中便于部署。为构建专属训练数据集,工程师们从Common Crawle开源库中筛选东南亚语言内容,同时开发内部合成系统,生成包含多样化字体和背景的文本图像样本。

在模型优化阶段,团队采用分阶段微调策略。初期通过低秩适配技术快速验证印尼文本文档的处理效果,当发现泰语、越南语等语言存在特殊视觉模式后,立即启动全参数微调。经过数轮迭代训练,最终诞生的轻量化模型不仅在字符识别准确率上超越主流OCR工具,其图像处理速度较通用模型提升40%。

这项技术突破已产生实质性应用价值。在马来西亚驾照识别场景中,新模型将错误率从18%降至3.2%;越南身份证信息提取的完整率提升至97%,较传统方案提高23个百分点。Grab工程负责人表示,通过精准筛选高质量训练数据,小型专业模型完全能够实现效率与效果的双重突破。

目前,该模型已集成至Grab核心业务系统,支持打车、外卖、金融等场景的实时文档核验。研发团队正着手扩展模型能力边界,计划开发支持手写体识别、多语言混合文档解析等高级功能,以应对东南亚市场日益复杂的数字化需求。

来源:https://www.itbear.com.cn/html/2025-11/1009384.html
上一篇任天堂2026财年Q2利润增32%,上调Switch 2销量预期至1900万台 下一篇文心AI漫画教程:输入文字生成图片,两分钟变身漫画师
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
OpenClaw手机App上线,结果翻车了
科技数码 · 2026-07-01

OpenClaw手机App上线,结果翻车了

OpenClaw 官方宣布,已正式推出 iOS 和 Android 原生移动 App,用户如今可以在手机上使用这款主打“能真正帮你做事”的个人 AI 助手。官方在 X 上给出的定位也很直接:把 Agent 放进口袋里,让用户可以在移动端处理频道消息、任务和回复。从功能上看,OpenClaw 移动端并

优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5