对着智能鼠标用藏语提问,大模型不仅能精准理解,还能用带着“酥油茶香”般地道韵味的藏语流畅回答——这不是科幻场景,而是刚刚在第二十八届中国北京国际科技产业博览会现场上演的真实一幕。
本届北京科博会于5月8日至10日举行。展台上,这款名为“DeepZang”的藏语大模型吸引了众多关注。其背后的研发者,西藏觉罗数字产业管理有限公司,正致力于用前沿技术弥合人工智能时代的“数字鸿沟”,让藏语用户平等享受AI红利。
从“转码”到“原生”:藏语AI的思维革命
“主流通用大模型多基于汉语、英语语料训练,直接应用于藏语场景时,体验总不尽如人意。”西藏大学的博士研究生才让东知指出了核心问题。以往,通用模型处理藏语时,回答往往生硬,带有明显的机械转码痕迹,缺乏藏语特有的自然语感和深厚的文化底蕴。
而“DeepZang”选择了一条不同的技术路径:让AI直接用藏语“思考”。它采集了涵盖卫藏、康巴、安多三大方言区的超过30500小时藏语语音数据,并利用近7000万条藏汉双语平行精准语料进行深度训练。这使得它能够出色完成诸如“帮我起草一份牦牛买卖合同”、“创作一首赞美父母的藏语诗歌”等极具民族文化特色的日常任务。

5月8日,一名外国观众在北京科博会上用智能鼠标体验藏语大模型。新华社发
跨方言识别:降低使用门槛的关键突破
藏语地区文字统一,但口语方言差异显著,这曾是技术落地推广的主要障碍。“DeepZang”通过融合声纹识别与方言分类技术,有效破解了这一难题。这意味着,用户无需具备很高的藏文书写能力,只要会说藏语,就能轻松使用AI服务。
“这项技术能切实帮助到更多人。”在山南市从事藏汉翻译工作的洛桑顿玉深有感触。他和同事已将藏语大模型应用于实际工作:“过去需要两三个人花费40分钟翻译的文稿,现在在AI辅助下,一个人20多分钟就能完成,翻译效率的提升显而易见。”
从雪域高原到国际舞台:机遇与挑战并存
目前,“DeepZang”已积累超过30万用户,其中18至40岁的青年用户占比超过70%。用户主要分布于西藏、青海、四川、甘肃等地区,其中不少来自偏远乡村。得益于西藏主电网全覆盖和乡镇以上5G网络的基本通达,电力与网络的基础设施瓶颈已得到显著缓解。
然而,从“可用”到“好用”、“爱用”,道路依然漫长。公司产品部负责人多吉美久坦言,当前面临算力成本高昂、资金压力较大、可持续的商业闭环尚未完全形成等现实挑战。部分用户反馈,在进行多轮深入对话后,会遇到“token余额不足”的提示。这也正是他们此次亮相北京科博会的重要目的:寻求产业合作,融入更广阔的科技创新生态,共同推动藏语AI发展。
对于公司董事长旦增罗布而言,科博会是一个崭新的起点。而藏语大模型“DeepZang”的深远意义,或许正如其自身所回答的那样:它既是赋予广大藏语使用者拥抱智能时代的得力工具,也是搭建藏语文化与其他语言世界相互沟通的一座坚实桥梁。
