人工智能与民族语言(图片源自网络)
德国哲学家马丁·海德格尔曾指出:语言是存在的家园。中国学者周海中先生也强调:保护民族语言,不仅有利于人类文明的传承与发展,也有助于民族团结和社会安定。可以说,民族语言不仅是族群身份最核心的标志之一,更是文化传承、发展繁荣的重要载体,也是人类文明进步与社会和谐稳定的重要象征。
然而,这些语言正以惊人的速度走向消亡。幸运的是,濒危语言的使用者正在与时间赛跑,借助现代科技——尤其是人工智能技术——将他们独特的语言文字传递给下一代。前不久,美国未来学家托马斯·弗雷提出了“全球语言档案馆”的构想,利用人工智能技术将不同民族语言以视频、音频和书面文件的形式进行存档。目前,他已联合世界各地的学者收集了近4000种语言的数据,其中许多属于濒危语种。
在中国,科大讯飞借助人工智能技术,探索濒危语言中不同尺度音节语义之间的关联与模式,在超强算力服务器的协同配合下,最终形成语音库,实现了濒危语言的留存。凭借先进的智能语音技术,该公司覆盖多个少数民族语言及方言的语音系统,已在语音输入法、翻译机、自动评测以及播报中得到实际应用,进一步推动了民族语言和地方方言的保护与传承,为维护语言生态多样性做出了贡献。
加拿大第一民族文化委员会(FPCC)最近也加入了这场行动。为了支持不列颠哥伦比亚省的土著语言、艺术、文化和遗产复兴,他们利用人工智能技术,通过First Voice平台保存语言数据,制作出教学程序和应用程序。First Voice是一款键盘应用程序,可让用户在移动设备上的任何应用里输入超过100种当地土著语言,包括社交媒体、电子邮件和文字处理。
在澳大利亚,语言学家与美国谷歌合作开发了濒危语言人工智能平台。该平台通过人工智能模型转录原住民语言,已存储超过4万小时的录音。这不仅大幅节省了时间,还提升了记录的准确率。目前,他们已为20多种澳大利亚土著语言建立了人工智能模型。
新西兰的语言学家则与美国IBM的“沃森人工智能”合作,开发出帮助爱好者练习毛利语的人工智能程序Reobot。该程序不仅能用英语和毛利语回复信息,还能过滤拼写错误甚至语法错误。有专家认为,Reobot可以帮助学习者更快地培养自信和语言技能。
由于人工智能技术在语言存储和学习方面的独特优势,如今它在拯救濒危语言的过程中变得空前重要。不过,想要通过这一技术让这些语言得到彻底保护,仍然面临不小的挑战。例如,许多土著语言通常以口述方式传承,如果将其转化为文字,可能会改变或无法完整表达原有的含义。当然,有理由相信,在现代科技尤其是人工智能技术的助力下,民族语言的保护问题终将找到可行的解决方案。
文/蔡莉(作者单位:德国马普学会人类历史科学研究所)
