首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
谷歌AI摘要频现低级拼写错误 大语言模型缺陷难根治

谷歌AI摘要频现低级拼写错误 大语言模型缺陷难根治

热心网友
27
转载
2026-05-28

来,先分享一个今天最新鲜的网络段子。

5月28日,有用户用“Google”这个单词去测试谷歌的人工智能:其中包含几个字母p?你猜结果如何?谷歌自己给出的答案是——两个。

谷歌 AI 摘要频现低级拼写错误,大语言模型固有缺陷难根治

有趣的是,这并非个例。人工智能摘要(AI Overview)紧接着又声称,“poop”一词里含有一个字母r——这明显与事实不符。此外,“journalism”被它错误拼写为“j-o-u-r-n-a-d-i-s-m”,硬生生多塞了一个字母d。至于美国总统的姓氏?它倒是推测出里面有一个字母p,可实际拼出来的却是“t-r-p-u-m”。

说实话,谷歌这次高调推进搜索改版,将AI摘要推向前台,出现一些纰漏并不令人意外。类似的翻车事件此前早已上演:AI摘要曾引用恶搞帖子,教用户“吃石头”“往披萨上涂胶水”,让人哭笑不得。

谷歌给TechCrunch的邮件声明也非常坦诚:“大语言模型在单词字母计数方面一直存在困难,我们正在努力解决这个具体问题。”

这类低级拼写错误,业内同行早已见怪不怪。驱动聊天机器人及各类文本生成工具的大语言模型,其设计初衷本来就不是为了识别拼写。多年来,科技圈一直流传着一个梗:任何一家公司发布新AI模型,第一件事就是用“strawberry”这个单词去考验它,问问其中到底有几个字母r。结果呢?这些模型能几秒钟写出一套应用程序,能解开困扰数学家几十年的难题,可在拼写这件事上,和幼儿园小朋友几乎半斤八两。

不过,谷歌AI摘要暴露出的问题远不止这些滑稽的拼写梗。上周还出现了一个更离谱的漏洞:用户搜索“disregard”(忽视)时,页面本该给出该词的词典释义,结果AI直接回复了一句“收到。你随时可以提出新指令或问题。”谷歌事后修复了这个漏洞,但层出不穷的拼写错误依然天天刷屏,成了观众喜闻乐见的吐槽素材——因为从根本上讲,这类问题几乎无法根治。

研究人员对此早有解释。人工智能根本不像人类那样,把文字看成由字母和单词组成的单元。绝大多数大语言模型基于Transformer架构搭建,它们处理文本的方式是先将文字拆分成“词元”(token)。不同模型切分词元的粒度各不相同,可能是完整单词、音节,甚至单个字母。人工智能不是靠“读”来理解文本的,它会先把文本转换成数字表征,再根据上下文进行推理分析,最后生成看起来合乎逻辑的回复。

阿尔伯塔大学人工智能研究员、助理教授马修・古兹迪亚尔接受TechCrunch采访时说得非常直白:“大语言模型依托Transformer架构运行,它本质上不是在阅读文本。你输入指令后,内容先被转成编码。比如它认出了单词‘the’,只会对应一个专属编码,却根本无法区分组成这个单词的字母T、H、E。”

说到底,谷歌AI摘要这类大语言模型所依赖的“词元”架构,本身就带着天生的局限。研究人员普遍不看好它能彻底摆平拼写问题。

波士顿东北大学专攻大语言模型可解释性的在读博士谢里丹・福伊希特表示:“对语言模型来说,如何准确定义‘单词’本身就是个难题。即便行业专家能设计出一套完美的词元词汇表,模型大概率还是会继续合并或拆分文本片段。依我看,受这种模糊性的影响,根本不存在绝对完美的词元分词器。”

对研究人员而言,拼写问题其实排不上优先级——大语言模型的核心价值本来就不是拼写。但这些一眼就能看穿的失误,倒是给了我们一个很好的提醒:就算AI有时看起来无所不知、高深莫测,它也远远谈不上完美无缺。面对它给出的结果,别急着崇拜,更别盲目信从——核实,永远是第一道防线。

来源:https://www.ithome.com/0/956/579.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

谷歌AI摘要频现低级拼写错误 大语言模型缺陷难根治
AI资讯
谷歌AI摘要频现低级拼写错误 大语言模型缺陷难根治

来,先分享一个今天最新鲜的网络段子。5月28日,有用户用“Google”这个单词去测试谷歌的人工智能:其中包含几个字母p?你猜结果如何?谷歌自己给出的答案是——两个。有趣的是,这并非个例。人工智能摘要(AI Overview)紧接着又声称,“poop”一词里含有一个字母r——这明显与事实不符。此外,

热心网友
05.28
腾讯开源全新Hy3 Preview语言模型预览版
业界动态
腾讯开源全新Hy3 Preview语言模型预览版

4月23日,AI开源社区迎来一个重要新成员:腾讯混元正式发布了Hy3 preview语言模型,并宣布开源。这个模型采用了快慢思考融合的混合专家架构,总参数量达到2950亿,激活参数量为210亿,最大上下文长度支持扩展至256K。 这次发布并非孤立事件。回溯到今年2月,腾讯混元团队进行了一次基础设施层

热心网友
05.26
首个三模式大语言模型发布 4倍吞吐量开启长文本秒级响应
AI资讯
首个三模式大语言模型发布 4倍吞吐量开启长文本秒级响应

大语言模型的生成速度,一直是影响用户体验的关键瓶颈。尤其是在单用户交互场景下,传统的自回归解码方式就像一位字斟句酌的作家,虽然准确,但速度上难免受限。最近,英伟达的一项研究带来了一个颇具碘伏性的思路:为什么非要二选一?他们提出了一个能同时支持三种解码模式的大语言模型系列,仅通过切换注意力模式,就能在

热心网友
05.22
RPA非结构化数据处理中大语言模型应用方法详解
AI资讯
RPA非结构化数据处理中大语言模型应用方法详解

在探讨企业数字化转型的进程中,一个普遍存在的挑战是:真正蕴含价值的信息,往往并不存储在规整的结构化数据库里。行业研究数据显示,企业内部超过80%的数据都以非结构化的形式存在——这包括格式各异的PDF文档、法律合同、会议记录、社交媒体评论以及大量的音视频资料。传统的RPA(机器人流程自动化)在处理规则

热心网友
05.21
蚂蚁Inclusion团队发布大象多语言大模型
AI资讯
蚂蚁Inclusion团队发布大象多语言大模型

近年来,大语言模型领域涌现出众多新面孔,其中由蚂蚁集团Inclusion AI团队研发的百亿参数模型——Elephant(大象),因其卓越的效率表现,被不少用户誉为“国产版Grok 4 Fast”。它并非追求参数规模的庞然大物,而是一款专为高效解决实际问题而设计的“生产力利器”。 简单来说,Elep

热心网友
05.20

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

Paralives首发销量充足 支撑后续开发无需DLC
游戏攻略
Paralives首发销量充足 支撑后续开发无需DLC

《Paralives》开发商承诺所有后续更新永久免费,拒绝付费DLC模式。15人小团队依靠首发销售额即可支撑多年运营,无需依赖额外内容包维持开发,展现了与《模拟人生》系列不同的差异化竞争思路。

热心网友
05.28
比亚迪宋Ultra DM-i上市12.99万 承诺城市领航安全兜底
业界动态
比亚迪宋Ultra DM-i上市12.99万 承诺城市领航安全兜底

2025年5月28日,比亚迪王朝网全新力作——宋Ultra DM-i正式推向市场,共推出5款配置车型,官方售价区间为12 99万至15 99万元。此次定价策略极具突破性:一款拥有310公里纯电续航能力的中型插电混动SUV,直接下探至13万元级别市场。作为王朝网络的新旗舰,该车明确瞄准高频出行需求场景

热心网友
05.28
折叠屏iPhone Ultra外观已定,第三方保护壳亮相
科技数码
折叠屏iPhone Ultra外观已定,第三方保护壳亮相

先来关注一个有趣的细节:苹果首款折叠屏手机,传闻将于今年秋季正式亮相。产品命名可能为iPhone Ultra,也有媒体称之为iPhone Fold——无论最终叫什么,这都将标志着苹果在折叠形态领域首次“出手”。 近日,配件厂商iFunSmart已率先上架iPhone Ultra的首批保护壳——这绝非

热心网友
05.28
山寨币ETF批量上市后市场表现分析 哪些项目值得关注
web3.0
山寨币ETF批量上市后市场表现分析 哪些项目值得关注

山寨币ETF迎来批量上市潮,首批项目市场表现如何?一文分析 Binance币安 欧易OKX ️ Huobi火币️ 最近,市场出现了一个不容忽视的新动向:XRP、DOGE、LTC、HBAR等现货ETF已经悄然登陆美国市场。与此同时,A VAX、LINK等资产的同类产品也正在审批流程中。进入11月以来,

热心网友
05.28
即使在大幅涨价后 Steam Deck 玩家热情依旧再次售罄
游戏攻略
即使在大幅涨价后 Steam Deck 玩家热情依旧再次售罄

近日,公司对SteamDeck1TBOLED版涨价300美元至949美元,上架短短不到24小时便再度售罄。据外界分析,该公司从中国大量补货并分批投放库存,高溢价未影响众多玩家的抢购热情与速度,其人气极其旺盛无比足以支撑快速清空。

热心网友
05.28