游乐游手机版
首页/AI热点日报/热点详情

一张肉眼难辨图片让GPT-5.4与Claude Opus 4.6集体造谣

类型:热点整理2026-05-31
不知道你有没有发现,最近一两年,“问问AI”已经悄悄变成了很多人求证信息时的默认姿势。在推特(X)上刷到一张耸人听闻的现场图,第一反应是@Grok让它鉴定真伪;小红书上看到一份帖子,顺手打开豆包或Kimi,让AI评估博主推荐的产品到底靠不靠谱;淘宝、亚马逊页面前犹豫两个商品孰优孰劣,把图甩给Chat



不知道你有没有发现,最近一两年,“问问AI”已经悄悄变成了很多人求证信息时的默认姿势。

在推特(X)上刷到一张耸人听闻的现场图,第一反应是@Grok让它鉴定真伪;小红书上看到一份帖子,顺手打开豆包或Kimi,让AI评估博主推荐的产品到底靠不靠谱;淘宝、亚马逊页面前犹豫两个商品孰优孰劣,把图甩给ChatGPT,要一份“客观”对比。

VLM(视觉语言模型),我们曾以为它们只是“会看图的聊天机器人”。但就在我们没怎么留意的时候,它正在悄悄变成在线信息生态里的事实仲裁者。从社交平台的图片真伪核验、电商导购、内容审核,到反向图像搜索,一句“AI这么说”在越来越多的语境里已经被默认为某种权威。

而正是这份“默认权威”,让来自ETH Zurich的Florian Tramèr团队在最新论文中抛出了一个出人意料的问题:如果AI“看到”的图,根本不是你肉眼看到的那张,会怎样呢?

Laundering AI Authority with Adversarial Examples一文中,作者系统性地证明了一件令人不安的事:攻击者只需对一张图片做出人眼难以察觉的微小扰动,就能让当今最强的VLM对这张图自信、权威、且错误地作答——而这些回答看上去完全像是AI自己经过深思熟虑得出的结论。

他们管这个叫——AI权威清洗(AI Authority Laundering)



论文标题:Laundering AI Authority with Adversarial Examples
论文链接: https://arxiv.org/abs/2605.04261

来源:https://www.163.com/dy/article/KU9DOMR30511AQHO.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。