一张肉眼难辨图片让GPT-5.4与Claude Opus 4.6集体造谣_AI热点日报

一张肉眼难辨图片让GPT-5.4与Claude Opus 4.6集体造谣

类型：热点整理2026-05-31

不知道你有没有发现，最近一两年，“问问AI”已经悄悄变成了很多人求证信息时的默认姿势。在推特（X）上刷到一张耸人听闻的现场图，第一反应是@Grok让它鉴定真伪；小红书上看到一份帖子，顺手打开豆包或Kimi，让AI评估博主推荐的产品到底靠不靠谱；淘宝、亚马逊页面前犹豫两个商品孰优孰劣，把图甩给Chat

不知道你有没有发现，最近一两年，“问问AI”已经悄悄变成了很多人求证信息时的默认姿势。

在推特（X）上刷到一张耸人听闻的现场图，第一反应是@Grok让它鉴定真伪；小红书上看到一份帖子，顺手打开豆包或Kimi，让AI评估博主推荐的产品到底靠不靠谱；淘宝、亚马逊页面前犹豫两个商品孰优孰劣，把图甩给ChatGPT，要一份“客观”对比。

VLM（视觉语言模型），我们曾以为它们只是“会看图的聊天机器人”。但就在我们没怎么留意的时候，它正在悄悄变成在线信息生态里的事实仲裁者。从社交平台的图片真伪核验、电商导购、内容审核，到反向图像搜索，一句“AI这么说”在越来越多的语境里已经被默认为某种权威。

而正是这份“默认权威”，让来自ETH Zurich的Florian Tramèr团队在最新论文中抛出了一个出人意料的问题：如果AI“看到”的图，根本不是你肉眼看到的那张，会怎样呢？

在Laundering AI Authority with Adversarial Examples一文中，作者系统性地证明了一件令人不安的事：攻击者只需对一张图片做出人眼难以察觉的微小扰动，就能让当今最强的VLM对这张图自信、权威、且错误地作答——而这些回答看上去完全像是AI自己经过深思熟虑得出的结论。

他们管这个叫——AI权威清洗（AI Authority Laundering）。

论文标题：Laundering AI Authority with Adversarial Examples
论文链接: https://arxiv.org/abs/2605.04261

来源：https://www.163.com/dy/article/KU9DOMR30511AQHO.html

Claude

延伸阅读

补充最近整理过的热点入口。

一张肉眼难辨图片让GPT-5.4与Claude Opus 4.6集体造谣

相关热点

延伸阅读