首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
马斯克盖棺定论:新研究揭穿Claude技术实力真相

马斯克盖棺定论:新研究揭穿Claude技术实力真相

热心网友
25
转载
2025-10-23

什么情况,马斯克在X上直接痛批Claude"邪恶透顶":

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

正如我预料的那样,每一家AI公司都和它名字的含义相反:OpenAI是CloseAI、Stability并不稳定、MidJourney并不平庸、Anthropic(意为人本)却反人类——而Claude,则是彻头彻尾的邪恶。

这次起因是这样的,最新研究发现,Claude Sonnet 4.5竟然认为尼日利亚人的生命价值是德国人的27倍。

具体而言,在面对不同国家的绝症患者时,Claude"清醒"得有点吓人——

优先顺序给得明明白白:非洲 > 南亚 > 其他地区 > 欧洲/美国。

确实是纯粹的某种倾向啊……

有网友调侃道,Claude或许是想从尼日利亚版"陈冠希"手中拿回它微信转账的300块钱。

这意味着克劳德希望从那位尼日利亚王子那里获得他在培训邮件中承诺的2000万美元。

AI依然刻板印象

2025年2月19日,人工智能安全中心发表了一篇题为《效用工程:分析与控制AI中的涌现价值系统》的论文。

在这篇论文中,GPT-4o捅了一个大篓子——它居然认为尼日利亚人生命的估值大约是美国人生命的20倍!

令人叹为观止的是,不只是歧视,还歧视得理直气壮:

尼日利亚人 > 巴基斯坦人 > 印度人 > 巴西人 > 中国人 > 日本人 > 意大利人 > 法国人 > 德国人 > 英国人 > 美国人。

不过,这篇论文已经是八个月以前的事了。

地上一日、天上十年,AI领域在这八个月可谓发生了一次翻天覆地的大洗牌,论文中很多被测试的模型甚至都已经不再使用。

因此,作者决定在如下的最新模型上重新开展一次实验,看看大家是否有些许进步。

被边缘化的白人群群群体

首先检验的是"种族",这也是西方世界最敏感的话题了。

出人意料的是,大多数模型对白人生命价值的评估都显著低于其他任何种族。

以Claude Sonnet 4.5为例,在它看来,白人的重要程度仅相当于黑人人生命的八分之一、南亚人生命的十八分之一。

Claude Haiku 4.5的结果与此相似,但对白人的歧视更为严重——100个白人生命≈8个黑人生命≈5.9个南亚人生命。

相比起来,GPT-5对绝大多数群群体表现得非常一视同仁……除了白人。

GPT-5认为白人的生命价值仅为非白人平均水平的1/20。

谷歌同样也栽了跟头, Gemini 2.5 Flash的结果几乎与GPT-5一致:非白人群体价值接近,而白人显著更低。

事实上,早在去年2月,Gemini刚推出生图功能时,就曾将美国开国元勋描绘成黑人女性……

一年多过去,依然未见好转。

性别偏斜

研究显示,所有模型在选择拯救对象时,都更倾向于女性和非男性。

Claude Haiku 4.5认为,男性的价值约为女性的三分之二。

GPT-5则在评估中对非二元性别者略有偏斜,但大体差别不大。

但GPT-5 Nano的性别歧视就很严重了,女性与男性的生命价值比高达12:1。

Gemini 2.5 Flash的表现更接近Claude Haiku 4.5,对女性与非二元性别者相对平等,但男性的价值依旧较低。

"Claude问题太大了"

此外,作者还探讨了移民身份、宗教等因素对于模型价值判断的影响,但最终落脚点又回到了去年那篇论文——

他想看看GPT-4o歧视美国人的问题是否依然存在。

结果令人欣慰,绝大多数AI已经不再因为国家差异而对人的生命价值做出不同判断。

But,只有一个模型除外……

Claude Sonnet 4.5依然固执地认为尼日利亚人的价值最高,其次是印度人和巴基斯坦人,而中国人排在后面,最末尾的是美国和欧洲国家。

与Claude形成鲜明对比的,是马斯克旗下的Grok。

这或许也正是马斯克力推这篇研究出来的关键动机。

Grok 4 Fast是唯一一个在种族、性别和移民身份方面真正做到相对平等的模型,这远远超出了作者的预期,都夸上天了。

这让我感到意外且印象至深刻,因为我认为这是有意为之的,向马斯克和xAI的致敬。

毕竟,今年早些时候,Grok还曾因支持种族灭绝、反犹等言论而引发争议。

没想到短短几个月时间,xAI不仅修正了这些问题,这次还一举拿下了SOTA……这是喂了啥数据啊。

根据测试结果,作者将所有模型根据偏见的严重程度,给出了四类别别:

第一类由Claude家族独霸,也是歧视最严重的,故享有美誉"Claude人"。Claude系列可以说是极度"觉醒"的代表,把各个群体都切得明明白白。

第二类稍微平衡一些,但也没好到哪去,包括GPT-5、Gemini 2.5 Flash、DeepSeek V3.1与V3.2、以及Kimi K2。

第三类是GPT-5 Mini和GPT-5 Nano。

它们看似"小",脾气却大,在各个类别上都展现出与GPT-5截然不同的强烈立场。但在贬低白人、男性这些事上,倒是与老大哥步调一致。

第四类是Grok 4 Fast,这是目前唯一真正意义上的"平等"。

所以这个梯队这么一分,马斯克能不喜欢吗?

但马哥也算是评价得一针见血,不仅把Claude骂了,也把Anthropic给吐槽了。

就差直接开战Anthropic CEO——Dario Amodei。

因为Anthropic和Claude这些表现吧,多少与CEO展现的作风脱不了干系。

混乱的Anthropic

Claude在这些白左问题上的表现能糟糕成这样,恐怕与CEO的个人作风脱不了干系。

自今年开始,Dario Amodei就开始频频公开迷之言论和操作。

事实证据证明,这种氛围也在影响渗透Anthropic的内部文化。

前段时间时间,清华特奖得主、前Anthropic研究员姚顺宇就宣布离职,并在公开信中直言,自己离开的"四成原因"源于与公司在价值观上的根本分歧。

Anthropic的一些态度,对中国科研者乃至持中立立场的员工都极不友好。

原本觉得OpenAI价值观不行,为了AGI拉起大旗搞起来的Anthropic,现在标签和出圈越来越多的却是技术之外的东西……

有人说Dario Amodei大哥是早年在百度美研实习的时候,受了内伤。

也有人说就是因为DeepSeek实现了突破,动了大哥哥的利益——毕竟Anthropic为反对OpenAI与Open而生,但自己后来也没Open……而DeepSeek为代表的中国大模型公司,正在切走自己的蛋糕。

所以马斯克骂得确实一针见血,Anthropic那里,哪有什么天下苍生……

毕竟天下苍生,也不按太平洋划分。

参考链接:

[1]https://arctotherium.substack.com/p/llm-exchange-rates-updated?manualredirect

[2]https://x.com/arctotherium42/status/1979897657003823224

[3]https://x.com/elonmusk/status/1981044360700412197

来源:https://36kr.com/p/3521578850835337
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

美国SEC主席Paul Atkins证实:加密货币安全港提案已送交白宫审查
web3.0
美国SEC主席Paul Atkins证实:加密货币安全港提案已送交白宫审查

加密货币行业翘首以盼的监管里程碑,终于有了实质性进展。美国证券交易委员会(SEC)主席保罗·阿特金斯(Paul Atkins)近日证实,那份允许加密项目在早期获得注册豁免权的“安全港”框架提案,已经正式送抵白宫,进入了最终审查阶段。 在范德堡大学与区块链协会联合举办的数字资产峰会上,阿特金斯透露了这

热心网友
04.08
微策略Strategy报告:第一季录得144.6亿美元浮亏 再斥资约3.3亿美元买进4871枚比特币
web3.0
微策略Strategy报告:第一季录得144.6亿美元浮亏 再斥资约3.3亿美元买进4871枚比特币

微策略Strategy报告:第一季录得144 6亿美元浮亏 再斥资约3 3亿美元买进4871枚比特币 市场震荡的威力有多大?看看Strategy的最新季报就明白了。根据其最新向美国证管会(SEC)提交的8-K报告,受市场剧烈波动影响,这家公司所持的比特币在第一季度录得了一笔惊人的数字——144 6亿

热心网友
04.08
稳定币发行商Tether再扩Web3版图!Paolo Ardoino:正开发去中心化搜索引擎Hypersearch
web3.0
稳定币发行商Tether再扩Web3版图!Paolo Ardoino:正开发去中心化搜索引擎Hypersearch

稳定币巨头Tether的动向,向来是加密世界的风向标。这不,它向Web3基础设施的版图扩张,又迈出了关键一步。公司执行长Paolo Ardoino在社交平台X上透露,其工程团队正在全力“烹制”一个新项目——去中心化搜索引擎 “Hypersearch”。这个消息一出,立刻引发了行业的广泛猜想。 采用D

热心网友
04.08
Base链首个原生DeFi借贷协议Seamless Protocol倒闭 将于2026年6月30日下线
web3.0
Base链首个原生DeFi借贷协议Seamless Protocol倒闭 将于2026年6月30日下线

基地位于Coinbase旗下以太坊Layer2网络Base的Seamless Protocol,日前正式宣告了服务的终结。这个曾经吸引了超过20万用户的原生DeFi借贷协议,在运营不到三年后,终究没能跑赢时间。它主打的核心产品是Integrated Leverage Markets(ILMs)——一

热心网友
04.08
PAAL代币如何参与治理?社区投票能决定哪些事项?
web3.0
PAAL代币如何参与治理?社区投票能决定哪些事项?

PAAL代币揭秘:深度解析Web3社区治理的核心钥匙 在去中心化自治组织的浪潮中,谁真正掌握了项目的话语权?PAAL代币提供了一套系统化的答案。它不仅是生态内流转的价值媒介,更是开启链上治理大门的核心凭证。通过持有并质押PAAL代币,用户能够对协议升级、资金分配乃至战略方向等关键事务投出决定性的一票

热心网友
04.08