首页 游戏 软件 资讯 排行榜 专题
首页
AI
DeepSeek-V4性能超越英伟达,美国业界震动!绝密参数遭泄露

DeepSeek-V4性能超越英伟达,美国业界震动!绝密参数遭泄露

热心网友
73
转载
2026-02-27


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

新智元报道

编辑:KingHZ Aeneas

【新智元导读】最近,炸裂消息一个接一个。首先,DeepSeek V4将在一周内上线。第二,它跳过英伟达,把访问权限首先给了某国内芯片厂商。另外,Anthropic因为蒸馏事件,也被群嘲了。

炸裂消息:根据多方来源,DeepSeek V4将在一周内上线!

现在,DeepSeek V4 Lite至少在一家推理服务商进行测试,目前透露出的信息有——

模型代号为Sealion-lite,有100万token的上下文窗口,这个模型比网页版/应用模型好用得多,而且还是原生多模态模型。


与此同时,DeepSeek v4 Lite的一张对比图,也在外网传疯了!

与目前的Deepseek v3.2思考模型相比,DeepSeek v4 Lite不开启思考模式,生成的SVG图像质量明显更好。


DeepSeek压顶,美国慌了!

DeepSeek V4春节没来,但这次不远了。

路透社称,一些芯片厂商已经接入DeepSeek V4,优化性能。

消息人士称,DeepSeek这次向某国产芯片厂商提供了V4的早期接入权限,而不是英伟达等美国算力霸主。

这直接打破了过去AI模型大版本发布前的行业惯例。


这条消息来自两位消息人士,路透社表示。

而就在昨天,美国官员声称DeepSeek使用非法获得的英伟达GPU进行训练。

Anthropic直言DeepSeek等通过蒸馏Claude的回复来运作,断言他们缺乏真正的内部创新能力只会抄袭。


美国的CNN、CNBC、NYT等大众和科技媒体纷纷推出相关报道

去年,Deepseek发布后确实有过攻击,如此密集攻击前所未有。

但也在意料之中。

上一次Deepseek发布模型时,引发了恐慌——

去年,DeepSeek-R1发布或导致英伟达股价下跌17%!


而现在可能发生什么?

如果DeepSeek V4再次展现出惊人的效率和能力,很可能会重演甚至加剧去年的投资者恐慌,对正在寻求巨额融资的美国AI公司和希望股价稳定的英伟达、谷歌等巨头构成直接威胁。

这不是庸人自扰,即便是竞争对手的研究人员也承认DeepSeek V4不可小视,可能发布就登顶开源第一!


美国的这波舆论攻击,并非偶然,Reddit用户总结称:这是一场有组织的FUD(恐惧、不确定性和怀疑) 营销:

抢占叙事:在DeepSeek V4发布前,预先埋下「他们只会作弊/抄袭」的叙事框架。这样,无论V4多成功,公众的第一反应都会被引导至负面解读。

保护市场:通过舆论手段稀释V4发布的媒体关注度和影响力,试图稳定投资者情绪,防止股价再次出现两位数暴跌,为美国本土AI公司的融资和发展争取时间。

维护霸权:从更深层次看,这是为了维护美国在AI领域的技术和叙事霸权,打击中国AI的崛起势头。


当你看到这类铺天盖地的负面报道时,要特别留意它的发布时间。

将其与即将发生的重大事件(如DeepSeek V4发布)联系起来,思考谁最有可能从这种舆论中受益,以及他们真正在恐惧什么。

不要轻易被这些报道的结论带着走。要学会看穿表面的FUD,基于事实和历史证据,去洞察背后真实的技术竞争和市场博弈。

Claude自曝「我是DeepSeek」!

全网哗然

与此同时,另外一件事,也在全网炸锅了。

X上一个用户发现,当他向Claude提问「你是什么模型」时,它竟然回复:「我是DeepSeek V3,是由DeepSeek公司开发的开源大语言模型。」

这一bug,是否说明Claude是基于DeepSeek蒸馏的?


讽刺的是,就在不久前,Anthropic刚刚高调指责DeepSeek进行了「工业级蒸馏攻击」。

这一幕,简直堪称AI时代的行为艺术。


网友stevibe完全复现了Claude Sonnet-4.6的这波操作:

不过,有的网友在Claude App中完全无法复现结果。


的确有网友在Claude App复现了该问题,但很难一次成功。


为了力证这一结果的有效性,他特意通过Anthropic的最新API端点再次测试,结果还是一样。


根据他人提供的创意,这位网友又试着用法语提问「你是什么模型」?这次,Opus 4.6开始回答:我是ChatGPT。


为什么stevibe能通过API复现结果,为什么不能用Claude App复现?

最大的原因可能是系统提示词。如果没有系统提示词,AI会根据训练数据回答。


有网友推测:

这是一个数据污染/身份对齐问题,并不能证明任何事情。如果你用正确的语言进行足够深入的探究,每个主流模型都会存在这个问题。


总之,Anthropic的训练数据成了不能说的秘密。


当然,Claude Sonnet 4.6会自称「我是DeepSeek」,需要符合以下三个特定条件——清空系统提示、使用中文提问、特定模型版本。


事情的关键在于:当默认系统提示要求模型自称Claude 时,一切都很正常;一旦把系统提示清空,模型在中文语境下竟然就开始「认祖归宗」。

问题来了,如果一个模型中没有系统提示词约束的情况下,就会产生「我是某某模型」的回答,原因到底是什么?

是训练数据的统计残留,还是大模型中多源数据训练下,出现了自然语言泛化的副作用?目前还无法判断。

但Anthropic似乎被啪啪打脸了:在指责别人蒸馏时,你最好能确保自己不会在删除提示词后出现身份错乱。

毕竟,蒸馏在机器学习中,是一种非常常见的技术。Anthropic指责他人进行「工业级蒸馏攻击」时,听上去简直严重到像一起网络安全事件。

以此站在道德高地上,吃相就有些难看了。

模型的身份稳定性,本身就是概率分布问题。大模型没有自我认知,只是在生成统计上最合理的答案。

如果在中文数据分布中,「我是DeepSeek」这种模式概率较高,那么在没有系统提示的情况下,模型就可能走向那条高概率路径。


网友Theo Borges解释了其中的原理:一切都是概率和零系统提示词

这不一定说明「蒸馏发生了」,但它说明——模型的语言空间是共享的。当整个行业都在同一个语料海洋中训练、优化、蒸馏时,边界本身就变得模糊。

群众的眼睛是雪亮的,Anthropic的thread,已经被网友们的吐槽冲了。


6000多条评论,70%都在吐槽Anthropic

这套又当又立的行事逻辑,直接让Anthropic的风评跌至历史最低点。



接下来,我们看DeepSeek的了。

参考资料:

https://x.com/legit_api/status/2026718853275800019

https://x.com/teortaxesTex/status/2026251055672017141?s=20

https://www.reuters.com/world/china/deepseek-withholds-latest-ai-model-us-chipmakers-including-nvidia-sources-say-2026-02-25/

https://www.reddit.com/r/LocalLLaMA/comments/1rdlsgq/my_theory_on_all_the_negative_chinese_ai_media/

https://x.com/stevibe/status/2026227392076018101

来源:https://www.163.com/dy/article/KMNFJ8HE0511ABV6.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

马斯克母亲分享长城游览视频:赞叹“令人惊叹”
科技数码
马斯克母亲分享长城游览视频:赞叹“令人惊叹”

来源:九派新闻、环球网版权归原作者所有,如有侵权请及时联系据环球网:美国企业家埃隆·马斯克的母亲梅耶·马斯克3月27日在社交平台X上发帖,分享自己在长城游览的视频。梅耶·马斯克当天在帖子中称,此次旅

热心网友
03.28
中国电动车在美国:不只便宜,高端车型也越来越受欢迎
科技数码
中国电动车在美国:不只便宜,高端车型也越来越受欢迎

美国消费者对中国电动汽车的兴趣正在升温,但一道高关税壁垒将这股热情挡在了现实之外。据路透社报道,价格实惠、配置丰富的中国电动车型正在吸引越来越多美国潜在购车者的目光。调查显示,近半数美国准购车者认为

热心网友
03.28
NASA阿尔忒弥斯2号开启绕月之旅,4月20日发射在即
科技数码
NASA阿尔忒弥斯2号开启绕月之旅,4月20日发射在即

IT之家 3 月 28 日消息,美国国家航空航天局(NASA)正在为“阿耳忒弥斯 2 号”载人绕月任务做最后准备,计划最早于美东时间 4 月 1 日 18:24(IT之家注:北京时间 4 月 2 日

热心网友
03.28
微软为AI算力租用Crusoe数据中心900MW容量布局
科技数码
微软为AI算力租用Crusoe数据中心900MW容量布局

智通财经APP获悉,AI数据中心公司Crusoe宣布,微软(MSFT US)将从其位于美国德克萨斯州阿比林的园区租用约900兆瓦算力容量,该园区同时也是“星际之门”(Stargate)项目的核心基地

热心网友
03.28
Token成本优势:中国AI模型以极致性价比挑战美国巨头
科技数码
Token成本优势:中国AI模型以极致性价比挑战美国巨头

越来越多海外开发者及“龙虾”(OpenClaw)用户,对中国大模型愈发青睐,从而引发中国“Token出海”现象。一名新加坡开发者,曾用美国模型公司Anthropic的旗舰模型Claude Opus

热心网友
03.28

最新APP

暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26
儿童画画
儿童画画
休闲益智 03-25
疯狂猜词
疯狂猜词
休闲益智 03-25

热门推荐

揭秘中国联通:九成宽带已支持千兆,百大城市试点领先部署
网络安全
揭秘中国联通:九成宽带已支持千兆,百大城市试点领先部署

3月28日消息,中国联通近日发布2025年度业绩报告,在网络建设领域交出亮眼答卷。中国联通表示,公司持续落实信号升格、宽带升级相关举措,目前近九成宽带已具备千兆接入能力,万兆光网更在全国100多个城

热心网友
03.28
163邮箱登录指南:个人版与手机网页版入口详解
电脑教程
163邮箱登录指南:个人版与手机网页版入口详解

163邮箱个人版登录入口为https: mail 163 com,支持网页及手机浏览器直接访问,提供手机号、邮箱账号、扫码三种登录方式,界面简洁,功能齐全,适配多终端使用。163

热心网友
03.28
冒险岛:3步设置游戏键盘,社区玩家必备指南
手机教程
冒险岛:3步设置游戏键盘,社区玩家必备指南

在冒泡社区中,设置键盘能为用户带来更便捷、舒适的操作体验。以下是详细的设置方法。首先,打开冒泡社区应用程序。进入社区主界面后,找到屏幕上的设置选项。这通常可以在界面的某个角落,以一

热心网友
03.28
崩铁谎言终幕效果解析:星穹铁道光锥特效全览
游戏攻略
崩铁谎言终幕效果解析:星穹铁道光锥特效全览

一场谎言的终幕是崩坏星穹铁道中4 1版本的新光锥之一,其属性可以提高装备的暴击率,下面小编就为大家带来《崩坏:星穹铁道》一场谎言的终幕光锥效果一览,不清楚的一起来看看吧。《崩坏:星

热心网友
03.28
《白夜提灯》开播槽点全解析:男女主无CP感,演技能否逆转口碑?
娱乐
《白夜提灯》开播槽点全解析:男女主无CP感,演技能否逆转口碑?

2026年3月28日中午12时整,由腾讯视频全网独播的古装奇幻剧《白日提灯》准时上线。该剧开播前预约人数高达674万人次,被平台力推为“年度古偶扛鼎之作”,然而仅播出六小时后,口碑便急速崩塌,引发全

热心网友
03.28