如果你觉得最近AI新闻多得看不过来,那不是你信息过载了——是真的多。

这一周里,Google、OpenAI、Anthropic、Sakana AI四家把各自下半年的底牌亮了出来。SK Hynix甩出一个294亿美元的IPO。Nobel奖得主从DeepMind跳到了Anthropic。梳理下来,有三条主线特别值得关注。
模型层:推理能力不再是卖点,是门票
Gemini 2.5 Pro Deep Think 上线了(6月22日)
Google开放了Deep Think增强推理模式。简单说就是模型在回答前先做多轮假设推演,像人一样「先想清楚再说」。
几个关键数字:
- GPQA Diamond(研究生级科学推理):82.4%。超过了Anthropic Fable 5的79.1%和GPT-5.5的76.3%。
- 编程基准HumanEval :94.1%。
- SWE-bench(真实工程任务):76.4%——比Fable 5低一截(88.6%),但比GPT-5.5高。
结论:Deep Think证明了Google在科学推理这个方向上拿到了领先身位。但SWE-bench上的差距说明编码落地能力还不够。Google的打法是把Deep Think跟$4.99/月的AI Plus订阅、35亿Android设备分布网络打包——这是现在市面上最完整的「模型 + 分发 + 价格」组合拳。对个人开发者来说,如果你需要高性价比的科学计算/论文辅助工具,Deep Think是目前最值得试的。
GPT-5.6 三兄弟来了(6月26日)
OpenAI一次发布了三个模型:Sol(旗舰)、Terra(性价比)、Luna(极速)。Sol据说能独立完成50%的长时间专业任务。全系列首次同时在生物和网络安全评估中拿到「High」评级。
但只有少数合作伙伴能现在就用上,普通开发者得等。
结论:GPT-5.6是OpenAI「六周迭代」的兑现(5.4→3月、5.5→4月、5.6→6月)。三个分层模型的策略是在回应Anthropic的Claude系列(Opus/Sonnet/Haiku)——模型在变成商品,你开始按任务类型和预算选模型,而不是只盯着一款旗舰。值得放进评测矩阵,但现阶段可及性有限。
一句话总结这两家:推理能力正在从「旗舰模型专属功能」变成「基础套餐」。再过半年,不能深度推理的模型大概没人用了。
产品层:AI开始「上班」了,不只是「聊天」
Claude Tag 发布了(6月23日)
这件事比表面看起来大得多。Anthropic把Claude直接嵌进Slack频道里,它不再是等你打开对话窗口的工具,而是像同事一样蹲在频道里。@一下,交代任务,它在频道里公开执行。
几个值得注意的设计:
- 共享身份。张三今天交代的事,李四明天能看到进度接着做。不是某个人的私助,是团队的公共节点。
- 持续记忆。Claude Tag会持续读频道上下文和组织知识,越用越像团队一员。
- 异步工作。你扔个任务,关Slack去开会,它跑完了把结果贴回来。
- 权限隔离。法务频道的Claude看不到工程频道的数据。
Anthropic内部已经在用Claude Tag自动审批和合并产品团队65%的代码变更。
结论:这是Anthropic从「API提供商」转型为「企业工作流操作系统」的关键一步。以前AI是个人工具,现在AI是团队资源。入口从「打开ChatGPT」变成了「在讨论里@一下」。上下文从「每次重新交代」变成了「AI已经看过频道历史」。这件事对AI创业者意味着:模型的竞争正在向下游迁移。光有最好的模型还不够,还得有最好的「进入工作流」的方式。
Sakana AI 发布了 Fugu 调度器(6月22日)
这是一个多智能体编排系统。你调一个API,它自动把任务路由到GPT-5.5、Gemini 3.5、Claude Opus等模型池里最合适的那个。你自己不用管理多套API密钥和路由逻辑。
结论:Fugu解决了一个真实痛点——没人想手动在多模型间切换。但它也有隐患:编排层是黑盒,你不完全知道哪些数据经过了哪个模型。合规场景下这是个坑。另外Sakana把「不受出口管制影响」作为卖点——技术确实精巧,但商业可持续性地缘上有点悬。适合有多模型路由需求、但又不想自己维护路由逻辑的团队先评估着。
资本层:钱从模型层往芯片层跑了
SK Hynix 要融294亿美元(6月24日)
韩国存储芯片巨头SK Hynix正式提交了纳斯达克上市文件,募资294亿美元。这个数字相当于什么概念——全球有史以来规模最大的IPO之一,仅次于沙特阿美。
SK Hynix是Nvidia HBM(高带宽内存)的核心供应商。AI训练芯片对HBM的需求激增,让这家「隐形冠军」的市值已经超过了三星电子。
结论:294亿美元说明AI的钱已经从「模型创业公司」传导到「芯片供应商」再到「存储供应商」。SK Hynix拿到这笔钱会加速HBM扩产,这有望缓解高端AI训练芯片的供应瓶颈。但HBM市场是三家垄断(SK、三星、Micron),价格短期下不来。如果你在做自建推理集群的AI创业公司,这个供应链信号得盯着。
CoreWea ve 进了纳斯达克100(6月22日)
AI GPU云服务商CoreWea ve上市15个月后入选纳斯达克100指数。Q1营收21亿美元,但背着250亿美元债。
结论:AI基础设施服务正式成为华尔街承认的核心赛道。但对用GPU的开发者来说,CoreWea ve本质上是个重资产高杠杆的中间商——GPU云的定价权在芯片厂手里。
人才:Nobel奖得主离开DeepMind去了Anthropic
John Jumper——AlphaFold联合发明人、2024年诺贝尔化学奖得主——在DeepMind干了9年后,6月19日宣布跳槽Anthropic。
同周,Google Gemini联合负责人Noam Shazeer也跳去了OpenAI。Alphabet股价两天跌掉2250亿美元。
结论:这两个人的去向不是偶然的。Jumper加盟的时机正好卡在Anthropic准备IPO之前。信号很明确:下一阶段AI竞争不只是比模型参数,而是比谁能把AI应用到药物发现、材料科学这些硬科技领域,并从中拿到可验证的商业价值。人才从大厂往「更敏捷的挑战者」方向流动,对Google的长期竞争力是个真考验。
本周三条主线,落实到你能做的事
如果你在做模型选型:本周最该上手的是Gemini 2.5 Pro Deep Think(科学推理首选、性价比高)。GPT-5.6放进观察列表等着。Sakana Fugu适合有多模型路由需求的团队先做技术评估。
如果你在做AI产品:Claude Tag代表了AI产品的一个新方向——从「对话窗口」到「工作流嵌入式」。想想你的产品能不能不做成一个「需要用户打开的新工具」,而是嵌入到他们已经每天在用的协作环境里。
如果你在关注AI成本:SK Hynix的294亿IPO说明内存供应会改善,但三家垄断格局意味着AI基础设施成本短期内不会大幅下降。做AI创业的预算模型里,别把硬件降价当成确定性假设。
本文仅关注产品/技术层面,数据来源于官方公告及公开报道。
