首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
GPT-5表现未达预期,马斯克解散Dojo团队|AI周报

GPT-5表现未达预期,马斯克解散Dojo团队|AI周报

热心网友
87
转载
2025-09-03

本周焦点:GPT-5、Claude Opus 4.1、OpenAI开源模型gpt-oss-120b和gpt-oss-20b、Qwen-Image、Cursor CLI、ElevenMusic、Producer.AI、KittenTTS、Cohere Command A Vision。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

一、重磅产品:OpenAI发布GPT-5——吹响AI智能体时代冲锋号

新闻:OpenAI推出的GPT-5是本周、甚至可能是本年度最重磅的AI产品。公司将GPT-5设定为ChatGPT的默认模型,并称其为“迄今最智能、最快速、最实用的模型”。发布会上,OpenAI重点展示了GPT-5在编程、数学、多模态理解和健康等领域的卓越性能,并现场演示了其强大的AI编程能力:它可以通过“氛围编程”(vibe-code)构建出复杂的应用程序。

GPT 5官方简介视频
打开网易新闻 查看更多视频
GPT 5官方简介视频

ChatGPT中的GPT-5是一个整合了顶尖GPT-5推理模型的统一系统,内置路由机制,可以自动判断何时延长思考时间,以平衡速度和思考深度。

OpenAI还为开发者发布了三款GPT-5 API模型变体:GPT-5、GPT-5 mini以及GPT-5 nano。这些模型的性能和定价都极具竞争力,性价比堪称业界标杆。OpenAI阐述了GPT-5的企业推广策略,强调其将提升自动化水平、推动生产力进步,开启“工作新纪元”。媒体认为,GPT-5标志着整个行业向AI智能体的根本性转变。这款模型融合了工具与推理的能力,以及出色的AI编程水平,使其成为构建AI智能体的理想模型。

但由于GPT-5上线后表现不及预期,引发用户不满,OpenAI紧急宣布重新上线GPT-4o,供Plus和Team用户使用。

锐评:靴子终于落地,只不过到底是神是鬼?

二、AI技术与产品发布——各路豪强纷纷亮剑

1. 新闻:Anthropic发布Claude Opus 4.1。这是Opus 4的升级版,专注于智能体任务、真实世界编程和推理能力。Claude Opus 4.1在SWE-bench Verified测试中的得分率为74.5%,较Opus 4提升2个百分点,与GPT-5持平。这款模型已经向Claude付费用户开放,并可通过Claude Code及其他AI编程助手调用其API,价格与Opus 4持平。

\ 打开网易新闻 查看精彩图片

锐评: 主打一个“精准对标”GPT-5。

2. 新闻:OpenAI发布两款全新开源AI模型gpt-oss-120b和gpt-oss-20b。这是自GPT-2以来OpenAI首次发布开源模型。这两款gpt-oss模型均采用Apache 2.0许可协议,都是高效的混合专家(MoE)架构模型,支持私有化和本地化部署。基准测试显示这两款模型性能优异,数学和编程表现尤为突出。但有迹象表明,这些模型可能针对基准测试做过专门优化,社区反馈也指出其在常识和创造性推理方面存在局限。目前,这两款模型已上线HuggingFace、Ollama及众多API平台,是对开源社区的重要贡献。

锐评: 像是为了考试专门刷过题的尖子生。

3. 新闻:谷歌DeepMind发布了其AI“世界模型”(world model)的新版本Genie 3。这款模型能够基于用户提示词,实时生成可供用户及AI智能体进行交互的3D环境。据谷歌介绍,Genie 3在互动时长和场景记忆的连贯性上,均较上一代版本有显著提升。

谷歌Genie 3官宣:一句话生成3D世界
打开网易新闻 查看更多视频
谷歌Genie 3官宣:一句话生成3D世界

锐评: 未来人人都能开发《我的世界》了。

4. 新闻:阿里巴巴通义千问团队发布开源AI图像生成器Qwen-Image。这款模型以高精度的文本渲染和精准遵循指令的能力而著称,在图像生成和编辑方面见长。尽管初期测试结果褒贬不一,Qwen-Image仍是顶级开源模型之一,能为企业提供灵活支持多种语种脚本和复杂版式的内容创作工具。这款模型采用Apache 2.0许可协议,可免费商用,已经上线HuggingFace和QwenChat。

\ 打开网易新闻 查看精彩图片

锐评: 专治AI画图“鬼画符”的老毛病。

5. 新闻: ElevenLabs发布文本转音乐模型ElevenMusic,跻身音乐生成领域。ElevenLabs表示,这款模型几乎可用于所有商业用途,目前已经上线ElevenLabs官网,面向开发者的API也即将开放。

锐评: 自动写歌还不用担心抄袭问题。

6. 新闻:原Riffusion团队最新发布AI音乐智能体Producer.ai。它被称为“AI歌曲创作的最新维度”,可用于交互式歌曲创作。据Producer官方介绍,这款产品能帮助用户实现艺术构想,运用前沿模型与用户共同创作、编辑和混音,打造录音室品质的原创歌曲。整个过程中还能与用户共同学习。

锐评:未来KTV的热歌榜,一半是人类歌手,一半是“电子歌姬”。

7. 新闻:Cursor推出了其产品的命令行界面(CLI)版本,在AI编程助手领域向Claude Code和Gemini CLI发起挑战。

锐评:敲代码的“小黑窗”,也要用AI来武装。

8. 新闻: Cohere发布Command A Vision。这是一款参数量高达1120亿的视觉模型,专为企业应用场景打造。据称,其性能超越竞品,擅长通过OCR和分析解读图表、示意图、扫描文档和图像。Cohere同时宣布North平台正式上线。这是一个“能安全访问用户工作中所有数据的智能体AI平台”,通过企业托管方式运行AI智能体应用。

锐评:一键解读眼花缭乱的图表,堪称打工人的福音。

9. 新闻:微软推出免费图像转3D工具Copilot 3D。该工具可将图片转换为GLB格式的3D渲染文件,适用于三维查看器、设计工具和游戏引擎,用户可通过微软Copilot Labs访问。早期测试表明,这款工具在处理人物和动物方面存在局限。

锐评:再也不用花大钱学3D建模了。

10. 新闻:谷歌为财经信息与商业新闻工具Google Finance带来了AI功能升级。用户现在可使用AI研究金融问题、访问高级图表工具,并获取包括大宗商品和加密货币在内的实时数据与新闻。

锐评:以前炒股靠玄学,现在靠AI。

11. 新闻:谷歌于本周三正式发布AI编程智能代理工具Jules。这款产品于今年5月在Google I/O开发者大会上首次公开亮相,基于谷歌的Gemini 2.5 Pro模型,采用异步、代理式架构,能够与GitHub深度集成。开发者可分配任务后关闭电脑,无需实时监控。免费版任务上限已下调至每日15个,订阅费用每月19.99美元起。

锐评:它干活,你摸鱼。

12. 新闻:Anthropic在API和Vertex AI平台上正式推出“搜索结果内容块”功能,为检索增强生成(RAG)应用提供了能够标注来源的原生引用功能。

锐评:这下不用担心AI胡诹了,每条内容可都是有出处的。

13. 新闻:AWS在Bedrock平台全面开放“自动化推理检查”功能,旨在帮助企业更放心地部署AI。这一功能使用基于数学的验证方法来检测和防止模型产生幻觉。

锐评:大模型也得老老实实讲逻辑。

14.新闻:一款仅有1500万参数的微型文本转语音模型KittenTTS发布。这款模型可以在CPU上运行,让在算力有限的边缘设备上实现语音交互成为可能。

锐评:搭载集显的老古董也能玩转AI文本转语音。

15.新闻:Anthropic为Claude Code平台推出自动安全审查功能,引入了可扫描代码漏洞并提出修复建议的工具。这个AI驱动的解决方案通过终端命令和GitHub审查直接集成到开发者工作流中,旨在解决因AI加速软件开发导致代码安全保障跟不上节奏的问题。

锐评:这是给狂飙的AI编程装了个刹车。

三、AI研究资讯——模型也练内功心法

1.新闻:谷歌研究团队利用主动学习筛选方法,在保持甚至提升质量的同时,将模型微调所需的训练数据量减少了10000倍。团队报告称,使用500个精选数据集微调的模型与人类判断的一致性,较使用10万个众包基线数据集高出65%。这项研究彰显了高质量数据在微调AI模型中的巨大威力。

锐评:谷歌用行动证明,给AI“减负”进行“素质教育”,效果比“填鸭式”教学好得多。

2.新闻:Anthropic的一项新研究引入“人格向量”(persona vectors)的概念,用于识别、监控和控制大语言模型中的性格特征。这些位于模型内部空间中的向量方向对应着不同的性格特质,有助于管理不良行为。这一技术通过论文《人格向量:监控和控制语言模型中的性格特征》(Persona Vectors: Monitoring and Controlling Character Traits in Language Models)公开发表,它支持主动筛选训练数据并直接“引导”模型,使其行为更为稳定、更可预测。

锐评:AI也有了家长控制模式。

四、AI商业与政策——几家欢喜几家愁

1.新闻:OpenAI本周宣布,旗舰产品ChatGPT的周活跃用户数将达到7亿,较今年3月的5亿有显著增长,同比增幅超过四倍。 此外,报道称,OpenAI的付费企业用户数已从今年6月的300万增至500万。另外,公司的年度经常性收入(ARR)也已从6月的100亿美元增长至130亿美元,并有望在年底前突破200亿美元。

\ 打开网易新闻 查看精彩图片

锐评:ChatGPT不光是聊天工具,还成了OpenAI的印钞机。

2.新闻:OpenAI正就一轮新的股票出售进行早期洽谈。这轮交易旨在允许员工套现,Thrive Capital等现有投资者正商讨参与其中,届时公司估值或将达到约5000亿美元。

锐评:多少OpenAI员工要提前实现财富自由。

3.新闻:Meta收购AI语音初创公司WaveForms,收购金额未披露。这是继近期收购PlayAI之后,Meta为扩充“超级智能实验室”(Superintelligence Labs)而实施的最新举措。

锐评:小扎主打一个“打不过就买过来”。

4.新闻:Windsurf等公司因使用AI编程模型成本高昂而面临“严重负毛利率”。Cursor等热门服务正在调整定价来应对严峻行业挑战,其他公司则在激烈竞争和成本压力下考虑出售或自建AI模型。

锐评:AI是真的贵。

5.新闻:特斯拉解散Dojo超级计算机团队,终止为自动驾驶技术自研AI芯片和超级计算机的计划。该团队核心人员已离职并加入AI数据中心初创公司DestinyAI。Dojo团队负责人离职,其余成员将被调往其他岗位。这意味着特斯拉将更加依赖英伟达,同时也将依赖三星生产的AI6芯片。

锐评:造车和造芯是两码事,马斯克最终还是选择将专业的事交给专业团队。

6.新闻:Duolingo宣布季度营收超出预期,股价上涨近30%,该公司曾因拥抱生成式 AI并逐步淘汰外包员工而引发争议。Duolingo现已转型为“AI 优先”,新增148门语言课程,产品数量翻倍。Duolingo预计今年营收将超过10亿美元,活跃用户增长40%。

锐评:不是外包不努力,而是AI太给力。

7.新闻:马斯克宣布,X平台将在Grok AI的回复中引入广告。广告商可以付费,让他们的解决方案在用户向Grok 提问时以推荐的形式出现。这一策略旨在提升广告投放的精准度,并增加X平台的广告收入以支持运营。

锐评:宇宙的尽头是“广告位招租”。

8.新闻:Perplexity为Truth Social的新搜索引擎“Truth Search AI”提供技术支持。这一AI搜索引擎能提供带引用的答案,但其信息来源受Truth Social控制。

锐评:这是AI加持的“信息茧房”,主打一个精准投喂。

9.新闻:谷歌否认AI搜索功能正在扼杀内容出版商流量,坚称自然点击量与去年同期相比“相对稳定”,且质量有所提高。谷歌将流量变化归因于用户转向论坛和社交媒体寻找真实内容,而非AI影响所致。

锐评:这锅甩得叫一个专业。

10.新闻:2025世界机器人大会在北京开幕。本届大会以“让机器人更智慧,让具身体更智能”为主题,吸引了200余家国内外机器人相关企业、1500余件产品参展,其中100余款为首发新品,人形机器人整机企业数量创下全球同类展会之最。

宇树科技发布新款四足机器狗
打开网易新闻 查看更多视频
宇树科技发布新款四足机器狗

锐评:这哪里是展会,简直就是机器人开年会。

五、AI观点与评论——GPT-5能成为AGI的前奏吗

1.新闻:各界对GPT-5的发布反响不一。软件开发达人Theo在试用后表示,“我没想到它能这么好用。这真是个非常出色的模型。”但更多评测则更为客观中肯,既承认其优点也指出了问题。一些评测者发现,编程方面Opus 4.1略胜一筹,但比GPT-5贵得多,而GPT-5要优于Sonnet 4。《经济学人》对GPT-5的评价是:“GPT-5并非某些人所期待的颠覆性飞跃。但这类模型若能持续进步数年,便可催生出具有颠覆性力量的AI系统。”

锐评:不是GPT-5不够强,而是大家对它的期望太高。

2.新闻:DeepMind首席执行官称AGI时代即将到来。戴密斯·哈萨比斯(Demis Hassabis)在接受采访时表示,他预计AGI(通用人工智能)可能在5到10年内到来,并称其影响可能“比工业革命大10倍、速度也快很多”。他同时强调AI带来的巨大生产力与“激进富裕”的可能性,但也指出了随之而来的分配问题与社会挑战。

锐评:离“科幻照进现实”,可能就差两届世界杯的时间了。(辰辰)

来源:https://www.163.com/tech/article/K6LT1FCO00097U7T.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

xAI创始团队宣告结束,最后一位联合创始人已离职
业界动态
xAI创始团队宣告结束,最后一位联合创始人已离职

与SpaceX合并的人工智能初创公司xAI,近期正迎来人事的巨大变动。最新消息称,xAI创始团队中的最后一名联合创始人Ross Nordeen已在上周五离职。此前,领导xAI预训练团队的联合创始人M

热心网友
03.30
《为了全人类》主创解读硅谷职场:我们懂现实创业困境
娱乐
《为了全人类》主创解读硅谷职场:我们懂现实创业困境

来源:环球市场播报  在 Apple TV + 的另类历史太空竞赛剧《为了全人类》(For All Mankind)中,虚构的人类在五季剧情里完成了无数壮举:他们登上了月球,也踏足了火星;让女性入主

热心网友
03.30
硅谷血案:一句谎言致奥尔特曼出走,OpenAI濒临致命危机
业界动态
硅谷血案:一句谎言致奥尔特曼出走,OpenAI濒临致命危机

编辑 | 王凤枝谎言被当面戳穿的那一秒,达里奥·阿莫代伊(Dario Amodei)就知道,他与山姆·奥特曼(Sam Altman)的合作彻底走到了尽头。2020年底,OpenAI内部爆发了一场信任

热心网友
03.30
马斯克xAI创始11人集体离职,项目前景引发关注
科技数码
马斯克xAI创始11人集体离职,项目前景引发关注

3月30日消息,据IT之家援引外媒报道,埃隆 · 马斯克最初组建的 xAI 创始团队,现已全部离场。据知情人士透露,11 名联合创始人之一的罗斯 · 诺丁已于当地时间 3 月 27 日正式离开 xA

热心网友
03.30
马斯克AI创业搭子“全跑了”:真相与项目复盘
AI
马斯克AI创业搭子“全跑了”:真相与项目复盘

智东西3月29日报道,今天,xAI联合创始人罗斯·诺丁在社交平台X上悄然移除了自己的xAI员工认证,离开了这家以马斯克为首的AI独角兽。至此,xAI最初的12名联合创始人中,仅剩马斯克一人。诺丁的x

热心网友
03.29

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

OPPO A6k 手机上市:天玑 6300 + LCD 直屏 + 7000mAh 电池,定价 1999 元起
科技数码
OPPO A6k 手机上市:天玑 6300 + LCD 直屏 + 7000mAh 电池,定价 1999 元起

OPPO A6k手机重磅发布:天玑6300处理器、高清LCD直屏、7000mAh超大电池,售价仅1999元起 OPPO旗下广受欢迎的A系列再添实力新机。近日,备受期待的OPPO A6k正式上市发售。这款新品搭载了备受好评的天玑6300八核处理器,并配备了一块容量高达7000mAh的耐用长寿电池,成为

热心网友
04.06
《红色沙漠》熔化锁链的火焰任务攻略-支线任务完成方法详解
游戏攻略
《红色沙漠》熔化锁链的火焰任务攻略-支线任务完成方法详解

速览 在《红色沙漠》的广阔世界中,数量丰富的支线任务与主线剧情共同构筑了沉浸式的冒险体验。其中,“熔化锁链的火焰”任务作为瑟金斯家族剧情线的关键环节,其触发机制与主线进程紧密相连。任务并非随时可用,玩家需将主线故事推进到特定阶段后,任务才会自动添加至任务日志。本篇攻略将为你详解此支线任务的接取条件与

热心网友
04.06
《异种航员2》运动机制详解-战术移动与时间单位消耗
游戏攻略
《异种航员2》运动机制详解-战术移动与时间单位消耗

《异种航员2》运动机制深度解析 在《异种航员2》(Xenonauts 2)的策略战斗中,对“时间单位”(TU)的高效运用是取胜的核心。每个士兵的移动、射击乃至战术配合,都依赖于玩家对TU的精确规划。操作上手简单:选中单位后,直接使用鼠标左键点击目的地方格,系统便会清晰显示移动所需消耗的时间单位,帮助

热心网友
04.06
《异种航员2》封面机制详解-掩体闪避效果介绍
游戏攻略
《异种航员2》封面机制详解-掩体闪避效果介绍

速览 在《异种航员2》(Xenonauts 2)的战局中,掌握“战术规避”与精通“火力输出”同等关键。游戏全新设计的掩体系统,是提升你作战小队生存几率的战略性核心。简言之,战场上绝大多数可见的物体都能转化为你的战术屏障。无论是散落的木箱、残缺的矮墙,还是茂密的灌木丛与坚实的建筑物,巧妙地利用它们,就

热心网友
04.06
《红色沙漠》超凡建造物任务攻略-任务流程详解
游戏攻略
《红色沙漠》超凡建造物任务攻略-任务流程详解

速览 在开放世界大作《红色沙漠》中,庞大的支线任务系统为玩家提供了丰富的探索体验。其中,“超凡建造物”任务是阿方索家族势力任务线中的重要一环。要成功接取此任务,玩家必须首先完成其前置任务【枪械名门】。在此之后,任务的下一步关键操作是前往游戏中标注的特定建筑地点进行互动调查——这本质上是一个用于快速移

热心网友
04.06