首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
一周AI看点:GPT-5.1情商跃升,AI巨头伊利亚离职风波

一周AI看点:GPT-5.1情商跃升,AI巨头伊利亚离职风波

热心网友
30
转载
2025-12-06

一、重磅工具:“空间智能”正式上线,AI开始自己造世界

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

新闻:World Labs发布世界模型Marble。这个生成式AI世界模型允许用户根据文本、图像、视频和3D布局等多种输入,生成可持续交互的3D环境。这些模型基于渲染场景中的高斯溅射特征生成3D世界,能在用户探索时保持一致性。

\

World Labs一直在开发能够突破空间智能边界的世界模型,其理念基于该公司创始人李飞飞所提出的“空间智能是AI下一个前沿”。空间智能是AI理解物理世界的基础,支持创建和编辑交互式AI世界;这项技术有望成为一种基础性的AI模型技术,既能服务于视频和图像的生成式AI模型,也能支持机器人和自动驾驶汽车等与物理世界交互的AI模型。

\

锐评:这是要造出《黑客帝国》母体的节奏。

二、AI技术与产品发布:从会说话到会“说人话”,个性成GPT-5.1新亮点

1. 新闻:本周OpenAI发布GPT-5.1。作为GPT-5的更新版,GPT-5.1旨在实现更“富有人情味”的交互体验。它提供两种主要模式:GPT-5.1 Instant (即时模式),用于快速、热情、遵循指令的聊天;以及GPT-5.1 Thinking(思考模式),用于更持久的多步骤推理。即时模式能提供快速、友好的回答,而思考模式则会在处理复杂任务时自动放慢速度。而在“自动”模式下,ChatGPT会自动将用户任务分配给最合适的模式。

\

GPT-5.1还包含一套更丰富的个性预设(默认、专业、友好、坦诚、古怪、高效、书呆子气、尖酸刻薄),让用户可以通过设置微调回复的语气。GPT-5.1的发布公告并未提及新模型的推理或基准测试能力有何具体提升,而旧版GPT-5模型将会保留数月时间。

评测指出,GPT-5.1感觉更“温暖”、更具个性化,解决了此前GPT-5缺乏个性的问题,在交互式聊天中对指令的响应和遵循能力也有所改善。TechRadar的日常使用评测称GPT-5.1“能力更强且更可控”。Digital Trends则表示:“我更喜欢用Gemini,但GPT-5.1更新可能会让ChatGPT成为你真正想用的AI助手。”

OpenAI还扩展了ChatGPT的协作功能,允许多人与同一个AI对话。GPT-5.1中的这项功能主要针对项目工作、规划和学习小组的需求,允许用户邀请朋友加入进行中的ChatGPT对话,并看到AI结合上下文回复每个人的消息。

锐评:GPT情商拉满,终于学会“好好说话”了。

2. 新闻:百度发布ERNIE-4.5-VL-28B-A3B-Thinking,这是一个基于混合专家(MoE)架构的新型多模态推理模型。其总参数量为280亿,但每个token仅激活30亿参数。ERNIE-4.5-VL-28B-A3B-Thinking能够处理图表理解、视频理解、视觉定位和工具增强的图像搜索等视觉推理任务。在MathVista和其他VQA(视觉问答)套件等基准测试中,它的表现与Gemini 2.5 Pro和GPT-5.1相当,但模型规模要小得多。ERNIE-4.5-VL-28B-A3B-Thinking基于Apache 2.0开源许可协议,其文档、演示以及权重已同步上线Hugging Face。

\

锐评:百度这波“以小博大”,证明“浓缩就是精华”,顺手还给开源了。

3. 新闻:ElevenLabs推出Scribe v2 Realtime,这是该公司最新的用于实时转录的低延迟语音转文本模型。Scribe v2 Realtime能以低于150毫秒的延迟转录语音,目标应用场景包括语音助手、会议助手和实时字幕,并支持90多种语言。ElevenLabs为使用其API的用户和开发者提供了产品页面和技术文档。

锐评:话音未落,已转录成文。

4. 新闻:谷歌更新Android和iOS平台上的Gemini Live,提供更具适应性和表现力的语音功能。用户现在可以调整语速,听到更细微的语调和节奏变化,还可以要求AI用不同角色的口音来讲故事。新版应用还改进了AI对语言学习和练习对话的支持。此外,Gemini Live API中新增的本地音频模型降低了延迟,提升了语音优先应用的性能。

锐评:除了不像人会喘气,啥音都会。

5. 新闻:谷歌在其搜索的AI模式以及Gemini应用中推出了一整套AI购物工具。对话式购物功能可以从包含约500亿个产品列表的图谱中提取信息;“智能结账”功能可跟踪价格,并在商品价格降至用户设定阈值以下时通过Google Pay自动下单;“让Google致电”的智能体功能可代替用户致电本地商店,查询库存和促销信息。

锐评:这下网购花钱更快了。

6. 新闻:Terminal-Bench基准测试已更新至2.0版。Terminal-Bench是一个开源基准测试,包含89个实际终端任务,用于评估AI智能体在真实Shell环境中的操作能力。Terminal-Bench团队还发布了基于容器的标准框架Harbor,可以让不同智能体在相同任务上进行可复现的评估。Terminal-Bench的公开排行榜会跟踪各智能体在终端AI自动化任务上的表现。

锐评:智能体考试也越来越难,还要比拼敲命令行。

7. 新闻:总部位于巴黎的H Company公司发布新一代多模态模型Holo Two,旨在推动跨平台的计算机使用智能体。Holo Two模型有40亿、80亿和300亿-A3B MoE三种规模,均是经过调优的视觉语言模型,用于在真实GUI(图形用户界面)中进行定位、导航和任务执行。这些模型使智能体能够“查看”屏幕,并通过点击和按键来控制屏幕;它们可以在网页、桌面以及移动端运行。Holo Two模型现已开放权重并上线Hugging Face平台。

锐评:能看屏幕、能点按钮、能跑GUI,这不是把坐办公室的活全包了嘛。

8. 新闻:新发布的Robyn是前医生Jenny Shao创建的一款富有同理心的AI伴侣。作为一款iOS应用,Robyn的定位并非替代心理医生,而是一个高情商的伙伴。它能记住用户的详细信息,具备长期跟踪模式,可以提供关于压力、情感依恋风格和习惯方面的见解,同时为了确保安全还内置了防护措施和危机响应流程。

锐评:明明白白你的心,渴望一份真感情。

9. 新闻:Gemini 3和Nano Banana 2即将发布。Gemini 3预览版现已在LMArena上线,代号为“riftrunner”。谷歌新一代AI图像模型Nano Banana 2也已以预览形式出现在Gemini应用内。Nano Banana 2在角度和视点方面具备更强的类相机控制,改进了文本渲染能力,并采用多步骤的“规划、生成、评估、修复”工作流,在呈现最终结果前会反复自我修正图像。

锐评:还会反复纠错,AI出图这是要卷到用户满意为止。

三、AI研究动态:小模型打出大智慧,多语言多环境AI纷纷出炉

1. 新闻:Meta推出语音识别系统Omnilingual ASR,能支持超过1600种语言和方言。Meta表示,Omnilingual ASR是“被设计成一个社区驱动的框架”,其中包含一套用于自动语音识别 (ASR) 的新型开源AI模型和一个涵盖350种冷门小语种的转录语音数据集。这些AI模型的参数量从3.5亿到70亿不等,均基于Meta的wav2vec 2.0架构开发。Meta在论文《Omnilingual ASR:支持1600多种语言的开源多语言语音识别》中公布了他们的研究成果。

锐评:能不能听懂我们的温州话?

2. 新闻:微博AI发布VibeThinker-1.5B,并在论文《小模型,大逻辑:多样性驱动优化在VibeThinker-1.5B中激发大模型推理能力》一文中对其进行了介绍。VibeThinker-1.5B是一个15亿参数的推理模型,针对数学和逻辑任务进行了优化,在数学推理基准测试中的得分超过许多大模型。这款AI模型采用多样性驱动的优化策略,能从规模更小的网络中激发出大模型风格的推理行为。

锐评:证明参数不是一切,大模型被啪啪打脸。

3. 新闻:谷歌DeepMind推出基于Gemini的智能体SIMA 2,它可在3D虚拟世界和商业游戏中运行,通过感知屏幕和控制键盘鼠标来执行任务。据描述,新版比SIMA 1更通用且自我改进能力更强,能够处理先前没见过的环境和更复杂的任务。目前SIMA 2仍是一个研究性AI模型,但被DeepMind视为迈向通用智能体、可在丰富模拟环境中通过交互进行学习的重要一步。

锐评:SIMA 2靠“看屏幕、敲键鼠”就能通关,人类玩家的“高光时刻”不多了。

四、AI商业与政策:淘金热度不减,连杨立昆也坐不住了?

1. 新闻:Anthropic宣布将在未来十年向美国AI基础设施投资500亿美元,在得克萨斯州和纽约州建立AI数据中心,以满足30多万商业客户对Claude日益增长的需求。这些项目预计将创造约800个永久性工作岗位和2400个建筑工作岗位,也符合美国保持先进计算领域领导地位的AI战略。

锐评:哪是训练Claude,这分明是在用钞票给AI筑巢。

2. 新闻:Meta首席AI科学家杨立昆(Yann LeCun)计划离开Meta,创办自己的公司。他的离职反映出Meta AI团队的人事动荡;但这也可能是机遇,或将催生出一个更注重研究的AI实验室,追求的成果完全不同于那些专注于大语言模型的AI公司。


锐评:小扎的钞能力不好用了?

3. 新闻:AI原生代码编辑器开发商Cursor宣布完成23亿美元D轮融资,估值达到293亿美元。该公司现已用其热门产品Cursor给自己命名,据称2025年营收增长了100倍,并表示年化营收突破10亿美元大关,客户包括数百万开发者和许多全球顶尖的工程组织。考虑到Cursor惊人的营收增幅,高达290亿美元的估值也就不足为奇了。

锐评:AI时代最赚钱的不是造AI,而是给造AI的“码农”造工具。

4. 新闻:欧洲数据保护监察局 (EDPS) 发布AI风险管理指导文件,为欧盟机构提供在数据保护法框架下如何管理AI系统风险的实用指南。这份名为《AI系统风险管理指南》的文件概述了在公共部门部署AI时进行风险评估、文档记录和人工监督的步骤,并将指导意见与《通用数据保护条例》的义务和欧盟最新的《AI法案》对齐。

锐评:模型还没跑起来,文件倒出了不少。

五、AI观点与文章:狂飙之后,该谁来付“电费”

新闻:彭博社专栏作家警告称,随着超大规模云服务商纷纷锁定数据中心所需的大量能源供应,AI“电力争夺”正与能源可负担性发生冲突。如果AI电力需求上涨冲击到能源价格,可能会引发公众的强烈反对和监管介入。

这种担忧并非首次出现,但政策制定者和企业需要解决谁来为AI能源需求背后的基础设施买单的问题。否则公众反对建设AI数据中心的声音将会越来越大。

锐评:再不解决“电费谁出”的问题,小心公众拔插头。(辰辰)

来源:https://www.163.com/tech/article/KEI7SJNR00097U7T.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

上海滨江惊进化龙虾,百种虾类上演生存竞争
科技数码
上海滨江惊进化龙虾,百种虾类上演生存竞争

“安装龙虾送Token”“OpenClaw实战应用”“OpenClaw攻防实战”……周六一早,2026全球开发者先锋大会就迎来了汹涌人潮,“龙虾”相关体验区更是人气爆棚,现场一片“百虾大战”的景象。

热心网友
03.29
知声AI年收入12亿,硬核增长与盈利未来可期
AI
知声AI年收入12亿,硬核增长与盈利未来可期

智东西作者|三北编辑|漠影智东西3月26日报道,刚刚,云知声交出了一张“硬核成绩单”。该公司2025年营收12 1亿元,同比增长29%;其中大模型相关收入达6 1亿元,同比暴涨1076%,首次撑起半

热心网友
03.27
新加坡理工团队开发超高精度语音识别模型
科技数码
新加坡理工团队开发超高精度语音识别模型

这项由新加坡Knovel工程实验室开展的研究成果,发表于2026年3月17日的arXiv预印本(编号:arXiv:2603 16184v1),为多语言自动语音识别领域带来了令人瞩目的突破。对于那些想

热心网友
03.26
连续24年建言两会,科技代表解析中国AI领跑关键
科技数码
连续24年建言两会,科技代表解析中国AI领跑关键

全文共2199字,阅读大约需要5分钟“未来每个人都将拥有专属的人工智能助手,它可通过车载、手机、家居、床头、厨房等各类终端与我们交互”。北京商报记者丨魏蔚2026年全国两会期间,全国人大代表、科大讯

热心网友
03.11
对话刘庆峰:AI硬件形态重塑,迈向无边界未来
科技数码
对话刘庆峰:AI硬件形态重塑,迈向无边界未来

2026年全国两会期间,全国人大代表、科大讯飞董事长刘庆峰的公文包里多了一件特别的 "随行装备 "——一台能装进口袋的智能办公本。这不仅是一台录音设备,更是一个搭载着自主可控大模型的 "随身秘书 ",会议内

热心网友
03.11

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

《洛克王国》世界圣羽翼王打法攻略-圣羽翼王技能与实战详解
游戏攻略
《洛克王国》世界圣羽翼王打法攻略-圣羽翼王技能与实战详解

速览攻略:世界圣羽翼王核心打法与全面解析 本攻略将为你完整呈现《洛克王国》世界圣羽翼王的通关秘籍,深度剖析两种高效实战打法:追求极致速度的“燃薪虫四回合速通”与稳定输出的“酷拉无限连击流”。文章将进一步解析这位翼系精灵王的技能机制、属性克制关系及其在PVE与PVP中的实战定位,帮助你彻底掌握应对其隐

热心网友
04.06
《异种航员2》工程系统详解-工作坊与资源管理指南
游戏攻略
《异种航员2》工程系统详解-工作坊与资源管理指南

速览:工程系统核心机制解析 在《异种航员2》中,工程系统是整个抵抗力量赖以运转的“战略后勤中枢”。无论是研发新武器、生产重型装甲还是制造先进飞行器,所有实体装备的产出都依赖于此。简言之,该系统的核心运作围绕着两大关键:工程师人力的高效配置与全球稀缺资源的精细化调度。工程师的数量直接决定了每个项目的建

热心网友
04.06
《洛克王国世界》治愈兔位置详解-任务与战斗关键精灵
游戏攻略
《洛克王国世界》治愈兔位置详解-任务与战斗关键精灵

核心速览 在《洛克王国世界》中,治愈兔是一位兼具功能性任务角色与实战辅助能力的精灵。它的价值不仅在剧情推进中体现,更在于对战里出色的治疗与防护表现。本文将为你全面解析治愈兔的精准获取位置、种族属性特点以及实战技能搭配,助你顺利捕捉并最大化其在队伍中的作用。所有关键信息将通过清晰的图文内容详细展示,确

热心网友
04.06
《红色沙漠》传说之狼打法-传说之狼击杀流程详解
游戏攻略
《红色沙漠》传说之狼打法-传说之狼击杀流程详解

速览 在《红色沙漠》中,挑战传说之狼这一强大的任务BOSS,需要玩家进行充分的准备并遵循完整的任务流程。整个过程环环相扣,你必须首先参与塞莱斯特家族的势力任务,通过完成任务将家族声望提升至指定等级,才能解锁【传说之狼】的专属讨伐任务,最终直面这个传说中的强大生物。 红色沙漠传说之狼怎么打 归根结底,

热心网友
04.06
《宝可梦Pokopia》舒适度提升攻略-环境等级与栖息地优化指南
游戏攻略
《宝可梦Pokopia》舒适度提升攻略-环境等级与栖息地优化指南

【宝可梦Pokopia】舒适度全解析:快速提升环境等级的核心秘诀 你是否正在探索《宝可梦Pokopia》世界,并希望有效提升宝可梦栖息地的舒适度?舒适度不仅是衡量宝可梦快乐程度的晴雨表,更是解锁游戏核心内容、加速发展的关键驱动指标。本攻略将系统性地为你揭示提升舒适度的核心途径,涵盖从装饰栖息地、建造

热心网友
04.06