2025年11月AI领域八大重要资讯盘点

上期我们盘点了2025年10月的AI重磅动态,热度未减,新的突破又接踵而至。从3D场景的秒级生成,到长视频的实时创作,再到模型能力的全方位进化,这个月的AI领域可谓精彩纷呈。话不多说,一起来看看11月又有哪些值得关注的新进展。
一、AI秒级生成3D场景!厦大x腾讯开源FlashWorld
3D内容创作的门槛,正在被AI以惊人的速度拉低。最近,由厦门大学与腾讯联合研发的FlashWorld模型正式亮相,带来了碘伏性的体验:仅需一张图片或一段文字描述,它就能在5到10秒内生成一个高质量的3D场景。
这个速度,相比以往的技术提升了10到100倍,而渲染效果却更加细腻逼真。这项突破意味着,那个“人人皆可快速构建3D世界”的愿景,或许真的不远了。

二、南洋理工&腾讯ARC:分钟级实时生成突破
长视频生成的“不可能三角”——高质量、长时长、实时性,一直是业界的难题。南洋理工大学与腾讯ARC实验室合作的RollingForcing技术,带来了新的解法。
该技术通过联合去噪、注意力池化和高效训练策略,在单块GPU上实现了分钟级别的实时长视频生成,有效解决了生成过程中误差累积的核心痛点。这不仅保证了高达16 fps的实时生成速度,更显著提升了长序列视频的连贯性与质量,为交互式世界模型、神经游戏引擎等前沿应用铺平了道路。

三、Lovart平台上线“编辑元素”新功能
AI生图“一发不可收拾”,难以进行局部精细调整,是许多设计师的切肤之痛。针对海外市场的AI设计平台Lovart,最近上线的“编辑元素”功能,正是为此而来。
这项功能能够像专业图像软件一样,自动识别生成图片中的各个独立元素,并将其分解为可单独编辑的图层。用户可以自由调整任一图层的细节,而完全不会影响到其他部分。这无疑大大增强了AI绘图的可控性与实用性,让创意修改变得前所未有的便捷。

四、OpenAI发布GPT-5.1,智商情商双提升
距离GPT-5发布仅数月,OpenAI便火速推出了迭代版本GPT-5.1系列。官方明确表示,此次升级旨在让ChatGPT“更智能,也更有趣”。
此前,GPT-5曾被部分用户反馈缺乏“人味”和创造力。而GPT-5.1则着重在智能水平与沟通风格上进行了双重优化。OpenAI首席执行官萨姆·奥尔特曼指出,新版本在指令遵循和自适应思考方面改进显著,整体的智力与沟通能力都有了长足进步。

五、谷歌“嵌套学习”突破LLM遗忘瓶颈
大模型如何像人类一样持续学习新知识而不遗忘旧技能?谷歌提出的全新机器学习范式——“嵌套学习”,给出了一个颇具启发性的答案。
该范式摒弃了传统的静态训练周期,将模型视为一系列嵌套问题的堆叠,允许模型以不同的更新速度在各嵌套层中学习。这使得AI能够不断吸收新技能,同时稳固保持已掌握的能力。这被认为是人工智能向“类脑进化”方向迈出的关键一步,也代表了谷歌对深度学习架构与优化统一性的新层次理解。

六、英伟达发布OmniVinci全模态大模型
多模态理解的下一个阶段是什么?英伟达开源的OmniVinci模型指向了“全模态统一”。这是一个能够理解视觉、音频、语言等多种信息,并将其置于同一潜在空间进行推理的全模态大语言模型。
这意味着AI不仅能看、能听、能说,还能在这些模态间进行深度的关联推理与内容生成。这个参数量为90亿的模型一经发布便备受关注,其在Huggingface平台上的权重下载量迅速突破万次,热度可见一斑。

七、Meta开源1600语言语音识别系统
打破语言壁垒,AI正在行动。Meta的FAIR团队近日发布了“全语种自动语音识别系统”,其最大亮点是支持超过1600种语言的语音转写。
据透露,其中有500种语言是首次被任何AI系统所覆盖。Meta将这一系统视为构建“通用语音转写系统”的重要里程碑,它有望极大地促进全球范围内的跨语言沟通与信息平等获取,让更多小众语言被世界听见。

八、Utopai Studios发布影视专用AI模型与工作流
当AI深入影视工业,它会带来怎样的变革?AI原生影视工作室Utopai Studios给出了它的方案:一套专为电影与电视制作设计的AI模型和工作流。
与常见的通用视频生成模型不同,Utopai的模型核心在于理解影视创作的内在逻辑。它能够解析剧本故事,协助导演进行镜头规划和场景生成。通过将剧本理解、表演呈现与镜头连贯性等关键环节深度整合,这套系统旨在直接赋能专业的影视制作流程,强化叙事本身的力量。

相关攻略
4月底,香港迎来全球专用通信行业盛会——Critical Communications World Asia 2026(CCA 2026)。作为全球关键通信领域的领军企业,海能达不仅展示了其旗舰终端与前沿行业解决方案,更深入分享了在人工智能时代下,关键通信智能化发展的核心洞察与未来路径。展会现场思想
面对董事会日益增长的期待,许多企业正陷入一种“AI战略表演”的困境:各类试点项目不断涌现,汇报材料持续更新,但始终难以转化为清晰可衡量的商业成果。问题的根源往往不在于技术瓶颈,而在于业务流程未能重塑、数据基础尚未就绪、治理体系存在缺失,以及对技术供应商的过度依赖。 每隔一段时间,企业首席信息官(CI
豆包AI虽不能直接盯盘,但可通过智能体、生活管家与外部工具组合实现价格监控。核心是将实时监控拆解为条件识别、定时触发和通知推送。具体方法包括:创建条件解析智能体并绑定日程、设置每日定时检查分析行情、利用桌面组件预设监控项快速响应,以及借助任务提醒接收第三方脚本预。
近期,微软人工智能经济研究所发布了2026年第一季度全球生成式AI应用扩散研究报告。数据显示,全球劳动适龄人口中使用生成式AI工具的比例已从16 3%上升至17 8%,增幅达1 5个百分点。报告指出,在AI普及率较高的经济体中,用户的使用深度与频率也在同步提升。目前,全球已有26个经济体的劳动适龄人
市场聚焦:新一轮代币解锁潮即将到来 对于加密市场而言,代币解锁向来是一个需要高度关注的节点。这不,根据Token Unlocks的最新数据,未来一周又将迎来一波密集的解锁事件。具体来看,以下几个项目的代币释放值得投资者留意(以下时间均为北京时间)。 Sui (SUI):解锁规模最大 打头阵的是Sui
热门专题
热门推荐
为庆祝成立50周年,苹果在全球多地门店举办系列庆祝活动。最盛大的庆典在其总部ApplePark举行,员工齐聚草坪,传奇音乐人保罗·麦卡特尼登台献唱,首席执行官蒂姆·库克也参与其中。这场科技与艺术交融的盛会,既是对过往传奇的致敬,也寓意着新篇章的开启。
苹果公司成立五十周年之际,首席执行官蒂姆·库克发布内部信回顾历程。信中指出,公司从车库中的一台原型机起步,如今全球活跃设备已达25亿台。库克强调,未来需主动创造而非等待,并鼓励员工铭记创新精神,共同把握机遇,开创下一个五十年。
苹果CEO库克在专访中回顾了iPod的诞生历程。该产品以口袋装千首歌的能力革新了音乐消费方式。其爆红要求苹果在三个月内生产约1500万台,这极大考验了供应链。此次极限压力测试为苹果锻造出世界级供应链能力奠定了基础。库克还透露,首台原型机播放的第一首歌是《HeyJude》。
知名投资人段永平家族办公室持仓市值升至约200亿美元。本季度清仓阿里,减持苹果、台积电;重仓AI与电动车赛道,大幅增持英伟达并新建仓特斯拉,拼多多获增持。其首次跨足Web3领域,建仓稳定币发行商Circle,显示对合规区块链基础设施的关注。
Mac内置的“缩放”辅助功能可放大屏幕细节。通过系统设置开启该功能后,可选择画中画或全屏模式。用户可使用修饰键配合触控板手势、快捷键组合、双击Control+Option或鼠标智能缩放等多种方式灵活操作,满足不同场景下的查看需求。





