OpenAI发布最强视频模型Sora 2，支持同步音频生成

首页

AI资讯

热心网友

转载

2025-10-02

北京时间10月1日凌晨，OpenAI正式推出全新升级的视频生成模型Sora 2。

OpenAI

这款迭代产品在视频真实感上实现重大突破，并首次整合音频生成功能。该技术基于前代图像生成框架，在新版应用中加入创新的"身份验证+客串演出"模式——用户只需录制一段包含面容和声音的短视频，就能在生成内容中演绎不同角色。

https://player.bilibili.com/player.html?bvid=bv1QgHjzKEKj&autoplay=0&page=1</a>"" width=""100%"">

Sora应用采用类社交媒体的交互设计，具备智能推荐引擎和个性化内容排序功能，让用户既能享受算法推荐的热门内容，又能自主调节内容展示优先级。

作为2024年2月首代模型的升级版，Sora2显著改善了初代在运动轨迹（如篮球弹跳）方面的机械感问题，令物理规律的呈现更为流畅自然。最具突破性的是新增的语音合成能力，OpenAI承认模型尚存缺陷，但证明通过海量视频训练确实能提升虚拟世界的拟真度。

目前iOS版Sora采用邀请制测试，首批开放区域限于美加两国。考虑到视频生成对计算资源的巨大消耗，OpenAI在测试期将实施用量管控，同时为用户保留付费获取额外生成额度的选项。

针对伦理安全问题，OpenAI专门发布技术白皮书强调：所有生成视频将嵌入不可篡改的数字水印；肖像使用权需经本人实时授权且可随时撤回；未成年账号强制启用家长监护功能。

内容审核方面，系统部署了多层次防护机制：预生成阶段过滤不良内容，音频与画面交叉检测危险信息，并计划组建专项人工审核团队重点筛查网络霸凌等行为。

OpenAI将Sora2定义为AI进化的重要里程碑："视频模型正在经历指数级发展。未来，通用世界模拟器与智能体技术将深度改变人类社会的发展轨迹。"

来源:https://www.ithome.com/0/887/039.htm

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：豆包1.6-vision上线：首款支持工具调用的视觉思考大模型下一篇：OpenAI发布Sora：可授权创作视频的AI社交应用

相关攻略

AI资讯

OpenAI 2026年第一季度营收达57亿美元领先Anthropic

OpenAI在2026年第一季度营收达57亿美元，较竞争对手Anthropic同期高出约10亿美元。其收入主要来自ChatGPT消费级产品，付费用户持续增长，但业务重心正转向企业服务。尽管营收亮眼，公司调整后营业利润率仍为负值，面临显著亏损。为应对竞争与盈利压力，OpenAI正加速推进上市进程，最早或于今年9月进行IPO。

热心网友

05.23

AI资讯

微软Fara1.5浏览器AI模型发布任务成功率72%超越OpenAI

微软发布专为浏览器设计的Fara1 5系列AI智能体模型，包含4B、9B和27B三个版本。该模型基于Qwen3 5构建，通过观察浏览器截图输出操作指令，采用“观察—思考—行动”循环决策。在Online-Mind2Web基准测试中，Fara1 5-27B任务成功率达72%，超越多款主流模型。其训练使用了约200万条混合数据，并设计了在信息缺失、任务模糊或执行不

热心网友

05.23

AI资讯

OpenAI破解80年科学难题新模型获顶刊认可

OpenAI一款未发布的通用推理模型独立推翻了悬置近80年的埃尔德什“平面单位距离猜想”。模型未经专门训练，运用代数数论构造反例完成证明。此前OpenAI曾因虚假突破受批评，但此次成果获包括原批评者在内的多位顶级数学家背书，被视为AI自主产出重要数学发现的标志性进展。

热心网友

05.22

AI资讯

OpenAI文本嵌入模型text-embedding-3-large实战应用指南

OpenAI的text-embedding-3-large模型可生成3072维文本向量，适用于高精度语义搜索和RAG系统。通过API调用时需正确设置请求头与请求体，批量处理时应将文本数组传入input参数以提高效率。使用LangChain集成可方便初始化并支持降维适配。实际应用中需注意文本长度限制、向量与原文的绑定存储以及数据库的维度适配。

热心网友

05.22

科技数码

OpenAI一季度营收57亿美元创下新高

最近，AI领域的收入数据成了热门话题。根据媒体报道，受Codex、商业销售与广告等多重业务驱动，OpenAI在今年第一季度创造了57亿美元的收入，这个数字比其主要竞争对手Anthropic高出约10亿美元。尤其值得注意的是，仅在今年2月，OpenAI就产生了高达250亿美元的年化收入，势头相当迅猛。

热心网友

05.22

热门推荐

业界动态

英特尔Titan Lake处理器全系支持LPDDR6内存

英特尔下一代TitanLake处理器全系支持LPDDR6内存。面向主流笔记本的U、P及高能效PX系列还将兼容LPDDR5X与DDR5，为设备设计提供灵活性。U、P、PX系列采用Intel18A工艺的新CPU模块，而B、BX系列沿用旧架构。高端PX系列集成GPU采用台积电N2P工艺，配备16个Xe核心，旨在提升图形性能。

热心网友

05.23

web3.0

比特币巨鲸4.96亿美元空单引发市场对去中心化公信的深度讨论

一只鲸鱼做空比特币 4 96 亿美元，触发市场公信讨论最近，链上数据捕捉到的一笔大额交易，瞬间吸引了所有市场参与者的目光：一只比特币巨鲸，悄然开立了价值近5亿美元的空单。这笔操作如同一块投入平静湖面的巨石，不仅激起了短线的价格波澜，更将市场深层的公信机制与交易透明度问题，再次推到了讨论的中心。鲸

热心网友

05.23

游戏攻略

四海兄弟故乡成就快速达成攻略

解锁《四海兄弟》“故乡没那么快”成就需耐心探索：深入隐秘角落，留意环境细节；积极与居民互动，收集对话线索；完成相关支线任务，关注伏笔；并注意特定时段触发的事件。成就进度可累积，坚持全面探索方能最终达成。

热心网友

05.23

游戏攻略

鬼谷子最强出装推荐与实战打法攻略

鬼谷子是战术型辅助，核心在于技能运用与合理出装。二技能是关键控制，配合大招的群体伪装可发起突袭。出装以冷却缩减和生存能力为主，如冷静之靴、极寒风暴和魔女斗篷。实战中需把握进场时机，从侧翼切入控制敌方核心，并注意与队友配合衔接伤害。

热心网友

05.23

AI教程

AI音效生成工具OptimizerAI自动为视频添加背景音乐

在游戏开发、动画制作、视频创作等数字内容领域，专业音效设计是提升作品沉浸感与专业度的关键。然而，传统音效制作流程往往依赖昂贵的专业设备与庞大的素材库，对独立开发者、小型团队及个人创作者构成了较高的技术门槛与成本压力。近期，一款名为OptimizerAI的人工智能音效生成平台备受关注，它致力于通过AI

热心网友

05.23