OpenAI发布最强视频模型Sora 2,支持同步音频生成
北京时间10月1日凌晨,OpenAI正式推出全新升级的视频生成模型Sora 2。

这款迭代产品在视频真实感上实现重大突破,并首次整合音频生成功能。该技术基于前代图像生成框架,在新版应用中加入创新的"身份验证+客串演出"模式——用户只需录制一段包含面容和声音的短视频,就能在生成内容中演绎不同角色。
Sora应用采用类社交媒体的交互设计,具备智能推荐引擎和个性化内容排序功能,让用户既能享受算法推荐的热门内容,又能自主调节内容展示优先级。
作为2024年2月首代模型的升级版,Sora2显著改善了初代在运动轨迹(如篮球弹跳)方面的机械感问题,令物理规律的呈现更为流畅自然。最具突破性的是新增的语音合成能力,OpenAI承认模型尚存缺陷,但证明通过海量视频训练确实能提升虚拟世界的拟真度。
目前iOS版Sora采用邀请制测试,首批开放区域限于美加两国。考虑到视频生成对计算资源的巨大消耗,OpenAI在测试期将实施用量管控,同时为用户保留付费获取额外生成额度的选项。
针对伦理安全问题,OpenAI专门发布技术白皮书强调:所有生成视频将嵌入不可篡改的数字水印;肖像使用权需经本人实时授权且可随时撤回;未成年账号强制启用家长监护功能。
内容审核方面,系统部署了多层次防护机制:预生成阶段过滤不良内容,音频与画面交叉检测危险信息,并计划组建专项人工审核团队重点筛查网络霸凌等行为。
OpenAI将Sora2定义为AI进化的重要里程碑:"视频模型正在经历指数级发展。未来,通用世界模拟器与智能体技术将深度改变人类社会的发展轨迹。"
相关攻略
OpenAI在2026年第一季度营收达57亿美元,较竞争对手Anthropic同期高出约10亿美元。其收入主要来自ChatGPT消费级产品,付费用户持续增长,但业务重心正转向企业服务。尽管营收亮眼,公司调整后营业利润率仍为负值,面临显著亏损。为应对竞争与盈利压力,OpenAI正加速推进上市进程,最早或于今年9月进行IPO。
微软发布专为浏览器设计的Fara1 5系列AI智能体模型,包含4B、9B和27B三个版本。该模型基于Qwen3 5构建,通过观察浏览器截图输出操作指令,采用“观察—思考—行动”循环决策。在Online-Mind2Web基准测试中,Fara1 5-27B任务成功率达72%,超越多款主流模型。其训练使用了约200万条混合数据,并设计了在信息缺失、任务模糊或执行不
OpenAI一款未发布的通用推理模型独立推翻了悬置近80年的埃尔德什“平面单位距离猜想”。模型未经专门训练,运用代数数论构造反例完成证明。此前OpenAI曾因虚假突破受批评,但此次成果获包括原批评者在内的多位顶级数学家背书,被视为AI自主产出重要数学发现的标志性进展。
OpenAI的text-embedding-3-large模型可生成3072维文本向量,适用于高精度语义搜索和RAG系统。通过API调用时需正确设置请求头与请求体,批量处理时应将文本数组传入input参数以提高效率。使用LangChain集成可方便初始化并支持降维适配。实际应用中需注意文本长度限制、向量与原文的绑定存储以及数据库的维度适配。
最近,AI领域的收入数据成了热门话题。根据媒体报道,受Codex、商业销售与广告等多重业务驱动,OpenAI在今年第一季度创造了57亿美元的收入,这个数字比其主要竞争对手Anthropic高出约10亿美元。尤其值得注意的是,仅在今年2月,OpenAI就产生了高达250亿美元的年化收入,势头相当迅猛。
热门专题
热门推荐
英特尔下一代TitanLake处理器全系支持LPDDR6内存。面向主流笔记本的U、P及高能效PX系列还将兼容LPDDR5X与DDR5,为设备设计提供灵活性。U、P、PX系列采用Intel18A工艺的新CPU模块,而B、BX系列沿用旧架构。高端PX系列集成GPU采用台积电N2P工艺,配备16个Xe核心,旨在提升图形性能。
一只鲸鱼做空比特币 4 96 亿美元,触发市场公信讨论 最近,链上数据捕捉到的一笔大额交易,瞬间吸引了所有市场参与者的目光:一只比特币巨鲸,悄然开立了价值近5亿美元的空单。这笔操作如同一块投入平静湖面的巨石,不仅激起了短线的价格波澜,更将市场深层的公信机制与交易透明度问题,再次推到了讨论的中心。 鲸
解锁《四海兄弟》“故乡没那么快”成就需耐心探索:深入隐秘角落,留意环境细节;积极与居民互动,收集对话线索;完成相关支线任务,关注伏笔;并注意特定时段触发的事件。成就进度可累积,坚持全面探索方能最终达成。
鬼谷子是战术型辅助,核心在于技能运用与合理出装。二技能是关键控制,配合大招的群体伪装可发起突袭。出装以冷却缩减和生存能力为主,如冷静之靴、极寒风暴和魔女斗篷。实战中需把握进场时机,从侧翼切入控制敌方核心,并注意与队友配合衔接伤害。
在游戏开发、动画制作、视频创作等数字内容领域,专业音效设计是提升作品沉浸感与专业度的关键。然而,传统音效制作流程往往依赖昂贵的专业设备与庞大的素材库,对独立开发者、小型团队及个人创作者构成了较高的技术门槛与成本压力。近期,一款名为OptimizerAI的人工智能音效生成平台备受关注,它致力于通过AI





