游乐游手机版
首页/科技数码/文章详情

AI三巨头同日发力:微软自研大模型,OpenAI推语音助手,马斯克杀入编程领域

时间:2025-08-30 15:31
8月29日消息,周四,微软、OpenAI与埃隆·马斯克旗下的xAI不约而同地发布了各自最新的AI模型,此举不仅标志着AI赛道的竞争已进入白热化阶段,也凸显了核心技术正以前所未有的速度向前推进。微软:

8月29日消息,周四,微软、OpenAI与埃隆·马斯克旗下的xAI不约而同地发布了各自最新的AI模型,此举不仅标志着AI赛道的竞争已进入白热化阶段,也凸显了核心技术正以前所未有的速度向前推进。

微软:自研模型,志在掌控AI命运

微软周四推出了两款自主研发的强大AI模型,此举标志着微软的人工智能部门将不再“藏于幕后”,而是要正式走向台前,与OpenAI等行业巨头正面竞争,从而在高风险的AI赛道上掌握自己的命运。

MAI-Voice-1:一款高效的语音AI模型,能够在单个GPU上运行,并在不到一秒内生成一分钟的音频。

· MAI-1-preview:一款文本模型,预计将为未来版本的Copilot AI助手提供支持。

这两款模型在设计上都高度注重成本效益。 微软人工智能部门负责人穆斯塔法·苏莱曼(Mustafa Suleyman)透露,微软采用了部分来自开源社区的技术,以MAI-1-preview为例,其训练仅使用了约1.5万颗英伟达H-100 GPU,远低于xAI的Grok模型所使用的超10万颗。

“如今,训练模型的艺术就在于选择完美的数据,避免在无效的Token上浪费任何计算力,”苏莱曼强调。

尽管AI模型日趋高效,但消费者需求和新技术对算力的依赖持续增长,导致AI公司面临着巨大的成本挑战。苏莱曼透露,微软的AI团队已在全球多个顶级数据中心着手开发下一代模型,这些数据中心均配备了英伟达的下一代芯片GB-200。他描绘了一个“庞大的五年发展路线图”,并表示“每个季度都在进行投资”。

“作为全球最大的公司之一,我们必须具备打造世界最强模型的内部专业能力,”苏莱曼表示。不过,他也试图淡化与长期合作伙伴OpenAI的潜在竞争,称“我们的目标是深化合作关系”。

作为一名AI安全的倡导者,苏莱曼近期曾撰文警告“看似有意识的AI”的危险,并表示微软的目标是在“后训练”阶段,像雕刻一样移除让模型看起来拥有情感和目标的特征。“盲目模仿所有人类能力存在实际风险,而现在正是我们主动思考这些风险的时候。”

有分析认为,尽管微软仍处于构建强大AI模型的初期阶段,但此举对于微软保持长期竞争力至关重要。其最终目标,或许是借助Windows和Office的强大分发渠道,利用自研AI模型和基础设施为这些核心产品提供支持。

OpenAI:升级语音API,定义“下一个媒介”

同一天,OpenAI也发布了其迄今为止最先进的语音模型gpt-realtime,并宣布其Realtime API在历经数月公测后已广泛可用。

“我们认为语音是下一个媒介,”OpenAI产品负责人迈克达德·贾弗(Miqdad Jaffer)表示,“通过语音来表达,比文本更简单、更自然。”

据介绍,OpenAI于2024年10月首次以公测版形式推出了Realtime API,此次更新后,将支持远程模型上下文协议(MCP)服务器、图像输入和电话呼叫。OpenAI方面表示,MCP非常适合语音命令,能让用户无缝地通过已连接的应用程序执行操作。

这些扩展功能将使得语音智能体能够访问更多工具,并拥有更丰富的上下文来协助用户。这不仅简化了将AI模型与数据源连接的过程,并且MCP作为一项开放标准,还能在确保连接安全性的同时,优先保护用户的数据和隐私。

新的gpt-realtime模型则在多个维度上实现了显著提升:不仅在智能化、函数调用和遵循复杂指令方面有所改进,还能在单个句子中途流畅地切换语言。其演示版本展现了逼真的类人特性,声音的起伏能够表达多种情感,甚至在面对“越狱尝试”时也能冷静地重新引导对话。此外,该模型还能分析照片内容,并就其观察与用户展开讨论。

贾弗特别强调了“遵循指令”能力的重要性,他认为“能够给出一组指令并让模型稳定地执行,是构建模型的关键”。

此外,OpenAI还新增了两种专供API用户的语音Cedar和Marin。从周四开始,新模型和API已向所有开发者开放。贾弗建议开发者,“去做对你的用户最有益的事情,我们相信语音就是未来。”

xAI:切入编程赛道,主打经济高效

与此同时,马斯克旗下的xAI也加入了这场发布热潮,推出了一款名为grok-code-fast-1的“快速且经济”的智能编程模型,正式进军AI编程这一关键领域。

xAI表示,该模型将在有限时间内免费提供,首批发布合作伙伴包括了GitHub Copilot和Windsurf。其“优势在于以经济、紧凑的形式提供强劲的性能”,旨在成为处理常见编程任务的高性价比选择。

智能编程领域的竞争正日趋激烈。 微软的GitHub Copilot已在企业中广泛应用,其CEO萨提亚·纳德拉(Satya Nadella)在4月透露,公司内部已有20%至30%的代码由AI编写。而OpenAI旗下的编程助手Codex也已于6月向ChatGPT Plus用户开放。xAI此刻入局,无疑将使这一赛道的竞争格局更趋复杂。

三雄竞逐,创新与竞争并存

微软、OpenAI和xAI在同一天的模型发布,共同勾勒出当前AI行业竞争激烈、创新层出不穷的图景。

微软正着力于通过自主研发掌握核心技术,并强调模型的成本效益和长期战略部署;OpenAI则持续深耕其技术优势,力图在作为“下一个媒介”的语音交互上定义行业标准;而xAI则以其“快速且经济”的智能编程模型,切入AI编程助手这一关键应用领域。

这三家公司尽管在具体策略和侧重点上有所不同,但都殊途同归地致力于推动AI技术的边界,并将其融入更广泛的产品和应用中。这场“三雄争霸”不仅加速了技术迭代,也预示着人工智能将在未来深刻改变我们的工作和生活方式。(小小)

来源:https://www.163.com/tech/article/K84BE73200097U7T.html
上一篇上汽奥迪E5 Sportback 9月16日上市,预售23.59万起 下一篇英特尔获57亿美元注资,投资者反应强烈
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
宫本茂亲签3DS XL拍卖价破两万美元
科技数码 · 2026-05-29

宫本茂亲签3DS XL拍卖价破两万美元

今天来说一件挺有意思的事:2015年任天堂世界锦标赛冠军约翰·戈德堡,近日将他当年夺冠时赢得的宫本茂亲笔签名版3DS XL掌机放上了拍卖平台。截至2026年5月29日,这台签名掌机的竞拍价已突破两万美元,并且价格还在持续攀升。戈德堡在社交媒体上发布声明表示,经过相当长时间的慎重考虑,他决定将这台对自

七彩虹隐星P16 Pro游戏本新配置仅售7799元
科技数码 · 2026-05-29

七彩虹隐星P16 Pro游戏本新配置仅售7799元

七彩虹近期推出隐星P16Pro游戏本新配置,售价7799元。其搭载酷睿i9-13900HX处理器与RTX5060显卡,配备16英寸2 5K高刷电竞屏及高效散热系统。存储组合为16GB内存与1TB固态硬盘,支持后续扩展。该配置主打高性能性价比,适合预算有限但追求强劲性能的游戏玩家与轻度创作者。

苹果iPhone Hikawa握把支架448元重新上架
科技数码 · 2026-05-29

苹果iPhone Hikawa握把支架448元重新上架

苹果公司重新上架了与艺术家贝利·桧川及PopSockets合作设计的iPhone专用握把支架。该配件采用磁吸设计,兼具握持与支架功能,旨在通过人性化设计降低握持负担,并提供三种配色可选,售价448元。

苹果体育应用扩展至170市场 为2026世界杯引入对阵图
科技数码 · 2026-05-29

苹果体育应用扩展至170市场 为2026世界杯引入对阵图

苹果体育应用新增覆盖90多个国家和地区,全球可用市场总数超过170个。为迎接2026年世界杯,应用加入了完整的赛程对阵图和可视化阵型卡片,方便用户追踪赛事与战术。同时,应用支持实时活动功能,可将比分固定在锁屏或表盘,并新增一键跳转至新闻的入口。目前该应用仍仅限iPhone用户使用。

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产
科技数码 · 2026-05-29

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产

据博主爆料,小米下一代自研玄戒芯片计划于今年6月正式进入量产阶段,此次将采用台积电3nm工艺。初代玄戒O1累计出货量已突破100万颗,量产验证十分扎实。新一代芯片的产能将显著提升,这意味着供货问题基本得到解决。 根据现有曝光信息,这颗迭代芯片极有可能命名为玄戒O3,首发搭载机型预计为小米MIX Fo