首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
TML 成立7个月首发声:揪出大模型随机元凶,开源方案终结 LLM 推理乱象

TML 成立7个月首发声:揪出大模型随机元凶,开源方案终结 LLM 推理乱象

热心网友
30
转载
2025-09-11

用 AI 检查同一份合同,两次给出的风险提示可能不同;

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

向智能客服咨询同样问题,得到的答案可能不一致。

这种随机性是 AI 行业长期存在的技术痛点。

OpenAI 前 CTO Mira Murati 创办的 Thinking Machines Lab(简称 TML),正针对这一问题开展研究,其最新进展或为 AI 可靠性提升提供解决方案。

Thinking Machines Lab:未出产品已获资本关注

2025 年 2 月,Mira Murati 离开 OpenAI 四个月后,正式成立 Thinking Machines Lab。

该公司成立七个月,未发布任何产品,已完成 20 亿美元种子轮融资,估值达 120 亿美元。

领投方为硅谷风投 a16z,英伟达、AMD、思科等科技企业参与投资。

TML 团队共 30 人,三分之二来自 OpenAI,包括 OpenAI 联合创始人 John Schulman、前研究副总裁 Barret Zoph,二人均为 ChatGPT 核心技术开发者。

AI 安全专家 Andrew Tulloch 拒绝扎克伯格 15 亿美元回聘邀请,选择加入 TML。

Murati 创办 TML 的思路,与她在 OpenAI 期间的思考一致。

推动 ChatGPT 面向公众开放时,她发现 AI 技术越强,越需要解决可靠性问题。

Murati 在一次采访中表示,当前 AI 的输出结果存在不可控性。

TML 的使命不是追求更强模型,而是填补 AI 能力与人类需求间的差距。

AI 随机性的核心成因:批次处理引发计算差异

9 月 11 日,TML 在研究博客 Connectionism 发布首篇文章,明确 AI 随机性的成因。

此前部分观点认为,AI 对同问题输出不同答案是因 “随机种子” 设置差异,但 TML 研究显示,核心原因是 “批次处理” 技术细节。

更为关键的发现是,并行计算策略的变化,才是导致输出不确定的根本原因。

简单来说,当服务器处理大家的 AI 请求时,会把不同用户的需求打成大小不一的 “包裹” 进行处理。

而不同的批量大小、序列长度,还有 KV 缓存状态,会影响 GPU 内核的选择策略,进而改变计算执行顺序。

再加上计算机算小数的时候,类似 (a+b)+c 和 a+(b+c) 这样的计算,结果可能会有细微差别。

这些小差别在 AI 的神经网络里会像滚雪球一样越积越大,最后就导致同一个问题,AI 给出的答案却不一样。

TML 的解决方案:批次不变内核实现结果稳定

为了攻克这个难题,TML 团队拿出了 “批次不变内核” 这个创新方案。

简单来说,这个方案规定,不管处理的数据量大小、怎么分组,AI 系统里的关键计算部分,都得按照同样的步骤算出一样的结果。

针对 AI 模型中特别重要的 RMSNorm、矩阵乘法、注意力机制这三个模块,团队也设计了专门的优化办法,就是为了让 AI 不管遇到多少数据,计算流程都能保持稳定。

光有方案还不够,团队用有 2350 亿参数的 Qwen3-235B-A22B-Instruct-2507 模型做了严格测试。

以前的 AI 系统,同样的问题每次算出来的答案都不太一样,测 1000 次能得到 80 种不同结果。

但用了 batch-invariant 方案后,只要输入的内容一样,AI 每次输出的答案就完全相同,这在大语言模型发展史上尚属首次。

刚开始,新方案让 AI 计算速度慢了将近一半,但经过优化后,现在这点性能损耗已经在可接受范围了。

这项技术突破对关键行业的实际价值尤为显著。

在医疗诊断场景下,AI 辅助系统若对同一患者的 CT 影像产生前后矛盾的分析结论,极易干扰临床医生的诊疗决策;

金融风控领域同样面临挑战,AI 模型对相同贷款申请的评估结果波动,不仅可能引发风险误判,更可能触及合规红线。

TML 研发的新技术,就像给高风险行业的 AI 上了一把 “安全锁”,让它们用起来更靠谱、更让人放心。

不同行业的突破点:让AI决策不再“玄学”

Murati 目前带领的团队研究方向,和大部分 AI 企业不太一样。

在其他公司都在努力扩大模型规模,思考如何让 AI 能生成更多东西的时候,TML 反其道行之,研究怎样才能让 AI 的表现更稳定,让大众能理解它是怎么 “思考” 的。

这其实和 Murati 在 OpenAI 的工作经历有关,

作为人工智能领域的从业者,她既了解大模型的强大之处,也明白技术失控的风险后果。

团队的研究博客取名 "Connectionism"(联结主义)颇有深意,这是 1980 年代研究神经网络与生物大脑相似性的 AI 子领域名称。

Murati 想通过这些基础研究,把 AI 的 “底细” 摸清楚,让大家不再觉得 AI 像个神秘莫测的 “黑匣子”。

目前,TML 还没有公布具体的商业化计划,但金融和医疗行业已经表现出浓厚兴趣。

让机器思维具备可预测性,虽不涉及 AI 能力边界的突破,但对 AI 技术安全融入社会至关重要。

Murati 表示,行业不需要 AI 输出不可控的结果,而是需要 AI 输出稳定可靠。

来源:https://36kr.com/p/3462089870611848
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

美国SEC主席Paul Atkins证实:加密货币安全港提案已送交白宫审查
web3.0
美国SEC主席Paul Atkins证实:加密货币安全港提案已送交白宫审查

加密货币行业翘首以盼的监管里程碑,终于有了实质性进展。美国证券交易委员会(SEC)主席保罗·阿特金斯(Paul Atkins)近日证实,那份允许加密项目在早期获得注册豁免权的“安全港”框架提案,已经正式送抵白宫,进入了最终审查阶段。 在范德堡大学与区块链协会联合举办的数字资产峰会上,阿特金斯透露了这

热心网友
04.08
微策略Strategy报告:第一季录得144.6亿美元浮亏 再斥资约3.3亿美元买进4871枚比特币
web3.0
微策略Strategy报告:第一季录得144.6亿美元浮亏 再斥资约3.3亿美元买进4871枚比特币

微策略Strategy报告:第一季录得144 6亿美元浮亏 再斥资约3 3亿美元买进4871枚比特币 市场震荡的威力有多大?看看Strategy的最新季报就明白了。根据其最新向美国证管会(SEC)提交的8-K报告,受市场剧烈波动影响,这家公司所持的比特币在第一季度录得了一笔惊人的数字——144 6亿

热心网友
04.08
稳定币发行商Tether再扩Web3版图!Paolo Ardoino:正开发去中心化搜索引擎Hypersearch
web3.0
稳定币发行商Tether再扩Web3版图!Paolo Ardoino:正开发去中心化搜索引擎Hypersearch

稳定币巨头Tether的动向,向来是加密世界的风向标。这不,它向Web3基础设施的版图扩张,又迈出了关键一步。公司执行长Paolo Ardoino在社交平台X上透露,其工程团队正在全力“烹制”一个新项目——去中心化搜索引擎 “Hypersearch”。这个消息一出,立刻引发了行业的广泛猜想。 采用D

热心网友
04.08
Base链首个原生DeFi借贷协议Seamless Protocol倒闭 将于2026年6月30日下线
web3.0
Base链首个原生DeFi借贷协议Seamless Protocol倒闭 将于2026年6月30日下线

基地位于Coinbase旗下以太坊Layer2网络Base的Seamless Protocol,日前正式宣告了服务的终结。这个曾经吸引了超过20万用户的原生DeFi借贷协议,在运营不到三年后,终究没能跑赢时间。它主打的核心产品是Integrated Leverage Markets(ILMs)——一

热心网友
04.08
PAAL代币如何参与治理?社区投票能决定哪些事项?
web3.0
PAAL代币如何参与治理?社区投票能决定哪些事项?

PAAL代币揭秘:深度解析Web3社区治理的核心钥匙 在去中心化自治组织的浪潮中,谁真正掌握了项目的话语权?PAAL代币提供了一套系统化的答案。它不仅是生态内流转的价值媒介,更是开启链上治理大门的核心凭证。通过持有并质押PAAL代币,用户能够对协议升级、资金分配乃至战略方向等关键事务投出决定性的一票

热心网友
04.08