首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
MBZUAI与法国理工学院突破:AI写作算法比人工快4倍

MBZUAI与法国理工学院突破:AI写作算法比人工快4倍

热心网友
25
转载
2025-12-30


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

这项由阿联酋穆罕默德·本·扎耶德人工智能大学(MBZUAI)和法国综合理工学院(Ecole Polytechnique)联合完成的研究发表于2025年12月的arXiv预印本平台,研究编号为arXiv:2512.02892v1。研究团队由Amr Mohamed、Yang Zhang、Michalis Vazirgiannis和Guokan Shang组成,他们开发出一种名为SchED的算法,能让AI在保持文章质量的同时,写作速度提升3到4倍。

想象一下你正在使用一个AI写作助手,但它总是要反复修改很多遍才能给出满意的答案,每次修改都需要时间,让你等得不耐烦。现在,研究人员发明了一种聪明的方法,就像给AI装上了一个"直觉感应器",让它知道什么时候已经写得足够好了,可以停止继续修改,从而大大节省时间。

这项研究的核心在于解决扩散语言模型(diffusion language models,简称dLLM)的一个重大问题。扩散语言模型是一种新型的AI写作技术,它不像传统的AI那样一个字一个字地顺序生成文字,而是像拼图一样,先生成一个粗糙的版本,然后一遍遍地修改和完善。这种方法的好处是能够考虑到整个文章的全局信息,写出更连贯、更合理的内容。但是问题在于,现有的系统往往会过度谨慎,即使文章已经足够好了,还是会继续修改很多轮,浪费大量计算资源和时间。

研究团队的创新在于开发了一种叫做SchED(Schedule-based Early Decoding,基于进度的早期解码)的算法。这个算法就像一个经验丰富的编辑,能够随时评估文章的质量,并在恰当的时机说"好了,这篇文章已经足够好了,不需要再修改了"。

SchED算法的工作原理可以用烹饪来类比。当你煮一锅汤时,你不会固定地煮30分钟,而是会不断尝味道,一旦发现汤的味道已经调得刚好,就会立即关火。SchED就是这样一个"品尝者",它会持续监测AI生成文字的"置信度"——也就是AI对自己写出内容的确信程度。当置信度达到一定水平时,算法就会判断继续修改已经没有必要,从而停止迭代过程。

更巧妙的是,SchED采用了一种"进度感知"的策略。就像你做菜时,开始阶段需要更仔细地调味,而快完成时只需要微调一样,SchED会根据修改的进度动态调整质量要求。在修改的早期阶段,它会要求更高的置信度才停止,确保基础质量足够好。而在后期阶段,它会适当放松要求,避免过度修改。

研究团队设计了三种不同的"进度曲线"来控制这个过程:线性曲线、余弦曲线和指数曲线。线性曲线就像平稳下坡的山路,质量要求均匀递减。余弦曲线则像一个温和的弯道,开始下降较慢,中间加速,最后又放缓。指数曲线则像陡峭的悬崖,开始时要求很高,然后急速下降到较低要求。不同的曲线适用于不同的应用场景:当你需要确保最高质量时,可以选择较为保守的线性或余弦曲线;当你更注重速度时,可以选择更激进的指数曲线。

为了验证这个算法的效果,研究团队进行了大规模的实验测试。他们选择了两个代表性的扩散语言模型家族:Dream和LLaDA。Dream模型采用单块处理方式,就像一次性修改整个文档;而LLaDA模型采用块状扩散策略,就像分段修改文档的不同部分。每个模型家族都有基础版本和指令调优版本,后者经过专门训练,更善于理解和遵循人类指令。

实验涵盖了十个不同类型的测试任务,包括多项选择题(如GPQA、MMLU、HellaSwag等)、数学推理题(GSM8K)、长文本问答和摘要任务(HotpotQA、MultiNews),以及机器翻译任务(英法、英德翻译)。这种多样化的测试确保了算法在各种实际应用场景下都能有效工作。

实验结果令人兴奋。对于经过指令调优的模型,SchED算法实现了3.8到4.0倍的速度提升,同时保持了99.8%到100%的原始质量。这意味着你可以用原来四分之一的时间得到几乎同样质量的文章。对于基础模型,虽然速度提升相对较小(1.04到1.14倍),但在更激进的设置下也能达到2.34倍的加速,同时质量损失控制在很小范围内。

研究团队还引入了一个创新的评估指标叫做"质量惩罚速度"(Quality-Penalized Speed, QPS),这个指标综合考虑了速度提升和质量损失。它就像一个公平的评判员,会根据质量下降的程度来"惩罚"速度的提升。使用γ=4这个严格的惩罚参数,SchED算法在Dream基础模型上获得了1.01到2.03的QPS分数,在指令调优模型上获得了3.24到4.30的分数,明显优于其他现有方法。

为了理解为什么SchED在指令调优模型上表现特别出色,研究团队进行了深入的熵分析。熵是信息论中的一个概念,可以理解为"不确定性"的度量。当AI生成文字时,如果它对下一个词的选择很确定,熵就低;如果它在多个选项间犹豫不决,熵就高。

分析结果显示,指令调优模型在生成过程中的熵下降更快且更稳定。这就像一个经过专业培训的厨师,能够更快地判断菜品是否已经做好,而新手厨师则需要更多时间才能做出同样准确的判断。指令调优让AI模型变得更加"自信"和"果断",因此SchED算法能够更早地识别出生成任务已经完成,从而获得更大的速度提升。

具体来看各种任务类型的表现,SchED在不同场景下都展现出了良好的适应性。在多项选择题任务中,由于答案相对简短且明确,模型能够很快达到足够的置信度,因此速度提升显著且质量损失最小。在数学推理任务中,虽然需要更复杂的逻辑推理,但SchED依然能在保持准确性的同时提供可观的加速。在长文本生成任务中,SchED通过考虑整个回答区域的置信度,避免了局部过度自信导致的早期停止问题,确保了长文本的质量和连贯性。在翻译任务中,SchED能够在保持翻译准确性的同时显著减少计算时间。

与现有的早期停止方法相比,SchED的优势在于其渐进式的置信度阈值设计。传统方法往往使用固定的停止条件,容易导致过早停止或过度修改。而SchED的动态阈值就像一个经验丰富的项目经理,会根据项目进度调整质量标准,在项目早期严格把关,在接近完成时适当放松要求,从而在质量和效率之间找到最佳平衡点。

SchED算法的一个重要特点是它完全不需要额外的训练或模型修改。这意味着你可以直接把这个算法应用到现有的任何扩散语言模型上,就像给汽车安装一个更智能的GPS导航系统,不需要改动引擎或其他部件。这种"即插即用"的特性大大提高了算法的实用价值和普及潜力。

在实际应用方面,SchED算法为不同需求的用户提供了灵活的选择。如果你是一个对质量要求极高的用户,比如正在写重要的商业提案或学术论文,你可以选择保守的线性或余弦调度,这样可以在略微加速的同时确保质量不受任何影响。如果你是一个更注重效率的用户,比如需要快速生成大量内容草稿,你可以选择更激进的指数调度,在可接受的质量损失范围内获得显著的速度提升。

研究还发现,不同类型的文本生成任务对SchED算法的响应存在有趣的差异。数学导向的任务(如GPQA和GSM8K)在生成初期显示出较高的熵值,但随着推理过程的深入,置信度会快速提升。这反映了AI在处理逻辑推理任务时的思考模式:开始时面临多种可能的解题路径,但一旦找到正确方向,就能快速收敛到答案。相比之下,一般知识问答任务的熵变化更加平稳,反映了这类任务的相对简单性。

SchED算法的成功还得益于其巧妙的置信度聚合策略。传统方法通常只关注局部区域的置信度,容易受到局部波动的干扰。而SchED考虑整个答案区域的平均置信度,就像一个优秀的品酒师不会只尝一口就下结论,而是要综合考虑酒的各个层次。这种全局视角使得算法的判断更加稳定和可靠。

从技术实现角度来看,SchED算法的计算开销非常小。它只需要在每个修改步骤计算置信度分数并与动态阈值比较,这个过程的计算量相比于整个文本生成过程来说微不足道。这意味着算法本身不会成为系统的性能瓶颈,而是真正起到了优化加速的作用。

研究团队还对算法的鲁棒性进行了全面测试。他们发现SchED在不同的模型架构、不同的任务类型、以及不同的参数设置下都表现稳定。这种鲁棒性对于实际应用至关重要,因为真实世界的使用场景往往比实验室环境更加复杂多变。

值得注意的是,SchED算法的成功不仅仅是技术层面的突破,也为我们理解AI的"自信心"提供了新的视角。通过观察AI在生成过程中置信度的变化,我们可以更好地理解AI的决策过程,甚至可以将这些insights应用到其他AI系统的优化中。

实验还揭示了一个有趣的现象:指令调优不仅提高了模型的任务执行能力,还使其具备了更好的"自我认知"能力。经过指令调优的模型能够更准确地评估自己生成内容的质量,这种元认知能力使得SchED算法能够更有效地工作。这一发现对于未来AI系统的设计具有重要启示意义。

从更广阔的视角来看,SchED算法代表了AI系统优化的一个重要方向:不是通过增加更多的计算资源来提高性能,而是通过更智能的算法来提高效率。这种思路在当前计算资源日益珍贵的背景下显得尤为重要。随着AI模型规模的不断增大,如何在保证性能的同时提高效率将成为一个关键挑战,而SchED算法为解决这个挑战提供了一个有效的思路。

研究团队在论文中也诚实地讨论了算法的局限性。SchED虽然在大多数情况下表现优秀,但在某些特殊场景下,过于激进的参数设置可能导致质量损失。因此,在实际应用中,用户需要根据自己的具体需求来选择合适的参数组合。研究团队建议,对于质量要求极高的应用,应该选择保守的参数设置;而对于时间敏感的应用,可以适当接受一些质量损失来换取速度提升。

未来的改进方向包括学习自适应的调度参数、针对特定任务类型优化聚合策略、以及与其他加速技术(如推测解码、缓存机制等)的结合。研究团队表示,他们正在探索如何让算法自动学习最优的参数设置,而不需要人工调整。他们还在研究如何将SchED与其他加速技术结合,以获得更大的性能提升。

这项研究的代码已经在GitHub上开源,感兴趣的开发者和研究人员可以通过https://github.com/amr-mohamedd/SchED.git获取完整的实现代码。这种开放的态度有助于推动整个领域的发展,让更多人能够在此基础上进行进一步的创新和改进。

总的来说,SchED算法为扩散语言模型的实用化迈出了重要一步。通过巧妙的进度感知置信度调度,它在保持高质量输出的同时显著提高了生成效率,为AI写作助手、自动翻译系统、智能客服等实际应用铺平了道路。随着这类技术的不断成熟,我们可以期待在不久的将来看到更快速、更高效的AI文本生成服务进入我们的日常生活。

Q&A

Q1:SchED算法是什么原理?

A:SchED算法就像一个经验丰富的编辑,能够实时监测AI写作的质量置信度,并根据进度动态调整质量要求。当AI对自己写的内容足够自信时,算法就会停止继续修改,避免浪费时间在不必要的反复修改上。

Q2:SchED算法能提升多少速度?

A:对于经过指令调优的AI模型,SchED能实现3.8到4倍的速度提升,同时保持99.8%到100%的原始质量。对于基础模型,在保守设置下能提升1.04到1.14倍速度,激进设置下可达2.34倍速度提升。

Q3:普通用户能直接使用SchED算法吗?

A:目前SchED算法主要面向AI研究人员和开发者,代码已在GitHub开源。普通用户需要等待AI公司将这项技术集成到实际产品中,比如AI写作助手、翻译软件等,才能享受到更快的AI服务体验。

来源:https://www.163.com/dy/article/KI2DDCEC0511DTVV.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

BCBC币(BCBC)实时行情?
web3.0
BCBC币(BCBC)实时行情?

BCBC币(BCBC)深度解析:技术底色与市场前景 在百花齐放的数字货币领域,总有项目希望以独特的技术路径站稳脚跟。BCBC币(BCBC)正是其中之一,它依托一套组合技术方案来构建其安全与稳定的基石,目标直指高效、低成本的支付新体验,同时也不失为投资者眼中一个潜在的增值选项。 技术架构:不止于共识的

热心网友
04.02
BNB连锁店在最新焚化活动中燃烧了价值9.16亿美元的代币
web3.0
BNB连锁店在最新焚化活动中燃烧了价值9.16亿美元的代币

BNB Chain完成第31次季度销毁,近10亿美元BNB永久退出流通 近日,全球顶尖的区块链基础设施BNB Chain正式完成了其第31次季度代币销毁。根据官方公布的数据,本次共计销毁了1,579,207 716枚BNB,按销毁时市场价值计算,总额高达约9 16亿美元。此次大规模销毁再次向市场展现

热心网友
04.02
openclaw 常见命令解析
AI
openclaw 常见命令解析

OpenClaw 核心命令完全指南:从入门到精通 当您开始接触一个新工具时,最常见的障碍是什么?往往是面对复杂的命令列表感到困惑,只能被动地复制粘贴。这不仅影响效率,而且在遇到问题时更难以排查。 本文将为您深入解析 OpenClaw 的关键指令,帮助您从基础操作者转变为理解原理的熟练用户,全面提升配

热心网友
04.02
全球首款带物理直觉的AI模型在沪发布,理解真实世界规律
科技数码
全球首款带物理直觉的AI模型在沪发布,理解真实世界规律

让AI告别“重视觉效果、轻物理逻辑”的行业短板,近期五一视界(51WORLD)发布全球首款物理直觉世界模型51World Model,实现AI遵循物理规律推演、与真实场景全要素交互的核心突破,彻底破

热心网友
04.01
宇树G1机器人拆解:揭秘超40%毛利率与全供应链控制
科技数码
宇树G1机器人拆解:揭秘超40%毛利率与全供应链控制

一台售价8 5万元的人形机器人,拆开来看,成本只有4 16万元,预估毛利率40 7%。但宇树G1的真正壁垒,藏在硬件之外。3月30日,中邮证券电新团队分析师苏千叶、盛炜、杨帅波发布《宇树G1人形机器

热心网友
04.01

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

《洛克王国世界》星光对决轮椅打法 星光对决怎么打
游戏攻略
《洛克王国世界》星光对决轮椅打法 星光对决怎么打

《洛克王国世界》星光对决平民攻略:手残党也能轻松通关的“轮椅流”阵容打法 在《洛克王国世界》中,星光对决玩法以其较高难度让不少玩家感到棘手。许多玩家都在寻找一套无需复杂操作、容错率高的“轮椅式”打法,以实现稳定通关。本文将为你详细拆解一套经过大量实战验证的平民阵容与傻瓜式流程,即使是操作有限的玩家也

热心网友
04.06
王者荣耀新赛季何时开启
游戏攻略
王者荣耀新赛季何时开启

王者荣耀新赛季开启时间:全网玩家热议的焦点 每当新赛季的号角吹响,峡谷必将迎来一场全面的革新。全新的版本机制、平衡性调整、丰厚的赛季奖励以及紧张刺激的段位重置,共同构成了玩家们每个季度最期待的盛宴。因此,新赛季的具体开启时间,自然成为了所有召唤师最为核心的关注点。 王者荣耀新赛季具体什么时候开始?

热心网友
04.06
《洛克王国世界》地图矿产分布一览
游戏攻略
《洛克王国世界》地图矿产分布一览

《洛克王国世界》地图矿产分布一览:老玩家带你精准挖宝 在《洛克王国世界》中实现资源积累与装备打造,矿石采集是至关重要的经济来源和生存技能。幸运的是,游戏内各大地图板块均蕴藏着丰富且种类各异的矿物资源。然而,对于矿石的具体产出地点、外观特征以及刷新规律,许多新手甚至部分资深探险家依然存在疑惑。 为此,

热心网友
04.06
如何直接打开126邮箱登录链接-126邮箱登录链接怎样直接打开
手机教程
如何直接打开126邮箱登录链接-126邮箱登录链接怎样直接打开

在信息高速流转的今天,电子邮箱已成为我们工作与生活中的核心沟通工具。作为国内领先的邮件服务提供商,126邮箱以其卓越的稳定性、丰富的功能与出色的用户体验,赢得了数亿用户的信赖。本文将为您详细介绍如何快速找到并直接打开126邮箱的官方登录链接,实现一键安全登录,助您高效管理邮件,畅享无缝沟通体验。 一

热心网友
04.06
咕咕三国是什么游戏
游戏攻略
咕咕三国是什么游戏

咕咕三国:深度体验真实三国策略世界的沉浸式手游 提到三国题材,你会联想到哪些经典场景?是谋士运筹帷幄的智慧交锋,还是名将沙场征战的铁血豪情?《咕咕三国》这款策略手游正将这段恢弘历史完美融入游戏世界,不仅再现了那段波澜壮阔的岁月,更为玩家提供了一个可以亲身调度兵马、施展战略的互动平台,让每个人都能在指

热心网友
04.06