苹果FS-DFM模型实现128倍提速,AI长文写作告别漫长等待
10月14日,科技媒体9to5Mac发布报道称,苹果公司推出全新FS-DFM扩散模型,仅需8次快速迭代就能生成媲美传统模型上千轮迭代的高质量文本,生成速度最高可提升128倍。
苹果与俄亥俄州立大学研究团队近日联合发表学术论文,提出名为“少步离散流匹配”(Few-Step Discrete Flow-Matching,简称FS-DFM)的创新语言模型。
该模型专门针对长文本生成效率进行优化,通过8轮精炼迭代即可输出高质量的长篇内容,其生成效果与传统扩散模型经过上千步迭代的结果不相上下。
在深入了解FS-DFM之前,需要明确两种主流语言模型的工作原理:
以ChatGPT为代表的自回归模型采用串行生成方式,依照前后顺序逐个生成文字单元,每个新单元的生成都依赖于之前的所有内容。
而扩散模型则采用并行生成策略,同时生成多个文字单元,通过多轮迭代不断优化,最终形成完整回复。
FS-DFM作为扩散模型的改进版本,进一步简化了迭代流程,致力于以最少的步骤直接产生最终文本。据博文介绍,苹果研究团队为实现这一目标,设计了一套精巧的三阶段方案:
首先,模型经过特殊训练,能够灵活适应不同次数的精炼迭代。
其次,研究人员引入“教师”模型进行指导,确保模型在每次迭代中都能实现大幅且准确的内容更新,同时避免过度修正的问题。
最后,团队还优化了迭代机制本身,使模型能够以更少、更稳定的步骤生成最终文本。
在性能测试中,FS-DFM还与拥有70亿参数的Dream模型和80亿参数的LLaDA模型进行了对比。实验数据表明,即使参数规模仅为1.7亿到17亿的FS-DFM变体,在困惑度和熵值两项关键指标上都表现更优——困惑度衡量文本的准确性与流畅度,数值越低越好;熵值反映模型选词的置信程度,过低会导致文本单调重复,过高则可能产生无意义内容。
相关攻略

10月15日消息,国际数据公司(IDC)今天发布2025年第三季度全球智能手机市场报告。整体市场呈现复苏态势,三季度全球出货量达3 227亿部,同比增长2 6%,AI功能与高端机型成为增长核心动力。

10 月 14 日消息,科技媒体 9to5Mac 今天(10 月 14 日)发布博文,报道称苹果提出 FS-DFM 扩散模型,仅需 8 轮快速迭代,即可生成与传统模型上千轮迭代质量相媲美的文本,且

10月14日消息,苹果宣布中国大陆用户将于10月17日起可预购iPhone Air,新机将在10月22日正式发售。这是首款支持eSIM的国行版机型,该机型取消了实体SIM卡槽,采用纯eSIM设计。除

10 月 14 日消息,苹果今日宣布,其在中国超过 90% 的生产制造现已采用可再生能源,逾百家供应商共同促成了这一进展。这一里程碑的达成,源于公司与供应商长达十年的紧密协作,双方正稳步推进到 2

10 月 14 日消息,今日,苹果公司确认将参加将于 2025 年 10 月 19 日至 23 日在檀香山举行的国际计算机视觉大会(ICCV)。据苹果公司介绍,ICCV“每年与欧洲计算机视觉会议(
热门专题


热门推荐

由十英工作室代理发行的横版战术射击游戏《破门而入:行动小队》正式版手游,将于10月17日上午10:00在安卓与iOS平台同步上线。该作在Steam平台享有“好评如潮”的美誉。为庆祝

芝麻开门 (Gate io) 官方入口及平台概览 对于数字资产爱好者来说,选择一个安全、可靠的交易平台至关重要。 芝麻开门 (Gate io) 作为

近日,由中国电信人工智能研究院(TeleAI)与中电信人工智能科技有限公司联合主办的“TeleStudio全模态视频创作挑战赛”正式拉开帷幕。本次大赛依托本月10日全网上线、限时免费开放的“Tele

10月15日消息,长光卫星日前发布了哈密“为人民服务” 标语的破坏与重生的图片记录。其介绍,2024年,哈密戈壁滩“为人民服务”大字逐渐遭人开车漂移破坏。越野爱好者在标语上肆意漂移,留下了一个个刺眼

科大讯飞近日在上海世界会客厅举办“对话世界,沟通无限——AI同传技术升级暨翻译耳机新品发布会”,同时通过迪拜Gitex Global科技盛会向全球展示中国AI翻译技术的最新突破。此次活动标志着科大讯