变分掩码扩散模型：优化并发标记预测的依赖关系处理

首页

AI资讯

热心网友

转载

2025-10-30

变分掩码扩散(VMD)模型通过引入潜在变量，成功解决了标准掩码扩散在并发标记预测中无法有效捕捉依赖关系的问题。在合成数据、数独谜题和文本数据上的实验都证明了VMD的有效性，特别是在标记间依赖关系重要的场景中。

1. 研究背景与问题定义

基于扩散的大型语言模型(DLLMs)作为自回归模型(ARMs)的重要扩展，正在成为生成式AI领域的重要创新方向。与传统ARMs按预定顺序逐一生成标记的方式不同，DLLMs提供了并发标记生成、更高输出多样性、增强全局一致性以及更好的生成文本可控性等优势。近期的突破性模型如LLaDA、Mercury和Gemini Diffusion都凸显了DLLMs的潜力。

然而，当前的掩码扩散模型(MDM)存在一个关键限制：无法有效捕捉并发预测的标记之间的依赖关系。这导致在标记间依赖性较强的推理任务中性能下降。例如，在预测"A poker hand that consists of two English words is: a a"的后续两个词时，合适的预测应为"high card"、"two pair"、"full house"或"straight flush"。这些词对之间存在强依赖关系，但MDM在并发预测时会独立采样，无法考虑这种依赖性，从而可能产生不合理的组合。

2. 变分掩码扩散(VMD)模型

为解决上述问题，研究者提出了变分掩码扩散(Variational Masked Diffusion, VMD)框架，通过引入潜在变量来建模并发预测期间的联合标记分布。VMD的核心思想是：通过潜在变量模型捕捉任意联合分布，而不仅仅是可因式分解的分布。

图片

2.1 基本变分公式

VMD的基本公式为：

pθ(x0i|xt) = ∫pθ(x0i|xt,z)p(z)dz

其中z是全局潜在变量，不依赖于标记位置i。这使得模型能够在标记之间建立联合分布。条件于潜在变量z，标记可以独立采样，但边缘化潜在变量后，能够从正确的联合分布中获得样本。

训练目标函数(NELBO)为：

-log pθ(x0) ≤ ∫(0→1) (1/t)


		
		  
			
		  
		  来源:https://www.51cto.com/article/828393.html
		
        
          免责声明：
          游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。
        
		
        
				
			上一篇：阿里新研究：统一VLA与世界模型的核心方法解析
							下一篇：TEE.fail漏洞威胁：NVIDIA、Intel、AMD硬件安全防护风险分析
		        

				        
          相关攻略
		            
            
				
			
            
              
                
                  
                
                科技数码
              
            
            人大AI智能体提速：扩散模型实现边思考边搜索
            这项由中国人民大学、上海交通大学等机构联合完成的研究发表于2026年，论文编号为arXiv:2602 07035v1，标志着人工智能搜索代理技术的一次重要突破。有兴趣深入了解的读者可以通过该论文编号   
            
              
                
                  
                
                热心网友
              
              02.12
            
          
		            
            
				
			
            
              
                
                  
                
                AI资讯
              
            
            PickStyle视频风格适配器：用上下文迁移完成视频风格转换
            论文提出PickStyle框架，用风格适配器增强预训练网络，靠配对静态图像数据训练，还通过构建合成训练片段弥合差距，引入CS-CFG确保风格迁移与内容保留。实验表明，该方法能实现优质视频转换，优于现   
            
              
                
                  
                
                热心网友
              
              02.10
            
          
		            
            
				
			
            
              
                
                  
                
                AI资讯
              
            
            Stable-DiffCoder突破扩散模型，实现代码生成新超越
            机器之心编辑部扩散语言模型（Diffusion Language Models, DLLMs）因其多种潜在的特性而备受关注，如能加速的非自回归并行生成特性，能直接起草编辑的特性，能数据增强的特性。然   
            
              
                
                  
                
                热心网友
              
              02.09
            
          
		            
            
				
			
            
              
                
                  
                
                科技数码
              
            
            扩散模型如何预测？独立研究者揭秘最佳目标策略
            扩散模型就像是一位神奇的画家，它能从一片混乱的噪点中逐步画出美丽的图像。不过，这位画家在作画时面临一个关键选择：它应该专注于去除画布上的噪点，还是直接描绘最终的图像轮廓？这个看似简单的问题，实际上一   
            
              
                
                  
                
                热心网友
              
              02.04
            
          
		            
            
				
			
            
              
                
                  
                
                AI资讯
              
            
            PractiLight：扩散模型重塑图像照明，无需大规模微调的奥秘
            论文的关键见解是，图像中的光照关系本质上类似于自注意力层中的标记交互，因此在自注意力层中得到了最佳体现。 标题:PractiLight: 使用基础扩散模型进行实用光控制论文：https:  arxi   
            
              
                
                  
                
                热心网友
              
              01.25
            
          
		          
				
        
          热门专题
          
																	
					
						
					
					
						刀塔传奇破解版无限钻石下载大全
						2025-08-05
					
				
																		
					
						
					
					
						洛克王国正式正版手游下载安装大全
						2025-08-05
					
				
																																																					          
        
        
          最新APP
          
							                    
              
              
                宝宝过生日
                
                  应用辅助
                  
                  04-07
                
              
            
			            
              
              
                台球世界
                
                  体育竞技
                  
                  04-07
                
              
            
			            
              
              
                解绳子
                
                  休闲益智
                  
                  04-07
                
              
            
			            
              
              
                骑兵冲突
                
                  棋牌策略
                  
                  04-07
                
              
            
			            
              
              
                三国真龙传
                
                  角色扮演
                  
                  04-07
                
              
            
						          
        
        
          热门推荐
		  		            
            
				
			
            
              
                
                  
                
                AI资讯
              
            
            面壁智能开源全双工全模态模型MiniCPM-o 4.5详解
            MiniCPM-o 4 5是什么 在探索更自然、更智能的人机交互道路上，我们始终在期待一个“全能型选手”的到来。如今，这个角色或许已经登场。面壁智能最新开源的MiniCPM-o 4 5，一个仅拥有90亿参数的全模态大模型，正致力于重新划定“智能对话”的边界。 它彻底颠覆了传统一问一答的“对讲机”式交
            
              
                
                  
                
                热心网友
              
              05.23
            
          
		            
            
				
			
            
              
                
                  
                
                web3.0
              
            
            2025欧易OKX官网正版APP下载入口及安全获取教程
            Binance币安 欧易OKX ️ Huobi火币️ 想在2025年安全获取欧易OKX的正版APP？其实秘诀就一个：认准官方网站，避开所有仿冒和可疑的下载渠道。要知道，欧易现已统一更名为欧易OKX，其核心业务始终围绕数字资产交易及相关服务展开。 确认官方网站地址 第一步，打开浏览器，手动输入欧易OK
            
              
                
                  
                
                热心网友
              
              05.23
            
          
		            
            
				
			
            
              
                
                  
                
                AI资讯
              
            
            国产AI社交平台SecondMe：真人发帖与智能互动体验
            SecondMe Book是什么 在AI社交这一前沿赛道，一款国产平台正带来独特的解决方案。SecondMe Book，本质上是一个能够让你构建个人AI数字分身的创新平台。它允许用户创建一个能够代表真实自我风格与思维的AI数字身份，并让这个“第二自我”在一个专属的AI社交网络中自主运行——包括主动发
            
              
                
                  
                
                热心网友
              
              05.23
            
          
		            
            
				
			
            
              
                
                  
                
                AI资讯
              
            
            阶跃星辰开源Step 3.5 Flash基座模型详解
            在AI大模型技术快速发展的今天，如何在卓越性能与高效推理成本之间取得最佳平衡，已成为行业关注的核心焦点。近期，由阶跃星辰推出的开源模型Step 3 5 Flash引发了广泛热议。该模型专为智能体（AI Agent）应用场景深度优化，旨在顶尖能力与亲民部署成本之间，构建一个极具竞争力的技术支点。 简而
            
              
                
                  
                
                热心网友
              
              05.23
            
          
		            
            
				
			
            
              
                
                  
                
                AI资讯
              
            
            美团开源LongCat大语言模型Flash Lite版本详解
            LongCat-Flash-Lite是什么 在探索大语言模型性能与效率的最佳平衡点时，美团近期推出的LongCat-Flash-Lite提供了一个极具创新性的解决方案。作为新一代高效大语言模型，它凭借其突破性的架构设计，在人工智能领域获得了广泛关注。 简而言之，该模型创新性地融合了“混合专家系统（M
            
              
                
                  
                
                热心网友
              
              05.23