DAG革新时间序列预测:开源代码、数据与排行榜
时间序列预测是数据科学中的关键技术,广泛应用于经济趋势分析、交通流量预测、IT智能运维等核心领域。传统预测模型通常仅聚焦于目标变量(内生变量)的历史数据模式,然而现实场景中,系统行为往往受到多种外部因素(外生变量/协变量)的共同驱动。有效整合这些已知的外部信息,是提升预测准确性与决策可靠性的关键所在。
然而,现有方法在利用外生变量时常面临两大局限:一是未能充分利用预测时已知的未来协变量信息;二是缺乏对内生与外生变量间复杂动态关联的显式建模,导致信息利用不充分,预测性能存在瓶颈。
近期,华东师范大学研究团队创新性地提出了名为DAG的通用预测框架,精准应对上述挑战。该框架的核心思想在于:不仅要使用外生变量,更要“深度理解”并“智能迁移”其蕴含的关联模式。DAG通过构建时间与通道双维度的相关网络,系统性地挖掘历史与未来、内生与外生变量之间的深层依赖关系,并将这些学到的“关联模式”注入预测过程,从而显著提升模型精度。

具体而言,DAG框架并行执行两大核心任务:在时间维度,它学习历史外生变量影响未来外生变量的动态模式,并将这种“时间因果结构”迁移至目标变量的演化预测中;在通道维度,它学习历史外生变量与历史内生变量之间的交互模式,再将这种“跨变量相关结构”迁移至如何利用未来外生变量预测未来目标的过程中。这种双重迁移机制,实现了对外生信息的最大化与智能化利用。
研究背景:挖掘被忽视的“双重相关”结构
当前主流的时间序列预测模型,无论是经典的统计方法还是前沿的深度学习模型,其建模重心大多局限于目标序列自身的时间依赖性。但在诸如电力负荷预测、商品销量预估等实际应用中,未来已知的外部信息(如天气预报、节假日安排、营销计划)往往对预测结果具有决定性影响。

现有方法对此的处理存在明显不足。一类方法完全忽略未来协变量,仅依赖历史信息进行预测,这在信息利用上存在先天缺陷。另一类方法虽将未来协变量作为额外输入,但通常仅进行简单拼接或线性处理,未能建模其与目标变量间复杂的非线性动态关系,易受噪声干扰,预测效果提升有限。
问题的根源在于一个未被系统建模的“双重相关”结构:时间维度上,外生变量的历史-未来演变模式,与内生变量的历史-未来演变模式,是否共享相似的时间动态结构?通道维度上,历史阶段内外生变量与内生变量的关联模式,能否有效指导未来阶段利用外生变量预测内生变量的过程?

DAG框架的创新之处,正是通过两个独立的模块分别显式地建模并利用这两种相关性,从而构建出更强大、更鲁棒的预测系统。
模型架构:时间与通道相关性的协同建模
DAG的整体架构清晰体现了其双路径协同的设计理念,如下图所示:

时间相关模块:捕捉序列演化模式
该模块旨在建模并迁移时间维度上的相关性。其设计基于一个关键洞察:外生变量跨时间的依赖模式,与目标变量自身的时序演化模式具有结构相似性。
时间相关发现模块首先将历史外生变量序列切分为多个片段(Patch)并转换为Token序列。随后,通过标准的Transformer编码器学习这些历史片段对未来外生变量的注意力权重。其巧妙之处在于,模块并非直接传递原始的注意力分数,而是提取Transformer中可学习的查询(Query)和键(Key)投影矩阵的参数,将其作为更本质、更鲁棒的“时间相关表示”。同时,该模块会输出对未来外生变量的一个辅助预测,其预测误差构成“时间相关损失”,用于监督时间关联模式的学习。
时间相关注入模块则负责将学到的“时间相关表示”应用于目标变量预测。它对历史内生变量进行同样的分块处理,并引入一个“相关增强的Transformer块”。在此模块中,注意力机制融合了两部分信息:一部分来自内生变量本身的线性投影;另一部分则来自发现模块提取的查询/键参数。通过一个可学习的门控机制动态融合两组注意力得分,最终生成基于历史内生变量的未来预测。至此,外生变量蕴含的时间动态模式被有效注入。
通道相关模块:建模变量间交互影响
该模块专注于建模不同变量(通道)之间的静态与动态关联。
通道相关发现模块的目标是学习历史外生变量如何影响历史内生变量。它将每个历史外生变量的完整序列编码为一个汇总Token,然后通过Transformer学习其与历史内生变量序列的关联。同样,它会提取注意力机制中的可学习参数作为“通道相关表示”,并输出对历史内生变量的辅助预测,其误差构成“通道相关损失”。
通道相关注入模块则利用未来外生变量来预测未来内生变量,并注入前面学到的“通道相关表示”。其流程与时间注入模块对称:编码未来外生变量,在相关增强的Transformer块中融合来自通道发现模块的相关参数,最终输出基于未来外生变量的预测。这使得历史阶段学到的变量间因果关系,能够指导模型更智能地解读和利用未来的协变量信息。
多任务学习与预测融合
DAG采用多任务学习策略进行端到端训练。总损失函数由三部分组成:时间相关损失(监督外生变量时间模式学习)、通道相关损失(监督变量间关系学习)以及核心的最终预测损失(监督目标变量预测精度)。
模型最终输出是时间注入模块和通道注入模块各自预测结果的加权融合。通过调整相关损失与最终预测损失的权重,模型能够在学习通用相关结构和优化具体任务性能之间取得最佳平衡。
实验验证:性能卓越,优势突出
综合性能对比
研究在电力、交通、经济、气象等领域的12个真实世界数据集上进行了全面的长短期预测实验,对比了包括TiDE、TFT、PatchTST、TimesNet等在内的9个前沿基线模型。对于不支持未来协变量的基线,研究通过添加额外网络进行了公平适配。
实验结果显示,DAG在绝大多数数据集和预测长度上,其均方误差(MSE)和平均绝对误差(MAE)均显著优于所有对比方法,证明了其框架的优越性和普适性。

消融实验分析
为验证各模块的必要性,研究进行了系统的消融实验,结果明确显示:
- 仅使用历史内生变量或仅使用未来外生变量,预测误差均较高,证实单一信息源不足。
- 简单结合两者(基线方法)能带来提升,但仍有局限。
- 分别引入时间相关模块或通道相关模块,都能带来超越简单结合的显著性能增益。
- 完整的DAG模型(同时包含双重相关模块)取得了最佳性能,有力证明了同时建模时间和通道相关性的设计是有效且必要的。

参数鲁棒性分析
对关键超参数的敏感性分析表明,DAG框架具有良好的鲁棒性。例如,预测融合权重和相关损失权重在0.3至0.7区间内模型表现稳定;嵌入维度在64到256之间能兼顾性能与效率;Patch长度在8到32之间可根据数据特性选择,以平衡局部特征捕捉与计算复杂度。

未来信息缺失场景的适应性
针对实际中未来外生变量可能无法获取的场景,研究测试了DAG的变体:使用模型自身预测的未来外生变量替代真实值。实验表明,即使在这种信息受限的模式下,DAG的表现依然稳健,其性能优于许多专门为仅使用历史协变量设计的模型,展现了框架的灵活性与实用性。

结论与展望
综上所述,DAG框架为融合外生变量的时间序列预测问题提供了一个创新且高效的解决方案。它通过显式建模并迁移时间与通道双重相关性,深度挖掘了数据中隐含的结构化信息,特别是实现了对未来已知协变量的智能化利用。全面的性能对比与细致的消融实验均验证了该框架设计的有效性与先进性。这项工作不仅显著提升了多变量时间序列预测的精度,也为如何更深入地理解与融合多源异构时序数据提供了新的方法论启示。
相关攻略
5月15日,蚂蚁开源万亿参数模型Ring-2 6-1T。其核心创新是可调节推理强度机制,提供“high”与“xhigh”模式,分别优化智能体任务与高难度科研数学。采用异步强化学习与“棒冰算法”,显著提升训练效率与稳定性。基准测试表现顶尖,在代码生成、财务分析、3D游戏开发等场景展现广泛应用潜力。
深夜,一位电商运营专员仍在手动将数千条订单数据从一个平台复制粘贴到另一个系统;而隔壁技术团队的工程师,早已通过简洁的脚本指令,让“数字员工”在十分钟内精准无误地完成了全部工作。 这巨大效率差距的背后,核心驱动力正是机器人流程自动化(RPA)技术。如今,开源RPA框架已成为众多企业和开发者实践自动化、
在AI辅助开发的日常中,我们常常会遇到一个令人头疼的问题:项目初期文档清晰、记忆整洁,但随着功能迭代和Bug修复,代码库越来越庞大,而配套的文档和AI记忆却逐渐“腐化”,变得过时甚至矛盾。这直接导致了一个普遍现象——你的AI助手似乎越用越“笨”,给出的建议开始偏离实际,甚至犯下一些莫名其妙的错误。
在多模态人工智能处理领域,传统的检索增强生成(RAG)框架长期面临一个核心瓶颈:它们通常专精于文本处理,一旦涉及图像、视频等非文本信息,要么需要依赖OCR等技术进行“翻译”,要么就完全无法处理。这种割裂的处理模式不仅损失了原始数据的丰富语义和视觉细节,也让整个推理过程如同黑箱,难以追溯、验证与优化。
全球AI图像生成领域的竞争格局,正迎来前所未有的激烈变革与范式升级。 就在上周,OpenAI正式推出GPT-Image-2,其卓越的视觉表现力与精准的文本遵循能力引发了行业广泛关注。无论是高度拟真的电商直播场景、充满复古质感的90年代风格照片,还是逻辑缜密的知识图谱可视化,一系列令人惊叹的演示案例迅
热门专题
热门推荐
为庆祝品牌投身赛车运动整整125年,斯柯达正式推出了晶锐Fabia Motorsport Edition特别版。这款车基于Fabia 130打造,设计灵感直接来源于征战赛场的Fabia RS Rally2拉力赛车,整体风格充满了对赛事历史的致敬意味。不过,得先说明白,它的升级重点主要落在了外观和底盘
Grayscale 通过其以太坊质押 ETF 质押了 102,400 个 ETH,价值 2 37 亿美元 先来看一组数据:资产管理巨头 Grayscale 最近通过其以太坊质押 ETF,一口气质押了超过10万个 ETH,价值约2 37亿美元。这个动作本身不小,但更有意思的是市场的后续反应——或者说,
劳斯莱斯库里南自问世以来,始终是超豪华全尺寸SUV领域的标杆。对于追求极致安全又不愿牺牲低调气质的高净值人士而言,如何实现“隐形”的顶级防护,一直是核心诉求。如今,加拿大专业防弹车制造商Inkas,以一款近乎“零痕迹”改装的库里南,给出了完美解决方案——一座移动的“隐形堡垒”。 区别于常见的外露装甲
新加坡维塔士工作室正考虑将《侠盗猎车手V》与《荒野大镖客:救赎2》移植至任天堂Switch平台。该团队拥有丰富的移植经验,曾成功负责多款游戏的跨平台适配。这两款作品全球销量巨大,若能登陆Switch,其便携特性可能成为新的市场增长点。
当高尔夫GTI迎来五十周年里程碑,传奇的纽博格林北环赛道成为其致敬历史与展望未来的最佳舞台。这里不仅铭刻了燃油性能图腾的巅峰时刻,也正式开启了电动GTI的新纪元。近日,大众汽车正式宣布,高尔夫GTI 50周年版在纽北创下全新纪录,荣膺最快前驱量产车称号;与此同时,品牌首款纯电动GTI车型——ID





