GridSFM：一种用于电网的预训练新型小型基础模型

时间：2026-06-06 16:19

GridSFM是一个面向电网的轻量级基础模型，采用离散神经算子实现交流最优潮流（AC-OPF）毫秒级近似求解。在54个电网测试中，成本误差中位数为2 23%，可替代直流潮流模型；具备不可行场景识别、完整运行点输出及热启动加速能力。基于150个拓扑和50万场景训练，支持零样本泛化与少量样本微调迁移。

电力系统正面临着前所未有的挑战：用电需求持续攀升、可再生能源大规模并网、交通电气化加速推进，以及极端天气事件愈发频繁，每一项都让人头疼。这些问题背后，其实都指向同一个核心：在不断变化的运行条件下，如何找到电网最经济的“最佳工作点”？

要找到这个工作点，就需要求解一个名为“交流最优潮流”（AC‑OPF）的数学问题。它极其复杂，属于非凸优化问题。目标是在满足所有物理定律（比如电压不越限、线路不过热）、系统稳定性和负荷需求的前提下，计算出最便宜的发电机出力方案。可以说，从日常调度、实时市场出清到事故预想分析，电网的每一次关键决策都离不开它。这些决策直接影响着每年高达200亿美元的阻塞成本，以及因线路拥堵而被迫放弃的、理论上网量达数千亿瓦时的清洁能源。问题的关键在于，AC‑OPF的计算代价极高。对于一个实际规模的输电网，求解一次可能需要几个小时。这迫使运行人员不得不在“仔细算几个关键场景”和“用简化模型算几千个场景”之间做出痛苦取舍。而像直流潮流（DC‑OPF）这类简化模型，为了追求速度，忽略了无功功率、电压等关键物理特性，算出的结果在某些工况下可能严重偏离实际，导致调度方案不经济，甚至在重负荷下威胁系统可靠性。

正是为了打破这个计算瓶颈，微软推出了**GridSFM**——一个专门为电网设计的“小型”基础模型。这个模型本质上是一个单一的神经网络，可以在毫秒级时间内，为从500到80,000个节点不等的电网提供AC‑OPF的近似解。你只需要输入电网拓扑、发电机和负荷数据、以及线路约束，它就能快速输出一个运行点，并告诉你这个点是否“可行”（即是否满足所有物理和运行约束）。这种速度提升是革命性的，意味着我们可以实时评估成千上万甚至更多的运行场景，让电网运行从“事后被动响应”真正转变为“事前主动优化”。

这次发布的GridSFM，其技术内核是一个分块结构的离散神经算子。它把电网看作一个有向图：节点（母线）和发电机是顶点，输电线是边。模型的训练过程很有意思，它用了两套“老师”：一套是传统AC‑OPF求解器（比如IPOPT）给出的精确解作为“监督”，另一套则是物理定律本身。任何违反基尔霍夫定律或运行约束（如热极限）的行为，都会在训练时受到惩罚。这样一来，模型不仅能学习可行解，也能理解不可行解的特征。

与以往大多数需要针对每个电网拓扑单独训练一个模型的方法不同，GridSFM走的是“通用化”路线。这次发布的版本，在**150个基础电网拓扑**和约**50万个场景**上进行了训练。这些场景涵盖了各种负荷变化、多重设备故障、线路降额、电压收紧以及不同的机组报价。目的很明确：逼着模型学会“泛化”，而不是死记硬背。

在我们的测试中，GridSFM-Open版本在54个电网混合场景上的表现是：

成本差距：与求解器给出的“真值”相比，成本差距的中位数仅为2.23%（均值为3.41%），且高达83%的场景下，差距低于5%。
热启动速度：如果你需要更高的精度，可以把GridSFM的预测结果作为“初始猜测”，输入给传统求解器。这种“热启动”方式，比完全从头算起的“冷启动”快了1.66倍（几何平均），比用DC-OPF结果做热启动也快了1.59倍。
自适应能力：这个模型还展现了惊人的适应力，仅需少量样本的微调就能迁移到全新的电网拓扑上。

GridSFM vs. DC-OPF：一个更聪明的替代品

目前行业里的普遍做法，是在需要快速近似时，使用DC-OPF。它把复杂的交流方程线性化，假设电压固定、角度很小，忽略无功和损耗。这确实能换来速度（从分钟级甚至小时级缩短到秒级），但代价也很明确：它“看不见”电压和无功约束，在系统承受压力时，其调度成本可能比最优AC解高出10%以上。在我们的测试基准中，某些极端电网的误差甚至超过了20%。

GridSFM的设计目标，就是成为DC-OPF在这个“快速近似”位置上的一个替代品。它和DC-OPF一样通用，不用为每个新拓扑重新训练。但与DC-OPF相比，有三个硬核优势：

1. 识别“不可行”场景的能力。 所谓“不可行”，是指当前的负荷根本无法被满足，无论你怎么调度都会违反电压、热极限等约束。这是运行中最危险的信号，也是排查成本最高的环节。因为求解器只有在花大量时间迭代后才发现算不下去了，才知道这场景不可行。GridSFM自带一个“压力分数”头，可以给每个场景打分，快速识别出哪些场景大概率是不可行的。在我们的测试中，这个分数对真实可行场景的识别准确率是94.5%，对真实不可行场景的准确率是96.1%。

2. 提供完整的运行点。 与只给出有功功率的DC-OPF不同，GridSFM的输出包含了完整的交流运行点，包括电压和相角。这意味着运行人员可以直接评估系统真实的运行状态，特别是那些决定系统安全性的电压和无功潮流。

3. 更出色的热启动效果。 正如前文所述，GridSFM的热启动比冷启动和DC-OPF热启动都快得多。这是因为它的预测更接近真实的AC-OPF最优解，大大减少了求解器迭代的次数。在德州夏季峰值电网（Texas2k）这类网格化输电网中，加速比甚至超过了7倍。

深入案例：从德克萨斯电网看模型能力

我们以德克萨斯夏季峰值电网（Texas2k）为例，看看GridSFM内部发生了什么。模型会把每个场景映射到一个128维的空间里，然后我们可以将这个高维空间压缩到两个维度来观察。有趣的是，代表“可行”、“真实不可行”和“人为制造不可行”的三类场景，在压缩后的空间里呈现出清晰的聚类。它们的“类中心”相距甚远，说明模型确实成功地将“可行”与“不可行”区分开了。

基于这种区分能力，模型预测的“压力分数”的AUC（曲线下面积）高达0.986，在自然操作点下的分类准确率为95.5%。这意味着运行人员可以根据这个分数，制定一个分流策略：分数很低（自信可行）的场景，直接采用模型给出的调度方案；分数很高（肯定出了问题）的场景，立即交给工程师人工审查；分数居中、拿不准的场景，再交给传统求解器去仔细算。这个策略平衡了“计算成本”和“漏报风险”。

零样本泛化与快速微调：这才是基础模型的价值

为了测试GridSFM是否是真正意义上的“基础模型”，我们用了一个它从未见过的新电网——拥有6,470个节点的 case6470_rte，比其训练集中的最大网格还要大1.4倍。结果呢？

零样本（Zero-shot）表现： 意料之中，性能出现了下降。成本误差上升到14%，电压预测变得几乎平坦，可行性分类器把所有场景都判定为不可行。但这个模型至少还能正确排序不同场景的成本高低。
少量微调（Few-shot）后： 性能迅速回升。仅仅用1000个场景训练10个epoch，成本误差就降到了1.12%，电压预测精度重回91%，可行性检测几乎完美。更妙的是，这种适应性还能跨过事故（N-1）进行迁移。
极致的小样本： 就算只用10个场景微调，成本误差也能控制在1.76%，可行性检测准确率超过90%。

这说明，GridSFM在预训练阶段已经深刻理解了AC-OPF的物理机理。迁移到新电网，主要工作更像是“校准”而非“重新学习”。这个开放的模型权重，完全可以作为用户在自己电网拓扑上进行微调的起点。

以下是不同微调样本量下的性能表现对比：

微调样本数	成本误差	可行性检测
0 (零样本)	14%	0 (完全崩溃)
10	1.76%	92%
100	0.88%	97%
1000	1.12%	99%

展望与总结

我们认为，GridSFM最有价值的应用场景，正是那些受到单次求解时间限制，不得不“挑选”少数场景进行分析的领域：事故筛选、输电扩展规划、负荷选址分析，以及在极端天气下的韧性研究。这次发布的GridSFM-Open版本，连同我们之前开放的美国电网开源拓扑数据集，组成了一个完整的技术栈：开源数据、开源代码、开源模型权重。我们希望这能成为社区构建更强大电网模拟器、规划工具和决策支持系统的一个起点。

关于 GridSFM-Premier： 请注意，我们还有一个规模更大的生产级版本，但这次不包含在开放发布中。如果您有兴趣评估或合作，欢迎通过官方邮箱联系我们。

来源：https://cloud.tencent.com.cn/developer/article/2682870

foundation