首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
利用堆叠集成学习,英国研究团队实现251颗盾牌座δ型星星震学指数高精度预测

利用堆叠集成学习,英国研究团队实现251颗盾牌座δ型星星震学指数高精度预测

热心网友
40
转载
2026-04-27

英国华威大学研究团队构建了一套堆叠式集成学习框架,直接从 TESS 光变曲线中预测盾牌座 δ 型星的关键星震学参数。该方法在 643 颗恒星样本上取得了显著效果:所有目标参数的决定系数 R² 均高于 0.77,并在未参与训练的 60 颗恒星上表现出良好的泛化能力,预测结果与传统星震学分析高度一致。

想窥探恒星的内心世界吗?星震学就是那把钥匙。通过解析恒星天然的振荡信号,科学家得以反演其内部结构与演化状态,这堪称现代恒星物理中最具穿透力的研究手段。而在众多研究对象中,盾牌座 δ 型星(质量约为太阳的 1.5–2.5 倍)因其丰富的脉动模式和高度密集的振荡频谱,当之无愧地成为了星震学的“黄金实验场”。这类恒星的脉动,主要源于氦电离区的不透明度(κ)机制驱动,而其内部活跃的对流核,则进一步引发了诸如对流超射、化学混合以及角动量再分配等一系列复杂过程。更棘手的是,较快的自转会让振荡模式发生耦合与频率分裂,这无疑给模式识别与参数提取的难度加了个“倍增器”。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

在星震学分析中,功率谱中最高峰对应的频率、最大振荡功率频率,以及大频率间隔 Δν 等参数尤为重要。其中,Δν 对恒星的平均密度极为敏感,是刻画其整体结构的核心指标。然而,对于盾牌座 δ 型星而言,快速自转与多模式混叠,往往会把原本规则的频率间隔搅得一团糟,这让传统方法在测量 Δν 时举步维艰。

转机出现在数据洪流时代。近年来,TESS 卫星获取的大规模高精度光变曲线数据,极大拓展了该类恒星的研究样本,但随之而来的数据处理过程依然计算密集、高度依赖经验,想要高精度提取参数,依然不是件轻松的事。正是在这一背景下,机器学习提供了一条全新的技术路径。相比传统方法,集成学习能够巧妙融合多个模型的预测结果,在复杂数据环境下往往能实现更高的精度与稳定性。像随机森林、梯度提升和岭回归这些方法,近年来在天文学数据分析中已崭露头角,展现出不小的潜力。

英国华威大学的研究团队正是抓住了这一趋势,他们构建了一套堆叠式集成学习框架,目标直指一个核心问题:能否绕过繁琐的中间步骤,直接从 TESS 光变曲线中预测出盾牌座 δ 型星的关键星震学参数?答案是肯定的。该方法在 643 颗恒星样本上表现亮眼:所有目标参数的决定系数 R² 均高于 0.77,更关键的是,在未参与训练的 60 颗恒星上,它同样表现出优秀的泛化能力,预测结果与传统星震学分析高度吻合。

这项研究成果已以「Ensemble Machine Learning Approach to Estimate the Asteroseismic Indices for δ Scuti Stars Observed by TESS」为题,正式发表于 The Astronomical Journal。

研究亮点:

* 提出了一套直接从光变曲线估算关键星震学参数的机器学习框架,突破了传统方法的局限,大幅提升了参数提取的效率。

* 通过优化特征选择和模型架构,实现了高精度预测,并在独立样本上验证了其可靠性。

* 完成了 251 颗盾牌座 δ 型星的星震学指数测定,构建了新星表,丰富了相关恒星的参数数据库,为今后大样本统计分析和恒星演化研究提供了重要数据支撑。

论文地址:https://beta.iopscience.iop.org/article/10.3847/1538-3881/ae4bd8

数据集:TESS 光变曲线筛选与星震学样本构建

这项研究的基石,是一个包含 643 颗盾牌座 δ 型星的 TESS 光变曲线数据集,以及与之对应的三项关键星震学指数:ν(Aₘₐₓ)、νₘₐₓ 和 Δν。初始样本虽有 677 颗恒星,但经过多轮严格筛选,最终保留了 643 颗作为核心数据集。筛选标准相当明确:必须拥有 TESS 2 分钟短曝光光变曲线(数据来自 MAST 档案);每个观测天区的数据点不能少于 7,000 个;光变曲线需经过 PDC-SAP 校正处理;并且,三项星震学参数必须完整可用。

光有训练数据还不够。研究人员额外选取了 251 颗盾牌座 δ 型星作为补充样本。这些恒星同样拥有高质量光变曲线,但其星震学参数尚未被发表。它们的入选条件同样严格:至少覆盖 3 个观测天区,且每个天区数据点不低于 7,000 个。这部分样本,正是用来检验模型实战能力的“新战场”。

643 颗盾牌座 δ 型星的频数直方图

模型:多基模型堆叠的集成回归框架

整个模型的目标很清晰:基于光变曲线的特征,估算恒星的星震学参数。实现路径则环环相扣,主要包括特征提取、数据预处理、集成建模以及超参数优化。

在特征构建方面,研究采用了“两条腿走路”的策略。一类是统计特征,比如均值、标准差、中位数等,用来描述光度分布的基本性质;另一类是频域特征,包括主成分分析(PCA)、自相关函数(ACF)、快速傅里叶变换(FFT)以及离散小波变换(DWT),目的是为了从振荡信号中提取出周期性与多尺度结构信息。

在数据预处理阶段,第一步是剔除存在缺失值的样本,并对所有特征进行归一化处理,让它们站在同一起跑线上。此外,针对部分特征分布不均衡可能带来的模型偏差问题,研究引入了基于统计分布的重采样方法,通过生成合成数据来缓解这一问题,从而提升模型训练的稳定性。

框架是整个方法的核心。模型采用了堆叠式集成回归框架,随机森林、梯度提升回归和岭回归三大基模型各司其职:前两者分别从降低方差和减小偏差的角度提升预测性能,岭回归则通过正则化专门处理特征间的共线性问题。这些基模型的预测输出,并不会被直接采用,而是作为新的输入特征,去训练一个元回归器进行最终融合。这种“集各家之长”的策略,能有效提升整体泛化能力并降低预测误差。

当然,好模型离不开好参数。在模型训练过程中,研究人员采用了随机搜索结合交叉验证的方法,对树的数量、最大深度和学习率等关键超参数进行精细优化,以确保获得稳定且性能最优的模型配置。

以 60 颗独立星检验泛化,所有星震学指数 R²>0.77

实验验证是检验真理的唯一标准。整个过程分为模型训练、泛化能力评估以及新样本预测三个部分。

在训练阶段,研究人员从 643 颗恒星中随机选取 583 颗用于构建模型,并按照 8:2 的比例划分训练集与测试集。为了降低随机性的影响,这一过程重复了 100 次。剩下的 60 颗恒星则被完全“隔离”,作为独立的测试集,专门用于评估模型面对全新数据时的泛化能力。而那 251 颗未标注样本,则留待最后进行实际预测。

对比 583 颗星的实测与预测值、相对误差及误差分布

在训练与测试样本上,模型的表现堪称优秀:对 ν(Aₘₐₓ)、νₘₐₓ 和 Δν 的预测 R² 分别达到了 0.95、0.93 和 0.87,大多数样本的相对误差被控制在 0.2 以下。特征重要性分析揭示了哪些信息贡献最大:自相关函数(ACF)拔得头筹,FFT 与 DWT 紧随其后,部分统计特征(如偏度、峰度)也发挥了一定作用。学习曲线则显示模型收敛稳定,超参数优化效果显著。

模型学习曲线

真正的考验在独立测试集上。模型依然保持了强劲的性能,三个参数的 R² 分别为 0.91、0.87 和 0.77,预测结果与观测值高度一致。多次重复实验的结果波动很小,这充分说明了模型具有出色的稳定性与鲁棒性。最终,研究人员将训练好的模型应用于那 251 颗未标注恒星,成功得到了它们的星震学参数预测值。令人放心的是,所有预测结果都落在了盾牌座 δ 型星的合理参数范围内。

结语

总而言之,这项工作并非意在取代传统的星震学方法,而是提供了一种极具针对性的高效补充。在大规模观测数据滚滚而来的今天,这种思路的价值愈发凸显:先通过数据驱动方法实现参数的高效、批量预估,再结合精细的物理建模进行深入分析和验证。对于像盾牌座 δ 型星这样振荡模式复杂、传统处理方式效率瓶颈明显的目标,这条“机器学习+天体物理”的融合路径,无疑打开了一扇新的大门,让科学家能更从容地应对星海中的数据洪流。

来源:https://36kr.com/p/3784745204521990
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

别信大众智慧?研究称预测市场真正依赖的是“知情少数派”
web3.0
别信大众智慧?研究称预测市场真正依赖的是“知情少数派”

预测市场的真相:是群体智慧,还是少数人的游戏? 说起预测市场,很多人脑海里会立刻浮现出“群体智慧”这个词。成千上万的用户对事件反赌,最终价格似乎总能精准反映现实概率——这听起来像是民主化预测的完美典范。但最近一项来自伦敦商学院和耶鲁大学的研究,却给这个浪漫的想象泼了一盆冷水。 研究团队发现,像Pol

热心网友
04.27
伊朗警告波斯湾安全形势严峻,霍尔木兹海峡紧张局势加剧
web3.0
伊朗警告波斯湾安全形势严峻,霍尔木兹海峡紧张局势加剧

伊朗议员警告:若安全受威胁,波斯湾航道或陷动荡 伊朗议员法达侯赛因·马利基近日发出警告,称如果伊朗的沿海安全受到威胁,波斯湾和阿曼海将出现不安全局势。这无疑给该地区的航运前景蒙上了一层阴影。与此同时,市场对于霍尔木兹海峡交通将于5月15日恢复正常的预期,也出现了微妙变化,目前概率为14 5%。是的,

热心网友
04.27
Oracle RAC如何检查归档模式?跨节点确认归档归属
数据库
Oracle RAC如何检查归档模式?跨节点确认归档归属

Oracle RAC归档日志全面检查指南:节点级验证与线程归属深度解析 在Oracle RAC集群环境中,归档日志的配置与状态检查是一项需要精细化操作的关键任务。它要求数据库管理员必须对每个节点逐一进行归档模式、路径设置、日志生成状态的审查,并深刻理解日志线程归属的核心逻辑。检查的核心流程是:首先通

热心网友
04.27
Oracle RMAN恢复时如何重命名日志文件_配置日志路径参数
数据库
Oracle RMAN恢复时如何重命名日志文件_配置日志路径参数

解决RMAN恢复时日志文件名冲突引发的 ORA-01157 错误 在使用RMAN执行数据库恢复操作时,若目标磁盘上已存在同名的在线重做日志文件(例如 redo01 log),恢复进程常会中断并抛出 ORA-01157: cannot identify lock data file 错误。值得注意的是

热心网友
04.27
SQL如何查询用户连续达标的天数_窗口函数状态机模型
数据库
SQL如何查询用户连续达标的天数_窗口函数状态机模型

SQL如何查询用户连续达标的天数:窗口函数状态机模型 说起查询“连续达标”天数,很多人的第一反应可能是用日期相减。但这里有个本质问题需要先想清楚:我们到底在识别什么? “连续达标”的本质是识别不间断的满足条件时间序列,需用LAG()判断状态延续性并用SUM() OVER构造段ID,而非依赖日期相减。

热心网友
04.27

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

我国刀具市场发展调研报告
办公文书
我国刀具市场发展调研报告

我国刀具市场发展调研报告 在当今制造业持续升级的背景下,市场调研报告的重要性日益凸显。一份结构清晰、数据翔实的报告,能为决策提供关键参考。以下这份关于我国刀具市场的调研报告,旨在梳理现状、剖析问题,并为未来发展提供借鉴。 当前,国内刀具年销售额约为145亿元,其中硬质合金刀具占比不足25%。这一比例

热心网友
04.27
国内首份空净市场调研报告
办公文书
国内首份空净市场调研报告

国内首份空净市场调研报告 在公众健康意识日益增强的今天,市场报告的重要性不言而喻。一份结构清晰、数据翔实的报告,能为行业描绘出精准的航图。那么,一份优秀的市场调研报告究竟该如何呈现?近期发布的这份国内空气净化器行业蓝皮书,或许能提供一个范本。 市场增长的势头有多强劲?数据显示,国内空气净化器市场正驶

热心网友
04.27
水利工程供水管理调研报告
办公文书
水利工程供水管理调研报告

水利工程供水管理调研报告 在各类报告日益成为工作常态的今天,撰写一份扎实的调研报告,关键在于厘清现状、找准问题、提出思路。这份关于水利工程供水管理的报告,旨在系统梳理情况,为后续决策提供参考。 一、基本情况 横跨区域的**水库及八座枢纽拦河闸,构成了**运河流域防洪与兴利供水的骨干工程体系。自投入运

热心网友
04.27
财产保全申请书范本
办公文书
财产保全申请书范本

财产保全申请书范本 一份规范的财产保全申请书,是启动财产保全程序的关键文书。其核心在于清晰、准确地列明各方信息、诉求与依据。通常,申请书的结构是固定的,但具体内容需要根据案件事实来填充。下面,我们通过几个典型的范本来拆解其中的要点。 篇一:通用格式范本 首先来看一个通用模板。这个模板清晰地勾勒出了申

热心网友
04.27
暑假大学生防台风社会实践调研报告范文
办公文书
暑假大学生防台风社会实践调研报告范文

“防台抗台”活动由学院的积极分子组成,他们踊跃报名,利用暑期时间奉献自己的青春,为社会尽一份力量。 带队的学院分团委书记吕老师点出了活动的深层价值:这不仅是一次能力锻炼,更是学生认识社会、融入社会并最终回馈社会的关键一步。经过这番历练,团队友谊愈发坚固,协作精神显著增强,感恩之心也油然而生。 青春洋

热心网友
04.27