基于神经遗忘决策集成网络(NODE)与数值特征嵌入的极端降雨事件预测:多变量气象表格数据分析
Abstract
极端降雨事件的频发对区域水资源管理与城市防灾减灾构成严峻威胁,准确的极端气象预测已成为大气科学领域的核心诉求。传统数值天气预报(NWP)系统受限于次网格尺度参数化瓶颈,难以精准捕捉局地极端降水的突发性;而以梯度提升决策树(GBDT)为代表的浅层机器学习模型在处理高维异构气象表格数据时,存在固有的特征表征瓶颈。为此,本研究提出了一种引入分段线性编码(PLE)数值特征嵌入的神经遗忘决策集成网络(NODE-PLE)。该架构将一维连续气象物理量映射至高维稠密特征空间,并利用基于 激活函数的可微遗忘决策树实现端到端的非线性特征交互。实证研究基于覆盖澳大利亚49个气象站、跨度10年的142,193个样本数据集,采用深度去噪自编码器处理高缺失率变量,构建物理驱动的高阶衍生特征,并以焦点损失函数(Focal Loss)应对极端事件(降雨量> 13.00 mm,占比4.97%)的类别不平衡问题。独立测试集验证表明,NODE-PLE 在综合性能上取得了与传统 GBDT 基线模型竞争的表现,RMSE 降至8.58 mm,较XGBoost下降 6.8%,展现了深度学习架构结合数值特征嵌入在气象表格数据极端事件预测中的潜力与竞争力。