深度学习周报(5.11~5.17)
目录摘要Abstract1 文献阅读 《Quantum Machine Learning for Climate Modelling》1.1 研究背景1.2 方法论1.3 创新点1.4 实验结果3 总结摘要本周主要阅读了《Quantum Machine Learning for Climate Modelling》这篇论文了解了使用量子神经网络进行云量参数化的方法主要包括量子部分的网络实现以及 shap 分析的评估方法。AbstractThis week, I mainly read the paper titled Quantum Machine Learning for Climate Modelling and learned about the method of using quantum neural networks for cloud fraction parameterization, which primarily includes the network implementation of the quantum part and the evaluation method using SHAP analysis.1 文献阅读 《Quantum Machine Learning for Climate Modelling》1.1 研究背景地球系统模型ESM是地球系统不同组成部分及其相互作用的全球耦合模型包括大气、海洋、陆地和冰冻圈通常用于预测未来气候变化以改进气候变化减缓和适应策略。一般来说用于的 ESM 存在计算成本高和分辨率受限的问题而且云物理和湍流等亚网格过程无法直接解析需要经验参数化这会带来偏差。同时结合机器学习ML改善传统物理模型已被证实可行但经典 ML 模型在超出训练区域时泛化能力有限。量子机器学习QML则因其潜在的高表达能力和良好的泛化性能为改进 ESM 中的参数化提供了新思路。1.2 方法论本文旨在使用量子神经网络进行云量参数化以替代传统参数化方案同时探索 QNN 与经典神经网络NN的性能和学习稳定性差异。故方法论主要包括数据处理架构设计训练方法与评估方法几个方面。其中数据主要使用高分辨率 ICON 模型模拟水平分辨率 2.5 km再进行粗粒化到 80km 网格作为训练数据输入特征包含比湿、云水、云冰、温度、压力、水平风速、几何高度、纬度等。架构上QNN 包括数据重上传、变分量子电路和测量后的线性加权输出量子比特数量与输入特征数相等经过适当的重新缩放后输入特征被编码为多层编码层中单量子比特旋转的角度整体通过 Pennylane 库在 Python 中进行数值模拟并用 JAX 进行优化p.s. 数据重上传用于增加模型能够捕获的傅里叶频率数量。经典 NN 则采用三层隐藏层节点数分别为 12、6、2输出云量。最后通过 SHAP 值即根据输入特征在模型输出中添加或移除的部分进行评分以评估输入特征对模型预测的贡献从而比较 QNN 和经典 NN 的特征重要性与稳定性。1.3 创新点本文创新点主要如下首先将量子神经网络直接嵌入 ESM 参数化流程是 QML 在气候建模的实际应用探索。其次利用数据重上传与变分量子电路设计增加模型的 Fourier 表达能力和非线性处理能力使 QNN 可捕捉复杂的输入输出关系。最后首次将 SHAP 方法系统应用于量子机器学习模型比较量子与经典网络在学习物理规律上的稳定性。1.4 实验结果本文实验主要分为性能比较与可解释性分析两部分。在性能比较上QNN 与经典 NN 在均方误差和指标上相近均明显优于传统 Xu-Randall 参数化当两者具有相似数量的自由参数时经典NN在性能上略优于QNN。另外QNN 对训练噪声表现出较好鲁棒性当采样次数足够大时含噪声的训练能够成功并紧密贴合无噪声的训练曲线不过当采样次数较少时训练初期均方误差会下降但随后会变得不稳定。在可解释性分析上QNN 的特征重要性分布SHAP 值在不同训练实例间较为稳定而经典 NN 则差异巨大这主要是因为它可能学到不一致甚至非物理的关系。2 总结本周三次元的事情较多所以只简单看了下论文整体感觉中规中矩。其模型跟上篇论文差不太多貌似还包括一部分在量子计算机上进行的部分。相对重点感觉是了解到了 shap 分析这种无关模型的评估方法感觉后面可能会有使用的地方。下周大概会延续之前的想法一是找一篇方便复现的或者方法上有不同比如量子结合不同的模型架构之类的论文进行阅读二是寻找一下公开可用的数据集。