Loading... # Nowcasting of cloud-to-ground lightning location and frequency based on a deep learning technique 阅读笔记 ## Introduction 本节首先介绍了云地闪电对输电网络的危害,并由此引出了传统的闪电预测方案,指出了其计算量大,无法处理非线性问题的缺陷;然后引出了最近的深度学习方案,介绍了ConvLSTM、ConvGRU等;接着提出了本研究的内容和数据集;最后介绍了研究的创新点: - 实现了云对地闪电的频次预测 - 对两个实际问题进行预测,验证了落地的价值 ## Data and methods ### Data 这节讲述了数据来源: - 闪电数据为文本数据,来自CG发现网络 - 卫星数据来自卫星图像,空间分辨率为0.05°,时间分辨率为10分钟 在数据集划分上: - 将20-22年的数据作为训练集,23年的数据作为测试集 - 训练集八二分为训练集和测试集 ### Methods #### Data preprocessing 这部分讲了一下数据的预处理方式 - 雷电数据:先采用log2norm初始化纠正偏斜的分布,然后再用min-max norm消除量纲影响 - 卫星图像数据:直接采用min-max norm 消除量纲影响 然后作者做了一些初期的可视化,发现云地闪电的发生情况和卫星图像之间有一定的对应关系,初步验证了想法的可行性 #### Conv-GRU-attention model <img src="https://y0k1n0-1323330522.cos.ap-beijing.myqcloud.com/image-20251127114237513.png" alt="image-20251127114237513" style="zoom: 50%;" style=""> 这部分主要讲了整体模型的结构,由输入层、卷积层、最大池化层、GRU 层、全连接层、输出层以及注意力机制组成。 - 输入:过去六个时间步的卫星数据和闪电数据 - 输出:未来12个时间步的闪电频次图像 - CNN:提取空间特征 - GRU:捕捉不同时间步之间的依赖性 - Attention:计算不同位置的注意力权重 - Full connection:预测未来 120 分钟的闪电情况 ### Model training and evaluation 这部分介绍了损失函数和训练设计。 损失函数: $$ \text{Loss} = \sum_{t=0}^{T} W_t \cdot \frac{1}{M} \sum_{i=1}^{N_x} \sum_{j=1}^{N_y} \exp^{2.5Fls^2}\left(\hat{Fls}_{i,j} - Fls_{,i,j}\right) $$ 其中: - $Fls_{i, j}$:某个网格实际观测到的闪电频次 - $\hat{Fls}_{i, j}$:某个网格预测的闪电频次 - 指数中的$Fls$:同$Fls_{i, j}$,通过高频闪电区域误差的加权放大,无闪电区域误差常规惩罚,解决样本不平衡的问题 - $W_t$:未来12个时间步的时间权重,模型对于较晚的时间步赋予更大的权重 ## Results and discussion ### Model performance for the test set 这部分通过对于预测图象的可视化证明了模型的有效性 ### Model generalization capability #### Time dimension 这部分做了时间维度的消融实验和可视化讨论。模型是基于中国中部的夏季气象数据进行训练,然后再中国中部的冬季气象数据下进行可视化,验证模型的结果。结果表明模型在在不同时间下也有很好的表现,证明了在时间维度的生成能力。 #### Spatial dimension 这部分做了空间维度的消融实验和可视化讨论。模型是基于中国中部的夏季气象数据进行训练,然后再中国南部的夏季气象数据下进行可视化,验证模型的结果。结果表明模型不同地域下也有很好的表现,验证了再空间维度的生成能力。 ## 总结和反思 这篇文章没有给出具体的模型实现细节,不过大体给出了实现思路: - 时序+特征提取结合,进行视频预测 - CNN关注特征信息,GRU关注时序信息 - 注意力机制重新分配权重,迫使模型关注雷电发生的区域 - 通过在不同时段的数据上测试验证在时间维度的生成能力;在不同空间的数据上验证在空间维度上的生成能力 最后修改:2025 年 11 月 30 日 © 允许规范转载 赞 如果觉得我的文章对你有用,请随意赞赏