LIGHTNING PREDICTION CAPABILITY IMPROVEMENT BASED ON FEATURE EXTRACTION AND ENSEMBLE LEARNING
-
摘要: 雷电是对人类社会有重大安全影响的自然灾害之一, 对雷电进行监测、预警是降低其危害的重要手段。利用广州市黄埔区的大气电场仪资料和闪电定位资料统计分析了反映雷电趋势的相关特征, 并从中提取预警因子探讨与电场仪探测范围内雷电事件的相关性, 基于基分类器BP神经网络, 分别通过Bagging和Adaboost的方法建立集成模型。试验表明, 在以30分钟为时间片的雷电事件预警中, 基于BP神经网络模型, 对比本试验提取的特征和其他研究提供的特征, 误报率和漏报率分别降低了16.83%和15.19%;集成方法比未集成的单一BP神经网络误报率最大降低了11.46%, 漏报率最大降低了4.73%, 说明了特征提取和集成学习的方法能有效提升模型在雷电预测中的准确率。Abstract: Lightning is one of the natural disasters that have a major impact on human safety. Monitoring and early warning of lightning are important means to reduce harm. The present study uses the atmospheric electric field data and lightning location data in Huangpu District of Guangzhou to analyze relevant features that reflect the lightning trend, find early warning factors from them, and explore their correlation with lightning events within the electric field detection range. The experiment is based on the base classifier BP neural network, and establishes the ensemble model through Bagging and Adaboost respectively. The experiments show that in the early warning of lightning event with a time window of 30 minutes, the features extracted in this experiment reduce FPR and FNR by 16.83% and 15.19%respectively, compared with the features provided by the current research. Compared with the single BP neural network, the ensemble method reduces FPR by 11.46% and FNR by 4.73%, which shows that the method of feature extraction and ensemble learning can effectively improve the accuracy of the model in lightning prediction.
-
表 1 预测因子及其相关性分析
预测因子 定义 相关性系数 电场探测量 电场仪探测返回的数值量 0.417 电场全距 电场强度的最大值减最小值 0.334 极性反转 电场曲线正负反转的次数 0.370 差分全距 电场差分的最大值减最小值 0.335 差分最大值 电场差分的最大值 0.313 差分绝对值均值 电场差分绝对值的平均值 0.465 接近闪电 距离电场仪15~20 km范围内是否发生闪电 0.683 表 2 混淆矩阵
混淆矩阵 真实值 正 负 预测值 正 TP FP 负 FN TN -
[1] 田德宝, 冯瑜骅, 张雪慧, 等. 2012-2017年全国雷电灾害事故统计分析[J]. 科技通报, 2020, 36(5): 42-47. [2] 罗林艳, 祝燕德, 王智刚, 等. 基于大气电场与闪电资料的雷电临近预警方法[J]. 成都信息工程学院学报, 2010, 25(5): 524-530. [3] 柴瑞, 王振会, 肖稳安, 等. 大气电场资料在雷电预警中应用[J]. 气象科技, 2009, 37(6): 724-728. [4] 行鸿彦, 张强, 季鑫源. 基于地面电场资料的雷电临近预报研究[J]. 大气科学学报, 2017, 40(1): 111-117. [5] 徐彬彬. 基于大气电场组网数据的雷电灾害预警应用[D]. 南京: 南京信息工程大学, 2018. [6] 周俊驰, 王振会, 冯民学, 等. 南京周边地区雷电过境时电场特征及其在预警中的应用[J]. 高原气象, 2013, 32(5): 1 470-1 477. [7] 王凯, 朱浩, 刘安平, 等. 黄山风景区雷电电场特征及预警方法研究[J]. 气象与环境学报, 2015, 31(5): 184-189. [8] 马明, 吕伟涛, 张义军, 等. 我国雷电灾害及相关因素分析[J]. 地球科学进展, 2008(8): 856-865. [9] 周明薇, 肖稳安, 张其林, 等. 基于支持向量机的雷电潜势预报初探[J]. 大气科学学报, 2018, 41(4): 569-576. [10] 陈勇伟, 郑涛, 王汉堃, 等. 基于BP神经网络模型的雷电潜势预报[J]. 干旱气象, 2013, 31(3): 595-601. [11] 田浩, 章涵, 冯万兴, 等. 基于BP神经网络和大气电场特征的地闪雷电预测方法[J]. 电瓷避雷器, 2018(6): 27-33. [12] 刘三梅, 吕海勇, 陈绍东, 等. 广东省雷电风险区划研究[J]. 资源科学, 2014, 36(11): 2 337-2 344. [13] ALWIN J H, AARNOUT V D. Thunderstorm predictors and their forecast skill for the Netherlands[J]. Atmos Res, 2003, 67(3): 273-299. [14] 张亚刚, 杨银, 张成军, 等. 基于径向基函数神经网络温度预报订正方法及评估[J]. 热带气象学报, 2021, 37(1): 136-144. [15] 张天虎, 鲍艳松, 钱芝颖, 等. 基于BP神经网络与遗传算法反演大气温湿廓线[J]. 热带气象学报, 2020, 36(1): 97-107. [16] 周满国, 黄艳国, 杨训根. 基于GRU神经网络与灰色模型集成的气温预报[J]. 热带气象学报, 2020, 36(6): 855-864.