RISK ASSESSMENT FOR TYPHOON ECONOMIC LOSSES IN COUNTY-BASED UNITS USING MACHINE LEARNING
-
摘要: 基于2008—2019年我国台风县(区)灾情的直接经济损失数据,根据经济损失率将台风灾害经济损失风险分为五类,考虑台风灾害的致灾因子和孕灾环境因子共选取10个解释变量,采用五种经典的机器学习算法,包括支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)、AdaBoost、XGBoost(Extreme Gradient Boosting Machine)和LightGBM(Light Gradient Boosting Machine),分别构建台风灾害经济损失风险评估模型,选出准确率最高的模型,应用于经典台风过程并进行检验评估。结果表明:基于RF算法的台风灾害经济损失风险模型的准确率最高;利用RF、XGBoost、LightGBM、AdaBoost和SVM算法构建模型的准确率依次为0.69、0.63、0.62、0.45和0.41。选择RF算法构建的台风灾害经济损失风险模型的解释变量表明,致灾因子是最主要的解释变量,其中,降雨导致损失的重要性超过风速。该模型在训练集和测试集上对风险分类的TS评分为0.55和0.51,但对每种风险类别的辨别能力存在差异,对于最低风险和最高风险的分类效果较好,对于较高风险和中等风险的分类能力不足。利用该模型对2017年第13号台风“天鸽”的经济损失进行检验评估,评估结果与实际台风灾害经济损失的风险等级较一致,各风险等级的准确率均达到0.7以上,TS评分在0.58以上,空报率和漏报率分别在0.31和0.25以下。Abstract: Based on the direct economic losses data of typhoon disasters in county-based units from 2008 to 2019, ten explanatory variables are selected by considering disaster-causing factors and environmental factors. Algorithms including Support Vector Machine (SVM), Random Forest (RF), AdaBoost, Extreme Gradient Boosting Machine (XGBoost) and Light Gradient Boosting Machine (LightGBM) are used to build typhoon economic losses risk models respectively. The performance is evaluated to identify the model with the best accuracy. The result show that the accuracy of typhoon economic losses risk model using RF algorithm is highest; the accuracy of models using RF, XGBoost, LightGBM, AdaBoost and SVM are 0.69, 0.63, 0.62, 0.45 and 0.41, respectively. According to the model based on RF, disaster-causing factors are the dominant explanatory variable, and the importance of rainfall-induced losses exceeded that of wind speed. The model is good at economic losses risk classification, with TS scores of 0.55 and 0.51 for the training and test sets. However, the model has different ability to distinguish between each category. The model has a good classification effect on the lowest risk and highest risk, but has a certain deficiency in higher risk and medium risk. This model is applied to Typhoon Hato, the 13th typhoon in 2017, and the results are consistent with the actual economic losses risk level, with the accuracy above 0.7, the TS score above 0.58, and the false alarm rate and false alarm rate below 0.31 and 0.25, respectively.
-
Key words:
- typhoon disaster /
- economic losses /
- risk assessment /
- machine learning /
- random forest
-
表 1 基于不同机器学习算法构建台风灾害损失模型的性能对比
学习算法 准确率 召回率 精确率 F1分数 RF 0.69 0.68 0.67 0.67 XGBoost 0.63 0.63 0.62 0.63 LightGBM 0.62 0.62 0.62 0.62 AdaBoost 0.45 0.45 0.43 0.44 SVM 0.41 0.41 0.38 0.36 表 2 模型在训练集和测试集的准确率、TS评分、空报率和漏报率
风险评估 训练集 测试集 模型 最低风险 较低风险 中等风险 较高风险 最高风险 最低风险 较低风险 中等风险 较高风险 最高风险 准确率 0.95 0.61 0.52 0.63 0.75 0.93 0.57 0.48 0.59 0.70 TS评分 0.72 0.48 0.43 0.49 0.62 0.71 0.42 0.38 0.45 0.57 空报率 0.21 0.37 0.48 0.32 0.30 0.25 0.41 0.50 0.38 0.32 漏报率 0.05 0.45 0.51 0.41 0.25 0.11 0.48 0.58 0.45 0.28 表 3 台风“天鸽”损失风险评估的准确率、TS评分、空报率和漏报率
风险评估 最低风险 较低风险 中等风险 较高风险 最高风险 平均值 准确率 0.91 0.72 0.70 0.74 0.86 0.79 TS评分 0.76 0.61 0.58 0.63 0.72 0.66 空报率 0.20 0.18 0.31 0.22 0.13 0.21 漏报率 0.10 0.25 0.15 0.21 0.19 0.15 -
[1] 端义宏. 登陆台风精细结构的观测、预报与影响评估[J]. 地球科学进展, 2015, 30(8): 847-854. [2] 隋广军, 唐丹玲. 台风灾害评估与应急管理[M]. 北京: 科学出版社, 2015. [3] 温姗姗, 翟建青, FISCHER T, 等. 1984-2014年影响中国热带气旋的经济损失标准化及其变化特征[J]. 热带气象学报, 2017, 33(4): 478-487. [4] WANG Y J, WEN S S, LI X C, et al. Spatiotemporal distributions of influential tropical cyclones and associated economic losses in China in 1984-2015[J]. Natural Hazards, 2016, 84(3): 2 009-2 030. [5] 陈文方, 端义宏, 陆逸, 等. 热带气旋灾害风险评估现状综述[J]. 灾害学, 2017, 32(4): 146-152. [6] GROSSI P, KUNREUTHER H. Catastrophe modeling: a new approach to managing risk[M]. Springer US, 2005. [7] VICKERY P J, MASTERS F J, POWELL M D, et al. Hurricane hazard modeling: The past, present, and future[J]. Journal of Wind Engineering and Industrial Aerodynamics, 2009, 97(7): 392-405. [8] 陈克平. 灾难模型化及其国外主要开发商[J]. 自然灾害学报, 2004, 13(2): 1-8. [9] 张晓宇, 韦波, 杨昊宇, 等. 基于GIS的广东省台风灾害风险性评价[J]. 热带气象学报, 2018, 34(6): 783-790. [10] 张悦, 李珊珊, 陈灏, 等. 广东省台风灾害风险综合评估[J]. 热带气象学报, 2017, 33(2): 281-288. [11] 杨绚, 张立生, 杨琨, 等. 台风大风低矮房屋易损性及智能网格预报的应用[J]. 气象, 2020, 46(3): 429-440. [12] 雷小途, 陈佩燕, 杨玉华, 等. 中国台风灾情特征及其灾害客观评估方法[J]. 气象学报, 2009, 67: 875-883. [13] 赵珊珊, 任福民, 高歌, 等. 近十年我国热带气旋灾害的特征研究[J]. 热带气象学报, 2015, 31(3): 793-800. [14] FISCHER T, SU B D, WEN S S. Spatio-temporal analysis of economic losses from tropical cyclones in affected provinces of China for the last 30 years (1984-2013)[J]. Natural Hazards Review, 2015, 16(4): 04015010. [15] WANG H, XU M, ONYEJURUWA A, et al. Tropical cyclone damages in Mainland China over 2005-2016: losses analysis and implications[J]. Environment, Development and Sustainability, 2019, 21(6): 3 077-3 092. [16] 王秀荣, 张立生, 李维邦. 台风灾害综合等级评判模型改进及应用分析[J]. 气象, 2018, 44 (02): 304-312. [17] CHEN W, LU Y, SUN S, et al. Hazard footprint-based normalization of economic losses from tropical cyclones in China during 1983-2015[J]. International Journal of Disaster Risk Science, 2018, 9(2): 195-206. [18] 尹宜舟, 高歌, 王国复. 气象灾害的灾体模型及其初步应用[J]. 气象, 2019, 45(10): 1 439-1 445. [19] 赵珊珊, 高歌, 任福民, 等. 广东省县域单元热带气旋灾害损失评估方法研究[J]. 热带气象学报, 2018, 34(3): 332-338. [20] 丑洁明, 班靖晗, 董文杰, 等. 影响广东省的热带气旋特征分析及灾害损失研究[J]. 大气科学, 2018, 42 (2): 357-366. [21] 陈佩燕, 杨玉华, 雷小途, 等. 我国台风灾害成因分析及灾情预估[J]. 自然灾害学报, 2009, 18(1): 64-73. [22] 尹宜舟, 李焕连. 我国台风灾害年景预评估方法初探[J]. 气象, 2017, 43(6): 716-723. [23] WEN S S, SU B D, WANG Y J, et al. Economic sector loss from influential tropical cyclones and relationship to associated rainfall and wind speed in China[J]. Global and Planetary Change, 2018, 169(2): 224-233. [24] 殷洁, 戴尔阜, 吴绍洪. 中国台风灾害综合风险评估与区划[J]. 地理科学, 2013, 33(11): 1 370-1 376. [25] 朱婧, 陆逸, 李国平, 等. 基于县级分辨率的福建省台风灾害风险评估[J]. 灾害学, 2017, 32(3): 204-209. [26] 周福, 陈海燕, 娄伟平, 等. 浙江省台风灾害评估与风险区划[M]. 杭州: 浙江教育出版社, 2012: 75-87. [27] 张颖超, 仲丽君. 基于灰关联和回归分析的台风灾害损失研究与分析[J]. 热带气象学报, 2013, 29(4): 665-671. [28] 叶丁嘉, 王国复, 尹宜舟, 等. 基于灰色关联法的县域台风灾情评估方法初探[J]. 海洋气象学报, 2019, 39 (1): 68-75. [29] 高歌, 黄大鹏, 赵珊珊. 基于信息扩散方法的中国台风灾害年月尺度风险评估[J]. 气象, 2019, 45(11): 1 600-1 610. [30] 于小兵, 俞显瑞, 吉中会, 等. 基于信息扩散的东南沿海台风灾害风险评估[J]. 灾害学, 2019, 34(1): 73-77. [31] 卢耀健, 刘合香, 王萌. 华南台风灾害的风险熵-极限学习机预测模型研究[J]. 灾害学, 2019, 34(4): 216-221. [32] 张文, 赵珊珊, 万仕全, 等. 基于人工智能技术的热带气旋灾害评估方法研究: 以广东省为例[J]. 气候与环境研究, 2018, 23(4): 504-512. [33] 郭桂祯, 刘乃山. 基于随机森林模型的区域洪涝灾害房屋倒损评估方法研究[J]. 灾害学, 2018, 33(3): 48-51. [34] 刘扬, 王维国. 基于随机森林的暴雨灾害人口损失预估模型及应用[J]. 气象, 2020, 46 (3): 393-402. [35] YING M, ZHANG W, YU H, et al. An Overview of the China Meteorological Administration Tropical Cyclone Database[J]. J Atmos Oceanic Technol, 2014, 31(2): 287-301. [36] 任福民, BYRON G, DAVID E. 一种识别热带气旋降水的数值方法[J]. 热带气象学报, 2001, 17(3): 308-313. [37] 王咏梅, 任福民, 王小玲, 等. 中国台风降水分离客观方法的改进研究[J]. 气象, 2006, 32(3): 6-10. [38] 陆逸, 朱伟军, 任福民, 等. 1980-2014年中国台风大风和台风极端大风的变化[J]. 气候变化研究进展, 2016, 12(5): 413-421. [39] BEVEN K, KIRKBY M J. A physically based, variable contributing area model of basin hydrology[J]. Hydrological Science Bulletin, 1979, 24(1): 4 369. [40] 解河海, 黄国如. 地形指数若干计算方法探讨[J]. 河海大学学报(自然科学版), 2006, 34(1): 46-50. [41] 金亦, 张文平, 刘金涛, 等. 2017. 地形指数与流域退水特征的关系分析[J]. 人民长江, 48(13): 23-25. [42] 徐新良, 庄大方, 贾绍凤, 等. GIS环境下基于DEM的中国流域自动提取方法研究[J]. 长江流域资源与环境, 2004, 13(4): 343-348. [43] CORTES C, VAPNIK V. Support-vector networks[J]. Machine Learning, 1995, 20: 273-297. [44] HSU C W, LIN C J, A comparison of methods for multiclass support vector machines[J]. IEEE Transactions on Neural Networks, 2002, 13 (2): 415-425. [45] 周志华. 机器学习[M]. 北京: 清华大学出版社, 2016. [46] BREIMAN L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32. [47] FREUND Y, ROBERT E S. A decision-theoretic generalization of on-line learning and an application to boosting[J]. Journal of Computer and System Sciences, 1997, 55(1): 119-139. [48] CHEN T, TONG H. Higgs boson discovery with boosted trees[C]. International Conferenceon Highenergy Physics&Machine Learning. 2014. [49] GUOLIN K, QI M, THOMAS F, et al. LightGBM: A Highly Efficient Gradient Boosting Decision Tree[M]. Advances in Neural Information Processing Systems 30 (NIPS 2017): 3 149-3 157. [50] CHAWLA N V, BOWYER K W, HALL L O, et al. SMOTE: Synthetic minority over-sampling technique[J]. Journal of Artificial Intelligence Research, 2002, 16(1): 321-357. [51] 金荣花, 代刊, 赵瑞霞, 等. 我国无缝隙精细化网格天气预报技术进展与挑战[J]. 气象, 2019, 45(4): 445-457.