Research and Application of Image Recognition Technology for Disastrous Weather Events in Hebei
-
摘要: 为有效利用社会化观测灾害性天气事件的大量图像,发展监测新手段,以社会公众发布的灾害性天气事件图像为训练集,基于残差网络ResNet50(Residual Network 50)构建了8类灾害性天气事件图像识别模型,并通过格点化气象要素实况二次订正技术以及线上审核、线下更新的优化模式,提高模型识别精度和运行效率。结果表明,优化后8类模型识别的平均准确率在80% 以上,已应用于河北省多源气象灾情监测采集业务,获取的灾害性天气和气象灾害事件图像数量较传统方式有显著提升。
-
关键词:
- 灾害性天气 /
- 图像识别 /
- 社会化观测 /
- ResNet50残差网络 /
- 格点化实况订正 /
Abstract: To effectively utilize the extensive image data of disastrous weather events observed by the public, and to develop new monitoring methods, we created a training set using images of disastrous weather events shared by the public. Based on the ResNet-50 convolutional neural network, an image recognition model was developed for eight types of disastrous weather events. The model's accuracy and operational efficiency were enhanced through a secondary correction technique using gridded meteorological parameters, as well as an optimization mode involving online auditing and offline updates. After optimization, the average recognition accuracy rate of the eight models exceeded 80%. This technology has been applied to the multi-source meteorological disaster monitoring and documentation in Hebei Province, significantly increasing the number of images obtained for disastrous weather events compared to traditional methods. -
表 1 灾害性天气事件图像样本筛选标准
类别 图像样本筛选标准 降雨 在图像中明显可见空中水滴滴落或地面形成汇流 降雪 在图像中明显可见雪花飘落或地面形成积雪 冰雹 在图像中出现球形冰状物体,且图像中一般伴随地面湿润、树叶凌乱等现象 雾 图像中出现浑浊气体,使得图像模糊,造成视觉障碍 内涝 图像中的城市产生积水现象,造成局部交通不便 洪水 图像中江河湖泊水量迅速增加或水位迅猛上涨,造成大面积破坏 滑坡 图像中的土体或岩体,受雨水浸泡,沿着软弱面或软弱带,整体地或分散地顺坡向下滑动 倒塌 图像中的建筑物由于降雨或大风等气象因素,造成墙壁倾倒、塌落 表 2 各类灾害性天气事件图像数据
类别 训练集正例数量(数据增强前) 训练集正例数量(数据增强后) 训练集负例数量 总数量(数据增强后) 降雨 7 143 7 143 15 000 32 294 降雪 10 294 17 294 7 000 14 143 雾 4 978 9 978 10 000 19 978 冰雹 3 444 6 444 10 000 16 444 滑坡 2 596 3 596 14 000 21 000 倒塌 3 859 4 859 6 000 9 204 洪水 3 000 7 000 5 000 8 596 内涝 1 704 3 204 5 000 9 859 总计 37 018 59 518 72 000 131 518 表 3 五折交叉验证测试结果(单位:%)
类型 Fold-1 Fold-2 Fold-3 Fold-4 Fold-5 平均值 P R F1 P R F1 P R F1 P R F1 P P P P R F1 降雨 97.4 98.1 97.7 97.6 98.0 97.8 97.1 97.9 97.5 97.0 98.3 97.6 98.1 97.5 97.8 97.4 98.0 97.7 降雪 94.5 95.0 94.7 95.3 94.5 94.9 94.5 93.8 94.1 95.0 93.8 94.4 95.1 95.1 95.1 94.9 94.4 94.7 雾 95.6 94.8 95.2 95.6 94.8 95.2 95.0 95.7 95.4 95.3 95.2 95.3 95.1 95.1 95.1 95.3 95.1 95.2 冰雹 94.1 86.0 89.9 94.4 87.1 90.6 95.1 83.2 88.8 94.2 84.0 88.8 93.9 87.1 90.3 94.3 85.5 89.7 内涝 85.5 88.1 86.8 87.3 93.9 90.5 91.2 90.4 90.8 89.9 93.2 91.5 90.1 88.1 89.1 88.8 90.7 89.7 洪水 79.0 95.7 86.5 86.5 85.2 85.9 85.6 79.9 82.6 86.9 77.9 82.2 85.5 81.5 83.5 84.7 84.0 84.1 滑坡 90.7 91.2 90.9 89.0 91.1 90.0 91.1 90.3 90.7 87.9 91.7 89.8 83.5 92.7 87.9 88.5 91.4 89.9 倒塌 89.4 85.5 87.4 89.7 86.9 88.3 91.1 84.3 87.6 88.6 87.7 88.2 91.1 77.6 83.8 90.0 84.0 87.0 平均值 90.8 91.8 91.1 91.9 91.4 91.6 92.6 89.4 90.9 91.9 90.2 91.0 91.6 89.3 90.3 91.7 90.4 91.0 注:P代表查准率,R代表查全率,F1代表F1分数。 表 4 6类图像识别模型在测试集上的准确率
灾害性天气事件名称 过程时间 测试数据情况 准确率/% 降雨 2016.07.18—26 共推送1 117张
正确927张83.0 2018.07.21—26 降雪 2019.02.10—15 共推送14 609张
正确13 505张92.4 2019.12.15—16 雾 2019.01.10—15 共推送648张
正确569张87.8 冰雹 2018.06.12—15 共推送58张
正确49张84.5 2019.05.15—18 内涝 2016.07.18—26 共推送1 497张
正确1 240张82.8 2018.07.21—26 洪水 2016.07.18—26 共推送593张
正确482张81.3 2018.07.21—26 表 5 模型运行条件及图像识别结果复筛指标
模型名称 模型运行时间 模型运行区域 图像识别结果复筛指标 降雨 3—11月 全区 3 h降雨量 > 0 mm 降雪 9月—次年5月 张家口、承德 3 h降雪量 > 0 mm 11月—次年4月 其他地区 雾 全年 全区 能见度 < 5 km 冰雹 4—10月 全区 24 h降雨量 > 0 mm 内涝 4—10月 城市 图像拍摄时间前推24 h内出现3 h降雨量 > 10 mm 洪水 4—10月 全区 图像拍摄时间前推7天内日降雨量 > 10 mm 倒塌 全年 全区 图像拍摄时间前推7天内日降雨量 > 10 mm 滑坡 4—11月 山区 图像拍摄时间前推7天内日降雨量 > 10 mm 注:复筛指标优先应用格点化气象数据,10 km内所含站点或格点数据有满足筛选条件即通过筛选。 -
[1] 王书欣, 陈元昭, 张舒婷. 基于爬虫技术的社会化观测数据获取及应用[J]. 气象科技进展, 2019, 9(3): 234-237. [2] 武凯利, 仝宗和, 张鹏升, 等. 基于深度学习的复杂气象条件下海上船舶识别[J]. 科学技术与工程, 2019, 19(3): 130-135. [3] 韩兴, 刘晓平, 王刚, 等. 基于深度神经网络复杂场景下的机器人拣选方法[J]. 北京邮电大学学报, 2019, 42(5): 22-28. [4] 吴雪, 宋晓茹, 高嵩, 等. 基于数据增强的卷积神经网络火灾识别[J]. 科学技术与工程, 2020, 20(3): 1 113-1 117. [5] 王远谋, 李家启, 陈施吉, 等. 基于机器学习的重庆长江航道雾图像特征识别研究[J]. 气象与环境学报, 2021, 37(1): 106-112. [6] 关胤. 基于残差网络迁移学习的花卉识别系统[J]. 计算机工程与应用, 2019, 55(1): 174-179. [7] 甘俊英, 翟懿奎, 黄聿, 等. 基于双激活层深度卷积特征的人脸美丽预测研究[J]. 电子学报, 2019, 47(3): 636-642. [8] 阎妍, 行鸿彦, 刘刚, 等. 基于"深度学习"识别模型的玉米农田监测应用系统设计与实现[J]. 气象科技, 2019, 47(4): 571-580. [9] 米前川, 高西宁, 李玥, 等. 深度学习方法在干旱预测中的应用[J]. 应用气象学报, 2022, 33(1): 104-114. [10] KIM L I. Deep learning-based monitoring of overshooting cloud tops from geostationary satellite data[J]. Giscience & Remote Sensing, 2018, 55(5): 763-792. [11] 黄彬, 吴铭, 孙舒悦, 等. 基于深度学习的卫星多通道图像融合的海雾监测处理方法[J]. 气象科技, 2021, 49(6): 823-829, 850. [12] 孟辉, 路志英, 李笑冬, 等. 基于图像识别技术的高炮安全射界图辅助绘制系统设计与应用[J]. 干旱气象, 2020, 38(4): 689-696. [13] 王兴, 吕晶晶, 王璐瑶, 等. 基于深度神经网络的强对流天气识别算法[J]. 科学技术与工程, 2021, 21(7): 2 737-2 746. [14] 韩丰, 龙明盛, 李月安, 等. 循环神经网络在雷达临近预报中的应用[J]. 应用气象学报, 2019, 30(1): 61-69. [15] 金子琪, 王新敏, 鲍艳松, 等. 基于卷积神经网络的飑线识别算法[J]. 应用气象学报, 2021, 32(5): 580-591. [16] 唐伟, 周勇, 董昊, 等. 我国气象领域应用人工智能技术的现状和国际对比[J]. 气象科技进展, 2019, 9(5): 55-56, 62. [17] 杜智涛, 姜明波, 杜晓勇, 等. 机器学习在气象领域的应用现状与展望[J]. 气象科技, 2021, 49(6): 930-941. [18] 孙伟帅. 基于迁移学习的天气图像识别[J]. 西华大学学报(自然科学版), 2021, 40(1): 22-26. [19] 褚荣燕, 王钰, 杨杏丽, 等. 基于正则化KL距离的交叉验证折数K的选择[J]. 计算机技术与发展, 2021, 31(3): 52-57. [20] 周俊宇, 赵艳明. 卷积神经网络在图像分类和目标检测应用综述[J]. 计算机工程与应用, 2017, 53(13): 34-41. [21] ALEX K, ILYA S, GEOFFREY E H. ImageNet classification with deep convolutional neural networks[J]. Communications of the ACM, 2017, 60(6): 84-90. [22] 常亮, 邓小明, 周明全, 等. 图像理解中的卷积神经网络[J]. 自动化学报, 2016, 42(9): 1 300-1 312. [23] SZEGEDY C, LIU W, JIA Y, et al. Going deeper with convolutions[C]//Proceedings of the IEEE conference on computer vision and pattern recognition: 1-9. [24] GAO H, ZHUANG L, LAURENS V D M, et al. Densely connected convolutional networks[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017: 2 261-2 269. [25] HE K M, ZHANG X Y, REN S Q, et al. Deep residual learning for image recognition[C]//Proceedings of the IEEE conference on computer vision and pattern recognition, 2016: 770-778. -