VISIBILITY FORECAST BASED ON PROXIMAL SUPPORT VECTOR MACHINE
-
摘要: 利用2008—2010年逐年12月、次年1月的T511L61数值预报产品和单站观测资料,采用近似支持向量机方法,分别建立了南京、杭州和衢州站分类和回归结合的能见度释用预报模型(简称分类和回归结合模型)。利用2011年12月、次年1月资料作为独立样本,对模型进行试报检验,并与不分类条件下的纯回归模型进行对比。结果表明:分类和回归结合模型的预报效果好于纯回归模型,在24、36、48、60和72 h试报中,分类和回归结合模型的南京、杭州和衢州三站平均的准确率依次为75.5%、83.7%、72.1%、75.4%和78.0%,在除48 h的其余4个预报时次中,分类和回归结合模型的三站平均的准确率均高于纯回归模型。分类和回归结合模型在单站能见度预报中有较好的应用前景。
-
关键词:
- 近似支持向量机 /
- 分类和回归结合的模型 /
- 能见度 /
- 预报
Abstract: Based on T511L61 numerical prediction products and observed stations data of December and January from 2008 to 2010, a classification-regression forecast model is established for visibility at Nanjing, Hangzhou and Quzhou stations by using proximal support vector machine.The model is tested using independent samples of December and January in 2011, and compared with the regression one.The results indicate that the forecasting effect of the classification-regression model is better than that of the regression one.The average accuracy of classification-regression model for the three stations in 24 h, 36 h, 48 h, 60 h and 72 h is 75.5%, 83.7%, 72.1%, 75.4% and 78.0%, respectively. Its average accuracy is also higher than that of regression one.The classification-regression model is suitable for forecasting visibility at these stations.-
Key words:
- proximal support vector machine /
- classification-regression model /
- visibility /
- forecast
-
表 1 南京站第36 h能见度预报因子
名称 高度/hPa 经度/°E 纬度/°N 相关系数 水汽压 1 000 118 31 0.63 风速 850 122 35 0.39 涡度 1 000 120 32 0.42 条件性稳定指数 925 120 31 0.38 温度露点差 1 000 120 31 0.37 偏差风 850 121 30 0.40 表 2 能见度分级标准
级别 能见度/km 1 0 < V≤1 2 1 < V≤2 3 2 < V≤4 4 4 < V≤6 5 6 < V≤10 6 10 < V≤20 7 V > 20 表 3 南京站模型试验结果准确率
单位:%。 分类界限/km 24 h 36 h 48 h 60.h 72.h 4 69.2 55.0 76.9 57.5 79.5 6 69.2 47.5 66.7 50.0 66.7 8 74.4 65.0 74.4 52.5 82.0 10 79.5 77.5 74.4 70.0 87.2 表 4 模型各预报时次的准确率
单位:%。 预报时效/h 南京 杭州 衢州 平均 24 Ⅰ 79.5 67.5 79.5 75.5 Ⅱ 74.4 67.5 71.8 71.2 36 Ⅰ 77.5 87.5 86.0 83.7 Ⅱ 72.5 77.5 79.1 76.4 48 Ⅰ 76.9 65.0 74.4 72.1 Ⅱ 74.3 65.0 76.9 72.1 60 Ⅰ 70.0 72.5 83.7 75.4 Ⅱ 62.5 77.5 76.7 72.2 72 Ⅰ 87.2 72.5 74.4 78.0 Ⅱ 82.1 62.5 66.7 70.4 表 5 模型各预报时次的平均绝对误差
单位:km。 预报时效/h 南京 杭州 衢州 平均 24 Ⅰ 2.72 2.70 3.03 2.82 Ⅱ 2.79 2.83 3.29 2.97 36 Ⅰ 2.41 2.01 1.79 2.07 Ⅱ 2.66 1.97 2.23 2.29 48 Ⅰ 2.65 2.86 3.05 2.85 Ⅱ 2.73 2.90 2.94 2.86 60 Ⅰ 3.02 2.29 2.05 2.45 Ⅱ 2.83 2.79 2.27 2.63 72 Ⅰ 3.16 2.90 3.01 3.02 Ⅱ 3.74 3.08 3.11 3.31 -
[1] 张利娜, 张朝林, 王必正, 等.北京高速公路大气能见度演变特征及其物理分析[J].大气科学, 2008, 32(6): 1 229-1 240. [2] 马雁军, 左洪超, 张云海, 等.辽宁中部城市群大气能见度变化趋势及影响因子分析[J].高原气象, 2005, 24(4): 623-628. [3] 吴兑, 邓雪娇, 毕雪岩, 等.细粒子污染形成灰霾天气导致广州地区能见度下降[J].热带气象学报, 2007, 23(1): 1-6. [4] 吴洪, 柳崇健, 邵洁, 等.北京地区大雾形成的分析和预报[J].应用气象学报, 2000, 11(1): 123-127. [5] 刘德, 李永华, 喻桥, 等.基于客观分析的重庆雾的BP神经元网络预报模型研究[J].气象科学, 2005, 25(3): 293-298. [6] 张德山, 魏建明, 陈廷良, 等.首都机场高速公路能见度预报方法[J].气象科技, 2002, 30(6): 358-361. [7] 冯汉中, 陈永义, 成永勤, 等.双流机场低能见度天气预报方法研[J].应用气象学报, 2006, 17(1): 94-99. [8] 吴兑, 邓雪娇, 游积平, 等.南岭山地高速公路雾区能见度预报系统[J].热带气象学报, 2006, 22(5): 417-422. [9] 唐延婧, 裴兴云.贵州交通站资料应用于山区高速公路低能见度研究[J].热带气象学报, 2015, 31(2): 280-288. [10] BURGES C J C. A tutorial on support vector machines for pattern recognition[J]. Knowledge Discovery and Data Mining, 1998, 2(2): 121-167. [11] 张学工.关于统计学习理论与支持向量机[J].自动化学报, 2000, 26(1): 32-42. [12] 丁世飞, 齐丙娟, 谭红艳.支持向量机理论与算法研究综述[J].电子科技大学学报, 2011, 40(1): 2-10. [13] 冯汉中, 陈永义.处理非线性分类和回归问题的一种新方法 (Ⅱ)——支持向量机方法在天气预报中的应用[J].应用气象学报, 2004, 15(3): 355-365. [14] 熊秋芬, 胡江林, 陈永义.天空云量预报及支持向量机和神经网络方法比较研究[J].热带气象学报, 2007, 23(3): 255-260. [15] 李才媛, 韦惠红, 邓红. SVM方法在武汉市大雾预警预报中的应用[J].暴雨灾害, 2008, 27(3): 264-267. [16] 何娜, 付宗钰, 赵玮, 等. SVM方法在北京地区夏季晴雨预报中的初步应用[J].暴雨灾害, 2013, 32(3): 284-288. [17] MANGASARIAN F G, PROXIMAL O L. Support vector machine classifiers[C]//Proceedings of the 7th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco: ACM, 2001: 77-82. [18] 杜喆, 胡廷锋, 刘三阳.用于回归的临近支持向量机[J].计算机科学, 2009, 36(1): 126-127. [19] 黄嘉佑.气象统计分析与预报方法[M].北京:气象出版社, 2004: 54-58. [20] 朱树先, 张仁杰.支持向量机核函数选择的研究[J].科学技术与工程, 2008, 8(16): 4 513-4 517. -