img img
高级检索
地球科学进展, 2018, 33(4): 404-415
doi: 10.11867/j.issn.1001-8166.2018.04.0404
偏最小二乘回归在水汽和地面气温多模式集成预报中的应用研究
Application of Partial Least Squares Regression in Multimodal Integrated Forecasting of Water Vapor and Surface Air Temperature
李江峰, 蔡晓军*,, 王文, 李倩文, 雷彦森
南京信息工程大学气象灾害教育部重点实验室/气候与环境变化国际合作联合实验室/气象灾害预报预警与评估协同创新中心,江苏 南京 210044
Li Jiangfeng, Cai Xiaojun*, Wang Wen, Li Qianwen, Lei Yansen
Key Laboratory of Meteorological Disaster, Ministry of Education, Nanjing University of Information Science and Technology/Joint Laboratory of International Cooperation on Climate and Environment Change/Center for Innovation and Coordination of Meteorological Disaster Prediction and Early Warning and Assessment, Nanjing 210044, China
 引用本文:
李江峰, 蔡晓军, 王文, 李倩文, 雷彦森. 偏最小二乘回归在水汽和地面气温多模式集成预报中的应用研究[J]. 地球科学进展, 2018, 33(4): 404-415, doi:10.11867/j.issn.1001-8166.2018.04.0404
Li Jiangfeng, Cai Xiaojun, Wang Wen, Li Qianwen, Lei Yansen. Application of Partial Least Squares Regression in Multimodal Integrated Forecasting of Water Vapor and Surface Air Temperature[J]. Advances in Earth Science, 2018, 33(4): 404-415, doi:10.11867/j.issn.1001-8166.2018.04.0404

摘要:

使用一种新的多模式集成方法偏最小二乘回归(PLS),利用其能完全消除多重共线性的特征来改善比湿和地面气温多模式集成预报的效果。基于TIGGE资料集下的欧洲中期天气预报中心(ECMWF)、中国气象局(CMA)、日本气象厅(JMA)和英国气象局(UKMO)4个中心集合预报结果,建立2012年多模式(25°60°N,60°150°E)区域24168 h预报时效(间隔24 h)比湿和地面气温的多模式集成模型,分别使用消除偏差集合平均(BREM)、简单集合平均(EMN)、超级集合预报(SUP)以及偏最小二乘回归(PLS)4种方法对地面气温和水汽多模式集成,利用均方根误差(RMSE)和距平相关系数(cor)来判定多模式集成的效果并且针对性地预报了一次短期寒潮过程。2次预报结果均表明:偏最小二乘回归(PLS)方法的多模式集成效果最好,不但优于4种单一模式而且表现出比其他3种方法更好的预报性能,具有一定的价值以及应用前景。

关键词: 偏最小二乘回归(PLS) ; 多模式集成预报 ; 地面气温 ; 比湿

Abstract:

The use of a new multi model integration method of Partial Least Squares regression (PLS) can completely eliminate the multicollinearity features to improve multi model’s integrated forecasting results of the humidity and temperature. Based on the four centers’ ensemble forecast results, namely, the European Center for Medium-Range Weather Forecasts (ECMWF), Chinese Meteorological Administration (CMA), the Japan Meteorological Agency (JMA) and the UK Met Office (UKMO), we built a 2012 multi mode (25°~60°N, 60°~150°E) 24 ~168 hours forecast time (interval 24 hours) multi model for humidity and temperature and used the four methods, like ensemble average (BREM) for eliminating the deviation, a simple set of average (EMN), Super Ensemble (SUP) and Partial Least Squares regression (PLS) for ground temperature multi model integration. We used the Root-Mean-Square Error (RMSE) and anomaly correlation coefficient (cor) to determine the effect of more modes of integration and to predict a short course of cold. The two prediction results showed that the Partial Least Squares regression (PLS) was the best multi model integrated method, more superior than the other three single modes and compared with the other three methods, it showed better prediction performance, which has certain value and application prospect.

Key words: Partial Least Squares regression (PLS) ; Multi model ensemble forecast ; Surface air temperature ; Humidity.
1 引 言

数值天气预报经过了上百年的发展,逐步从单一的数值模式预报转化为综合分析实时观测、全球多家数值预报模式和卫星、雷达、气象自动站等多种资料的基础上得出的最终结论,而全球多家数值天气模式要素预报各有千秋,各种模式的天气数据信息值得参考,如何取舍值得探讨。

大气是一个高度非线性的系统,因此初始条件的微小误差十分敏感地影响数值预报的结果[1],同时由于观测的误差和资料同化、资料分析中带来的误差,所得到的数值天气预报的初始场总是有不可避免的不确定性[2]。Epstein[3]为解决此问题提出了动力随机预报,Leith[4]从大气运动的随机性角度提出了集合预报,用一个随机扰动产生初始场进行集合预报。

早在20世纪70年代,Thompson[5]就发现了将2个相互独立的预测结果进行统计后处理,其预测的均方根误差可以明显小于单个预测结果的预报误差。Krishnamurti等[6]因此提出了超级集合预报方法,即将多个模式的预报结果通过适当的线性组合在一起,形成最终的预报结果,来降低系统误差对预报结果的影响。20世纪初,杨学胜[7]提出多模式集合预报是一种能够提高模式预测水平的统计后处理方法,从此,多模式集成预报广泛被应用。2003年,Vijaya Kumar等[8]使用超级集合预报方法对飓风的强度和路径进行超级集合预报检验,发现超级集合预报在对飓风的强度和路径效果优于单个模式和多模式集合平均。2005年,Ross等[9]应用超级集合预报分析6个模式中的全球逐日资料,分别对500 hPa高度场、平均海平面气压、200 hPa风场以及850 hPa风场进行多模式集成,效果良好。2009年,Krishnamurti等[10]基于5个中心研究多模式集成降水预测,将预报时效从13天延伸到10天进行讨论,发现延伸的410天多模式集成预报效果仍然优于单一模式预报效果。包红军[11]对多模式动态权重集成定量降水预报产品进行ts评分,成功地预报了第一个暴雨过程,但第二个效果较差,因此需要改进权重或选取更加有效的集成方法。陈超辉等[12]进行的江淮汛期多模式短期集合预报研究表明多模式集合总体效果比任一单一模式的集合预报效果好,并且指出不同的模式对降水集合预报的响应不同,当降水临界值比较低时,单一模式对多模式集合效果影响较小,但当降水临界值较大时,影响较大。张亚洲等[13]提出不同降水临界值对集合预报影响不同,临界值较小时集合预报效果好,但临界值较大时,效果较差。唐圣钧等[14]提出了ARPS-WRF多模式集合相比传统集合预报明显提高了中雨、大雨、暴雨的准确度,对特大暴雨因概率覆盖范围较大导致空报较多而改进有限,但仍优于单一模式集合。魏凤英[15]发现在有限样本情况下,回归系数可以保证在最小方差意义下得到最优集成集合,因此,回归方法被广泛运用于多模式集成预报中。智协飞等[16]利用5个集合中心集合预报结果,讨论多模式集成预报方法,发现多模式集成预报效果明显优于单一中心的预报,且滑动平均方法较为优秀,但对于降水的多模式集成效果仍然欠缺。于水燕等[17]使用消除偏差集合平均和超级集合预报的方法,对中国东部水汽做了多模式集成预报研究,发现超级集合预报方法最优,消除偏差集合平均的方法与集合平均的方法效果差不多,但仍然优于任意单一模式。李倩等[18]使用BP人工神经网络的方法对温度进行多模式集成预报,使用 t213、欧洲中心以及t106 3种模式,发现多模式集成温度在我国华北东北地区预报效果最好,BP神经网络集成后明显优于任意一种模式。林春泽等[19]基于TIGGE资料,采用均方根误差评估欧洲中期天气预报中心(European Centre for Medium-Range Weather Forecasts,ECMWF)、日本气象厅(Japan Meteorological Agency,JMA)、美国国家环境预报中心(National Centers for Environmental Prediction,NCEP)和英国气象局(Met Office,UKMO)4个中心的集合预报资料温度场,比较超级集合预报(Multi-madel Superensemble,SUP)与单一模式、多模式简单集合平均(Ensemble Mean,EMN)、消除偏差集合平均(Bias-Removed Ensemble Mean,BREM)的预报效果,发现超级集合预报、多模式集合平均以及消除偏差集合平均都明显好于任意单个中心的预报。

多模式集成预报大量应用于各种气候要素预测,但对于某些要素仍不能取得较好的效果,智协飞等[16]发现对于24 h累计降水预报,超级集合预报效果不理想,甚至超过单一模式结果,但各种集成方法对于不同要素预报改进效果各有千秋,因此有待于选择。目前,偏最小二乘(Partial Least Squares regression,PLS)回归被大量应用于医学、化学和工业等其他产业,技术已经十分成熟,但利用偏最小二乘回归的方法来做多模式集成预报方面仍然处于摸索阶段,本文试图将偏最小二乘回归应用于多模式集成预报,对比湿和地面气温进行24168 h(间隔24 h)的多模式集成预报回报,与目前最常用的消除偏差集合平均(BREM)、简单集合平均(EMN)、超级集合预报(SUP)以及偏最小二乘回归(PLS)方法4种单一模式效果对比,以均方根误差(Root-Mean-Square Error,RMSE)以及距平相关系数(cor)来判定预报效果的优劣。

2 资料与方法
2.1 资料

(1)TIGGE(The International Grand Global Ensemble)资料:所用资料来自TIGGE资料集下的中国气象局(China Meteorological Administration,CMA)、JMA、UKMO和ECMWF 4个中心全球集合预报模式逐日12时(世界时)起报的2 m温度和850 hPa比湿资料,资料分辨率为1°×1°经纬网格,预报时效为24168 h(间隔24 h),预报区域为25°60°N,60°150°E。其中温度资料时间为与“观测值”相对应的预测时间。

(2)FNL(Final Operational Global Analysis)资料:选取2012年1月8日至2月29日和2012年12月131日逐日12时(世界时)2 m温度资料,区域为25°60°N,60°150°E,分辨率为1°×1°的经纬网格,作为“观测值”来检验预报效果。

(3)Era-interim资料:选取2011年6月8日至8月31日(85天)、2012年6月1日至8月31日(92天)逐日12时(世界时)850 hPa比湿资料,区域为25°60°N,60°150°E,分辨率为1°×1°的经纬网格,作为“观测值”来检验预报效果。

2.2 方法

采用PLS,BREM,EMN,SUP 4种方法进行多模式集成预报回报。

2.2.1 多模式集合平均(EMN)

计算公式为:

Vemn = 1 n i = 1 n F i , (1)

式中:Fi表示第i个模式的预报值,n表示参加多模式集成预报的模式总数。

2.2.2 消除偏差集合平均(BREM)

计算公式为:

S t = O ̅ + 1 N i = 1 N ( F i - F i ¯ ) , (2)

式中:St为消除偏差集成预报值, O ̅ 为观测值在训练期的平均,Fi为第i个模式预报值, F i ¯ 为第i个模式在训练集的预报值平均,N为参与集成的模式总数。在消除偏差集合平均模型中,子模式取相同权重系数(1/N)。

2.2.3 超级集合预报(SUP)

超级集合预报在一个给定的格点上,对于某一气象要素有:

S t = O ̅ + i = 1 N a i ( F i , t - F i ¯ ) , (3)

a i = E i / i = 1 N E i , (4)

式中: S t 为超级集成预报值 , O 为观测值 , O ̅ 为训练集观测值的平均 , F i , t 为第 i 个模式 t 时刻的预报值 , F i ¯ 为第 i 个模式在训练集的预报值平均 , t 为时间 , N 为参与超级集成的模式总数 , a i 为权重 ( i = 1 N a i = 1 ) , E i 代表各模式误差的倒数。流程如图1所示。

2.2.4 偏最小二乘回归(PLS)

首先,该方法在变量系统中提取若干对系统具有最佳解释能力的新综合变量,称为PLSR成分,然后利用这些成分进行回归建模。PLSR建模算法如下:

数据标准化(Z-score 标准化)

主成分引入:提取出自变量组和因变量组的成分t1,u1,能很好地代表x,y中的变异信息,并且t1对u1有很大的解释能力,t1和u1相关系数达到最大值。


图1

多模式集成预报流程示意图

Fig.1

Schematic diagram of multi-mode integrated forecasting process

主成分回归:建立PLS方程式并分析PRESS(预测误差平方和)/SS(误差平方和)看是否需要继续提取成分。

逆标准化:将标准化的回归方程式中的函数用原函数取代,将回归方程式转化为对原函数的回归方程式。

交叉检验:舍一交叉检验法,每次都舍去其中一个样本,使用其他所有的样本来检验舍去的样本,充分利用了每一个样本数据。

PLS集多元线性回归分析、典型相关分析和主成分分析的基本功能为一体,将建模类型的预测分析方法与非模型式的数据内涵分析方法有机地结合起来。PLS的基本思想是,首先,分别在自变量E0与因变量F0中提取第一主成分t1u1;然后,建立因变量F0t1的回归。如果回归已经达到满意的程度,则算法中止;否则,将利用E0被解释后的残余信息进行第二主成分的提取,直到能达到一个满意的精度为止。若最后对自变量提取了r个主成分T1,T2, …,Tr,PLS将通过建立F0T1,T2,…,Tr的回归,然后,再表达成F0对自变量的回归方程。

PLS是采用信息综合与筛选技术的新型多元回归建模方法,它能克服变量多重相关性在系统建模中的不良作用。在利用多个自变量X=(X1,X2,…,Xp)进行回归建模时,PLS将自变量系统中的信息重新组合,有效地提取对因变量Y解释性最强,又最能概括自变量系统X中信息的综合变量(即主成分)t0, t1, …, ti (ip)剔除多重相关信息和无解释意义信息的干扰,从而克服了自变量多重相关性在系统建模中的不良作用,得到一个更为可靠的分析结果。

3 2012年冬季地面气温的多模式集成预报回报
3.1 2012年12月地面气温的多模式集成预报回报

采用ECMWF,CMA,JMA和UKMO这4个中心地面2 m温度资料,预报时效为24168 h(间隔24 h),训练期为2012年1月8日至2月29日(53天),预报期为2012年12月131日(31天),将FNL资料与相应时间4种模式建模,进行多模式集成预报回报。

图2可以看出,PLS多模式集成预报地面气温方面效果显著。无论是24168 h中的哪一张图,PLS都占据了绝对的优势地位。其次效果最好的是SUP以及BREM,2条曲线效果差异不明显,但是绝大多数日期以及预报时效来说,SUP要略好于BREM,与4种单一模式对比的话,除EMN以外的3种多模式明显优于任意一种单一模式。EMN与单一模式效果最好的EC效果各有千秋,从图2a,b来看,EMN略差于效果最好的EC但明显优于其他3种单一模式,其余时次来说EMN略强于EC。4种单一模式对比平均均方根误差,EC<UKMO<CMA<JMA,可以看出JMA的预报效果十分不好,与其他模式相比误差最大。效果最好的是图2中的橙色线也就是PLS方法,可以说相比于其他7种有绝对的优势,极大地改善了预报效果。同样,通过图3的距平相关系数图可以看出橙色的PLS方法在每一个预报时效的距平相关系数都是最大的,其次是SUP,这与均方根误差得到的结果相同,同样说明了PLS的优越性。

3.2 寒潮个例的多模式集成预报回报

本文以2012年12月2729日影响我国大部分区域的寒潮为例,分析多模式集成预报回报的效果。采用ECMWF,CMA,JMA和UKMO这4个中心地面2 m温度资料,预报时效为24168 h(间隔24 h),训练期为2012年1月8日至2月29日(53天),预报期为2012年12月2729日,进行多模式集成预报回报。

对于这次短期的寒潮过程,由图4可以看出对于均方根误差来说,PLS占据绝对优势,24168 h平均均方根误差仅有3.050,相比第二、第三的超级集合预报SUP(RMSE=3.568)以及BREM(RMSE=3.745)都有相当大的提升,4种方法中效果最差的是简单集合平均EMN(RMSE=3.919),从均方根误差可以说明对于气温的骤降来说4种多模式集成方法优劣比较PLS>SUP>BREM>EMN。对于4种单一模式来说,均方根误差来看UKMO(RMSE=4.105)<EC(RMSE=4.406)<CMA(RMSE=4.783)<JMA(RMSE=5.418),效果最好的是UKMO,JMA效果仍然最差。

对于4种单一模式来说,对于均方根误差的地理分布来看,4种单一模式误差都比较均匀,误差较大值基本分布在我国西部交界一带以及内蒙古西北部、俄罗斯南部,以及我国东北北部、蒙古西部和缅甸北部,有914 ℃的均方根误差。4种单一模式中效果最好的是UKMO,其次是EC,CMA和JMA。从图4中可以看出EC在贝加尔湖一带出现了一小片大于12 ℃的均方根误差,通过4种多模式集成处理后,除了集合平均EMN为910以外,其他3种都有效降低了贝加尔湖一带的均方根误差,消除偏差集合平均BREM降低到了17,PLS降低到了15,超级集合预报SUP也降低到了9以下。4种模式中JMA误差明显最大,在我国东北大部分区域、缅甸、俄罗斯东南部、蒙古西部以及我国新疆西北部都有超过9的均方根误差。总的来说,EMN对4种单一模式的集成效果令人不太满意,与效果最好的UKMO相比差不多;BREM有效降低了我国整个西部的均方根误差,但对于我国东北地区以及俄罗斯南部、蒙古北部效果不佳;SUP有效降低了我国整个西部的均方根误差,对于西北部尤为明显,但在东部地区以及日本一带出现了均方根误差大于12的小区域,在这些区域比任一单一模式都要差。效果最好的PLS将全部区域都均方根误差最大值都降低到了9以下,可以说极大地改善了其他3种方法效果不佳的个别区域,平均均方根误差也是很令人满意,仅有3.050,有效降低了几乎全部区域的均方根误差,效果明显优于其他3种方法,而且具有一定的稳定度,具有一定的价值和应用前景。


图2

2012年12月131日每日24 h(a),48 h(b),72 h(c),96 h(d),120 h(e),144 h(f),168 h(g)地面气温预报在25°60°N,60°150°E区域的平均均方根误差

Fig.2

December 1,2012 to December 31,2012 daily 24 h(a),48 h(b),72 h(c),96 h(d),120 h(e),144 h(f),168 h(g) surface air temperature in 25°60°N,60°150°E area average Root-Mean-Square Error

4 2011—2012年夏季水汽的多模式集成回报

中国是一个多暴雨的国家,尤其在每年夏季暴雨多发,由于暴雨造成的洪涝灾害时有发生,在同样时间华北地区的干旱十分严重,对人类的生活和生产带来了严重影响,而水汽是形成降水的必要条件之一,暴雨的必要条件就是有充分的水汽供应,必须要有水汽的明显集中来提供源源不断的水汽供应,才有可能产生持续性大暴雨。由上可见,水汽历来都是暴雨预报与分析中关注的焦点。


图3

2012年12月131日8种模式气温分别与FNL资料气温的日平均距平相关系数

Fig.3

Daily average Anomaly correlation coefficient between FNL air temperature and eight modes air temperature from December 1, 2012 to December 31, 2012

目前,单一模式水汽的预报误差相对较大,多模式集成预报研究水汽方面的集成也不多,因此本文使用PLS多模式集成方法对4种单一模式进行集成,以期提高模式对水汽的预报准确性,来更好地预报暴雨。

资料选取日本气象厅(JMA)、中国气象局(CMA)、英国气象局(UKMO)以及欧洲中心(ECMWF)3种模式比湿资料建模,以欧洲中心era-interim再分析资料作为“观测值”,观测资料时间长度为2011年6月8日至8月31日以及2012年6月1日至8月31日的逐日12时(世界时)起报,分辨率为1°×1°的经纬网格,预报时效为2472 h的850 hPa比湿集合平均资料,预报区域为25°60°N,60°150°E。选取2011年6月8日至8月31日的850 hPa比湿资料进行建模,2012年6月1日至8月31日的资料作为预测。


图4

2012年12月2729日寒潮过程地面气温“实况场”与CMA(a),EC(b),UKMO(c),JMA(d),PLS(e),SUP(f),BREM(g),EMN(h)24168 h平均均方根误差的地理分布(单位:℃)
右上角RMSE表示平均均方根误差

Fig.4

December 27, 2012 to December 29, 2012 cold-air outbreak surface air temperature “real ” and CMA(a), EC(b),UKMO(c),JMA(d),PLS(e),SUP(f),BREM(g),EMN(h)24168 h average Root-Mean-Square Error geographical distribution(unit:℃)
In the upper right corner RMSE express the average Root-Mean-Square Error

4.1 多模式集成的时间序列效果分析

图5给出了4种单一模式以及4种多模式集成在25°60°N,60°150°E区域,2012年6月1日至8月31日的850 hPa比湿平均均方根误差。总的来说,相比于温度的多模式集成,SUP与BREM相差更小,几乎是重合了,这可能是由于比湿本身各种单一模式的误差不稳定,造成各种模式误差的倒数相差不大。从图5a和图5b可以看出4种多模式集成模式除了极个别天数以外都明显优于单一模式,其中SUP和RREM效果差不多,但明显优于EMN,效果最好的是PLS。对于图5c来说,多模式集成效果仍然明显好于任意单一模式,4种多模式集成除了EMN效果较差以外,其他3种相差不大,但PLS还是在大多数天数明显优于BREM以及SUP。从图5d和图5e可以看出,多模式集成效果仍然优于任意单一模式,4种多模式集成中,EMN效果略差,其余3种效果不相上下,在某些天数PLS要略优于BREM以及SUP,但总体来说相差不大,BREM以及SUP的稳定性要略强于PLS。从图5f和图5g可以看出4种多模式集成仍然优于单一模式,EMN提升较大,在很多天数与BREM和SUP相差很小,但稳定性不高,总的来说略差于BREM和SUP,PLS表现不错,大多数天数优于其他3种多模式集成。总体来看,图5ad也就是24,48,72和96 h预测中,4种单一模式来看,EC和UKMO是明显优于CMA和JMA的,但到了120 h以后,尤其是144 h以及168 h,4种模式在不同日期效果各有优劣,可以看出比湿的预报单一模式预报性能都很不稳定。相比较来看,多模式集成的稳定性优势就很大,而且在数值方面占据了绝对的优势,本文使用的PLS多模式集成方法,在大多数预报时效均方根误差都是最小的,且稳定性不错,总的来说还是优于其他方法以及单一模式。


图5

2012年6月1日至8月31日每日24 h(a),48 h(b),72 h(c),96 h(d),120 h(e),144 h(f),168 h(g)850 hPa比湿预报的25°60°N,60°150°E区域的平均均方根误差

Fig.5

June 1, 2012 to August 31, 2012 daily 24 h(a),48 h(b),72 h(c),96 h(d),120 h(e),144 h(f),168 h(g) specific humidity in 25°60°N,60°150°E area average Root-Mean-Square Error

4.2 比湿多模式集成的地理分布分析

图6给出了4种单一模式以及4种多模式集成在25°60°N,60°150°E区域,2012年6月1日至8月31日的850 hPa比湿平均均方根误差。对于图5,首先从左上角的均方根误差来看,4种单一模式中均方根误差最小的是EC(RMSE=1.721),其次是UKMO(RMSE=1.827)和JMA(RMSE=1.914),最大的是CMA(RMSE=1.950)。从数字来看,4种模式差距不太大,对于比湿来说,各种模式预报表现出了明显的误差。但相比于4种多模式集成预报来看,4种多模式集成效果都比较明显,效果最好的PLS的均方根误差只有1.299,其次是SUP的1.364以及BREM的1.379,即使是效果最差的EMN也只有1.479,比单一模式有很大的提高。从地理分布来看,从图6a可以看出,CMA的预报误差集中在我国西藏地区、印度北部和巴基斯坦北部,以及阿富汗东北边的一小块区域,在我国东海沿海以及日本也有超过2.4 g/kg比湿的区域,其他地方基本误差在12.2 g/kg。从图6b可以看出,EC误差集中地区和CMA相差不多,误差集中在西藏南部的很小一块区域以及新疆西南部一小块,以及巴基斯坦南部、阿富汗北边的一小块区域。相比于CMA在中国东部沿海区域误差小了很多,基本不超过2.8 g/kg,大部分误差在1.41.8 g/kg。从图6c可以看出JMA在我国新疆和西藏地区表现较好,但在蒙古西部有一大块区域误差大于3.8 g/kg,同样误差大的区域还有巴基斯坦北部以及阿富汗东北边一小块区域,但在我国东部沿海一带以及华北区域误差较大。从图6d可以看出UKMO相比于EC,误差极大区差不多,只是在新疆西部有一小块极大值,华北和东海沿岸误差略大一些。从图6来看,4种单一模式各有各的优势,在不同的区域各有千秋。因此多模式集成也是有必要的,下面来分析一下多模式集成的效果。图6e可以看出,EMN降低了绝大部分区域的均方根误差,也减少了极大值区域,大于3.4 g/kg的区域减少到了2个,我国华北以及东海沿海一带尤为明显。图6f和图6g相差不大,SUP只是在不同区域有一些细微的改善,总体来说影响不大。效果最好的是图6h,也就是PLS,将误差极大值控制在2.4以下,单模式中几个误差最大值区域都得到很好的衰减,相比于BREM和SUP在华北和东部区域也得到很明显的提升。


图6

2012年6月1日至8月31日850 hPa比湿“实况场”分别与CMA(a),EC(b),JMA(c),UKMO(d), EMN(e),BREM(f),SUP(g),PLS(h)24168 h平均均方根误差的地理分布(单位:g/kg)
左上角RMSE表示平均均方根误差

Fig.6

June 1, 2012 to August 31, 2012 specific humidity “real” and CMA(a),EC(b),JMA(c),UKMO(d),EMN(e), BREM(f),SUP(g),PLS(h) 24168 h average Root-Mean-Square Error geographical distribution(unit:g/kg)
In the upper right corner RMSE express the average Root-Mean-Square Error

5 结论与讨论

本文分别对2012年冬季地面气温以及夏季水汽进行多模式集成预报,运用4种单一模式CMA,JMA,ECMWF和UKMO在区域25°60°N,60°150°E的850 hPa比湿和2 m温度资料进行集成,使用EMN,BREM,SUP以及PLS做多模式预报回报,得到以下几点:

(1)对于地面气温预报,各种多模式集成方法都有效降低了单一模式的均方根误差,效果最差的EMN虽然与效果最好的单一模式各有千秋,但在平稳性上却好了不少,PLS在24168 h的每一个时次的均方根误差几乎都是最小的,可以说明显优于其他3种多模式集成方法。

(2)在短期寒潮过程的地面气温多模式集成回报中,PLS仍然保持最小的均方根误差,从均方根误差的分布来说,多模式集成方法都有效改善了单一模式的一些极大值区域,比如EC和JMA的贝加尔湖区域,在4种集成方法集成以后效果很好。效果最好的PLS把所有区域的极大值都降到了9以下,并且把一些小的极大值区域直接消除,可以说对于误差较大的区域有相当好的改善。

(3)在850 hPa比湿的多模式集成回报中,在稳定性上多模式集成相比于单一模式,有很大的优势。效果最好的仍然是PLS,除了96 h和120 h预报中,效果与消除偏差集合平均和超级集合预报不相上下,其他时次的平均均方根误差都是最小的,在稳定性上也略优于其他3种多模式集成方法。在比湿的均方根误差地理分布来看,4种单一模式在不同区域各有优劣,但多模式集成方法都有效改善了一些误差极大值区域,效果最好的是PLS,将误差极大值控制在了2.4以下,单模式中几个误差最大值区域都得到了很好的衰减,相比于BREM和SUP在华北和东部区域也得到了很明显的提升。

(4)PLS本质上也是一种超级集合预报,它的优势在于各个因子之间完全消除了多重共线性,能使每一组数据都相互独立不相互干扰,而其他所有方法包括BREM、滑动平均等都不可能避免多重共线性,各个因子之间的多重共线性很容易使模型不稳定,造成误差较大。

The authors have declared that no competing interests exist.

参考文献

[1]
Lorenz E N.A study of the predictability of a 28-variable atmospheric model[J]. Tellus, 1965, 17:321-333.
DOI:10.1111/j.2153-3490.1965.tb01424.x URL
A 28-variable model of the atmosphere is constructed by expanding the equations of a two-level geostrophic model in truncated double-Fourier series. The model includes the nonlinear interactions among disturbances of three different wave lengths. Nonperiodic time-dependent solutions are determined by numerical integration. By comparing separate solutions with slightly different initial conditions, the growth rate of small initial errors is studied. The time required for errors comparable to observational errors in the atmosphere to grow to intolerable errors is strongly dependent upon the current circulation pattern, and varies from a few days to a few weeks. Some statistical predictability of certain quantities seems to be present even after errors in the complete circulation pattern are no longer small. The feasibility of performing similar studies with much larger atmospheric models is considered. DOI: 10.1111/j.2153-3490.1965.tb01424.x
[本文引用: 1]
[2]
[杜钧. 集合预报的现状和前景[J].应用气象学报,2002,13(1):16-28.]
Du Jun.The status and prospect of ensemble forecast[J]. Journal of Applied Meteorology,2002,13(1):16-28.
[本文引用: 1]
[3]
Epstein E S.Stochastic dynamic prediction[J]. Tellus,1969,21:739-759.
[本文引用: 1]
[4]
Leith C E.Theoretical skill of Monte Carlo forecasts[J]. Monthly Weather Review,1974,102:409-418.
DOI:10.1175/1520-0493(1974)1022.0.CO;2 URL
Abstract The theoretical skill of Monte Carlo approximations to the stochastic dynamic forecasting technique proposed by Epstein is examined by means of an extension of earlier atmospheric predictability studies that used the test-field model of two-dimensional turbulence. The fundamental statistical hydrodynamical concept of an ensemble of phase paths evolving in a dynamical phase space is reviewed and used to define the statistical properties of a finite Monte Carlo sample. The application of a linear regression step to arrive at a final best estimate of the state of the atmosphere is also discussed. The resulting forecasts approach the climatological mean at forecast times so late that all skill has been lost. For an ideal case with an observing resolution, hopefully achievable in the 1980s with satellite-based sensors, it is found that the. Monte Carlo procedure leads to the greatest improvement in mean-square vector wind forecast skill in the 6- to 10-day range. For another case corresponding roughly...
[本文引用: 1]
[5]
Thompson P D.How to improve accuracy by combining independent forecasts[J]. Monthly Weather Review, 1977, 105(2): 228-229.
DOI:10.1175/1520-0493(1977)1052.0.CO;2 URL
It is shown that the ensemble mean-square error of forecasts constructed from a particular linear combination of independent and imperfectly correlated predictions is less than that of any of the individual predictions. The weights to be attached to each prediction are determined by the Gaussian method of least squares and depend on the covariances between independent predictions and between prediction and verification. At the present stage of development of numerical prediction methods, it appears possible to reduce the error variance by about 20%, simply by the optimum combination of two independent predictions.
[本文引用: 1]
[6]
Krishnamurti T N, Kishtawal C M, LaRow T E,et al. Improved weather and seasonal climate forecasts from multimodel SUPerensemble[J]. Science, 1999, 285(5 433): 1 548-1 550.
DOI:10.1126/science.285.5433.1548 PMID:10477515 URL
Abstract A method for improving weather and climate forecast skill has been developed. It is called a superensemble, and it arose from a study of the statistical properties of a low-order spectral model. Multiple regression was used to determine coefficients from multimodel forecasts and observations. The coefficients were then used in the superensemble technique. The superensemble was shown to outperform all model forecasts for multiseasonal, medium-range weather and hurricane forecasts. In addition, the superensemble was shown to have higher skill than forecasts based solely on ensemble averaging.
[本文引用: 1]
[7]
[杨学胜. 业务集合预报系统的现状及展望[J]. 气象, 2001, 27(6): 3-9.]
Yang Xuesheng.The present situation and prospect of service ensemble forecasting system[J].Meteorological Monthly,2001, 27(6): 3-9.
DOI:10.3969/j.issn.1000-0526.2001.06.001 URL
集合预报系统从原理上讲也可称之为概率预报系统,其最终目的是要提供所有大气变量的完全概率预报.近几年集合预报技术已从以前仅考虑初值的不确定性发展为也考虑模式的不确定性,进而发展了多模式-多分析集合预报技术等.阐述了目前业务集合预报的一些问题,如扰动初值的生成、多模式集合预报、集合预报产品的应用、检验评价等,介绍了近几年集合预报的新的进展及该技术的未来发展趋势.
[本文引用: 1]
[8]
Vijaya Kumar T S V, Krishnamurti T N, Fiorino M,et al. Multimodel superensemble forecasting of tropical cyclones in the Pacific[J]. Monthly Weather Review, 2003, 131(3): 574-583.
DOI:10.1175/1520-0493(2003)1312.0.CO;2 URL
Using currently available operational forecast datasets on the tracks and intensities of tropical cyclones over the Pacific Ocean for the years 1998, 1999, and 2000 a multimodel superensemble has been constructed following the earlier work of the authors on the Atlantic hurricanes. The models included here include forecasts from the European Centre for Medium-Range Weather Forecasts (ECMWF), the National Centers for Environmental Prediction/Environmental Modeling Center [NCEP/EMC, the Aviation (AVN) and Medium-Range Forecast (MRF) Models], the U.S. Navy [Naval Operational Global Atmospheric Prediction System, (NOGAPS)], the U.K. Met Office (UKMO), and the Japan Meteorological Agency (JMA). The superensemble methodology includes a collective bias estimation from a training phase in which a multiple-regression-based least squares minimization principle for the model forecasts with respect to the observed measures is employed. This is quite different from a simple bias correction, whereby a mean value is simply shifted. These bias estimates are described by separate weights at every 12 h during the forecasts for each of the member models. Superensemble forecasts for track and intensity are then constructed up to 144 h into the future using these weights. Some 100 past forecasts of tropical cyclone days are used to define the training phase for each basin. The findings presented herein show a marked improvement for the tracks and intensities of forecasts from the proposed multimodel superensemble as compared to the forecasts from member models and the ensemble mean. This note includes detailed statistics on the Pacific Ocean tropical cyclone forecasts for the years 1998, 1999, and 2000.
[本文引用: 1]
[9]
Ross R S, Krishnamurti T N.Reduction of forecast error for global numerical weather prediction by the Florida State University (FSU) superensemble[J].Meteorology and Atmospheric Physics, 2005, 88(3): 215-235.
DOI:10.1007/s00703-004-0077-8 URL
The skill of the FSU Superensemble technique as applied to global numerical weather prediction is evaluated extensively in this paper. The global mass and motion fields for year 2000 and precipitation over the domain 5565S to 5565N for year 2001, as predicted by the Superensemble, the ensemble member models, and the mean of the ensemble members, are evaluated by standard statistical measures of skill to determine the performance of the Superensemble in relation to the other models. The member models are global forecast models from 5 of the world’s operational forecast centers in addition to the FSU global spectral model. For precipitation 5 additional versions of the FSU global model are utilized in the ensemble, as defined by different initial conditions provided by various physical initialization algorithms. Statistical parameters calculated for the mass and motion fields include root mean square (RMS) error, systematic error (or bias), and anomaly correlation. These are applied to the mean sea level pressure, 50065hPa heights, and the wind fields at 85065hPa and 20065hPa. Statistical parameters that were calculated for precipitation include RMS error, correlation, equitable threat score (ETS), and a special definition of bias appropriate for the precipitation field. For the mass and motion fields the performance of the Superensemble was considered for the annual global case, as well as for each hemisphere (north and south) and for each of the four seasons. For precipitation only the annual case was considered over the domain cited above.For the mass and motion fields the RMS calculations showed the Superensemble to be superior (to have the smallest total forecast error) in all comparisons to the ensemble member models, and to be superior to the ensemble mean in the vast majority of comparisons. Performance in comparison to the other models was generally better in the Southern Hemisphere than in the Northern Hemisphere, and better in the transition seasons of fall and spring than in the extreme seasons of winter and summer. The Superensemble had the best success with mean sea level pressure, followed in order by 50065hPa geopotential heights, 85065hPa winds, and 20065hPa winds.In the calculations of 50065hPa geopotential height anomaly correlation the Superensemble had higher scores in all comparisons to the ensemble member models, as well as higher scores in the majority of comparisons to the ensemble mean. As with the RMS error results, the Superensemble performed better in the Southern Hemisphere than in the Northern Hemisphere, and better in fall than in summer, in comparison to the other models. The superior anomaly correlation scores of the Superensemble attest to the ability of the model to forecast daily perturbations from the climatological means, perturbations that are associated with transient synoptic scale features, given the horizontal resolution in the forecast models.In terms of systematic error reduction the Superensemble produces its most impressive results. Annual global mean sea-level pressure systematic errors for day 5 forecasts are generally in the range of ±165hPa (compared to errors as high as 865hPa in other models), and day 2 forecasts of 50065hPa geopotential height produced systematic errors generally in the range of ±10 meters (compared to errors as high as 60 meters in other models). The Superensemble was able to reduce systematic errors in forecasts of a variety of important features in the global mass and motion fields: surface equatorial trough, wave amplitude in geopotential heights at 50065hPa, trade winds and Somali Jet at 85065hPa, mid-latitude westerlies, subtropical jet, and Tropical Easterly Jet (TEJ) at 20065hPa.In terms of forecasting precipitation the Superensemble outperforms all ensemble member models and the ensemble mean in terms of RMS error, correlation coefficient, equitable threat score, and bias. The superior correlation scores indicate that the Superensemble is more reliable than the other models in predicting perturbations in the area distribution of precipitation, perturbations that are essentially associated with migrant synoptic scale disturbances, considering the horizontal resolution of the forecast models.The Superensemble is a valuable tool for significantly improving upon the global model forecasts of the world’s operational forecast centers. These forecasts are used daily as important guidance in making weather forecasts in all regions of the world. This paper will demonstrate that the Superensemble improves upon the ensemble member model forecasts: (1) in a statistical sense considering broad areas of the globe, (2) in a synoptic climatology sense through focus on the improved forecasts of climatological features seen in the global mass and motion fields, (3) in a synoptic sense through use of anomaly correlation and correlation coefficient where improvement is demonstrated in the forecasts of perturbations from mean fields which are essentially associated with transient synoptic scale disturbances.
[本文引用: 1]
[10]
Krishnamurti T N, Sagadevan A D, Chakraborty A,et al. Improving multimodel weather forecast of monsoon rain over China using FSU superensemble[J]. Advances in Atmospheric Sciences, 2009, 26(5): 813-839.
DOI:10.1007/s00376-009-8162-z URL
In this paper we present the current capabilities for numerical weather prediction of precipitation over China using a suite of ten multimodels and our superensemble based forecasts. Our suite of models includes the operational suite selected by NCARs TIGGE archives for the THORPEX Program. These are: ECMWF, UKMO, JMA, NCEP, CMA, CMC, BOM, MF, KMA and the CPTEC models. The superensemble strategy includes a training and a forecasts phase, for these the periods chosen for this study include the months February through September for the years 2007 and 2008. This paper addresses precipitation forecasts for the medium range i.e. Days 1 to 3 and extending out to Day 10 of forecasts using this suite of global models. For training and forecasts validations we have made use of an advanced TRMM satellite based rainfall product. We make use of standard metrics for forecast validations that include the RMS errors, spatial correlations and the equitable threat scores. The results of skill forecasts of precipitation clearly demonstrate that it is possible to obtain higher skills for precipitation forecasts for Days 1 through 3 of forecasts from the use of the multimodel superensemble as compared to the best model of this suite. Between Days 4 to 10 it is possible to have very high skills from the multimodel superensemble for the RMS error of precipitation. Those skills are shown for a global belt and especially over China. Phenomenologically this product was also found very useful for precipitation forecasts for the Onset of the South China Sea monsoon, the life cycle of the mei-yu rains and post typhoon landfall heavy rains and flood events. The higher skills of the multimodel superensemble make it a very useful product for such real time events.
[本文引用: 1]
[11]
[包红军. 多模式集成定量预报降水在一次暴雨洪水预报中的检验与应用[C]∥S12水文气象、地质灾害气象预报与服务.中国气象学会,2012.]
Bao Hongjun.Inspection and application of multi-model integrated quantitative precipitation forecast in a storm flood forecast[C]∥S12 Meteorological, Geo-hazard Meteorological Forecasting and Services. Chinese Meteorological Society, 2012.
[本文引用: 1]
[12]
[陈超辉, 王铁, 谭言科, . 2003 年江淮汛期多模式短期集合预报方法研究[J]. 热带气象学报, 2009, 25(4): 449-457.]
Chen Chaohui, Wang Tie, Tan Yanke, et al. Study on multi-mode short-term ensemble forecasting method for Jianghuai flood season in 2003[J]. Journal of Tropical Meteorology, 2009, 25(4): 449-457.
DOI:10.3969/j.issn.1004-4965.2009.04.010 URL
利用AREM、MM5和WRF模式为试验模式,由对短期天气预报结果影响颇大的积云参数化方 案和边界层方案构成15个集合预报成员,开展有限区域多模式短期集合预报在我国汛期时段的应用与研究。分别研究了单个模式集合预报和多模式集合预报在 2003年汛期(7月)预报中的应用,预报对象主要包括降水、500hPa位势高度和700hPa相对湿度。试验结果表明:(1)由AREM、MM5和 WRF模式构成的多模式集合对以上要素的集合预报总体效果比其任一单个模式的集合预报效果好;(2)对于降水的集合预报,单个模式的集合平均结果对多模式 集合预报效果有影响。且对于不同的降水临界值影响不同;当降水临界值较小时,单模式集合平均结果对多模式集合效果影响较小;当降水临界值较大时,影响较 大,甚至可以影响多模式集合的集合平均预报成败;(3)对于降水、500hPa位势高度和700hPa相对湿度,其单个模式以及多模式的48h集合预报对 确定性预报的改善度都比24h的显著。(4)对于形势预报和相对湿度预报,多模式集合预报效果明显比同期死。,模式的预报水平高。
[本文引用: 1]
[13]
[张亚洲, 李盛林, 邓文彬, . 基于多模式短期集合预报技术的热带气旋降水预报试验[J]. 气象与减灾研究, 2011, 34(2): 26-33.]
Zhang Yazhou, Li Shenglin, Deng Wenbin, et al. Experiment of tropical cyclone precipitation forecast based on multi-mode short-term ensemble forecasting[J]. Meteorology and Disaster Reduction Research,2011, 34(2): 26-33.
DOI:10.3969/j.issn.1007-9033.2011.02.005 URL
利用中尺度AREM和WRF模式为试验模式,由对降水预报结果影响颇大的积云和边界层参数化方案构成的10个集合预报成员,开展有限区域多模式短期集合预报在热带气旋降水预报中的应用与研究。分别研究了单个模式集合预报和多模式集合预报在热带气旋"天鹅"(0907)降水预报中的应用。试验结果表明:(1)WRF模式集合预报效果整体上要优于AREM模式,由AREM和WRF模式构成的多模式集合预报优于单个模式集合预报。(2)不同降水临界值对集合预报影响不同,当临界值较小时,集合预报效果较好,当临界值较大时,集合预报效果较差。(3)热带气旋强度的突然增强,会导致集合预报效果变差。(4)热带气旋登陆前降水集合预报最差,但不同降水临界值对应出现的时间不同,当降水临界值较大时,出现的时间靠近登陆时间,当降水临界值较小时,出现的时间则提前。
[本文引用: 1]
[14]
[唐圣钧, 王东海, 杜钧, . 混合集合预报法在华南暴雨短期预报中的试验[J]. 应用气象学报, 2015, 26(6): 669-679.]
Tang Shengjun, Wang Donghai, Du Jun, et al. Experiment of mixed ensemble forecasting method for short term Rainstorm Forecast in Southern China[J]. Journal of Applied Meteorological Science,2015, 26(6): 669-679.
DOI:10.11898/1001-7313.20150603 URL
基于ARPS和WRF模式的多初值、多物理方案的集合预报系统,检验由高、低空间分辨率模式集成的结果.针对2013年5月8日华南地区强降水过程,设计ARPS模式集合、WRF模式集合和ARPS-WRF 多模式集合3组试验,对比分析混合集合预报法与传统方法的降水预报效果.结果表明ARPS模式集合改善了广东省南部局地强降水预报,该方法在中雨、大雨、暴雨量级改进效果显著.WRF 模式集合对广东省北部强降水预报优于ARPS模式集合,但空报、报率较大,该方法有一定局限性.ARPS-WRF 多模式集合在降水落区和量级预报上均优于传统方法.混合集合预报法利用低分辨率(36km)集合预报和高分辨率(12km)控制预报实现了高分辨率(12km)集合预报,改善了降水预报效果,该方法可为业务高分辨率集合预报提供参考.
[本文引用: 1]
[15]
[魏凤英. 全国夏季降水区域动态权重集成预报试验[J]. 应用气象学报,1999,10(4):402-409.]
Wei Fengying.Integrated weighted prediction experiment of regional summer rainfall in China[J].Journal of Applied Meteorological Science, 1999,10(4):402-409.
DOI:10.3969/j.issn.1001-7313.1999.04.003 URL
根据全国大范围夏季降水趋势分布预报的特点,设计了一种区域动态权重集成预报方案.以多种预报方法对各区域历史预报技巧得分为依据,尤其注重各方法距起报时刻近期的预报技巧,赋予各区域动态归一化权重系数,在区域集成预报的基础上合成全国大范围降水分布预报.1990~1998 年9 年独立样本的试验预报表明,集成预报的预报技巧优于各预报方法预报技巧的平均水平.集成预报在一定程度上改善了预报技巧的不稳定现象.
[本文引用: 1]
[16]
[智协飞, 季晓东, 张璟, . 基于TIGGE 资料的地面气温和降水的多模式集成预报[J]. 大气科学学报, 2013, 36(3): 257-266.]
Zhi Xiefei, Ji Xiaodong, Zhang Jing, et al. Multimodal integrated forecasting of ground temperature and precipitation based on TIGGE data[J].Journal of Nanjing Institute of Meteorology, 2013, 36(3): 257-266.
[本文引用: 2]
[17]
[于水燕, 智协飞. 中国东部水汽的多模式集成预报研究[C]∥第31届中国气象学会年会 S2 灾害天气监测, 分析与预报.北京, 2014.]
Yu Shuiyan, Zhi Xiefei.Multimodal Integrated Forecasting of Water Vapor in Eastern China[C]∥The Thirty-first Session of the Annual Meeting. Beijing, 2014.
[本文引用: 1]
[18]
[李倩, 胡邦辉, 王学忠, . 基于BP 人工神经网络的区域温度多模式集成预报试验[J]. 干旱气象, 2011, 29(2): 231-235.]
Li Qian, Hu Banghui, Wang Xuezhong, et al. Multi model integrated prediction experiment of regional temperature based on BP artificial neural network[J].Arid Meteorology, 2011, 29(2): 231-235.
[本文引用: 1]
[19]
[林春泽, 智协飞, 韩艳, . 基于TIGGE 资料的地面气温多模式超级集合预报[J]. 应用气象学报, 2009, 20(6): 706-712.]
Lin Chunze, Zhi Xiefei, Han Yan, et al. Multi model super set forecast of surface temperature based on TIGGE data[J].Journal of Applied Meteorological Science, 2009, 20(6): 706-712.
DOI:10.3969/j.issn.1001-7313.2009.06.008 URL
基于TIGGE资料,采用均方根误差分别对欧洲中期天气预报中心、日本气象厅、美国国家环境预报中心和英国气象局4个中心集合预报的地面气温场集合平均结果进行检验评估,比较各中心地面气温的预报效果。并利用超级集合、多模式集合平均和消除偏差集合平均3种方法对4个中心的地面气温预报进行集成,同时对预报结果进行分析。结果表明:2007年夏季日本气象厅与欧洲中期天气预报中心在北半球大部分地区预报效果最好,各中心在不同地区预报效果不同。超级集合与消除偏差集合平均降低了预报误差,预报效果优于最好的单个中心预报和多模式集合平均。对于较长的预报时效,消除偏差集合平均表现出了更好的预报性能。
[本文引用: 1]
Resource
PDF downloaded times    
RichHTML read times    
Abstract viewed times    

Share
Export

External search by key words
偏最小二乘回归(PLS)     
多模式集成预报     
地面气温     
比湿     

Partial Least Squares regression (PLS)     
Multi model ensemble forecast     
Surface air temperature     
Humidity.     

External search by authors
李江峰     
蔡晓军     
王文     
李倩文     
雷彦森     

Li Jiangfeng    
Cai Xiaojun    
Wang Wen    
Li Qianwen    
Lei Yansen    

Related articles(if any):