中国气象局数值天气集合预报统一后处理系统的研发与应用
1.
2.
3.
4.
Research, Development, and Application of the Unified Post-Processing System for the CMA-GEPS/REPS Ensemble Prediction
1.
2.
3.
4.
收稿日期: 2022-09-17 修回日期: 2022-10-25
| 基金资助: |
|
Received: 2022-09-17 Revised: 2022-10-25
作者简介 About authors
高丽(1978-),女,内蒙古阿拉善人,研究员,主要从事大气动力学与集合预报研究.E-mail:gaol@cma.gov.cn
集合预报是数值天气预报中发展最快的方向之一,已成为当前预报预测业务准确率和产品丰富性的重要保障。过去30年间,伴随着国际上集合数值预报科学研究的快速发展,业务集合预报技术和系统取得了长足进步。作为集合预报链条中面向下游用户的信息输出端,后处理系统已经成为大规模数据生成和产品制作功能一体化、多层次预报分析方法和技术高度集约化的综合平台,在发挥集合预报优势方面扮演着关键角色。首先回顾了国内外集合预报后处理系统发展历程以及后处理技术发展趋势和走向,归纳并阐述了集合预报后处理系统的主要功能。进一步详细介绍了中国气象局全球/区域集合预报业务系统的集合预报统一后处理系统针对上述各方面主要功能的设计思路、结构框架、关键技术和常规产品等研发进展情况,并重点阐释了如何充分利用该集合预报业务系统实时大样本集合预报数据信息开发的极端预报指数、热带大气季节内振荡、西北太平洋副热带高压和南亚高压等多样化新产品及其在业务中的实际应用。总体来看,集合预报后处理将成为充分发挥集合预报准确度高、信息量大以及社会效益显著等优势的研发新方向。
关键词:
Ensemble prediction, one of the most rapid developments in numerical weather prediction, has presently become a vital basis for accurate forecasting and assessment of product abundance. In the past three decades, accompanied by the rapid developments in prediction research and techniques, a significant progress has been made in operational technology and systems for ensemble prediction. As the output end of the information facing downstream users in the ensemble prediction chain, the post-processing system has been an integrated platform for the generation of numerous ensemble data, the unification of product-making functions, and the intensification of multilevel forecasting approaches and techniques. In this study, a comprehensive local-to-global review was first conducted for the historical development, current stage, and future direction of the post-processing system and technology for ensemble prediction. Second, the following seven main functions of the post-processing system were summarized:
Keywords:
本文引用格式
高丽, 郑嘉雯, 招佐森, 罗月琳, 任鹏飞, 姚国华.
GAO Li, ZHENG Jiawen, ZHAO Zuosen, LUO Yuelin, REN Pengfei, YAO Guohua.
1 引 言
集合预报主要是针对大气运动的不确定性和可预报性而提出的一种数值预报方法,已成为当前气象预报预测业务的准确率和产品丰富性的重要保障。集合预报的基本思想首先由Epstein[1]和Leith[2]提出,基于大量研究和试验后,美国国家环境预报中心(National Centers for Environmental Prediction,NCEP)和欧洲中期天气预报中心(European Centre for Medium-Range Weather Forecasts, ECMWF)于1992年12月陆续建立了各自的集合数值天气预报业务系统,这标志着集合预报已进入到实际业务应用阶段[3-10]。过去30年间,伴随着集合数值预报研究与技术的快速发展,业务集合预报技术和系统取得了长足进步[11-21]。随着计算机能力日益提升,集合预报系统的建设和业务应用已成为数值天气预报发展的主要方向[22-24]。
目前,在欧美数值天气预报业务产品体系中,集合预报产品已占据了相当大的比重,无论其预报准确率还是信息量,都扮演着不可替代的角色。一个完备的集合预报系统主要包含前处理的集合扰动成员生成、数值预报模式以及集合后处理3个部分[25-29]。其中,集合前处理主要包括同化资料的输入和扰动成员的生成等,而集合后处理则包括从模式数据输出开始到最后面向用户服务的全过程。前人研究工作大部分聚焦在数值预报模式发展和集合成员最优生成,而对于能够真正展现出集合预报效果和效益的后处理部分,相关文献和研究报告明显较少[30-35]。例如,人们耳熟能详的集合平均和集合离散度等预报信息的提取和表达,便是集合后处理部分所要解决的关键问题。国际上关于集合后处理方法和系统化技术的发展比较迅速[36-40]。作为集合预报面向用户的信息输出端,后处理系统是数据生成和产品制作功能一体化、多种预报分析方法和技术集约化的综合平台,在发挥集合预报优势方面扮演着关键角色[41-44]。
本文回顾了国内外关于集合预报后处理系统方面的发展历程以及集合后处理技术的发展趋势和走向,归纳出集合预报后处理系统所具有的主要功能,进一步介绍中国气象局全球/区域集合预报业务系统(China Meteorological Administration-Global Ensemble Prediction System/Regional Ensemble Prediction System,CMA-GEPS/REPS)的集合预报统一后处理系统和多样化新产品研发和相关科学研究以及实际应用情况。
2 国内外集合预报后处理业务发展现状
2.1 国际上集合预报后处理的发展
集合预报是国际上各大主要数值天气预报中心开展技术研发和业务应用的重要方面。在1990年代初期,ECMWF以集合平均的确定性预报和成员离散度的概率性预报为代表的集合产品制作等后处理技术逐步发展起来[45],这成为ECMWF中期环流预报准确率大幅提升和数值预报产品日益丰富多样化的重要推动力。在1992年以后,随着大样本最优集合预报系统的建立和发展,集合图形和数据产品的研发与制作以及后端应用进入快速发展轨道[41]。美国NCEP除了在集合后处理产品有着类似发展之外,还在集合预报偏差订正和信息提取方面独辟蹊径,在确保充分利用集合信息基础上还能提升预报准确率[46-48]。其他国家集合预报的发展大体遵循欧美的发展思路和技术体系[49]。因此,集合后处理逐渐成为一个集合预报系统中独立发展的重要组成部分,其技术体系也必然伴随着集合预报系统发展而逐渐变革,主要体现在集合产品的种类增加、产品形式多样化、集合预报偏差订正、集合概率信息提取以及数据处理技术升级等。
总体来看,集合后处理技术发展趋势大体上概括为:从确定性到概率性、从简单到复杂、从单一到多样化、从数据到图形以及偏差订正和用户导向型产品开发等。归纳起来,当前国际上集合预报后处理系统一般都具备较为全面的功能:
2.2 我国集合预报后处理的发展
2002年9月,基于增长模繁殖扰动技术的第二代全球中期数值集合预报系统(T213模式)正式业务化[5]。其后的两件事情极大地推动了我国集合后处理技术的快速发展:一是依托2008年北京奥运会气象保障科技攻关项目发展起来的全球和区域集合预报系统及拓展集合预报产品;二是2006年参与到由世界气象组织世界天气研究计划建立的交互式全球大集合预报系统(THORPEX Interactive Grand Global Ensemble, TIGGE)中,其提供的大量国际交换数据为开展集合产品开发打开了方便之门,大幅提升了我国集合后处理的技术水准和预报水平。这期间开发了箱线图和Talagrand图等丰富的集合概率预报产品,并开始了大气动力学诊断量的技术研发,实现了国际数据交换通用格式的压码和解码等集合预报数据后处理技术,与国际发展趋势接轨。
2014年底,中国气象局数值预报中心研发的第三代全球中期集合预报系统(T639模式)实现业务化,后处理技术和产品部分首次成为一个较为完整的子系统。随着模式时空分辨率大幅提升,集合概率预报产品主要向精细化和高频次方向发展,集合后处理系统初步实现了集成化和标准化。通过历次重大事件气象保障的技术攻关,专门为特殊用户和需求研制了多种新产品,使集合预报图形产品的数量和质量均得到质的提升。基于建立的全球和区域集合预报业务后处理系统,集合预报数据产品也得到了广泛应用。另一方面,为了减小模式误差的影响,发展了针对业务模式集合预报的偏差订正技术,提升了集合确定性与概率预报的准确率[55-56]。与国际前沿紧密衔接,基于大样本集合预报数据信息的极端预报指数(Extreme Forecast Index, EFI)、重要大气环流型指数等新型集合预报产品研发和检验工作也陆续得以开展[57-59]。
第四代集合预报系统是基于我国自主研发的GRAPES(Global/Regional Assimilation and Prediction System)模式建立的,其全球版本于2018年底实现业务化运行,标志着我国集合预报发展迈上新的台阶。此时,集合预报后处理的技术发展也真正进入到相对成熟阶段,基于一系列关键技术开发,后处理的集约化、模块化、并行化和高计算效率等技术层次得到显著提升,实现了统一、分时后处理系统架构,建立了GRAPES全球/区域集合预报统一后处理系统[60]。技术进步也推动了集合产品的研发和应用,不但丰富了预报员使用的集合预报工具箱,在重大社会活动和重要赛事等实际保障服务中也根据预报员需求,从集合产品的数量和质量上不断丰富和提升。2021年随着中国气象局地球系统数值预报中心组建成立,GRAPES集合预报系统更名为CMA-GEPS/REPS,在2022年北京冬奥会/冬残奥会服务保障中,新一代集合后处理系统和相关产品发挥了重要的支撑作用。
总体来看,我国集合预报后处理的发展起步较晚、技术水准和用户接受度仍有限,早期的集合预报产品的解释应用仅限于系统输出结果的图形展示,无数据类型产品[28],对于数据量巨大的集合数据缺乏有效的信息处理技术,集合业务服务支撑能力偏弱。从T639集合开始直到GRAPES集合后处理技术和系统快速发展,逐渐扭转了这一落后局面。集合产品已成为TIGGE国际示范项目的数据提供方之一。在常规图形和数据类型集合产品的基础上,台风、极端要素预报和重要天气环流型等复杂集合产品成为有力补充,辅之以集合预报订正与聚类分析等信息提取和预报改进技术,明显提升了集合预报产品性能和应用前景[59-62],使得集合预报后处理系统成为驱动其他专业环境预报模式、提取预报检验数据和后端产品可视化运控等包含多模块的完备技术体系。
3 CMA-GEPS/REPS的集合预报后处理系统介绍
广义的集合后处理可划分为模式后处理、产品制作和用户服务3个主要部分,其中模式后处理是指使用模式面上的原始输出经过垂直插值、诊断量的计算和数据格式转换,产生可以归档的基本标准格式后处理产品。产品制作部分则是利用计算语言编程和绘图软件编程产生基于用户需求的图形产品,利用数据格式转换技术产生各种水平分辨率各种要素组合的数据集等,以及为提高产品精度进行的系统偏差订正等产品改进工作。用户服务部分是用来支持用户方便浏览、下载和使用,并根据个性需求进行产品定制和产品再加工等的支持系统。
因此,一个完整的集合预报后处理系统需要包括集合预报数据生成、产品制作以及解释应用等部分。在设计后处理系统时,需要统一考虑3个方面的内容:
3.1 集合后处理系统的组织构架
在统一化的集合后处理框架中,CMA全球和区域集合预报后处理系统不存在本质性差异,其组织构架如图1所示。
图1
图1
CMA-GEPS/REPS后处理系统组织框架及产品制作流程图
Fig. 1
Flow chart of the CMA-GEPS/REPS postprocessing and product-making
从图1可知,该集合后处理系统主要包含以下7个部分:
(1) 集合统一后处理模块
主要用于产生各集合成员的GRIB2格式后处理元数据,包含谱格转化、垂直插值、物理诊断量计算和数据压码等一系列计算过程。该模块输入数据是各时效、各成员的二进制格式的模式输出变量,输出GRIB2格式的变量,包含单层和等压面层要素以及物理诊断量等。
(2) 数据类产品部分
包括GRIB2数据制作模块和MICAPS数据制作模块两部分,主要功能是利用集合成员预报数据制作技术,生成国际规范格式和业务专有格式的集合数据类产品,为国际TIGGE计划数据交换和气象预报业务MICAPS平台等提供数据源。
(3) 常规产品部分
主要包括基本图形产品制作模块,其功能是按照用户需求,通过数据转化、集合概率产品制作技术和绘图工具,制作全球、中国和世界气象组织(World Meteorological Organization,WMO)示范项目覆盖区域等不同空间范围的图形产品,例如邮票图、集合平均图、面条图、分簇图和概率预报图等,主要用于日常天气预报。
(4) 专项预报产品部分
主要包括台风集合产品、极端预报产品和距平概率预报产品的制作模块,制作EFI和距平概率产品,以及台风、西北太平洋副热带高压(以下简称“西太副高”)和南亚高压、热带大气季节内振荡(Madden-Julian Oscillation,MJO)等集合产品,用于极端天气和重要环流型预报,通过驱动其他应用模式和模型,制作特色和专业气象服务集合产品。
(5) 订正释用产品部分
主要包括聚类分析释用产品制作模块和偏差/误差订正制作模块,充分利用集合预报成员大样本信息,以便进一步改进集合预报和提升预报准确率。主要功能包括对多样本的集合预报进行确定性和概率性的偏差/误差订正处理,并进行多集合成员信息的聚类分析和分类释用。
(6) 运行监控部分
即可视化运行监控模块,具有每天定时自动启动运行集合预报系统,为系统运行提供可视化监测、控制、出错处理选择、查看机器资源以及完成数据调度等功能。
(7) 保障服务技术支持部分
即面向用户的产品开发和应用模块,主要功能是开展面向特殊用户的专有产品开发和应用,以满足国内外重大活动和事件气象保障服务所需要开发的集合预报产品。
3.2 集合后处理关键技术方案介绍
后处理技术的发展既要紧跟国际先进技术发展方向,又要面向我国实际业务的需求。
(1) 集合预报统一后处理技术
随着集合成员数快速增加、分辨率成倍提升等模式客观发展,使得集合预报后处理面临的数据量是单一确定性模式输出的几十倍,这对于数据压缩比的要求显著增加。而且,在集合预报应用推广过程中,不同用户平台之间数据的灵活使用和转换等需求也在不断提升,这些都成为推动后处理技术改进的重要因素。CMA集合后处理系统通过在压码程序中增加集合预报产品定义模块,在自描述的表格驱动码编码规则中,添加了集合成员数、产品类型和集合成员标识等接口,同时兼顾效率,采用并行技术,实现全球/区域系统统一的集合预报后处理技术。
(2) 分时效并行处理技术
高性能计算中通常采用两类并行方式:一是功能并行或任务并行,即多个处理器在同一时间内执行不同的运算或操作;二是数据并行,即多个处理器在同一时间内执行同一指令。集合预报占用资源较大,样本数量多,后处理数据文件数量多、数据交换量大。为了在后处理系统中充分发挥两种并行方式的优势,围绕样本数据并行处理与时效性控制这一核心问题,针对产品所需数据的时效性和种类特点,采用了不同并行方法,即分时效并行任务创建与过程唤醒相结合、数据信息检索传递等方式加大并行度。将后处理系统中计算与绘图和数据处理过程分离,尽可能优化程序设计,从而有效提高了集合产品的制作效率,大幅缩短了后处理运行时间,使得后处理系统在功能实现、处理效率等各方面都满足了业务运行需求。
(3) 集合数据和图形产品制作技术
国际数据交换需要采用通用标准格式进行集合预报输出数据产品的压码和解码,这是集合预报数据后处理的关键技术,我们在CMA集合系统中实现了具有高压缩比的GRIB1/2格式,使得相关数据产品在国内外广为传播使用。利用集合输出数据综合开发了箱线图和Talagrand图等常规集合概率预报产品,以及大气动力学诊断量和物理统计量的辅助集合产品制作技术,并根据气象科技前沿发展和特殊服务保障需求,研发了众多专项预报产品的制作技术,从而为预报员和用户提供丰富的预报解读和参考信息。
(4) 集合预报偏差/误差订正技术
(5) 集合预报的分类释用技术
集合预报聚类产品在许多国家气象业务部门得到普遍采用,主要思路是将集合预报通过不同的客观聚类方法划分为几类,浓缩集合预报信息供预报员使用。聚类分析方法对集合预报系统的产品释用提供了一种简捷、有效的方法,可以把集合预报中相似的成员合并成一类(并同时给出该类出现的相对频率),在多平衡态时就可能会出现几类很不相同的天气形势以供预报员或用户参考。基于CMA-GEPS高度场集合预报数据,将动态聚类的“手肘法”方案引入到传统的Ward聚类方法中,发展了环流集合预报分类释用方法[61],能够有效地划分出最有可能发生的环流形势类型、并给出发生概率,而且集合大类相比于集合平均预报,具有更高的预报技巧和更小的预报误差,这种优势随着预报时效的延长愈发显著。
(6) 极端预报指数技术
为了利用集合预报系统信息对极端天气发出早期的预警信号,EFI能够有效地从集合预报中提取异常预报分布[65-66],在ECMWF和NCEP等业务机构广泛应用[67-69]。我国学者开展了基于国内集合预报系统的极端天气预报研究[70]。由于EFI的原理是计算累积的模式气候概率分布和集合预报概率分布之差,因此在进行集合预报业务应用的时候,首要解决的是对业务模式气候概率分布的合理估算和阈值设定。为此,我们发展了新的气候概率估算方案,运用局地时空拓展样本量的方法计算得到了较为平滑的气候概率分布曲线函数,从而实现了对EFI的实时估算和数据图形产品开发。2015年在T639全球集合预报系统业务中开发出了极端降水和极端温度指数产品,2018年基于GRAPES-GEPS开发制作了1~15 d预报时效的EFI产品,显著提升了极端天气预报能力,并实现了数据和图形产品实时在线发布、推广应用。
(7) 东亚重要环流系统集合预报技术
西太副高与南亚高压两大环流系统对我国气象要素以及极端天气事件有显著影响,对其强度和位置进行准确预报显得尤其重要。但长期以来对西太副高和南亚高压的天气尺度预报研究较少,而与西太副高相比,对南亚高压的模式模拟及预报研究几乎未受到关注[71]。利用CMA-GEPS的2018年底业务化以来的实时集合数据,高丽等[60]开展了西太副高和南亚高压的集合预报方法研究,为进一步改进模式和提升东亚重要环流系统的集合预报产品应用提供科学参考。在此基础上,按照气象预报预测业务规范,运用500 hPa位势高度场集合成员数据分别计算西太副高的强度、面积、脊线位置和西伸脊点4个特征指数[72],开发出逐日西太副高指数数据和图形产品。并利用200 hPa纬向西风和位势高度集合预报数据开发了南亚高压的强度、中心经度和纬度的特征指数[73]集合预报产品。
(8) 热带大气季节内振荡集合预报技术
MJO是季节内尺度上最显著的大尺度环流系统,对我国影响很大,其特征指数的准确预报对中期—延伸期天气预报有重要意义[74]。国内外MJO预报主要是基于S2S(Subseasonal to Seasonal)业务模式,以气候模式居多[75-76]。我国学者尚未对数值天气预报模式的MJO预报开展系统性研究。2016年以来,我们利用T639集合预报系统和GRAPES-GEPS的集合成员预报,发展出适用于各自模式集合预报系统的MJO诊断预报技术方案,开发出预报时效为1~15 d的MJO中期集合预报产品,研发了MJO指数的集合羽状预报图形产品。并利用集合平均预报的MJO特征指数开发出了对我国气温和降水进行统计模型重构预报的新产品,可利用MJO预报信息实现对气象要素的间接预报。目前这些MJO预报和诊断图形产品每日滚动发布,成为大气季节内振荡预报业务的重要部分。
4 集合后处理产品与应用
集合预报后处理系统的主要功能是为用户需求输出集合预报图形信息,这里展示出关注度较高以及新近发展的主要图形集合预报产品,并对于典型的应用范例进行介绍。
(1) 气象要素集合预报图形产品
常规气象要素的图形产品主要包含集合平均、离散度、概率分布图和面条图等,其中用户使用最多和关注度高的是区域邮票图和单站箱线图。邮票图可为用户提供集合预报的离散度以及可能出现的极端天气情况提供参考,直观了解每个集合成员预报的空间分布,但成员过多时不利于短时间内把握主要信息。箱线图可提供单站的集合预报概率分布的第25百分位和第75百分位以及集合成员的中位数、最小值和最大值,这兼顾到集合平均信息和不确定性,可全面展示气象要素随预报时间的变化,并把握各时刻的集合预报概率分布特征及演变趋势。
(2) 极端预报指数产品
图2
图2
2021年7月20日的降水(a)和风速(b)以及2022年8月15日的高温(c)提前24小时预报的EFI分布
Fig. 2
The 24-hr EFI products of the rainfall (a) and wind speed (b) on 19 July 2021, and the high temperature (c) on 15 August 2022
(3) 西太副高和南亚高压集合预报产品
图3
图3
2022年8月18日起报的西太副高强度(a)、面积(b)、西伸脊点(c)和脊线位置(d)的集合预报箱线图
Fig. 3
Ensemble forecast box-whisper products of the intensity (a), area (b), western ridge point (c), and ridge line (d) of the Western-Pacific Subtropical High (WPSH) initiated on 18 August 2022
图4
图4
2022年9月9日起报的南亚高压的强度(a)、中心经度(b)和中心纬度(c)的集合预报箱线图
Fig. 4
Ensemble forecast box-whisper products of the intensity (a), center longitude (b), center latitude (c) of the South-Asian High (SAH) initiated on 9 September 2022
(4) 热带大气季节内振荡集合预报产品
图5
图5
2020年1月MJO强事件的指数集合预报相限图(左)和基于此重构的我国降水异常(右)
Fig. 5
Ensemble forecast products of the MJO phase diagram (left) and reconstructed pentad-mean precipitation anomaly in China (right) in January 2020
5 总结和展望
随着数值模式和高性能计算机技术的快速发展,集合预报已成为数值预报中最重要的发展方向之一,目前已成为数值预报准确率提升的主要途径。伴随着集合预报模式和前处理集合扰动生成技术的日趋成熟完善,有关集合预报信息的后处理技术及应用也越来越受到重视,逐渐在日常天气预报和气候预测方面展示出不可替代的作用和优势。本文系统性地回顾了中国气象局数值天气集合预报统一后处理系统的研发与应用情况。
如何有效制作集合预报产品、让其在实际预报和预测业务中发挥作用等一系列应用问题,是当前国内外关注的重点。为推动我国集合预报业务发展,中国气象局数值预报中心集合预报团队利用实时获取的全球/区域集合预报系统的模式输出数据,综合运用自主研发的集合预报统一后处理压码技术、分时效并行处理技术、集合产品制作生成技术、集合统计量诊断分析和偏差/误差订正技术等,综合建成了全球/区域集合预报统一后处理系统,制作并提供实时集合预报数据和图形产品。目前,该系统的集合预报产品已经在国省两级气象业务和国内重大活动服务保障中提供有力支持。
尽管实现了快速发展和长足进步,CMA集合预报后处理系统仍有很多方面存在不足之处和亟待发展的方面。目前,集合大数据的分析展示尤为薄弱,需要发展多维可视化技术;亟待开发智能化的后处理技术和相关产品;基于大样本集合信息的分类释用产品的研发很有价值;发展有效的确定性和概率性偏差/误差订正技术对于提升集合预报准确率至关重要[77];集合预报实时检验有必要成为后处理系统的一部分,为预报员提供更为丰富的参考信息;开发更多用户导向的集合产品、满足日趋专业和特色化的服务需求是未来重要发展方向。此外,集合预报后处理生成信息的应用领域也在不断拓宽,未来可以在强天气、中小尺度极端天气预报、海洋和大气环境等专业预报领域发挥更大的作用。
参考文献
Theoretical skill of Monte Carlo forecasts
[J].
Ensemble forecasting at NCEP and the breeding method
[J].
The ECMWF ensemble prediction system: methodology and validation
[J].
/
| 〈 |
|
〉 |


甘公网安备62010202000687