天气预报中的人工智能技术进展

doi:10.11867/j.issn.1001-8166.2020.053

[1]

Bjerknes

V

.

Dynamic Meteorology and Hydrograph, Part II. Kinematics

[M].New York: Camegie Institute, Gibson Bros,1911.

[本文引用: 1]

[2]

Key

J

, Maslanik

J

, Schweiger

A

.

Classification of merged AVHRR and SMMR Arctic data with neural networks

[J]. Photogrammetric Engineering and Remote Sensing, 1989, 55(9):1 331-1 338.

[本文引用: 1]

[3]

Bankert

R

.

Cloud classification of AVHRR imagery in maritime regions using a probabilistic neural network

[J]. Journal of Applied Meteorology, 1994,33(8):909-918.

[本文引用: 1]

[4]

Marzban

C

, Stumpf

G

.

A neural network for tornado prediction based on Doppler radar-derived attributes

[J]. Journal of Applied Meteorology, 1996, 35(5):617-626.

[本文引用: 1]

[5]

Lakshmanan

V

, Stumpf

G

, Witt

A

.

A neural network for detecting and diagnosing tornadic circulations using the mesocyclone detection and near storm environment algorithms

[C]//21st International Conference on Information Processing Systems, San Diego, American Meteorological Society, J5.2,

2005

.

[本文引用: 1]

[6]

Marzban

C

, Stumpf

G

.

A neural network for damaging wind prediction

[J]. Weather and Forecasting, 1998, 13 (1):151-163.

[本文引用: 1]

[7]

Marzban

C

, Witt

A

.

A Bayesian neural network for severe-hail size prediction

[J]. Weather and Forecasting, 2001, 16(5):600-610.

[本文引用: 1]

[8]

Manzato

A

.

Hail in northeast Italy: A neural network ensemble forecast using sounding-derived indices

[J]. Weather and Forecasting, 2013, 28(1):3-28.

[本文引用: 1]

[9]

Anagnostou

E

.

A convective/stratiform precipitation classification algorithm for volume scanning weather radar observations

[J]. Meteorological Applications, 2004, 11(4):291-300.

[本文引用: 1]

[10]

Lakshmanan

V

, Karstens

C

, Krause

J

, et al.

Quality control of weather radar data using polarimetric variables

[J]. Journal of Atmospheric and Oceanic Technology, 2014, 31(6):1 234-1 249.

[本文引用: 2]

[11]

Lakshmanan

V

, Rabin

R

, DeBrunner

V

.

Identifying and tracking storms in satellite images

[C]//Second Artificial Intelligence Conference, Long Beach, CA, American Meteorological Society, 90-95, 2000.

[本文引用: 1]

[12]

Lakshmanan

V

, Fritz

A

, Smith

T

, et al.

An automated technique to quality control radar reflectivity data

[J]. Journal of Applied Meteorology, 2007, 46(3): 288-305.

[本文引用: 1]

[13]

Newman

J

, Lakshmanan

V

, Heinselman

P L

, et al.

Range- correcting azimuthal shear in Doppler radar data

[J]. Weather and Forecasting, 2013, 28:194-211.

[本文引用: 2]

[14]

Trafalis

T B

, Ince

H

, Richman

M B

.

Tornado detection with support vector machines

[C]//International Conference on Computational Science. Berlin, Heidelberg：Springer, 2003: 289-298.

[本文引用: 1]

[15]

Adrianto

I

, Trafalis

T

, Lakshmanan

V

.

Support vector machines for spatiotemporal tornado prediction

[J]. International Journal of General Systems, 2007, 38(7): 759-776.

[本文引用: 1]

[16]

Dai

Lijie

, Zhang

Changjiang

, Xue

Licheng

, et al.

Eyed tropical cyclone intensity objective estimation model based on infrared satellite image and relevance vector machine

[J]. Journal of Remote Sensing, 2018, 22(4): 581-590.

[本文引用: 1]

戴李杰,张长江,薛利成, 等.

红外卫星云图和相关向量机的有眼热带气旋客观定强模型

[J]. 遥感学报，2018, 22(4):581-590.

[本文引用: 1]

[17]

Chisholm

D

, Ball

J

, Veigas

K

, et al.

The diagnosis of upper-level humidity

[J]. Journal of Applied Meteorology, 1968, 7(4):613-619.

[本文引用: 1]

[18]

Williams

J D

, Dettling

A S

, Steiner

M

.

Combining observations and model data for short-term storm forecasting

[C]//Remote Sensing Applications for Aviation Weather Hazard Detection and Decision Support, SanDiego, CA, International Society for Optics and Photonics, 2008.

[本文引用: 1]

[19]

Williams

J

, Sharman

R

, Craig

J

, et al.

Remote detection and diagnosis of thunderstorm turbulence

[C]//Remote Sensing Applications for Aviation Weather Hazard Detection and Decision Support, San Diego, CA, International Society for Optics and Photonics. 2008.

[本文引用: 1]

[20]

Gagne

II D J

, McGovern

A

, Brotzge

J

.

Classification of convective areas using decision trees

[J]. Journal of Atmospheric and Oceanic Technology, 2009, 26(7): 1 341-1 353.

[本文引用: 2]

[21]

McGovern

A

, Gagne

II D J

, Williams

J K

, et al.

Enhancing understanding and improving prediction of severe weather through spatiotemporal relational learning

[J]. Machine Learning, 2014, 95(1): 27-50.

[本文引用: 1]

[22]

McGovern

A

, Gagne

II D J

, Basara

J

.

Solar energy prediction: An international contest to initiate interdisciplinary research on compelling meteorological problems

[J]. Bulletin of the American Meteorological Society, 2015, 96(8):1 388-1 395.

[本文引用: 1]

[23]

Elmore

K L

, Grams

H

.

Using mping data to generate random forests for precipitation type forecasts

[C]//14th Conference on Artificial and Computational Intelligence and its Applications to the Environmental Sciences, 4.

2

2016.

[本文引用: 1]

[24]

Breiman

L

.

Random forests

[J]. Machine Learning, 2001, 45(1):5-32.

[本文引用: 1]

[25]

Friedman

J H

.

Stochastic gradient boosting

[J]. Computational Statistics and Data Analysis, 2002, 38(4): 367-378.

[本文引用: 1]

[26]

Schapire

R E

.

The boosting approach to machine learning: An overview

［M］//Denison D D，Hansen M H，Holmes C，et al.Nonlinear Estimation and Classification. New York： Springer, 2003.

[本文引用: 1]

[27]

Baldwin

M

, Kain

J

, Lakshmivarahan

S

.

Development of an automated classification procedure for rainfall systems

[J]. Monthly Weather Review, 2005, 133(4):844-862.

[本文引用: 1]

[28]

Lakshmanan

V

, Smith

T

.

Evaluating a storm tracking algorithm

[C]//26th Conference on Interactive Information Processing Systems. Atlanta, GA: American Meteorological Society, 2010.

[本文引用: 2]

[29]

Miller

M L

, Lakshmanan

V

, Smith

T M

.

An automated method for depicting meso-cyclone paths and intensities

[J]. Weather and Forecasting, 2013, 28: 570-585.

[本文引用: 1]

[30]

Pathak

J

, Wikner

A

, Fussell

R

, et al.

Hybrid forecasting of chaotic processes: Using machine learning in conjunction with a knowledge-based model

[J]. Chaos: An Interdisciplinary Journal of Nonlinear Science, 2018, 28(4): 041101.

[本文引用: 3]

[31]

McNicholas

C

.

Smartphone pressure analysis with machine learning and kriging

[C]//Oral Presentation， 1B.2.

The 100th American Meteorological Society Annual Meeting

Boston, MA, USA, 2020.

[本文引用: 3]

[32]

Chakraborty

T

.

Creating bias-corrected global radiation datasets from climate reanalysis products using supervised learning

[C]//Oral Presentation, 1A.3.

The 100th American Meteorological Society Annual Meeting

Boston, MA, USA, 2020.

[本文引用: 1]

[33]

Lakshmanan

V

, Herzog

B

, Kingfield

D

.

A method for extracting postevent storm tracks

[J]. Journal of Applied Meteorology and Climatology, 2015, 54(2): 451-462.

[本文引用: 2]

[34]

Adams-Selin

R D

, Ziegler

C L

.

Forecasting hail using a one-dimensional hail growth model within WRF

[J]. Monthly Weather Review, 2016, 144: 4 919-4 939.

[本文引用: 1]

[35]

Sobash

R A

, Schwartz

C S

, Romine

G S

, et al.

Severe weather prediction using storm surrogates from an Ensemble Forecasting System

[J]. Weather Forecasting, 2016, 31(1): 255-271.

[本文引用: 1]

[36]

Smith

T M

, Lakshmanan

V

, Stumpf

G J

, et al.

Multi-radar multi-sensor (mrms) severe weather and aviation products: Initial operating capabilities

[J]. Bulletin of the American Meteorological Society, 2016, 97(9):1 617-1 630.

[本文引用: 2]

[37]

Witt

A

, Eilts

M

, Stumph

G

, et al.

An enhanced hail detection algorithm for the WSR-88D

[J]. Weather Forecasting, 1998, 13: 286-303.

[本文引用: 1]

[38]

Clark

A J

, MacKenzie

A

, McGovern

A

, et al.

An automated, multi-parameter dryline identification algorithm

[J]. Weather and Forecasting, 2015, 30(6)： 1 781-1 794.

[本文引用: 1]

[39]

Ma

Leiming

, Bao

Xuwei

,

Research progress on physical parameterization schemes in numerical weather prediction models

[J]. Advances in Earth Science, 2017, 32(7): 679-687.

[本文引用: 2]

马雷鸣，鲍旭炜.

数值天气预报模式物理过程参数化方案的研究进展

[J]. 地球科学进展，2017, 32(7): 679-687.

[本文引用: 2]

[40]

Ma

L M

，Tan

Z M

.

Improving the behavior of the cumulus parameterization for tropical cyclone prediction convection trigger

[J]. Atmospheric Research， 2009， 92(2)： 190-211.

[本文引用: 1]

[41]

Ma

Leiming

.

Research progress on major structures of tropical cyclone boundary layer

[J]. Progress in Geophysics, 2013, 28(3):1 259-1 268.

[本文引用: 1]

马雷鸣

.

热带气旋边界层关键结构研究进展

[J]. 地球物理学进展, 2013, 28(3): 1 259-1 268.

[本文引用: 1]

[42]

Ma

L M

, Bao

X W

.

Parametrization of planetary boundary-layer height with helicity and verification with tropical cyclone prediction

[J]. Boundary Layer Meteorology, 2016, 160(3):569-593.

[本文引用: 1]

[43]

Glahn

H R

, Lowry

D A

.

The use of model output statistics (mos) in objective weather forecasting

[J]. Journal of Applied Meteorology,1972, 11(8): 1 203-1 211.

[本文引用: 1]

[44]

Ma

L M

.

Convection forecast enhanced by the deep learning of radar observation and numerical prediction

[C]//Oral Presentation, 1B.1.

The 100th American Meteorological Society Annual Meeting

Boston, MA, USA, 2020.

[本文引用: 1]

Dynamic Meteorology and Hydrograph, Part II. Kinematics

1

1911

... 由于大气运动的高度复杂性，天气预报、尤其是强对流、台风等灾害天气预报一直是国际难题，被称为气象学的终极问题^[1].从古希腊哲学推理到中世纪占卜，再到现代科学推理、计算机建模和数值预报，天气预报已从一种主观化、经验性的体力劳动，慢慢演化为客观化、定量化的高科技活动.这一转变的形成，长期以来主要得益于数值预报，即通过计算机做数值计算求解描写天气演变过程的流体力学和热力学的方程组，预测未来一定时段的大气运动状态和天气现象.尽管已取得了长足的进步，但是由于对大气运动规律科学认识及数值模式表达仍有不足，全球主流的数值预报模式还普遍存在误差，这种误差在极端天气预报中表现尤为明显.例如美国国家天气局（National Weather Service，NWS）于2019年更新的全球数值天气预报模式GDAS/GFS V15.0.0（简称GFS-FV3模式）尚存在美国中西部2 m极端温度偏高、虚报的（非热带）低压、飓风降水预报误差等问题. ...

Classification of merged AVHRR and SMMR Arctic data with neural networks

1

1989

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

Cloud classification of AVHRR imagery in maritime regions using a probabilistic neural network

1

1994

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

A neural network for tornado prediction based on Doppler radar-derived attributes

1

1996

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

2005

1

2

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

A neural network for damaging wind prediction

1

1998

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

A Bayesian neural network for severe-hail size prediction

1

2001

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

Hail in northeast Italy: A neural network ensemble forecast using sounding-derived indices

1

2013

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

A convective/stratiform precipitation classification algorithm for volume scanning weather radar observations

1

2004

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

Quality control of weather radar data using polarimetric variables

2

2014

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

... [10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

Identifying and tracking storms in satellite images

1

2000

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

An automated technique to quality control radar reflectivity data

1

2007

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

Range- correcting azimuthal shear in Doppler radar data

2

2013

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

... (2)订正模式误差.假设无观测偏差，数值模式与观测的偏差可以认为是不完美的认知所导致的模式误差.传统的模式订正方法一般基于数值模式统计释用（Model Output Statistics，MOS）^[13]模型，即基于给定时间范围内的数值模式输出与观测^[44]之间的统计模型，通常使用线性回归.在更新数值模式后，在收集到足够样本的新模式预报数据后，必须通过MOS模型进行再训练.机器学习显然可以帮助识别和了解模式的误差，进而应用于MOS模型，对数值模式进行订正.图3给出了上海中心气象台基于AI模型订正数值模式预报的结果^[39]，这种订正可基于一种罚函数（cost function）的最小化来实现. ...

Tornado detection with support vector machines

1

2003

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

Support vector machines for spatiotemporal tornado prediction

1

2007

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

Eyed tropical cyclone intensity objective estimation model based on infrared satellite image and relevance vector machine

1

2018

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

红外卫星云图和相关向量机的有眼热带气旋客观定强模型

1

2018

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

The diagnosis of upper-level humidity

1

1968

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

Combining observations and model data for short-term storm forecasting

1

2008

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

Remote detection and diagnosis of thunderstorm turbulence

1

2008

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

Classification of convective areas using decision trees

2

2009

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

... [20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

Enhancing understanding and improving prediction of severe weather through spatiotemporal relational learning

1

2014

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

Solar energy prediction: An international contest to initiate interdisciplinary research on compelling meteorological problems

1

2015

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

2

1

2016

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

Random forests

1

2001

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

Stochastic gradient boosting

1

2002

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

The boosting approach to machine learning: An overview

1

2003

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

Development of an automated classification procedure for rainfall systems

1

2005

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

Evaluating a storm tracking algorithm

2

2010

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

... 与AI技术在其他领域的应用发展一样，天气预报中的AI应用也从计算机视觉技术应用起步.目前计算机视觉技术已在多普勒雷达图像智能识别和短临外推（一般为0~2小时）、卫星云图类型识别等方面广泛应用.日本九州大学的研究小组利用深度学习技术，开发了从全球云系统分辨率模型（Nonhydrostatic Icosahedral Atmospheric Model， NICAM）气候实验数据中识别热带低压的方法，特别是夏季西北太平洋热带低压发生一周前的征兆.美国NWS已大力着手基于云的天气预报应用，并已启动了内部研究和发展计划（Internal Research & Development Project，IP&D）提高天气预报能力.IP&D实现了针对灾害天气的实时数据挖掘，进而用于洪水预测.通过AI算法考虑过去已导致明显洪水灾害的区域，选出预报目标区，结合亚马逊网络云服务（Amazon Web Services，AWS），通过机器学习预测该目标区的洪灾可能性和严重程度，并通过AWS网页进行图形可视化调用.NWS还做了强风（阵风大于等于25.7 m/s)实时预报，使用AI技术预测未来不同距离(风暴单元周围0、5和10 km)和时间窗(未来0~15、15~30、30~45、45~60和60~90 min)内出现大风的概率.数据集由MYRORSS（The Multi-Year Reanalysis of Remotely Sensed Storms）质量控制的雷达图像、快速更新同化(Rapid Update Cycle，RUC)模型数据、1分钟气象机场报告(METARs;国家气候数据中心2006年)和NWS地区风暴报告等构成.MYRORSS的空间和时间分辨率分别为1 km和5 min,而RUC的分辨率为13 km和1 h.主要流程包括：首先，使用实时^[28]和事后^[33]方法对风暴细胞进行识别和跟踪.选取预测因子包括风暴运动(速度和方向)、风暴目标的形状参数(面积、方向和偏心)等；其次，通过对流允许模型(Convection Allowing Model，CAM)集成提供有关风暴强度、位置和演化的信息，并建立可预测冰雹发生概率和预测冰雹大小分布的机器学习模型.该模型已经在两个CAM集成系统上实时运行，并通过冰雹cast诊断^[34]和风暴替代变量(updraft helicity)^[35]进行验证.其中，观测的冰雹由美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration,NOAA)国家强风暴实验室(The National Severe Storms Laboratory,NSSL)多雷达多传感器^[36]给出的冰雹最大预期^[37]确定.预报和观测到的风暴根据空间和时间上的接近程度进行匹配，从每个预报风暴的范围内提取描述风暴和环境变量的统计信息，并将其输入到机器学习模型中.这种方法与Clark等^[38]通过干线（dryline）判断风暴的方法有异曲同工之妙.Google公司也将深度学习用于提供空间分辨率1 km、时间分辨率1~3 h的美国大陆雨雪预报.观测资料包括遥感和地面站，如GEO和LEO卫星，多普勒雷达、雨量站，地表和气候等信息.过去2 h的历史数据主要包括：

①

8张GOES-16卫星图像（15 min分辨率），

②

8张或更多的多普勒雷达图像（2 min分辨率），

③

1张IMERG/GPM LEO卫星云图（每3 h 1张），

④

PRISM（Parameter-elevation Regressions on Independent Slopes Model）气候资料（当月的30年气候平均），

⑤

地形高度.输出包括未来3 h雷达图像和/或雨量观测.与传统的深度学习方法相比，该方法考虑到卫星资料和雷达资料的观测时间差异，使用延时处理以使两者时间匹配.基于2018年和2019年数据的检验表明，该方法的3 h预报性能高于数值预报方法.另一个典型的实例是，ProbSevere公司利用多雷达多传感器(Multi-Radar/Multi-Sensor System，MRMS)的复合反射率(同时获得多个雷达的最大柱状反射率)实时识别和跟踪风暴^[36].该方法在识别时，使用了风暴附近环境以及风暴速度信息.训练标签是通过运行一个名为best track的事后风暴跟踪程序^[33].训练数据还对所有持续时间大于7 200 s的风暴进行了采样，产生了2 872 680个用于训练的样本. ...

An automated method for depicting meso-cyclone paths and intensities

1

2013

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

Hybrid forecasting of chaotic processes: Using machine learning in conjunction with a knowledge-based model

3

2018

... AI技术的发展经历了从手工规则和启发法到线性模型和决策树、再到集成和深度模型、元学习模型的过程，日趋复杂、成熟的AI模型也为天气预报技术的不断提升创造了条件.目前在天气预报中应用的主流AI技术主要包括神经网络、支持向量机、决策树和随机森林模型等.

①

人工神经网络，是由加权非线性函数组成的网络模型，在多层连接和训练的情况下，可以表示任意非线性函数.当通过多层网络联接和训练后，理想情况下它可以表达任何非线性过程.人工神经网络自20世纪80年代起被广泛应用于气象领域^[2],主要包括云^[3]、龙卷^[4,5]、大风^[6]、冰雹^[7,8]、降水^[9,10]、风暴^[11]等的识别、分类和观测质量控制等^[12,13].近年来，神经网络方法已发展出了一系列各具优势的延伸模型，包括深度信念网络（Deep Belief Network，DBN）、卷积神经网络（Convolution Neural Network，CNN）、递归神经网络（Recurrent Neural Network，RNN）、长短时记忆模型（Long Short-Term Memory，LSTM）和生成对抗网络（Generative Adversarial Nets，GAN）等.

②

支持向量机（Support Vector Machine, SVM），是一种按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），它可以通过核方法（kernel method）进行非线性分类.SVM使用铰链损失函数（hinge loss）并加入正则化项以优化结构风险（structural risk），已被用于识别和预报龙卷^[14,15].同类的还有相关向量机（Relevance Vector Machine，RVM）模型，由于在解决小样本和非线性问题中表现出特有的优势，已被用于台风定强等研究^[16].

③

决策树模型，是一种简单易用的非参数分类器，它由决策点、策略点(事件点)及结果构成树形图，通常以最大收益期望值或最低期望成本作为决策准则.决策树模型不需要对数据有任何的先验假设，计算速度较快，而且稳健性强，已被广泛应用于气象领域^{[17,18,19,20,21,22,23]}.

④

随机森林法(Random Forests，RFs)^[24]，是一种包含多个决策树的分类器，即由决策树构成的集合.由于基于不同的数据和预测因子进行训练，决策树“森林”中的每棵树都是不同的，形成类似“专家库”的作用.以渐进梯度回归树方法（Gradient Boosted Regression Trees, GBRT)^[25]为例，它通过boosting算法训练一组决策树的集合^[26]，且基于不同权重进行训练，权重基于前次训练的残差来确定.此外，聚类法等方法也被广泛应用，Baldwin等^[27]使用异构聚类法（Hierarchical Clustering）来划分强降水区域.Gagne等^[20]和Lakshmanan等^[10,28]使用k-means聚类法来分析灾害天气雷达回波图像.Miller等^[29]将聚类法用于风暴路径的识别.尽管有不同的复杂定义和应用，这些方法都可以归为“机器学习”（Machine Learning）的范畴，其共同特征是：针对特定的任务（如“分类”）使用数据进行训练；一般都基于“输入—输出”方程，通过最小化“实际输出”(actual outputs)与“期望输出”(desired outputs)间的差异确定参数值（parameter values）;在大多数情形下，任务都是静态的（static）,即训练所需数据都是给定的“输入—输出”序列对.在这些方法中，由于在机器视觉、语音识别、自然语言处理、强化学习等方面的突出优势，深度神经网络（“深度学习”）已成为目前AI气象应用的主流.例如，图1给出了Pathak等^[30]将一种基于局部区域和周边区域数据（或称为“蓄水池”，reservoirs）作为输入、局部区域作为输出（预报对象）的深度学习方法，可通过多重蓄水池平行运算的方式预测高维系统. ...

... [30]Application of reservoir-only prediction network (Input Layer-Output Layer) in Machine Learning[<xref ref-type="bibr" rid="R30">30</xref>]

Fig.1

2.2　AI技术在国内外观测预报中的典型应用实例2.2.1　观测方面

美国华盛顿大学^[31]开展了基于智能手机的气压分析和机器学习.IBM的TWC（The Weather Company）已经通过其智能应用程序APP建立了分布全球的气压观测网，目前已经积累了超过50亿次的智能手机气压观测数据.然而，观测传感器和基础数据存在误差必须进行质量控制，因而他们提出了一种偏差订正机器学习算法.首先，基于过去的实测气压数据和实时传感器资料训练的Gradient-boosting模型，可以分析智能手机的气压观测误差；其次，将观测气压减去分析的气压观测误差实现观测偏差订正，再使用多分辨率kriging插值，得到2018年覆盖美国大陆的逐5分钟、空间分辨率5 km、经偏差订正的气压观测（图2）.订正结果可与METAR观测资料以及快速更新同化（High-Resolution Rapid Refresh）模式资料进行比较验证.耶鲁大学^[32]研究发现NCEP/NCAR、MERRA-2和ERA5等3种全球辐射再分析数据集中，月平均入射长、短波辐射都不同程度存在低估，而散射辐射在不同模式中被低估和高估的现象同时存在.测试发现随机森林方法可明显改进这一误差.通过使用地面辐射基准网络（Baseline Surface Radiation Network，BSRN）的逐小时观测，构造一个经偏差订正的全球格点化的辐射数据集.一旦训练好后，这种随机森林算法可被用于任一格点数据的订正而不需要观测资料，这非常适用于全球资料分析. ...

... [30]Fig.12.2　AI技术在国内外观测预报中的典型应用实例2.2.1　观测方面

美国华盛顿大学^[31]开展了基于智能手机的气压分析和机器学习.IBM的TWC（The Weather Company）已经通过其智能应用程序APP建立了分布全球的气压观测网，目前已经积累了超过50亿次的智能手机气压观测数据.然而，观测传感器和基础数据存在误差必须进行质量控制，因而他们提出了一种偏差订正机器学习算法.首先，基于过去的实测气压数据和实时传感器资料训练的Gradient-boosting模型，可以分析智能手机的气压观测误差；其次，将观测气压减去分析的气压观测误差实现观测偏差订正，再使用多分辨率kriging插值，得到2018年覆盖美国大陆的逐5分钟、空间分辨率5 km、经偏差订正的气压观测（图2）.订正结果可与METAR观测资料以及快速更新同化（High-Resolution Rapid Refresh）模式资料进行比较验证.耶鲁大学^[32]研究发现NCEP/NCAR、MERRA-2和ERA5等3种全球辐射再分析数据集中，月平均入射长、短波辐射都不同程度存在低估，而散射辐射在不同模式中被低估和高估的现象同时存在.测试发现随机森林方法可明显改进这一误差.通过使用地面辐射基准网络（Baseline Surface Radiation Network，BSRN）的逐小时观测，构造一个经偏差订正的全球格点化的辐射数据集.一旦训练好后，这种随机森林算法可被用于任一格点数据的订正而不需要观测资料，这非常适用于全球资料分析. ...

The 100th American Meteorological Society Annual Meeting

3

2020

... 美国华盛顿大学^[31]开展了基于智能手机的气压分析和机器学习.IBM的TWC（The Weather Company）已经通过其智能应用程序APP建立了分布全球的气压观测网，目前已经积累了超过50亿次的智能手机气压观测数据.然而，观测传感器和基础数据存在误差必须进行质量控制，因而他们提出了一种偏差订正机器学习算法.首先，基于过去的实测气压数据和实时传感器资料训练的Gradient-boosting模型，可以分析智能手机的气压观测误差；其次，将观测气压减去分析的气压观测误差实现观测偏差订正，再使用多分辨率kriging插值，得到2018年覆盖美国大陆的逐5分钟、空间分辨率5 km、经偏差订正的气压观测（图2）.订正结果可与METAR观测资料以及快速更新同化（High-Resolution Rapid Refresh）模式资料进行比较验证.耶鲁大学^[32]研究发现NCEP/NCAR、MERRA-2和ERA5等3种全球辐射再分析数据集中，月平均入射长、短波辐射都不同程度存在低估，而散射辐射在不同模式中被低估和高估的现象同时存在.测试发现随机森林方法可明显改进这一误差.通过使用地面辐射基准网络（Baseline Surface Radiation Network，BSRN）的逐小时观测，构造一个经偏差订正的全球格点化的辐射数据集.一旦训练好后，这种随机森林算法可被用于任一格点数据的订正而不需要观测资料，这非常适用于全球资料分析. ...

... [31]Surface pressure in horizontal resolution of 5 km observed by mobile phones over US[<xref ref-type="bibr" rid="R31">31</xref>]

Fig.2

2.2.2　预报方面

与AI技术在其他领域的应用发展一样，天气预报中的AI应用也从计算机视觉技术应用起步.目前计算机视觉技术已在多普勒雷达图像智能识别和短临外推（一般为0~2小时）、卫星云图类型识别等方面广泛应用.日本九州大学的研究小组利用深度学习技术，开发了从全球云系统分辨率模型（Nonhydrostatic Icosahedral Atmospheric Model， NICAM）气候实验数据中识别热带低压的方法，特别是夏季西北太平洋热带低压发生一周前的征兆.美国NWS已大力着手基于云的天气预报应用，并已启动了内部研究和发展计划（Internal Research & Development Project，IP&D）提高天气预报能力.IP&D实现了针对灾害天气的实时数据挖掘，进而用于洪水预测.通过AI算法考虑过去已导致明显洪水灾害的区域，选出预报目标区，结合亚马逊网络云服务（Amazon Web Services，AWS），通过机器学习预测该目标区的洪灾可能性和严重程度，并通过AWS网页进行图形可视化调用.NWS还做了强风（阵风大于等于25.7 m/s)实时预报，使用AI技术预测未来不同距离(风暴单元周围0、5和10 km)和时间窗(未来0~15、15~30、30~45、45~60和60~90 min)内出现大风的概率.数据集由MYRORSS（The Multi-Year Reanalysis of Remotely Sensed Storms）质量控制的雷达图像、快速更新同化(Rapid Update Cycle，RUC)模型数据、1分钟气象机场报告(METARs;国家气候数据中心2006年)和NWS地区风暴报告等构成.MYRORSS的空间和时间分辨率分别为1 km和5 min,而RUC的分辨率为13 km和1 h.主要流程包括：首先，使用实时^[28]和事后^[33]方法对风暴细胞进行识别和跟踪.选取预测因子包括风暴运动(速度和方向)、风暴目标的形状参数(面积、方向和偏心)等；其次，通过对流允许模型(Convection Allowing Model，CAM)集成提供有关风暴强度、位置和演化的信息，并建立可预测冰雹发生概率和预测冰雹大小分布的机器学习模型.该模型已经在两个CAM集成系统上实时运行，并通过冰雹cast诊断^[34]和风暴替代变量(updraft helicity)^[35]进行验证.其中，观测的冰雹由美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration,NOAA)国家强风暴实验室(The National Severe Storms Laboratory,NSSL)多雷达多传感器^[36]给出的冰雹最大预期^[37]确定.预报和观测到的风暴根据空间和时间上的接近程度进行匹配，从每个预报风暴的范围内提取描述风暴和环境变量的统计信息，并将其输入到机器学习模型中.这种方法与Clark等^[38]通过干线（dryline）判断风暴的方法有异曲同工之妙.Google公司也将深度学习用于提供空间分辨率1 km、时间分辨率1~3 h的美国大陆雨雪预报.观测资料包括遥感和地面站，如GEO和LEO卫星，多普勒雷达、雨量站，地表和气候等信息.过去2 h的历史数据主要包括： $①$ 8张GOES-16卫星图像（15 min分辨率）， $②$ 8张或更多的多普勒雷达图像（2 min分辨率）， $③$ 1张IMERG/GPM LEO卫星云图（每3 h 1张）， $④$ PRISM（Parameter-elevation Regressions on Independent Slopes Model）气候资料（当月的30年气候平均）， $⑤$ 地形高度.输出包括未来3 h雷达图像和/或雨量观测.与传统的深度学习方法相比，该方法考虑到卫星资料和雷达资料的观测时间差异，使用延时处理以使两者时间匹配.基于2018年和2019年数据的检验表明，该方法的3 h预报性能高于数值预报方法.另一个典型的实例是，ProbSevere公司利用多雷达多传感器(Multi-Radar/Multi-Sensor System，MRMS)的复合反射率(同时获得多个雷达的最大柱状反射率)实时识别和跟踪风暴^[36].该方法在识别时，使用了风暴附近环境以及风暴速度信息.训练标签是通过运行一个名为best track的事后风暴跟踪程序^[33].训练数据还对所有持续时间大于7 200 s的风暴进行了采样，产生了2 872 680个用于训练的样本. ...

... [31]Fig.22.2.2　预报方面

与AI技术在其他领域的应用发展一样，天气预报中的AI应用也从计算机视觉技术应用起步.目前计算机视觉技术已在多普勒雷达图像智能识别和短临外推（一般为0~2小时）、卫星云图类型识别等方面广泛应用.日本九州大学的研究小组利用深度学习技术，开发了从全球云系统分辨率模型（Nonhydrostatic Icosahedral Atmospheric Model， NICAM）气候实验数据中识别热带低压的方法，特别是夏季西北太平洋热带低压发生一周前的征兆.美国NWS已大力着手基于云的天气预报应用，并已启动了内部研究和发展计划（Internal Research & Development Project，IP&D）提高天气预报能力.IP&D实现了针对灾害天气的实时数据挖掘，进而用于洪水预测.通过AI算法考虑过去已导致明显洪水灾害的区域，选出预报目标区，结合亚马逊网络云服务（Amazon Web Services，AWS），通过机器学习预测该目标区的洪灾可能性和严重程度，并通过AWS网页进行图形可视化调用.NWS还做了强风（阵风大于等于25.7 m/s)实时预报，使用AI技术预测未来不同距离(风暴单元周围0、5和10 km)和时间窗(未来0~15、15~30、30~45、45~60和60~90 min)内出现大风的概率.数据集由MYRORSS（The Multi-Year Reanalysis of Remotely Sensed Storms）质量控制的雷达图像、快速更新同化(Rapid Update Cycle，RUC)模型数据、1分钟气象机场报告(METARs;国家气候数据中心2006年)和NWS地区风暴报告等构成.MYRORSS的空间和时间分辨率分别为1 km和5 min,而RUC的分辨率为13 km和1 h.主要流程包括：首先，使用实时^[28]和事后^[33]方法对风暴细胞进行识别和跟踪.选取预测因子包括风暴运动(速度和方向)、风暴目标的形状参数(面积、方向和偏心)等；其次，通过对流允许模型(Convection Allowing Model，CAM)集成提供有关风暴强度、位置和演化的信息，并建立可预测冰雹发生概率和预测冰雹大小分布的机器学习模型.该模型已经在两个CAM集成系统上实时运行，并通过冰雹cast诊断^[34]和风暴替代变量(updraft helicity)^[35]进行验证.其中，观测的冰雹由美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration,NOAA)国家强风暴实验室(The National Severe Storms Laboratory,NSSL)多雷达多传感器^[36]给出的冰雹最大预期^[37]确定.预报和观测到的风暴根据空间和时间上的接近程度进行匹配，从每个预报风暴的范围内提取描述风暴和环境变量的统计信息，并将其输入到机器学习模型中.这种方法与Clark等^[38]通过干线（dryline）判断风暴的方法有异曲同工之妙.Google公司也将深度学习用于提供空间分辨率1 km、时间分辨率1~3 h的美国大陆雨雪预报.观测资料包括遥感和地面站，如GEO和LEO卫星，多普勒雷达、雨量站，地表和气候等信息.过去2 h的历史数据主要包括： $①$ 8张GOES-16卫星图像（15 min分辨率）， $②$ 8张或更多的多普勒雷达图像（2 min分辨率）， $③$ 1张IMERG/GPM LEO卫星云图（每3 h 1张）， $④$ PRISM（Parameter-elevation Regressions on Independent Slopes Model）气候资料（当月的30年气候平均）， $⑤$ 地形高度.输出包括未来3 h雷达图像和/或雨量观测.与传统的深度学习方法相比，该方法考虑到卫星资料和雷达资料的观测时间差异，使用延时处理以使两者时间匹配.基于2018年和2019年数据的检验表明，该方法的3 h预报性能高于数值预报方法.另一个典型的实例是，ProbSevere公司利用多雷达多传感器(Multi-Radar/Multi-Sensor System，MRMS)的复合反射率(同时获得多个雷达的最大柱状反射率)实时识别和跟踪风暴^[36].该方法在识别时，使用了风暴附近环境以及风暴速度信息.训练标签是通过运行一个名为best track的事后风暴跟踪程序^[33].训练数据还对所有持续时间大于7 200 s的风暴进行了采样，产生了2 872 680个用于训练的样本. ...

The 100th American Meteorological Society Annual Meeting

1

2020

... 美国华盛顿大学^[31]开展了基于智能手机的气压分析和机器学习.IBM的TWC（The Weather Company）已经通过其智能应用程序APP建立了分布全球的气压观测网，目前已经积累了超过50亿次的智能手机气压观测数据.然而，观测传感器和基础数据存在误差必须进行质量控制，因而他们提出了一种偏差订正机器学习算法.首先，基于过去的实测气压数据和实时传感器资料训练的Gradient-boosting模型，可以分析智能手机的气压观测误差；其次，将观测气压减去分析的气压观测误差实现观测偏差订正，再使用多分辨率kriging插值，得到2018年覆盖美国大陆的逐5分钟、空间分辨率5 km、经偏差订正的气压观测（图2）.订正结果可与METAR观测资料以及快速更新同化（High-Resolution Rapid Refresh）模式资料进行比较验证.耶鲁大学^[32]研究发现NCEP/NCAR、MERRA-2和ERA5等3种全球辐射再分析数据集中，月平均入射长、短波辐射都不同程度存在低估，而散射辐射在不同模式中被低估和高估的现象同时存在.测试发现随机森林方法可明显改进这一误差.通过使用地面辐射基准网络（Baseline Surface Radiation Network，BSRN）的逐小时观测，构造一个经偏差订正的全球格点化的辐射数据集.一旦训练好后，这种随机森林算法可被用于任一格点数据的订正而不需要观测资料，这非常适用于全球资料分析. ...

A method for extracting postevent storm tracks

2

2015

... 与AI技术在其他领域的应用发展一样，天气预报中的AI应用也从计算机视觉技术应用起步.目前计算机视觉技术已在多普勒雷达图像智能识别和短临外推（一般为0~2小时）、卫星云图类型识别等方面广泛应用.日本九州大学的研究小组利用深度学习技术，开发了从全球云系统分辨率模型（Nonhydrostatic Icosahedral Atmospheric Model， NICAM）气候实验数据中识别热带低压的方法，特别是夏季西北太平洋热带低压发生一周前的征兆.美国NWS已大力着手基于云的天气预报应用，并已启动了内部研究和发展计划（Internal Research & Development Project，IP&D）提高天气预报能力.IP&D实现了针对灾害天气的实时数据挖掘，进而用于洪水预测.通过AI算法考虑过去已导致明显洪水灾害的区域，选出预报目标区，结合亚马逊网络云服务（Amazon Web Services，AWS），通过机器学习预测该目标区的洪灾可能性和严重程度，并通过AWS网页进行图形可视化调用.NWS还做了强风（阵风大于等于25.7 m/s)实时预报，使用AI技术预测未来不同距离(风暴单元周围0、5和10 km)和时间窗(未来0~15、15~30、30~45、45~60和60~90 min)内出现大风的概率.数据集由MYRORSS（The Multi-Year Reanalysis of Remotely Sensed Storms）质量控制的雷达图像、快速更新同化(Rapid Update Cycle，RUC)模型数据、1分钟气象机场报告(METARs;国家气候数据中心2006年)和NWS地区风暴报告等构成.MYRORSS的空间和时间分辨率分别为1 km和5 min,而RUC的分辨率为13 km和1 h.主要流程包括：首先，使用实时^[28]和事后^[33]方法对风暴细胞进行识别和跟踪.选取预测因子包括风暴运动(速度和方向)、风暴目标的形状参数(面积、方向和偏心)等；其次，通过对流允许模型(Convection Allowing Model，CAM)集成提供有关风暴强度、位置和演化的信息，并建立可预测冰雹发生概率和预测冰雹大小分布的机器学习模型.该模型已经在两个CAM集成系统上实时运行，并通过冰雹cast诊断^[34]和风暴替代变量(updraft helicity)^[35]进行验证.其中，观测的冰雹由美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration,NOAA)国家强风暴实验室(The National Severe Storms Laboratory,NSSL)多雷达多传感器^[36]给出的冰雹最大预期^[37]确定.预报和观测到的风暴根据空间和时间上的接近程度进行匹配，从每个预报风暴的范围内提取描述风暴和环境变量的统计信息，并将其输入到机器学习模型中.这种方法与Clark等^[38]通过干线（dryline）判断风暴的方法有异曲同工之妙.Google公司也将深度学习用于提供空间分辨率1 km、时间分辨率1~3 h的美国大陆雨雪预报.观测资料包括遥感和地面站，如GEO和LEO卫星，多普勒雷达、雨量站，地表和气候等信息.过去2 h的历史数据主要包括：

①

8张GOES-16卫星图像（15 min分辨率），

②

8张或更多的多普勒雷达图像（2 min分辨率），

③

1张IMERG/GPM LEO卫星云图（每3 h 1张），

④

PRISM（Parameter-elevation Regressions on Independent Slopes Model）气候资料（当月的30年气候平均），

⑤

地形高度.输出包括未来3 h雷达图像和/或雨量观测.与传统的深度学习方法相比，该方法考虑到卫星资料和雷达资料的观测时间差异，使用延时处理以使两者时间匹配.基于2018年和2019年数据的检验表明，该方法的3 h预报性能高于数值预报方法.另一个典型的实例是，ProbSevere公司利用多雷达多传感器(Multi-Radar/Multi-Sensor System，MRMS)的复合反射率(同时获得多个雷达的最大柱状反射率)实时识别和跟踪风暴^[36].该方法在识别时，使用了风暴附近环境以及风暴速度信息.训练标签是通过运行一个名为best track的事后风暴跟踪程序^[33].训练数据还对所有持续时间大于7 200 s的风暴进行了采样，产生了2 872 680个用于训练的样本. ...

... [33].训练数据还对所有持续时间大于7 200 s的风暴进行了采样，产生了2 872 680个用于训练的样本. ...

Forecasting hail using a one-dimensional hail growth model within WRF

1

2016

... 与AI技术在其他领域的应用发展一样，天气预报中的AI应用也从计算机视觉技术应用起步.目前计算机视觉技术已在多普勒雷达图像智能识别和短临外推（一般为0~2小时）、卫星云图类型识别等方面广泛应用.日本九州大学的研究小组利用深度学习技术，开发了从全球云系统分辨率模型（Nonhydrostatic Icosahedral Atmospheric Model， NICAM）气候实验数据中识别热带低压的方法，特别是夏季西北太平洋热带低压发生一周前的征兆.美国NWS已大力着手基于云的天气预报应用，并已启动了内部研究和发展计划（Internal Research & Development Project，IP&D）提高天气预报能力.IP&D实现了针对灾害天气的实时数据挖掘，进而用于洪水预测.通过AI算法考虑过去已导致明显洪水灾害的区域，选出预报目标区，结合亚马逊网络云服务（Amazon Web Services，AWS），通过机器学习预测该目标区的洪灾可能性和严重程度，并通过AWS网页进行图形可视化调用.NWS还做了强风（阵风大于等于25.7 m/s)实时预报，使用AI技术预测未来不同距离(风暴单元周围0、5和10 km)和时间窗(未来0~15、15~30、30~45、45~60和60~90 min)内出现大风的概率.数据集由MYRORSS（The Multi-Year Reanalysis of Remotely Sensed Storms）质量控制的雷达图像、快速更新同化(Rapid Update Cycle，RUC)模型数据、1分钟气象机场报告(METARs;国家气候数据中心2006年)和NWS地区风暴报告等构成.MYRORSS的空间和时间分辨率分别为1 km和5 min,而RUC的分辨率为13 km和1 h.主要流程包括：首先，使用实时^[28]和事后^[33]方法对风暴细胞进行识别和跟踪.选取预测因子包括风暴运动(速度和方向)、风暴目标的形状参数(面积、方向和偏心)等；其次，通过对流允许模型(Convection Allowing Model，CAM)集成提供有关风暴强度、位置和演化的信息，并建立可预测冰雹发生概率和预测冰雹大小分布的机器学习模型.该模型已经在两个CAM集成系统上实时运行，并通过冰雹cast诊断^[34]和风暴替代变量(updraft helicity)^[35]进行验证.其中，观测的冰雹由美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration,NOAA)国家强风暴实验室(The National Severe Storms Laboratory,NSSL)多雷达多传感器^[36]给出的冰雹最大预期^[37]确定.预报和观测到的风暴根据空间和时间上的接近程度进行匹配，从每个预报风暴的范围内提取描述风暴和环境变量的统计信息，并将其输入到机器学习模型中.这种方法与Clark等^[38]通过干线（dryline）判断风暴的方法有异曲同工之妙.Google公司也将深度学习用于提供空间分辨率1 km、时间分辨率1~3 h的美国大陆雨雪预报.观测资料包括遥感和地面站，如GEO和LEO卫星，多普勒雷达、雨量站，地表和气候等信息.过去2 h的历史数据主要包括：

①

8张GOES-16卫星图像（15 min分辨率），

②

8张或更多的多普勒雷达图像（2 min分辨率），

③

1张IMERG/GPM LEO卫星云图（每3 h 1张），

④

PRISM（Parameter-elevation Regressions on Independent Slopes Model）气候资料（当月的30年气候平均），

⑤

地形高度.输出包括未来3 h雷达图像和/或雨量观测.与传统的深度学习方法相比，该方法考虑到卫星资料和雷达资料的观测时间差异，使用延时处理以使两者时间匹配.基于2018年和2019年数据的检验表明，该方法的3 h预报性能高于数值预报方法.另一个典型的实例是，ProbSevere公司利用多雷达多传感器(Multi-Radar/Multi-Sensor System，MRMS)的复合反射率(同时获得多个雷达的最大柱状反射率)实时识别和跟踪风暴^[36].该方法在识别时，使用了风暴附近环境以及风暴速度信息.训练标签是通过运行一个名为best track的事后风暴跟踪程序^[33].训练数据还对所有持续时间大于7 200 s的风暴进行了采样，产生了2 872 680个用于训练的样本. ...

Severe weather prediction using storm surrogates from an Ensemble Forecasting System

1

2016

... 与AI技术在其他领域的应用发展一样，天气预报中的AI应用也从计算机视觉技术应用起步.目前计算机视觉技术已在多普勒雷达图像智能识别和短临外推（一般为0~2小时）、卫星云图类型识别等方面广泛应用.日本九州大学的研究小组利用深度学习技术，开发了从全球云系统分辨率模型（Nonhydrostatic Icosahedral Atmospheric Model， NICAM）气候实验数据中识别热带低压的方法，特别是夏季西北太平洋热带低压发生一周前的征兆.美国NWS已大力着手基于云的天气预报应用，并已启动了内部研究和发展计划（Internal Research & Development Project，IP&D）提高天气预报能力.IP&D实现了针对灾害天气的实时数据挖掘，进而用于洪水预测.通过AI算法考虑过去已导致明显洪水灾害的区域，选出预报目标区，结合亚马逊网络云服务（Amazon Web Services，AWS），通过机器学习预测该目标区的洪灾可能性和严重程度，并通过AWS网页进行图形可视化调用.NWS还做了强风（阵风大于等于25.7 m/s)实时预报，使用AI技术预测未来不同距离(风暴单元周围0、5和10 km)和时间窗(未来0~15、15~30、30~45、45~60和60~90 min)内出现大风的概率.数据集由MYRORSS（The Multi-Year Reanalysis of Remotely Sensed Storms）质量控制的雷达图像、快速更新同化(Rapid Update Cycle，RUC)模型数据、1分钟气象机场报告(METARs;国家气候数据中心2006年)和NWS地区风暴报告等构成.MYRORSS的空间和时间分辨率分别为1 km和5 min,而RUC的分辨率为13 km和1 h.主要流程包括：首先，使用实时^[28]和事后^[33]方法对风暴细胞进行识别和跟踪.选取预测因子包括风暴运动(速度和方向)、风暴目标的形状参数(面积、方向和偏心)等；其次，通过对流允许模型(Convection Allowing Model，CAM)集成提供有关风暴强度、位置和演化的信息，并建立可预测冰雹发生概率和预测冰雹大小分布的机器学习模型.该模型已经在两个CAM集成系统上实时运行，并通过冰雹cast诊断^[34]和风暴替代变量(updraft helicity)^[35]进行验证.其中，观测的冰雹由美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration,NOAA)国家强风暴实验室(The National Severe Storms Laboratory,NSSL)多雷达多传感器^[36]给出的冰雹最大预期^[37]确定.预报和观测到的风暴根据空间和时间上的接近程度进行匹配，从每个预报风暴的范围内提取描述风暴和环境变量的统计信息，并将其输入到机器学习模型中.这种方法与Clark等^[38]通过干线（dryline）判断风暴的方法有异曲同工之妙.Google公司也将深度学习用于提供空间分辨率1 km、时间分辨率1~3 h的美国大陆雨雪预报.观测资料包括遥感和地面站，如GEO和LEO卫星，多普勒雷达、雨量站，地表和气候等信息.过去2 h的历史数据主要包括：

①

8张GOES-16卫星图像（15 min分辨率），

②

8张或更多的多普勒雷达图像（2 min分辨率），

③

1张IMERG/GPM LEO卫星云图（每3 h 1张），

④

PRISM（Parameter-elevation Regressions on Independent Slopes Model）气候资料（当月的30年气候平均），

⑤

地形高度.输出包括未来3 h雷达图像和/或雨量观测.与传统的深度学习方法相比，该方法考虑到卫星资料和雷达资料的观测时间差异，使用延时处理以使两者时间匹配.基于2018年和2019年数据的检验表明，该方法的3 h预报性能高于数值预报方法.另一个典型的实例是，ProbSevere公司利用多雷达多传感器(Multi-Radar/Multi-Sensor System，MRMS)的复合反射率(同时获得多个雷达的最大柱状反射率)实时识别和跟踪风暴^[36].该方法在识别时，使用了风暴附近环境以及风暴速度信息.训练标签是通过运行一个名为best track的事后风暴跟踪程序^[33].训练数据还对所有持续时间大于7 200 s的风暴进行了采样，产生了2 872 680个用于训练的样本. ...

Multi-radar multi-sensor (mrms) severe weather and aviation products: Initial operating capabilities

2

2016

... 与AI技术在其他领域的应用发展一样，天气预报中的AI应用也从计算机视觉技术应用起步.目前计算机视觉技术已在多普勒雷达图像智能识别和短临外推（一般为0~2小时）、卫星云图类型识别等方面广泛应用.日本九州大学的研究小组利用深度学习技术，开发了从全球云系统分辨率模型（Nonhydrostatic Icosahedral Atmospheric Model， NICAM）气候实验数据中识别热带低压的方法，特别是夏季西北太平洋热带低压发生一周前的征兆.美国NWS已大力着手基于云的天气预报应用，并已启动了内部研究和发展计划（Internal Research & Development Project，IP&D）提高天气预报能力.IP&D实现了针对灾害天气的实时数据挖掘，进而用于洪水预测.通过AI算法考虑过去已导致明显洪水灾害的区域，选出预报目标区，结合亚马逊网络云服务（Amazon Web Services，AWS），通过机器学习预测该目标区的洪灾可能性和严重程度，并通过AWS网页进行图形可视化调用.NWS还做了强风（阵风大于等于25.7 m/s)实时预报，使用AI技术预测未来不同距离(风暴单元周围0、5和10 km)和时间窗(未来0~15、15~30、30~45、45~60和60~90 min)内出现大风的概率.数据集由MYRORSS（The Multi-Year Reanalysis of Remotely Sensed Storms）质量控制的雷达图像、快速更新同化(Rapid Update Cycle，RUC)模型数据、1分钟气象机场报告(METARs;国家气候数据中心2006年)和NWS地区风暴报告等构成.MYRORSS的空间和时间分辨率分别为1 km和5 min,而RUC的分辨率为13 km和1 h.主要流程包括：首先，使用实时^[28]和事后^[33]方法对风暴细胞进行识别和跟踪.选取预测因子包括风暴运动(速度和方向)、风暴目标的形状参数(面积、方向和偏心)等；其次，通过对流允许模型(Convection Allowing Model，CAM)集成提供有关风暴强度、位置和演化的信息，并建立可预测冰雹发生概率和预测冰雹大小分布的机器学习模型.该模型已经在两个CAM集成系统上实时运行，并通过冰雹cast诊断^[34]和风暴替代变量(updraft helicity)^[35]进行验证.其中，观测的冰雹由美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration,NOAA)国家强风暴实验室(The National Severe Storms Laboratory,NSSL)多雷达多传感器^[36]给出的冰雹最大预期^[37]确定.预报和观测到的风暴根据空间和时间上的接近程度进行匹配，从每个预报风暴的范围内提取描述风暴和环境变量的统计信息，并将其输入到机器学习模型中.这种方法与Clark等^[38]通过干线（dryline）判断风暴的方法有异曲同工之妙.Google公司也将深度学习用于提供空间分辨率1 km、时间分辨率1~3 h的美国大陆雨雪预报.观测资料包括遥感和地面站，如GEO和LEO卫星，多普勒雷达、雨量站，地表和气候等信息.过去2 h的历史数据主要包括：

①

8张GOES-16卫星图像（15 min分辨率），

②

8张或更多的多普勒雷达图像（2 min分辨率），

③

1张IMERG/GPM LEO卫星云图（每3 h 1张），

④

PRISM（Parameter-elevation Regressions on Independent Slopes Model）气候资料（当月的30年气候平均），

⑤

地形高度.输出包括未来3 h雷达图像和/或雨量观测.与传统的深度学习方法相比，该方法考虑到卫星资料和雷达资料的观测时间差异，使用延时处理以使两者时间匹配.基于2018年和2019年数据的检验表明，该方法的3 h预报性能高于数值预报方法.另一个典型的实例是，ProbSevere公司利用多雷达多传感器(Multi-Radar/Multi-Sensor System，MRMS)的复合反射率(同时获得多个雷达的最大柱状反射率)实时识别和跟踪风暴^[36].该方法在识别时，使用了风暴附近环境以及风暴速度信息.训练标签是通过运行一个名为best track的事后风暴跟踪程序^[33].训练数据还对所有持续时间大于7 200 s的风暴进行了采样，产生了2 872 680个用于训练的样本. ...

... [36].该方法在识别时，使用了风暴附近环境以及风暴速度信息.训练标签是通过运行一个名为best track的事后风暴跟踪程序^[33].训练数据还对所有持续时间大于7 200 s的风暴进行了采样，产生了2 872 680个用于训练的样本. ...

An enhanced hail detection algorithm for the WSR-88D

1

1998

... 与AI技术在其他领域的应用发展一样，天气预报中的AI应用也从计算机视觉技术应用起步.目前计算机视觉技术已在多普勒雷达图像智能识别和短临外推（一般为0~2小时）、卫星云图类型识别等方面广泛应用.日本九州大学的研究小组利用深度学习技术，开发了从全球云系统分辨率模型（Nonhydrostatic Icosahedral Atmospheric Model， NICAM）气候实验数据中识别热带低压的方法，特别是夏季西北太平洋热带低压发生一周前的征兆.美国NWS已大力着手基于云的天气预报应用，并已启动了内部研究和发展计划（Internal Research & Development Project，IP&D）提高天气预报能力.IP&D实现了针对灾害天气的实时数据挖掘，进而用于洪水预测.通过AI算法考虑过去已导致明显洪水灾害的区域，选出预报目标区，结合亚马逊网络云服务（Amazon Web Services，AWS），通过机器学习预测该目标区的洪灾可能性和严重程度，并通过AWS网页进行图形可视化调用.NWS还做了强风（阵风大于等于25.7 m/s)实时预报，使用AI技术预测未来不同距离(风暴单元周围0、5和10 km)和时间窗(未来0~15、15~30、30~45、45~60和60~90 min)内出现大风的概率.数据集由MYRORSS（The Multi-Year Reanalysis of Remotely Sensed Storms）质量控制的雷达图像、快速更新同化(Rapid Update Cycle，RUC)模型数据、1分钟气象机场报告(METARs;国家气候数据中心2006年)和NWS地区风暴报告等构成.MYRORSS的空间和时间分辨率分别为1 km和5 min,而RUC的分辨率为13 km和1 h.主要流程包括：首先，使用实时^[28]和事后^[33]方法对风暴细胞进行识别和跟踪.选取预测因子包括风暴运动(速度和方向)、风暴目标的形状参数(面积、方向和偏心)等；其次，通过对流允许模型(Convection Allowing Model，CAM)集成提供有关风暴强度、位置和演化的信息，并建立可预测冰雹发生概率和预测冰雹大小分布的机器学习模型.该模型已经在两个CAM集成系统上实时运行，并通过冰雹cast诊断^[34]和风暴替代变量(updraft helicity)^[35]进行验证.其中，观测的冰雹由美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration,NOAA)国家强风暴实验室(The National Severe Storms Laboratory,NSSL)多雷达多传感器^[36]给出的冰雹最大预期^[37]确定.预报和观测到的风暴根据空间和时间上的接近程度进行匹配，从每个预报风暴的范围内提取描述风暴和环境变量的统计信息，并将其输入到机器学习模型中.这种方法与Clark等^[38]通过干线（dryline）判断风暴的方法有异曲同工之妙.Google公司也将深度学习用于提供空间分辨率1 km、时间分辨率1~3 h的美国大陆雨雪预报.观测资料包括遥感和地面站，如GEO和LEO卫星，多普勒雷达、雨量站，地表和气候等信息.过去2 h的历史数据主要包括：

①

8张GOES-16卫星图像（15 min分辨率），

②

8张或更多的多普勒雷达图像（2 min分辨率），

③

1张IMERG/GPM LEO卫星云图（每3 h 1张），

④

PRISM（Parameter-elevation Regressions on Independent Slopes Model）气候资料（当月的30年气候平均），

⑤

地形高度.输出包括未来3 h雷达图像和/或雨量观测.与传统的深度学习方法相比，该方法考虑到卫星资料和雷达资料的观测时间差异，使用延时处理以使两者时间匹配.基于2018年和2019年数据的检验表明，该方法的3 h预报性能高于数值预报方法.另一个典型的实例是，ProbSevere公司利用多雷达多传感器(Multi-Radar/Multi-Sensor System，MRMS)的复合反射率(同时获得多个雷达的最大柱状反射率)实时识别和跟踪风暴^[36].该方法在识别时，使用了风暴附近环境以及风暴速度信息.训练标签是通过运行一个名为best track的事后风暴跟踪程序^[33].训练数据还对所有持续时间大于7 200 s的风暴进行了采样，产生了2 872 680个用于训练的样本. ...

An automated, multi-parameter dryline identification algorithm

1

2015

... 与AI技术在其他领域的应用发展一样，天气预报中的AI应用也从计算机视觉技术应用起步.目前计算机视觉技术已在多普勒雷达图像智能识别和短临外推（一般为0~2小时）、卫星云图类型识别等方面广泛应用.日本九州大学的研究小组利用深度学习技术，开发了从全球云系统分辨率模型（Nonhydrostatic Icosahedral Atmospheric Model， NICAM）气候实验数据中识别热带低压的方法，特别是夏季西北太平洋热带低压发生一周前的征兆.美国NWS已大力着手基于云的天气预报应用，并已启动了内部研究和发展计划（Internal Research & Development Project，IP&D）提高天气预报能力.IP&D实现了针对灾害天气的实时数据挖掘，进而用于洪水预测.通过AI算法考虑过去已导致明显洪水灾害的区域，选出预报目标区，结合亚马逊网络云服务（Amazon Web Services，AWS），通过机器学习预测该目标区的洪灾可能性和严重程度，并通过AWS网页进行图形可视化调用.NWS还做了强风（阵风大于等于25.7 m/s)实时预报，使用AI技术预测未来不同距离(风暴单元周围0、5和10 km)和时间窗(未来0~15、15~30、30~45、45~60和60~90 min)内出现大风的概率.数据集由MYRORSS（The Multi-Year Reanalysis of Remotely Sensed Storms）质量控制的雷达图像、快速更新同化(Rapid Update Cycle，RUC)模型数据、1分钟气象机场报告(METARs;国家气候数据中心2006年)和NWS地区风暴报告等构成.MYRORSS的空间和时间分辨率分别为1 km和5 min,而RUC的分辨率为13 km和1 h.主要流程包括：首先，使用实时^[28]和事后^[33]方法对风暴细胞进行识别和跟踪.选取预测因子包括风暴运动(速度和方向)、风暴目标的形状参数(面积、方向和偏心)等；其次，通过对流允许模型(Convection Allowing Model，CAM)集成提供有关风暴强度、位置和演化的信息，并建立可预测冰雹发生概率和预测冰雹大小分布的机器学习模型.该模型已经在两个CAM集成系统上实时运行，并通过冰雹cast诊断^[34]和风暴替代变量(updraft helicity)^[35]进行验证.其中，观测的冰雹由美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration,NOAA)国家强风暴实验室(The National Severe Storms Laboratory,NSSL)多雷达多传感器^[36]给出的冰雹最大预期^[37]确定.预报和观测到的风暴根据空间和时间上的接近程度进行匹配，从每个预报风暴的范围内提取描述风暴和环境变量的统计信息，并将其输入到机器学习模型中.这种方法与Clark等^[38]通过干线（dryline）判断风暴的方法有异曲同工之妙.Google公司也将深度学习用于提供空间分辨率1 km、时间分辨率1~3 h的美国大陆雨雪预报.观测资料包括遥感和地面站，如GEO和LEO卫星，多普勒雷达、雨量站，地表和气候等信息.过去2 h的历史数据主要包括：

①

8张GOES-16卫星图像（15 min分辨率），

②

8张或更多的多普勒雷达图像（2 min分辨率），

③

1张IMERG/GPM LEO卫星云图（每3 h 1张），

④

PRISM（Parameter-elevation Regressions on Independent Slopes Model）气候资料（当月的30年气候平均），

⑤

地形高度.输出包括未来3 h雷达图像和/或雨量观测.与传统的深度学习方法相比，该方法考虑到卫星资料和雷达资料的观测时间差异，使用延时处理以使两者时间匹配.基于2018年和2019年数据的检验表明，该方法的3 h预报性能高于数值预报方法.另一个典型的实例是，ProbSevere公司利用多雷达多传感器(Multi-Radar/Multi-Sensor System，MRMS)的复合反射率(同时获得多个雷达的最大柱状反射率)实时识别和跟踪风暴^[36].该方法在识别时，使用了风暴附近环境以及风暴速度信息.训练标签是通过运行一个名为best track的事后风暴跟踪程序^[33].训练数据还对所有持续时间大于7 200 s的风暴进行了采样，产生了2 872 680个用于训练的样本. ...

Research progress on physical parameterization schemes in numerical weather prediction models

2

2017

... 近年来，我国在AI天气预报领域也取得了显著进展.中央气象台通过深度卷积神经网络机器学习基于海量热带低压云图可以判别热带气旋的生成和发展，并采用时空记忆循环网络算法的雷达外推预报准确率较光流法等传统方法有大幅提升.以香港科技大学为代表的研发团队在全球率先提出了基于卷积神经网络进行短临预测的方法（Convolutional LSTM Network），主要思路是从输入的雷达数据中使用卷积神经网络（Convolutional Neural Networks, CNN）层做特征提取并结合LSTM来做序列预测.2017年该方法的提出者施行健博士又对这一模型框架进行了改进升级，在AI国际顶级会议NIPS上发表了TrajGRU模型，克服了CNN-LSTM模型的短板，通过学习时空递归连接结构，更好地刻画强对流系统迅速变化特征.这一方法一度成为国际AI天气预报领域的参照标杆（Benchmark）.近年来，上海中心气象台与复旦大学合作提出了基于深度序回归技术的数值模式订正机器学习算法和基于STAR技术的雷达外推短临预报技术^[39]，改进了数值模式降水空报现象、延长了雷达外推强降水预报的时效，相关方法在2019年“利奇马”台风、汛期强降水预报服务中发挥了重要作用.除此之外，一些国内高科技公司也开发了AI天气预报技术和APP，提供了丰富的智能化预报服务产品.气象部门与高科技公司也合作通过技术大赛（如“全球气象AI挑战赛”、“神气”、“观云识天”等）等方式也推动了AI技术在天气预报中的应用发展. ...

... (2)订正模式误差.假设无观测偏差，数值模式与观测的偏差可以认为是不完美的认知所导致的模式误差.传统的模式订正方法一般基于数值模式统计释用（Model Output Statistics，MOS）^[13]模型，即基于给定时间范围内的数值模式输出与观测^[44]之间的统计模型，通常使用线性回归.在更新数值模式后，在收集到足够样本的新模式预报数据后，必须通过MOS模型进行再训练.机器学习显然可以帮助识别和了解模式的误差，进而应用于MOS模型，对数值模式进行订正.图3给出了上海中心气象台基于AI模型订正数值模式预报的结果^[39]，这种订正可基于一种罚函数（cost function）的最小化来实现. ...

数值天气预报模式物理过程参数化方案的研究进展

2

2017

... 近年来，我国在AI天气预报领域也取得了显著进展.中央气象台通过深度卷积神经网络机器学习基于海量热带低压云图可以判别热带气旋的生成和发展，并采用时空记忆循环网络算法的雷达外推预报准确率较光流法等传统方法有大幅提升.以香港科技大学为代表的研发团队在全球率先提出了基于卷积神经网络进行短临预测的方法（Convolutional LSTM Network），主要思路是从输入的雷达数据中使用卷积神经网络（Convolutional Neural Networks, CNN）层做特征提取并结合LSTM来做序列预测.2017年该方法的提出者施行健博士又对这一模型框架进行了改进升级，在AI国际顶级会议NIPS上发表了TrajGRU模型，克服了CNN-LSTM模型的短板，通过学习时空递归连接结构，更好地刻画强对流系统迅速变化特征.这一方法一度成为国际AI天气预报领域的参照标杆（Benchmark）.近年来，上海中心气象台与复旦大学合作提出了基于深度序回归技术的数值模式订正机器学习算法和基于STAR技术的雷达外推短临预报技术^[39]，改进了数值模式降水空报现象、延长了雷达外推强降水预报的时效，相关方法在2019年“利奇马”台风、汛期强降水预报服务中发挥了重要作用.除此之外，一些国内高科技公司也开发了AI天气预报技术和APP，提供了丰富的智能化预报服务产品.气象部门与高科技公司也合作通过技术大赛（如“全球气象AI挑战赛”、“神气”、“观云识天”等）等方式也推动了AI技术在天气预报中的应用发展. ...

... (2)订正模式误差.假设无观测偏差，数值模式与观测的偏差可以认为是不完美的认知所导致的模式误差.传统的模式订正方法一般基于数值模式统计释用（Model Output Statistics，MOS）^[13]模型，即基于给定时间范围内的数值模式输出与观测^[44]之间的统计模型，通常使用线性回归.在更新数值模式后，在收集到足够样本的新模式预报数据后，必须通过MOS模型进行再训练.机器学习显然可以帮助识别和了解模式的误差，进而应用于MOS模型，对数值模式进行订正.图3给出了上海中心气象台基于AI模型订正数值模式预报的结果^[39]，这种订正可基于一种罚函数（cost function）的最小化来实现. ...

Improving the behavior of the cumulus parameterization for tropical cyclone prediction convection trigger

1

2009

... (1)改进模式物理表达.数值预报模式中的物理参数化^[40]可以应用AI进行改进，例如，可对影响对流触发的物理因子进行识别和改进对流参数化方案^[41]，针对模式分辨率的不同自适应调整网格尺度和次网格尺度过程所致降水的比例，以解决对流参数化的灰色区域（grey zone）网格问题；根据观测的边界层结构特点^[42]改进边界层高度参数化^[43]；甚至可以应用于水文参数化，从几千个流域中学习环境变量(例如降水和地表坡度)并得到水文参数(例如平均、最大和最小径流)等. ...

Research progress on major structures of tropical cyclone boundary layer

1

2013

... (1)改进模式物理表达.数值预报模式中的物理参数化^[40]可以应用AI进行改进，例如，可对影响对流触发的物理因子进行识别和改进对流参数化方案^[41]，针对模式分辨率的不同自适应调整网格尺度和次网格尺度过程所致降水的比例，以解决对流参数化的灰色区域（grey zone）网格问题；根据观测的边界层结构特点^[42]改进边界层高度参数化^[43]；甚至可以应用于水文参数化，从几千个流域中学习环境变量(例如降水和地表坡度)并得到水文参数(例如平均、最大和最小径流)等. ...

热带气旋边界层关键结构研究进展

1

2013

... (1)改进模式物理表达.数值预报模式中的物理参数化^[40]可以应用AI进行改进，例如，可对影响对流触发的物理因子进行识别和改进对流参数化方案^[41]，针对模式分辨率的不同自适应调整网格尺度和次网格尺度过程所致降水的比例，以解决对流参数化的灰色区域（grey zone）网格问题；根据观测的边界层结构特点^[42]改进边界层高度参数化^[43]；甚至可以应用于水文参数化，从几千个流域中学习环境变量(例如降水和地表坡度)并得到水文参数(例如平均、最大和最小径流)等. ...

Parametrization of planetary boundary-layer height with helicity and verification with tropical cyclone prediction

1

2016

... (1)改进模式物理表达.数值预报模式中的物理参数化^[40]可以应用AI进行改进，例如，可对影响对流触发的物理因子进行识别和改进对流参数化方案^[41]，针对模式分辨率的不同自适应调整网格尺度和次网格尺度过程所致降水的比例，以解决对流参数化的灰色区域（grey zone）网格问题；根据观测的边界层结构特点^[42]改进边界层高度参数化^[43]；甚至可以应用于水文参数化，从几千个流域中学习环境变量(例如降水和地表坡度)并得到水文参数(例如平均、最大和最小径流)等. ...

The use of model output statistics (mos) in objective weather forecasting

1

1972

... (1)改进模式物理表达.数值预报模式中的物理参数化^[40]可以应用AI进行改进，例如，可对影响对流触发的物理因子进行识别和改进对流参数化方案^[41]，针对模式分辨率的不同自适应调整网格尺度和次网格尺度过程所致降水的比例，以解决对流参数化的灰色区域（grey zone）网格问题；根据观测的边界层结构特点^[42]改进边界层高度参数化^[43]；甚至可以应用于水文参数化，从几千个流域中学习环境变量(例如降水和地表坡度)并得到水文参数(例如平均、最大和最小径流)等. ...

The 100th American Meteorological Society Annual Meeting

1

2020

... (2)订正模式误差.假设无观测偏差，数值模式与观测的偏差可以认为是不完美的认知所导致的模式误差.传统的模式订正方法一般基于数值模式统计释用（Model Output Statistics，MOS）^[13]模型，即基于给定时间范围内的数值模式输出与观测^[44]之间的统计模型，通常使用线性回归.在更新数值模式后，在收集到足够样本的新模式预报数据后，必须通过MOS模型进行再训练.机器学习显然可以帮助识别和了解模式的误差，进而应用于MOS模型，对数值模式进行订正.图3给出了上海中心气象台基于AI模型订正数值模式预报的结果^[39]，这种订正可基于一种罚函数（cost function）的最小化来实现. ...