基于GIS和Logistic回归模型的洪涝灾害区划研究
Study on Flood Hazard Risk Zoning Based on GIS and Logistic Regression Model
通讯作者: 邓红卫(1969-),男,湖南岳阳人,教授,主要从事金属矿山开采、矿山安全、水资源利用与灾害防治研究.E-mail:denghw208@126.com
收稿日期: 2020-08-04 修回日期: 2020-09-18 网络出版日期: 2020-11-30
基金资助: |
|
Corresponding authors: Deng Hongwei (1969-), male, Yueyang City, Hu'nan Province, Professor. Research areas include metal mining, mine safety, water resource utilization and disaster prevention. E-mail:denghw208@126.com
Received: 2020-08-04 Revised: 2020-09-18 Online: 2020-11-30
作者简介 About authors
王鹏(1995-),男,湖北恩施人,硕士研究生,主要从事水资源承载力与水害防治研究.E-mail:1170310531@qq.com
洪涝灾害危险性区划对于洪涝灾害的控制和预防具有重要的意义。以汉江湖北河段沿线为例,在构建洪涝灾害危险性评价指标体系基础上,利用ArcGIS将各项评价指标进行归一化处理,建立研究区的格网并与历史灾害点相连接,得到每个网格内各项评价指标的数据和相应的灾害发生情况。然后,根据二元Logistic回归原理,利用SPSS进行二元逻辑回归分析,从而得出各评价指标与洪涝发生情况的关联性。在此基础上,应用Logistic回归模型确定的危险性概率计算方法,在ArcGIS中绘制研究区的洪涝灾害危险性区划图。将洪涝灾害危险性划分为高危险区、较高危险区、中等危险区、较低危险区和低危险区5个等级,各风险区面积占比依次为8.3%、12.5%、20.6%、19.2%和39.4%。
关键词:
The flood hazard risk zonation is of great importance to the control and prevention of flood disaster. Taking the catchment area along Han River in Hubei Province as an example, based on the flood hazard risk evaluation index system, ArcGIS was used to normalize each evaluation index. The grid of the research area connected with the historical flood disaster point was accordingly established in order to obtain the statistics of each evaluation index and the corresponding disaster occurrences in each grid. Afterwards, according to the binary Logistic regression principle, SPSS was used for binary logistic regression analysis, so as to obtain the correlation between each evaluation index and the occurrence of flood disaster. On the basis of the above, the risk probability calculation method of Logistic regression model was applied to draw the flood hazard zoning map of the study area in ArcGIS. The results showed that flood hazard risk in the study area coexisted with the two aggregation modes of high and low value. And flood hazard risk was divided into five levels: The highest, higher, moderate, lower and the lowest regions. The area proportion of each risk region was 8.3%, 12.5%, 20.6%, 19.2% and 39.4%, respectively.
Keywords:
本文引用格式
王鹏, 邓红卫.
Wang Peng, Deng Hongwei.
1 引 言
实际上,国内外对于洪涝灾害的研究一直都是热点问题。通过众多学者的探索,在洪涝灾害风险评估[3,6,7]、洪涝灾害过程模拟[6,8,9]以及洪涝灾害预测预警[10~13]方面已取得显著的研究成果。一些研究采用水文和水动力模型[14~16]来识别和评估易受洪水影响的区域,但这种基于线性假设的方法在洪水事件的区域差异研究中仍然存在一定的局限性[17]。随着遥感和地理信息技术的发展,近些年,基于GIS的空间分析与层次分析法(Analytic Hierarchy Process)、主成分分析、模糊逻辑和专家打分等统计方法相结合的多目标指标评价方法已广泛应用于洪水灾害研究,这对于洪水灾害制图具有重要意义[18~21]。传统的层次分析法和专家打分等方法的主要不足在于需要依赖专家主观经验来分配权重,而且多目标指标评价方法评价指标的选取会受数据限制出现“以点代面”的现象,也不适合在尺度较小的区域开展[22]。
汉江是长江的最大支流,因其特殊的自然条件和地理环境,加之沿岸城市和人口大规模聚集,导致汉江流域也成为洪涝频发地区。据不完全统计[2,23,24],清后期至今,仅汉江上游就发生洪涝灾害59次,并造成了严重的经济损失,虽然采用兴修水利等防洪工程措施[25]很好地控制了汉江流域洪涝灾害的发生,但随着社会经济的发展和人类工程活动的加剧,该地区洪涝灾害发生的可能性依然存在,因此开展汉江沿线地区洪涝灾害区划研究具有重要的现实意义。本文以该地区为研究背景,充分调查了该区域历史洪涝灾害点,此外,考虑到洪灾的发生情况为典型的二分类变量,建立了洪灾发生的Logistic回归分析模型,并借助GIS技术完成了研究区域的洪涝灾害危险性区划制图。研究成果将为该地区洪涝灾害监测、预警和管理提供技术支撑,也为洪涝灾害频繁的其他地区开展防洪减灾提供参考。
2 研究区域概况
汉江流经陕西和湖北两省,河长1 577 km,流域面积15.9万km2。干流丹江口以上为上游,丹江口—钟祥为中游,钟祥以下为下游。本研究主要以汉江在湖北省境内的河段为研究区域(图1),经纬度范围为109°26′~114°36′E,30°3′~33°16′N。沿线流经湖北14个县市,沿汉江流向依次为郧西县、郧县、丹江口市、老河口市、谷城县、襄阳市、宜城市、钟祥市、沙洋县、天门市、潜江市、仙桃市、汉川市和武汉市等,总面积为38 315.96 km2,占汉江流域总面积的24.01%。汉江湖北段沿线区域属亚热带季风气候,气候温和湿润,年平均降水量873 mm,水量较丰沛,但年内分配不均,5~10月径流量占全年的75%左右。
图1
图1
汉江在湖北省境内河段的示意图
Fig.1
Map showing the study area of the Han River in Hubei Province
3 指标体系构建与数据处理
3.1 指标体系构建
图2
3.2 数据来源
本研究采用的数据包括:
3.3 数据处理
根据3.1中建立的评价指标体系,对各个评价指标进行预处理,各评价指标的获取及处理方法如下:
(1) 灾害点密度
灾害点密度是指单位面积内洪涝灾害的数量。基于研究区域的DEM数据,利用ArcGIS水文分析模块进行流域划分,然后利用分区统计功能得到各流域单元内的灾害数量,计算出各流域范围内的灾害密度。具体的操作流程如下:原始DEM→填洼→流向分析→流量分析→河网生成→积水流域生成→矢量化积水流域面+灾害点分布图→灾害点密度图(图3a)。
图3
图3
洪涝灾害危险性评价因子分布图
Fig.3
Distribution map of risk assessment factors of flood disaster
(2) 汛期降水量
汛期内强降水是造成洪涝灾害的主要致灾因子,利用研究区及周围共28个气象站点1981—2010年的汛期(7~8月)月平均降水量数据,在ArcGIS中利用Spatial Analyst—插值工具,采用克里金插值法进行插值分析得到研究区域的汛期降水量分布图(图3b)。
(3) 地形起伏度
洪涝灾害的发生与地形有紧密的关系,一般来说,地形起伏越大,洪涝灾害发生的可能性越小;地形起伏越小,洪涝灾害发生的可能性越大。本研究选择用地形起伏度来表达地形对洪涝灾害危险性的影响程度,具体的提取方法如下:以研究区域的原始DEM数据为底图,采用Spatial Analyst工具—邻域分析—块统计功能,设置邻域类型为7×7的矩形邻域,分别计算出邻域内的最大值和最小值,将前面得到的2份统计数据相减即得到研究区域地形起伏度图(图3c)。
(4) 植被覆盖类型
(5) 距河流距离
在洪涝灾害的危险性区划中,需要考虑受洪涝威胁的河流缓冲区,以此表征河流水系对洪涝灾害发生的影响程度。利用研究区的实际河网,以长江以及汉江干流的集水域边界为第一缓冲区,依次建立500、1 000、1 500、2 000和2 500 m的缓冲区;以北河、南河、小清河等其他支流所组成的集水域边界为第二缓冲区,依次建立100、500、1 000、1 500和2 000 m的缓冲区。将上述建立的缓冲区与研究区的面文件联合,得到相应的河流缓冲图(图3e)。距离河流越近,洪涝灾害发生的危险性越大,为了将这种影响程度量化,本研究中对建立的缓冲区按照表1进行赋值(赋值范围[0,1]),从而得到水系缓冲归一化指标。
表1 水系缓冲赋值标准
Table 1
支流缓冲/m 干流缓冲/m | <500 | 500~1 000 | 1 000~1 500 | 1 500~2 000 | 2 000~2 500 | >2 500 |
---|---|---|---|---|---|---|
<100 | 1 | 1.0 | 1.0 | 1.0 | 1.0 | 1.0 |
100~500 | 1 | 0.8 | 0.8 | 0.8 | 0.8 | 0.8 |
500~1 000 | 1 | 0.8 | 0.6 | 0.6 | 0.6 | 0.6 |
1 000~1 500 | 1 | 0.8 | 0.6 | 0.4 | 0.4 | 0.4 |
1 500~2 000 | 1 | 0.8 | 0.6 | 0.4 | 0.2 | 0.2 |
>2 000 | 1 | 0.8 | 0.6 | 0.4 | 0.2 | 0 |
(6) 河网密度
河网密度即为单位面积内河道的总长度。研究发现,河网密度从一定程度上反映了一个地区的降雨量和下垫面条件,而后者对洪涝危险性有较大影响。因此,河网密度可以间接反映洪涝灾害危险性的相对大小,即河网密度高的地方遭遇洪涝的可能性较大。河网密度的计算步骤如下:根据研究区的DEM数据,利用ArcGIS的水文分析模块进行填洼—流向—流量—栅格河网矢量化分析,并计算出矢量化河网的河流长度,然后利用线密度分析工具计算出单位面积内的河网密度图(图3f)。
由于各评价指标数据类型和单位不同,无法对同一目标进行综合评价,这就需要对各评价指标进行归一化处理,转化为无量纲的相对数。本研究采用极差标准化方法进行归一化处理,计算公式如下:
式中:Xi表示各个评价指标的值,Xmax和Xmin分别表示各评价指标的最大值和最小值。
将各评价指标栅格图层加入ArcGIS中,根据
4 洪涝灾害危险性区划
4.1 Logistic回归模型建立
Logistic回归模型,是指因变量为二分类变量的回归分析。在洪涝灾害的危险性评价中,可将各评价指标数据作为自变量,而灾害发生与否可用0(灾害不发生)和1(灾害发生)去表征,是典型的二分类变量[29]。由于因变量的不连续,线性回归将不适用于推导此类自变量和因变量的关系,在此情况下,本研究选用Logistic回归模型解决此问题,其表达式为:
式中:P(y=1|x1,…,xi)为事件发生的概率;xi为自变量;
这里洪涝灾害发生的概率表示洪涝灾害发生的可能性大小,用
4.2 二元Logistic回归分析
根据上述思想,本研究Logistic回归模型的因变量是洪涝灾害的发生情况。在ArcGIS中,利用鱼网工具创建1 km×1 km的网格覆盖整个研究区,经剪裁后共均匀生成39 604个网格,将该网格与历史灾害点进行空间联接,从而得到每个网格内的灾害发生情况,然后分别将各评价指标的归一化结果按照建立的网格进行分区统计,将统计结果以表格形式导出,最后整理得到每个网格内6个自变量和对应因变量组成的样本数据集。由于边界网格经剪裁后不完整,剔除边界网格的无效数据后,剩下36 909组数据作为预分析样本。由于Logistic回归模型采用的是最大似然估计参数法,为了保证分析的准确性,样本规模需要大于100,但是样本数据过大又会使得任何多元相关都呈现出统计显著[26]。因此,本研究采取随机抽样的方法抽取5 000组作为分析样本。
本研究采用SPSS数据分析软件进行Logistic回归分析,在SPSS中随机选取5 000组自变量和因变量数据集,使用SPSS分析模块的Logistic回归分析工具,采用逐步回归法进行分析,所得结果如表2所列。
表2 Logistic回归分析结果输出表
Table 2
指标 | B | S.E. | Wald | df | 显著性 | Exp(B) | 95% EXP(B) 置信区间 | |
---|---|---|---|---|---|---|---|---|
下限 | 上限 | |||||||
灾害点密度x1 | 4.507 | 2.836 | 2.437 | 1 | 0.000 | 9.065 | 3.022 | 17.926 |
汛期降水量x2 | 3.599 | 1.667 | 0.920 | 1 | 0.037 | 0.202 | 0.008 | 5.301 |
地形起伏度x3 | -1.349 | 8.144 | 0.167 | 1 | 0.000 | 0.035 | 0.010 | 0.504 |
植被覆盖类型x4 | -2.743 | 0.856 | 19.126 | 1 | 0.000 | 0.024 | 0.004 | 0.127 |
河网密度x5 | 0.152 | 0.316 | 0.233 | 1 | 0.048 | 1.165 | 0.627 | 2.162 |
距河流距离x6 | 2.064 | 0.203 | 103.218 | 1 | 0.000 | 6.825 | 5.288 | 7.874 |
常数 | -3.243 | 0.212 | 234.046 | 1 | 0.000 | 0.039 | - | - |
根据分析结果可知,模型的x2值为576.759,P值近似于0,表明所选择的模型具有显著的统计学意义。根据各指标逻辑回归系数,地形起伏度和植被覆盖类型的回归系数均为负,表明地形起伏越小、植被覆盖度越低,洪涝灾害发生的危险性越高;另外,由于造成研究区洪涝灾害的主要因素是汛期的强降水,因此汛期降水量对洪涝灾害发生的影响程度应较为明显,而由表2可知,年汛期降水量指标的逻辑回归系数达到3.599,表明了这一模拟结果与实际情况相符。
表3 ROC分析曲线输出表
Table 3
区域面积 | 标准误差 | 渐进显著性 | 置信度95%的置信区间 | |
---|---|---|---|---|
下限 | 上限 | |||
0.885 | 0.020 | 0.000 | 0.846 | 0.924 |
图4
4.3 洪涝灾害综合危险性区划
结合
图5
4.4 洪涝灾害危险性分析
通过将灾害点分布图与危险性区划图相连接,利用空间统计工具可以得到各危险性分区面积、各危险性分区内灾害点数量以及分区内灾害点密度,相应的统计结果如表4所列。
表4 研究区洪水灾害危险性区划
Table 4
危险区 | 洪涝灾害危险性概率/% | 分区面积/km2 | 分区面积百分比/% | 洪灾数量/次 | 分区洪灾数量 百分比/% | 分区灾害点 密度/(次/100 km2) |
---|---|---|---|---|---|---|
高危险区 | 65.1~99.3 | 3 150.5 | 8.3 | 86 | 49.4 | 2.73 |
较高危险区 | 45.6~65.1 | 4 768.6 | 12.5 | 28 | 16.1 | 0.59 |
中等危险区 | 29.4~45.6 | 7 843.5 | 20.6 | 26 | 14.9 | 0.33 |
较低危险区 | 15.1~29.4 | 7 328.9 | 19.2 | 21 | 12.1 | 0.29 |
低危险区 | 3.4~15.1 | 15 076.1 | 39.4 | 13 | 7.5 | 0.09 |
将区划结果与研究区县级行政区划边界相叠加,采用分析工具—提取—分割可以统计出每个县市各洪灾风险等级所占面积,统计结果如表5所列。
表5 县市内各洪灾风险区面积百分比 (%)
Table 5
县市 | 高风 险区 | 较高 风险区 | 中等 风险区 | 较低 风险区 | 低风 险区 | 县市 | 高风 险区 | 较高 风险区 | 中等 风险区 | 较低 风险区 | 低风 险区 |
---|---|---|---|---|---|---|---|---|---|---|---|
郧西县 | 0.07 | 1.69 | 4.08 | 15.33 | 78.84 | 钟祥市 | 7.97 | 7.77 | 14.11 | 41.33 | 28.82 |
郧县 | 1.24 | 6.20 | 5.57 | 9.41 | 77.58 | 沙洋县 | 9.59 | 8.79 | 28.75 | 42.40 | 10.47 |
丹江口 | 0 | 0.07 | 14.82 | 11.75 | 66.56 | 天门市 | 11.42 | 12.63 | 40.54 | 35.21 | 0.19 |
老河口 | 1.84 | 5.03 | 9.67 | 21.95 | 61.50 | 潜江市 | 10.63 | 31.32 | 50.46 | 7.58 | 0 |
谷城县 | 3.68 | 7.79 | 8.12 | 18.80 | 61.60 | 仙桃市 | 15.53 | 44.22 | 38.17 | 2.08 | 0 |
襄阳市 | 1.57 | 5.97 | 7.46 | 23.54 | 61.47 | 汉川市 | 19.99 | 19.84 | 52.56 | 7.61 | 0 |
宜城市 | 4.25 | 7.13 | 7.76 | 16.10 | 64.76 | 武汉市 | 35.09 | 24.15 | 38.90 | 1.86 | 0 |
5 结 论
以汉江在湖北境内河段段为研究背景,构建了洪涝灾害危险性评价指标体系。在ArcGIS中进行网格划分并统计网格内各评价因子以及实际灾害发生情况,从而建立了Logistic回归模型。根据Logistic的回归分析结果和相应危险性概率计算方法,在ArcGIS中计算得到研究区的整体洪灾危险性,将危险性划分成5个等级,绘制出研究区的洪涝灾害危险性区划图。结论如下:
(1) 灾害点密度、汛期降水量、地形起伏度、植被覆盖类型、河网密度和距河流距离在95%的置信区间上显著,对洪水的发生影响很大,且各个指标的逻辑回归系数分别为4.507、3.599、-1.349、 -2.743、0.152和2.064。
(2) 利用ROC曲线分析,ROC曲线下方与坐标轴所围面积(AUC)达到0.885,说明洪涝灾害发生情况与所选取的评价指标具有不错的相关性,即二元逻辑回归模型用于洪涝灾害危险性评价可行。
(3) 分析区划结果可以得到,高危险区和较高危险区包含了65.5%的洪涝灾害点,表明区划结果与实际情况相符,可为该地区洪涝灾害控制和预防提供理论指导。
(4) 论文在采用Logistic回归分析时,仅随机选取了5 000组数据作为分析样本,导致回归方程与实际方程的拟合精度略有差异,在今后的研究中,可以多次选取样本进行反复回归分析弥补这一不足;此外,由于当前对于洪涝灾害危险性评价指标的选取尚未取得一致共识,本研究仅基于以前的相关研究和研究区的实际情况选取了部分评价指标,同时,也未进一步考虑各评价因子间的相关性,后续可针对各评价因子对洪涝灾害的影响做更加深入的综合分析。
参考文献
Advances in the study of climate change impacts on flood disaster
[J]. ,
气候变化对洪水灾害影响研究进展
[J].,
The rain-storm flood disasters in the upper reaches of the Hanjiang River in Shaanxi Province since the late Qing Dynasty
[J]. ,
清末以来陕西省汉江上游暴雨洪水灾害研究
[J]. ,
Flood risk assessment and regionalization from past and future perspectives at basin scale
[J]. ,
China's urbanization and its ecological environment challenges in the 21st century
[J]. ,
21世纪中国的城市化特点及其生态环境挑战
[J].,
Wang Qiang. Flood risk assessment model for urban cultural heritage: A case study of Guangzhou City
[J]. ,
城市文化遗产洪涝灾害风险评估模型构建——以广州市为例
[J].,
Scenario simulation and risk assessment of urban flood in Donghaochong basin,Guangzhou
[J]. ,
广州东濠涌流域城市洪涝灾害情景模拟与风险评估
[J]. ,
Risk assessment of rainstorm and flood disasters based on the hazard grades/indices in Qinghai Province
[J]. ,
基于风险度的青海省暴雨洪涝灾害风险评估
[J]. ,
Data Driven Rainstorm and Flood Disaster Process Simulation Method
[D].
数据驱动的暴雨洪涝灾害过程模拟方法
[D].
Simulation and assessment of flood disasters
[J]. ,
洪水灾害模拟及评估
[J]. ,
Hazard assessment and early warning research on flood disasters in China based on weather forecast data
[J]. ,
基于气象预测数据的中国洪涝灾害危险性评估与预警研究
[J]. ,
Study on flood disaster loss prediction based on Gaussian Process Regression Model: A case study of Chongqing City
[J]. ,
基于高斯过程回归模型的洪涝灾害损失预测研究——以重庆市为例
[J].,
A three-parameter flood damage function,part Ⅱ—Case study
[J]. ,
洪涝灾害三参数损失函数的构建Ⅱ——实例研究
[J].,
Grey prediction of flood disaster in Hunan based on Markov Chain Correction
[J]. ,
基于马尔科夫过程修正的湖南洪涝灾变灰预测研究
[J].,
Automated processing for flood area detection using ALOS-2 and hydrodynamic simulation data
[J]. ,
Assessment of hydrology, sediment and particulate organic carbon yield in a large agricultural catchment using the SWAT model
[J]. ,
Scenario-based projections of future urban inundation within a coupled hydrodynamic model framework: A case study in Dongguan City, China
[J]. ,
A comparison of frequency ratio and fuzzy logic models for food susceptibility assessment of the lower Kosi River Basin in India
[J]. ,
Spatial appraisal of flood risk assessment and evaluation using integrated hydro-probabilistic approach in Panjkora River Basin, Pakistan
[J]. ,
GIS-based risk evaluation for flood disaster in Hubei Province
[J]. ,
基于GIS的湖北省洪水灾害危险性评价
[J]. ,
Flood risk assessment based on hydrodynamic model and fuzzy comprehensive evaluation with GIS technique
[J]. ,
Risk of zoning flood disaster along Xiangjiang River in Hunan Province
[J]. ,
湘江湖南段洪水灾害综合风险区划
[J]. ,
Progress on disaster mechanism and risk assessment of urban flood/waterlogging disasters in China
[J]. ,
中国城市洪涝致灾机理与风险评估研究进展
[J].,
The palaeoflood events recorded by slackwater deposits in sedimentary profiles during the Eastern Han Dynasty in the upper reaches of the Hanjiang River
[J]. ,
汉江上游沉积记录的东汉时期古洪水事件考证研究
[J]. ,
Study on historical flood disasters and climate change in the upper reaches of the Hanjiang River
[J]. ,
陕南汉江上游历史洪水灾害与气候变化
[J]. ,
Flood risk map system in medium and small basins in China
[J]. ,
GIS支持下中小流域洪水风险图系统研究
[J]. ,
Study on Geological Hazards Risk Zoning Based on GIS and Logistic Model
[D].
基于GIS和Logistic模型的地质灾害危险性区划研究
[D].
On the flood hazard evaluation in Guangzhou
[J]. ,
广州洪灾风险评价研究
[J]. ,
Flood hazard assessment in pakistan at grid scale
[J]. ,
基于格网的洪水灾害危险性评价分析——以巴基斯坦为例
[J]. ,
Information and Logistic Regression Models based coupling analysis for susceptibility of geological hazards
[J]. ,
基于信息量模型与Logistic回归模型耦合的地质灾害易发性评价
[J]. ,
/
〈 | 〉 |