北山地区金窝子金矿床成矿系统分析
Anlysis of metallogenic system in Jinwozi gold deposit, Beishan
-
摘要: 金窝子金矿床产于华力西期黑云母二长花岗岩及其围岩上泥盆统金窝子组中,矿化类型为石英脉型和蚀变岩型。研究表明华力西期—印支期花岗岩系统和低角度韧脆性断裂及其次级高角度张性-张扭性断裂系统与成矿有密切的时空及物质联系,是金矿化的主控因素;矿化类型受构造应力场和断裂力学性质控制。Abstract: The Jinwozi gold deposit occurred in Hercynian biotite adamellite and Jingwozi Formation (Upper Devonian).Its mineralization type is the quartz-vein one and the altered-rock one.This study reveals that a granitic magma system,and low-angle ductile-brittle fault and high-angle extension-tension shear second order fault system closely a ssociated with the minerlization in terms of space,time and materials,accounts for the gold minerlizaion.The minerlization types are controlled both by the tectonic stress field and the fracture mechanic property.
-
Keywords:
- Jinwozi gold deposit /
- metallogenic system /
- Beishan
-
滑坡是中国最重要的自然灾害之一,每年都会造成一定的人员伤亡和经济损失(Froude et al., 2018;郭子正等,2018;黄煜等,2023)。滑坡易发性分析能够提供有关滑坡空间分布的有用信息,通常被选为滑坡风险评估的初始步骤。合理准确的滑坡易发性图能够帮助政府决策部门有效开展防灾减灾工作。因此,如何生成准确可靠的滑坡易发性图已成为现阶段的研究热点(郭子正等,2019a;张林梵,2023;林明明等,2024)。
滑坡易发性评价方法大致可分为3类,包括专家经验模型、基于物理的(或确定性)模型和数据驱动模型(许冲等,2010;Goetz et al., 2011;Huang et al., 2017;Reichenbach et al., 2018;郭子正等,2019b)。专家经验模型通常属于定性方法,主要依赖于专家经验来描述滑坡灾害(Sezer et al., 2017)。基于物理的模型将边坡破坏机制和岩土参数相结合,通常以无限斜坡模型为基础(He et al., 2021)。常见的基于物理的模型包括TRIGRS(李婧等,2022)、Scoops3D (He et al., 2021)、SINMAP (武利,2012)等。然而,在大范围内确定岩土体准确的物理力学性质是一个挑战,通常具有很高的不确定性。相比之下,数据驱动模型通过深入分析历史滑坡与环境变量之间的统计或非线性关系来模拟未来滑坡发生的可能性,通常比其他模型具有更高的预测能力和客观性(Zêzere et al., 2017)。
受益于GIS和遥感技术的快速发展,数据驱动模型能够考虑各种类型的环境因子,包括地形地貌、水文和地质因素等。然而,对于一个区域特定的滑坡数据库,环境因子的最佳组合仍然是一个悬而未决的问题。一方面,研究者试图在分析中考虑更多因素,以包含更多有用的信息;另一方面,必须在模型的复杂度和性能中找到平衡,因为更多的因素虽然可能获得较高的模型精度,但模型效率会随之降低。此外,很少有研究讨论因素的地貌意义或解释单个因素在边坡稳定性中的相关性(Segoni et al., 2020),且滑坡环境因子的条件独立性也没有被广泛考虑(Pereira et al., 2012)。而考虑因素的相关性和独立性对于数据驱动模型的质量非常重要。目前已经提出了一些方法来研究滑坡易发性建模过程中的因子贡献程度,例如主成分分析、信息增益比、前向消除和多重共线性技术(张俊等,2016;Binh Thai et al., 2019;Nsengiyumva et al., 2020;Tang et al., 2020)。笔者采用Pearson相关系数计算因子间的独立性,并考虑采用C5.0决策树法评价因子重要性。
前人研究比较了不同数据驱动模型的性能,包括双变量、多变量和机器学习技术(Kouli et al., 2014;Bueechi et al., 2019;黄发明等,2020;王本栋等,2024)。大多数比较结果表明,多变量技术优于双变量技术(Rossi et al., 2010),而机器学习算法则优于两者(黄发明等,2021;李泽芝等,2024;林琴等,2024)。但它们都缺乏因素独立性的考虑和重要性的比较。对于滑坡多发地区,比较模型性能是必要的,因其有助于当地的土地利用规划并减小滑坡风险。因此,笔者以黄河流域中游为研究区,使用3种不同数据驱动方法(WIV、SVM、RF)进行滑坡易发性评价并对比分析模型性能,希望能够生成更加准确可靠的区域滑坡易发性图。
1. 研究区概况及数据准备
1.1 研究区概况
研究区(图1)位于E 110°30′0″~110°0′0″,N 37°10′0″~37°40′0″,横跨陕西和山西两省。总面积约为
1661 km2,长约62 km,包括7个县。海拔从590 m到1500 m不等,中部海拔较低,因为黄河从中流过。从地质上看,区内主要地质构造为王家汇背斜,方向为NW 30°。岩性单元包括寒武系至第四系的地层,主要露头沉积物为黄土和砂岩和泥岩夹层。气候为温带干旱气候,多年平均降水量为460 mm。降雨时空变化明显:雨季一般从7月到9月,占年降雨量的近70%,且南部地区的降雨量比北部地区多。区内最具代表性的地貌单元是黄土高原,是中国典型的滑坡多发地区之一(Zhang et al., 2010)。受当地环境影响,植被覆盖范围小,坡体水土保持能力较弱(Guo et al., 2020)。在这样的地质条件下,研究区近年来发生了多起山体滑坡,造成了相当大的损失。但目前还没有关于该地区利用数据驱动技术进行滑坡易发性预测及制图的比较研究,因此是开展此类研究的合适区域。
1.2 滑坡数据库
准确的滑坡数据库对区域易发性评估结果至关重要,因为它能够提供滑坡的基本特征,例如位置、面积、体积等(Fell et al., 2008)。此外,这是验证结果的重要依据,因为研究者需要将实际的历史滑坡点与预测结果进行比较(Huang et al., 2021)。本研究通过遥感图像和野外实地调查相结合的方式确定滑坡位置。卫星图像包括LandsatTM8和谷歌地球图像。野外调查由中国地质调查局西安地质调查中心于2018年进行。每一个滑坡位置坐标都由便携式GPS记录下来,并重新投影到地图上,详细信息则是根据滑坡报告确定的。然后将滑坡特征存储在GIS属性表中,并与滑坡的空间位置相关联。在最终的数据库中,共识别出滑坡684处,其中陕西省414处,山西省270处。这些滑坡的深度(h)从0.5 m到30 m不等,具体可分为浅层滑坡(h≤10 m)、中深层滑坡(10 m<h≤25 m)和深层滑坡(h>25 m)3个类型。其中,深层滑坡数量最少,仅占滑坡总数的8%,中深层和浅层滑坡分别占35.8%和56.1%;体积方面,约85%的滑坡体积小于1×105 m3,而体积大于106 m3的滑坡只有6个,均发育在黄河沿岸。依据最新的滑坡分类方法(Hungr et al., 2014),上述大部分历史滑坡点都属于浅层土质滑坡,降雨和人类活动是最常见的诱发原因。
1.3 环境因子的准备
选择输入因子是评估滑坡易发性的一项基本任务,因为它决定了建模过程中可以包含哪些信息(Catani et al., 2013)。在本研究中,基于对研究区滑坡机制的认知和前人相关文献,共考虑了14 个因素作为输入因子。这些因素可分为地形地貌因素、地质因素、水文因素、环境因素和触发因素5类。
高程(图2a)能反映滑坡势能,且不同高程区域的人类工程活动存在差异,同时高程也会对边坡环境条件(如气候、植被等)产生影响。研究区DEM数据来源于开源网站地理空间数据云(http://www.gscloud.cn/),空间分辨率为30 m。
坡度(图2b)可以表示每个单元表面的陡峭程度,对边坡稳定性有重要影响。它由DEM在GIS环境中生成,范围为0到59°。
坡向(图2c)会导致小气候的差异(例如,阳光照射和温度)并影响斜坡上的植被。使用DEM提取研究区域的坡向,并划分为了8个方向(北、南、西、东、西北、东北、西南、东南)和一个平坦区域(值为−1)。
平面曲率(图2d)可以控制地表水流影响沉积和侵蚀。该区域的平面曲率值从−2.825到4.227不等。
剖面曲率(图2e)控制流经斜坡的水流的加速和减速,从而影响流动过程。它也是从DEM中计算得到的,其结果为−3.908~4.199。
地表粗糙度(图2f)是指地表面积与其投影面积之比,是反映地表形态的宏观指标(Goetz et al., 2015)。它是通过计算斜坡的表面积与垂直方向投影面积之比而获得的。该因子的方程为:
$$ \mathit{SDS} \mathrm{=1/cos(} \mathit{slope} \mathrm{)} $$ (1) 岩性(图2g)被认为是各种地质灾害的物质基础,对控制滑坡的发展起着至关重要的作用(Catani et al., 2013)。研究区地质特征按地层年代和岩土性质划分为砂壤土、黏土、红黏土、砂岩和石灰岩5个单元。
地质结构(图2h)对于滑坡易发性评估至关重要,是因为斜坡上的许多物理过程(如变形)与地质运动有关;此外,地质构造也会影响斜坡上的节理和裂缝。
NDWI(图2i)可以反映河流对地表的影响(Wang et al., 2020)。它主要来自Landsat 8 TM遥感图像,可以通过图像中不同波段的光谱反射率计算:
$$ NDWI{\text{ = }}\frac{{P(Green) - P(NIR)}}{{P(Green) + P(NIR)}} $$ (2) 式中:P(Green)代表绿色波段的光谱反射率;而P(NIR)是近红外波段的光谱反射率,在本研究中,NDWI值为−0.475~0.240。
与河流的距离(图2j):河流可以切割和侵蚀河岸,河流水位波动会重塑地形并影响斜坡的地下水。 与到地质结构的距离类似,笔者计算了每个单元格到最近河流的欧几里得距离,以表示河流的影响。
NDVI(图2k)揭示了特定区域的植被覆盖程度,可以影响斜坡的水文过程。它也是从遥感图像中获得的。计算公式如下(Chang et al., 2020):
$$ NDVI{\text{ = }}\frac{{P(NIR) - P(Red)}}{{P(NIR) + P(Red)}} $$ (3) 式中:P (Red) 是红色波段的光谱反射率;P (NIR) 是近红外波段的光谱反射率。
土地利用(图2l)能够反映植被和人类工程活动的影响(Guo et al., 2025),还会涉及根系内聚力和水文过程。研究区主要有5种土地利用类型:水、居民区、森林、草地和农田。
降雨(图2m)是滑坡最常见的触发因素。在GIS中制作了研究区年平均降雨量图,显示南部地区的降雨量高于北部地区。
到道路的距离(图2n):研究区人口稠密,因此人类活动也是引发滑坡的重要因素。该地区分布着多条国道、高速公路和铁路,因此笔者以到公路的距离作为反映人类活动强度的指标。
2. 研究方法
2.1 因子独立性检验和重要性计算(C5.0决策树)
环境因子的独立性和重要性检验对易发性建模有显著影响,能降低计算过程的复杂性,提高滑坡易发性评价的准确性。如前文所述,文中环境因子的选择主要基于专家经验和文献回顾(Catani et al., 2013;Guo et al., 2021)。上述14个环境因子虽然地质背景不同,但与滑坡易发性存在内在关联。因此,首先采用皮尔逊相关系数法计算所选因子的独立性。不同因子对易发性制图的精度有不同的贡献,因此还需要进行重要性计算来表明环境因子对滑坡的影响程度(Zhu et al., 2022)。在本研究中,应用了C5.0决策树模型 (田乃满等, 2020)。C5.0算法考虑了信息增益比(IGR)方法来计算因素重要性,它允许基于概率度量获得不确定性降低的水平。最佳解决方案是通过使用最大IGR进行拆分计算的决策树向下增长来实现的。IGR (GainRatio) 可以表示如下:
$$ GainRatio = \frac{{Gains({S_q}, m)}}{{S plit({S_q}, m)}} $$ (4) 式中:Sq 是通过Bootstrap重采样随机选择的训练数据集 D 的子集;m 是预测变量。 Split(Sq, m) 表示分割信息。Gains(Sq, m)表示信息增益,可以表示为:
$$ Gains({S_q}, m) = H({S_q}) - \sum\limits_{v \in V(m)} {\frac{{\left| {{S_v}} \right|}}{{\left| {{S_q}} \right|}}} H({S_v}) $$ (5) 式中: H (x)是数据集 x 的熵;V(m)是预测变量 m 的取值范围;SV 是集合 Sq 的子集。
此外,提出了提升算法以提高模型的稳定性,并减少分类错误(Dou et al., 2020)。采用交叉验证方法来评估模型的性能,该方法有利于解决过拟合问题,提高模型泛化能力(Yao et al., 2008)。使用了R软件中内置包用于C5.0 DT建模,其中开发了一个函数,通过计算落入训练数据集中的因素百分比来确定输入数据的重要性。
2.2 滑坡易发性模型
2.2.1 加权信息量模型
信息量模型(IV)是一种常见的统计方法,它可以整合专家主观经验和环境因子与滑坡相关性的客观特征,已被广泛应用于滑坡易发性评估(Bhandary et al., 2013)。IV模型首先计算各个评价因子不同等级的信息量(Wang et al., 2019),表达式如下:
$$ I\left( {{x_i}, A} \right) = \ln \frac{{P\left( {{x_i}/A} \right)}}{{P\left( {{x_i}} \right)}} $$ (6) $$ I\left( {{x_i}, A} \right) = \ln \frac{{{N_i}/N}}{{{S_i}/S}} = \ln \frac{{{N_i}/{S_i}}}{{N/S}} $$ (7) 式中:S 为区域总面积;N 为滑坡灾害数; Si是第i个因子的面积;Ni为第 i 个因子中的滑坡灾害数。Ii<0表明该类别中滑坡发生的可能性小于稳定的可能性,该因子对滑坡的贡献较小;反之Ii>0表明该类别对于滑坡发生具有正向作用。然而,传统的信息量模型没有考虑触发因素对滑坡的“贡献”差异。在这项研究中,笔者应用层次分析法来改善这一缺陷,并通过将每个因子的相关权重与其分类信息量的乘积相加来计算加权信息值(WIV)。方程如下:
$$ L{\text{ = }}\sum\limits_{i = 1}^n {{W_i}{I_i}} $$ (8) 式中:Wi 为第 i 个因子的权重,L为滑坡易发性指数(LSI)。
2.2.2 随机森林模型
随机森林模型是近年来发展起来的一种算法,被认为是组装了许多随机决策树。它的基本技术之一是自举重采样技术,它在训练集中随机重复选择一些样本来训练决策树,并生成其他树来组成随机森林。在随机生成多棵决策树后,样本可以根据每棵决策树的统计结果选择最佳分类(贾俊等,2023)。决策树的形成需要叶子节点的完全分裂,每个叶子节点不能持续分裂(Pradhan, 2013)。大多数决策树算法都需要修剪以避免过度拟合。在RF模型中随机选择样本可以有效避免修剪分类结果(Goetz et al., 2015)。RF模型结合了每个决策树,可以代表最终的结果。它的优点主要包括:可以在一定程度上避免过拟合,增强抗噪能力;且无需特征值即可计算高维样本。
2.2.3 支持向量机模型
SVM模型是一种用于统计数据二元分类的智能算法(付泉等,2024)。该模型通过核函数将环境因子数据从原始空间映射到更高维空间。因此,样本在空间中是线性可分的,并能够分析滑坡点和非滑坡点的正负分类之间的最大间距。在空间中搜索最优超平面,分离样本,使样本间隔最大化,然后通过分类决策函数对样本进行分类(Goetz et al., 2015)。{xi, yi}是样本数据的特征向量,其中i=1, 2, …, l, xi∈Rn, yi∈{−1, +1}, l 是样本个数,n 表示输入维度。非线性映射 Φ (x) 将样本从输入空间映射到特征空间。分类超平面可以计算为 wΦ(x)+ b=0,其中 w, b 是分类决策函数的系数。最优超平面需要最大 2/‖w‖,可以转化为二次规划问题。提出了拉格朗日乘子法来求解这个方程:
$$ \left\{ {\begin{array}{*{20}{c}} {\min \dfrac{1}{2}{{\left\| w \right\|}^2} + C \displaystyle \sum\limits_{i = 1}^n {{\xi _i}} } \\ {s.t.{y_i}\left( {w * {x_i} + b} \right) \geqslant 1 - {\xi _i}} \\ \begin{gathered} {\xi _i} \geqslant 0, i = 1, 2 \cdots n \\ \end{gathered} \end{array}} \right. $$ (9) 式中: ξi 是松弛因子;C 是惩罚参数。简化的拉格朗日高维映射函数可以表示为:
$$ \left\{ {\begin{array}{*{20}{c}} {K\left( {{x_i}, {x_j}} \right) = \phi \left( {{x_i}} \right)\phi \left( {{x_j}} \right)} \\ {\max Q\left( a \right) = \displaystyle \sum\limits_{i = 1}^n {{a_i} - \dfrac{1}{2} \displaystyle \sum\limits_{i = 1}^n { \displaystyle \sum\limits_{j = 1}^n {{a_i}{a_j}{y_i}{y_j}K\left( {{x_i} \cdot {x_j}} \right)} } } } \\ {s.t. \displaystyle \sum\limits_{i = 1}^n {{a_i}{y_i} = 0, 0 \leqslant {a_i} \leqslant C} } \end{array}} \right. $$ (10) 式中:K(xi, xj) 是核函数(Cherkassky,1997)。则 SVR 模型可以建立为:
$$ f(x) = {sgn} \left[ {\sum\limits_{i = 1}^n {{a_i} * {y_i}} K({x_i} \cdot x) + {b^ * }} \right] $$ (11) 上述方法中提出了核函数,将高维空间问题简化为低维空间问题。核函数的选择对于模型分类的准确性具有重要意义。笔者选择RBF(径向基函数)作为核函数,因为它是应用最广泛的一种(Zhou et al., 2016)。
3. 结果
3.1 易发性模型参数优化
文中区域滑坡易发性建模主要包括以下步骤:
(1)栅格文件的单元格分辨率设置为30 m,全区共有
1849962 个栅格单元。在GIS环境下提出了格点转折函数,用于获取区域内所有环境因子的属性数据。由于各个环境因子取值范围不同,首先将各个因素值归一化到[0, 1]区间。在建立环境因子体系后,应用层次分析法计算各因子的权重。利用环境因子判断矩阵计算了每个因素的归一化权重。不同统计指标的结果(随机指数=1.58;一致性指数=0.092;一致性比=0.058<0.1;λmax=15.191)表明矩阵通过了一致性检验。(2)将684个滑坡点作为滑坡样本,在滑坡点周围大于500 m的缓冲区内随机抽取非滑坡样本684个。各个非滑坡点之间的距离大于100 m。在MATLAB环境下,将滑坡和非滑坡样本随机划分为80%的训练数据集和20%的测试数据集,利用不同的模型对训练数据进行训练。然后将研究区所有栅格代入训练好的模型中进行预测,得到了整个区域的易发性分布图。
(3)SVM和RF模型在Matlab 软件中实施以计算滑坡易发性。具有RBF的SVM模型考虑了非负松弛变量来确定最优超平面,改进了具有分类误差的样本的优化,并模拟了训练集和测试集样本。k折交叉验证方法确定了两个关键参数,即惩罚因子C和核函数参数g,最终得到最优参数c =
0.7579 和g =0.5843 。测试样本1094 个,预测成功995个,失败99个,训练集样本准确率为90.95%(图3a)。测试样本274个,其中预测成功238个,失败36个,测试样本准确率为86.86%(图3b)。RF模型采用bootstrap的方式,从已经放回的训练数据中抽取500个样本,形成500棵决策树。利用最优因子集作为模型运算决策树的生长和分裂节点。将创建的RF分类器引入样本预测,结果表明它具有良好的预测性能(图4a)。测试样本1092 个,预测成功1090 个,失败两个,训练集样本准确率为99.82%(图4b)。测试样本274个,其中预测成功246个,失败28个,测试样本准确率为87.97%(图4c)。3.2 环境因子重要性分析
采用SPSS软件中的双变量相关分析对14个环境因子的独立性进行分析。相关系数R[−1, 1]是计算结果的判断指标。R的绝对值越大,相关性越大。R= [−1, 0), 0, (0, 1] 表示两个因素分别为负相关、无线性相关、正相关,低相关(独立性)可通过|R| < 0.5判断。计算结果表明相关系数|R|max=0.486 < 0.5,说明环境因子对滑坡灾害易发性评价影响不大,选择合理。
14 个因子中的5个因子在滑坡易发性建模过程中贡献较大,分别是到道路的距离(IM=1)、到河流的距离(IM=0.97)、坡度(IM=0.93)、降雨量(IM=0.92),海拔(IM=0.91)。岩性(IM=0.67)、土地利用(IM=0.42)、地质构造(IM=0.32)和NDVI(IM=0.32)的贡献中等(图5)。其他5个因素的贡献较低,包括 NDWI、平面曲率、轮廓曲率、表面粗糙度和坡向。重要性计算结果与层次分析法计算的权重一致,其中与道路的距离(W=0.159)、与河流的距离(W=0.136)、降雨量(W=0.132)、坡度(W= 0.132)具有较高的权重,验证了主观权重结果的合理性和模型计算的客观重要性。总体而言,结果表明,本研究区域滑坡发生的两个触发因素(到河流的距离和降雨量)比其他因素更重要。此外,没有任何因子具有负重要值,因此所有因子都可以合理地纳入滑坡易发性评价。
依据公式(4)、(5)计算GIS环境下各环境因子不同等级的信息量值,再乘以因素权重得到各因素的WIV和排名。表1总结了在特定环境因子内分布的滑坡数量与总数的比值(Ni/N),在特定环境因子内分布的滑坡面积与整个区域的比值(Si/S),IV (I)、权重、WIV,以及每个因子的每个级别的排名。根据结果可知,该区域的IV值为−2.11~2.47。排名前6的因子的WIV分别为:道路距离(0~100 m)、降雨量(>475 mm)、河流距离(0~100 m)、坡度(23°~59°)、NDWI(0.008~0.240),土地使用(定居)。这些因素显着影响研究地点历史滑坡的发展。
表 1 滑坡环境因子 IV 的计算结果Table 1. Calculation of the IV of the landslide environmental factors环境因子 值 Ni/N Si/S 密度比 信息量 权重 加权信息量 排名 高程 (m) 594~774 0.39 0.39 1.00 0.90 0.073 0.0657 9 774~901 0.22 0.76 0.29 −0.33 0.02409 61 901~ 1028 0.26 0.69 0.38 −0.07 0.00511 40 1028 ~1183 0.11 0.51 0.21 −0.67 0.04891 66 1183 ~1510 0.01 0.08 0.16 −0.92 0.06716 68 坡度 (°) 0~7 0.14 0.19 0.74 −0.30 0.107 − 0.0321 62 7~12 0.20 0.29 0.68 −0.39 0.04173 64 12~17 0.26 0.28 0.96 −0.05 0.00535 42 17~23 0.25 0.18 1.39 0.33 0.03531 15 23~59 0.14 0.06 2.44 0.89 0.09523 4 坡向 (°) 北(0~22.5) 0.09 0.06 1.56 0.45 0.031 0.01395 22 东北(22.5~67.5) 0.13 0.12 1.13 0.12 0.00372 28 东(67.5~112.5) 0.15 0.13 1.14 0.13 0.00403 27 东南(112.5~157.5) 0.10 0.12 0.79 −0.23 0.00713 44 南(157.5~202.5) 0.12 0.13 0.94 −0.06 0.00186 34 西南(202.5~247.5) 0.10 0.15 0.68 −0.38 0.01178 51 西(247.5~292.5) 0.09 0.14 0.68 −0.39 0.01209 52 西北(292.5~337.5) 0.14 0.11 1.27 0.24 0.00744 25 北(337.5-360) 0.08 0.05 1.57 0.45 0.01395 22 平面曲率 −2.824~−0.345 0.06 0.06 1.00 −0.16 0.031 0.00496 38 −0.345~−0.097 0.22 0.25 0.88 −0.12 0.00372 36 −0.097~0.095 0.35 0.34 1.03 0.03 0.00093 31 0.095~0.343 0.31 0.27 1.13 0.12 0.00372 28 0.343~4.227 0.07 0.07 1.00 −0.10 − 0.0031 35 剖面曲率 −3.908~−0.393 0.05 0.06 0.85 −0.16 0.031 0.00496 38 −0.393~−0.140 0.16 0.20 0.79 −0.23 0.00713 44 −0.140~0.082 0.28 0.37 0.77 −0.26 0.00806 47 0.082~0.367 0.36 0.29 1.23 0.20 0.0062 26 0.367~4.199 0.15 0.08 1.84 0.61 0.01891 18 地表粗糙度 1~1.023 0.34 0.48 0.69 −0.37 0.042 0.01554 55 1.023~1.052 0.33 0.32 1.02 0.02 0.00084 32 1.052~1.097 0.21 0.15 1.41 0.35 0.0147 21 1.097~1.199 0.09 0.04 2.23 0.80 0.0336 16 1.199~1.919 0.03 0.01 3.00 2.15 0.0903 8 岩性 沙壤土 0.16 0.19 0.88 −0.13 0.052 0.00676 43 黏土 0.33 0.43 0.77 −0.26 0.01352 53 红黏土 0.06 0.03 2.00 0.50 0.026 17 砂岩 0.43 0.31 1.38 0.32 0.01664 19 石灰岩 0.02 0.04 0.49 −0.71 0.03692 63 距断层距离 (m) 0~ 2709.069 0.37 0.28 1.30 0.26 0.049 0.01274 24 2709.069 ~5727.746 0.29 0.28 1.03 0.03 0.00147 30 5727.746 ~9056.030 0.16 0.19 0.83 −0.18 0.00882 48 9056.030 ~13003.531 0.11 0.16 0.72 −0.32 0.01568 56 13003.531 ~19814.904 0.07 0.09 0.79 −0.23 0.01127 50 NDWI −0.475~−0.235 0.06 0.10 0.56 −0.58 0.038 0.02204 60 −0.235~−0.196 0.25 0.37 0.69 −0.38 0.01444 54 −0.196~−0.151 0.47 0.43 1.09 −0.02 0.00076 33 −0.151~0.008 0.13 0.06 2.19 1.07 0.04066 11 0.008~0.240 0.09 0.04 2.27 2.47 0.09386 5 NDVI −0.198~0.008 0.02 0.01 2.00 1.13 0.038 0.04294 10 0.008~0.135 0.31 0.20 1.53 0.43 0.01634 20 0.135~0.180 0.35 0.40 0.88 −0.13 0.00494 37 0.180~0.235 0.26 0.30 0.87 −0.14 0.00532 41 0.235~0.536 0.05 0.09 0.57 −0.57 0.02166 59 距河流距离 (m) 0~100 0.35 0.15 2.33 0.85 0.136 0.1156 3 100~200 0.16 0.12 1.32 0.28 0.03808 14 200~300 0.11 0.13 0.86 −0.15 − 0.0204 58 300~500 0.14 0.21 0.66 −0.41 0.05576 67 500~ 1776.851 0.23 0.38 0.60 −0.51 0.06936 69 距道路距离 (m) 0~100 0.72 0.16 4.56 1.52 0.159 0.24168 1 100~200 0.12 0.12 0.95 −0.05 0.00795 46 200~300 0.05 0.12 0.41 −0.90 − 0.1431 71 300~500 0.06 0.18 0.34 −1.07 0.17013 72 500~ 2835.437 0.05 0.42 0.12 −2.11 0.33549 74 土地利用 水面 0.03 0.02 1.65 0.50 0.08 0.04 12 村庄 0.17 0.05 3.22 1.17 0.0936 6 林地 0.24 0.28 0.87 −0.14 − 0.0112 49 草地 0.28 0.48 0.58 −0.54 − 0.0432 65 农田 0.29 0.17 1.66 0.50 0.04 12 降雨 (mm) <400 0.10 0.22 0.47 −1.45 0.132 − 0.1914 73 400~425 0.22 0.11 1.99 0.69 0.09108 7 425~450 0.12 0.13 0.87 −0.14 0.01848 57 450~475 0.10 0.22 0.44 −0.82 0.10824 70 >475 0.46 0.33 1.40 1.57 0.20724 2 3.3 不同滑坡易发性图中的滑坡分布
表1中计算的各因子不同范围的WIV由ArcGIS赋值,并由ArcGIS栅格计算器叠加,以确定该地区的滑坡易发性指数(LSI)。LSI值为−0.838~0.940(图6a)。将SVM和RF方法预测的LSI通过ArcGIS软件分配到研究区对应的格网中,得到对应的滑坡易发性图。来自SVM和RF模型的研究区域LSI值分别为−4.236~1.807(图6b)和0~1(图6c)。采用自然断点法将LSI划分为高、中、低、极低4个易发性等级,得到了3种数据驱动模型的易发性分布图(图7)。结果表明,3个模型得到的高易发地带与历史滑坡点的空间分布基本一致。Ni/N和Si/S值都随着易发性水平的增加而增加,从而表明这些模型对滑坡易发区/非滑坡区的预测较好(图8)。WIV模型的每一层在总面积中所占的比例都比较均匀。高易发性面积占总面积的10.8%,滑坡点数占总点数的57.8%。相比之下,易发性极低的地区占整个区域的33.2%,但滑坡数量仅占所有点的2.5%。对于高易发性区域识别的滑坡数量,SVM和RF模型均超过70%,表明大部分滑坡预测成功。RF表现最好:高易发性区占全区面积的21.9%,滑坡个数占90.5%,极低易发性区面积占总面积的39.4%,滑坡个数占总面积只有0.7%。这些结果表明,RF方法更好地预测了高易发性地区的历史滑坡,生成的滑坡易发性图更有效。
3.4 模型验证与比较
模型验证对于模型适应度评估和生成的滑坡易发性图的质量评估都至关重要(Guzzetti et al., 2005)。笔者提出了基于混淆矩阵的统计指标来评估这些模型的预测能力,并生成了接收者操作特征(ROC)。笔者使用了接收者操作特征曲线(ROC)来定量评估及对比这些模型的性能,3个模型的ROC曲线下面积(AUC)均在0.8以上,说明这些模型在滑坡易发性评估中均具有良好的预测能力(图9)。RF模型的AUC值为
0.9035 ,而SVM和WIV的AUC值分别为0.8472 、0.8446 。SVM和RF模型得到的极低易发性区内的滑坡点只有5个,占清单点的0.7%。通过上述对比可知,SVM和RF模型的验证结果更加客观准确。虽然WIV模型可以量化因素与滑坡发生之间的关系,但专家判断主要是非定性和经验性的。因此,误差高于机器学习模型。在这3种模型中,随机森林的预测能力最高。4. 结论
(1)分别使用了3种数据驱动模型生成黄河中游流域的区域滑坡易发性图。环境因子间的皮尔逊相关系数表明,所有选择的14个因素都是条件独立的。从C5.0决策树方法获得的结果揭示了该地区滑坡发生最关键的因素,即到道路的距离、到河流的距离和坡度。
(2)使用ROC曲线的验证和比较结果表明,RF模型(AUC=0.904)比WIV(AUC=0.845)和SVM(AUC=0.847)模型具有更高的准确性。RF模型确定了97.1%的历史滑坡清单点位于高易发性区域,而只有0.7%的滑坡位于低易发性区域。
(3)3种技术已被确认为中国黄土高原滑坡易发性评估较有前景的模型,特别是RF模型。研究结果有助于未来在具有相似地质和环境的地区进行滑坡风险管理和防灾减灾工作。
-
陈富文,李华芹,等.新疆东部金窝子金矿成因讨论--同位素年代学证据[J].地质论评,1999,45(3): 247-253. 王虹.金窝子金矿床动力热液成矿雏议[J].新疆地质,1993,11(1): 63-67. 杨文勇,潘富生,贾书震,等.东疆地区金矿成矿特征及找矿方向[J].西北地质,1991,12(4): 14-19. 曹正中.金窝子金矿成因分析[J].新疆矿产地质,1990,(1-2): 45-50. 翟裕生,邓军,李晓波.区域成矿学[M].北京: 地质出版社,1999.15-19. 张巨庆.哈密金窝子矿区找矿预测综合模型[J].桂林冶金地质学院学报,1991,11(3): 298-307. 席小平.金窝子岩体的地质特征及找金方向[J].新疆地质,1997,15(1): 76-83
计量
- 文章访问数: 2348
- HTML全文浏览量: 0
- PDF下载量: 3721