关键词:
机器学习
数据库
数理统计
滑坡
摘要:
机器学习已经在滑坡易发性评价中大量应用且取得了较好的表现,但在进行大区域评价时,仍存在数据库样本需求量大,算力要求高;影响因素分级机械化,未考虑其与滑坡机理的相关性等情况。为减少数据库样本需求,本文提出了构建包含3种坡体状态的滑坡的数据库:已经发生过失稳的坡体、正处于失稳状态的坡体、失稳概率小的坡体,该数据库可以在数值上划分出临界值,便于模型更准确地识别滑坡,较大幅度地减小了数据量。针对影响因素分级机械化的问题,提出了基于频数分布图、累计曲线及其导数图的数理统计方式,更精细地描述因数与滑坡易发性的关系。以新疆滑坡灾害为例,验证了“包含3种坡体状态的数据库”与“基于数理统计的描述方法”的适用性,获得了新疆滑坡灾害易发性分区图。结果表明与传统数据库对比,在不明显改变精度的前提下,减少了90%以上的样本量;基于数理统计的描述方法可以绘制出更加细致的滑坡危险性分区图;活动性断裂和地形起伏度对新疆滑坡易发性起到重要的控制作用。