Multi-Feature-Based Identification of Subtropical Evergreen Tree Species Using Gaofen-2 Imagery and Algorithm Comparison
研究背景
森林在人类生存和可持续发展中发挥着不可替代的作用。它们影响陆地生态系统的生产力、土壤形成、养分循环以及周围流域生态。掌握森林中树木的种类和分布对理解森林生态系统过程和制定森林管理策略至关重要。我国森林分布广泛,亚热带常绿林面积较大,是我国南方的主要森林类型。但由亚热带森林景观具有复杂的冠层结构和较高的林分密度,树种识别难度大。已有研究多数集中于温带地区的树种识别,亚热带地区的研究相对较少。高分辨率卫星与机器学习技术的结合为区域尺度的树种识别提供了可能。然而亚热带树种识别中无人机数据的使用往往多于卫星数据的使用。并且不同分类算法对树种遥感识别的影响研究较少。不同特征组合和不同机器学习方法对亚热带常绿树种识别的效果有待探究。本研究旨在探索不同算法和特征组合方案及其在亚热带树种识别中的能力,寻找最适合亚热带常绿林区的遥感树种识别方法。主要步骤包括(1)基于4种特征因子(波段反射率、植被指数、纹理特征、地形特征)构建11种特征组合方案,比较使用不同类型因子识别亚热带常绿树种的效果;(2)构建5种机器学习分类算法,最近邻分类(KNN)、支持向量机(SVM)、BP神经网络(BP)、随机森林(RF)等,探索不同分类算法的识别能力;(3)评价识别模型变量的相对重要性,分析变量对识别模型的贡献率。
研究方法
图1 研究区域及样点分布图
研究区位于江西省赣州市南康区(图1)。我们采用手持亚米级精度GPS对单株立木进行定位,记录其树种、树高、胸径等信息。野外调查共获取样本489个。将样本分为常绿阔叶树、杉木和马尾松三大类,其中常绿阔叶样本149个,马尾松样本186个、杉木样本154个。选取GF-2 PMS数据为遥感数据提取样点的波段反射率、植被指数及纹理特征,DEM数据提取坡度、坡向和海拔。
研究结果
本研究主要结论如下:
(1) 方案8(波段反射率+植被指数+地形因子)与SVM结合能够产生最佳的亚热带常绿森林树种识别效果,总体精度为90.27%,Kappa系数为85.37%(表1)。
表1 各分类算法最优方案模型精度
(2)通过多特征组合的方法构建BP、SVM、RF、KNN和PLR分类器。各分类算法得到的最佳OA和kappa系数分别超过87%和81%(图2);分类结果满足复杂林冠结构和高林分密度下亚热带天然常绿林树种识别的应用需求。
图2 各算法最优分
(3)利用单一类别的特征因子难以实现准确的树种识别。多种特征的结合具有较高的分类精度,地形因子的加入有效提高了树种识别精度。
(4)将GF-2数据提取的波段反射率、植被指数特征、纹理特征和地形因子进行不同方案的组合。方案8(波段反射率+植被指数+地形因子)效果最好,其次是方案11(波段反射率+植被指数+纹理特征+地形因子) (图3)。
图3 不同分类方案精度比较
(5)基于错分误差和漏分误差评价三种常绿树种的识别效果。我们发现在5种模型中,马尾松的识别效果最好,其次是杉木(图4)。
图4 各树种分类误差
(6)不同变量在树种识别中的重要性不同。NDGI、海拔和MSAVI是关键的变量(图5)。
图5变量相对重要性:(a)方案11;(b)方案8