以干旱荒漠区塔里木河中下游的植被为研究对象,采用长时间序列的MODIS数据构建研究区常用的4种植被指数[归一化植被指数(NDVI)、差值植被指数(DVI)、增强型植被指数(EVI)、比值植被指数(RVI)],并通过遥感方法和Image J软件获得研究区植被覆盖度,分析发现与实测的植被覆盖度有显著相关性。从Image J获得的植被覆盖度与4种植被指数的回归结果可以得出4种植被指数在研究区的适用性,从而优选出最适合此研究区的植被指数。结果表明,基于MODIS的4种植被指数与研究区实际植被覆盖度之间存在显著的正相关关系,各植被指数与研究区植被覆盖度的拟合程度由高到低依次是NDVI>EVI>RVI>DVI,使用NDVI获取植被信息最为适宜。
To more accurately determine vegetation information for the mid-lower reaches of the Tarim River in an arid desert region, we used MODIS data to calculate commonly used vegetation indices (VIs, normalized difference vegetation index [NDVI], difference vegetation index [DVI], enhanced vegetation index [EVI], ratio vegetation index [RVI]). We combined remote sensing data using Image J software to acquire a vegetation coverage, and compared them with actual measurements. We concluded that they were significantly correlated. Next, we made a vegetation coverage map via Image J and vegetation indices in a 2D scatter plot using regression analysis. Finally, we chose the most suitable VI among the four VIs. The study showed that each VI was positively correlated with vegetation coverage. The goodness of fit between VIs and vegetation coverage was ranked: NDVI, EVI, RVI, and DVI. Thus, we suggest the use of NDVI as the VI.
植被是土地生产力变化的重要指示因子, 在西北干旱地区, 对植被的研究尤为重要。将多光谱数据通过线性和非线性的配合能得到植被指数(vegetation index, VI) 的各类数值, 这些数值与植被的盖度、生物量等都具有良好的相关性, 对植被有相关指示作用[1, 2, 3]。植被指数法是一种经济有效的方法, 它可以从遥感图像中获取大尺度的植被信息, 这是基于轨道上卫星红外波段的不同组合, 这些频段包括了超过90%的植被信息[4, 5]。以往对干旱区植被的研究大多是通过分析植被指数反映植被生长变化趋势[6], 或通过植被指数法估算地表植被覆盖度[7, 8, 9, 10, 11], 如以塔里木河下游为研究对象, 用某天的MODIS数据构建出多种植被指数与现场实测植被覆盖度进行回归反演[6], 但把植被指数与植被覆盖度联系起来并长时间研究, 从而分析它们之间的相关性, 进而选择更适合于该研究区的植被指数, 这方面的研究尚不多见。
选择适宜的植被指数是植被状态遥感测量的关键技术[12], 对于塔里木河这一研究区, 植被稀疏破碎, 因其流域水源相对充足, 植被覆盖度具有由高至低的过渡性。塔里木河下游恰拉至台特玛湖这一条状植被带具有抵御风沙、保护绿洲安全的作用, 被人们称为“ 下游绿色走廊” , 而不同植被指数在监测的重点和适宜区域上是存在差异的[13], 为能更好地反映和监测此地区的植被状况, 本研究采用长时间序列的MODIS数据构建常用的4种植被指数, 并通过遥感方法和Image J软件获取研究区植被覆盖度, 与实测的植被覆盖度进行比较分析, 对研究区植被指数的适用性研究具有一定的理论和实践意义。
新疆塔里木河流域总面积可达102万km2, 它是从塔里木盆地周边向中间集流的区域, 包括九大水系的114条源头河以及塔里木河干流。塔里木河作为中国第一大内陆河, 其长度为2 137 km, 地理坐标是71° 39″-93° 45″ E、34° 20″-43° 39″ N。
研究区属于大陆性暖温带, 多戈壁、沙漠, 地处欧亚大陆腹地, 远离海洋, 四周又多高山环绕, 降水稀少, 沿河一带具有独特的生态系统, 并且沿岸形成一条狭长的植被带, 由乔木、灌木和草本植物群落构成, 其中以旱生耐盐种类占优势, 主要分布有胡杨(Populus diversifolia)、柽柳(Tamarix chinensis)等植被。上游地区大多是起伏不平的沙漠, 河水很不稳定, 特别是河水流量的季节性变化又非常大, 冰山融化产生的水流中携带着大量的泥沙流向塔里木河中下游。研究区地势西高东低, 三面都被高大的山体阻隔, 河流自西向东环绕着塔克拉玛干沙漠穿过塔里木盆地。每当炎热的夏季到来时, 冰川上的积雪融化, 导致河水流量急剧增加。目前, 流域内仍以农牧业为主, 种植有粮食、核桃(Juglans regia)、库尔勒香梨(Annona squamosa)等。
因不能保证每个时段的数据影像都没有云层覆盖, 而气象要素对数据质量的影响较大, 考虑下载MODL1B后处理数据的繁琐性, 研究区数据选取从美国国家航空航天局(NASA)网站上下载的2007年的MOD13Q1数据产品, 其空间分辨率为250 m。MOD13Q1数据是16 d合成的, 里面包含12个字段的数据。本研究选用其中的4个字段即250 m 16 d NDVI、250 m 16天EVI、250 m 16 d红光反射和250 m 16 d近红外反射进行研究。用ENVI中MODIS conversion toolkit (MCTK)插件对MOD13Q1数据进行坐标重投影, 并用Band Math计算比值植被指数(RVI)和差值植被指数(DVI)。RVI中输入B1/B2, DVI中输入B1-B2。其中B1代表近红波段, B2代表红波段。
研究区位于南疆, 采用实地方法去测量植被覆盖度, 测得的结果会比较准确。但却无法测量到流域中某些地区的植被覆盖, 难度较大。在目前, 应用比较广泛的方法是根据归一化植被指数NDVI计算植被覆盖度。但NDVImax和NDVImin的选取存在着很强的人为主观性[14]。
Image J是一个基于Java的图像处理软件, 可用于创建、显示、编辑、处理分析图像。通过适当调节图像阈值、粒子圆度(circularity)以及粒子尺寸(size)等, 能对图片中的区域面积进行统计, 它已经在医学和生物等领域被广泛应用[15], 其分析测量功能在一些领域被用来测量面积[16, 17, 18]。
研究区主要以柽柳、黑刺(Hippophae neurocarpa)、铃铛刺(Halimodendron halodendron)等灌木和以胡杨等乔木为主。从卫星影像上看这些植被(特别是灌木)具有非常好的形态和圆度。而用Image J来计算植被盖度时需要设置粒子圆度, 为保证准确度, 研究区选取灌木分布的区域进行研究, 这样就可以把植被近似看成是一个个粒子。从Google Earth上选取2007年各时间段的研究区卫星图, 把它与NASA上下载的研究区各时间的MODIS影像进行经纬度投影。分别在两者叠加的基础上, 从卫星图中截出相应250 m× 250 m大小的合计72个样地, 划出并保存样地矢量, 以便后期获取对应样地的植被指数。要注意的是, 需要选取较多的研究区样地, 并且要做到均匀分布。图1a是从2007年8月13日的Google Earth卫星图上截取的一个研究区下游样地(88° 40.98″ E, 40° 26'48.20″ N), 图1b是用Image J软件对该样地进行植被覆盖度统计时显示的统计结果。
根据现有的各时间段具有的NDVI、DVI、增强型植被指数(EVI)和RVI 4种植被指数, 用ENVI软件分别叠加样地矢量层, 并作图(图2), 同时提取出72个样地的植被指数值。
采用SPSS软件和Excel软件对数据进行分析, 并制图。
3.1 2007年8月13日的植被指数与实测获得的植被覆盖度回归分析
根据落在每个覆盖度区间的样地数保持一致的原则, 把研究区分成了高植被覆盖(覆盖度> 15%)、中植被覆盖(10%< 覆盖度≤ 15%)、中低植被覆盖(5%< 覆盖度≤ 10%)和低植被覆盖(0≤ 覆盖度≤ 5%)这4个区间, 记录72个样地的4个植被指数(图3)。以VI为横坐标, 实测植被覆盖度(Fvc)为纵坐标, 进行两者的线性回归, 得到拟合方程(图4), 运用SPSS软件分析两者的相关程度, 总结得出植被覆盖度与植被指数的相关性分析表(表1)。结果表明, 研究区72个样地上获得的4个植被指数与实测的植被覆盖度之间均存在极显著相关性(P< 0.001)。
![]() | 表1 各植被指数在不同植被覆盖度区间的相关系数 Table 1 Correlation analysis of vegetation index(VI) in four vegetation coverage areas |
回归分析图(图4)直线方向为第1, 3象限方向, 各种植被指数与植被覆盖度均呈正相关关系。从曲线的拟合程度来看, NDVI的效果最好, 说明在塔里木河中下游这一研究区比较适宜用NDVI来表达植被信息。分别进行各植被指数在4个植被覆盖度区间的相关性(R2)分析(表1), 结果发现, 与NDVI的相关程度最高。
![]() | 图4 各植被指数与实测植被覆盖度的回归分析图Fig.4 The regression analysis of vegetation index(VI) and measured vegetation coverage |
3.2 2007年4种植被指数与实测植被覆盖度比较
3.2.1 2007年8月13日实测植被覆盖度与Image J测得的植被覆盖度的对比分析 通过实地测量得到研究区2007年8月13日的72个灌木样地的植被覆盖度, 将其作为纵坐标, 用Image J计算相应72个样地植被覆盖度(FI), 将其为横坐标, 验证发现, P< 0.001, 相关系数为0.940 1, 说明实测植被覆盖度与计算得出的植被覆盖度呈极显著的相关关系(图5)。
![]() | 图5 实测植被覆盖度与Image J计算出的样地植被覆盖度的相关性分析Fig.5 Comparison analysis of measured vegetation coverage and vegetation coverage calculated using Image J |
3.2.2 2007年各植被指数与植被覆盖度的相关性分析 由于缺少2007年长期的植被覆盖度实测数据, 2007年8月13日是具有实测植被覆盖度数据的, 同时发现, 2007年8月13日的实测植被覆盖度与用Image J测得的当天植被覆盖度呈极显著相关关系(P< 0.001)(图6)。因此, 将用Image J测得的各时段的植被覆盖度作为2007年的覆盖度实测值进行分析(其中各时段对应于2007年MOD13Q1数据产品的各个时间)。用Excel对2007年各时段的4个植被指数与Image J测得的植被覆盖度进行回归分析, 得到不同时段相关系数R2(图6), 发现与NDVI的相关系数均最大, 且P< 0.001。
根据植被覆盖度与植被指数的相关公式[17], 运用ENVI 4.5中的Band Math进行相关运算, 得到研究区的植被覆盖度, 以MOD13Q1数据集中2007年8月13日的数据为例(图7), 其NDVI植被指数与实测覆盖度数据误差最小。在2007年各时段, NDVI的相关系数都最大, 也最适宜表达研究区植被(图6), 因此选用之前计算得到的NDVI这一植被指数进行研究区植被覆盖度的估算, 结果发现, 估计值很接近实际地表覆盖情况。
本研究对2007年8月13日以及2007年的植被指数与实测植被覆盖度进行线性回归后发现, 适宜程度最好的是NDVI植被指数, 其相关系数集中在0.87(图6)附近, 其余3个植被指数(DVI、EVI、RVI)的值相对较低, 且相关系数呈EVI> RVI> DVI的顺序。在4个植被覆盖度区间(高植被覆盖区、中植被覆盖区、中低植被覆盖区、低植被覆盖区)的4个植被指数中也是与NDVI的相关性最高, 然后依次是EVI、RVI和DVI。其中在高植被覆盖区和中植被覆盖区的4个植被指数的相关系数比其余两个覆盖区(中低植被覆盖区和低植被覆盖)高。
对上述结果的解释, 一方面, 需要从这4个植被指数的基本特点和适用情况进行分析。NDVI的应用最为普遍, 它能较好地反映高植被覆盖地区的植被情况, 对低盖度地区的植被反映情况存在较大误差, 会在一定程度上受到土壤背景的干扰[19, 20]。DVI能极其敏锐地响应土壤背景的变化, 主要用于植被发育的早期阶段, 即覆盖度比较低的阶段; EVI也常常被用在植被密集的地区[21]。土壤背景对处理研究区相应的植被指数影响是比较大的[6], 而研究区植被主要受到塔里木河中下游的水流影响, 分布有裸露的、稀疏的以及茂盛的植被, 其土壤背景并不相同。因此用不同植被指数反映的植被情况自然各不相同, 结果也具有差异性。特别是在土壤裸露或是植被覆盖较少的地方, DVI植被指数能比较敏感地探测到植被的变化, 比较适合在低植被覆盖区监测生态环境变化[22]。RVI和叶面积具有较强的相关性, 对植被比较敏感, 但容易受到大气条件的影响, 且在研究区植被盖度< 50%时, 分辨能力很弱[4]。而本研究区的植被盖度并未达到50%, 导致后期的计算结果并不突出, 因此RVI植被指数与植被覆盖度的相关系数也没有NDVI和EVI的高。另一方面, 在数据获取、数据处理等方面的方法或选取不当都会影响后期4个植被指数与相应植被覆盖之间的相关系数的大小。比如在数据获取方面, 考虑到获取气象数据的难度性, 在选择遥感影像时应该尽量选择天气较好且无风的时段[6], 以此来提高数据的准确性, 而实际上遥感影像并不可能做到拍摄时绝对无风和晴朗, 在这种情况下自然也会影响到植被指数计算结果的精度; MODIS影像与Google Earth卫星图片的像元尺寸无法精确地贴合, 这导致后期在Google Earth卫星图片截取的像元与实际相应的MODIS影像像元并不一致, 从而影响两者的相关性; 而后期在用Image J软件进行植被覆盖度计算时, 在调节图像阈值和在进行粒子分析时设置的粒子圆度和尺寸不太适合, 这也会在很大程度上影响到4个植被指数在研究区的适宜性结果; 或在计算植被指数时, 由于植被指数对土壤背景比较敏感(特别是DVI植被指数)[22], 因此对土壤调节参数的设置不太合理势必对结果产生影响; 或是样地选取的数量不够多以及相应样地的植被指数统计不当, 这都会影响到植被指数与植被覆盖度的相关性。
本研究中4个植被指数与实测植被盖度的回归分析(图4)中有些点的离散程度比较大。结合这些点的坐标, 发现离散点实际大多分布在植被覆盖度较低、土壤裸露的地方, 说明研究土壤背景来调节植被指数的应用具有十分重要的意义。用NDVI进行植被覆盖度的遥感估计(图7)时发现, 研究区的植被覆盖度大多集中在6%以内, 符合干旱区植被的特点; 统计发现低植被覆盖区占到了55%左右。植被盖度在10%~20%时, 植被主要分布在研究区河道的两侧或洼地, 而盖度小于10%的植被多分布在离河道较远的荒漠地区。
本研究针对塔里木河中下游区域植被指数的适宜性问题, 以2007年MOD13Q1数据产品为数据源, 采用线性回归和反演, 对研究区植被指数进行了综合分析, 结果表明, 在塔里木河中下游区域比较适宜用NDVI来反映植被情况, 且各植被指数的适宜程度从高到低依次为NDVI、EVI、RVI、DVI; NDVI在高植被覆盖(覆盖度> 15%)、中植被覆盖(10%< 覆盖度≤ 15%)、中低植被覆盖(5%< 覆盖度≤ 10%)和低植被覆盖(0≤ 覆盖度≤ 5%)这4个覆盖度区间的适宜性也最高; 研究区选择灌木这种植被进行分析, 因其在卫星图上具有很好的圆度, 使得通过Image J软件计算获得的植被覆盖度与实测的植被覆盖度具有很高的相关性, 不但精度高, 而且在计算植被盖度时也十分高效。除此研究区以外的西北干旱区是否可以得出相同的植被指数适宜性结果还有待后续的进一步研究。
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|