第一作者:任璇(1991-),女,新疆塔城人,在读硕士生,研究方向为草原生物灾害遥感监测。E-mail:[email protected]
气象因子对研究草地生产力、植被长势、灾害评估等都有着重要的意义,本研究采用不同空间插值方法(协同克里格法Cokriging、反距离加权法IDW和ANUSPLIN法)对新疆地区90个气象站点2000-2011年多年的7月平均降水和气温数据进行空间插值分析,使用均方根误差法(RMSE)以及平均绝对误差法(MAE)对插值的结果进行评价,讨论不同方法对该地区降水和气温插值结果的影响。利用不同插值方法,基于CASA模型进行新疆草地NPP的估算,结合实测生物量数据,对3种插值方法下的估算结果进行评估,结果表明,1)降水和气温数据都是基于ANUSPLIN法的插值结果最优( MAE降水 =6 .45, RMSE降水 =8 .77, MAE气温 =2 .11, RMSE气温=3.52)。2)基于不同插值方法得到的气象要素估算的新疆草地NPP精度不同,将实测数据与同时期CASA模型模拟值相关性进行分析,基于ANUSPLIN法插值的气象要素估算NPP的精度最高( R2=0.794 7),NPP实测值与模拟值有良好的线性关系,比基于Cokriging插值的气象要素估算精度提高了13.23%,比IDW提高了20.13%。说明提高气象要素的插值精度有利于新疆草地NPP的估算研究。
Meteorological factors are significant in researching grassland productivity, vegetation growth, and disaster assessment. This study used different spatial interpolation methods including Cokriging (CK), inverse distance weighting (IDW), and ANUSPLIN, to analyse the average July precipitation and temperature datasets of 90 meteorological stations in Xinjiang from 2000 to 2011. In addition, the mean absolute error (MAE) and root mean square error (RMSE) were used to evaluate the interpolation results, and we discussed the effects of different interpolation methods on spatial variation of precipitation and temperature. Furthermore, the spatial variations in precipitation and temperature obtained using various interpolation methods were used to calculate the grassland net primary productivity (NPP) in Xinjiang using the Carnegie-Ames-Stanford (CASA) model and verified their accuracy using field measured biomass data. We obtained the following results, 1)The interpolation results of the precipitation and temperature using the ANUSPLIN was better than those of the other methods ( MAEprecipitation=6.45, RMSEprecipitation=8.77, and MAEtemperature=2.11, RMSEtemperature=3.52), which indicates that the ANUSPLIN is a superior method for interpolating meteorological factors in Xinjiang. 2) The accuracy of estimating the Xinjiang grassland NPP differed between the various methods. The calculation of the coefficients between the field measured biomass data and the simulated values obtained using CASA model, showed that the ANUSPLIN had the highest accuracy, with an R2 of 0.794 7. There was a good linear relationship between the measured and simulated values of the grassland NPP. Compared with the Cokriging and IDW, the accuracy of ANUSPLIN was higher by 13.23% and 20.13%, respectively. These results show that improving the accuracy of the interpolation results of meteorological factors could enhance the estimation of grassland NPP.
草原作为陆地生态系统中分布最为广泛的生态系统之一, 在气候调节以及全球碳循环中起着重要作用[1, 2]。净初级生产力(net primary productivity, NPP)指植物在单位时间和单位面积内积累的有机物总量, 是植物光合作用生成的有机物总量减去呼吸作用消耗之后的剩余量, 也是反映陆地生态系统响应和全球气候变化的重要参数[3, 4, 5, 6]。草地NPP的研究对草地资源的合理利用, 挖掘草地气候生产潜力, 最大程度提高产量以及对草地农业生态系统中碳循环研究都具有指导意义[7, 8, 9, 10, 11]。因为草原生态环境的天然脆弱性以及其对气候变化响应较为敏感, 温度和水分是影响草地生态系统演替重要气候驱动因子, 同时也是影响草地生产力的关键因素和估算草地生态环境及NPP的重要指标[11, 12, 13, 14]。根据前期研究表明, 新疆草地植被NPP与降水的相关性显著[15], 因此, 气象数据的精准性会很大程度地影响草地植被NPP的估算。
随着气候变化研究的日益深入, 如何基于有限的、分布不均的站点气象观测数据获得某一地区的气候要素时空分布情况, 从而提高降水、气温空间模拟的精度已成为气候变化领域的热点问题[16, 17, 18]。空间数据的内插是由一组已知的分区数据或离散数据, 依据一定的数学关系推算未知点数据或区域数据的过程。就目前的研究方法中, 在气象要素空间插值方面, 主要使用的方法有样条法(Splines)、反距离加权法(inverse distance weight, IDW)、协同克里格插值法(Cokriging, CK)等, 气象要素的变化十分复杂, 不同的插值方法得出的结果也有很大的区别。新疆地区气象台站点分布稀疏, 且多分布于绿洲内, 周边站点较少, 空间上分布不均匀, 加之地貌复杂多样, 经纬度跨度较大, 对气象因素影响较大, 如何利用有限的站点对新疆地区气象要素空间分布进行准确模拟是一个难题。与反距离加权法、径向基函数法、协克里格方法相比, 普通克里格法对新疆全疆降水空间分布进行插值的计算精度最高[19]。基于ANUSPLIN软件的局部薄盘光滑样条法对东北地区气温序列进行插值的结果最优[20]。ANUSPLIN是澳大利亚科学家Hutchinson针对气候数据曲面拟合, 基于薄盘样条理论编写的专用软件, 该软件能对多个不同表面同时进行空间插值, 对不同时间段的气象数据处理, 运用ANUSPLIN尤为适合, ANUSPLIN软件已在不同国家不同领域得到了广泛运用, 并且得到了很好的评价。因此, 为了更准确地探求新疆地区降水量及气温的空间分布状况, 本研究利用ArcGIS中地统计模块对新疆地区2000-2011年降水及气温进行协同克里格插值、反距离加权插值, 并与ANUSPLIN插值结果进行对比, 以期选取适合新疆地区气象插值的模型, 提高草地NPP 估算模型精度。
新疆维吾尔自治区(简称新疆)位于34° 22'-49° 33' N, 73° 32'-96° 21' E, 地处中国西北部、亚欧大陆腹地, 面积为166万km2, 占中国国土面积1/6。新疆远离海洋, 四周高山环抱, 是典型的温带大陆性干旱气候, 年平均气温10.4 ℃, 年均降水量188.1 mm, 是全国降水量最少的地区之一, 且降水分布极不均匀, 北疆多于南疆, 西部多于东部, 山区多于盆地。地区温差大, 吐鲁番盆地最高温度达49.6 ℃; 北部富蕴县可可托海, 极限低温至-51.5 ℃。新疆地域辽阔, 境内既有高山、丘陵、盆地, 又有平原绿洲、戈壁和沙漠, 不同的地貌条件发育和形成了多种多样的草地类型, 新疆草地总面积约0.57亿hm2, 其中可利用草地面积0.48亿hm2, 占全国可利用草地面积的20.2%, 居全国第3位[21, 22, 23]。
本研究中所采用美国国家航空航天面向全球免费提供的EOS/MODIS的MOD13A1数据产品的NDVI数据(http://e4ftl01.cr.usgs.gov/MOLT/), 时间分辨率为16 d, 其中像元值采用最大合成法(maximum value composite, MVC), 空间分辨率为500 m。利用专业处理软件MRT对数据进行格式转换、投影转换、拼接, 将HDF格式转换成Tiff格式。用新疆行政区划图裁剪出新疆2000-2011年逐年7月的NDVI栅格数据。研究中使用的草地类型数据为欧盟联合研究中心(JRC)空间应用研究所(SAI)的2000年全球覆盖数据产品(GLC2000), 分辨率1 000 m。用ArcGIS提取出新疆地区高山亚高山草地、高山亚高山草甸、草甸、荒漠草地、平原草地5种类型。新疆地区DEM数据(分辨率30 m), 来源于中国科学院计算机网络信息中心国际科学数据(http://www.gscloud.cn)。
本研究用于空间插值的气温、降水数据来自于中国气象数据网(http://data.cma.gov.cn/), 时间序列为2000-2011年每年的7月, 包括新疆108个气象站点的气温和降水数据, 以及各个站点的经度、纬度、海拔高程。对数据进行准确性检验, 剔除不连续数据、错误数据及冗余数据, 最终用90个站点的数据进行空间插值, 在此基础上计算2000-2011年各个站点的7月平均降水量及气温。
实测数据来自新疆维吾尔自治区草原总站提供的实测生物量数据, 采集时间为2011年7月中旬, 包括荒漠草原、山地草甸、平原草原、高寒草甸、低地草甸的86个实测点。
不同的空间插值方法, 有不同的适用范围, 针对不同数据的不同特点。在科学研究之前, 先对数据内插结果进行测试对比后, 择优选择是一般选择插值方法的原则。本研究基于2000-2011年多年7月平均降水量及气温数据, 通过对比分析协同克里格、反距离加权、ANUSPLIN插值法, 分析新疆地区最优插值方法, 借助ArcGIS软件地统计分析模块和ANUSPLIN平台实现。
1.3.1 协同克里格法(Cokriging) 协同克里格法是把区域化变量的最优估值方法从单一属性发展到两个以上的协同区域化属性。基于空间属性的相关联性, 对一个或多个变量采用空间估值的方法, 达到提高估值合理性与估值结果精度。高程数据对降水及气温有重要的影响, 所以使用高程作为影响降水和气温的第二影响因子, 加入到空间插值计算中。运用协同克里格估值方法, 其中将高程作为影响因子的公式可表示为:
Z=
式中:Z表示兴趣点气温(降水)的插值结果; λ i表示参与插值的点对预测点降水(气温)所占的权重值; n为实测站点的数量; Zi代表第i(i=1, 2, 3, …, n)个站点的真实测量值; y(x)表示x点的高程值; my、mz作为高程和降水(气温)的全局平均数值。
1.3.2 反距离加权法(IDW) 反距离加权插值是经常使用的插值方法, 即物体间的相似性与物体之间的距离呈反比。反距离加权法将样本点与插值点的距离作为权重加权平均, 样本点距离插值点越远, 权重越小, 用数学公式如下所示:
Z=[
式中:Z为待估算的降水量(气温)的栅格值; Z(xi)为第i(i=1, 2, 3, …, n)个气象站点的降水量(气温); n为用于插值的站点个数; di为插值点到第i个站点的距离; p为距离的幂。
1.3.3 ANUSPLIN插值法 ANUSPLIN运用普通薄盘和局部薄盘样条函数作为理论的插值方法。局部薄盘光滑样条法是在薄盘光滑样条法的基础上扩展而来, 与薄盘光滑样条法不同的是, 除普通的样条自变量以外, 局部薄盘光滑样条法允许引入线性协变量子模型, 例如海拔与气温之间的相关性[24]。可将局部薄盘光滑样条理论模型表示为以下数学公式:
Zi=f(xi)+bTyi+ei(i=1, 2, …, n) (3)
式中:Zi是i点的因变量; xi作为d维样条的独立变量, f(xi)为关于x需要估算的未知光滑函数; y是P维独立协变量; b为yi的P维系数; ei表示方差为wiσ 2和期望值等于0的自变量随机误差; wiσ 2中W作为权重的已知局部相对变异系数, σ 2为误差方差。当缺少bTyi, 即P=0, 模型可简化为普通薄盘光滑样条, 当公式中f(xi)不存在时, 则简化成了多元线性回归方程, 注意在局部薄盘光滑样条法中如果不存在f(xi), 数据处理将无法进行。函数f和系数b可使用最小二乘估计法计算:
式中:ρ 为光滑参数, 数值通常大于0, 主要作用于曲面粗糙度与数据保真度之间的平衡, Jm(f)是f(xi)的粗糙度测度函数, 作为f(xi)的m阶偏导数。m值表示糙度次数, 在局部薄盘光滑样条法中又叫作样条次数。本研究中, 气温插值采用纬度和经度作为独立变量, 高程作为独立协变量、样条次数为3的三变量的局部薄盘光滑样条函数, 降水的空间插值由于数据范围大以及不确定性强, 所以采用平方根变换用来降低数据的值域范围, 最后再运用普通双变量的薄盘样条函数。
为检验不同插值方法在研究区的预测精度, 利用ArcGIS地统计工具下的Subset工具随机构建两个子集, 选取90个气象站点的70%样本(N=63)为训练子集, 30%的样本(N=27)做验证子集。用训练子集中的样点进行插值预测, 得到验证子集中站点的降水(气温)值, 通过计算预测值与实测值的均方根误差(Root Mean Square Error, RMSE)和平均绝对误差(Mean Absolute Error, MAE)作为检验插值精度的标准, 计算公式如下:
RMSE=
MAE=
式中:Z0(xi)与Z(xi)分别作为第i个检验站点的预测和实测值; n为检验站点总数量。均方根误差和平均绝对误差总体数值越小, 说明插值方法的准确度越高, 平均绝对误差相同时, 均方根误差越小, 对应的准确度则越高。
相关研究表明, CASA模型比较适用于新疆地区草地NPP估算研究[25], 因此, 本研究采用朱文泉等[26, 27]改进的CASA模型。该模型由植被所吸收的光合有效辐射(APAR)和光能转化率(ε )共同确定。公式如下:
NPP(x, t)=APAR(x, t)× ε (x, t) (7)
式中:APAR(x, t)表示在t月、在像元x处植物所吸收的光合有效辐射, ε (x, t)表示在t月、在像元x处的植物实际光能利用率。APAR由光合有效辐射的吸收占比与太阳总辐射量确定, 用以下公式计算:
APAR(x, t)=SOL(x, t)× FPAR(x, t)× 0.5 (8)
式中:SOL(x, t)表示t月x处的太阳辐射总量, 0.5通常是植物对太阳有效辐射(400-700 nm)的利用率。
光能转化率是植被把吸收的光合有效辐射(PAR)通过光合作用转化为有机碳的效率, 光能转化率受温度和水分的影响较大, 用以下公式计算:
c(x, t)=Tε 2(x, t)× Tε 2(x, t)× wz(x, t)× ε max (9)
式中:Tε 2表示植物在不同温度条件下对光能转化率的影响, wz表示植物在不同水分条件下对光能转化率的影响, ε max表示在理想条件下植物的最大光能利用率。
在目前区域NPP的模型研究中, 模拟结果的检验通常采用对比法, 主要是将实测数据与模拟结果进行对比的方法。由于NPP野外实测的难度大、精度不高等因素, 所以在实际操作中一般采用将生物量转换成NPP数据用来代替NPP实测数据, 在本次研究中, 首先将生物量转换成草地NPP, 其次通过实测数据(换算值)与CASA模型模拟结果进行一对一分析, 完成模拟值的精度检验, 最后分析优化后的气象插值方法对草地NPP估算的影响。
插值分析前, 对建模站点数据进行统计特征检验。2000-2011年7月平均降水量总体变化在1.77~126.04 mm, 均值为26.326 mm, 中位数与降水量平均值有一定差距, 为21.975 mm, 偏态系数为1.799 4, 呈正偏(图2)。峰度系数为6.685 9, 表明新疆地区7月降水数据的分布比标准正态分布高耸。正态分布QQ图显示, 降水数据不符合正态分布, 需进行相应的数据转换, 本研究对降水数据采用log变换进行预处理(图3)。2000-2011年7月平均气温数据总体变化在5.83~32.88 ℃, 均值为23.422 ℃, 中位数与气温平均值较接近为24.654 ℃, 偏态系数为-1.905 9, 呈负偏。峰度系数为7.907 1, 表明新疆地区7月气温数据的分布比标准正态分布高耸。正态分布QQ图显示, 数据总体倾向于正态分布, 所以对气温数据无需进行相应的数据转换。
分别以全疆90个站点多年7月平均降水量为指标, 对降水数据进行空间插值, 新疆地区降水的总体空间格局呈北高南低, 乌鲁木齐、西部的伊犁河谷等地由于受地形、海拔、地理位置等的影响, 降水量显著增加, 而在塔克拉玛干沙漠、古尔班通古特沙漠等地区降水稀少。但是, 基于Cokriging法、IDW法、ANUSPLIN法插值出的结果有一定差距(图4), 因此, 对插值结果进行验证分析, 通过计算预测值与实测值的平均绝对误差、均方根误差作为检验插值精度的标准, 可以看出, 不同插值方法之间的平均绝对误差、均方根误差并不相同(表1)。
Cokriging法与IDW法的平均绝对误差(MAECK=12.12, MAEIDW=14.92)与均方根误差(RMSECK=21.21, RMSEIDW=24.37)均高于ANUSPLIN法(MAE=6.45, RMSE=8.77)。ANUSPIN法精度相比较CK法提高了46.78%, 较IDW法提高了56.77%, 具有明显的优势。另外, 不同插值方法所得结果在曲线平滑程度以及局部地区的空间分布具有一定差异, ANUSPLIN法比较平滑, 更能直观地表达新疆地区降水的分布情况, 而IDW法的插值结果在部分地区形成了明显的“ 牛眼” 。综上所述, 3种插值方法在新疆地区的插值精度为ANUSPLIN> Cokriging> IDW。这说明基于ANUSPLIN软件的插值方法更加适合新疆地区的降水数据插值。
分别利用Cokriging法、IDW法、ANUSPLIN法对新疆多年7月气温数据进行空间插值, 在南疆的沙漠地带气温较高, 尤其以吐鲁番附近气温最高, 而在一些绿洲区域及高山地区气温较低(图5)。Cokriging方法插值的气温范围为4.67~47.65 ℃, IDW方法插值的气温范围为5.83~32.59 ℃, Cokriging和IDW方法都未预测出山区的负值低温, 同时气温的地带性变异也不明显, 而ANUSPLIN则体现出了使用DEM预测气温的优势, 其插值的气温范围为-22.76~35.55 ℃。可以明显地突出昆仑山、天山、阿尔泰山的低温趋势。从平方根误差和均方根误差来看, 这3种插值方法相比较降水插值精度较高, ANUSPLIN进行的气温插值产生误差明显偏小(MAE=2.11, RMSE=3.52), 比Cokriging法(MAE=3.65, RMSE=5.28)精度提高了42.19%, 比IDW法(MAE=3.52, RMSE=4.84)精度提高了40.06%。综上所述, 3种插值方法在新疆地区插值精度为ANUSPLIN> IDW> Cokriging。说明基于ANUSPLIN软件的插值方法更加适合新疆地区的气温数据插值。
新疆草地植被NPP空间分布特征受区域水热条件的制约, 空间上呈北高南低的空间格局, 最高值出现在伊犁河谷地区以及北疆地区, 最低值出现在新疆南部地区, 由于北疆雨水较多, 而南疆夏季干旱少雨, 靠近沙漠(图6)。气温、降水对于草地NPP估算是至关重要的影响因素, 因此, 提高气象因子的插值精度, 提高其估算精度, 更有利于草地NPP的研究。基于Cokriging、IDW、ANUSPLIN这3种插值方法, 对降水、气温数据进行插值, 利用CASA模型对新疆地区草地NPP进行估算, 得出3种不同插值方法下的草地NPP。结合自治区草原总站提供的实测生物量数据, 对其数据进行处理转换, 将实测数据与同时期CASA模型模拟值相关性进行分析, 在不同插值方法下的草地NPP估算精度有一定区别(图7), 其中利用ANUSPLIN法进行气象要素插值的估算精度最高(R2=0.794 7), NPP实测值与模拟值有良好的线性关系。IDW法进行气象要素插值的估算精度最低(R2=0.671 8)。利用以上3种插值方法得出草地NPP值分别与实测草地NPP值进行计算, 求出二者之间的平均绝对误差和均方根误差, 进行对比分析(表2), 从平方根误差和均方根误差来看, 利用ANUSPLIN法气象插值下估算的草地NPP精度较高(MAE=16.66, RMSE=21.23), 其精度比Cokriging法(MAE=19.20, RMSE=25.17)提高了13.23%, 比IDW法(MAE=20.86, RMSE=27.00)提高了20.13%。说明提高气象要素的插值精度有利于新疆草地NPP的估算研究。
空间内插方法是气象要素区域平均过程的基础, 本研究表明, 基于ANUSPLIN插值方法的精度最高, 钱永兰等[28]研究表明, 与反距离权重法和克里格法进行逐日气象要素插值的结果进行对比, ANUSPLIN软件的插值误差最小。
在新疆的90个气象站中分别随机选择15、30、45、60、75个站作为试验样本参与插值, 剩余的站用于检验精度, 进一步分析随着气象站密度的变化, 不同插值方法的精度变化规律。结果表明(图8), 对降水与气温数据的插值, 站台数量较少时, 对比3种插值方法, ANUSPLIN法的精度明显较高, 但提高站点数量后, 3种插值方法的精度差异逐渐减小。由此说明, 在对气象站分布不均匀且密度较低的地区的降水和气温插值时, ANUSPLIN法更有优势。
新疆地区地貌复杂多样, 地形起伏较大, 气象站台稀少, 且分布不均匀。因此, 利用ANUSPLIN插值方法, 考虑了地形因子对气象数据插值的影响, 消除了地形对其空间分布格局的制约。利用ANUSPLIN插值的分布图更接近实际情况, 本研究也进一步推进了ANUSPLIN插值方法在新疆地区的应用。
在草地NPP的研究中, 由于基础条件(如设备条件、气象数据等)的一些限制, 对于提高估算精度有一定的困难, 应该转变思路, 通过选择更优的理论以及研究方法, 不断优化和提高研究成果精度。利用遥感模型对草地NPP进行估算是代替大量人力、物力工作的一个重要手段, 因此, 估算模型的精度尤为重要, CASA模型是一个充分考虑环境条件和植被本身特征的光能利用率模型, 将环境变量和遥感数据、植被生理参量联系起来, 为了更精确地估算NPP, 仅仅提高气象数据插值精度是远远不够的, 在研究中仍有需要改进的地方, 如:1)遥感数据精度不够高, 采用的500 m分辨率的MODIS产品数据及1 000 m的草地类型数据, 在今后的研究中可选择时间分辨率与空间分辨率都相对较高的数据, 将用其对研究区草地NPP估算的相关参数进行修正。2)不同草地类型的一些生理参量不同, 最大光利用率等参数也和草地类型相关, 因此将草地类型结合到光能利用率模型中, 针对不同的草地类型, 模拟出不同草地类型的最大光利用率, 进一步改进模型, 使其更合理化。3)植被指数也是光能利用率模型中重要参数, 不同区域环境合适不同的植被指数, 进一步的研究中应探索不同植被指数在估算草地NPP的适用性。
本研究选择2000-2011年7月新疆地区90个气象站点的降水、气温数据, 检验数据特征后, 分别采取协同克里格法、反距离加权法、ANUSPLIN法对降水气温数据进行插值, 再利用3种不同的插值方法得到的气象数据对新疆草地NPP进行估算, 比较其估算精度, 得出以下结论:
1)ANUSPLIN方法作为目前较好的曲面插值方法之一, 符合插值曲面对平滑度以及精确度的同时要求。通过对比研究, ANUSPLIN插值方法精度最高, 所以ANUSPLIN插值方法适合新疆地区气象数据插值。
2)ANUSPLIN法充分利用经纬度、高程等影响因素对降水以及气温的影响作用, 在气象站点密度低以及受自然因素影响站点分布不均的情况下, ANUSPLIN法的优势更加明显。新疆地区气象台站稀少、分布不均匀, 海拔变化较大、各季降水量差别很大, 因此, 为了进一步提高插值精度, 除了选择适合的插值模型, 还应引用更多的影响因子, 如坡度、坡向等。
3)由研究结果表明, 基于ANUSPLIN法得到的气象要素估算NPP的精度最高(R2=0.794 7), 因此, 提高气象数据的插值精度, 有利于草地NPP的估算研究。
对于本研究来说, 继续深入研究新疆草地NPP的估算研究仍是以后研究工作的方向, 而基于CASA模型进行草地NPP的估算中影响因素有很多, 包括降水、气温、草地类型、最大光能利用率等。因此, 在提高气象数据插值精度的同时对CASA模型中的参数本地化, 使其更加适合新疆草地NPP的估算, 以提高估算精度。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|