第30卷,第5期 光谱学与光谱分析2010年5月 SpectroscopyandSpectralAnalysisVol130,No15,pp129521300
May,2010
基于机载高光谱成像的柑橘产量预测模型研究
叶旭君1,KenshiSakai2,何 勇13
11浙江大学生物系统工程与食品科学学院,浙江杭州 31002921东京农工大学农学部,东京18328509,日本
摘 要 果树的隔年结果现象严重影响果园的果实产量和经济效益。选择受隔年结果现象影响较为严重的
柑橘作为研究对象,运用机载高光谱成像仪在较早生长季节(2003年4、5、6月)获取柑橘果树的高光谱图像,利用偏最小二乘回归(PLS)确定基于高光谱图像数据的模型预测变量,建立柑橘产量的多元线性回归(MLR)和人工神经网络(ANN)预测模型。研究结果表明,利用5月份获得的高光谱图像建立的模型具有最优的产量预测效果,而且PLS2MLR模型比PLS2ANN模型具有更好的稳定性和一致性。该研究结果为今后研制和开发基于高光谱成像技术的柑橘产量预测方法提供了重要的理论和技术基础。关键词 柑橘;PLS;MLR;ANN;预测模型;变量技术;中图分类号:S127 文献标识码:A DOI:1013964/j112(2引 言
大的影响。合理运用多种控制方法,并制定相应的肥水管理措施,可有效防止隔年结果现象
[1]
[11]。Goel等与Uno等利用机载光谱图象数据计算出几
个植被指数(Vegetationindex)用以估算玉米的产量,并获得了较准确的预测结果[12,13]。上述研究主要是基于传感器或成像仪能够识别作物多种生物物理和生理特性的能力,建立这些特性变量与作物产量直接或间接的相关关系,能在一定程度上反映作物的产量水平。另一方面,作物光谱数据的获得时间也决定作物产量预测的准确性[14,15]。因此,需要针对不同农作物确定相应的光谱适宜采集时期,才能获得准确的产量预测结果。
本研究选择受隔年结果现象影响较为严重的柑橘作为研究对象,运用机载高光谱成像仪获取柑橘的高光谱数据,利用偏最小二乘回归(Partialleastsquareregression)确定模型的预测变量,并采用多元线形回归(Multiplelinearregres2
sion)和人工神经网络(Artificialneuralnetworks)方法建立基
。然而每棵果树均作为独
立的个体存在隔年结果现象,传统的果园管理方法,无法满
足不同果树个体因隔年结果趋势差异及对各种控制方法和管理措施的需求。另一方面,大多数果园都采用均一管理方式,没有考虑到不同区块的空间变异性,导致部分果树的施肥量过高或过低。而成功应用各种隔年结果控制方法和肥水管理措施的关键是获得每棵果树个体的产量信息,并以此为依据,针对果树个体制定相应的隔年结果控制方法和肥水管理措施。这种变量技术(Variableratetechnology),可以增加果园盈利,同时减少化肥的过量应用,降低污染地下水的风险。
遥感光谱数据与多种作物的生物物理和生理参数密切相关,主要包括叶面积指数(LAI)、叶片绿色度、株高、叶片氮含量、叶绿素含量、水分含量等[228]。因此,利用遥感图像可以评价作物的生长发育状况,进而对作物进行精细化的管理和作业。近几年,遥感技术也被应用于作物的产量预测。Yang等通过比较机载高光谱数据与产量的监测数据,发现棉花和高粱的产量与其高光谱反射数据呈显著正相关[9,10]。 收稿日期:2009208209,修订日期:2009211212
于遥感光谱数据的柑橘产量预测模型。在较早季节获得的柑橘预测产量,可用于准确判断柑橘不同个体的隔年结果趋
势,为制定每棵果树的合理隔年结果控制方法和肥水管理措施提供了重要依据。
1 材料与方法
111 研究地概况
基金项目:日本科学振兴会(JSPS)项目(2110,14360148,15658074)资助
作者简介:叶旭君,1971年生,浙江大学生物系统工程与食品科学学院助理研究员 e2mail:yezising@zju1edu1cn
3通讯联系人 e2mail:yhe@zju1edu1cn
1296光谱学与光谱分析 第30卷
取图像中每个像素的任一波段的光谱反射值,同时也可以用多边形工具选定图形对象,并对其所包含的像素进行统计学分析,提取图形对象的光谱反射特征。本研究以柑橘个体为研究对象,因此首先以多边形工具识别并确定图像中各个果树个体的冠层。然后利用ERDASImagine816图像处理软件的嵌入式程序,提取图像中选定的各个树冠的平均反射值。这些各个波段的平均反射值能反映不同柑橘果树个体的树冠构成特点,将作为预测变量用于建立柑橘产量的预测模型。图2为从4个不同时期获得的高光谱图像提取的一棵果树冠层的光谱数据。由图中可见,不同时期获得的高光谱数据存在一定差异,表明果树的冠层结构随着季节改变而发生变化
。
本研究在位于日本神奈川县根府川农业试验站的一个柑
)。橘试验场进行(东经139°07′440129″、北纬35°12′130101″
该地区属于温带气候,全年平均气温1514℃,年降水量176215mm。本研究所选择的柑橘品种为温州蜜柑(CitrusunshiuMarc1),试验在一个占地面积约为2700m2的果园进行。该果园采用传统的生产管理措施,即对每棵果树采用在时间、数量和频率等方面一致的施肥、除草、中耕、收获等措施。在本研究期间,该果园未遭受严重气候灾害和病虫害的影响。112 高光谱图像获取、分析与处理
本研究利用机载高光谱成像系统AISAEagle获取试验果园的高光谱图像。AISAEagle能拍摄72个波段的遥感图像,其波长范围为407~898nm,空间分辨率为110m×110m。为了确定可用于预测柑橘产量的高光谱图像的最佳获取季节,于2003年(4月10日、5月21日和6月5日)在柑橘的早期生长季节分3次获取了柑橘的高光谱图像。根据所建模型的预测效果,于2004年(5月26日)再次获取柑橘的高光谱图像,用以检验不同建模方法的预测效果。所有图像均在距地面约1000m的高空,在没有云层干扰的时期拍摄获得。AISAEagle拍摄获得的数据由芬兰光谱成像有限公司SPECIM实验室确定的校正系数进行校正。地面对象在传感器的辐射先经转换为地面反射率,然后经大气校正,何失真校正后,()标。图1为从4月
2ofaveragespectralreflectancedataforonecit2
ruscanopyextractedfromhyperspectralimagesac2quiredonfourdates
114 柑橘产量数据的获取
本研究记载了2003~2004年期间试验果园每棵柑橘果树的产量数据(每颗果树收获的果实个数)。作为初步分析,选定果园内48棵果树作为本研究的研究对象(图1)。这些果树目前均处于成年期,植株具有相对稳定持续的开花结果能力。
115 基于高光谱数据的柑橘产量预测变量的确定
高光谱数据包含许多波长的光谱数据,而且通常极易存在多重共线性(Multicollinearity)问题,表现为各波长数据,特别是相邻波长数据之间存在高度线性相关关系。因此,需在建模前对高光谱数据进行预统计分析,以消除原始数据中多余的变量。本研究采用偏最小二乘回归(PLS)方法确定柑橘产量模型的预测变量,通过选定排列前几位的少数几个因子建立回归模型达到较好的预测效果[16,17]。
116 柑橘产量预测模型的建立、验证与评价
Fig11 ExperimentalcitrusorchardatNebukawaAgricultural
ResearchStation,KanagawaPrefectureinJapan1Lo2cationof48treesofsamevarietyandagecategoryusedinthestudyisshownbywhitecircle
113 柑橘冠层高光谱数据的提取
利用PLS确定的主成分作为预测变量,采用多元线性回归(multiplelinearregression,MLR)和人工神经网络(artifi2
cialneuralnetworks,ANN)模型[18],分别建立柑橘产量的PLS2MLR和PLS2ANN预测模型。
经校正的高光谱图像先调入ERDASImagine816图像处理软件。该软件具有强大的图像分析和处理功能,可以提
为验证所建模型的一致性(Consistency),按以下方法将
所有样本数据平均分为两个组:首先,所有样本数据(48棵果树)按产量数据进行排列,从1到48按顺序对各样本进行编号;然后,将样本分为奇数组和偶数组,分别用于建模和
第5期 光谱学与光谱分析验证。以上方法获得的两组数据的平均产量分别为26913和26115,标准偏差分别为21614和20618,表现相似的数据分布特征,因此有利于提高所建模型的一致性。
模型评价指标采用决定系数(R2)、均方差(RMSE)和相对均方差(RRMSE),其中R2越大表明模型越好,而RMSE和RRMSE越小则表明模型的预测效果越佳。其中RRMSE的计算公式如下
RRMSE=
N
1297
[Y(i)∑
N
来确定最佳主成份数[19]。由于PRESS为测量数据的绝对误
差值,而本研究中不同果树个体因受隔年结果影响,同一生长季节内果树产量差异极其悬殊,采用PRESS指标时,其值较大。本文采用代表相对误差值的RRMSE作为评价标准。 RRMSE值越小,说明建模的预测能力越好。图3表明了不同主成分数对RRMSE的影响。由图3可以看出,利用不同时期获得的图像数据建立模型,开始阶段随着模型主成分数的增加,其验证集的RRMSE均逐渐减小,说明此前的
-^Y(i)]2
(1)
- Y]2
i=1
[Y(i)∑
式中:N是样本数,Y(i)是第i个样本的实际值,^Y(i)是第i
个样本的预测值, Y是样本预测值的平均值。
2 结果与分析
211 最佳建模主成分数的确定
利用PLS方法建立模型时,需要确定建立模型所使用的最佳主成分数,来保证既能避免不充分拟合,又能避免出现过度拟合的情况。一般研究中,常采用预测残差平方和(pre2dictionresidualerrorsumofsquare,PRESS)
作为评价标准,
Fig13 intheRRMSEoftheationsetasthenum2
berincreased
Fig14 Performanceofthe2003PLS2MLRmodelsdevelopedwiththeoptimal
PLSfactors(forboththetraining(a)andvalidationdataset(b))
1298光谱学与光谱分析 第30卷
图像上加以识别,因此从不同冠层提取的经定量化的光谱特征,进而可以反映冠层不同叶龄叶片的构成状况。本研究表明利用冠层的高光谱图像,通过提取定量化的高光谱特征并建立相应的模型,可以较好地预测柑橘个体的产量。213 PLS2ANN模型
利用选定的PLS主成分分别建立不同时期图像的人工神经网络模型(PLS2ANN)。本研究建立的PLS2ANN模型为一个3层神经网络结构,包括1个输入层(PLS主成分)、1个中间层(5个神经元)和1个输出层(柑橘产量)。中间层和输出层神经元的转换函数分别取为常规S形函数和线性函数,通过对中间层神经元的常规S形函数转换实现对输入层特征提取的非线性变换。与PLS2MLR模型相比较,PLS2ANN模型是非线性的,因此在拟合输入层和输出层变量之间的关系时具有更好的灵活性。由图5可见,PLS2ANN模型比PLS2MLR模型显示更好的预测效果,3个模型建模集和验证集的各评价指标均优于PLS2MLR模型。而且,利用5月份高光谱图像建立的PLS2ANN模型也取得了优于利用4月和6月图像建立的PLS2ANN模型的预测效果。这一结果与PLS2MLR模型的结果一致,5月份果树冠层结,5月份可确定为。
模型因主成分数偏少拟合不充分,而当主成分数达到并超过一定数量时,其值明显增大,此时表明模型已经出现过拟合现象。因此,当验证集的RRMSE最小时所建模型的主成分数可视为建模的最佳主成分数。由图3可见,2003年4、5、6月不同时期获得图像的最佳主成分数分别为6,7,4。212 PLS2MLR模型
用2003年4、5、6月不同时期获得图像的最佳主成分建立各自图像的最佳PLS2MLR模型,并用其预测建模集和验证集样本的产量,所得到的预测产量和实际产量的散点图、最优拟合直线及其回归方程的有关参数列于图4。图4中(a)和(b)分别表示建模集和验证集的预测结果。从图4可以看出,建模集的线性回归方程的R2比验证集的线性回归方程的R2稍大,而建模集的RMSE和RRMSE比验证集的RMSE和RRMSE较小,表明模型预测建模集的效果比预测验证集的效果更好,该结果与一般数学建模结果的趋势一致。比较利用4,5,6月份图像建立的模型可见,5月份获得图像的模型预测效果最佳,其次为4月和6月。已有研究发现,果树个体冠层的叶龄状况(新老叶构成)一定程度上可以反映该个体上年的产量水平及次年的产量潜力[20]。新叶的叶片颜色为淡绿色,而叶龄较大的老叶因化合物积累较多,叶片呈深绿色。不同叶龄叶片因其颜色的差异,能在高光谱
Fig15 Performanceofthe2003PLS3ANNmodelsdevelopedwiththeoptimal
PLSfactors(forboththetraining(a)andvalidationdataset(b))
第5期 光谱学与光谱分析
214 PLS2MLR模型和PLS2ANN模型稳定性比较
1299
根据以上分析结果,选定2003年5月获得图像建立的PLS2MLR模型和PLS2ANN模型作为预测模型,并用2003年5月和2004年5月提取的光谱主成分作为输入变量,用来预测2003年和2004年各柑橘果树个体的产量。图6显示了两种模型分别预测2003年和2004年试验地橘园产量的空间分布图。由图6可见,PLS2MLR模型和PLS2ANN模型在预测2003年产量时均取得了较好的预测效果,比较两模型的预测效果发现,PLS2ANN模型比PLS2MLR模型的预测效果更好。然而,利用次年的2004年5月获得的图像代入基于2003年5月获得图像建立的模型,其结果显示,PLS2MLR模型获得的预测效果优于PLS2ANN模型的预测结果,
其获得的各果树产量的空间分布与实测产量的空间分布更为一致。由此可见,利用2003年5月获得图像建立的PLS2MLR模型和PLS2ANN模型作为预测模型,并用不同年份同一季节(如2004年5月)获得的高光谱图像作为预测输入变量,PLS2MLR模型比PLS2ANN模型表现更好的稳定性和一致性。该结果表明,柑橘果树冠层的高光谱特征与其产量之间表现较稳定的线性关系,基于非线性的PLS2ANN模型仅在利用同一生长周期较早季节获得的图像预测该生长周期末的产量时表现较好的准确度。因此,基于建立的模型,利用任一年份同一季节的图像作为预测变量时,具有较高稳定性的PLS2MLR模型比PLS2ANN模型有更好的应用潜力
。
Fig16 Rand2withthehyperspectralimagery
21,thecitrusyieldof2003and2004
3 结 论
基于变量技术的精细农业管理方式可以有效防止果树的隔年结果现象。应用该技术可在较早生长季节获得每棵果树个体的产量信息,制定针对每棵果树个体的隔年结果控制方法和肥水管理措施。本研究通过获得柑橘的高光谱图像数据,利用PLS回归确定模型的预测变量,并采用多元线形回
参
考
归和人工神经网络方法建立基于遥感光谱数据的柑橘产量预测模型。分析表明,柑橘在5月获得的高光谱图像建立的模型具有最优的预测效果。此外,利用5月份图像建立的PLS2MLR模型比PLS2ANN模型具有更好的稳定性和一致性。因此,利用5月高光谱图像建立的PLS2MLR模型,通过获得不同年份同一季节的图像,可以较准确地预测该年份的柑橘产量。本研究结果为今后研制和开发基于高光谱成像技术的柑橘产量预测方法提供了重要的理论和技术基础。文
献
[1] OkudaH,KiharaT,NodaK,etal.BulletinoftheNationalInstituteofFruitTreeScience,2002,1:61.
[2] FENGXiao,ZHENGGuo2qing,QIAOShu,etal(冯 晓,郑国清,乔 淑,等).JournalofMaizeSciences(玉米科学),2008,16(6):
86.
[3] ZHUYan,LIYing2xue,ZHOUDong2qin,etal(朱 艳,李映雪,周冬琴,等).ActaEcologicaSinica(生态学报),2006,26(10):3363.[4] SerranoL,FilellaI,PenuelasJ.CropScience,2000,40:723.
[5] ZHAOGuo2fu,WANGJian2xing(赵国富,王建兴).JournalofAgriculturalMechanizationResearch(农机化研究),2008,11:33.[6] ThenkabailPS,SmithRB,dePauwE.RemoteSensingofEnvironment,2001,71:158.
[7] JIHai2yan,WANGPeng2xin,YANTai2lai(吉海彦,王鹏新,严泰来).SpectroscopyandSpectralAnalysis(光谱学与光谱分析),2007,
27(3):514.
[8] OsborneSL,SchepersJS,FrancisDD,etal.CropScience,2002,42:165.[9] YangCH,EverittJ,BradfordJ,etal.PrecisionAgriculture,2003,5:445.[10] YangCH,EverittJ,BradfordJ.TransactionsoftheASAE,2004,47:915.[11] RodriguezJC,DucheminB,HadriaR,etal.Agronomie,2004,24:295.
[12] GoelPK,PrasherSO,LandryJA,etal.TransactionsoftheASAE,2003,46:1235.
1300光谱学与光谱分析 第30卷
[13] UnoY,PrasherSO,LacroixR,http://putersandElectronicsinAgriculture,2005,47:149.[14] ChangKW,ShenY,LoJC.AgronomyJournal,2005,97:872.[15] ShimizuT.AgriculturalandForestryFinance,2002,23:508.
[16] AbdiH.PartialLeastSquares(PLS)Regression.In:Lewis2BeckM,BrymanA,FutingT.Eds.EncyclopediaofSocialSciences
ResearchMethods.ThousandOaks(CA):Sage,2003.
[17] RamadanZ,HopkePK,JohnsonMJ,etal.ChemometricsandIntelligentLaboratorySystems,2004,75:23.[18] AtkinsonPM,TatnallARL.InternationalJournalofRemoteSensing,1997,18:699.
[19] LUWan2zhen,YUANHong2fu,XUGuang2tong,etal(陆婉珍,袁洪福,徐广通,等).ModernNearInfraredSpectralAnalysisTech2
niques(现代近红外光谱分析技术).Beijing:ChinaPetrochemicalPress(北京:中国石化出版社),2000.
[20] YeX,SakaiK,GarcianoLO,etal.EcologicalModelling,2006,98:426.
DevelopmentofCitrusYieldPredictionModelBasedonAirborneHyperspectralImaging
YEXu2jun1,KenshiSakai2,HEYong13
1.CollegeofBiosystemsEngineeringandFoodScience,ZhejiangUniversity,Hangzhou 310029,China2.FacultyofAgriculture,TokyoUniversityofAgricultureandTechnology,Tokyo18328509,Japan
Abstract Thephenomenonofalternatebearingoffruitsseriouslyaffectsthefruityieldsaswellasthebenefitsofor2chards.Thepresentstudyinvestigatedthepossibilityofairborneofindividualcit2rustrees.Thehyperspectraldatawerefirstextractedfromtheusingpartialleast2squaresregression(PLS).TheoptimalPLS,andasinputsofcitrusyieldpre2dictionmodelsdeveloped(neuralnetwork(ANN)modellingtech2niques.TheonimagesobtainedinMayachievedthebestprediction,andthePLS2MLRaandconsistencythanthePLS2ANNmodel.Theseresultsproviodeanimportanttheo2reticalandfoundationforthefutureresearchanddevelopmentofhyperspectralimaging2basedcitrusproductiontech2niques.
Keywords Citrus;PLS;MLR;ANN;Predictionmodel;Variableratetechnology;Precisionagriculture
(ReceivedAug.9,2009;acceptedNov.12,2009)
3Correspondingauthor