种植园映射在东南亚
- 1计算机科学与工程系,明尼苏达大学双子城,明尼阿波利斯,锰、美国
- 2自然资源和环境管理部门,夏威夷大学的马诺,火奴鲁鲁,嗨,美国
- 3环境研究所,明尼苏达大学双子城,圣保罗,锰、美国
种植园映射为理解森林砍伐和气候变化是很重要的。虽然大多数现有的种植园产品手动创建,在本文中,我们研究基于集成学习的框架自动映射在加里曼丹南部种植园规模每年使用遥感数据。我们学习几个组件在这个框架的有效性,包括类聚合、数据采样、学习模式选择和后处理,与多个基线进行比较。此外,我们分析我们的种植园测绘产品质量视觉检测的高分辨率图像。我们也比较方法对现有手动标记种植园数据集和表明,我们的方法可以实现一个更好的平衡精度(即。和回忆(即,用户的准确性)。生产者的准确性)。
1。介绍
近年来,生物燃料作物的合成提供了一个机会来减少对化石燃料的依赖。例如,生物柴油生产使用有机脂肪和植物油,如棕榈油和可用于汽油柴油。生物燃料可能有助于加强能源安全的国家,没有直接的化石燃料的存款,同时减少温室气体(GHG)的排放(Sorda et al ., 2010)。然而,生物燃料作物的生产也能对环境产生负面影响,例如森林砍伐(Fargione et al ., 2008)。此外,生物燃料也把更多的压力对水和土地资源,否则可以用于生产的食物(Cai et al ., 2010)。因此,对土地和水资源的竞争需要的食品和生物燃料生产的一个非常重要的问题food-water-energy辩论(Tilman et al ., 2009;Lambin Meyfroidt, 2011)。
一个典型的例子一个非常强大的相互作用的食物,水和能源是不可持续的在印尼棕榈油生产生物燃料和其他国家和人类消费(慕克吉Sovacool, 2014)。全球棕榈油产量是由印度尼西亚和马来西亚,占超过90%的全球棕榈油(WorldAtlas 2018)。印尼是目前全球最大的棕榈油生产国和出口国。此外,由于全球人口增加,对棕榈油的需求在全球范围内显示了增加的趋势。这种快速增长的棕榈油行业发生了严重损坏的热带森林碳循环中扮演非常重要的角色。热带森林覆盖只有7 - 10%的地球表面(Malhi和优雅,2000;夜莺et al ., 2004),但他们是全球重要,包含40 - 50%的碳存储在陆地植被。这些森林在全球碳循环的作用是很重要的,因为据估计,热带森林砍伐负责全球人为二氧化碳排放的20% (帕里et al ., 2007)。在东南亚热带雨林是独一无二的,因为他们有异常高的生物多样性和很大程度上的热带泥炭地。全球热带泥炭地非常丰富的碳汇包含88.6 Gt的泥炭碳池(等于15 - 19%的全球泥炭碳池),其中57.4 Gt仅在印尼泥炭地碳(et al ., 2011页)。森林间隙,泥炭地排水和火灾造成的(包括自然和人类)导致显著的CO的排放2到大气中。例如,1997 - 98年印尼泥炭火灾释放超过0.87吨的二氧化碳,相当于平均发布的年度全球化石燃料排放的14%在1990年代(et al ., 2002页)。
除了生物多样性丧失和高碳排放,棕榈油的大规模种植也能导致水土质量差和可用性问题。例如,棕榈油厂废水(梨果)处理未经处理的废物进入自然水源和水质造成严重的退化。此外,大量普通油萃取过程是水,因为它需要大量的水(Sheil et al ., 2009;Rupani et al ., 2010)。
种植产业的不可持续的性质在东南亚和世界其他地方已经被全球承认。不同的公司和政府正在努力确保棕榈油种植园满足严格的可持续性标准(Scarlat Dallemand, 2011)。举个例子,在一个新的欧盟生物燃料政策,任何进口棕榈油生物柴油,该地区必须在其全生命周期,证明储蓄35%的温室气体排放化石燃料柴油相比,和原料不能种植地区的生物多样性价值或股票高的碳。大企业集团在印度尼西亚和其他东南亚国家也开始朝着可持续棕榈油的生产通过认证下可持续棕榈油圆桌会议(棕榈油)(思腾Glasbergen, 2011)和其他认证项目,如国际可持续性和碳认证(ISCC) (莫泽et al ., 2014)和ISPO认证(Paoli et al ., 2013)。然而,评估这些不同政策的有效性取决于监控土地覆盖变化的能力由于种植园扩张(卡尔森et al ., 2018)。因此,这些土地使用可伸缩的和及时的监测是至关重要的对于理解程序和政策是否达到了既定目标(WCS, 2010;wak和亚洲,2014年)。
遥感图像的分类到不同的土地覆盖类被广泛使用的方法在不同的地球科学应用。从各种地球观测卫星遥感数据,如先进的高分辨率辐射计(NOAA AVHRR),卫星倒l 'Observation de la特(现货)植被、中分辨率成像光谱仪(MODIS),森林和陆地卫星,已经用于生产大规模土地覆盖和土地覆盖地图监控(Achard Estreguil, 1995;Mayaux et al ., 1998;汉森et al ., 2000)。
特别是通过各种地球观测卫星遥感数据获取提供了巨大的机会,监测土地利用/土地覆盖变化(LULC)引起的种植园种植。然而,当前状态的艺术方法基于遥感数据是有限的时间频率和可伸缩性由于各种原因,如需要人工干预,使用非常简单的机器学习方法,只适用于小区域(汉森et al ., 2008,2013年;Hoscilo et al ., 2011;董et al ., 2012;李和福克斯,2012年;Margono et al ., 2012;比赛当天艳阳高照et al ., 2012),b;齐格勒et al ., 2012;Gutierrez-Velez DeFries, 2013)。这个日期,没有现有的框架,它可以提供种植地图的自动化程度在年度尺度大的地区。
尽管每年种植园地图并不可用,一些组织已经开发出种植园地图为单个或几年。两个数据集树种植园(TP)数据集(彼得森et al ., 2016)和圆形标志数据集(Gunarso et al ., 2013)。这些数据集有合理的准确性,因为他们已经准备使用由人类专家目视判读。TP数据集提供了树种植园在选定的热带国家的位置大约在2013 - 2014。进行目视检查彼得森et al。(2016)有很好的回忆(即,这个数据集。,producer's accuracy, which is the fraction of true plantations that have been detected over the total amount of true plantations) but has poor precision (i.e., user's accuracy, which is the fraction of true plantations among the detected plantations). RSPO dataset is available for three different years namely 2001, 2005, and 2009. This product provides a very detailed map with 19 classes for each of these years. This dataset has higher precision but poor recall. Even though these datasets are imperfect, they can serve as different sources of noisy labels that can be used for training machine learning models.
虽然我们有一些手动创建的种植园地图作为标签的来源,土地覆盖变化的自动检测与种植园使用遥感数据集仍然是一个挑战性的任务由于各种原因:
高的多模:存在各种各样的土地覆盖类型在地球表面。不同的分类法已定义分类位置在地球表面在不同的粒度级别。例如,表1显示了三种不同的分类法。类似地,更详细或粗分类可以定义取决于应用程序。理想情况下,我们希望用最详细分类分类位置获得最大的土地覆盖变化信息。但在实践中,学习分类模型可以区分所有这些类是很困难的。不存在高精度地图能够提供足够的高质量的所有这些类的训练样本。在这项工作中,我们的目标是通过使用粗分类简化问题。具体来说,我们将所有的土地覆盖类型聚合成三个类即森林、种植园和所有其余的土地覆盖类型标记为其他土地覆盖类。森林类已经分开的其他类,因为我们也感兴趣的估计有多少的种植园建立了通过消除森林。现在这三个类子类内部使这些类在本质上高度综合。因此,我们需要从所有这些模式训练样本以达到更好的分类精度。
嘈杂的地面实况:在传统的分类设置,它假定高质量的地面实况标签可用于训练分类模型。然而,在这种情况下高质量地真理是不可用的。相反,来自不同来源的嘈杂的标签是可用的。因此,传统分类技术可能有限的性能在这个场景中。
高维度:大部分土地覆盖类年度增长周期,因此表现出季节性模式。分类不能通过仅使用一个时间步的类间可分性不同。例如,农作物领域收获后看起来非常类似于一个贫瘠的土地,因此不会区分。为了达到更好的分类性能,我们需要将两个光谱特性在个人的增长步伐和时间模式不同的土地覆盖类型。
时空异质性:由于大气扰动和自然变化在土地覆盖类型,分类模型在特定时间的特定区域可能不执行当应用到其他地区和时间。因此,有必要将特征空间变化为更好的性能。
在本文中,我们研究机器学习框架的有效性在年度规模地图种植园。这个框架学习从嘈杂的多层次合奏地面实况数据通过手工标记(即。、TP和达到。这项工作的主要贡献是研究几个组件在这个框架的有效性通过比较一组变异这个框架的性能。
我们比较的质量年度种植园区段提出了生成的框架与现有的数据集的印尼Kalimanthan地区用于训练我们的算法。具体地说,我们已经分析了部分Kalimanthan与MODIS瓷砖h29v09重叠。通过高分辨率图像的目视检查和手动标记点集,我们表明,该框架可以克服现有产品的缺点,从而有可能产生高质量的大型种植园地图小手动工作。
2。相关工作
提出了各种各样的方法使用不同空间和时间尺度的遥感监测土地覆盖的变化。然而,大多数这些方法只关注检测森林砍伐活动(汉森et al ., 2008;Hoscilo et al ., 2011;Margono et al ., 2012)。广泛使用的全球森林砍伐的产品(汉森et al ., 2013)不区分森林和种植园。同样,土地覆盖产品从美国国家航空航天局也不模型分别种植类。
土地覆盖类型的方法集中在检测转换从种植园/有几个问题,让他们不适合监测在大规模种植相关的活动。一些方法涉及广泛的人类参与使用目视判读检测过程(比赛当天艳阳高照et al ., 2012),b;齐格勒et al ., 2012)。一些自动基于机器学习的方法也在文献中被提出但他们使用非常简单的技术这样的阈值(董et al ., 2012;Gutierrez-Velez DeFries, 2013),最近邻方法(李和福克斯,2012年)。一些先进的机器学习方法只有在选择小规模的测试数据集(显示成功贾et al ., 2017 a,b)。由于这些原因当前状态的艺术方法适用性有限。
3所示。研究区域和数据集
3.1。MODIS数据和区域的研究
在本文中,我们利用MODIS MOD09A1数据集包含seven-band反射率值由MODIS仪器收集在美国宇航局Terra卫星。MODIS遥感数据的数据集在500 m分辨率为每一天。每日图像处理生成8天合成图像通过选择每个位置的反射值和最小噪声从相应的8天时间间隔。我们将验证该方法对MODIS瓷砖h29v09,如图所示图1,这是一个印度尼西亚(Kalimanthan南部plantation-intensive地区地区Abood et al ., 2015;STA 2018)。这个区域包含1312112个地点(即。,MODIS pixels) at 500m spatial resolution, or equivalently 328,028 km2。
3.2。真实数据集
3.2.1之上。树种植园数据集
树种植园数据集(TP)是由透明的世界,可以在全球森林的手表。在这个数据集,种植园位置标记根据陆地卫星图像大约2013 - 2014 (彼得森et al ., 2016),并且每个位置是进一步分为工业种植园,中型种植园马赛克,小型种植园马赛克或非常年轻的种植园。这个数据集包含了总共260483个地点在我们地区的研究。进行目视检查彼得森et al。(2016)从数字地球和我们与高分辨率图像,TP数据集涵盖了大部分真正的种植区域(高召回),但包含了许多错误(低精度)。
3.2.2。达到数据集
数据集是由圆形标志可持续棕榈油圆桌会议(棕榈油)Gunarso et al。(2013)在该地区,覆盖了所有的地方。在这个地区,每个位置都是分为19土地覆盖类型之一,2000年,2005年和2009年达到数据集。此外,它聚合19土地覆盖类型成9高层类,描述表1。简而言之,棕榈油种植园的数据集提供了信息和其他土地覆盖类型上2000年,2005年和2009年(见表2)。虽然报告(圆形标志Gunarso et al ., 2013)没有提供一个准确的评估,研究数字高分辨率图像显示,达到数据集是准确的(高精度),但真正错过许多种植园(低召回)领域。
表2。MODIS像素的计数为2000年土地覆盖,2005年和2009年(列3 - 5)和估计的区域(103公里2)每个土地覆盖类型的2000年,2005年和2009年(列6 - 8)MODIS瓷砖h29v09(南加里曼丹),报告的数据集的棕榈油。
4所示。方法
在本节中,我们将首先描述了整体学习提出了框架。然后我们介绍几种基线方法变异的方法。通过比较这些基线,我们能够证明每个组件在拟议的框架的有效性。
4.1。整体学习框架
种植园的映射是困难的从机器学习的角度来看,因为它需要区分种植园和多个土地覆盖类型。如果我们直接合并所有non-plantation类,如常绿森林、草原、农田、负类,进行二进制分类种植园和non-plantation之间负类的异质性将极大地阻碍了分类性能。有许多现有的多层次分类工作(Angulo et al ., 2003;贾et al ., 2019)和类异质性(Pavlidis et al ., 2001;Karpatne et al ., 2014)。然而,这些作品不能直接适应我们的问题由于不同土地覆盖类型的偏态和它们之间的关系。此外,复杂的特征空间遥感数据对学习过程构成了挑战。
为了解决这些挑战,提出框架学习一个模型在多个土地覆盖类。具体来说,我们在学习的过程中定义三个类:“庄园”,“森林”和“其他。”具体来说,“庄园”类包含多种类型的种植园和“森林”类包含延绵的森林和森林穿越道路但尚未登录。这三个类是RSPO聚合得到的土地覆盖类型,所述表1。这里我们分别模型类的“森林”有两个原因。首先,它是一个著名的挑战区分种植园和森林,因为油棕榈树可以成为绿色森林当他们成长为成熟阶段。其他土地覆盖类型,如城市和农田通常显示低水平的绿色,因此更容易区分种植园。其次,通过确定森林和种植园,我们可以更好地理解转换从热带雨林到种植园。
每一对之间的区别的知识学习课程,我们建议火车三个二元分类器:“种植”和“森林”(p),“森林”和“他人”(P-O),和“他人”和“庄园”(o f)。这样每个分类器集中在利用一对特定的类之间的区别的知识。这种学习策略可以极大地减少类异质性和提高学习的性能。因为每个二元分类器集中在区分一双特定类,总共有八个可能的组合的结果三个分类器。基于独立的预测,我们将分配聚合预测结果作为多数类标签。例如,如果两个p的分类器和O-P预测一个测试位置“庄园”,那么我们将标签这个测试位置“庄园”不管岗分类器的预测。我们总结每个预测之间的关系和聚合的预测表3。特别是,当三个二元分类器产生相互不同的标签,如最后两行所示,我们将标签测试样本为“未知”(U)。值得注意的是在我们的问题,我们检测种植园的报道感兴趣,明显的前两行。
更好的从时段遥测遥感数据中提取有用的区别的知识,我们训练但是深信念网络(DBN) (辛顿,2009)每个二元分类器(158年,64年,20隐变量,最后一层输出类标签)。我们给每个DBN模型的串联seven-band光谱特性为46收集日期一年。然后模型输出每年为每个像素一个类标签。
另一个重大挑战是不同土地覆盖类型可以高度倾斜在现实世界的数据集。培训过程很可能是由人口众多的土地覆盖类型,如裸露的土壤,如果我们采用统一的采样策略。为此,我们同时为每个子类样本的样本在每个聚合类。此外,培训数据从多个年RSPO基于采样数据集和TP的数据集。
最后,我们利用隐马尔可夫模型(HMM)后处理的分类从合奏获得输出模型。HMM模型能够获取共同的土地覆盖变化和修复一个错误分类标签根据其先前的标签。考虑每年的序列{森林,森林种植园,种植森林,种植园},排名靠前,位于第五的“森林”极有可能是一个分类的错误“庄园”,并将其固定,因为种植园很少转换回森林。
4.2。与基线比较方法
显示每个组件的有效性在计划的框架,我们比较一组(即基线涵盖不同的学习策略。、类聚合、训练数据采样和学习模型)和不同的后处理方法。
4.2.1。准备不同的学习策略
我们与使用不同的类聚合方法,训练数据采样和学习模式的选择。
•二进制:基线,我们训练种植园和non-plantation之间的二元分类器。与提出的三级分类策略相比,这个基线合并“森林”和“其他”类non-plantation。
•四级:这里使用三个聚合类,而是我们定义四类:“庄园”,“森林”“裸露的土壤,”和“其他。”“裸土”的定义是基于数据集(见圆形标志表1)。然后我们将火车6每一对类之间的二元分类器。用该方法类似,我们总预测结果多数投票。
•统一:基线我们统一样本每个聚合类“庄园”,“森林”和“其他”而不是把每个子类的样本。
•支持向量机:而不是DBN,我们实现我们的整体学习策略使用支持向量机(SVM)和RBF内核。
4.2.2。不同的后期处理策略
在拟议的框架中,我们利用19土地覆盖类型中定义(见圆形标志表1)作为后处理中的潜在类嗯。我们希望与后处理策略对HMM模型使用不同的设置。HMM模型预计模型少复杂的过渡模式,如果我们使用潜在的类的数量。
•NonP:这个基线与建议的学习方法是一样的,除了它不涉及后处理过程。
•HMM9:这里我们使用HMM进行后处理基于9 RSPO高级聚合类中提供的数据集。
•HMM3:在这里,我们使用基于三聚合classes-P嗯进行后处理,F, O。
这里我们介绍相关指标的测量性能。因为我们的方法生成年度种植园地图,我们可以测量上的性能。具体来说,我们将测量性能每年从2001年到2009年的回忆。每年计算召回的比例“自信的种植位置”成功地检测到。一个位置被标记为“自信的种植位置”如果是贴上由棕榈油种植园(可在2000、2005和2009年)在两个相邻的年{2000、2005、2009}。例如,如果一个位置贴上的棕榈油种植园的2000年和2005年,这是一个“自信的种植位置”每年从2000年到2005年。
自从RSPO数据集低召回,我们不能用圆形标志数据集在每年估计精度。相反,我们测量的整体精度使用树种植园(TP)数据集(2014年)因为TP具有较高的召回,因此没有标记TP的任何位置不太可能种植园。我们也测量整个召回RSPO使用数据集(2009年)。整个测量精度和召回使用所有探测到种植园的位置通过2001年到2014年。更正式,总体精度措施种植园的分数都贴上我们的方法和TP数据集所有检测到种植园的方法。整个召回措施的种植园的分数都贴上RSPO通过我们的方法和数据集在2009年对所有2009年棕榈油种植园标记的数据集。
5。实验和结果
5.1。种植园的地图
基于该方法,我们可以生成年度种植园地图。例如,我们给我们的种植园生成地图在2014年图2和日益增长的地区种植图3。根据我们的检测结果,这个地区的种植园面积平均年增幅约为10%。根据图3我们的方法检测比棕榈油种植园数据集但比TP数据集更少的种植园。在5.5节,我们将展示几个例子来研究我们的检测和现有产品的区别。
5.2。学习策略的比较
所示的结果表4,我们可以验证每个组件在该方法的有效性。首先,我们可以观察到二进制的二进制分类导致性能不满意由于non-plantation类内部的非均质性强。此外,四级导致精度小于该方法,因为我们有更复杂的组合6分类器的预测的基础上,和整体学习的结果可以更自信。此外,统一的性能不如我们的方法,因为培训是由人口众多的土地覆盖类型(例如,森林、农田),和忽略了小类(例如,裸露的土壤、采矿),类似于种植园。以这种方式训练分类器极有可能分类这些小类作为种植园,从而导致较低的精度。此外,我们可以观察到,该方法优于SVM以相当大的优势由于DBN的有效性从复杂的特征空间中提取有识别力的模式。
5.3。比较的后处理步骤
我们展示了该方法的性能和不同的后处理策略的基线表5。首先,NonP之间的比较和其他方法演示了后处理的有效性。此外,嗯使用19土地覆盖类优于HMM模型与9个潜在的类或三个潜在的类。这是因为19类可以更好地定义嗯的潜伏状态空间和更准确的模型的过渡过程。使用更少的潜在类相当于合并多个不同的过渡是一个过渡。导致合并后的异质性过渡模式可能会降低性能。
5.4。使用不同数量的训练数据性能
我们还检查分类性能和训练数据量之间的关系。具体来说,我们将测试性能在2001年,2005年、2009年和2013年使用不同数量的训练数据。性能测量使用一个单独的测试组3000自信种植园样本和3000 non-plantation样本(即。联盟的“森林”和“其他”)。
可以看出,有一种强烈的积极和训练数据的数量之间的非线性关系和模型性能(图4)。性能数据时迅速增加规模很小,但增长缓慢后大小大于10000的数据。
我们得出这样的结论:种植园映射是一个挑战,因为有效的探测种植园的分类模型的训练在一个新的地区需要足够的手动标记样本。只有足够的学习样本模型提取歧视模式区分种植园和其他土地覆盖。
5.5。视觉验证使用高分辨率数据
如前所述,树种植园回忆但是低精度高,而达到精度高,但较低的召回。这里我们想要展示我们的种植园生成地图可以达到一个更好的平衡比这两个真实的数据集。我们使用高分辨率数字数据来证明这一点。具体地说,我们研究三种不同的情况。
1。的位置贴上种植园的TP但不是圆形标志:分析这个场景中,我们展示了三个例子图5。红色代表地点在贴上种植园的方法和TP但不是圆形标志,和绿色代表只有TP标记的位置。我们显示相对应的高分辨率图像图5 a, C, E使用数字图5 b, D, F,分别。
图5。(A, C, E)示例的位置贴上种植园TP但不是圆形标志。红色表示标记的位置,该方法和TP,和绿色表示只有TP标记的位置。每个颜色的点的中心是一个500————500像素。(B, D, F)高分辨率数字图像(北顶部)在同一地区(A, C, E)。
根据高分辨率图像,红颜色的地区图5一个是一个真正的种植面积,但RSPO缺失的数据集。至于绿颜色的地区图5 c数据集,包括树种植园但不被我们的方法,我们可以清楚地看到,从高分辨率图像,它不是真正的种植园。在图5 e我们展示面积与位置在两个红色和绿色的颜色。从高分辨率的图像图5 f我们可以观察到,该方法可以检测真正的种植园和non-plantation区域之间的边界。
R1和R2这些例子,我们表明,该方法可以检测到缺少真正的种植位置数据集,同时避免圆形标志的位置错误检测到数据集树种植园。
2。的位置贴上种植园的方法但不是TP:现在我们需要几个例子的情况下检测到我们的方法但错过了从树种植园数据集,如图所示图6 a, C。通过使用相应的高分辨率图像(图6 b, D),我们可以清楚地看到,他们是真正的种植园。这样,我们证明了我们的方法有可能检测到真正的种植园,不是树种植园检测到的数据集。因此,我们的方法可以实现精度高,甚至高于估计精度使用树种植园数据集(0.8463)。
3所示。的位置贴上棕榈油种植园的但不是由该方法:我们给几家大型例子补丁图7 a, C和相应的高分辨率图像图7 b, D,分别。我们展示的位置贴上棕榈油种植园的但不是黄色的方法。根据我们的观察,这些位置通常是相邻的地点包括圆形标志数据集和我们的方法(蓝色)。
图7。(A, C)例子的位置贴上种植园由该方法而不是圆形标志(黄色)。蓝色表示检测到的位置的棕榈油和该方法。每个颜色的点的中心是一个500————500像素。(B, D)高分辨率数字图像(北顶部)在同一地区(A, C)。
根据相应的高分辨率图像,黄色的位置不是真实的种植园。这说明,有些地方是错误地贴上标签的棕榈油种植园的数据集,但正确的方法。因此,我们建议的方法的实际召回高于估计回忆价值RSPO使用数据集(0.8677)。
公平和全面验证我们的种植园地图生成真实需要足够的种植园样本。而生成的地图的视觉验证超出了本文的范围,我们使用sampling-based方法更详细的考试地点在上面讨论的三个场景和测量方法的准确性和现有的种植园的产品。我们之前讨论的结果报告(贾et al ., 2016)。
6。结论
在本文中,我们研究几个关键部件在机器学习框架自动创建种植园地图。这些组件包括类聚合、数据采样、学习模式选择和后处理。多个基线来自这个框架的评估确认每个组件的有效性。的视觉验证该框架在大区域在印度尼西亚(MODIS瓷砖h29v09)表明,该方法可以生成高质量的年度种植园地图和我们的检测精度和召回的达到一个更好的平衡比数据集,用于训练计划的框架。
本文提供的方法可以用来创建种植园映射产品。在未来,我们将利用生成的种植园地图更好地理解种植园转换如何影响环境和监控策略遵从性。
例如,分析使用的组合生成的种植园地图和辅助数据集,数据集如种植园让步1对潜在的非法种植区域有一个含义。我们还计划利用消防产品(Mithal et al ., 2018)从种植园转换和检测不受控制的火灾研究森林砍伐的影响。此外,我们将分析种植园动力学和碳排放之间的相关性2研究如何培养种植会导致大量的碳排放。
我们建议的方法也仍然有限的验证和图像输入,在未来的工作需要处理。第一个局限性在于使用的参考数据验证过程(例如,TP、棕榈油和数字)主要是通过手工检查。然而,一些种植园可能不是很容易识别视觉由于其先进的年龄和相关高的树木覆盖。第二,我们的分析也受到分辨率的MODIS数据。而陆地卫星的高分辨率数据(30米)和哨点数据(10米)提供潜在的地图种植园更准确地说,陆地卫星时间频率低(16天)和哨兵(5/10日)很难找到图像噪音小(例如,云)。联合多尺度学习框架有可能更好地描述目标的边界类与更高的空间分辨率,同时利用丰富的时态知识更频繁地收集的卫星数据。
数据可用性声明
这个手稿不公开的数据集,因为圆形标志数据集目前私人和仍在更新。请求访问数据集应该指向jiaxx221@umn.edu。
作者的贡献
XJ是主要作者进行了大部分的实验和分析。正义与发展党进行部分实验。KC,詹和PW是我们的领域专家,也在很大程度上帮助分析结果和帮助文本。VK是管理整个团队,还帮助审核工作。
资金
这项工作是由NSF奖1029711和NSF大数据奖1029711。詹和PW部分支持的贝尔蒙特论坛/ FACCE-JPI魔鬼资助项目(NE / M021327/1)。访问计算机设备是由明尼苏达州超级计算机研究所提供。
的利益冲突
作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。
脚注
1。^http://data.globalforestwatch.org/datasets/oil -棕榈- 2 c163.232%2c6.245 concessions?geometry=88.921%2c - 9.085%
2。^- 2 c131.77%2c4.239 http://data.globalforestwatch.org/datasets/e129158a68434ca49d96a40d0e3109b1?geometry=94.614%2c - 3.446%
引用
Abood, s。,Lee, J. S. H., Burivalova, Z., Garcia-Ulloa, J., and Koh, L. P. (2015). Relative contributions of the logging, fiber, oil palm, and mining industries to forest loss in indonesia.Conserv。列托人。8日,58 - 67。doi: 10.1111 / conl.12103
Achard F。,and Estreguil, C. (1995). Forest classification of southeast Asia using NOAA AVHRR data.快速眼动,参议员包围。54岁,198 - 208。
Angulo C。,Parra, X., and Catala, A. (2003). K-SVCR. A support vector machine for multi-class classification.Neurocomputing55岁,57 - 77。doi: 10.1016 / s0925 - 2312 (03) 00435 - 1
Cai, X。,Zhang, X., and Wang, D. (2010). Land availability for biofuel production.环绕。科学。抛光工艺。45岁,334 - 339。doi: 10.1021 / es103338e
卡尔森,k . M。Heilmayr, R。吉布斯,h·K。,Noojipady, P., Burns, D. N., Morton, D. C., et al. (2018). Effect of oil palm sustainability certification on deforestation and fire in Indonesia.Proc。国家的。学会科学。美国115年,121 - 126。doi: 10.1073 / pnas.1704728114
咚,J。,Xiao, X., Sheldon, S., Biradar, C., and Xie, G. (2012). Mapping tropical forests and rubber plantations in complex landscapes by integrating {PALSAR} and {MODIS} imagery.{ISPRS} j . Photogramm。快速眼动,Sens。74年,特尔。doi: 10.1016 / j.isprsjprs.2012.07.004
Fargione, J。山,J。,Tilman, D。,Polasky, S., and Hawthorne, P. (2008). Land clearing and the biofuel carbon debt.科学319年,1235 - 1238。doi: 10.1126 / science.1152747
Gunarso, P。,Hartoyo, M. E., Agus, F., Killeen, J., and T Goon, J. (2013).可持续棕榈油圆桌会议、吉隆坡、马来西亚。报告的技术小组第二温室气体可持续棕榈油圆桌会议的工作小组。网上:https://rspo.org/publications/download/a2ac85181ed4501
Gutierrez-Velez, v . H。,and DeFries, R. (2013). Annual multi-resolution detection of land cover conversion to oil palm in the peruvian amazon.快速眼动,参议员包围。129年,154 - 167。doi: 10.1016 / j.rse.2012.10.033
汉森,M。,DeFries, R., Townshend, J. R., and Sohlberg, R. (2000). Global land cover classification at 1 km spatial resolution using a classification tree approach.Int。j . Rem, Sens。21日,1331 - 1364。doi: 10.1080 / 014311600210209
汉森,m . C。,Potapov, P. V., Moore, R., Hancher, M., Turubanova, S., Tyukavina, A., et al. (2013). High-resolution global maps of 21st-century forest cover change.科学342年,850 - 853。doi: 10.1126 / science.1244693
汉森,m . C。,Stehman, S. V., Potapov, P. V., Loveland, T. R., Townshend, J. R., DeFries, R. S., et al. (2008). Humid tropical forest clearing from 2000 to 2005 quantified by using multitemporal and multiresolution remotely sensed data.Proc。国家的。学会科学。美国105年,9439 - 9444。doi: 10.1073 / pnas.0804042105
Hoscilo,。,页面,s E。,Tansey, K. J., and Rieley, J. O. (2011). Effect of repeated fires on land-cover change on peatland in southern central Kalimantan, Indonesia, from 1973 to 2005.Int。j .荒地火灾20岁,578 - 588。doi: 10.1071 / WF10029
贾,X。,Khandelwal, A., Gerber, J., Carlson, K., West, P., Samberg, L., et al. (2016).自动化的种植园在东南亚使用遥感数据的映射。技术报告16 - 029。双城,MN:明尼苏达大学计算机科学系。
贾,X。,Khandelwal, A., Nayak, G., Gerber, J., Carlson, K., West, P., et al. (2017a). “Incremental dual-memory LSTM in land cover prediction,” in第23届ACM SIGKDD学报》国际会议上知识发现和数据挖掘(哈利法克斯,NS: ACM), 867 - 876。
贾,X。,Khandelwal, A., Nayak, G., Gerber, J., Carlson, K., West, P., et al. (2017b). “Predict land covers with transition modeling and incremental learning,” in学报2017年暹罗国际会议数据挖掘(休斯顿,德克萨斯州:暹罗),171 - 179。
贾,X。,Wang, M., Khandelwal, A., Karpatne, A., and Kumar, V. (2019). “Recurrent generative networks for multi-resolution satellite data: an application in cropland monitoring,” in28日学报》国际联合会议上人工智能(澳门:AAAI出版社),2628 - 2634。doi: 10.24963 / ijcai.2019/365
Karpatne,。,Khandelwal, A., Boriah, S., and Kumar, V. (2014). “Predictive learning in the presence of heterogeneity and limited training data,” in长效磺胺(费城,宾夕法尼亚州:暹罗),253 - 261。
Lambin, e . F。,and Meyfroidt, P. (2011). Global land use change, economic globalization, and the looming land scarcity.Proc。国家的。学会科学。美国108年,3465 - 3472。doi: 10.1073 / pnas.1100480108
李,Z。,and Fox, J. M. (2012). Mapping rubber tree growth in mainland southeast asia using time-series {MODIS} 250m {NDVI} and statistical data.达成。Geogr。32岁,420 - 432。doi: 10.1016 / j.apgeog.2011.06.018
Malhi Y。,and Grace, J. (2000). Tropical forests and atmospheric carbon dioxide.生态发展趋势。另一个星球。15日,332 - 337。doi: 10.1016 / s0169 - 5347 (00) 01906 - 6
Margono, b。,Turubanova, S., Zhuravleva, I., Potapov, P., Tyukavina, A., Baccini, A., et al. (2012). Mapping and monitoring deforestation and forest degradation in Sumatra (Indonesia) using landsat time series data sets from 1990 to 2010.环绕。卷。7:034010。1748 - 9326/7/3/034010 doi: 10.1088 /
Mayaux, P。,Achard F。,and Malingreau, J.-P. (1998). Global tropical forest area measurements derived from coarse resolution satellite imagery: a comparison with other approaches.环绕。Conserv。25日,37-52。
比赛当天艳阳高照,J。Hooijer,。施,C。,Tollenaar, D., Vernimmen, R., Liew, S. C., et al. (2012a). Extent of industrial plantations on southeast asian peatlands in 2010 with analysis of historical expansion and future projections.华东桐柏生物能源4,908 - 918。doi: 10.1111 / j.1757-1707.2012.01172.x
比赛当天艳阳高照,J。施,C。,Tan, W. J., and Liew, S. C. (2012b). 2010 Land cover map of insular southeast asia in 250-m spatial resolution.快速眼动。参议员。3、11日至20日。doi: 10.1080 / 01431161.2010.526971
Mithal, V。,Nayak, G., Khandelwal, A., Kumar, V., Nemani, R., and Oza, N. (2018). Mapping burned areas in tropical forests using a novel machine learning framework.快速眼动,Sens。10:69。doi: 10.3390 / rs10010069
莫泽C。,Hildebrandt, T., and Bailis, R. (2014). “International sustainability standards and certification,” in可持续发展的生物燃料在拉丁美洲和加勒比地区(Springer), 27 - 69。
穆克吉,我。,and Sovacool, B. K. (2014). Palm oil-based biofuels and sustainability in southeast asia: a review of Indonesia, Malaysia, and Thailand.更新。维持。能源牧师。37岁的1 - 12。doi: 10.1016 / j.rser.2014.05.001
夜莺,J。、Phinn年代。,and Held, A. (2004). Ecosystem process models at multiple scales for mapping tropical forest productivity.掠夺。理论物理。Geogr。28日,241 - 281。doi: 10.1191 / 0309133304 pp411ra
页面,s E。,Rieley, J. O., and Banks, C. J. (2011). Global and regional importance of the tropical peatland carbon pool.水珠。改变医学杂志。17日,798 - 818。doi: 10.1111 / j.1365-2486.2010.02279.x
页面,s E。,Siegert, F., Rieley, J. O., Boehm, H.-D. V., Jaya, A., and Limin, S. (2002). The amount of carbon released from peat and forest fires in Indonesia during 1997.自然420年,61 - 65。doi: 10.1038 / nature01131
Paoli G。,Gillespie, P., Wells, P., Hovani, L., Sileuw, A., Franklin, N., et al. (2013).在印度尼西亚棕榈油:治理、决策和对可持续发展的影响。华盛顿特区:美国大自然保护协会。
帕里,M。,Canziani, O., Palutikof, J., Van der Linden, P., and Hanson, C. (2007). “Contribution of working group ii to the fourth assessment report of the intergovernmental panel on climate change, 2007,” in2007年气候变化:第二工作组:影响,适应和脆弱性。网上:https://www.ipcc.ch/report/ar4/wg2/
Pavlidis, P。韦斯顿,J。Cai, J。,and Grundy, W. N. (2001). “Gene functional classification from heterogeneous data,” in计算生物学学报》第五届国际会议上(蒙特利尔,QC: ACM), 249 - 255。
彼得森,R。,Goldman, E., Harris, N., Sargent, S., Aksenov, D., Manisha, A., et al. (2016).与多光谱图像映射树种植园:初步结果七热带国家。华盛顿特区:世界资源研究所。
Rupani, p F。,Singh, R. P., Ibrahim, M. H., and Esa, N. (2010). Review of current palm oil mill effluent (POME) treatment methods: vermicomposting as a sustainable practice.世界达成。科学。J。11日,70 - 81。
Scarlat, N。,and Dallemand, J.-F. (2011). Recent developments of biofuels/bioenergy sustainability certification: a global overview.能源政策39岁,1630 - 1646。doi: 10.1016 / j.enpol.2010.12.039
斯考滕,G。,and Glasbergen, P. (2011). Creating legitimacy in global private governance: the case of the roundtable on sustainable palm oil.生态。经济学。70年,1891 - 1899。doi: 10.1016 / j.ecolecon.2011.03.012
Sheil D。,Casson, A., Meijaard, E., Van Noordwjik, M., Gaskell, J., Sunderland-Groves, J., et al. (2009).油棕的影响和机遇在东南亚:我们知道我们需要知道什么?CIFOR偶尔纸没有数量。51。茂物:国际林业研究中心(CIFOR)主任。
Sorda G。,Banse, M., and Kemfert, C. (2010). An overview of biofuel policies across the world.能源政策38岁,6977 - 6988。doi: 10.1016 / j.enpol.2010.06.066
STA (2018)。统计印尼。网上:https://www.bps.go.id/dynamictable/2015/09/04%2000/protect/kern + .2222em / relax00 /保护/ kern + .2222em / relax00/838 /轻轨- tanamanperkebunan menurut - propinsi丹- jenis tanaman -印尼- 000 - ha - 2011 - 2016 . html(2018年7月7日通过)。
Tilman, D。,Socolow, R., Foley, J. A., Hill, J., Larson, E., Lynd, L., et al. (2009). Beneficial biofuels–the food, energy, and environment trilemma.科学325年,270 - 271。doi: 10.1126 / science.1177970
WorldAtlas (2018)。世界上顶级棕榈油生产国。网上:https://www.worldatlas.com/articles/top-palm-oil-producing-countries-in-the-world.html(2018年7月7日通过)。
关键词:遥感、种植园、深度学习、森林砍伐、整体学习
引用:卡尔森K,贾X,口,戈贝尔JS、西PC和Kumar V(2019)种植园映射在东南亚。前面。大数据46。doi: 10.3389 / fdata.2019.00046
收到:2019年3月16日;接受:2019年11月21日;
发表:2019年12月06。
编辑:
Ranga Raju Vatsavai美国北卡州立大学版权©2019,口,卡尔森,嘉宝,西和库马尔。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。
*通信:一些Kumarkumar001@umn.edu
__ORCID:美术学贾orcid.org/0000 - 0001 - 8544 - 5233
金伯利卡尔森orcid.org/0000 - 0003 - 2162 - 1378
詹姆斯·s·嘉宝orcid.org/0000 - 0002 - 6890 - 0481
保罗·c·西orcid.org/0000 - 0001 - 9024 - 1657