准备数据
为了做出明智的森林保护决策,您需要确定具有共同生物气候特征的区域。
浏览工程
您将从下载教程数据开始。
- 下载 IdentifyRegions.ppkx 工程包,并在计算机上找到下载的文件。
注:
大多数 Web 浏览器默认将文件下载到计算机的 Downloads 文件夹中。 - 双击 IdentifyRegions.ppkx 工程包。
工程包可用于共享 ArcGIS Pro 工程和数据。 打开这些压缩文件后,工程的副本将提取到您的 C:\Users\[user name]\Documents\ArcGIS\Packages 文件夹。
工程包提取后,工程随即在一个显示底图和埃尔云克国家森林轮廓的地图上打开。
埃尔云克国家森林位于波多黎各东部。
下载生物气候数据
地球陆地表面区域高分辨率气候学 (CHELSA) 生物气候变量数据集是一个高分辨率的全球气候数据集,可用于模拟物种分布。 您将下载一个可能对您的分析有用的变量栅格。
- 在浏览器中,转到 CHELSA Bioclim 页面。
- 读取 Bioclim 数据集的描述。
注:
在调查可能对您有用的数据图层时,研究其描述至关重要,该页面提供了数据相关的重要背景信息,包括数据编辑者、收集方法、预期用途以及是否存在使用限制或哪些人可以使用这些数据。CHELSA 数据是在引用原始出版物和数据集的条件下提供的。
- 向下滚动至图层描述表。
此表提供了有关每个图层的信息,可帮助您确定要使用的图层。
bio1 图层包含年平均气温数据。 这对于识别森林中的区域可能很有用。
该表中记录了 50 个图层。 以 bio 为前缀的 19 个图层是本教程感兴趣的。 根据您的保护工作的详细信息,您会选择不同的图层组合。
- 向上滚动到表格上方,然后单击可在此下载图层下载链接。
将打开 S3 文件浏览器页面。 它将显示四个文件夹。 第一个文件夹是 1981-2010 年期间的历史数据。 其他三个文件夹包含使用不同气候模型产生的预测数据。
- 在 S3 文件浏览器页面上,单击 1981-2010/ 文件夹旁边的展开按钮。
随即展开该文件夹。
- 单击 bio/ 文件夹旁边的展开按钮。
- 查找文件名中带有 _bio1_ 的文件,并单击 CHELSA_bio1_1981-2010.V.2.1.tif 文件的下载按钮。
CHELSA_bio1_1981-2010.V.2.1.tif 文件将下载到您的计算机。 该文件为 110 MB。
根据您之前查看的表格,此文件是 1981-2010 年期间年平均气温的栅格数据集。
您将对该文件进行裁剪和采样,以获取您的森林的数据。
对于本教程,您不需要下载任何其他生物气候数据文件。 它们已被下载和裁剪,并存储在工程中供您以后使用。
向工程添加数据
现在您已经下载了气温数据,您将把它添加到您的工程中。
- 在 ArcGIS Pro 的功能区中单击地图选项卡,并在图层部分中单击添加数据。
- 在添加数据窗口中,展开计算机,展开此 PC,然后单击下载。
如果您的浏览器设置为下载到另一个位置,请在 Microsoft File Explorer 中找到该文件,并在添加数据窗口中浏览到该位置。
- 单击 CHELSA_bio1_1981-2010.V.2.1.tif 栅格数据集,然后单击确定。
将显示一条消息,询问您是否要计算栅格的统计数据。
- 单击是。
CHELSA_bio1_1981-2010_V.2.1.tif 图层将出现在地图上。
该图层具有全局范围,但这一部分主要显示为白色。 它覆盖了之前可见的底图。 您可以看到森林边界多边形和森林中的一些浅灰色像素。
如果查看图层值范围,您会发现此栅格中的像元值介于 2196 和 3079 之间,高值以较浅的灰色阴影绘制。
如果您查看描述数据的表格,您会看到数据有一个比例因子和一个偏移。
基于此信息进行转换(乘以比例值 0.1,然后减去 273.15),栅格值将转换为摄氏度,范围从 -53.55 到 34.75。
- 在内容窗格中,右键单击 CHELSA_bio1_1981-2010.V.2.1.tif 图层,然后单击缩放至图层。
该地图将显示图层的全图范围。
您可以看到赤道区域是浅色的,温度值较高,两极是深色的,温度值较低。 公园边界是一小片黑色的图面。
探索您下载的数据是有好处的,这样您就能了解它是否适合您的分析。
- 在内容窗格中,右键单击 boundary 图层,然后单击缩放至图层。
您已经下载并探索了 CHELSA_bio1_1981-2010.V.2.1.tif 图层。 其看起来会对您的分析有用。
裁剪栅格
在森林中工作时不需要完整的数据范围,因此接下来您将使用森林边界裁剪数据。
- 在功能区分析选项卡的地理处理组中,单击工具。
将出现地理处理窗格。
- 在地理处理窗格的搜索框中,输入 clip raster,然后在工具搜索结果中,单击裁剪栅格工具。
- 在裁剪栅格工具上,为输入栅格选择 CHELSA_bio1_1981-2010.V.2.1.tif 图层。
- 对于输出范围,选择边界图层。
该工具会将输入栅格裁剪至边界要素图层的全图范围,除非您指定应使用图层中的要素进行裁剪。
- 选中使用输入要素裁剪几何框。
这将把栅格裁剪到森林边界。
输出栅格数据集名称默认为原始栅格名称的第一部分,末尾附加 _Clip。 栅格将保存在工程地理数据库中。
- 单击运行。
栅将被裁剪,并且 CHELSA_bio1_19812010_V_Clip 图层将被添加到地图中。
由于裁剪后的栅格包含的值范围与原始栅格不同,因此图层的符号系统也不同,色带更清晰地显示了森林中的值范围。
您不再需要具有完整全局范围的原始栅格,因此现在要将其移除。
- 在内容窗格中,右键单击 CHELSA_bio1_1981-2010.V.2.1.tif 图层,然后单击移除。
注:
为了节省时间和减少教程数据下载量,其他生物气候变量的栅格已被裁剪。 如果您必须自己执行此操作,您可以在批处理模式下打开裁剪栅格工具,方法是搜索该工具,右键单击该工具,然后单击批处理。 在批处理工具设置窗格中,批处理工具的批处理参数将是输入栅格。 单击下一步,批量裁剪栅格工具将打开。 然后,您可以为批量输入栅格添加所有输入栅格,并按照您对裁剪栅格工具采取的方式配置其余的工具设置。 运行该工具会将每个栅格裁剪到森林范围。
生成采样点
下一步是从栅格创建一组点。 这将允许您以允许可视化和多元聚类分析的方式组合来自多个栅格的数据。 您将使用栅格转点工具在像元中心创建一组点,并将栅格值作为属性。
- 在裁剪栅格工具上,单击后退按钮。
- 在地理处理窗格的搜索框中,输入 raster to point,然后在工具搜索结果中,单击栅格转点工具。
- 在栅格转点工具上,为输入栅格选择 CHELSA_bio1_19812010_V_Clip 图层。
- 对于字段,接受默认值 value。
- 对于输出点要素,输入 bioclimate_points。
- 单击运行。
bioclimate_points 图层将被添加到地图中。
您将使用该图层对生物气候栅格进行采样。 这些都是为您准备的,位于采样栅格地图中。 您将复制刚才创建的点,然后切换到包含栅格的地图。
- 在内容窗格中,右键单击 bioclimate_points 图层,然后单击复制。
- 在地图窗格中,单击采样栅格地图选项卡。
- 在内容窗格中,右键单击采样栅格,然后单击粘贴。
采样栅格值
现在,您已经在栅格像元中心创建了点,下一步是运行采样工具,您将使用该工具从每个栅格中获取这些点的值。
- 在栅格转点工具上,单击后退按钮。
- 在地理处理窗格的搜索框中,输入 sample,然后在工具搜索结果中,单击采样工具。
- 对于输入栅格,单击添加多个按钮。
- 选中该框以选择所有内容。
- 单击添加。
- 对于输入位置栅格或要素,请选择 bioclimate_points。
bioclimate_points 图层中的每个点将用于对该位置的每个栅格值进行采样。
- 对于输出表格或要素类,请键入 Sample_vals。
- 接受重采样技术和唯一 ID 字段的默认值。
- 单击运行。
Sample_vals 表随即添加到独立表部分中的内容窗格。
- 在内容窗格内,右键单击 Sample_vals 表,然后单击打开。
- 检查该表。
字段名称源自栅格图层的名称。 它们包含了识别您需要的生物气候变量的信息,但是它们可以更清晰。
您将为字段提供一个更容易理解的别名,以便于解释数据。
设置字段别名
当您有难以理解的字段名称时,您可以分配别名以使它们更容易使用。 CHELSA Bioclim 描述页面包括一个具有短名称和长名称字段的表格。 您可以使用此表识别代码(如 bio1、bio2、bio3 等)对应的生物气候变量,并将这些名称用作字段别名。
- 在浏览器中,转到 CHELSA Bioclim 页面。
- 查看图层描述表。
- 在内容窗格的独立表部分中,右键单击 Sample_vals 表,指向数据设计,然后单击字段。
字段设计窗格随即显示。
- 单击 _bio1_ 变量的别名列。
使用 CHELSA Bioclim 网页上的表格,_bio1_ 变量对应于年平均气温。
- 在 _bio1_ 变量的别名列中,输入 mean_annual_air_temperature。
您可以使用这个方法来更新每个字段的别名。 但是,对于本教程,您不需要为所有字段设置别名。 为了节省时间,我们准备了一个稍后将用到的图层。
- 在功能区独立表选项卡的管理编辑内容部分中,单击保存.
该列的名称将在表中更新。
将采样表连接到点
将生物气候数据获取到点要素进行分析的最后一步是将您创建的表连接到您从像元中心创建的点。
- 在内容窗格中,右键单击 bioclimate_points 图层,指向连接和关联,然后单击添加连接。
添加连接工具将打开。
- 在添加连接工具上,为输入字段选择 OBJECTID。
该工具检测到内容中存在独立表,并将其添加到连接表参数中。 它还检测到表中有一个名为 OBJECTID 的字段,并将其设置为默认连接字段。
这些是正确的输入,所以工具现在可以运行了。 如果您有其他表,或者想要加入其他字段,您可以更改它们。
- 单击确定。
- 右键单击 bioclimate_points 图层,然后单击属性表。
点图层现在具有 Sample_vals 表中的属性。
该表显示了您为 mean_annual_air_temperature 字段设置的别名。
数据现在已经准备好进行探索和分析,以识别区域。
您下载了 bioclimate 数据,将其裁剪到您的感兴趣区域,从像元中心创建采样点,将多个 bioclimate 栅格采样到一个表中,设置别名,并将该表连接到您的点。 接下来,您将对准备好的数据进行一些探索。
识别变量
现在你已经准备好了生物气候数据,是时候探索变量了。
创建散点图矩阵图表
当您需要考虑多个数值变量时,散点图矩阵图表是比较变量对的好方法。 您将创建生物气候变量的散点图矩阵,以探索它们之间的关系。
- 在地图窗格中,单击识别变量地图选项卡。
识别变量地图显示了森林边界图层和名为 sample_locations 的图层。 sample_locations 图层包含带有描述性字段名称和别名的 bioclimate 变量样本数据。
- 在内容窗格中,右键单击 sample_locations 图层,指向创建图表并单击散点图矩阵。
图表属性窗格随即显示。
此窗格允许您配置图表的属性。 配置散点图矩阵的第一步是选择将要相互绘制的数值变量。
- 在图表属性窗格中,单击选择。
散点图矩阵图表有 19 个生物气候变量可供选择。
- 单击切换所有复选框按钮。
因为有如此多的字段,所以选择所有的字段并取消选中不想使用的字段会更容易。
- 取消选中前两个字段 pointid 和 grid_code,然后单击应用。
散点图矩阵出现在图表窗格中。
使用散点图矩阵检查数据关系
现在您已经创建了散点图矩阵图表,您将使用它来浏览数据并检查森林中不同位置的变量之间的关系。 您将根据您的学习要求和这次探索来决定使用哪些变量。
如果图表停靠在 ArcGIS Pro 中,它可能太小而无法阅读,因此首先您将浮动窗格以使其更容易放大。
- 右键单击 sample_locations - 样本位置散点图矩阵选项卡,然后单击浮动。
- 单击并拖动 sample_locations 的散点图矩阵图表窗口的一角,将其放大,以便更好地查看图的阵列。
图表在 X 轴和 Y 轴上显示了每个变量。 它显示了每个变量组合的小散点图。
如果您将鼠标悬停在其中一个小图上,将会弹出一个窗口,显示变量名和 R 平方值。
- 将鼠标悬停在其中一个具有高度正相关性的图上(一条从左到右呈上升趋势的窄点线)。
在该数据集中,对于特定的研究区域,最干燥月份每个位置的降水量与最湿润月份每个位置的降水量呈显著正相关。
- 将鼠标悬停在其中一个具有高度负相关性的图上(一条从左到右呈下降趋势的窄点线)。
在该数据集中,对于该研究区域,每个位置的年平均温度与每个位置的温度季节性(月平均温度的标准差)呈显著负相关。
- 单击其中一个相关性不太明显的图,然后将鼠标悬停在该图上。
单击其中一个图会选中它,并在图表窗口的右上方显示为一个较大的图。
在该数据集中,对于该研究区域,温度季节性和最干燥季度的平均降水量之间似乎没有很强的相关性。 对于不同的数据子集,这些变量之间可能存在不同的关系。
- 在散点图矩阵图表工具栏上,单击选择工具。
图表和地图是链接的,因此大图表上的选择会反映在所有较小的散点图和地图上。 这允许您以交互方式选择图表上的数据点,并查看它们在地图上的位置。
- 单击并拖动一个框,选择所选散点图右上方的一些点。
在大图表上所做的选择会反映在小图表上。
该选择也会显示在地图上。
您可以用这种方法继续探索您的研究区域中不同地方的不同变量之间的关系。
- 单击大图表中没有点的区域。
该选择在图表和地图上被清除。
- 关闭图表窗口。
图表将在内容窗格中列出。 可通过双击来将其重新打开。
CHELSA 生物气候数据集是一个多用途数据集,适用于许多研究课题。 在 19 个生物气候变量中,许多变量与温度和降水有关,并且这些变量中的许多变量是高度相关的。 它们显示年度趋势、季节性和极端或限制因素。 这里的所有数据并非对任何给定的工程都有用。
对于区域化分析,您需要相关性不高的变量。 您将使用年降水量、年温度范围和年平均温度来定义区域。 根据您的区域和用例,您可以选择不同的变量。
您已经探索了生物气候变量对之间的关系,以及变量的不同地理子集如何在该数据集中具有不同的关系和聚类模式。 现在,您将对所选变量进行区域化分析。
识别区域
既然数据已经准备好,变量也已经确定,最后一步就是进行区域化分析。
区域化是指根据每个区域的具体标准将一个区域划分为更小的区域,以了解每个区域的特点。 区域化的目的是将重要的主导环境因素归纳成空间区域,以便进行保护规划和管理。 根据物种和感兴趣区,不同的变量将非常重要。
创建聚类
您将使用多元聚类工具根据所选变量创建聚类。
- 在地图窗格中,单击识别区域地图选项卡。
地图显示 sample_locations 图层和 boundary 图层。
- 在地理处理窗格的搜索框中,输入多元聚类,然后在工具搜索结果中,单击多元聚类工具。
- 在多元聚类工具上,为输入要素选择 sample_locations 图层。
- 在分析字段框中,选中 Annual_precipitation、Annual_temperature_range 和 Mean_annual_temperature。
- 接受聚类方法和初始化方法的默认值。
默认的聚类算法是 K 均值算法。 默认的初始化方法是已优化的种子位置。 有关这些参数的详细信息,请参阅工具帮助。
- 将聚类数参数留空。
如果希望工具查找预定数量的聚类,可以在此处指定。 对于数据中自然聚类的初始探索,可以不指定该值。 该工具将根据数据确定最佳聚类数。
- 对于聚类数评估输出表,输入 Output_number_of_clusters。
如果指定此输出表,还将创建一个显示不同聚类数的伪 F 统计量值的图表。 最大伪 F 统计量值指明在最大化聚类内相似性和聚类间差异性方面表现最佳的解决方案。
您将使用此图表来了解工具输出,并自行决定所要创建的聚类数。
- 单击运行。
工具随即开始运行,不久后 sample_locations_MultivariateClustering 图层将被添加到地图中。
该图层显示由聚类 ID 符号化的样本位置。 已识别三个聚类。
这是一个开始,但是这三个聚类很大,可能不适合精细的生态决策。 您可以指定该工具创建更多的聚类,但是您如何知道应该有多少个聚类呢?
因为您指定该工具创建 Output_number_of_clusters 表,所以它还制作了一个图表,您可以浏览该图表以更好地了解数据中的聚类。 接下来,您将使用这些信息来优化您的分析。
优化聚类分析
现在,您将查看工具在 Output_number_of_clusters 表中记录的伪 F 统计量值。
- 在内容窗格的独立表部分的图表小节中,双击优化的伪 F 统计量图表。
随即显示该图表。 如有必要,可调整其大小以使其更清晰。
此图表显示了介于 3 和 30 之间的聚类解决方案的伪 F 统计量值。 该统计量是聚类间方差与聚类内方差的比率。 较大的值更适合最大化聚类内相似性和聚类间差异性。
该工具创建了三个聚类,因为最高伪 F 统计量值为 3,如图表所示。 在 6 处有第二个峰值,这也是可接受的解决方案。
- 将图表关闭。
- 单击地理处理选项卡。
多元聚类工具窗格显示了运行该工具时使用的设置。 您将更改工具将生成的聚类数,并再次运行它。
-
在多元聚类工具的聚类数框中,键入6。
- 接受其他参数的默认值,然后单击运行。
该工具运行并生成包含六个聚类的新地图。
除了点聚类的地图之外,该工具还创建了一个显示聚类特征的图表。 接下来您将检查它。
探索聚类的特征
对于三个变量中的每一个,每个聚类中的点往往具有相似的值。 多元聚类箱形图显示了这些值集。
- 在内容窗格的 sample_locations_MultivariateClustering 图层部分中,双击多元聚类箱形图。
该图表显示了每个变量的标准化值的分布的箱形图,以及指示每个变量的每个聚类的平均值的线。
在该图表中,三个箱形图显示了年降水量、年温度范围和年平均温度变量的标准化值。
在这些箱形图上绘制的是代表每个变量在每个聚类内的平均值的线。
- 在多元聚类箱形图上,将鼠标悬停在年降水量箱形图上的聚类 2 点上。
在本例中,聚类 2 用红色表示。 图表颜色与地图上随机分配的点颜色相匹配。 您的聚类 2 点可能是不同的颜色。
将出现一个弹出窗口,显示该点的聚类 ID、分析字段名称以及该聚类的平均值。
您可以使用此方法来检查每个聚类的每个字段的平均值。 聚类点由相同颜色的线连接。
红线代表图表中聚类 2 中的点,显示年降水量的平均值高于其他聚类、年温度范围的平均值居中,以及年平均温度的平均值较低。 该聚类代表森林中部高程较高的区域,这些区域比其他区域更潮湿、更凉爽。
相比之下,代表聚类 1 中的点的浅蓝色线具有最低的年平均降水量值、最高的年温度范围值和中间的年平均温度值。 这些点是森林西部边缘的低高程点。
您已经创建了六个聚类,代表森林中六个生物气候相似的区域。 聚类中的两个聚类(聚类 1 和聚类 5)具有空间上不连续的区域。
这些聚类可能适合您的工作。
在某些情况下,可能希望聚类在空间上是连续的。 使用空间约束多元聚类工具创建连续的聚类。
创建连续的聚类
拥有连续的栖息地聚类对物种保护非常有用。 如果需要聚类在空间上连续,可以使用在聚类过程中包含空间约束的工具。
- 单击地理处理选项卡,然后在多元聚类工具窗格中,单击后退按钮。
- 在地理处理窗格的搜索框中,输入空间约束多元聚类,然后在工具搜索结果中,单击空间约束多元聚类工具。
- 在空间约束多元聚类工具上,为输入要素选择 sample_locations 图层。
- 在分析字段框中,选中 Annual_precipitation、Annual_temperature_range 和 Mean_annual_temperature。
- 对于聚类大小约束,接受默认值无。
在这种情况下,您不需要约束聚类的大小。
- 对于聚类数,输入 6。
- 对于空间约束,接受默认值修剪型 Delaunay 三角测量。
- 单击运行。
您已经使用三个变量和两个多元聚类工具创建了生物气候区域。 您已经看到了如何获取和调查输入变量,以及检查聚类的特征。 这是一个显示工作流和可用数据的简化示例。 对于您自己的工作,您可能会使用一组不同的变量,并且您会选择与您从事保护工作的地区的位置、栖息地和物种极其相关的变量。