使用地统计向导插值温度
创建数据分布的直方图
首先,您将下载工程包,并在整个教程中使用存储在该包中的数据通过地统计向导对温度进行插值。
- 下载 InterpolateTemperatures 工程包。
- 在计算机上找到已下载的文件。 双击 InterpolateTemperatures.ppkx,并在 ArcGIS Pro 中将其打开。
注:
如果您目前尚未登录到 ArcGIS Pro,则将看到登录屏幕。 如果您已经登录,则该工程将打开。 如果您目前尚未登录,则仅执行步骤 3;否则,请转至步骤 4。 如果 ArcGIS Pro 获得使用 Enterprise 门户的许可,则可以使用这些凭据进行登录。 否则,您可以使用您的 ArcGIS Online 帐户对 ArcGIS Pro 进行许可。
- 使用授权用户帐户登录 ArcGIS 组织帐户或 ArcGIS Enterprise。
注:
如果您没有组织帐户,请参阅软件访问权限选项。
- 请花费一点时间直观地探索地图。
地图上的点代表温度样本。 每个点存储了每个月的平均温度值。 您将检查其中一些字段的数据分布以确定用于插值的字段。
注:
可以在 ArcGIS Living Atlas of the World:世界历史气候 - 1981 年至 2010 年 GHCND 站的月平均值中找到完整数据集。
- 在内容窗格中,右键单击 Temperature 图层。 指向创建图表,然后选择直方图。
随即显示图表属性窗格和空白图表视图。
- 在图表属性窗格中,将数值更改为 Jan Avg. Temp C(January Average Temperature in Celsius 缩写)并选中显示正态分布框。
图表视图随即更新以显示一个表示点数据最高温度值的直方图。 可以看到值范围为 -10.2 到 30.1 摄氏度。 轴上显示的值可能会有所不同,具体取决于窗格的宽度。
蓝色曲线代表图表的正态分布。 具有正态分布的数据具有钟形曲线。 可以看到,1 月份的平均气温分布并不是正态分布,而是向右偏斜。
- 在图表属性窗格中,将数值更改为 Aug Avg. Temp C。 直方图更新为新字段。
8 月的气温更接近正态分布。 当数据接近正态(钟形)分布时,插值方法最有效,某些地统计方法要求数据呈正态分布。 因此,您将在本课程的其他部分使用 Aug Avg. Temp C。
注:
如果您的数据不具有钟形曲线,则可以应用变换使其更接近正态分布。 有关此过程的相关信息,请阅读 Box–Cox、反正弦和对数变换。
- 关闭图表视图。
- 在内容窗格中,右键单击 Temperature 图层并选择符号系统。
随即显示符号系统窗格。
- 将字段更改为 Aug Avg. Temp C。
地图将更新以显示 8 月的温度。
使用反距离权重创建地统计表面
接下来,您将使用示例数据为整个非洲和中东创建预测温度值的表面。
在地统计学中,可以假设距离较近的事物比相距较远的事物更相似。 因此,任何未知位置都可能与离它最近的已知位置具有相似的值。
ArcGIS Pro 中的地统计向导提供了用于创建预测表面的多种不同插值方法。 通常,您需要尝试并比较几种方法的结果后,才可以确定要使用哪一种。 您将尝试的第一种方法是反距离权重,有时也称为 IDW。
IDW 是一种精确方法。 这意味着生成的表面不会与样本值不同。 这也是一种较简单的执行方法。 有关 IDW 的详细信息,请阅读反距离权重插值的工作原理。
- 在内容窗格中,右键单击 Temperature 图层并选择属性。
随即显示图层属性:温度窗格。
- 单击源选项卡。
- 向下滚动并单击空间参考以展开该部分。
该表的第一个参数为投影坐标系。
地统计。 要最大限度地减少这些距离失真,输入数据必须使用投影(而不是地理)坐标系。 可以使用投影地理处理工具为其提供一个投影坐标系。
此数据使用以非洲为中心的等距圆锥投影。 任何投影均无法完美地保留地图上的所有距离,但与其他投影相比,等距投影在此方面可以实现更好的结果。 在绘制大面积(例如大陆)地图时,投影的选择更为重要。
- 单击取消以关闭图层属性窗口。
- 在功能区分析选项卡的工作流组中,单击地统计向导。
随即显示地统计向导。
- 在确定性方法下,选择反距离权重法。 (您可能需要向下滚动以找到此选项。)
- 对于数据字段,选择 Aug Avg. Temp C。
- 单击下一步。
在此页面上,您可以交互式更改 IDW 方法的参数,并在预览地图中查看模型的响应方式。 在识别结果部分中,您可以了解任何位置的预测值。
- 在地统计向导中,单击预览地图的某些不同部分以在识别结果部分中查看该区域的预测温度。
- 在常规属性下,将邻域类型更改为平滑。 平滑选项通常会使预测表面更平滑、锯齿更少。
将更新预览地图。 当邻域类型为标准时,预览地图上只有一个圆圈。 当其为平滑时,将有三个同心圆。
预览地图上的圆圈代表搜索邻域。 要预测新值,将仅考虑附近的采样点(在搜索邻域内)。 您可以在搜索邻域中阅读有关此过程的详细信息,包括平滑邻域类型。
- 验证平滑系数已设置为 0.2。
- 单击完成。
- 在方法报告中,单击确定。
在地图中添加了表示非洲地区最高温度表面的新图层。
- 在内容窗格中,单击反距离权重,然后按下键盘上的 F2 以使名称可编辑。
- 将图层重命名为 IDW Smooth。
- 在 Oceans 上方拖动反距离权重并将其展开。
地图现在显示没有温度数据的位置的温度预测。
接下来,您将使用相同的数据和相同的方法创建一个略有不同的表面。
- 打开地统计向导。
提示:
在功能区的分析选项卡上,单击地统计向导。
- 确认已选择反距离权重方法,并且选择的数据字段为 Aug Avg. Temp C。单击下一步。
- 对于邻域类型,选择平滑。
- 单击幂参数中的单击以优化按钮。
幂值将更改为 3.1076。
并非搜索邻域中的所有点都被视为相等。 更接近预测位置的点将在计算中被赋予更高的权重。
如果幂为 0,则邻域中的所有点的权重相等。 幂越高,权重随距离下降的速度就越快。 较高幂值 3.1 会导致表面显示更局部化且缺少通用性,因为距离较远的点影响较小。
- 展开权重并滚动列表以查找不同颜色的权重。
此列表表示搜索半径内的所有点,包括分配给它们的权重。
单击列表中的某些值以查看在预览地图上选择的点。 红点将比绿点对预测产生更大的影响。
- 折叠权重并单击下一步。
交叉验证窗口提供了有关插值可靠性的信息。
此页面上的信息允许您评估预测表面的准确性。 通过从数据集中移除单个点,然后使用所有剩余的点来预测已移除的点的值来实现这一点。
散点图将预测值(在 x 轴上)与测量值(在 y 轴上)进行比较,当细灰线与粗蓝线重合时,将认为散点图处于最佳状态。
平均值可以显示模型是否偏向于预测过高或过低的值。 当其最接近 0 时,状态最佳。
均方根值几乎为 2.5。 这表明平均而言,预测温度值与测量值相差约 2.5 摄氏度。
- 单击完成,然后在方法报告窗口中,单击确定。
新图层即会被添加到地图中。
- 将图层重命名为 IDW Smooth Optimized。
- 在内容窗格中,关闭 Temperature 点图层。
- 取消选中,然后重新选中 IDW Smooth Optimized 以将其与 IDW Smooth 进行比较。
IDW Smooth Optimized(左)与 IDW Smooth(右)的比较。 两个图层相似,但较新的图层的红色部分更多。 哪个图层更好? 可以比较两个图层的准确性以帮助您做出决定。
- 在内容窗格中,同时选择 IDW Smooth 和 IDW Smooth Optimized。
注:
要选择多个图层,请在按住 Shift 键的同时选择图层。
- 右键单击并选择交叉验证。
随即出现每个图层的两个交叉验证窗口。 其中一个窗口挡住另一个窗口的视线。
- 将窗口移到一边,以便同时查看两个窗口。
这些与地统计向导中显示的交叉验证窗口相同。 您已经查看其中一个窗口,但是当可以在多个预测表面之间进行比较时,结果有时会更加有用。
汇总选项卡可以报告每个表面的数值错误。 均方根值越接近 0,创建的表面就越准确。
IDW Smooth Optimized 的误差值较小,因此可以认为此预测表面更可靠。
- 关闭两个交叉验证窗口。
- 在内容窗格中,仅选择 IDW Smooth。 右键单击此图层并选择移除。
- 在功能区顶角的工具栏上,单击保存按钮。
反距离权重被认为是一种简单快速的插值方法。 此方法有助于获取正在绘制现象的初始图片,并且可以准确遵循测量值,因此在某些情况下,您可能需要使用此方法。 但它也会在数据中的岛屿周围产生环形效应。
使用克里金法创建地统计表面
接下来,您将尝试克里金法以查看是否可以获得更准确的结果。 克里金法是一种非常灵活的地统计方法。 这意味着您可以通过多种方式对其进行调整以适应您的数据,但这也意味着必须做出更多选择。
- 打开地统计向导。
- 在地统计方法下,选择克里金法/协同克里金法,然后点安吉下一步。
- 在普通克里金法下,选择预测以创建类似于您之前使用 IDW 创建的预测值表面。
现在,您将使用普通克里金法的默认参数创建表面。
- 单击完成,然后单击确定。
新图层即会被添加到地图中。
- 将该图层重命名为 Kriging Default。
- 将 Kriging Default 与 IDW Smooth Optimized 进行比较。
Kriging Default(左)与 IDW Smooth Optimized(右)的比较。 新图层模式更加通用。 接下来,您将更改一些参数以尝试创建更好的地统计表面。
- 打开地统计向导。
- 确认选择的方法是克里金法/协同克里金法,然后单击下一步。
- 在普通克里金法下,选择预测并单击下一步。
- 在半变异函数/协方差建模页面中,单击优化模型按钮。
优化按钮将找到导致最小预测误差的参数。 请注意,半变异图和某些参数已发生更改。 在这种情况下,变化很小。
- 单击下一步。
- 在搜索邻域页面,将扇区类型更改为 8 个扇区。
增加扇区数量以确保可在所有方向上搜索邻域,并且仅在临近点一个方向上的大型集群不会对预测值产生全部影响。
- 单击下一步并查看交叉验证窗口中的结果。 请注意,克里金法为您提供的值比反距离权重多很多。
- 单击完成,然后单击确定。
将在地图中添加另一个图层。
- 将该图层重命名为 Kriging Modified。
- 将 Kriging Modified 与 Kriging Default 进行比较。
Kriging Modified(左)与 Kriging Default(右)的比较。 两个表面非常相似。
- 在内容窗格中,同时选择 Kriging Default 和 Kriging Modified。 右键单击并选择交叉验证。
- 调整窗口位置,以便同时查看两个窗口。 分析汇总选项卡上的值。
Kriging Default
Kriging Modified
平均值
-0.013
-0.024
均方根
2.294
2.283
标准平均值
0.001
0.003
标准均方根
0.854
0.841
平均标准误差
2.740
2.775
数值越接近零表示准确度越高。 标准化均方根误差例外。 在这种情况下,需要更接近 1 的值。
通过这些值中不能立即确定哪个表面更好。 除均方根外,Kriging Default 在其他每个类别中均具有更好的值。 然而,这并不足以说明其更好。
如果这些值中存在离得过远的值,则应该删除该图层。 但在本情况下,两个图层都显示了良好的交叉验证结果,因此可以使用均方根作为决定性因素值。 此外,理想状态还需要均方根值和平均标准误差值彼此接近。 如果这些值之间存在较大差异,则可能表明预测不稳定。
交叉验证报告表明 Kriging Modified 比 Kriging Default 更可靠。
- 打开 IDW Smooth Optimized 的交叉验证窗口。
该表面的均方根值为 2.5。 其可靠性低于任何克里金表面。
- 关闭所有交叉验证窗口。
- 从地图中移除 IDW Smooth Optimized 和 Kriging Default。
- 保存工程。
克里金法是一种比 IDW 更高级的方法,并且需要您制定更多决策。 但这允许您尝试参数,直到找到最适合数据和现象的参数。 克里金法还为您提供了更多工具来评估结果的准确性,例如您接下来将创建的标准误差估计值地图。
绘制标准误差估计值
现在,您已制作了覆盖非洲和中东的四种不同的温度表面。 每个表面均从相同的数据插值,但每个都显示了不同的表面。 显然,这些是有用预测,但不能将其视为事实。 可以将表面的某些部分(存在很多数据点)视为比其他部分(数据较少)更准确和可靠。 绘制这些不确定性程度,对为决策者提供支持非常有用。
- 在内容窗格中,仅选择 Kriging Modified。
- 在功能区的地统计图层选项卡上,将显示类型更改为标准误差。
地图变为大部分为红色。
- 在内容窗格中,打开 Temperature。
标准误差是预测值不确定性的测量值。 地图上的深红色区域具有较大的标准误差值,因此预测值的确定性较低。 较浅区域的结果可信度更高。 该地图表明结果在海洋中具有最大的标准误差。 这是因为海洋中没有采样测量点(尽管小岛上有一些)。
- 对于 Kriging Modified 图层,将显示类型更改为预测
对于此地图,您只对预测陆地温度感兴趣,因此可以对海洋进行掩膜。
- 在内容窗格中,将 Oceans 图层拖动到 Kriging Modified 上方。
- 保存工程。
即使您只有离散点数据,地统计也可以帮助您将许多现象映射为连续表面。 这对于可视化模式和执行分析非常有用。 您的研究区域内可能没有气象站,但更广泛地区的一组气象站可以提供了解和预测各地温度所需的数据。
“地统计向导”提供了许多插值方法,每种方法都有可以调整以生成不同结果的参数。 这是为什么? 根据绘制现象和可用数据,一个模型的结果可能会比另一个模型结果的可靠性更高。 如果您要根据插值表面制定决策,那么找到最准确的模型至关重要。
可以比较交叉验证结果以确定哪种方法最适合您的数据。 创建表面后,它的某些部分将提供比其他部分更准确的预测。 您可以通过标准预测误差对表面进行可视化,以了解预测最可靠的位置。
您制作的四个地图均来自相同的输入数据,但它们看起来彼此不同。 现在您以了解具有插值表面的地图的绘制方法,您对此类地图的信任度是否有变化? 可以调整地统计模型以创建更准确的结果。 另一方面,地图制作者可能有想要推广的议程,因此他们可能会调整地统计参数以强调趋势。
该工程还包含五个地图 - 其他大陆各一个。 您可以在目录窗格工程选项卡上的地图文件夹中找到这些地图。
如需附加挑战,请使用其中一张地图再次完成本教程。 对于非洲和中东,您发现 Aug Avg. Temp C 为最佳字段,Kriging Modified 为最佳表面。 对于其他大陆,您可能会发现不同的参数会产生更好的结果。
您可以在教程库中找到更多教程。