使用图表绘制和探索氧含量数据

首先,您需要使用折线图和直方图来浏览数据的属性和特性。 浏览数据几乎是所有分析工作流程的重要的第一步。 然后,使用这些图表确定数据是否适用于插值工作流程。 通过使用折线图查看溶氧水平随时间的变化情况,您可以选择适当的时间窗口进行分析。 选择时间窗口后,可通过直方图查看整个海湾的不同溶氧水平。

下载并打开工程

ArcGIS Pro 包中包含一个文件夹,其中包括从切萨皮克湾的河口采集的水质数据以及多个数据图层。 此数据由切萨皮克湾计划提供。

  1. 下载 Chesapeake_WaterQuality.zip 文件
  2. 在计算机上找到已下载的文件。
    注:

    开始下载前,根据 web 浏览器的不同,系统可能会提示您选择文件的位置。 大多数浏览器将默认下载到计算机的 Downloads 文件夹下。

  3. 右键单击该文件,然后将内容提取到计算机上的方便位置,例如 Documents 文件夹。
  4. 打开解压缩的文件夹查看内容。
  5. 如果计算机上已安装 ArcGIS Pro,请双击 Chesapeake_WaterQuality.ppkx 打开该工程。
    注:

    如果您没有 ArcGIS Pro 的访问权限或者 ArcGIS 组织账户,请参阅软件访问权限选项

  6. 如果收到系统提示,请使用您获得许可的 ArcGIS 账户登录。

    该项目包含一个名为 Chesapeake Bay Dissolved O2 的地图,其中包含地形底图和以下数据图层:

    • DissolvedO2 图层显示自 1984 年以来一直监测溶氧量和许多其他化合物的位置。 虽然地图上仅显示 131 个点,但每个位置都包含数百或数千个历史测量值。
    • Bay 图层表示海湾海岸线的简化面。
    注:

    溶氧量以每升水中含有的氧气毫克 (mg/L) 数测量。 根据美国国家海洋和大气管理局 (NOAA)[1] 信息,低于 5.0 mg/L 的任何持续溶氧水平被视为不正常,持续水平低于 0.2 mg/L 的任何位置都是死亡区域,鱼类和植物无法生存。

  7. 内容窗格中,对于 Chesapeake Bay Dissolved O2 地图,打开 Bay 图层。

    用于打开 Bay 图层的复选框

    注:

    根据默认 ArcGIS Pro 配置,内容窗格可能不会自动打开。 如有必要,单击功能区上的视图选项卡。 在窗口组中,单击内容

  8. 导航组的地图选项卡中,单击浏览

    浏览工具

  9. 单击地图并将其平移至切萨皮克湾的北端。

    切萨皮克湾的北端

  10. 内容窗格中,单击 Bay 图层将其选中。 在功能区上,单击要素图层选项卡。 在比较组中,单击卷帘

    卷帘工具

    当您指向地图时,指针会发生变化。

  11. 单击地图并上下或左右移动指针以隐藏 Bay 图层。

    卷帘 Bay 图层

    注:

    Bay 图层面的范围与下面的地形底图不完全匹配。 Bay 图层是从实际的切萨皮克湾边界简化和概化的。 概化可加快未来分析的速度。

  12. 地图选项卡中,单击浏览。 滚动鼠标滚轮以缩小到切萨皮克湾的全图。

    启用浏览工具时会禁用卷帘效果,从而允许正常平移和缩放。

  13. 内容窗格中,关闭 Bay 图层并打开 DissolvedO2 图层。
    注:

    DissolvedO2 图层来源于从切萨皮克湾计划水质数据库(1984 年至今)下载的 .csv 文件。 已对此数据进行地理编码、投影和过滤,以保留在 2014 年初至 2015 年底之间采集的与溶氧量有关的数据。

  14. 使用浏览工具查看整个切萨皮克湾的溶氧测量分布。

    切萨皮克湾的溶氧测量

    提示:

    使用切萨皮克湾计划水质数据库(1984 年至今)链接,您可以下载可自行调查的数年的其他养分数据。

创建折线图

浏览数据后,您需要创建溶氧水平的折线图。 折线图是一种用于显示值随时间的变化情况的图表。 您的折线图将显示 2014 年和 2015 年整个海湾的平均溶氧水平的变化情况。

SampleDate 设置为日期或数字可变字段可指定每个 DissolvedO2 测量值的采集日期和时间将绘制在折线图的水平 x 轴上。

  1. 内容窗格中,右键单击 DissolvedO2,指向创建图表并选择折线图

    创建折线图

    图表属性 - DissolvedO2Dissolved02 - DissolvedO2 图表窗格随即出现。

  2. 图表属性窗格中的数据选项卡上,对于日期或数字,选择 SampleDate。 对于聚合,选择平均值

    提供日期或数字参数

  3. 数值字段下,单击选择。 选中 MeasureValue,然后单击应用

    设置字段参数

    现在,图表将显示每个日期的溶氧测量值的平均值。

    存储在 MeasureValue 字段中的溶氧测量值将绘制在折线图的垂直 y 轴上。 现在,您可以选择以不同方式聚合数据。 SampleDate 属性将作为日期存储,因此默认选项为计数。 此方法用于对观察的记录天数进行计数。 MeasureValue 将作为数字存储,因此允许应用不同的算术运算。

  4. 时间分组选项部分中,确认已将间隔大小设置为 5 天。 对于空条柱,选择连接线

    连接空条柱中的线

    即使存在无可用测量值的日期的情况下,连接线也能保证线连接在一起,从而使折线图更具可读性。

    图表和图表窗格的标题将更新为 Dissolved02 – SampleDate 内的平均 MeasureValue,以反映用于生成折线图的变量。

  5. 在图表窗格中,目视确定在 2014 年 4 月 1 日到 2015 年 4 月 1 日期间内观察到的高于 12–13 mg/L 的平均溶氧水平。 此外,还要确定与低于 5–6 mg/L 的平均溶氧水平相对应的夏季日期。
    注:

    由于显示器分辨率和图表大小会影响在水平轴和垂直轴上显示的样本日期和测量值,因此您的图表内容可能与示例图像不同。 图表的线颜色可能有所不同,但是结果相同。

    折线图

    切萨皮克湾的溶氧量呈现出清晰的季节周期。 冬季的平均溶氧水平最高(平均水平高达 12–13 mg/L),夏季最低(平均水平低至 5–6 mg/L)。 由于低于 5.0 mg/L 的任何情况将被视为不正常,因此需要调查 6 月至 9 月期间的溶氧水平。 然而,令人鼓舞的是,平均溶氧水平从未接近 0.2 mg/L,该值指示无法供养海洋生物。

过滤折线图

虽然观察到溶氧水平中存在季节周期,但您想要更仔细地观察各个季节。 尽管数据的总体趋势忽上忽下,每个观察值之间存在很大的变化。 您需要使用任务选择从 2014 年 6 月 15 日至 2014 年 9 月 15 日在大于 5 米的深度采集的测量值。 任务指一组预配置的步骤,用于指导您完成工作流程。 此选择查询的任务已包含在您的项目中。

  1. 单击功能区上的视图选项卡。 在窗口组中,单击目录窗格

    “目录窗格”按钮

  2. 目录窗格中,展开 Tasks 文件夹,然后双击过滤 2014 年夏季和 2015 年夏季的样本任务

    “目录”窗格中的“任务”文件夹

    随即显示任务窗格。

  3. 任务窗格中,双击应用 Summer 2014 过滤器

    应用过滤器

    随即打开该任务。 此任务包含一个步骤,用于在 DissolvedO2 图层上执行第三方查询。

    应用 2014 年夏季过滤任务

    提示:

    您可以通过指向窗格的右侧并拖动窗格以使其显示更大的尺寸来调整窗格的大小。

    任务参数如下:

    • 对于输入行,选择 DissolvedO2
    • 对于选择类型,选择新建选择

    表达式使用以下 SQL 查询:

    • TotalDepth 大于 5
    • SampleDate2014 年 6 月 15 日中午 12:00:00 之后
    • SampleDate2014 年 9 月 16 日中午 12:00:00 之前

    查询表达式将选择 2014 年 6 月 15 日至 2014 年 9 月 15 日期间在超过 5 米的深度采集的所有样本。

    提示:

    要了解如何自行编写 SQL 查询表达式,请参阅在查询构建器中编写查询

  4. 单击运行

    任务过滤器会选择折线图上 2014 年夏季的点。

    包含选定项的折线图

  5. 在折线图的顶部,单击按选择过滤按钮。

    Summer 2014 的已过滤折线图

    图表将更新为仅显示所选点。

    图表仅显示所选点

    在 2014 年夏季,平均溶氧水平上下波动,没有任何明确的模式。 查看单个季节时,可以在整个数据集中看到的季节趋势将消失。 这也不错;趋势可能会给插值工作流程带来困难。 看起来如果您仅使用这 3 个月窗口内的测量值,则可以忽略季节趋势。

  6. 任务窗格中,单击完成以停止运行任务。 关闭任务窗格。

创建已过滤直方图

在上一节中,您使用折线图确定应将分析范围限制在 2014 年的夏季。 在这些月份中,平均溶氧水平接近不正常水平。 但是,折线图仅显示整个海湾的平均溶氧水平。 如果海湾的某些部分溶氧水平低而海湾的其他部分溶氧水平高呢? 平均值是否可能会隐藏一些极低的溶氧水平? 要回答这些问题,您需要创建选定数据的直方图。

  1. 内容窗格中,右键单击 DissolvedO2,指向创建图表并选择直方图
  2. 图表属性窗格的数据选项卡中,进行以下更改:
    • 变量下,为数字选择 MeasureValue
    • 对于图格,键入 64

    设置直方图的属性

    将更新 DissolveO2 – MeasureValue 分布窗格,以显示所有样本的 DissolvedO2 直方图。

    请注意,2014 年夏季以来的样本仍处于选中状态(蓝色)。

    2014 年夏季条柱处于选中状态的直方图

  3. 在折线图的顶部,单击按选择过滤按钮将其启用。

    已过滤数据的直方图

    直方图将更新以仅显示 Summer 2014 的选定样本。 在 2014 年夏季,大多数溶氧量测量值介于 3 mg/L 到 9 mg/L 之间。 夏季三个月份的平均溶氧水平为 5.26 mg/L。

    而值得注意的是直方图最左侧的两个条柱,其溶氧水平远远低于平均值,并且是通过大量样本观察到的。 接下来,需要对这些结果进行调查。

  4. MeasureValue 分布直方图中,将光标悬停在左侧的第一个数据立方图格(条柱)上方(介于 150200 之间),以显示该数据立方图格的 MeasureValue计数值。
    注:

    由于采用了四舍五入法,测量值可能略有不同。

    最低条柱的值

    条柱属性显示 185 个样本(共 4086 个样本)的溶氧水平介于 0 到 0.2 之间。 这表示一个死亡区域,结果应该非常令人担忧。 但是,仅当在较长一段时间内溶氧水平持续偏低时才会出现死亡区域。 下一模块将重点关注这些位置的溶氧水平是否持续偏低。

  5. 关闭图表窗格和图表属性窗格。

    关闭图表不会将其从工程中删除。

  6. 快速访问工具栏中,单击保存工程按钮。 如果提示,单击继续保存至更新版本的 ArcGIS Pro

    快速访问工具栏上的“保存工程”按钮

您使用了折线图和直方图浏览数据,同时应用选择过滤器。 折线图指示溶氧量分布中存在明显的季节模式,最低水平出现在夏季。 在 2014 年夏季,海湾的平均溶氧量接近不正常水平 5 mg/L。

如果在较长一段时间内溶氧水平保持在极低的水平,则在直方图中很明显一些个别点的溶氧水平指示存在死亡区域。 现在,必须确定是否有任何海湾区域的溶氧水平持续偏低。


执行插值并比较结果

插值模型的精度由位置的预测值与该位置的实际值的匹配相近程度定义。 而从表面上看,我们能够立即看出此精度定义存在矛盾。 如果仅在一组特定位置处测量溶氧量,则您如何能够判断在新位置处预测的插值模型的精确程度? 如果不知道新位置的实际值,则预测精度以何为据? 这似乎是一个不可逾越的矛盾,但是对于此矛盾,有一个普遍接受的解决方案,称作交叉验证。

交叉验证是一种“留一法”统计方法。 通过从数据集中按顺序移除每个测量点,然后使用其余点预测移除点位置的值,以评估模型精度。 如果插值模型可靠,其余点应能够精确地预测隐藏点的真实(测量)值。 然后,可以将预测值与真实的测量值进行比较,看看二者有多接近。 特定点的真实值与预测值之间的差异称为交叉验证误差。 对每个测量点进行交叉验证后,可以生成各种数字和图形诊断,以便评估模型的整体精度。 可通过插值 2014 年夏季的平均溶氧水平来解读交叉验证诊断,并将结果与​2015 年夏季的结果进行比较。

使用向导插值数据

接下来,您将使用已知的测量 O2 值对未采集测量值的氧含量进行插值。 表面中可用于映射或进一步分析的插值结果。 您将使用 Bay 图层中的要素作为障碍来隔离对切萨皮克湾的插值。

对于 2014 年夏季数据插值,您将使用 Geostatistical Wizard,这是一个动态的页面集,用于引导您完成构建插值模型并评估其性能的过程。

  1. 在功能区分析选项卡的工作流组中,单击地统计向导

    “地统计向导”按钮

    随即显示地统计向导

  2. 地统计向导首页中,在含障碍的插值下,选择核插值

    选择含障碍的核插值法

  3. 数据集下,对于源数据集,确认已选择 DisslovedO2,对于数据字段,选择 MeasuredValue。 在障碍要素下,选择 Bay

  4. 单击下一步

    随即显示正在加载数据页面。

  5. 正在加载数据页面上,对于数据集,选择使用平均值

    “使用平均值”选项

  6. 单击下一步

    随即显示核插值页面。

    核插值页面包含地图、常规属性和单点识别结果

    带宽参数是一个重要参数,但是您未输入值。 带宽用于控制预览表面中的搜索圆半径。 对于此数据,带宽以米为单位进行测量,并且软件已根据简单的优化提供默认值。 可以将其留空并允许 ArcGIS Pro 根据数据计算该值。

    识别结果下的值对应十字光标指示的当前位置。 (可选)可单击其他位置查看其值。

    注:

    由于在 DissolvedO2 图层中进行了选择,插值将仅在其计算中使用所选要素。

  7. 单击下一步

    随即显示交叉验证页面。

    “交叉验证”页面

    本教程后续将详细介绍交叉验证。

  8. 单击完成。 在方法报告窗口上,单击确定

    地图中随即显示输出图层。

    Kernel Interpolation 结果图层

    Kernel Interpolation 图层是一个自定义图层类型,仅适用于 ArcGIS Geostatistical Analyst 扩展模块。 已对其进行优化,可进行快速可视化和计算,并且可导出为栅格或要素图层。

    在地图上,红色和橙色代表的平均溶氧水平最高。 请注意,这些高值中的大多数位于海湾南部靠近大西洋的入口端。 最低水平(由蓝色和绿色指示)位于海湾中部和北部。

  9. 保存工程。

    您使用了 ArcGIS Geostatistical Analyst 扩展模块 中的 Geostatistical Wizard 对 2014 年夏季切萨皮克湾的平均溶氧水平进行插值。 根据插值地图,可以推断 2014 年夏季切萨皮克湾的一些区域可能已经低于正常的溶氧水平,但没有迹象表明存在鱼类和植物无法生存的任何持续死亡区域。

浏览交叉验证结果

接下来,您将查看已创建的图层的交叉验证窗口,然后解读其各个元素。

  1. 内容窗格中,右键单击 Kernel Interpolation 图层,然后选择交叉验证

    地理统计图层快捷菜单

    注:

    交叉验证是地理统计图层的属性并且不适用于任何其他图层类型。

    随即显示 Kernel Interpolation 图层的交叉验证窗口。

    注:

    要了解交叉验证窗口中包含的所有不同标签和统计信息,请参阅执行交叉验证和验证

  2. 交叉验证窗口的右侧,单击表格选项卡。

    该表格包含每个测量点的交叉验证结果。

  3. 如有必要,可调整窗口大小以显示误差列。

    表选项卡

    对于每个点,将保留点的测量值以及交叉验证的预测值。 误差值指预测值与测量值的差值。 如果误差值大于零,则表示交叉验证的预测值高于真实值。 如果误差值小于零,则表示预测值低于真实值。

  4. 单击误差列标题以从低到高进行排序。

    对“误差”列进行排序

    在重新排序的误差列中,最低的交叉验证误差为 -2.76。 这意味着交叉验证预测的溶氧水平比该位置的实际值低 2.76 mg/L。

  5. 单击误差列标题以从高到低进行排序。

    最高交叉验证误差约为 3.03。 这意味着交叉验证预测的溶氧水平大约比该点的测量值高 3.03 mg/L。

  6. 单击第一行以选择交叉验证误差最高的点。

    选择表格中的记录时,会突出显示左侧图表中的关联点。 对于此记录,点位于图表中的 x 轴上。

    选择最高交叉验证记录

    此图表显示了每个点的预测值与测量值的散点图以及蓝色点回归线。 理想情况下,预测值会与测量值接近,因此,您希望看到回归线以 45 度角跟随。 窗口中显示的灰色参考线用于评估回归线与此理想 45 度角的接近程度。 对于此点,蓝色回归线比灰色参考线稍微平坦一些,并且线周围的点非常分散。 但是,差异似乎并不太严重。 如果蓝线接近完全平坦或垂直,则表明存在无法接受的严重问题。

  7. 在窗口的图形诊断部分中,单击误差标签。

    错误选项卡

    误差选项卡将显示测量值与交叉验证误差的散点图。 此图用于确定交叉验证误差是否与测量值无关。

    如果要对低、中和高水平的溶氧进行同样精确的预测,则误差与测量值之间的独立性非常重要。 误差与测量值之间的独立性由平坦的回归线指示。 在您的图表中,回归线逐渐减小,表明低估了最高测量值并高估了最低测量值。

    这就是常见的平滑现象。 您的图表中的平滑程度较为典型,但您应当意识到此类平滑意味着模型可能错误预测位置的安全溶氧水平,而实际上该位置具有的溶氧水平不正常或危险。 您应将此信息置于一旁并继续分析,但是报告发现时应披露此信息。

  8. 交叉验证窗口的数值诊断部分中,单击摘要选项卡。

    “摘要”选项卡

    摘要选项卡将显示表格选项卡包含的信息的汇总统计数据,并提供一种简单且有用的方法来评估交叉验证结果。

    均方根是判断模型精度的最重要统计值。 其值始终大于零,而该值越接近于零,通常,交叉验证预测值越接近测量值。 您获取的均方根值约为 1.12,通常表明平均交叉验证误差与真实值相差超过 1 mg/L 的溶氧量。 所有其他统计数据提供了关于模型的有用信息,但均方根值是用于直接衡量预测精度的唯一数据。

    要关注的另一个汇总统计数据为平均值。 此值为交叉验证误差的平均值,用于评估模型预测的值会过高还是过低(称作偏差)。 如果模型无偏差,则此值应接近于零。 如果此值远远大于零,则意味着该模型系统进行的预测过高。 同样,如果该值远远小于零,则意味着该模型系统进行的预测过低。 您获取的值大约为 0.045,表明此模型的偏差极小。 通常,进行的预测大约高出 0.045 mg/L,此偏差量极小。 根据如此小的平均值,您可以放心地假设您的模型无偏差。

  9. 关闭交叉验证窗口。

查看 2015 年的图表

接下来,您将选择 2015 年夏季期间采集的溶氧测量值。 您将使用图表探索数据。

  1. 如有必要,可打开过滤 Summer 2014 和 Summer 2015 的样本任务。
    提示:

    在功能区上,选择视图,然后单击目录窗格。 展开任务文件夹。

  2. 双击应用 Summer 2015 过滤器
  3. 单击运行

    将选择 2015 年 6 月 15 日至 2015 年 9 月 15 日期间在深度超过 5 米的位置采集的测量值。

  4. 单击完成并关闭任务窗格。
  5. 内容窗格中,单击按绘制顺序列出按钮。

    按绘制顺序列出按钮

    您可以看到您之前创建的图表在内容窗格中列出。 图表会作为图层属性类型存储,可在地图内容窗格中将其与图层列表一起管理。

  6. 双击 MeasureValue 分布重新打开直方图。 确认已启用按选择过滤按钮,以便仅显示 2015 年夏季的选定样本。

    2015 年夏季数据的直方图

  7. 图表属性窗格的统计数据下,打开中值标准 差

    直方图将更新以包含这些值。

    包含中值和标准差的 2015 年夏季数据直方图

    此直方图的外观与 2014 年夏季的直方图相似。 大多数溶氧测量值大约介于 3 mg/L 和 9 mg/L 之间,在左侧接近危险水平 0.2 mg/L 的水平处也有一个大条柱。

  8. 内容窗格中,双击 SampleDate 内的 MeasureValue 平均值重新打开折线图。
  9. 图表属性窗格中,对于时间图格选项,将间隔大小更改为 5 天

    更新时间图格

  10. 如有必要,请单击按选择内容过滤按钮以仅显示 2015 年夏季的选定样本

    Summer 2015 的折线图

    折线图的外观也与 2014 年夏季的类似。 切萨皮克湾的总体平均溶氧水平上下波动,没有任何明确的模式。 这意味着您可以放心地平均这段时间内每个位置的值。

  11. 关闭图表属性窗格以及两个图表。

使用工具插值数据

之前,您使用了 Geostatistical Wizard 以插值 2014 年夏季的测量值。 但是,Geostatistical Wizard 包含的大多数的插值方法也作为地理处理工具提供。 接下来,您将使用含障碍的核插值法地理处理工具来插值 2015 年夏季的平均溶氧水平。

  1. 在功能区分析选项卡的地理处理组中,单击工具

    将出现地理处理窗格。

  2. 地理处理窗格中,搜索

    搜索将返回用于执行或包含搜索项的几个可能的地理处理工具。

  3. 单击含障碍的核插值法

    地理处理搜索结果

    将在地理处理窗格中打开含障碍的核插值法地理处理工具。

  4. 对于输入要素,选择 DissolvedO2

    此参数指定 DissolvedO2 图层包含要插值的点。

  5. 对于 Z 值字段,选择 MeasureValue

    此参数将指定 MeasureValue 字段包含溶氧测量值。

  6. 对于输出地理统计图层,输入 Summer 2015

    此参数指定生成的地理统计图层名称。

  7. 对于输入绝对障碍要素,选择

    此参数指定 Bay 图层将用作插值中的障碍。 从而允许工具使用水程距离。

  8. 接受其余的默认值。

    含障碍的核插值法参数

    通过将带宽参数留空,工具将确定产生可能的最小均方根交叉验证误差的带宽值。 这也是 Geostatistical Wizard 确定最佳带宽的方式。

    注:

    默认情况下,含障碍的核插值法工具将求取所有重合点的平均值,因此,不需要在地理处理工具中明确指定此值。 可以在该工具的环境选项卡上找到重合点的其他聚合方法。

  9. 单击运行

    将执行该工具。 随即会向 Chesapeake Bay Dissolved O2 地图添加名为 Summer 2015 的图层。 此图层代表针对 2015 年夏季整个切萨皮克湾预测的平均溶氧水平。

  10. 关闭与运行工具相关的所有摘要窗口。 在内容窗格中,关闭 DissolvedO2 图层。
  11. 内容窗格中,打开并关闭 Summer 2015 图层,然后将其与包含 2014 年夏季数据的 Kernel Interpolation 图层进行比较。

    2015 年夏季的溶氧量

    与 2014 年夏季一样,2015 年夏季的最高平均溶氧水平位于海湾南部靠近大西洋的入口端。 同样,海湾中部和北部的溶氧水平最低。

使用交叉验证比较图层

接下来,您将查看针对在上一节中创建的图层的交叉验证窗口,然后将数字和图表与 2014 年夏季的地图进行比较。

  1. 内容窗格中,双击 Kernel Interpolation 图层。

    随即出现图层属性窗口。

  2. 常规选项卡的名称中,删除 Kernel Interpolation,然后输入 Summer 2014

    重命名 Summer 2014 图层将有助于您区分和比较 2014年与 2015 年的结果。

  3. 单击确定
  4. 内容窗格中,右键单击 Summer 2014,然后选择验证

    将针对 2014 年夏季的溶氧水平打开交叉验证窗口。

  5. 内容窗格中,右键单击 Summer 2015,然后选择交叉验证

    将针对 2015 年夏季的溶氧水平打开交叉验证窗口。

  6. 比较 2014 年夏季和 2015 年夏季的根均方平均值。

    摘要2014 年夏天2015 年夏天

    Count

    78

    85

    均方根

    1.117

    1.002

    平均值

    0.036

    0.021

    从 2014 年夏季到 2015年夏季,根均方从 1.117 降至 1.002。 这表明与 2014 年夏季相比,2015 年夏季的交叉验证预测值精度大约高出 10%。 这可能是因为 2015 年夏季的数据大约增加 10%(85 个点与 78 个点),如计数值所示。

    从 2014 年夏季到 2015年夏季,平均值从 0.036 变为 0.021。 此值应尽可能接近于零,因此,2015 年夏季的偏差比 2014 年夏季的略低(尽管两个夏季的偏差水平都较低)。

  7. 在图形诊断中,针对 Summer 2014Summer 2015 单击预测选项卡。
  8. 比较预测选项卡上的图表。 如有必要,可并排放置 Summer 2014Summer 2015 的窗口进行比较。

    交叉验证图表比较

    Summer 2014 的回归线(左图)相比,Summer 2015 的蓝色回归线(右图)看起来更接近于灰色参考线。

  9. 在图形诊断中,针对 Summer 2014Summer 2015 单击误差选项卡。

    误差图表比较

    Summer 2014Summer 2015 对应的误差选项卡上的图表外观几乎完全相同。 您可能还记得,理想情况下,蓝色回归线是平坦的。 如 Summer 2014Summer 2015 中所示,回归线逐渐减小,表明模型正在对数据进行平滑处理并且低估了高值而高估了低值。

  10. 比较位于每个图表左下角的回归函数的斜率。

    Summer 2014 的回归函数Summer 2015 的回归函数

    -0.668

    -0.581

    回归函数表明与 Summer 2015 相比,Summer 2014 的蓝色回归线斜率略低(-0.668 与 -0.581)。 这表示 Summer 2014Summer 2015 稍稍更平滑。

    因此,可以得出以下结论:与 Summer 2014 的插值相比,Summer 2015 的插值错误预测位置的安全溶氧水平(实际水平不正常或危险)的可能性稍稍更低。 不过,这两年都没有出现严重的平滑程度。

  11. 关闭两个交叉验证窗口。
  12. 保存工程。

    您使用交叉验证评估和比较了插值模型的精度和可靠性。 通过了解交叉验证表、汇总统计数据和图表,您现在可以量化插值模型的精度和可靠性。 利用这些技能,可以对模型的局限性做出重要披露。 需要披露您的模型似乎会对数据进行平滑处理,因为,这可能会隐藏切萨皮克湾的一些危险溶氧水平。

    完成分析的各个统计部分后,您可能需要呈现这些信息,以便同事和决策者能够轻松理解。 分析结果必须使相应的人员能够充分认识或快速理解,否则即使是最好的分析,也不会起到任何作用。

    例如,您可能需要将地统计图层导出为栅格并应用有意义的色带。 然后,您可以将各个地图添加到布局中,以制作包含您的发现的海报。 您可参考此海报创建类似可视化成果。 有关创建布局的指导,请参阅教程系列ArcGIS Pro z中设计布局

在本教程中,您使用了 ArcGIS Geostatistical Analyst 扩展模块。 您使用 Geostatistical Wizard含障碍的核插值法地理处理工具分析了 2014 年和 2015 年夏季切萨皮克湾的平均溶氧水平。 利用插值,您创建了预测整个海湾的平均溶氧水平的地理统计图层。 然后,您对结果进行了交叉验证,来量化插值精度。

根据您获得的关于切萨皮克湾的结果,平均水平从未接近危险水平 0.2 mg/L,但许多个别测量值接近或低于此临界低水平。 尽管必须采取缓解气候变化措施使切萨皮克湾的溶氧水平高于正常水平 5.0 mg/L,但您的分析提供了一个在科学和统计方面均合理的结论,即使在夏季最差的时候,溶氧水平也足以维持繁荣的海洋生态系统。

死亡区域是一个全世界都面临的问题。 在墨西哥湾、英吉利海峡和中国东海等地点,可以使用类似的内插溶氧水平的过程。 使用图表探索数据、内插数据以及通过交叉验证评估结果精度的过程几乎适用于所有插值工作流程。 我们鼓励您下载其他来源的数据以及切萨皮克湾计划水质数据库(1984 年至今)中其他年份的数据,然后使用这些新的或更新的数据重复本步骤。

您可以在教程库中找到更多教程。