Нанесение на карту и исследование уровня растворенного кислорода с использованием диаграмм

Сначала вы используете диаграмму-график и гистограмму для изучения свойств и характеристик ваших данных. Изучение данных – первый и важный этап в каждом рабочем процессе анализа. И вы, используя диаграммы, определите, готовы ли ваши данные к рабочему процессу интерполяции. Используя линейный график, вы изучите динамику изменения концентрации кислорода в воде с течением времени, и выберете подходящее временное окно для анализа. После подбора временного окна гистограмма поможет вам оценить вариабельность концентрации кислорода по территории залива.

Загрузка и открытие проекта

В папке, предоставляемой для упражнений, содержатся данные оценки качества воды, собранные в акватории Чесапикского залива а также несколько слоев данных в виде пакета ArcGIS Pro. Данные предоставлены Chesapeake Bay Program.

  1. Загрузите файлов Chesapeake_WaterQuality.zip file.
  2. Найдите загруженный файл на вашем компьютере.
    Примечание:

    В зависимости от настроек браузера, вам могло быть предложено выбрать место для сохранения загружаемого файла. Большинство браузеров по умолчанию скачивают все в папку Загрузки.

  3. Щелкните файл правой кнопкой мыши и извлеките в подходящее расположение, например, в папку Документы.
  4. Откройте извлеченную папку и просмотрите содержимое.
  5. Если у вас на компьютере уже установлен ArcGIS Pro, дважды щелкните Chesapeake_WaterQuality.ppkx, чтобы открыть проект.
    Примечание:

    Если у вас нет доступа к ArcGIS Pro или учетной записи организации ArcGIS, см. варианты доступа к программному обеспечению.

  6. Если будет предложено, войдите под лицензированной учетной записью ArcGIS.

    Проект содержит карту Chesapeake Bay Dissolved O2 с топографической базовой картой и следующими слоями:

    • Слой DissolvedO2 с местоположениями забора проб на анализ растворенного кислорода и некоторых других элементов, мониторинг выполняется с 1984 года. Хотя вы увидите только 131 точку на карте, каждое местоположение содержит результаты сотен или даже тысяч измерений.
    • Слой Bay представляет упрощенный полигон береговой линии залива.
    Примечание:

    Кислород измеряется в миллиграммах на литр (мг/л). В соответствии с рекомендациями National Oceanic and Atmospheric Administration (NOAA)[1], постоянный уровень кислорода в воде ниже 5.0 мг/л считается недостаточным для жизнедеятельности, а местоположения с уровнем 0.2 мг/л определяются как мертвые зоны, где растения и рыбы не могут существовать.

  7. В панели Содержание карты Chesapeake Bay Dissolved O2 включите слой Bay.

    Окошко для включения слоя Bay

    Примечание:

    В зависимости от исходной конфигурации ArcGIS Pro панель Содержание может автоматически не открыться. В случае необходимости щелкните вкладку Вид на ленте. В группе Окна щелкните Содержание.

  8. На закладке Карта в группе Навигация щелкните Исследовать.

    Инструмент Исследовать

  9. Щелкните и переместите карту до северной оконечности Чесапикского залива.

    Северная оконечность Чесапикского залива

  10. На панели Содержание щелкните слой Bay, чтобы выделить его. Щелкните на ленте вкладку Векторный слой. В группе Сравнить щелкните Спрятать.

    Инструмент Спрятать

    Когда вы наведете курсор на карту, он изменится.

  11. Щелкните карту и перетащите курсор вверх и вниз или слева направо, чтобы скрыть слой Bay.

    Скрытие слоя Bay

    Примечание:

    Экстент полигона слоя Bay не совсем совпадает с границами залива по базовой карте Топографическая. Слой Bay был создан на основе береговой линии залива, но сильно упрощен и генерализован. Такая генерализация поможет ускорить анализ, который планируется выполнить.

  12. На вкладке Карта щёлкните Исследовать. Прокрутите колесико мыши, чтобы полностью вернуться к Чесапикскому заливу.

    Включение инструмента Исследовать отключает эффект шторки, что позволяет перемещать и масштабировать карту в обычном режиме.

  13. На панели Содержание отключите слой Bay и включите DissolvedO2.
    Примечание:

    Слой DissolvedO2 создан на основе файла .csv, загруженного из базы данных Chesapeake Bay Program Water Quality Database (с 1984 – по настоящее время). Эти данные были геокодированы, спроецированы и отфильтрованы таким образом, чтобы получились данные по уровню кислорода между началом 2014 года и концом 2015года.

  14. Используйте вкладку Исследовать для визуализации распределения измерений концентрации кислорода по акватории Чесапикского залива.

    Измерения концентрации кислорода в Чесапикском заливе

    Подсказка:

    По ссылке Chesapeake Bay Program Water Quality Database (1984 – настоящее время) вы можете загрузить данные по другим элементам, если захотите изучить их тоже.

Создание диаграммы-графика

Теперь, когда вы изучили данные, вы построите график изменения концентрации кислорода в воде. Диаграмма-график позволяет оценить изменения значений с течением времени. На вашем графике будет отображены средние значения концентрации кислорода по всему заливу, на период с начала 2014 года и по конец 2015 года.

Установка SampleDate в качестве поля переменной Дата и Число указывает, что дата и время каждого измерения концентрации в слое DissolvedO2 наносятся по горизонтальной оси x диаграммы-графика.

  1. На панели Содержание щелкните правой кнопкой DissolvedO2, выберите Построить диаграмму > Диаграмма-график.

    Создание диаграммы-графика

    Появятся панели Свойства диаграммы - Dissolved02 и Dissolved02 – диаграмма DissolvedO2.

  2. На панели Свойства диаграммы на вкладке Данные в опции Дата и число выберите SampleDate. В разделе Агрегирование выберите Среднее.

    Параметр Дата и Число

  3. В Числовые поля щелкните Выбрать. Отметьте MeasureValue, затем щелкните Применить.

    Установка параметра Поля

    Диаграмма теперь показывает среднее значение концентрации кислорода на каждый день.

    Измерения концентрации кислорода, хранящиеся в поле MeasureValue, откладываются по вертикальной оси y диаграммы-графика. Вы можете по-разному агрегировать данные. Так как атрибут SampleDate хранится как даты, по умолчанию предлагается использовать опцию агрегирования - Количество. Этот метод подсчитывает число дней, в которые проводились измерения. MeasureValue хранит числовые значения, к которым можно применить разнообразные арифметические действия.

  4. В разделе Опции биннинга времени подтвердите, что для параметра Размер интервала установлено значение 5 дней. Для Пустого бина выберите Соединить линию.

    Соединить линию для пустых бинов

    Соединить линию делает график более читаемым, так как линия не разрывается, даже если для даты нет соответствующего измерения.

    Заголовок диаграммы и панели диаграммы обновляются на Dissolved02 - среднее MeasureValue по сравнению с SampleDate, что отражает переменные, используемые для создания графика.

  5. На панели диаграммы визуально определите средние уровни растворенного кислорода выше 12–13 мг/л, наблюдавшиеся в период с 01.04.2014 по 01.04.2015. И обратите внимание на даты в летний период, которые соответствуют уровню концентрации ниже 5–6 мг/л.
    Примечание:

    Ваша диаграмма может выглядеть иначе, чем на рисунке, из-за отличий в экранном разрешении и размере диаграммы, которые влияют на то, какие даты и измерения отображаются на горизонтальной и вертикальной осям. Цвет линии на вашем графике также может отличаться, но результаты будут одинаковыми.

    Диаграмма-график

    Очевидно изменения концентрации кислорода в водах Чесапикского залива подвержены сезонным циклам. Наиболее высокие значения концентрации отмечаются зимой (со среднем уровнем в районе 12–13 мг/л), а низкие, в свою очередь, летом (средний уровень в районе 5–6 мг/л). Так как уровень концентрации ниже 5.0 мг/л считается опасным для жизни водных обитателей, необходимо тщательно изучить уровень кислорода в период от июня до сентября. Тем не менее, к счастью, ни разу не было зафиксировано концентрации кислорода в воде ниже чем 0.2 мг/л, что указывало бы на мертвую зону для водных растений и животных.

Фильтрация диаграммы-графика

Хотя вы заметили очевидные сезонные циклы в изменении уровня кислорода, сейчас вы хотите изучить один конкретный сезон. Хотя в данных отмечаются глобальные тренды в увеличении и падении уровня концентрации кислорода, есть также множество локальных флуктуаций от наблюдения к наблюдению. С помощью Задачи вы выберете измерения в период между 15 июня 2014 года и 15 сентября 2014 года, взятые на глубинах свыше 5 метров. Задача это набор предварительно настроенных шагов, проводящих вас по рабочему процессу. Задача для этого запроса выборки уже включена в проект.

  1. Щелкните вкладку Вид на ленте. В группе Окна щелкните Панель Каталог.

    Кнопка Панель каталог

  2. На панели Каталог разверните папку Задачи и дважды щелкните задачу Filter Samples for Summer 2014 and Summer 2015

    Папка Задачи на панели Каталог

    Появится панель Задачи.

  3. На панели Задачи дважды щелкните Apply Summer 2014 Filter.

    Применение фильтра

    Откроется задача. Эта задача состоит из одного шага, содержащего внешний запрос к слою DissolvedO2.

    Применение задачи Summer 2014 Filter

    Подсказка:

    Вы можете изменить размер панели, указав на правую часть панели и перетащив панель до большего размера.

    В задаче имеются следующие параметры:

    • Для Входных строк выберите DissolvedO2
    • Для Типа выборки выберите Новая выборка.

    Выражение использует следующие SQL-запросы:

    • TotalDepth больше 5
    • И SampleDate после 6/15/2014 12:00:00 AM
    • И SampleDate до 9/16/2014 12:00:00 AM

    С помощью выражения запроса будут выбраны все измерения, сделанные на глубине более 5 метров между 15 июня и 16 сентября 2014 года.

    Подсказка:

    Для более подробной информации о составлении выражений SQL см. Написание запроса в конструкторе запросов.

  4. Щелкните Запустить.

    Фильтр задач выбирает точки лета 2014 года на вашем линейном графике.

    Диаграмма-график с выборкой

  5. В верхней части линейного графика нажмите кнопку Фильтр по выборке.

    Отфильтрованный график, данные лета 2014 года

    График обновится и отобразит только выбранные точки.

    График, показывающий только выбранные точки

    В летние месяцы 2014 года средняя концентрация кислорода меняется то в одну, то в другую сторону, без выраженной закономерности. Сезонные тренды, заметные по всему набору данных, исчезают при взгляде на один конкретный сезон. Это хорошо; тренды могут затруднить рабочий процесс интерполяции. Если вы будете работать с измерениями только в пределах этого трехмесячного периода, сезонные тренды можно игнорировать.

  6. На панели Задачи щелкните Готово, чтобы выполнить задачу. Закройте панель Задачи.

Создание гистограммы с фильтрованными данными

В первой части урока вы использовали диаграмму-график и определили, что можно ограничить анализ данными за лето 2014 года. В эти месяцы уровень кислорода в воде опустился до критической отметки. Но на диаграмме-графике можно оценить концентрацию кислорода только в среднем по всему заливу. А что если в каких-то областях низкий уровень кислорода, а в каких-то - высокий? Может быть средние значения нивелируют очень низкий уровень? Для ответа на эти вопросы вы построите гистограмму с выбранными данными.

  1. На панели Содержание щелкните правой кнопкой DissolvedO2, выберите Построить диаграмму > Гистограмма.
  2. На панели Свойства диаграммы на вкладке Данные внесите следующие изменения:
    • В разделе Переменная для Числа выберите MeasureValue.
    • В опции Бины введите 64.

    Установка свойств гистограммы

    Панель DissolveO2 – Распределение MeasureValue обновится, показывая гистограмму значений слоя DissolvedO2 для всех измерений.

    Обратите внимание, что образцы лета 2014 года по-прежнему выделены синим цветом.

    Гистограмма с выбранными бинами лета 2014 г.

  3. В верхней части диаграммы-графика нажмите кнопку Фильтр по выборке, чтобы включить его.

    Гистограмма отфильтрованных данных

    Гистограмма обновится, показав только выбранные измерения, относящиеся к лету 2014 года. Летом 2014 года большинство измерений соответствовали уровню между кислорода от 3 до 9 мг/л. Среднее значение концентрации за три месяца составляет 5.26 мг/л.

    Но стоит обратить внимание на два крайних левых столбца гистограммы, где концентрация намного ниже среднего, а также большего числа остальных измерений. Вы исследуете это далее.

  4. На гистограмме Распределение MeasureValue, наведите на первый столбец слева, между 150 и 200, чтобы увидеть значения MeasureValue и Количество для бина данных.
    Примечание:

    Измеренные значения могут незначительно отличаться из-за округления.

    Значения для бина с наименьшей концентрацией

    Этот бин содержит 185 измерений из 4086, где уровень кислорода составляет экстремально низкие значения между 0 и 0,2. Это указывает на мертвую зону, и требует особого внимания. Хотя констатировать мертвую зону можно в том случае, если уровень кислорода постоянно сохраняется на критически низкой отметке в течение продолжительного времени. Действительно ли в этих местах постоянно сохраняется низкий уровень кислорода - будет темой исследования следующего модуля.

  5. Закройте панели Диаграмма и Свойства диаграммы.

    Закрытые диаграммы не удаляются из проекта.

  6. На Панели инструментов быстрого доступа щелкните кнопку Сохранить проект. Если появится запрос, щелкните Да, чтобы продолжить с сохранением в более новую версию ArcGIS Pro.

    Кнопка Сохранить проект на панели инструментов быстрого доступа

Вы использовали диаграмму-график и гистограмму, с фильтрацией для изучения данных. Диаграмма-график показала четкую сезонную закономерность в изменениях концентрации кислорода в воде, причем низкий уровень приходится на летние месяцы. Летом 2014 года средняя концентрация кислорода составляла около 5 мг/л, что близко к критическому значению.

Глядя на гистограмму становится очевидно, что некоторые точки указывают на уровень кислорода, соответствующий мертвой зоне, если такая концентрация сохраняется в течение некоторого времени. Сейчас критически важно определить, есть ли в заливе какие-либо участки с постоянно низким уровнем растворенного кислорода.


Выполнение интерполяции и сравнение результатов

Точность модели интерполяции определялась тем, насколько прогнозируемые значения местоположения были близки к реальным значениям в нем. Однако в подобном определении точности видны явные противоречия. Если вы измерили концентрацию кислорода только в наборе определенных местоположений, как вы можете судить о пригодности модели интерполяции в новых местоположениях? Если вы не знаете реальные значения в новых местоположениях, какая основа у вас имеется для точности прогнозирования? Все это выглядит как непреодолимые противоречия, но имеется общепринятое решение этой проблемы, известное как перекрестная проверка.

Перекрестная проверка – это метод статистики "исключение по одному". Точность модели оценивается путем последовательного удаления каждой измеренной точки из набора данных, чтобы использовать оставшийся набор для прогнозирования значения в местоположении удаленной точки. Если модель интерполяции надежна, оставшиеся точки должны точно предсказывать истинное (измеренное) значение в скрытой точке. Затем вы можете сравнить интерполированное и измеренное значение и понять, насколько они близки. Разница между истинным и предсказанным значением для определенной точки называется ошибкой перекрестной проверки. После перекрестной проверки каждой измеренной точки можно построить различные виды числовой и графической диагностики, чтобы получить доступ к общей точности модели. Вы будете анализировать диагностику перекрестной проверки, интерполируя средние уровни концентрации кислорода, начиная с лета 2014 года, и сравните результаты с летом 2015 года.

Интерполяция данных с использованием мастера

Затем вы будете использовать измеренные значения О2 для интерполяции уровней кислорода в точках, где измерения не проводились. Результаты интерполяции на поверхности, которые можно использовать для картографии и дальнейшего анализа. Вы будете использовать объекты слоя Bay как барьеры для ограничения интерполяции Чесапикским заливом.

Для интерполяции данных лета 2014 года, вы используете Geostatistical Wizard, динамический набор страниц, которые разработаны с целью провести вас через процесс построения модели интерполяции и оценки ее качества.

  1. На ленте, на вкладке Анализ в группе Рабочие процессы щелкните Мастер операций геостатистики.

    Справка мастера операций геостатистики

    Откроется диалоговое окно Мастера операций геостатистики.

  2. На первой странице Мастера операций геостатистики в разделе Интерполяция с барьерами выберите Интерполяция ядра.

    Выберите Интерполяция ядра с барьерами

  3. В разделе Набор данных для Исходный набор данных подтвердите, что выбрано значение DisslovedO2, а для Поле данных выберите MeasuredValue. Для Объектов барьеров выберите Bay.

  4. Щелкните Далее.

    Откроется страница Загрузка данных.

  5. На странице Загрузка данных в поле Набор данных выберите Использовать среднее.

    Опция Использовать среднее

  6. Щелкните Далее.

    Откроется страница Интерполяция ядра.

    Страница Интерполяция ядра содержит карту, общие свойства и результат идентификации для одной точки

    Параметр Ширина полосы очень важен, но вы не ввели значение. Ширина полосы определяет радиус окружности поиска в предварительном просмотре поверхности. Для этих данных ширина полосы вычисляется в метрах и по умолчанию рассчитывается программой по принципу простой оптимизации. Можно оставить его пустым и разрешить ArcGIS Pro вычислить его на основе ваших данных.

    Значения в поле Результат идентификации относятся к текущему местоположению, указанному перекрестием. При желании вы можете щелкнуть по другим местоположениям, чтобы увидеть их значения.

    Примечание:

    Поскольку в слое DissolvedO2 имеется выборка, в вычислениях интерполяции будут использоваться только выбранные объекты.

  7. Щелкните Далее.

    Откроется страница Перекрестная проверка.

    Страница Перекрестная проверка

    Вы подробно изучите перекрестную проверку позже в этом руководстве.

  8. Щелкните Готово. В окне Отчет метода щелкните OK.

    На карте появится выходной слой.

    Итоговый слой Интерполяции ядра

    Слой Интерполяция ядра – тип пользовательского слоя, используемый только в Дополнительный модуль ArcGIS Geostatistical Analyst. он оптимизирован для быстрой визуализации и вычисления, и его можно экспортировать либо в растровый, либо в векторный слой.

    Красные и оранжевые участки на карте соответствуют областям с высокой концентрацией кислорода в воде. Обратите внимание, что участки с максимальными значениями расположены в южной части залива и на концах бухт. Участки с низкой концентрацией (голубые и зеленые области) расположены в середине и в северной части залива.

  9. Сохраните проект.

    Вы использовали инструмент Geostatistical Wizard, часть Дополнительный модуль ArcGIS Geostatistical Analyst, для интерполяции среднего уровня концентрации растворенного кислорода в течение лета 2014 года в Чесапикском заливе. Основываясь на интерполированной карте, вы можете сделать вывод о том, что хотя в некоторых районах Чесапикского залива, возможно, уровень концентрации кислорода в воде летом 2014 года был ниже допустимого, но не было никаких признаков наличия в водах залива постоянных мертвых зон, в которых нет условий существования рыб и растений.

Изучение результатов перекрестной проверки

Далее вы изучите окно Перекрестной проверки слоя, который вы создали, и интерпретируете его различные элементы.

  1. На панели Содержание щёлкните правой кнопкой слой Интерполяция ядра и выберите Перекрестная проверка.

    Контекстное меню геостатистического слоя

    Примечание:

    Перекрестная проверка является свойством геостатистического слоя и не поддерживается для других типов слоев.

    Откроется окно Перекрестная проверка для слоя Интерполяция ядра.

    Примечание:

    Более подробно о различных вкладках и статистике, доступных в окне Перекрестная проверка, см. Выполнение перекрестной проверки и проверки.

  2. В правой части окна Перекрестная проверка щелкните вкладку Таблица.

    Таблица содержит результаты перекрестной проверки для каждой измеренной точки.

  3. Если необходимо, измените размер окна, чтобы увидеть столбец Ошибка.

    Вкладка Таблица

    Для каждой точки поддерживаются Измеренное значение, а также Проинтерполированное значение из перекрестной проверки. Значение Ошибки получается путем вычитания Измеренного значения из Проинтерполированного. Если значение Ошибки больше нуля, это означает, прогноз из перекрестной проверки выше истинного значения. Если значение Ошибки меньше нуля, прогноз ниже истинного значения.

  4. Щелкните на заголовке столбца Ошибка, чтобы отсортировать его от самого низкого до самого высокого значения.

    Сортировать столбец Ошибка

    В отсортированном столбца Ошибка самая низкая ошибка перекрестной проверки равна -2,76. Это означает, что спрогнозированный при перекрестной проверке уровень концентрации кислорода в этом местоположении на 2,76 мг/л меньше реального значения.

  5. Щелкните на заголовке столбца Ошибка, чтобы отсортировать его в обратном порядке.

    Самая высокая ошибка перекрестной проверки составляет 3,03. Это означает, что спрогнозированный при перекрестной проверке уровень концентрации кислорода для этой точки примерно на 3.03 мг/л выше измеренного значения.

  6. Щелкните первую строчку, чтобы выбрать точку с самой большой ошибкой перекрестной проверки.

    Выбранная запись в таблице подсвечивает соответствующую точку на графике слева. Для этой записи точка находится на оси x графика.

    Выбор записи с самой большой ошибкой перекрестной проверки

    Этот график показывает диаграмму рассеяния интерполированных значений по сравнению с измеренными значениями для каждой точки вместе с синей линией регрессии для точек. В идеале, интерполированные значения должны быть близки к измеренным, и ожидаемая линия регрессии должны идти под углом 45 градусов. Серая базовая линия показана в окне, чтобы вы могли оценить, насколько близка линия регрессии к этому идеальному углу в 45 градусов. В данном случае синяя линия регрессии немного отклонена от серой базовой, и имеется изменчивость среди точек вокруг линий. Однако разница не выглядит слишком большой. Если синяя линяя близка к вертикали или горизонтали, это указывает на серьезные проблемы, которые неприемлемы.

  7. В разделе окна с графической диагностикой щелкните на вкладке Ошибка.

    Вкладка Ошибка

    На вкладке Ошибка показана диаграмма рассеяния измеренный значений по сравнения с ошибками перекрестной проверки. Этот график используется для того, что бы определить, зависят ли ошибки перекрестной проверки от измеренных значений.

    Независимость ошибок и измеренных значений важна, так как вам необходима одинаковая точность для низких, вредных и высоких уровней концентрации кислорода. На независимость ошибок и измеренных значений указывает горизонтальная линия регрессии. На вашем графике линия регрессии идет вниз, что указывает на то, что самые высокие измеренные значения занижены, а самые низкие измеренные значения завышены.

    Это обычное явление, оно называется сглаживанием. Степень сглаживания вашего графика является типичной, но следует учитывать, что подобное сглаживание означает, что модель может некорректно предсказывать безопасный уровень концентрации кислорода в местоположениях, где на самом деле уровень опасен или вреден для здоровья. Это не должно вас остановить, ведь есть кое-что, что следует раскрыть при отчете о ваших находках.

  8. В разделе окна Перекрестная проверка с числовой диагностикой щелкните на вкладке Краткая информация.

    Вкладка Краткая информация

    На вкладке Краткая информация показана суммарная статистика для информации на вкладке Таблица, она обеспечивает простой доступ к результатам перекрестной проверки.

    Среднеквадратическое значение – это самое важное значение статистики для оценки точности модели. Это значение всегда будет больше нуля, но чем ближе оно к нулю, тем ближе, в среднем, будут интерполированные значения перекрестной проверки к измеренным значениям. Ваше среднеквадратическое значение, приблизительно равное1,12, указывает, что ошибка проверки отстоит от истинных значений немного более, чем 1 мг/л концентрации кислорода. Все другие данные статистики дают полезную информацию о модели, но только среднеквадратическое значение непосредственно измеряет точность интерполяции.

    Другой сводной статистикой, на которой следует сосредоточиться, является Среднее значение. Это среднее от ошибок перекрестной проверки, оно используется, чтобы понять, имеет ли модель тенденцию к интерполяции слишком высоких или слишком низких значений (это называется смещением). Если модель несмещенная, это значение должно быть близко к нулю. Если оно значительно больше нуля, то модель систематически создает слишком высокие значения интерполяции. Аналогично, если оно значительно меньше нуля, то модель систематически создает слишком низкие значения интерполяции. Ваше значение, приблизительно равное 0,045, указывает, что у модели имеется очень малое смещение. В среднем, она создает значения, примерно на 0,045 мг/л выше, но это очень небольшая величина. Вы можете уверенно предположить, что ваша модель несмещенная, на основании малого Среднего значения.

  9. Закройте окно Перекрестная проверка.

Просмотр диаграмм за 2015

Далее вы выберите измерения концентрации кислорода, взятые в течение лета 2015 года. Вы изучите данные при помощи диаграмм.

  1. Если необходимо, откройте задачу Filter Samples for Summer 2014 and Summer 2015.
    Подсказка:

    На ленте выберите Вид, затем щелкните Панель Каталог. Разверните папку Задачи.

  2. Дважды щелкните Apply Summer 2015 Filter.
  3. Щелкните Запустить.

    Выбраны измерения, взятые на глубине более 5 метров, с 15 июня по 15 сентября 2015 года.

  4. Щелкните Готово и закройте панель Задачи.
  5. На панели Содержание щелкните кнопку По отображению.

    Кнопка Перечислить по порядку отображения

    На панели Содержание отображаются созданные ранее диаграммы. Диаграммы хранятся как тип свойств слоя, которым можно управлять вместе со списком слоев на панели Содержание карты.

  6. Дважды щелкните на Распределение MeasureValue, чтобы повторно открыть гистограмму. Убедитесь, что кнопка Фильтр по выборке включена и отображаются только выборка для лета 2015 года.

    Гистограмма данных лета 2015

  7. На панели Свойства диаграммы в разделе Статистика включите Медиана и Ст. откл.

    Гистограмма обновляется, отображая новые значения.

    Гистограмма лета 2015 года с медианой и стандартным отклонением

    Гистограмма выглядит аналогично гистограмме лета 2014. Большинство измерений концентрации кислорода составляют от 3 мг/л до 9 мг/л, и имеется также большой столбец с левой стороны, на уровне, близком к опасному значению в 0,2 мг/л.

  8. На панели Содержание дважды щелкните Mean of MeasureValue over SampleDate, чтобы снова открыть линейную диаграмму.
  9. На панели Свойства диаграммы в Опции биннинга времени измените размер интервала на 5 дней.

    Обновить бининг времени

  10. Если необходимо, щелкните кнопку Фильтр по выборке, чтобы показать только выбранные примеры для лета 2015 года.

    Диаграмма-график для лета 2015 года

    Диаграмма-график также выглядит аналогично лету 2014. Общий средний уровень концентрации кислорода в Чесапикском заливе идет вверх и вниз без какой-либо видимой закономерности. Это означает, что вы можете с уверенностью получить среднее значение в каждом местоположении в течение этого периода времени.

  11. Закройте панель Свойства диаграммы и обе диаграммы.

Интерполяция данных с помощью инструмента

Ранее вы использовали Geostatistical Wizard для интерполяции измерений, полученных летом 2014 года. В то же время, большинство методов интерполяции, имеющихся в Geostatistical Wizard, также доступны в виде инструментов геообработки. Далее вы проинтерполируете средние уровни концентрации кислорода летом 2015 года при помощи инструмента геообработки Интерполяция ядра с барьерами.

  1. На ленте щелкните вкладку Анализ и в группе Геообработка щелкните Инструменты.

    Откроется панель Геообработка.

  2. На панели Геообработка выполните поиск по слову интерполяция.

    В результатах поиска будет несколько возможных инструментов геообработки, которые применяют или содержат искомый термин.

  3. Щелкните Интерполяция ядра с барьерами.

    Результаты поиска в геообработке

    Инструмент геообработки Интерполяция ядра с барьерами откроется на панели Геообработка.

  4. Для Входных объектов выберите DissolvedO2.

    Этот параметр указывает, что слой DissolvedO2 содержит точки, которые будут интерполироваться.

  5. Для Поля значений Z выберите MeasureValue.

    Этот параметр указывает, что поле MeasureValue содержит измерения концентрации кислорода.

  6. Для Выходной геостатистический слой введите Лето 2015.

    Этот параметр указывает имя итогового геостатистического слоя.

  7. Для Входных объектов абсолютных барьеров выберите Bay.

    Этот параметр указывает, что слой Bay будет использоваться как барьер при интерполяции. Это позволит инструменту использовать расстояния по воде.

  8. Примите оставшиеся значения по умолчанию.

    Параметры Интерполяции ядра с барьерами

    Если параметр Ширина полосы оставлен пустым, инструмент будет определять это значение как самое малую возможную среднеквадратическую ошибку перекрестной проверки. Таким же образом Geostatistical Wizard определяет оптимальную ширину полосы.

    Примечание:

    Инструмент Интерполяция ядра с барьерами будет брать среднее все совпадающих точек по умолчанию, поэтому это не нужно специально указывать в инструменте геообработки. Другие методы агрегирования совпадающих точек можно найти на вкладке Параметры среды инструмента.

  9. Щелкните Запустить.

    Инструмент выполняется. Слой с названием Лето 2015 добавлен на карту Chesapeake Bay Dissolved O2. Этот слой представляет прогнозируемый уровень концентрации кислорода в Чесапикском заливе летом 2015 года.

  10. Закройте все итоговые окна, связанные с запуском инструмента. На панели Содержание выключите слой DissolvedO2.
  11. На панели Содержание включите Лето 2015 и отключите его, и сравните его со слоем Интерполяция ядра, который содержит данные на лето 2014.

    Концентрации кислорода летом 2015

    Как и летом 2014, летом 2015 года самые высокие уровни средней концентрации кислорода наблюдаются в конце бухт и рядом с Атлантическом океаном в южной части залива. Самые низкие уровни концентрации кислорода снова видны в средней и верхней частях залива.

Сравнение слоев с помощью перекрестной проверки

Далее вы рассмотрите окно Перекрестная проверка для слоя, созданного в предыдущем разделе, и сравните числа и графику с картой лета 2014.

  1. На панели Содержание дважды щелкните слой Интерполяция ядра.

    Откроется окно Свойства слоя.

  2. На вкладке Общие для Имени удалите Интерполяция ядря и введите Лето 2014.

    Переименование слоя Лето 2014 поможет вам различать и сравнивать результаты для 2014 и 2015 года.

  3. Нажмите OK.
  4. На панели Содержание щёлкните правой кнопкой Лето 2014 и выберите Перекрестная проверка.

    Откроется окно Перекрестная проверка для уровней концентрации кислорода летом 2014 года.

  5. На панели Содержание щёлкните правой кнопкой Лето 2015 и выберите Перекрестная проверка.

    Откроется окно Перекрестная проверка для уровней концентрации кислорода летом 2014 года.

  6. Сравните значения Среднеквадратичная и Среднее для лета 2014 и лета 2015.

    Краткая информацияЛето 2014Лето 2015

    Количество

    78

    85

    Среднеквадратичная

    1,117

    1,002

    Среднее

    0,036

    0,021

    Среднеквадратичное значение упало с 1,117 летом 2014 до 1,002 летом 2015. Это указывает, что прогноз перекрестной проверки был примерно на10 процентов более точным летом 2015, по сравнению с летом 2014. Возможно, это произошло потому, что для лета 2015 имеется примерно на 10 процентов больше данных (85 точек, а не 78), на что указывает значение Количества.

    Среднее значение изменилось с 0,036 летом 2014 на 0,021 летом 2015. Это значение должно быть максимально близко к нулю, поэтому лето 2015 имеет немного меньшее смещение, чем лето 2014 (хотя оба уровня смещения низкие).

  7. В графической диагностике щелкните на вкладке Проинтерполированное значение и для лета 2014, и для лета 2015.
  8. Сравните графики на вкладке Проинтерполированное значение. При необходимости разместите окна для Лето 2014 и Лето 2015 рядом для сравнения.

    Сравнение графиков перекрестной проверки

    Синяя линия регрессии для лета 2015 (справа) выглядит расположенной ближе к базовой серой линии, чем линия регрессии лета 2014 (слева).

  9. В графической диагностике щелкните вкладку Ошибка и для лета 2014, и для лета 2015.

    Сравнение графиков ошибок

    Графики на вкладке Ошибка для лета 2014 и лета 2015 выглядят практически идентичными. Возможно, вы помните, что идеальная синяя линия регрессии должна быть горизонтальной. Идущая вниз линия регрессии, и летом 2014, и летом 2015, указывает, что модель сглаживает данные, занижает большие значения и завышает малые.

  10. Сравните уклон Функции регрессии, указанный с левом нижнем углу каждого графика.

    Функция регрессии Лето 2014Функция регрессии Лето 2015

    -0,668

    -0,581

    Функция регрессии показывает, что уклон синей линии регрессии более отрицательный для лета 2014, чем для лета 2015 (-0,668 против -0,581). Это указывает на немного большее сглаживание для лета 2014, чем для лета 2015.

    Следовательно, можно заключить, что интерполяция лета 2015 имеет немного меньшую вероятность, чем для лета 2014, чтобы неправильно прогнозировать безопасные уровни концентрации кислорода в местоположениях, где реальные значения опасны и вредны для здоровья. Однако ни один год не показывает сильного сглаживания.

  11. Закройте оба окна Перекрестной проверки.
  12. Сохраните проект.

    Сейчас вы сравнили точность и надежность модели интерполяции при помощи перекрестной проверки. Изучив таблицу перекрестной проверки, суммарную статистику и графики, вы теперь имеете возможность количественно выразить точность и надежность модели интерполяции. С такими навыками вы можете обнаружить важные ограничения моделей. Необходимо довести до сведения, что модели, похоже, сглаживают данные, а это потенциально может скрыть некоторые опасные уровни концентрации кислорода в Чесапикском заливе.

    Когда статистические составляющие анализа завершены, можно представить эту информацию, чтобы она была понятна вашим коллегам и руководству. Даже наилучший анализ не будет иметь никакого влияния, если он не сможет привлечь внимания нужных людей, и они не смогут его быстро понять.

    Например, вы можете экспортировать свои геостатистические слои в растры и применить значимую цветовую гамму. Затем вы можете добавите отдельные растры в компоновку, чтобы создать плакат с вашими открытиями. Вы могли бы создать визуализацию, подобную той, что изображена на этом плакате. Инструкции по созданию компоновок приведены в серии руководств Создание компоновки в ArcGIS Pro.

В этом руководстве вы использовали Дополнительный модуль ArcGIS Geostatistical Analyst. Вы использовали Geostatistical Wizard и инструмент геообработки Интерполяция ядра с барьерами для анализа средних уровней растворенного кислорода в Чесапикском заливе летом 2014 и 2015 годов. При помощи интерполяции вы создали геостатистические слои, прогнозирующие средние уровни концентрации кислорода по всему заливу. Далее вы выполнили перекрестную проверку результатов, чтобы убедиться в точности интерполяции.

На основании результатов можно сказать, что в Чесапикском заливе средние уровни никогда не опускались к опасному уровню 0,2 мг/л, но множество отдельных измерений были близки или ниже критически низкого уровня. Несмотря на предпринимаемые усилия по поддержанию уровней концентрации кислорода в Чесапикском заливе выше здорового уровня 5,0 мг/л, ваш анализ предоставляет научно и статистически подтвержденное заключение о том, что даже в самые худшие периоды лета уровни концентрации кислорода достаточны для поддержания здоровой морской экосистемы.

Мертвые зоны являются проблемой по всему миру. Аналогичные процессы интерполирования уровней концентрации кислорода можно использовать в таких местах, как Мексиканский залив, Ла-Манш и Восточно-Китайское море. Процесс изучения данных при помощи диаграмм, интерполяции данных и изучения точности результатов при помощи перекрестной проверки является обычным почти для всех рабочих процессов интерполяции. Вы можете загрузить данные из других источников и за другие года из Chesapeake Bay Program Water Quality Database (с 1984 г. и до настоящего времени) и повторить шаги с этими новыми или обновленными данными.

Вы можете найти больше учебных пособий в галерее учебных пособий.