Интерполяция измерений температур с использованием Мастера операций геостатистики
Построение гистограмм распределения данных
Сначала вы загрузите пакет проекта и на протяжении всего урока будете использовать хранящиеся в этом пакете данные для интерполяции температур с помощью Мастера операций геостатистики.
- Загрузите пакет проекта InterpolateTemperatures.
- Найдите загруженный файл на вашем компьютере. Дважды щелкните InterpolateTemperatures.ppkx, чтобы открыть его в ArcGIS Pro.
Примечание:
Если вы еще не выполнили вход в ArcGIS Pro, для этого появится специальный экран. Если вы уже выполнили вход, проект откроется. Если вы не выполнили вход, переходите к шагу 3, а если вы вошли - к шагу 4. Если ArcGIS Pro получает лицензию через портал Enterprise, войдите с использованием соответствующих учетных данных. Вы также можете использовать учетную запись ArcGIS Online для входа в ArcGIS Pro.
- Войдите под своей учетной записью организации ArcGIS или в ArcGIS Enterprise под учётной записью именованного пользователя.
Примечание:
Если у вас нет учетной записи организации, см. варианты доступа к программному обеспечению.
- Потратьте немного времени на изучение данных.
Точки на карте представляют выборочные измерения температур. Каждая точка хранит средние значения температуры для каждого месяца. Вы изучите распределение данных для нескольких месяцев, и решите, какие лучше всего подойдут для интерполяции.
Примечание:
Набор данных целиком вы можете найти в ArcGIS Living Atlas of the World: World Historical Climate – Monthly Averages for GHCND Stations for 1981 - 2010.
- На панели Содержание щёлкните правой кнопкой слой Temperature. Наведите на строку Построить диаграмму и выберите Гистограмма.
Откроется панель Свойства диаграммы и пустая панель диаграммы.
- В панели Свойства диаграммы измените Число на Jan Avg. Temp C (Сокращение от средней температуры по Цельсию за январь) и отметьте опцию Показать нормальное распределение.
Диаграмма обновится и отобразится гистограмма распределения значений температуры по точечным данным. Вы можете видеть, что значения варьируются в диапазоне от -10.2 до 30.1° градусов Цельсия. Значения осей могут отличаться, в зависимости от размера панели.
Кривая голубого цвета показывает линию нормального распределения на гистограмме. Данные, соответствующие нормальному распределению, соответствуют кривой колоколообразной формы. Вы видите, что распределение январских температур не соответствует нормальному, и существенно смещено вправо.
- В панели Свойства диаграммы измените Число на Aug Avg. Temp C. Гистограмма обновится в соответствии со значениями в новом поле.
Температуры в августе значительно ближе к нормальному распределению. Методы интерполяции работают лучше, если распределение данных приближается к нормальному (колоколообразная кривая), а некоторые геостатистические методы требуют, чтобы данные имели нормальное распределение. Поэтому вы будете использовать Aug Avg. Temp C для выполнения этого урока.
Примечание:
Если ваши данные не соответствуют кривой колоколообразной формы - вы можете применить преобразование для приведения данных к нормальному распределению. Более подробно о преобразованиях по методу Box-Cox, по методу арксинуса и логарифмических преобразованиях.
- Закройте вид диаграммы.
- На панели Содержание щелкните правой кнопкой мыши слой Temperature и выберите Символы.
Появится панель Символы.
- Измените Поле на Aug Avg. Temp C.
Карта обновится, будут показаны средние температуры в августе.
Создание геостатистических поверхностей с помощью метода обратно взвешенных расстояний
Далее вы создадите поверхности прогнозирования температур для территории Африки и Среднего Востока из набора данных точек измерений.
В геостатистике признается допущение, что объекты, которые находятся поблизости, более схожи, чем объекты, удаленные друг от друга. Соответственно, в неизвестных местоположениях значения должны быть схожи с известными местоположениями, которые находятся рядом.
Инструменты Мастер операций геостатистики в ArcGIS Pro предлагает множество различных методов интерполяции для создания поверхностей прогнозируемых значений. Обычно вы не знаете, какой использовать, и вам необходимо попробовать разные и сравнить полученные результаты. Первый метод, который вы попробуете, называется интерполяция ОВР (обратные взвешенные расстояния).
ОВР является точным методом. Это означает, что результирующая поверхность не будет меняться в зависимости от значений выборки. Кроме того, это один из наиболее простых методов. Более подробно можно прочитать в разделе Как работает метод обратных взвешенных расстояний.
- На панели Содержание щелкните правой кнопкой слой Temperature и выберите Свойства.
Откроется панель Свойства слоя: Temperature.
- Щелкните вкладку Источник.
- Перейдите к разделу Пространственная привязка и разверните его.
Первая строка в таблице Система координат проекции.
Для геостатистики важна точность измерения расстояния. Чтобы минимизировать погрешности в вычислении расстояний, входные данные должны быть в системе координат проекции (не в географической). Вы можете проецировать данные с помощью инструмента геообработки Проецировать.
Данные урока находятся в равнопромежуточной конической проекции, центрированной на Африке. Нет таких проекций, которые могут идеально сохранять все расстояния на карте, но равнопромежуточные проекции подходят для такой задачи лучше каких-либо других. Выбор проекции очень важен, особенно при картографии большой области, например целого континента.
- Щелкните Отмена, чтобы закрыть окно Свойства слоя.
- На ленте, на вкладке Анализ в группе Рабочие процессы щелкните Мастер операций геостатистики.
Откроется диалоговое окно Мастера операций геостатистики.
- В разделе Детерминистские методы выберите Метод обратно взвешенных расстояний. Возможно, вам понадобиться прокрутить окно вниз, чтобы найти эту опцию.
- В строке Поле данных выберите Aug Avg. Temp C.
- Щелкните Далее.
На этой странице вы можете в интерактивном режиме изменить параметры метода ОВР и увидеть, как меняется модель на предварительном просмотре. Раздел Результат идентификации показывает прогнозированное значение для любого местоположения.
- В Мастере операций геостатистики щелкните несколько разных местоположений на карте предварительного просмотра и посмотрите прогнозированные температуры в разделе Результат идентификации.
- В разделе Общие свойства для Типа окрестности выберите Сглаженная. Эта опция в основном делает прогнозируемую поверхность более сглаженной и менее зазубренной.
Карта предварительного просмотра обновится. Если для Типа окрестности выбрана Стандартная, на карте предварительного просмотра вы видите только одну окружность. Если тип окрестности - Сглаженная, вы увидите три окружности.
Эти окружности на карте предварительного просмотра представляют окрестность поиска. При вычислении нового значения учитываются только те точки выборки, которые попадают в окрестность поиска. Более подробно об этом процессе, включая сглаженный тип окрестности поиска см. в разделе Окрестность поиска.
- Убедитесь, что Коэффициент сглаживания установлен на 0.2.
- Щелкните Готово.
- В окне Отчет метода щелкните OK.
На карту добавлен новый слой, представляющий поверхность температур для Африканского региона.
- В панели Содержание выберите Метод обратно взвешенных расстояний и нажмите F2 на клавиатуре, чтобы сделать имя доступным для редактирования.
- Переименуйте слой на Сглаженный ОВР.
- Перетащите слой Сглаженный ОВР выше слоя Oceans и разверните его.
На карте показаны прогнозированные значения температур в местоположениях, где не было измерений.
Далее вы построите немного другую поверхность, используя те же данные и тот же метод.
- Откройте Мастер операций геостатистики.
Подсказка:
На ленте, на вкладке Анализ щелкните Мастер операций геостатистики.
- Подтвердите выбранный Метод обратно взвешенных расстояний и Поле данных Aug Avg. Temp C. Щелкните Далее.
- Для Типа окрестности выберите Сглаженная.
- Щелкните кнопку Щелкните для оптимизации в параметре Степенная.
Значение Степени изменится на 3.1076.
Не все точки в окрестности поиска считаются равнозначными. Те, которые расположены ближе к прогнозируемому местоположению, вносят больший вклад в вычисление.
Если Степень равна 0, все точки в окрестности имеют одинаковый вес. Чем выше степень, тем быстрее вес снижается по мере увеличения расстояния. Высокое значение степени - 3.1 приводит к построению более локализованной и менее обобщенной поверхности, так как точки, отдаленные от прогнозируемого местоположения, оказывают незначительное влияние.
- Разверните Веса и прокрутите вниз по списку, чтобы найти веса разных цветов.
В списке отражены все точки в пределах радиуса поиска и веса, назначенные им.
Щелкните по некоторым значениям, чтобы увидеть точки, выбранные на карте предварительного просмотра. Красные точки оказывают большее влияние, чем зеленые.
- Сверните Веса и щелкните Далее.
Откроется окно Перекрестная проверка, где можно оценить, насколько хорошо выполнена интерполяция.
Информация на этой странице позволяет вам оценить точность прогнозируемой поверхности. Она выполняется путем удаления одной точки из набора данных и использования всех остальных точек для прогнозирования значения в месте удаленной точки.
На графике сравниваются прогнозируемые значения (по оси x) и измеренные (по оси y), и если тонкая линия серого цвета совпадает с толстой линией голубого цвета - можно сделать вывод о хорошем результате.
Среднее значение позволяет вам судить, смещена ли модель при прогнозировании высоких или низких значений. Лучше всего, если значение близко к 0.
Значение Среднеквадратичной ошибки почти 2.5. Это означает, что прогнозированные значения температур отличаются от измеренных значений примерно на 2.5 градусов Цельсия.
- Щелкните Готово, и, в окне Отчет метода щелкните OK.
Новый слой добавлен на карту.
- Переименуйте слой на Оптимизированный сглаженный ОВР.
- На панели Содержание выключите точечный слой Temperature.
- Снимите и поставьте отметку для слоя Оптимизированный сглаженный ОВР, чтобы сравнить его со слоем Сглаженный ОВР.
Оптимизированный сглаженный ОВР (слева) и Сглаженный ОВР (справа). Оба слоя похожи, но в новом слое больше красного оттенка. Какой лучше? Вы можете сравнить точность двух слоев, чтобы решить, какой использовать.
- В панели Содержание выберите оба слоя, и Оптимизированный сглаженный ОВР и Сглаженный ОВР.
Примечание:
Для выбора нескольких слоев нажмите при выборке Shift.
- Щелкните правой кнопкой и выберите Перекрестная проверка.
Откроются два окна Перекрестная проверка для каждого слоя. Одно перекрывает другое.
- Переместите окна, чтобы видеть оба сразу.
Это такое же окно Перекрестной проверки, которое вы видите в Мастере операций геостатистики. Вы уже просматривали одно из них, но результаты лучше понятны, если вы можете сравнить несколько прогнозируемых поверхностей.
На вкладке Краткая информация приведено значение ошибки для каждой поверхности. Чем ближе значение Среднеквадратичной ошибки к 0. тем более точная поверхность.
Поверхность Оптимизированный сглаженный ОВР показывает меньшее значение ошибки, поэтому можно сказать, что эта поверхность прогнозированных значений более точная.
- Закройте оба окна Перекрестной проверки.
- В панели Содержание выберите только Сглаженный ОВР. Щелкните на слое правой кнопкой мыши слой и выберите Удалить.
- На панели быстрого доступа в верхнем углу ленты щелкните кнопку Сохранить.
Обратные взвешенные расстояния - удобный и быстрый метод интерполяции. Он хорошо подходит для получения первоначальной картины явления, которое вы отображаете, и иногда его может быть достаточно, прогнозированные значения будут точно соответствовать измеренным значениям. Но он также может выдавать кольцевой эффект вокруг островов в ваших данных.
Создание геостатистических поверхностей с помощью метода кригинга
Далее вы попробуете использовать кригинг, чтобы увидеть возможности получения более точных результатов. Кригинг является очень гибким методом геостатистики. То есть вы можете адаптировать его под ваши данные множеством способов, но при этом вам придется выбирать из целого списка различных опций.
- Откройте Мастер операций геостатистики.
- В разделе Методы геостатистики, выберите Кригинг/Кокригинг и щелкните Далее.
- В строке Ординарный кригинг выберите Прогноз, чтобы построить поверхность прогнозируемых значений, подобно той, которую вы сделали методом ОВР.
Сначала вы создадите поверхность с параметрами по умолчанию методом Ординарный кригинг.
- Щелкните Готово, затем ОК.
Новый слой добавлен на карту.
- Переименуйте слой на Кригинг по умолчанию.
- Сравните Кригинг по умолчанию и Оптимизированный сглаженный ОВР.
Кригинг по умолчанию (слева) и Оптимизированный сглаженный ОВР (справа). Новый слой выглядит значительно более генерализированным. Далее вы измените некоторые параметры чтобы попробовать улучшить геостатистическую поверхность.
- Откройте Мастер операций геостатистики.
- Подтвердите в качестве выбранного метода Кригинг/Кокригинг и щелкните Далее.
- В разделе Ординарный кригинг выберите Прогноз и щелкните Далее.
- На странице Моделирование варигораммы/ковариации щелкните кнопку Оптимизировать модель.
Кнопка Оптимизировать подбирает параметры, которые способствуют уменьшению ошибки прогнозирования. Обратите внимание, что карта поверхности вариограммы и некоторые параметры изменились. В нашем случае изменения минимальны.
- Щелкните Далее.
- На странице Окрестность поиска измените параметр Тип секторов на 8 секторов.
Увеличение числа секторов гарантирует, что соседи будут найдены во всех направлениях, а большой кластер соседних точек в одном из направлений не будет полностью влиять на прогнозируемое значение.
- Щелкните Далее и просмотрите результаты на панели Перекрестная проверка. Обратите внимание, что данных по перекрестной проверке кригинга существенно больше, чем в методе обратно взвешенных расстояний.
- Щелкните Готово, затем ОК.
Еще один слой добавлен на карту.
- Переименуйте слой на Модифицированный кригинг.
- Сравните Модифицированный кригинг и Кригинг по умолчанию.
Модифицированный кригинг (слева) и Кригинг по умолчанию (справа). Две поверхности очень похожи.
- В панели Содержание выберите Кригинг по умолчанию и Модифицированный кригинг. Щелкните правой кнопкой и выберите Перекрестная проверка.
- Переместите окна, чтобы видеть оба сразу. Изучите значения на вкладке Краткая информация.
Кригинг по умолчанию
Модифицированный кригинг
Среднее
-0.013
-0.024
Среднеквадратичная
2.294
2.283
Средняя нормированная
0,001
0.003
Среднеквадратичная нормированная
0.854
0.841
Средняя стандартная ошибка
2.740
2.775
Числа, близкие к нулю, указывают на более высокую точность. Исключение - показатель Среднеквадратичная нормированная. В этом случае желаемое значение приближается к 1.
По этим значения не сразу видно, какая поверхность лучше. Поверхность Кригинг по умолчанию показывает лучшие значения во всех категориях, кроме Среднеквадратичная. Но это не обязательно означает, что вторая поверхность лучше.
Если какое-либо из этих значений слишком отклоняется, слой рассматривать не следует. Но в этом сценарии для обоих слоев результаты перекрестной проверки удовлетворительные, поэтому вы можете использовать значение Среднеквадратичная в качестве маркера. Также желательно, чтобы значения Среднеквадратичная ошибка и Средняя ошибка были максимально подобны. Если между ними большая разница - это означает, что прогноз нестабилен.
Отчет Перекрестной проверки указывает, что поверхность Модифицированный кригинг немного точнее, чем Кригинг по умолчанию.
- Откройте окно Перекрестной проверки для Оптимизированный сглаженный ОВР.
Поверхность показывает значение Среднеквадратичной ошибки 2.5. Это значительно хуже, чем любая из поверхностей кригинга.
- Закройте все окна Перекрестной проверки.
- Удалите из карты Оптимизированный сглаженный ОВР и Кригинг по умолчанию.
- Сохраните проект.
Кригинг значительно более сложный метод интерполяции, нежели ОВР, но он требует настройки ряда параметров. С другой стороны, это дает вам возможность пробовать разные параметры, пока не подберете наиболее подходящие для ваших данных и моделируемого явления. Кригинг также дает вам возможность оценить точность ваших результатов, например отобразить на карте поверхность стандартной ошибки, что вы выполните далее в уроке.
Карта оценки стандартной ошибки
У вас есть четыре разные поверхности уровня температур для территории Африки и Среднего востока. Все они построены на основании одних и тех же данных, но каждая поверхность несколько отличается от другой. Очевидно, что можно использовать все эти поверхности, но их не стоит воспринимать как абсолютно точные. Некоторые участки поверхности (где есть много точек измерений) можно считать достаточно точными и более надежными, чем другие (где точки встречаются реже). Для принятия решений может быть полезно знать уровень погрешности прогнозирования.
- В панели Содержание выберите Модифицированный кригинг.
- На ленте, на вкладке Геостатистический слой измените Тип отображения на Стандартная ошибка.
На карте видны области красного цвета.
- На панели Содержание включите слой Temperature.
Стандартные ошибки – это измеренные погрешности для прогнозированных значений. Области темно-красного цвета на карте соответствуют большим значениям стандартной ошибки, и, как следствие, меньшей точности прогнозируемых значений. Более светлые области указывают на участки, где можно доверять прогнозируемым значениям. Карта подтверждает, что максимальный уровень ошибки прогнозирования приходится на океан. Это логично, так как на вне континента измерения температур не проводились (только на некоторых островах).
- Для слоя Модифицированный кригинг измените Тип отображения обратно на Прогнозирование.
На этой карте вас интересует только прогнозирование температур на суше, поэтому океан можно исключить с помощью маски.
- В панели Содержание переместите слой Oceans выше слоя Модифицированный кригинг.
- Сохраните проект.
Геостатистика позволяет вам отображать на карте различные явления в виде непрерывных поверхностей, даже если у вас есть только дискретные точки измерений. Это очень удобно для визуализации закономерностей и выполнения анализа. У вас может не быть метеостанций в изучаемой области, но набор метеостанций в регионе может предоставить вам данные, которые помогут понять и спрогнозировать уровень температуры в любом месте.
Инструменты Мастер операций геостатистики предлагает множество различных методов интерполяции, с различным набором параметров, которые позволяют получать различные результаты. Почему? В зависимости от явления, которое вы наносите на карту, и доступных для вас данных, одна модель может дать более надежные результаты, чем другая. Если вы собираетесь использовать интерполированную поверхность для принятия важного решения, подбор наиболее точной модели очень важен.
Вы можете сравнить результаты перекрестной проверки, чтобы понять, какой метод наиболее подходит для ваших данных. После построения поверхности некоторые участки могут показывать более точные прогнозы, чем другие. Вы можете визуализировать поверхность стандартной ошибки прогнозирования, чтобы понять, где прогноз более точен.
Вы получили четыре карты из одних и тех же входных данных, но они выглядят по-разному. Теперь, когда вы знаете, как строятся карты интерполированных поверхностей, вы больше или меньше доверяете результатам? Геостатистические модели могут быть изменены для получения более точных результатов. С другой стороны, у картографа может быть повестка дня, которую он хочет подчеркнуть, и он может настроить геостатистические параметры, чтобы выявить тенденцию.
В проекте есть еще 5 карт - по одной для каждого континента. Их можно найти на панели Каталог, на вкладке Проект, в папке Карты.
Чтобы усложнить задачу, пройдитесь по этому уроку еще раз, используя одну из этих карт. Для Африки и Среднего востока вы определили, что атрибут Aug Avg. Temp C подходит лучше всего, и Модифицированный кригинг - наилучший тип поверхности. На других континентах вы можете решить, что другие параметры покажут лучшие результаты.
Вы можете найти больше учебных пособий в галерее учебных пособий.