Интерполяция доли пожилого населения в Польше
Если вы знаете значения для большинства объектов в своем наборе данных, вы сможете использовать их для прогнозирования непрерывных значений по всей территории. И вы это сделаете для картографирования пространственного распределения пожилого населения в Польше.
- Скачайте пакет проекта FillGaps.
- Найдите загруженный файл на вашем компьютере. Дважды щелкните FillGaps.ppkx, чтобы открыть его.
Примечание:
Если у вас нет доступа к ArcGIS Pro или учетной записи организации ArcGIS, см. варианты доступа к программному обеспечению.
Проект откроется в ArcGIS Pro.
На этой карте показаны поветы - единицы административного деления Польши. Цвет полигонов соответствует проценту населения в возрасте старше 65 лет. К сожалению, этот набор данных является неполным. Для десяти поветов это значение отсутствует.
Эти пространственные данные можно найти в ArcGIS Living Atlas of the World. Значения процентной доли старшего возраста были предоставлены Statistics Poland (Пропущенные значения были искусственно удалены для данного урока).
Демографические данные зачастую сложно моделировать с помощью геостатистики, поскольку городские территории по своим закономерностям существенно отличаются от сельских. Но в данном случае пространственные различия в данных относительно сглажены, среди них нет явных разрывов. Это значит, что такие данные подходят для геостатистических исследований.
- Щелкните вкладку Анализ на ленте. В группе Рабочие процессы щелкните Мастер операций геостатистики.
Появится диалоговое окно Мастера операций геостатистики.
- В окне Мастера геостатистики в разделе Геостатистические методы выберите Площадная интерполяция.
Для большинства методов интерполяции входными данными могут быть только точки, но площадная интерполяция использует полигоны. В этом уроке вы будете использовать полигоны, которые находятся вплотную друг к другу и имеют общие границы, как кусочки пазла. Вы также можете использовать полигоны, которые находятся в отдалении друг от друга, либо перекрываются. Например, у вас могут быть данные наблюдения за птицами, которые хранятся, как полигоны на земле, которые охватывают конкретные наблюдатели.
Примечание:
Более подробно об этом геостатистическом методе можно узнать в статье Что такое площадная интерполяция?
Площадная интерполяция будет обрабатывать значения по-разному, в зависимости от того, объявите ли вы их средними значениями, долями или событиями. Вы работаете с процентом населения свыше определенного возраста, то есть это доли.
- В разделе Входной набор данных 1 для Тип, выберите Доля. Для Исходный набор данных выберите Powiaty_Seniors.
- Для Поле количества, выберите 2017 Senior Population, а для Поле генеральной совокупности выберите 2017 Total Population.
- Щелкните Далее.
В следующем окне будет показана ковариация. Синие перекрестия представляют ваши данные без моделирования. Синяя линия представляет модель, которая будет использоваться для прогнозирования процента пожилых людей на всей территории. Вы хотите изменить параметры модели таким образом, чтобы линия модели следовала пути перекрестий, и чтобы 90% перекрестий попадали в пределы красных доверительных интервалов. В настоящее время это не так.
Мало того, что линия не проходит рядом с перекрестиями, но есть два перекрестия, которые находятся очень далеко от линии. Во многих ситуациях вам не удастся создать идеальную модель, но вы можете попытаться подогнать как можно ближе к ней. Лучше всего начать с уменьшения размера лага. Таким образом вы сократите область, в которой выполняется поиск при пересчете для создания синих перекрестий.
- На панели Общие свойства для Размера лага введите 12000.
Модель изменится. Однако перекрестия теперь находятся еще дальше от доверительных интервалов.
Далее вы попробуете улучшить модель, изменив ее форму.
- Для Модели выберите Устойчивая.
Примечание:
Устойчивые модели и модели К-Бесселя часто дают лучший результат, но им требуется больше времени для обработки.
Создание идеальной модели может быть трудным или даже невозможным, особенно если вы работаете с демографическими данными, а не с естественным явлением. В этом сценарии, даже если только одно из перекрестий попадает в доверительные интервалы, линия модели относительно близко следует рядом с перекрестиями. Эта модель не идеальна, но это подходящий компромисс.
- Щелкните Далее.
В следующем окне представлен предварительный вариант карты.
- Щелкните на разных участках этой карты.
На карте выделены полигоны окрестностей, которые будут использоваться для определения прогнозируемых значений для той области, куда вы щелкнули. Полигоны красного цвета будут иметь больший вес в анализе, чем зеленые.
- Щелкните Далее.
Откроется страница Кросс-проверка. Кросс-проверка оценивает точности спрогнозированной поверхности. Она строится путем удаления одного полигона из набора данных и использования оставшихся данных для предсказания значения в удаленном полигоне.
График Прогноз для этой модели выглядит не очень хорошо. Идеально, если красные значения будут следовать тренду синих и серых линий. Сейчас график больше похож на облако случайных точек. С другой стороны, значения, которые перечислены на вкладке Краткая информация, выглядят хорошо. Все эти числа должны быть близки к нулю, за исключением Квадратный корень из среднего стандартизированный, котоое должно быть близким к 1. Значение Среднеквадратической ошибки 0.02 означает, что предсказанная доля пожилых граждан будет в среднем на 2% отличаться от реального значения. Это допустимая погрешность. Эти значения гораздо точнее показывают качество вашей модели, чем диаграмма.
- Щелкните Готово. В окне Отчет метода щелкните OK.
Интерполированный слой будет добавлен на карту.
- На панели Содержание отключите Powiaty_Seniors и включите Powiaty_Seniors outlines.
Области с жирными черными контурами - это зоны с отсутствующими данными.
Создание полигонов на основе интерполяции
Созданная вами интерполяция является непрерывной и игнорирует границы полигонов Геостатистика сгладила демографические данные, чтобы создать плавную поверхность. Хотя она может и не совсем точно соответствовать известным данным, подобные плавные интерполяции часто лучше подходят для прогнозирования неизвестных значений.
Далее вы конвертируете непрерывную поверхность интерполяции в полигоны.
- На ленте щелкните вкладку Карта. В группе Навигация щелкните Закладки и выберите Kluczborski.
На карте будет показан Ключборский повет.
Слой Areal Interpolation - это геостатистический слой, а это значит, что для каждой локации на карте значения будут немного различаться. На территории некоторых полигонов, для которых нужно определить значение, такого, как этот, представлен широкий диапазон предсказанных значений. Вы конвертируете эту прогнозную поверхность в полигональный слой с единым прогнозным значением для каждого повета.
- Щелкните вкладку Анализ на ленте. В группе Геообработка щелкните Инструменты.
Откроется панель Геообработка.
- В панели Геообработка в строке поиска введите Слой площадной интерполяции, и в списке результатов выберите Слой площадной интерполяции в полигоны.
- На панели инструмента Слой площадной интерполяции в полигоны введите следующее:
- Для Входной геостатистический слой площадной интерполяции выберите Areal Interpolation.
- Для Входных полигональных объектов выберите Powiaty_Seniors.
- Для Выходной полигональный класс объектов измените выходное имя на Interpolated_Polygons. Убедитесь, что добавили нижнее подчеркивание.
- Щелкните Запустить.
Слой Interpolated_Polygons добавлен на карту.
- На ленте щелкните вкладку Карта. В группе Навигация щелкните кнопку Полный экстент, чтобы вернуться к виду карты по умолчанию.
- В панели Содержание перетащите слой Interpolated_Polygons ниже слоя Powiaty_Seniors outlines.
- Отключите Площадную интерполяцию.
Теперь у вас есть значение доли пожилого населения в процентах для каждого полигона.
Так как у вас реальные значения для большинства этих полигонов, прогнозные значения нужны только для 10 из них. Вы выберите 10 полигонов с пропущенными значениями, и используете инструмент Вычислить поле, чтобы добавить значения к этим полигона отдельно.
- Щелкните правой кнопкой мыши Interpolated_Polygons и выберите Таблица атрибутов.
Появится таблица атрибутов. Она содержит все данные из слоя Powiaty_Seniors, а также три новых поля: Included, Predicted и Standard Error.
- Дважды щелкните на заголовке столбца Percent Seniors, чтобы отсортировать его.
Теперь все пустые записи находятся вверху таблицы. Далее вы замените эти значения <Null> на данные из поля Predicted.
- Выберите строки, где отсутствуют данные о пожилом населении.
Примечание:
Щелкните номер строки в первой записи и выберите несколько строк, нажав клавишу Shift или растяните курсор вокруг всех номеров строк, которые хотите выбрать. Вы также можете воспользоваться инструментом Выбрать по атрибуту.
- В верхней части таблицы атрибутов щелкните кнопку Вычислить.
Откроется всплывающее окно инструмента Вычислить поле. Вычисление поле будет применено только к выбранным строкам.
- Для Имени поля выберите Percent Seniors.
- В списке Поля пролистайте вниз и дважды щелкните Predicted.
Окно PercentSeniors = заполнено !Predicted!. Таким образом вы возьмете значения из поля Predicted и вставите их в поле Percent Seniors. Но существующие значения в этих двух полях отформатированы как десятичные доли, а не проценты. Чтобы конвертировать их, вы умножите значения на 100.
- После !Predicted! введите *100.
- Щелкните Применить.
- В таблице атрибутов щелкните кнопку Показать выбранные записи.
Значения <Null> в столбце Percent Seniors были заменены. Строки, которые не были выбраны, останутся без изменений.
- В верхней части таблицы атрибутов щелкните Очистить, чтобы очистить выборку.
- Закройте таблицу атрибутов.
Оформление карты
Наконец, вы настроите символы для нового слоя, чтобы они совпадали с исходными. Вместо поочередной настройки параметров символов, вы импортируете их из слоя Powiaty_Seniors.
- На панели Содержание отключите Powiaty_Seniors outlines и щелкните Interpolated_Polygons, чтобы выбрать его.
- На ленте во вкладке Векторный слой, в группе Отображение, щелкните Импорт.
Появится окно Импорт символов.
- В окне Импорт символов для Слоя символов выберите Powiaty_Seniors.
- Щелкните Применить, затем ОК.
Символы Areal_Interpolation_Polygons теперь соответствуют символам Powiaty_Seniors, вашего исходного слоя, но теперь больше нет пробелов в данных.
- На панели инструментов быстрого доступа нажмите кнопку Сохранить.
Процесс подстановки значений для замены отсутствующих данных называется подстановкой. Часто значения подставляются на основе среднего значения остальных данных. Когда у ваших данных есть пространственная составляющая, вам доступны варианты получше, потому что вы можете предположить, что явления, которые расположены ближе друг к другу, более похожи, чем явления, которые находятся дальше друг от друга. В этом уроке вы использовали площадную интерполяцию, чтобы создать непрерывную поверхность по всей Польше для моделирования процента населения старше 65 лет. Затем вы сделали выборку по этой поверхности, чтобы предсказать значения для полигонов, где отсутствовали данные.
Не забудьте сообщить пользователям карты, что часть данных на ней является подстановочными. Это можно сделать с помощью надписей, списка или символов. Если ваша карта используются в отчете, вы можете описать метод подстановки.
Инструмент Заполнить пропущенные значения может выполнить ту же задачу. Для некоторых наборов данных этот инструмент дает лучшие результаты. Для других лучше использовать геостатистику. Выбор сделать сложно, пока вы не попробуете оба варианта, но если пространственный переход между значениями не плавный, рекомендуется использовать Заполнить пропущенные значения.
Примечание:
В качестве дополнительного задания предлагаем найти инструмент Заполнить пропущенные значения на панели Геообработка и использовать его для подстановки пропущенных значений в слое Powiaty_Seniors. Сравните результаты с реальными значениями в Powiaty_full_dataset, которые можно увидеть, открыв панель Каталог, развернув папку Карты и дважды щелкните карту Full Dataset.
Более подробно см. раздел Заполнить пропущенные значения (Углубленный анализ пространственно-временных закономерностей) и статью ArcUser Dealing with Missing Data.
Вы можете найти больше учебных пособий в галерее учебных пособий.