Подготовка данных для анализа
Прежде чем приступить к анализу того, как реализовать программу наставничества, вы отфильтруете и адаптируете некоторые данные из нескольких источников.
Открытие проекта
Сначала вы загрузите и откроете данные проекта по умолчанию в ArcGIS Pro.
- Загрузите файл Identify_Schools.zip.
- Найдите загруженный файл на вашем компьютере.
Примечание:
В зависимости от настроек браузера, вам могло быть предложено выбрать место для сохранения загружаемого файла. Большинство браузеров загружают файлы в папку Загрузки по умолчанию.
- Щелкните файл правой кнопкой мыши и извлеките куда-нибудь, где его потом будет легко найти, например, в папку Документы.
- Откройте извлеченную папку Identify_Schools.
Папка содержит упакованный файл проекта ArcGIS Pro (.ppkx) и таблицу (.csv) с разделителями-запятыми.
- Если на вашем компьютере установлен ArcGIS Pro, дважды щелкните файл Identify_Schools.ppkx. Если будет предложено, войдите под лицензированной учетной записью ArcGIS.
Примечание:
Если у вас нет доступа к ArcGIS Pro или учетной записи организации ArcGIS, см. варианты доступа к программному обеспечению.
Проект содержит карту, на которой показаны школы округа Чатем, штат Джорджия, США, и зоны посещаемости старших школ. Школы представлены в виде точечных объектов, а зоны представлены в виде полигонов.
Эти два слоя были загружены с портала открытых данных SAGIS, авторитетного центра обмена данными для данной области.
Добавьте определяющий запрос
Школ намного больше, чем зон посещаемости старшей школы. Это потому, что слой школ содержит все школы, а не только государственные средние школы. Часто бывает так, что данные из авторитетных источников содержат больше объектов и атрибутов, чем нужно для вашего проекта.
- На панели Содержание щелкните правой кнопкой мыши слой Schools и щелкните Таблица атрибутов.
Каждая строка в этой таблице содержит значения для одной школы. Текст в нижней части таблицы говорит вам, что школ всего 100. В таблице есть поля, которые содержат значения, которые описывают каждую школу.
Поле TYPE указывает тип школы для каждой точки. Поскольку вас интересуют показатели процента выпускников, вы используете этот атрибут для фильтрации слоя, чтобы в нем отображались только средние школы. Поле SCHOOL_TYP определяет государственные и частные школы.
- На панели Содержание дважды щелкните Schools.
Откроется окно Свойства слоя.
- В окне Свойства слоя щелкните вкладку Определяющий запрос и выберите Новый определяющий запрос.
Новый запрос Query 1 появляется на панели Определяющий запрос. В строке Where есть раскрывающиеся списки, которые позволяют вам выбрать поле, отношение и значение.
- Выберите поле TYPE, выберите равно и выберите High.
Этот запрос отфильтрует слой, чтобы показать старшие школы. Этот проект занимается только государственными школами, поэтому вы добавите еще одно условие в запрос прежде чем выполнять его.
- Щелкните Добавить условие.
Ещё одна строка появляется на панели Определяющий запрос.
- Оставьте оператор И и создайте запрос SCHOOL_TYP равно Public School.
Два условия присоединяются оператором И,чтобы на карте отображались точечные объекты государственных старших школ.
Переключатель SQL в правом верхнем углу конструктора запросов позволяет просматривать (и редактировать) условия запросов, представленные в виде кода Языка структурированных запросов – Structured Query Language (SQL), но в большинстве случаев для создания запросов проще использовать эти элементы управления.
- Щелкните Применить.
- Нажмите OK.
Вы отфильтровали слой Schools с помощью определяющего запроса. Теперь слой показывает только государственные старшие школы, которые важны для этой части анализа.
Скрыть дополнительные поля
У слоя Schools есть несколько полей, которые не нужны для этого проекта. Этот элемент вы скроете.
- В таблице атрибутов для слоя Schools щелкните заголовок для поля GRADES.
Поле меняет цвет, указывая на то, что оно было выбрано.
- Удерживая клавишу Ctrl, щелкните заголовки полей AFFILIATIO, RESTRICTIO, ADDRESS, CITY и ZIP.
Теперь выбрано несколько полей.
- Правой кнопкой мыши щелкните RESTRICTIO и щелкните Скрыть поле.
Эти поля все еще находятся в таблице данных, но теперь они скрыты.
В слое AttendanceZones также есть поля, которые теперь уже не нужны. Поскольку большинство полей в слое вы будете скрывать, для того, чтобы скрыть эти поля, вы будете использовать вид Поля.
- На панели Содержание щелкните правой кнопкой AttendanceZones, наведите курсор на Дизайн данных и щелкните Поля.
Появится вид Поля.
- В виде Поля снимите отметку с заголовка Видимый, чтобы отключить видимость для всех полей.
- Отметьте Видимый рядом с NAME, чтобы снова включить это поле.
- На ленте на вкладке Поля в группе Изменить щёлкните Сохранить.
- Закройте панель вида Поля.
- На панели Содержание щелкните правой кнопкой AttendanceZones и выберите Таблица атрибутов.
Появится таблица атрибутов для слоя AttendanceZones, а поля, которые вам не нужны для анализа, будут скрыты. Отображается только поле NAME.
Сравните две таблицы
Далее вы сравните таблицы для слоев Schools и AttendanceZones.
- При необходимости, откройте таблицы атрибутов для слоев AttendanceZones и Schools.
Две таблицы могут быть расположены в виде двух вкладок в одной панели таблиц. Чтобы видеть их для сравнения рядом, вы перетащите одну из таблиц из этой панели.
- Перетащите вкладку AttendanceZones и прикрепите ее на боковую сторону таблицы атрибутов для слоя Schools.
По ходу перетаскивания панели – она будет представлена голубой тенью – появятся цели для прикрепления в центре вида таблицы и по сторонам окна приложения. Каждая из них показывает область, куда можно поместить панель.
- В таблице Schools щелкните правой кнопкой поле NAME и выберите Сортировать по возрастанию.
- В таблице AttendanceZones щелкните правой кнопкой поле NAME и выберите Сортировать по возрастанию.
На основании этих двух таблиц, выясняется, что большинство учащихся государственных средних школ посещают школы, расположенные в соответствующей зоне посещаемости этих учащихся, но некоторые посещают школы, расположенные за пределами границ этих зон.
Восемь средних школ - Beach, Groves, Islands, Jenkins, Johnson, New Hampstead, Windsor Forest и School of Liberal Studies (в средней школе Savannah), находятся в обеих таблицах.
Но есть три дополнительные школы, которые расположены вне зон AttendanceZones. Названия этих школ - Savannah Arts Academy, Savannah Early College (при средней школе Savannah) и Woodville Tompkins High / Twilight Program. Эти три школы, будучи школами-магнитами, набирают учащихся из разных зон посещаемости.
В Соединенных Штатах школы-магниты - это государственные школы или образовательные программы, которые предлагают широкий спектр различных учебных программ, часто специализирующихся на академических предметах, таких как математика, естественные науки или технологии. Цель школ-магнитов - предоставить учащимся доступ к специализированным академическим возможностям, которые не связаны географией проживания и предназначениями школьных зон. Критерии приема в школы-магниты в разных школьных округах могут быть разными, но часто определяются на основе сочетания личных качеств, лотерейной системы и других критериев.
Добавить информацию, присоединив таблицы
Ни один из двух текущих слоев не содержит данных о количестве учеников или об проценте выпускников. Часто вам придется улучшать существующие данные, комбинируя их с данными из других источников. К счастью, друг в вашем офисе нашел отчет штата о состоянии школ, в котором есть числовые данные, и записал их в текстовом файле значений, разделенных запятыми, или .csv (CSV – очень простой табличный формат). Вы будете использовать значение ID государственной школы, чтобы добавить эти данные в слой Schools.
- На ленте на вкладке Карта в группе Слой щелкните Добавить данные.
Откроется окно Добавить данные.
- Перейдите в извлеченную папку Identify_Schools, щелкните GraduationRates.csv и щелкните OK.
Таблица добавится на панель Содержание в раздел Автономные таблицы.
В этой таблице есть поле с именем SCHOOLCODE, в котором указан ID для каждой школы. Слой Schools имеет те же значения данных в поле с именем School_ID.
Вы соедините две таблицы, объединив их по соответствующим значениям в этих полях.
Примечание:
Иногда можно использовать поле имени в качестве поля соединения, но числовые или кодовые поля обычно лучше. Имена часто имеют различия в написании, использовании заглавных букв и полноте, которые мешают их сопоставлению. Например, поля NAME в слоях Schools и AttendanceZones используют разные правила именований для названий школ. В таблице Школы название одной из школ упоминается в сочетании со словом "High" (например, Beach High); в таблице AttendanceZones мы видим название этой же школы в сочетании со словами High School (например, Beach High School). Эти различия могут быть несущественными для человека, но они могут помешать правильному соединению таблиц.
- На панели Содержание щелкните правой кнопкой Schools, наведите курсор на Соединения и связи и выберите Добавить соединение.
Появится окно Добавить соединение.
- В окне Добавить соединение введите следующие параметры:
- Во Входной таблице должно быть выбрано Schools.
- Во Входном поле соединения выберите SCHOOL_ID.
- Для Соединяемой таблицы убедитесь, что выбран файл GraduationRates.csv.
- Для Поле соединяемой таблицы выберите SCHOOLCODE.
Примечание:
Значок предупреждения присутствует рядом с Входным полем соединения, поскольку поле не проиндексировано. Индексирование полей соединения повышает производительность, но для такой маленькой таблицы это не требуется. При щелчке по кнопке Проверить соединение инструмент проверит, работает ли выражение.
- Нажмите OK.
GRCLASSZ (размер классов средней школы) и GRDNUM (количество выпускников) добавлены в данный класс пространственных объектов. Теперь вы можете рассчитать процент выпускников.
- Закройте таблицу AttendanceZones.
Добавьте поля для хранения новых значений
Даже если у вас есть данные в таблицах, таблицы могут не содержать именно ту информацию, которая вам нужна. В этом случае таблица содержит два соответствующих поля, в которых указаны размер выпускного класса и количество выпускников. К счастью, показатели процента выпускников можно рассчитать по этим значениям. Вы добавите поле для сохранения результатов перед выполнением расчета.
- В таблице Schools щелкните Добавить.
В нижней части таблицы появится вид Поля для Schools с новым полем, доступным для редактирования.
- Для Имя поля введите GradRate. В Псевдоним введите Graduation Rate.
- Установите Тип данных на Число двойной точности.
- На ленте на вкладке Поля в группе Изменить щёлкните Сохранить.
Добавляя поля в таблицу, вы добавите еще два поля для хранения двух других фрагментов информации о школах – независимо от того, являются ли они школами с углубленным изучением предметов (школы посещают ученики из всех зон), и имеют ли они показатели процента выпускников выше или ниже среднего по штату.
- В нижней части вида Поля щелкните Щелкните здесь, чтобы добавить новое поле.
Добавлено новое поле.
- Для нового поля задайте следующие параметры:
- Для Имя поля введите Magnet.
- Для Тип данных выберите Текст.
- В окне Длина введите 5.
Это поле позволит вам провести различие между школами, в которых присутствуют ученики из одной зоны, и школами, которые посещают ученики из разных зон.
- Добавьте следующее поле, используя следующие параметры:
- Для Имя поля введите Under82.
- Для Тип данных выберите Текст.
- В окне Длина введите 5.
Это поле позволит вам различать школы, в которых процент выпускников выше или ниже 82.
- На ленте на вкладке Поля в группе Изменить щёлкните Сохранить.
- Закройте вкладку вид Поля.
Новые поля добавляются в конец таблицы Schools. Возможно, вам придется прокрутить вправо в таблице, чтобы увидеть их.
Теперь, когда поля добавлены, вы готовы рассчитать процент выпускников для каждой школы и пометить школы другими значениями для своего анализа.
Рассчитать новые значения
Далее вы будете рассчитывать количество выпускников для каждой школы. Чтобы рассчитать процент выпускников, вы разделите количество выпускников (GRDNUM) на общее количество учащихся в данном классе (GRDCLASSZ). Вы умножите результат на 100, чтобы получить показатель выпускников, выраженный в процентах.
- В таблице атрибутов Schools щёлкните правой кнопкой мыши Показатель выпускников и выберите команду Вычислить поле.
Появляется инструмент Вычислить поле.
- В инструменте Вычислить поле в разделе Выражение в столбце Поля дважды щелкните GRDNUM.
Это добавляет текст !GraduationRates.csv.GRDNUM! в окно выражения для вычисления поля.
Поскольку это вычисление для слоя, который имеет соединение, имя исходной таблицы добавляется в качестве префикса к имени поля, и они разделяются восклицательными знаками, чтобы указать, что это имя поля.
- Щелкните кнопку деления (/).
- В столбце Поля дважды щелкните GRCLASSZ.
- В окне выражения заключите имеющееся выражение в круглые скобки. В конце выражения введите * 100.
Итоговое выражение должно выглядеть так:
(!GraduationRates.csv.GRDNUM! / !GraduationRates.csv.GRCLASSZ!) * 100
То есть значение поля GRDNUM (количество выпускников), разделенное на значение поля GRCLASSZ (размер класса), умноженное на 100. И перед GRDNUM, и перед GRVLSSZ стоит префикс GraduationRates.csv, указывающий на то, что они находятся в таблице GraduationRates.csv. Это процентное значение будет сохранено в Schools.GradRate, поле GradeRate таблицы Schools.
- Нажмите OK.
Показатели процента выпускников появляются в столбце Graduation Rate таблицы Schools.
Три школы, в число которых входят Savannah Arts Academy, Savannah Early College (при Savannah High School) и Woodville Tompkins High / Twilight Program, набирают учащихся из разных зон посещаемости. Вы добавите значения в поле Magnet, чтобы отличать их показатели выпускников от показателей других школ.
- В таблице атрибутов Schools щелкните заголовок строки для Savannah Arts Academy чтобы выбрать ее. Удерживая нажатой клавишу Ctrl, щелкайте номера строк для Savannah Early College и Woodville Tompkins.
Строки для каждой школы должны быть выделены, чтобы указать, что они выбраны.
- В таблице Schools щелкните правой кнопкой мыши заголовок поля Magnet и щелкните Вычислить поле.
- В инструменте Вычислить поле в окне выражения введите "Yes".
Включите кавычки вокруг слова.
- Щелкните Применить. Не закрывайте инструмент Вычислить поле.
Для трех выбранных школ будет добавлено значение Yes к атрибуту Magnet.
- В таблице Schools щелкните кнопку Переключить выборку.
Остальные восемь школ теперь выбраны.
- В инструменте Вычислить поле измените выражение на "No" и нажмите OK.
Значения для поля Magnet будут обновлены.
- Щелкните кнопку Очистить выборку.
Выборка очищена.
Экспортируйте данные в новый класс пространственных объектов
Теперь, когда вы добавили новые данные в слой Schools, вы можете приступить к анализу подготовленных для вас данных о показателях выпускников средней школы. Вы экспортируете их в новый класс пространственных объектов, чтобы сохранить объединенные поля и устранить необходимость в определяющем запросе.
- На панели Содержание щелкните правой Schools, укажите Данные и выберите Экспорт объектов.
Откроется окно Экспорт объектов.
- Убедитесь, что для Входных объектов задан параметр Schools.
- Для Выходного класса пространственных объектов введите HighSchools.
- Нажмите OK.
В карту будет добавлен новый слой HighSchools.
- На панели Содержание отключите слой Schools.
- Закройте таблицу Schools.
- На панели быстрого доступа щёлкните Сохранить, чтобы сохранить проект.
Вы загрузили, открыли и изучили исходные данные для проекта. Вы также изменили поля, которые показывают слои, и добавили новые поля. Вы добавили данные в школы из файла .csv, рассчитали процент выпускников и классифицировали школы на школы-магниты и обычные. Вы экспортировали новый слой только старших школ со всей добавленной вами информацией.
Изучение данных
Теперь вы изучите данные. Вы будете использовать диаграмму данных, чтобы получить представление о распределении данных, и о том, как процент выпускников связан с конкретными местами в округе.
Просмотрите гистограмму выпускных классов
Сначала вы откроете таблицу атрибутов слоя HighSchools и отсортируете ее.
- Щелкните правой кнопкой слой HighSchools и щелкните Таблица атрибутов.
- В таблице HighSchools щелкните правой кнопкой мыши заголовок поля Graduation Rate и щелкните Сортировать по возрастанию.
- Щелкните правой кнопкой мыши заголовок поля Graduation Rate и щелкните Статистика.
Появится диаграмма с показателями выпускников в процентах, построенными в виде гистограммы, а также появится панель Свойства диаграммы, показывающая описательную статистику для значений этого поля. Среднее (средний) коэффициент выпускников по школам составляет 88,63 процента, что выше среднего по стране уровня в 82 процента. Самый низкий уровень выпускников составляет 75,3 процента, а самый высокий - 100 процентов.
По умолчанию эти данные разделены для данной гистограммы на восемь блоков, хотя их можно настраивать.
Числа в этой таблице показаны с большим количеством десятичных знаков, чем необходимо. Далее вы измените формат чисел для диаграммы.
- На панели Свойства диаграммы перейдите на вкладку Оси. В разделе Ось X для Числового формата, щелкните кнопку Определяет форматирование при отображении числовых полей.
- В появившейся панели для Категория выберите Число. В разделе Округление для Десятичные знаки введите 1.
Числовой формат для процента выпускников изменяется по оси x диаграммы.
- Щелкните Применить.
- Закройте панель Свойства диаграммы.
- Щелкните первый столбец в гистограмме.
Когда вы щелкаете столбец с наименьшим значением бина, выбираются две школы, которые попадают в этот бин. Они выделены на карте и в таблице атрибутов HighSchools.
- Щелкните другие столбцы, чтобы увидеть расположение школ в других бинах.
- Щелкните столбец с наивысшим процентом выпускников.
Выбраны три школы с самым высоким показателем выпускников.
- В таблице атрибутов HighSchools просмотрите атрибуты выбранных школ.
Эти три школы с самыми высокими показателями выпускников считаются школами школы с углубленным изучением отдельных предметов. Школы с углубленным изучением отдельных предметов привлекают учащихся из разных зон посещаемости. Прием в школы с углубленным изучением отдельных предметов может осуществляться на основе разных критериев, включая заслуги, лотерею, или наличие брата, или сестры, которые посещали эту школу раньше. Школы с углубленным изучением отдельных предметов, как правило, привлекают учащихся, которые особенно заинтересованы в специальной учебной программе или программе, предлагаемой данной школой; это могут быть специальные программы по искусству, естественным наукам и математике, профессиональному и техническому образованию. Школы с углубленным изучением отдельных предметов также могут иметь доступ к специальному финансированию и нанимать преподавателей с особыми интересами к программе. Выше перечислены лишь некоторые из причин, по которым в школы с углубленным изучением отдельных предметов самые высокие показатели выпускников среди этой группы школ в вашем анализе.
- В таблице HighSchools щелкните Очистить, чтобы удалить выборку.
Вашей организации может быть полезно изучить эти школы, чтобы определить причины их высокого уровня выпускников, которые также могут быть применены в программе наставничества.
- Закройте таблицу атрибутов HighSchools и панели диаграмм.
Отфильтруйте школы с углубленным изучением предметов.
Поскольку эти школы работают с учениками из разных районов проживания и имеют самый высокий уровень выпуска, они не подходят для программы наставничества старших и средних школ. Вы добавите определяющий запрос, чтобы отфильтровать их.
- На панели Содержание дважды щелкните HighSchools.
Откроется окно Свойства слоя.
- В окне Свойства слоя щелкните вкладку Определяющий запрос и выберите Новый определяющий запрос.
- Постройте выражение: Where Magnet is equal to No.
- Щелкните Применить, затем ОК.
Школы с углубленным изучением предметов больше не отображаются на карте
Измените символы для старших школ
Далее вы измените условные обозначения местоположений HighSchools, чтобы лучше показать, где находятся школы с высокими и низкими показателями выпускников.
- Щелкните правой кнопкой слой HighSchools и щелкните Символы.
Появится панель Символы.
- На панели Условные обозначения в разделе Основные символы выберите Градуированные цвета. Для Поле выберите Graduation Rate.
Методом классификации по умолчанию является Естественные границы.
В этой цветовой схеме школы с самыми высоким процентом выпускников отмечены темно-синими точками, которые становятся светлее по мере уменьшения этого показателя.
Средний уровень выпускников для старших школ составил 88,6, в то время как этот показатель в целом по стране в 2020 году составил 82 процента. Ваша организация хочет начать программу наставничества в школах, в которых процент выпускников ниже среднего по стране уровня 82%.
Далее вы измените символы, чтобы подчеркнуть школы с показателями ниже 82 процентов.
- На панели Символы, для Классов выберите 2.
- На вкладке Классы в столбце Верхнее значение дважды щелкните значение в первой строке. Установите первое верхнее значение на 82 и нажмите Enter.
- В столбце Верхнее значение дважды щелкните значение во второй строке. Установите верхнее значение на 100 и нажмите Enter.
- Щелкните символ для первой категории.
- В галерее символов выберите Круг 3.
Школы с показателями процента выпускников ниже среднего по штату выделяются этими символами.
Видно, что эти школы сгруппированы в северно-центральной части округа. Это отвечает на часть вопроса вашей организации – где находятся старшие школы с показателями процента выпускников ниже среднего по штату. Эти школы станут площадками для программы наставничества в девятом классе. Кроме того вам нужно определить, в каких средних школах ученики восьмых классов будут участвовать в программе наставничества.
- На панели Содержание включите слой Schools и выключите слой HighSchools.
Слой HighSchools содержит данные из GraduationRates.csv, поэтому в слое Schools присоединенные данные можно удалить.
- Правой кнопкой мыши щелкните слой Schools, установите курсор на Соединения и связи, щелкните Удалить все соединения.
- В появившемся окне Удалить соединения щелкните Да.
Показать расположение школ с восьмыми классами
Вы измените определяющий запрос для слоя Schools, чтобы показать школы с восьмиклассниками.
- На панели Содержание дважды щелкните Schools.
Откроется окно Свойства слоя.
- В окне Свойства слоя на вкладке Определяющий запрос установите курсор на Запрос 1 и щелкните кнопку Удалить определяющий запрос.
- В появившемся окне Удалить определяющий запрос щелкните Да.
Запрос будет удален.
Затем вы создадите запрос, чтобы найти школы, которые относятся к классу средних школ, школы К-8 или школы К-12 - школы всех этих категорий включают учащихся восьмого класса. Вы также добавите пункт, ограничивающий результаты в государственных школах.
Ранее в этом уроке вы использовали оператор And, чтобы объединить два условия запроса, отображая точки, в которых значение поля TYPE было High, а значение поля SCHOOL_TYP - Public School. Вам нужно, чтобы в запросе отображались только школы, которые удовлетворяют обоим этим запросам.
В этом запросе вы будете использовать операторы Or для объединения трех условий, с помощью которых будут найдены школы со значениями Middle или K-8 или K-12 в поле TYPE, а затем, с помощью оператора And вы найдете школы, в которых значение поля SCHOOL_TYP будет равно Public School.
- Щелкните Новый определяющий запрос.
Сначала вы построите запрос, который покажет средние школы.
- Для Запрос 1 создайте выражение Where TYPE is equal to Middle.
- Щелкните Добавить условие и создайте выражение And TYPE is equal to K-8.
- Щелкните Применить, затем ОК.
Карта обновится в соответствии с запросом.
В таблице нет записей. В чем может быть проблема?
- На панели Содержание дважды щелкните Schools.
Появится окно Свойства слоя на вкладке Определяющий запрос.
Проблема здесь – логическая ошибка. В запросе используется неверный оператор для соединения условий. Используя оператор And, запрос выберет школы, в которых значение поля TYPE равно и Middle, и K-8. Это выражение не приведет к совпадениям, так как школы содержат только одно значение текстовой строки, сохраненное в этом поле. Оно не может одновременно равняться обоим текстовым значениям.
Когда вы добавляете второе условие к выражению запроса в конструкторе Определяющий запрос, оператором по умолчанию будет оператор And, потому что это - обычный вариант. Если бы это поле было числовым, имело бы смысл иметь два условия, которые бы работали на одном и том же поле, присоединенном оператором And. Например, вы можете просматривать только те школы, в которых обучается от 100 до 300 учеников, поэтому вы можете сделать запрос, чтобы найти точки, в которых StudentBody> = 100 и StudentBody <= 300.
Решение состоит в том, чтобы изменить запрос, чтобы использовался оператор Or.
- Для Запрос 1 щелкните Редактировать.
- Измените And на Or.
- Щелкните Применить, затем ОК.
Теперь вы можете видеть школы, в которых поле TYPE либо равно Middle, либо равно K-8. Есть 26 школ, удовлетворяющих этому запросу.
- Откройте окно Свойства слоя для слоя Schools.
- Для Запрос 1 щелкните Редактировать. Добавьте третье условие Or TYPE is equal to K-12.
- Щелкните Применить, затем ОК.
Теперь вы можете увидеть школы совсеми тремя значениями поля TYPE: Middle, K-8 и K-12. Есть 26 школ, удовлетворяющих этому запросу.
Исключить частные школы и государственные чартерные школы
Некоторые из этих школ являются частными школами, а некоторые являются государственными чартерными школами, в которых, как и в старших школах с углубленным изучением предметов, учатся школьники из разных районов. Вы исключите частные школы и государственные чартерные школы. Для этого вы добавите условие.
- Откройте окно Свойства слоя для слоя Schools.
- На вкладке Определяющий запрос для Запроса 1 щелкните Редактировать.
- Щелкните Добавить условие и создайте выражение And SCHOOL_TYP is equal to Public School.
На этот раз оператор должен быть И.
- Щелкните Применить, затем ОК.
- Откройте таблицу атрибутов Schools.
До сих пор 26 школ удовлетворяют этому запросу. Результат удивителен, потому что некоторые из них должны были быть убраны этим запросом. Кроме того, в таблице все еще есть частные и государственные чартерные школы. Что здесь происходит?
- Откройте окно Свойства слоя для слоя Schools. Для Запрос 1 щелкните Редактировать.
Часть выражения теперь неопределённа.
- Переведите кнопку SQL в положение включено для просмотра запроса в виде выражения SQL.
В выражении SQL вы можете видеть, что скобки группируются вместе (TYPE = 'K-12' And SCHOOL_TYP = 'Public School').
Проблема в том, что в SQL существует порядок операций, как в арифметике. Правило состоит в том, что операторы And вычисляются первыми, а затем вычисляются операторы Or. Скобки были добавлены автоматически, чтобы указать, что правило соблюдалось. В этом случае запрос фактически показывает школы, которые соответствуют и TYPE = K-12 And SCHOOL_TYP = Public School, и школы, где TYPE = K-8 or TYPE = Middle.
- В виде выражения SQL измените круглые скобки так, чтобы они были вокруг TYPE = 'Middle' Or TYPE = 'K-8' Or TYPE = 'K-12'.
Полностью это выражение запроса должно выглядеть так: (TYPE = 'Middle' Or TYPE = 'K-8' Or TYPE = 'K-12') And SCHOOL_TYP = 'Public School'
- Щелкните Применить, затем ОК.
Теперь этот запрос возвращает только государственные школы, в которых могут быть восьмиклассники.
- Откройте окно Свойства слоя для Schools.
- Для Запрос 1 щелкните Редактировать. При необходимости отключите SQL.
Изменения, внесенные в код SQL, отражаются в группировке и отступах условий. Вы также можете изменить группировку условий в этом виде.
- Щелкните панель рядом с условием выбора школ K-8, нажмите клавишу Ctrl и щелкните панель рядом с условием выбора школ Middle.
Когда выбрано два или более условий, две кнопки в верхней части запроса становятся активными. Это позволяет вам изменять уровни отступов, чтобы группировать или разгруппировать условия для управления порядком операций.
- Щелкните Отмена и закройте окно Свойства слоя. Закройте таблицу атрибутов Schools.
Посмотрите все отобранные школы вместе
Теперь, когда вы нашли школы, в которых есть ученики-восьмиклассники, вы можете просматривать эти школы, а также и более взрослые школы.
- Включите слой HighSchool.
- На панели Содержание щёлкните правой кнопкой символ слоя Schools и выберите ярко-зеленый цвет, например Quetzal Green.
Школы с восьмиклассниками теперь ярко-зеленые.
- Сохраните проект.
Вопрос теперь в том, какие из отобранных школ с восьмыми классами должны получить наставников. Вы можете выбрать любые школы в зонах доступности старшей школы, участвующей в проекте. Вы можете выбрать школы на определенном расстоянии от участвующей старшей школы. Чтобы было легче принять решение, вы также можете использовать и демографические данные.
Вы нашли старшие школы с показателями процента выпускников ниже среднего по штату. Они будут местами для программы наставничества девятого класса. Вы также использовали определяющий запрос, чтобы показать соответствующие государственные школы с восьмыми классами. Далее вы просмотрите и проанализируете некоторые демографические данные, чтобы решить, какую из этих школ включить в программу.
Использование демографических данных для выбора школ
Далее вы добавите демографические данные на карту, чтобы принять решение о включении школ в программу. Вы изучите карту, чтобы понять взаимосвязь между показателями процента выпускников и демографическими факторами, а затем используете обогащение данных для количественной оценки этой задачи. Наконец, вы будете использовать обогащение данных, чтобы определить школы с восьмыми классами для участия в программе наставничества.
Добавление данных из Living Atlas
Сначала вы добавите слой демографических данных из ArcGIS Living Atlas of the World.
- На ленте на вкладке Вид в группе Окна щёлкните Панель Каталог.
Появится панель Каталог.
- На панели Каталог щелкните Портал.
- Щелкните вкладку Living Atlas. В поисковом окне введите ACS и нажмите Enter.
ACS расшифровывается как American Community Survey, проект демографических и жилищных данных, основанный на ежегодной выборке данных Бюро переписи населения США.
Примечание:
Чтобы узнать больше о данных ACS в ArcGIS Living Atlas, прочитайте раздел Census и ACS.
Есть много слоев ACS. Вы уточните поисковый запрос, чтобы найти конкретный.
- В поисковом окне введите ACS poverty и нажмите Enter.
- Правой кнопкой мыши щелкните слой ACS Poverty Status Variables - Boundaries и щелкните Добавить к текущей карте.
Полигоны являются переписными участками. Меньшие участки, как правило, находятся в городских районах с более высокой концентрацией людей.
На карте области с более темными цветами имеют более высокий уровень бедности. Школы с более низким процентом выпускников попадают в более мелкие городские районы с более высоким уровнем бедности, расположенные недалеко от центра округа.
- Щелкните карту на одном из участков возле красной точки.
Появится всплывающее окно участка переписи. Во всплывающем окне отображается номер участка, число людей, проживающих в этом районе, количество людей, живущих за федеральной чертой бедности, и число детей, живущих в бедности.
Гистограмма показывает возрастную структуру населения (младшие возрастные классы слева; старшие – справа).
Это всплывающее окно показывает количество детей, живущих в этом районе в бедности, и то, что значительная часть всего населения этого района тоже живет в бедности.
- Щелкните светлую полосу возле западного края округа.
Это всплывающее окно показывает, что в данном районе переписи относительно меньше детей, живущих в бедности, и лишь небольшая часть всего населения района живет в бедности.
Анализ этих двух районов показал, что школа с более низким показателем процента выпускников находится в районе с более высоким уровнем бедности, чем район, в котором расположена школа с более высоким показателем процента выпускников. Однако несколько школ с более высоким процентом выпускников расположены в районах с более высоким уровнем бедности.
Наблюдения за двумя моментами недостаточно для того, чтобы сделать вывод о наличии корреляции между уровнем бедности и процентом выпускников. Затем вы будете использовать инструмент Обогатить для дальнейшего изучения атрибутов в областях с высокими и низкими показателями процентов выпускников.
- Закройте всплывающее окно.
- Сохраните проект.
Добавить демографические данные в школьные зоны посещаемости
Еще одним способом анализа обстоятельств, которые могут способствовать снижению показателей процента выпускников, является суммирование демографических данных по зонам посещаемости. Это позволит провести количественное сравнение.
- Щелкните вкладку Анализ и в разделе Инструменты щелкните инструмент Обогатить.
Открывается панель Геообработка, отображающая инструмент Обогатить. Этот инструмент позволяет добавлять демографические данные из ArcGIS Online к вашим объектам.
- На панели Геообработка для Входных объектов выберите AttendanceZones.
Вы используете выходное имя по умолчанию, AttendanceZones_Enrich.
- Для Переменных щелкните кнопку плюс.
Появляется окно Обзор данных.
- В окне Обзор данных дважды щелкните Education.
- Дважды щелкните папку Educational Attainment.
- В разделе 2023 Educational Attainment (Esri) отметьте 2023 Pop Age 25+: High School/No Diploma. Нажмите кнопку процентов (%), чтобы добавить процент взрослых людей, посещавших среднюю школу, но не получивших диплом, и щелкните кнопку число (#) чтобы отменить выбор.
Примечание:
Дата периодически обновляется. Используйте самые последние доступные данные.
- На боковой панели щелкните Категории и дважды щелкните Доход.
- Дважды щелкните Доход домохозяйств.
- В разделе 2023 Income (Esri) отметьте 2023 Median Household Income.
Группы переменных 2023 Income (Esri) и 2023 Educational Attainment (Esri) представляют собой оценки текущего года, составленные демографами Esri на основе самых современных данных переписи и других источников данных. Они постоянно обновляются с самой последней информацией.
Какие другие демографические переменные могут быть полезны для этого анализа? Вы можете просматривать различные категории или искать другие ключевые слова. В этом уроке вы будете использовать только две выбранные переменные.
- Нажмите OK.
Переменные добавятся на панель инструмента Обогатить.
Примечание:
Инструмент Обогатить использует кредиты в зависимости от количества обогащенных объектов и количества добавленных переменных (из расчета 1 кредит на 100 объектов-переменных). Если вы добавите больше демографических переменных, инструмент будет потреблять 0,08 кредитов на каждую дополнительную переменную.
- На панели Геообработка щелкните Оценить кредиты, чтобы увидеть, сколько кредитов будет потреблять этот инструмент. Щелкните Запустить.
Инструмент запустится. Новый слой AttendanceZones_Enrich содержит информацию из зон посещаемости, а также данные из двух демографических переменных, которые вы добавили.
Присоедините старшие школы к зонам посещаемости
Зоны посещаемости теперь имеют атрибуты, которые можно использовать для количественной оценки различий между зонами посещаемости для школ с более высоким процентом выпускников и школ с более низкими показателями. В зонах посещаемости не указан процент выпускников, но вы можете использовать пространственное соединение, чтобы добавить эту информацию из слоя HighSchools.
- На панели Геообработка щелкните кнопку Назад.
- В поле поиска, введите Пространственное соединение. В списке результатов поиска щелкните инструмент Пространственное соединение.
Появится инструмент Пространственное соединение.
- Для Целевых объектов выберите AttendanceZones_Enrich.
Эти объекты будут получать значения из школ, которые они содержат, добавленные к их атрибутам.
- Для Присоединяемых объектов выберите HighSchools и примите другие значения по умолчанию.
Параметр Операции соединения установлен как Один-к-одному, так как число школ и зон одинаковое.
Поскольку слой HighSchools имеет фильтр, будут обрабатываться только те объекты, которые проходят фильтрацию.
- Щелкните Запустить.
Инструмент запустится и будет создан слой AttendanceZones__SpatialJoin. Теперь его полигоны содержат атрибуты (в том числе процент выпускников) из слоя точечных объектов HighSchools. Если у зон был школьный код, вы могли бы сделать это с помощью соединения таблиц, но у полигонов зон посещаемости не было поля с этим значением.
Рассчитайте значение с помощью Python
Ранее вы добавили переменную с именем Under82 к слою HighSchools. Благодаря пространственному соединению эта переменная теперь также включена в таблицу атрибутов для слоя AttendanceZones__SpatialJoin. Далее вы добавите значения в это поле, чтобы упростить отображение демографических данных.
Используя вычисление поля, вы установите значения этого поля Выше или Ниже. Вы могли бы сделать это таким же способом, как ранее вы установили переменную Magnet. В этом случае более быстрый способ - поскольку уже существует поле Graduation Rate, содержащее соответствующую информацию - это создать функцию Python и использовать ее в этом расчете, чтобы добавить Above, когда эти значения выше, и Below, когда эти значения ниже.
- Откройте таблицу атрибутов для слоя AttendanceZones__SpatialJoin, правой кнопкой мыши щелкните Under82 и щелкните Вычислить поле.
Появится окно Вычислить поле.
- Скопируйте следующий фрагмент кода и вставьте его в окно Блок кода:
def classify_school(gradrate): if gradrate >= 82: return "Above" if gradrate < 82: return "Below"
Этот код является функцией Python. Функция – это блок кода, который выполняет какую-то задачу. В этом случае задача состоит в том, чтобы проверить значения в одном поле и присвоить значения другому. Функции начинаются с def, от словосочетания "define a function" (задать функцию).
Имя функции – classify_school, и она принимает один параметр с именем gradrate в скобках после имени функции. После имени и параметра двоеточие указывает, что следующий код будет выполнен функцией.
Следующие строки имеют отступ в четыре (или восемь) пробела. В Python важное значение имеет постоянный отступ, так как он определяет, какие строки к каким относятся, и когда они выполняются.
Функция имеет две условные ветви, указанные в инструкциях if.
Если значение, полученное функцией в параметре gradrate, больше или равно 82, она вернет строковое значение Above.
Если значение, полученное функцией в параметре gradrate, меньше 82, она вернет строковое значение Below.
- Выше окна Блок кода для Under82 = введите classify_school().
- Щелкните между скобками. В списке Поля дважды щелкните Graduation Rate.
Это добавляет имя поля в качестве параметра для функции. Вот как это выглядит:
classify_school(!GradRate!)
Примечание:
Вставлено фактическое имя поля, а не псевдоним поля (Graduation Rate). Имя поля отделяется восклицательными знаками.
Когда инструмент запущен, код окна Выражение будет выполнен для поля Under82 для каждой строки таблицы. Этот код вызывает функцию classify_schools, которую вы определили в окне Блок кода. Для каждой строки будет проверяться, является ли значение в GradRate выше или ниже 82, и обновляться значение поля Under82 с результатом, возвращаемым функцией.
- В окне Блок кода щелкните в конце последней строки кода и нажмите клавишу Enter.
Желтая подсветка больше не видна, указывая на то, что код выполнен.
- Нажмите OK.
В таблице атрибутов поле Under82 отображает значения Выше и Ниже в соответствии с кодом Python.
В этом случае требуется обновить только несколько объектов и значений, поэтому для их вычисления не потребовалось бы много времени с помощью ручной выборки или инструмента Выбрать по атрибуту. Однако, когда вы хотите вычислить больше различных значений и больше условий, выражения Python могут сэкономить ваше время.
- Сохраните проект.
График результатов
Теперь, когда у вас есть зоны посещаемости, демографические данные, процент выпускников и категории Выше или Ниже для одних и тех же объектов, вы можете посмотреть на отношения между этими переменными. Диаграмма – хороший способ сделать это.
- На панели Содержание щелкните правой кнопкой AttendanceZones__SpatialJoin и выберите Построить диаграмму и Столбчатая диаграмма.
Появится панель Свойства диаграммы.
- На панели Свойства диаграммы для Категория или Дата выберите NAME.
- В Числовые поля щелкните Выбрать. Отметьте 2023 Median Household Income и щелкните Применить.
Диаграмма обновится.
Существуют различия в медианном доходе домохозяйства между различными зонами посещаемости средней школы.
- На панели Свойства диаграммы перейдите на вкладку Общие. В Заголовок диаграммы введите Median Household Income by Attendance Zone.
- На панели Диаграмма щелкните Экспорт и выберите Экспортировать как графику.
Откроется окно Экспорт.
- Сохраните изображение диаграммы на своем компьютере под именем Median_HH_Income_by_Attendance Zone как файл .png.
Вы можете добавить это изображение в отчетный документ или презентацию.
- На панели Свойства диаграммы перейдите на вкладку Данные. В Разбить (дополнительно) выберите Under82.
Диаграмма обновится, отображая каждую школу со значением поля Under82.
Когда вы поделите значения на то, находится ли зона посещаемости выше или ниже 82-процентного уровня выпускников, вы увидите, что более низкий медианный доход домохозяйств в некоторой степени связан с более низким процентом выпускников. Похоже, что переломным моментом является средний доход домохозяйства около 55 000 долларов. Вы можете экспортировать изображение этой диаграммы для использования в презентации.
- Закройте вид диаграммы и таблицу атрибутов.
- На панели Ресурсы снимите отметку слоя ACS Poverty Status Variables - Boundaries.
Теперь, когда определена взаимосвязь между медианным доходом домохозяйств и процентом выпускников, вы будете использовать обогащение данных, чтобы найти школы с восьмиклассниками в областях с более низким медианным доходом домохозяйства. Кажется, что доход здесь не является единственным фактором, поскольку в двух школах с показателями, превышающими 82 процента, также имеются относительно низкие значения медианного дохода домохозяйств в зоне посещаемости. Вы можете изучить взаимосвязь других демографических переменных с процентом выпускников и использовать одну или несколько дополнительных переменных для принятия решения.
Обогатить с расстоянием.
Чтобы найти школы с восьмиклассниками, у которых средний доход в семье ниже, вы можете выбрать те, которые попадают в те же зоны посещаемости средних школ, что и участвующие средние школы. Однако зоны большие и могут содержать несколько микрорайонов с разными характеристиками. Обычно школы K-8 и K-12 меньше, чем старшие школы, и каждая из них охватывает меньшую площадь. Поскольку у вас нет полигонов, представляющих зоны посещаемости для этих школ, вы можете приблизительно определить их окрестности, указав расстояние поиска в инструменте Обогатить.
- Щелкните вкладку Анализ на ленте. В группе Инструменты щелкните инструмент Обогатить.
- На панели инструмента Обогатить для Входные объекты выберите Schools.
Вы можете подтвердить выходное имя по умолчанию, Schools_Enrich.
- Для Переменных щелкните кнопку плюс.
Появляется окно Обзор данных.
- В окне Обзор данных в строке поиска введите median household income и нажмите Enter.
- Отметьте 2023 Median Household Income и щелкните OK.
- На панели инструмента Обогатить убедитесь, что для параметра Расстояние или время установлено значение 1, а в качестве Единиц выбраны Мили.
- Вверху панели инструментов щелкните оценить кредиты. Щелкните Запустить.
Инструмент запускается, в результате в радиусе одной мили от каждой школы будут суммированы средние доходы домашних хозяйств, а полученные данные будут добавлены в выходную таблицу Schools.
Использование радиуса в одну милю вокруг школ дает площадь выборки 3,14 квадратных миль. Это больше, чем минимальная рекомендуемая площадь две квадратные мили для использования инструмента Обогатить. Меньшие области будут содержать менее надежные результаты.
Инструмент Обогатить также позволяет суммировать демографические данные, используя временные зоны пешей или автомобильной доступности, благодаря чему вы можете получить демографические данные для районов в 10 минутах ходьбы или в 15 минутах езды от любой школы. Для этого руководства подходит простой круг.
Найти школы с низким медианным доходом домохозяйств
Вы обозначите школы в зависимости от значений доходов, которые вы только что добавили, и выберете школы для программы наставничества в восьмом классе.
- В панели Содержание щелкните правой кнопкой Schools_Enrich и выберите Символы.
- На панели Символы в разделе Основные символы выберите Градуированные символы.
- Для Поля выберите 2023 Median Household Income.
Символы для слоя Schools_Enrich будут обновлены.
Маленькие кружки представляют более низкие медианные доходы около школы, а большие кружки представляют более высокие медианные доходы. Большинство школ с более низким медианным доходом домохозяйства в радиусе одной мили также близки к трем старшим школам с показателями выпускников ниже 82 процентов.
Далее вы выберете школы с восьмиклассниками для этой программы. Поскольку пограничным значением для средних школ с более чем 82-процентным уровнем выпускников и менее чем 82-процентным уровнем выпускников была определена сумма около 55 000 долларов США, это же значение среднего дохода домохозяйства вы будете использовать и в качестве критерия отбора для школ с восьмиклассниками.
- На ленте щелкните вкладку Карта. В группе Выборка щелкните Выбрать по атрибуту.
- В окне Выбрать по атрибутам для Входных строк выберите Schools_Enrich.
- В разделе Выражение постройте выражение Where 2023 Median Household Income is less than or equal to 55000.
- Нажмите OK.
Школы выбраны.
- Открыть таблицу атрибутов для слоя Schools_Enrich.
Выбранные школы ar4 выделены в таблице. Для пяти школ значением TYPE является Middle, для двух - K-8.
- В заголовке таблицы щелкните кнопку Копировать выборку.
Вы можете вставить выбранные строки в электронную таблицу или текстовый документ, чтобы записать школы, которые вы выбрали. Вы также можете сохранить выбранные объекты в качестве нового слоя или рассчитать значение поля, чтобы указать, что для данной программы были выбраны эти школы. Вы также могли бы выбирать в слое HighSchools по атрибуту и копировать эти строки в свой документ.
- Сохраните проект.
В этом руководстве вы подготовили данные для анализа, использовали определяющие запросы для выбора нужных объектов для отображения, объединенные таблицы, вычисленные значения, символизированные и нанесенные на карту данные, пространственно объединенные слои и выбранные объекты по атрибутам для запроса конкретных значений. Вы использовали функцию Python для автоматической классификации значений в одном поле в классы другого. Вы также использовали ArcGIS Living Atlas и инструмент Обогатить для добавления в свой проект демографических данных, способствующих принятию более обоснованных решений.
Вы можете найти больше учебных пособий в галерее учебных пособий.