Изучение данных

В этом руководстве вы возьмете на себя роль аналитика данных, работающего с результатами тестов на уровень свинца в крови. Вы должны подготовить данные для анализа, визуализации и обмена. Данные будут использоваться разными группами для разных целей. Некоторым сотрудникам необходим доступ к точечным данным для проведения операций, таких как ведение дел и оценка объектов. Другим нужны агрегированные данные для информирования руководства, а некоторые исследования будут доступны общественности. Третьи должны анализировать изменения с течением времени и отслеживать результаты вмешательств и усилий по уменьшению негативных последствий. Поскольку законы о конфиденциальности защищают данные пациентов, вы должны подготовить различные производные данные, используя разные стратегии деидентификации.

Данные этого руководства вымышленные. Они были созданы для демонстрации рабочего процесса в этом руководстве. Они разработаны так, чтобы выглядеть правдоподобно для рабочего процесса, и структурированы аналогично данным, которые вы могли бы использовать в подобной ситуации, но из-за юридических ограничений на предоставление реальных данных такого типа они полностью выдуманы. Не полагайтесь на эти данные. Не пытайтесь делать выводы или принимать реальные решения на основе этих данных. Не используйте эти данные для обучения моделей искусственного интеллекта или машинного обучения, результаты будут неточными. Адреса в этом наборе данных - реальные, для демонстрации геокодирования и предоставления правдоподобных данных для деидентификации, но данные не имеют никакого реального отношения к этим адресам. Любые имена или значения атрибутов, связанные с этими адресами в наборах данных, выдуманы и не имеют никакого отношения к реальным людям или условиям в этих местах.

Скачивание и проверка данных

Сначала вы загрузите и изучите данные.

  1. Скачайте архив с данными проекта Blood_Lead_Levels_Zipped_Folder.zip.

    Файл с названием Blood_Lead_Levels_Zipped_Folder.zip загружен на ваш компьютер.

    В зависимости от вашего браузера и настроек он может быть сохранен в папку Загрузки или на ваш Рабочий стол.

  2. Найдите загруженный файл на компьютере и используйте утилиту, чтобы распаковать файл в папку. Укажите выходное расположение папки и щелкните Далее.

    Распакуйте архив.

    Укажите путь для извлечения данных из папки.

    Это zip архив, защищенный паролем. Появляется окно пароля.

  3. Для Пароль введите пароль I_Understand_This_Is_Fictitious_Data и щелкните ОК.

    Откроется диалоговое окно пароля.

    Используйте пароль, который указывает на то, что данные вымышленные.

    Файл zip извлечен на ваш компьютер в папку.

  4. Откройте папку, в которую распаковали архив.

    В нем находится файл с именем BloodLeadLevels.ppkx. Файл .ppkx является пакетом проекта ArcGIS Pro, архивированный файл для публикации проектов, содержащий карты, данные и другие файлы, которые вы можете открыть в ArcGIS Pro.

  5. Дважды щелкните BloodLeadLevels.ppkx, чтобы открыть его в ArcGIS Pro. При появлении запроса войдите в свою учетную запись ArcGIS.

    Появится карта Сакраменто, Калифорния. Вымышленный точечный слой High_Blood_Level_Results показывает расположение домашних адресов детей, у которых был зафиксирован высокий уровень свинца в крови.

    Вымышленные местоположения адресов детей с высоким уровнем свинца в крови.

    Ваша программа наблюдения и снижения воздействия свинца использует результаты анализов крови и местонахождение отдельных пациентов для расследования источников воздействия свинца в домах этих детей. Данные также используются для исследования потенциального воздействия на членов семьи и для отслеживания источников свинца на работе, в школе и в общественных местах.

  6. Если таблица атрибутов слоя High_Blood_Level_Results еще не открыта, на панели Содержание щелкните правой кнопкой мыши High_Blood_Level_Results и затем Таблица атрибутов.

    Опция Таблица атрибутов слоя со значениями высокого уровня содержания свинца в крови.

    Многие страны приняли политику защиты конфиденциальной информации, такой как финансовые и медицинские данные. В Соединенных Штатах Акт об ответственности и мобильности (HIPAA) был подписан в 1996 году и служит основным руководством по безопасному использованию медицинских данных.

    Министерство здравоохранения и социальных служб США определяет Защищенную медицинскую информацию (PHI) как «индивидуально идентифицируемую медицинскую информацию, хранящуюся или передаваемую застрахованной организацией или ее деловым партнером в любой форме и на любом носителе, будь то электронная, бумажная или устная». Индивидуально идентифицируемая медицинская информация включает демографические данные, которые относятся к:

    • прошлому, настоящему или будущему физическому или психическому здоровью или состоянию человека,
    • оказанию медицинской помощи физическому лицу или
    • прошлым, настоящим или будущим платежам за оказание медицинской помощи лицу,

    и то, что идентифицирует человека, или в отношении чего есть обоснованные мнения полагать, что его можно использовать для идентификации человека. Индивидуально идентифицируемая медицинская информация включает в себя множество общих идентификаторов (например, имя, адрес, дату рождения, номер социального страхования)».

  7. Изучите атрибуты таблицы.

    Таблица данных содержит персональные данные и данные о состоянии здоровья.

    Слой содержит вымышленные данные о домашнем адресе, имени и фамилии, дне рождения, возрасте, расе, этнической принадлежности, поле, результатах анализов крови и году тестирования. Если бы эти данные были реальными, они считались бы частной, сугубо личной информацией о состоянии здоровья, личности и точном местонахождении несовершеннолетних.

    Это полезная и ценная информация, но с ней следует обращаться осторожно в соответствии с законами о конфиденциальности медицинских данных. Поскольку ваша работа требует от вас использовать и передавать эти данные третьим лицам, вы должны знать законы и способы обезличивания данных для обмена.

    Поскольку таблица данных High_Blood_Level_Results включает информацию об уровнях свинца в крови и идентифицирующую информацию о детях, включая их имена, адреса и даты рождения, это PHI согласно HIPAA и должна быть тщательно защищена в соответствии с Правилом конфиденциальности HIPAA.

    Данными такого рода можно делиться только с сотрудниками, имеющими на это разрешение. Это разрешение будет определяться внутренними регламентами организации и обычно распространяется на тех, чьи должностные обязанности требуют доступа к PHI, или на тех, кому предоставлен доступ через внутренние процессы, такие как институциональный наблюдательный совет (IRB), для целей исследования и оценки.

    Вы можете задаться вопросом, имеет ли этот регламент отношение к вам.

  8. Прочтите раздел Are You a Covered Entity? на странице Centers for Medicare and Medicaid Services (CMS).

    На этой странице представлены инструкции для тех, на кого распространяются правила HIPAA. В документе Covered Entity Decision Tool (PDF) представлено интерактивное дерево решений, которое вы можете использовать, чтобы определить, являетесь ли вы организацией, на которую распространяется действие страховки, и должны ли следовать правилам HIPAA.

    В целом, к объектам страхования относятся следующие:

    • Планы медицинского страхования — те, которые предоставляют или оплачивают стоимость медицинского обслуживания.
    • Поставщики медицинских услуг — те, кто передает данные в электронном виде для любых целей (выставление счетов, направления и т.д.).
    • Информационные центры здравоохранения — организации, которые обрабатывают нестандартную медицинскую информацию для соответствия стандартам содержания или формата данных или наоборот, от имени других организаций.
    • Деловые партнеры — лицо или организация за пределами основной организации, которые выполняют определенные функции от имени основной организации, включая использование или раскрытие личной медицинской информации. В таких ситуациях застрахованное лицо должно заключить договор с деловым партнером, который возлагает на него те же обязанности и обязательства по защите конфиденциальности, которые подпадают под действие застрахованного лица.

    По сценарию данного руководства вы являетесь застрахованным лицом, поскольку в вашей организации есть медицинские клиники.

    Данные о состоянии здоровья, подобные уровню свинца в крови, чрезвычайно ценны для выявления различий в состоянии здоровья, оценки политики и стратегического планирования. Вы должны использовать методы, которые защищают личную конфиденциальность, одновременно максимизируя полезность данных для этих важных усилий.

  9. Прочитайте раздел De-identification Standard на странице HHS.gov.

    Вы можете использовать данные ГИС с PHI, но вы должны хранить их на должным образом защищенном локальном компьютерном оборудовании или в защищенной базе геоданных ArcGIS Enterprise. Эти данные не могут быть размещены в ArcGIS Online.

    Если вы делитесь данными, вы должны сначала деидентифицировать их.

    Схема деидентификации показывает данные идентификатора, отделенные от данных о состоянии здоровья.

    Целью деидентификации данных является отделение идентифицируемой информации от медицинской информации, чтобы обеспечить очень низкий риск повторной идентификации.

    Процесс деидентификации включает в себя удаление идентификаторов из набора данных таким образом, чтобы значительно свести к минимуму вероятность того, что кто-то сможет выяснить личность любого человека в этом наборе данных. Регуляторы знают, что даже при использовании надлежащих методов деидентификации риск идентификации все равно превышает нулевой. Поэтому требования к деидентификации заключаются в обеспечении очень низкого риска повторной идентификации личности. Два принятых метода деидентификации в соответствии со стандартом HIPAA показаны ниже.

    Методы деидентификации

    Первый метод деидентификации Safe Harbor требует от вас исключить из данных следующие 18 конкретных идентификаторов:

    • Names
    • Все географические подразделения меньше штата
    • Все элементы дат (кроме года), которые имеют непосредственное отношение к физическому лицу.
    • Номера телефонов
    • Идентификаторы и серийные номера транспортных средств
    • Номера факсов
    • Идентификаторы и серийные номера устройств
    • Адреса email
    • Универсальные веб-локаторы ресурсов (URL-адреса)
    • Social Security Numbers
    • Адреса интернет-протокола (IP)
    • Номера медицинских карт
    • Биометрические идентификаторы, включая отпечатки пальцев и голоса.
    • Номера получателей плана медицинского страхования
    • Фотографии анфас и любые сопоставимые изображения.
    • Номера счетов
    • Номера сертификатов/лицензий
    • Любой другой уникальный идентификационный номер, характеристика или код, за исключением разрешенных случаев.

    Большинство данных в слое High_Blood_Level_Results придется удалить полностью.

    Поля для удаления

    Этот метод не очень пригоден, если вы используете ГИС для здравоохранения, но о нем все же стоит знать. Он проще, чем второй метод, но требует немного больше действий, помимо удаления 18 идентификаторов. Менеджер данных также должен учитывать, есть ли в наборе данных какие-либо другие идентификаторы, которые теоретически можно использовать для идентификации человека, например уникальное название должности.

    Вы также могли заметить проблему со вторым идентификатором: все географические подразделения меньше штата. Это сделало бы чрезвычайно сложным использование ГИС на детальных масштабах, например, на уровне города или района.

    Вы можете начать с этого:

    Вымышленные точечные местоположения детей с высоким уровнем свинца в крови.

    Вплоть до показа на уровне штатов, например, как на следующей карте:

    Данные агрегированные до уровня штатов, без конкретных точечных местоположений

    Правила Safe Harbor позволяют использовать первые три цифры почтового индекса, если, согласно текущим данным переписи населения США, трехзначный почтовый индекс имеет более 20 000 человек. Однако лишь немногие сотрудники ГИС здравоохранения используют трехзначные почтовые индексы, а ГИС-специалисты в здравоохранении часто обеспокоены воздействием на здоровье на локальных уровнях.

    Чтобы максимально эффективно использовать ваши данные, вы должны использовать второй метод деидентификации, называемый методом экспертного определения.

  10. Посмотрите руководство по деидентификации Expert Determination.

    Метод экспертного определения обладает большой гибкостью. Это требует от пользователя, обладающего адекватными знаниями и опытом, применять общепринятые научные и статистические принципы и методы таким образом, чтобы обезличить данные с очень низким риском повторной идентификации. Ключевым аспектом метода экспертного определения является документирование используемых методов.

Вы просмотрели данные об уровне свинца в крови. Вы также исследовали определение PHI, субъектов, которые должны соответствовать HIPAA, и два метода деидентификации: Safe Harbor и Экспертное определение. Когда вы сталкиваетесь с PHI в своей работе, связанной с ГИС, важно, чтобы вы приняли соответствующие меры для соблюдения закона и предотвращения нарушения конфиденциальности.

Вы должны выбрать лучший метод для предоставления нужного уровня данных различным членам вашей команды в зависимости от их ролей и задач. Вы дадите доступ к идентифицирующим данным на уровне точек некоторым внутренним пользователям. Эти авторизованные пользователи могут осуществлять ведение дел и проводить исследования по поиску потенциальных источников заражения. Им могут понадобиться конкретные адреса проживания, чтобы рассчитать оптимизированные маршруты для посещений на дому. Другим, однако, понадобится обезличенный набор данных с минимальным набором показателей.

В следующих разделах вы будете использовать метод экспертного определения с использованием нескольких ГИС-технологий для создания продуктов данных, которые помогут вашей организации предотвратить отравление свинцом среди детей.


Создавайте визуализации на основе карт.

В этом разделе вы будете настраивать символы для данных об уровне свинца в крови на картах, используя методы, которые сохраняют целостность данных и пространственные закономерности, не нарушая при этом конфиденциальность отдельных лиц в наборе данных.

Разные методы полезны для разных случаев использования. Вы должны подумать о цели, аудитории и способе представления карты. Если карта будет статичной, например, в формате PDF, изображения или бумажной карты, и пользователь карты не будет интерактивно взаимодействовать с данными, к символам применяются правила, отличные от случая, когда пользователь карты будет просматривать ее в веб-браузере или приложении, где он может ее масштабировать и исследовать отдельные точки и связанные с ними атрибутивные данные.

Создание карты интенсивности

Вам необходимо составить карту для печати на плакате, чтобы информировать заинтересованные стороны и общественность о масштабах отравления свинцом среди детей в Сакраменто и рассказать о рисках и целевых вмешательствах, санитарном просвещении и связанных с этим мероприятиях. Карта интенсивности хорошо подходит для этого, поскольку она представляет сглаженную поверхность, показывающую плотность точек в вашем слое, при этом размывая истинное расположение точек.

  1. На панели Содержание щелкните правой кнопкой High_Blood_Level_Results и затем Символы.

    Опция Символы

  2. На панели Символы щелкните ниспадающий список Основные символы и выберите Карта интенсивности.

    Опция символов Карта интенсивности

    Символы слоя изменятся, данные отображаются в виде карты интенсивности.

    Плотность точек представлена в виде карты интенсивности

    Ярко-желтое и красное пятно в северо-восточной части города обозначает район, где проживают несколько детей с высоким уровнем свинца в крови. Важно отметить, что вы не можете видеть, сколько именно детей представлено, а также точное расположение их домов. Чтобы дополнительно защитить конфиденциальность пациентов, вы можете отображать эту тепловую карту без включения других административных границ, таких как линии округов или почтовые индексы, а также вы можете изменить базовую карту на ту, где не отображаются названия улиц, чтобы защититься от повторной идентификации конфиденциальных данных. Этот метод визуализации лучше всего работает для наборов данных с большим числом точечных объектов, из которых по крайней мере некоторые из них находятся в непосредственной близости от других.

    Примечание:
    Наиболее яркие области карты интенсивности иногда называют горячими точками. Несмотря на то, что это подходящий способ описания этих пространственных закономерностей, не следует путать этот тип горячих точек с результатами инструмента Анализ горячих точек, который выявляет статистически значимые кластеры на изучаемой территории.

  3. Щелкните на ленте вкладку Общий доступ и в разделе Выходные результаты выберите Скопировать в буфер обмена.

    Кнопка Скопировать в буфер обмена

    Статичное изображение карты интенсивности копируется в буфер обмена. Вы можете вставить это в презентацию или документ и поделиться им, не раскрывая закрытую медицинскую информацию.

  4. Приблизьтесь к яркой области в северо-восточной части города.

    Карта приближена к северо-восточной области, где наблюдается высокая концентрация точек.

    При увеличении масштаба символы карты интенсивности изменяются, показывая относительную плотность точек на экране.

    Символы карты интенсивности меняются при увеличении масштаба.

    Чем крупнее масштаб, тем больше деталей становится очевидными. Даже если данные размыты относительно исходного точечного представления, в некоторых масштабах карта интенсивности больше не является подходящим способом отображения персональных данных, сохраняя при этом защиту конфиденциальности.

    Карта интенсивности преобразуется в точки при увеличении масштаба.

    Примечание:
    Важно помнить, что если вы намеревались создать интерактивную карту, а не печатную, такая динамическая визуализация тепловой карты может раскрыть личную информацию. При создании интерактивных карт остерегайтесь динамически отображаемых карт интенсивности и рассмотрите возможность ограничения уровня масштабирования.

    В некоторых масштабах вы можете определить расположение размытых точек на уровне дома.

  5. Нажмите на одну из размытых точек.

    Данные из всплывающего окна для High_Blood_Level_Results 3012

    Во всплывающем окне отображаются атрибуты точки. Использование символов карты интенсивности не защищает данные пациента, когда карта является интерактивной. Точки и их атрибуты все еще присутствуют.

  6. На панели Символы в окне Радиус введите 50.

    Радиус задан как 50.

    Символы карты интенсивности изменяются, плотность пересчитывается с учетом большего значения радиуса.

    Результат увеличения значения радиуса

    Это новое представление можно использовать, чтобы показать плотность случаев с высоким уровнем свинца в крови в масштабе района.

    Рекомендуется изучить различные параметры символов карты интенсивности, чтобы понимать степень и масштаб кластеризации ваших данных, балансируя между необходимостью точного географического отображения данных и требованием защиты конфиденциальности субъектов. Многие проблемы, связанные со здравоохранением, включая вспышки заболеваний, возникают в разных географических масштабах. В некоторых случаях существует точечный источник, вызывающий вспышку, тогда как в других случаях проблема связана с передачей инфекции на уровне сообщества. Понимание и использование данных в соответствующем масштабе является ключом к любому успешному ГИС-анализу здравоохранения.

    Изображение статичной карты вашего города можно добавить в отчеты, которые информируют заинтересованные стороны и общественность о масштабах отравления свинцом среди детей в обществе. Карты интенсивности полезны для демонстрации того, как распределяются данные и где они особенно сконцентрированы. Вы можете подробнее узнать о символах карты интенсивности в справке.

  7. Щелкните Сохранить проект, чтоб сохранить проект.

Создание карты кластеров точек

Вам необходимо составить статичную карту планирования для руководства больницы, в которой будет четко указано, где имеются большие и малые концентрации случаев отравления свинцом. Конечно, вы все равно должны делать это таким образом, чтобы защитить частную жизнь людей. В данном случае руководство обеспокоено фактическим количеством случаев в своей зоне обслуживания, поскольку им необходимо обеспечить выделение специалистов и координировать ресурсы программы контроля.

Для этого вы создадите карту кластеров. Техника кластеризации объектов работает путем группировки кластеров точек внутри области и отображения градуированного символа, который показывает количество сгруппированных точек, представленных этим кластером. Это рекомендуется, если вы хотите отобразить точные числа в разных масштабах и вам не нужно или вы не хотите делиться местоположениями отдельных точек.

  1. На панели Содержание щелкните слой High_Blood_Level_Results.
  2. На ленте щелкните вкладку Векторный слой и в разделе Рисование щелкните Агрегирование, а затем Кластеризация.

    Опция Кластеризация

  3. Нажмите Да в сообщении, подтверждающем, что символы будут изменены.

    "Да" в диалоговом окне Кластеризация

    Символы слоя изменятся на стиль Кластеры. Цвет символов назначается случайным образом, а размер и количество кластеров будут зависеть от вашего экрана и экстента карты.

    Символы точек кластеров

    Кластеры точек масштабируются относительно количества точек в кластере, а также помечаются количеством точек.

  4. Приблизьтесь к кластеру на северо-востоке города.

    Кластеры изменяются при изменении уровня масштабирования и экстента.

    Как и символы карты интенсивности, символы кластера адаптируются к уровню масштабирования и экстенту карты.

    Если вы увеличите масштаб достаточно сильно, вы начнете видеть отдельные местоположения пациентов.

    Увеличенная карта, показывающая отдельные объекты.

    Как и в случае с символами карты интенсивности, в некоторых экстентах и уровнях масштабирования символы кластеров не подходят для защиты персональных данных. Кроме того, как и в случае с символами карты интенсивности, при достаточном приближении в интерактивной версии карты вы можете щелкнуть отдельные точки и получить их атрибуты. Символов кластеров недостаточно для защиты личности пациента на интерактивной карте.

    Для статичных карт вы можете настроить кластеризацию для желаемого масштаба и экстента.

  5. На панели Содержание в разделе High_Blood_Level_Results щелкните правой кнопкой Кластеры и затем Символы.

    Опция Символы в разделе Кластеры

  6. На панели Символы на вкладке Кластеры щелкните Настройки кластеров.

    Настройки кластера

  7. Щелкните бегунок Радиус кластеризации и перетащите его ближе к Верхнему краю шкалы.

    Бегунок переведен к верхнему краю шкалы

    При перетаскивании бегунка Радиус кластера к Верхнему краю шкалы количество кластеров уменьшается, а количество точек на кластер увеличивается.

    Увеличение радиуса кластера включает в себя больше точек в каждом кластере.

    Это похоже на то, как работает радиус карты интенсивности. Вы можете изменить радиус кластера, чтобы настроить степень кластеризации в соответствии с экстентом и масштабом вашей карты.

  8. На панели Содержание щелкните правой кнопкой Объекты и затем Приблизить к слою.

    Приблизить к слою

    Как и в случае с символами карты интенсивности, радиус, который хорошо подходит для одного масштаба и экстента, может оказаться неприемлемым для другого.

    Задан слишком большой радиус

  9. На панели Символы щелкните бегунок Радиус кластера и перетащите его ближе к Нижнему краю шкалы.

    Карта, показывающая скорректированный радиус кластера для экстента и масштаба карты.

    Карты кластеров используются в статических и динамических картах для отображения конкретных чисел случаев (в данном случае наблюдений) и для обозначения пространственных закономерностей в плотности данных. В целях конфиденциальности преимущество заключается в том, что кластеры не привязаны к административным границам, таким как почтовые индексы или округа, которые можно использовать для идентификации отдельных лиц. Вы должны настроить радиус кластера в соответствии с конкретным масштабом и экстентом карты, чтобы передать полезную информацию о закономерностях, не раскрывая местоположения отдельных пациентов.

    Поскольку вы создаете статичное изображение карты для руководства больницы, можно использовать карту кластеров, если вы правильно установите радиус этих кластеров.

    Статичная карта кластеров для коллег-руководителей больницы дает именно ту информацию, которая им необходима для планирования скоординированного подхода к лечению местных детей с высоким уровнем свинца в крови.

    Подробнее узнать об агрегировании объектов в кластеры вы можете в справке.

  10. Щелкните Сохранить проект, чтоб сохранить проект.

Вы использовали два метода визуализации — карту интенсивности и кластеризацию объектов — для визуализации точечных данных, не показывая точного местоположения людей.


Скрывайте мелкие ячейки сетки

Мелкие ячейки — это полигоны, содержащие агрегированные данные, но в которых количество точек данных достаточно мало, чтобы сделать возможной повторную идентификацию людей. В этом разделе вы объедините два метода для поддержки деперсонализации ваших данных при наличии мелких ячеек: анализ горячих точек и замощение. Анализ горячих точек основан на математических расчетах, которые идентифицируют статистически значимые пространственные кластеры с высокими значениями (горячие точки) и низкими значениями (холодные точки). Замощение — это метод мозаичного деления поверхности одинаковыми, непересекающимися геометрическими фигурами, такими как квадраты, треугольники или шестиугольники. Эти плитки можно использовать для отображения сводной информации о точках данных, которые попадают внутрь них.

Идентификация статистически горячих и холодных точек

Ваша следующая задача — создать карту, показывающую статистически значимые группы случаев повышенного уровня свинца в крови, для отчета, который будет опубликован в интернете на динамической веб-карте. Вы будете использовать инструмент Оптимизированный анализ горячих точек для создания карты и визуализации результатов в виде мозаики шестиугольников.

В ArcGIS Pro инструмент Оптимизированный анализ горячих точек позволяет объединять места с высоким уровнем свинца в крови во взвешенные объекты. Используя распределение объектов с весами, инструмент определит соответствующий вашему анализу масштаб. Это избавляет от необходимости заранее знать размеры шестиугольников. Агрегирование или группирование данных с помощью бинов, также называемых шестиугольниками, является удобным способом визуализации медицинской информации при одновременной защите конфиденциальности пациентов, поскольку они не соответствуют административно-территориальным границам. Второй уровень деидентификации возникает в результате предоставления аналитических результатов (уровней статистической значимости), а не количества случаев.

На вашей веб-карте будут показаны общие закономерности наличия и отсутствия случаев отравления свинцом среди детей на территории исследования, а также будут показаны районы с более высокими концентрациями.

  1. Щелкните на ленте вкладку Анализ и затем Инструменты.

    Вкладка Анализ и кнопка Инструменты

    Откроется панель Геообработка. Вы будете использовать эту панель для поиска и запуска инструмента Оптимизированный анализ горячих точек.

  2. Введите в окне поиска оптимизированный анализ горячих точек, в списке результатов щелкните инструмент Оптимизированный анализ горячих точек.

    Результаты поиска для "оптимизированный анализ горячих точек"

    Этот инструмент называется Оптимизированный анализ горячих точек, поскольку он ищет наилучшее расстояние, на котором можно выполнить анализ горячих точек. Это будет расстояние, на котором кластеризация между количествами в соседних бинах будет наиболее выраженной. Если явное расстояние не достигается, оптимизатор вычисляет среднее расстояние, при котором набирается определенное количество ближайших соседей для анализа. Наконец, инструмент сравнивает количество пациентов с высоким уровнем свинца в крови в каждом соседнем кластере бинов со всей областью исследования, чтобы определить z-оценку, которая напрямую связана р-значением, определяющим статистическую значимость.

  3. Для Входных объектов выберите High_Blood_Level_Results.
  4. Для Выходных объектов примите местоположение по умолчанию в базе геоданных BloodLeadLevels.gdb и введите High_Blood_Lead_Hot_Spots для имени класса объектов.

    Набор входных и выходных объектов

  5. Оставьте параметр Поле анализа пустым.

    Если с входными объектами связано числовое значение, вы можете использовать параметр Поле анализа, чтобы учесть эти значения при анализе горячих точек. В данном примере значение Поле анализа не задано. Вы будете оценивать распределение точек High_Blood_Level_Results на предмет горячих и холодных точек.

  6. Для параметра Метод агрегирования данных инцидентов щелкните ниспадающий список и выберите Подсчет количества инцидентов внутри гексагональной сетки.

    Подсчет количества инцидентов внутри гексагональной сетки

  7. Для параметра Ограничивающие полигоны, определяющие места возможных инцидентов щелкните ниспадающее меню и выберите Sacramento_ZIP_Codes.

    Sacramento_ZIP_Codes

    Слой содержит полигоны почтовых индексов Сакраменто. Эти функции будут использоваться инструментом для определения мест, где могут встречаться точки. По сути, вы указываете изучаемую область для инструмента, поэтому территории, находящиеся за ее пределами в Сакраменто, но все еще в пределах максимального ограничивающего прямоугольника входных точек, не будут идентифицированы как холодные точки.

  8. Щелкните Запустить.

    Инструмент отработает и слой High_Blood_Lead_Hot_Spots будет добавлен на карту.

  9. На панели Содержание снимите отметку для слоя High_Blood_Level_Results, чтобы изучить новый слой.

    Результирующий слой анализа горячих точек добавлен на карту.

    Классы символов слоя представлены на панели Содержание.

    Символы для анализа горячих точек

    Результаты работы инструмента синим цветом показывают статистически холодные точки, красным - статистически горячие точки, а белым - незначимые величины. Подробнее об инструменте Оптимизированный анализ горячих точек в документации.

    Вы можете поделиться этим слоем, чтобы показать распределение значительно высокого и низкого количества случаев. Однако прежде чем поделиться им, вам необходимо удалить поле Counts, которое вы будете использовать в следующем разделе. Это поле показывает число случаев в каждом бине. Предоставление конкретных чисел, особенно для ячеек с небольшим числом случаев, может не обеспечить адекватную защиту конфиденциальности пациентов, хотя это частично зависит от размера ячейки и частоты возникновения заболевания.

    Далее вы настроите символы для слоя анализа горячих точек на основе общего количества случаев в каждом бине. Этот метод не только показывает области концентрации, но также позволяет четко указать диапазон количества случаев.

  10. Щелкните Сохранить проект, чтоб сохранить проект.

Настройка символов для бинов по количеству

Вам требуется составить отчет, который будет передан внутренним аналитикам, работающим над проектом по смягчению последствий, им необходимо знать количество случаев заболевания в определенной области, но не расположение конкретных точек. Вы измените символы с Горячих точек на вариант, при котором для каждого полигона показано число объектов.

Сначала вы сделаете копию слоя, чтобы у вас были оба варианта настройки символов.

  1. На панели Содержание щелкните правой кнопкой слой High_Blood_Lead_Hot_Spots и затем Копировать.

    Опция копирования для слоя горячих точек с высоким уровнем свинца в крови

  2. На панели Содержание щелкните правой кнопкой Карта, а затем щелкните Вставить.

    Опция Вставки для слоя

  3. На панели Содержание щелкните имя вставленного слоя, чтобы его можно было изменить.

    Редактируемое имя слоя

  4. Введите в качестве имени слоя High_Blood_Lead_Hexbin_Counts.
  5. На панели Содержание снимите отметку для слоя High_Blood_Lead_Hot_Spots, чтобы его отключить.
  6. Щелкните правой кнопкой слой High_Blood_Lead_Hexbin_Counts и выберите Символы.
  7. На панели Символы щелкните Поле и затем Counts.

    Опция Числа

  8. Щелкните ниспадающий список Цветовая схема, пролистайте вниз и щелкните шкалу Красные (7 классов).

    Цветовая шкала Красные (7 классов)

  9. В раскрывающемся списке Классы выберите 5.

    Число классов установлено на 5.

  10. Щелкните правой кнопкой мыши цветовую метку для самого низкого класса, меньшего или равного 0, и выберите Нет цвета.

    Патч для значения 0 с вариантом "Нет цвета"

    Прозрачный цвет бинов с нулевыми значениями дает больше контекста для читателя карты и фокусирует внимание на ячейках, где находятся пациенты с высоким уровнем свинца в крови.

    Обратите внимание, что есть бины, внутри которых находится по 1 точке. Скорее всего вы не сможете показывать такие случаи. Для этого размер ячейки определенно слишком мал. Вы можете настроить гистограмму градуированных символов, чтобы изменить классы символов карты.

  11. На панели Символы щелкните вкладку Гистограмма.

    Вкладка Гистограмма

  12. Нажмите и перетащите маркер границы класса с 1 на 2.

    Граница класса перенесена на 2

  13. Нажмите и перетащите маркер границы класса с 3 на 4.

    Граница класса перенесена на 4

    Заданы новые границы интервалов классов.

    Новые границы классов заданы

    Символы обновлены, теперь бины с 1 и 2 случаями внутри сгруппированы в один диапазон.

    Бины с одним и двумя случаями попали в одну группу по символам.

    Подходящее число для минимального количества случаев в бине варьируется в зависимости от сценария и правил вашей организации. Для типовых событий вы можете использовать меньшее число, а для редких рекомендуется использовать большее значение. Также важно учитывать площадь каждого из них и количество людей (и потенциальных случаев), которые можно обнаружить в одном из них. Чем больше бин и чем больше количество людей, тем ниже можно установить минимальное количество случаев без риска повторной идентификации.

    Теперь вы готовы поделиться этой информацией со своими коллегами, выполняющими анализ. Хотя они являются штатными сотрудниками вашей организации и, возможно, имеют все необходимые разрешения для использования необработанных данных, им фактически не нужны данные точечного уровня для их работы. Рекомендуется предоставлять минимально возможный набор данных, исходя из рабочих потребностей. Это сбалансированный подход, который предлагает достаточно точные данные, чтобы сосредоточиться на местных проблемах (лучше, чем на уровне почтового индекса), избегая при этом перспективы обмена точечными данными, содержащими PHI, там, где они не нужны.

  14. Щелкните Сохранить проект, чтоб сохранить проект.

Вы использовали инструмент Оптимизированный анализ горячих точек, чтобы установить подходящий размер бинов (на основе оптимального масштаба анализа, а не на основе требований конфиденциальности) для входных точечных объектов, и обозначили бины символами, чтобы показать статистическую значимость. Использование карты горячих точек для выделения областей, вызывающих вопросы, позволяет выявить проблему, но в то же время делает невозможным идентификацию отдельных лиц. Вы также повторно настроили символы для бинов, чтобы показать фактическое количество случаев для другого аналитического процесса. Вы использовали метод, который не требовал, чтобы отдельные точки передавались заинтересованным лицам, у которых нет для этого разрешения или которые фактически не нуждались в них для своей работы. В результате вы получили четкое визуальное представление областей с большим количеством случаев повышенного уровня свинца в крови по всей исследуемой территории.


Генерализация и агрегирование данных

В этом разделе вы просмотрите данные по годам и узнаете, как защитить индивидуальную информацию и не идентифицировать небольшие группы данных в картографических продуктах, которые будут опубликованы. Вы узнаете, как обобщать и агрегировать данные для защиты конфиденциальной информации, используя методы, которые будут по-прежнему показывать соответствующие закономерности в данных. Что касается данных о состоянии здоровья, то зачастую наиболее информативными являются закономерности; местонахождение отдельных случаев не всегда необходимо в целях информирования. Например, как аналитик вы можете захотеть использовать обобщенные или агрегированные данные из годовых отчетов и отчетов по надзору за отравлениями свинцом у детей, а не отдельные точки, используемые при ведении пациентов и расследованиях.

Обобщение данных предполагает упрощение данных за счет уменьшения их сложности или детализации. Например, вы можете обобщить данные о дате рождения до года рождения. Вы можете обобщить возрастные группы в группы с 10-летним интервалом. Также вы можете объединить такие племенные группы, как чероки, навахо и чокто, в категорию американских индейцев. С другой стороны, агрегирование предполагает объединение нескольких точек данных в единую сводную статистику, например, количество рождений в год. В следующих шагах вы сосредоточитесь на методах агрегирования, но вы также можете применить методы обобщения к базовым данным, чтобы еще больше скрыть конфиденциальную информацию.

Суммирование данных по почтовому индексу и году

Вы начнете с суммирования данных по годам, используя слой почтового индекса исследуемой области. Границы почтовых индексов часто используются в статистике здравоохранения. Это имеет плюсы и минусы. С другой стороны, почтовые индексы меньше, чем переписные округа, и большинство людей знают свой почтовый индекс и могут найти его на карте. С другой стороны, границы почтовых индексов — это искусственные области, предназначенные для эффективной доставки почты, и они могут меняться со временем. Вы, как аналитик, должны решить, соответствуют ли они вашим потребностям и правилам публикации данных вашей организации.

  1. На панели Геообработка щелкните кнопку Назад.
  2. В поле поиска введите Суммировать в пределах и в списке результатов щелкните инструмент Суммировать в пределах (Инструменты анализа).

    Результаты поиска Суммировать в пределах

    Есть еще один инструмент Суммировать в пределах из набора инструментов GeoAnalytics Desktop Tools, но в данном руководстве вам нужен именно инструмент из группы Инструменты Анализа.

  3. В диалоговом окне Суммировать в пределах для Входных объектов выберите слой Sacramento_Zip_Codes.

    Параметр Входные полигоны задан как слой Sacramento_Zip_Codes

  4. Для Входных суммируемых объектов выберите слой High_Blood_Level_Results.

    Параметр Входные суммируемые объекты задан как High_Blood_Level_Results

  5. Для Выходной класс объектов примите местоположение по умолчанию в базе геоданных BloodLeadLevels.gdb и введите HBLL_by_zip_year для имени класса объектов.

    Параметр Выходной класс объектов задан как HBLL_by_zip_year

  6. Для Поле группировки выберите опцию Blood Level Test Year.

    Параметр Поле группировки задан как Blood Level Test Year

  7. Щелкните Запустить.

    Слой HBLL_by_zip_year добавлен на карту. В разделе Автономные таблицы также добавляется таблица testYear_Summary. Эта таблица содержит итоговые данные с количествами по почтовым индексам за год. Этот набор можно присоединить обратно к слою HBLL_by_zip_year, чтобы показать значения по годам.

    Далее вы присоедините данные и узнаете, как обобщать данные за несколько лет или агрегировать соседние почтовые индексы, чтобы соответствовать минимальным пороговым значениям вашей организации для защиты данных.

Присоедините сводную таблицу к результирующему классу объектов

Теперь вы соедините сводную таблицу с результирующим классом объектов, чтобы у вас был единый класс объектов с данными, обобщенными по почтовому индексу и году. Это позволит вам создавать слои для отображения данных за каждый год.

  1. На панели Содержание щелкните правой кнопкой мыши слой HBLL_by_zip_year и затем Таблица атрибутов.

    Значения таблицы HBLL by Zip

    В таблице показаны данные из исходных полигонов почтового индекса и данные, добавленные с помощью инструмента Суммировать в пределах. Поле Количество точек показывает общее количество случаев в каждом полигоне почтового индекса. Поле JOIN ID содержит значения, которые вы можете использовать, чтобы присоединить атрибуты из таблицы testYear_Summary в этот слой. Всего в этом классе объектов 17 полигонов почтовых индексов.

  2. На панели Содержание в разделе Автономные таблицы щелкните правой кнопкой таблицу testYear_Summary и затем Открыть.

    Значения таблицы Test Year Summary

    Поле JOIN ID содержит значения, которые вы можете использовать для присоединения атрибутов к слою HBLL_by_zip_year. Поле testYear хранит значения по годам по пробам крови. Поле Counts of Points показывает общее количество случаев в каждом полигоне почтового индекса за каждый год, всего в таблице 50 записей.

  3. На панели Содержание щелкните правой кнопкой HBLL_by_zip_year, наведите курсор на Соединения и связи и выберите Добавить соединение.

    Добавить соединение

  4. В диалоговом окне Добавить соединение в параметре Входная таблица по умолчанию должен быть слой HBLL_by_zip_year, который вы щелкнули правой кнопкой мыши.
  5. Для Входного поля соединения выберите JOIN ID.

    Рядом с параметром Входное поле соединения значок предупреждения указывает на то, что поле не проиндексировано. Для таких небольших таблиц, как эта, это не является проблемой.

  6. Для Соединяемой таблицы выберите таблицу testYear_Summary.
  7. Для Поля соединяемой таблицы выберите Join ID.
  8. Щелкните Проверить соединение.

    Параметры Добавить соединение заполнены, кнопка Проверить соединение выделена.

    Процесс Проверки соединения запускается и возвращает сообщение.

    Сообщение Проверки соединения

    Поскольку два поля не проиндексированы, инструмент рекомендует создать для них индексы, чтобы повысить производительность. Учитывая количество включенных объектов, в этом нет необходимости.

    Инструмент также сообщает, что это соединение один-ко-многим и что полученный объединенный класс объектов будет иметь 50 записей (по одной на каждую запись в таблице testYear_Summary).

  9. Щёлкните Закрыть, в окне Сообщения.
  10. В диалоговом окне Добавить соединение щелкните OK.

    Таблица атрибутов слоя HBLL_by_zip_year обновится, в ней появятся дополнительные поля из testYear_Summary, а также дополнительные записи для сочетаний полигонов почтовых индексов и тестовых годов.

    Результаты работы инструмента Добавить соединение являются временными. Вы создадите копию класса объектов со всеми объектами, экспортировав ее в новый класс объектов.

  11. Щелкните правой кнопкой слой HBLL_by_zip_year перейдите к меню Данные и щелкните Экспорт объектов.
  12. Для Выходного класса объектов укажите имя HBLL_by_zip_all_years.
  13. Нажмите OK.

    Новый класс объектов сохранится в базе геоданных проекта.

Присвоение символов слою

Теперь вы настроите условные обозначения для слоя.

  1. В панели Содержание отключите все слои, кроме слоя HBLL_by_zip_all_years.
  2. На панели Содержание щелкните слой правой кнопкой слой HBLL_by_zip_all_years и выберите Символы .
  3. На панели Символы щелкните ниспадающее меню Основные символы и выберите Градуированные цвета.
  4. Щелкните ниспадающий список Поле и выберите второе из полей Count of Points, которое находится под Join ID.

    Выбрано второе поле Count of Points

    Это поле содержит совокупное количество точек внутри полигона, произошедших в определенном году. Первое поле содержит общее количество за все три года.

  5. Для Цветовая схема выберите Фиолетовый (5 классов).

    Символы слоя обновляются. Вы можете заметить, что не все классы символов слоя, показанного на панели Содержание, могут быть отображены на карте.

    Не все классы символов отображаются на карте.

    В этом примере, кажется, отсутствует класс с самыми высокими значениями. Это связано с тем, что слой HBLL_by_zip_all_years содержит несколько копий каждого полигона почтового индекса, по одной для каждого года, для которого в этом почтовом индексе были случаи. Символы слоя учитывают весь диапазон значений в таблице атрибутов, но цвет символов отображается только для самых верхних полигонов.

  6. На ленте на вкладке Карта в разделе Навигация щелкните ниспадающий список инструмента Исследовать и выберите Видимые слои.
  7. Щелкните самый северо-восточный полигон почтовых индексов.

    Щелкните самый северо-восточный почтовый индекс.

    На панели Всплывающее окно показано, что в этой локации в слое HBLL_by_zip_all_years находится три объекта. Атрибуты верхнего отображаются в нижней части всплывающего окна. Вы можете видеть, что первый объект в этом примере относится к 2018 году; в этом году в почтовом индексе 95821 было зафиксировано 24 случая.

    Были возвращены три объекта из слоя.

    Вы можете щелкнуть объекты (в данном случае перечисленные по имени со словом Сакраменто) в верхней части панели Всплывающее окно, чтобы просмотреть атрибуты двух других.

    Значения второго объекта отличаются.

    Второй объект относится к 2019 году, когда в почтовом индексе 95821 было зафиксировано 48 случаев.

Отображение данных в отдельных слоях по годам

Теперь, когда у вас есть слой HBLL_by_zip_all_years с количеством почтовых индексов по годам, вы сделаете копии слоя, чтобы визуализировать распределение случаев с высоким уровнем свинца в крови за каждый год.

  1. На панели Содержание щелкните слой правой кнопкой слой HBLL_by_zip_all_years и выберите Копировать.
  2. На панели Содержание щелкните правой кнопкой Карта, а затем щелкните Вставить.
  3. Щелкните имя копии слоя HBLL_by_zip_all_years и переименуйте его в HBLL_by_zip_2018.
  4. Дважды щелкните слой HBLL_by_zip_2018 и на панели Свойства слоя щелкните Определяющий запрос.
  5. Щелкните Новый определяющий запрос.

    Кнопка Новый определяющий запрос

  6. В разделе Определяющие запросы в сроке Где щелкните ниспадающий список и затем поле testYear. Оставьте оператор по умолчанию, равно, затем щелкните третий ниспадающий список и выберите 2018.

    Запрос вида Где testYear равно 2018

    При этом создается определяющий запрос Где, который фильтрует слой так, чтобы на карте отображались только полигоны 2018 года.

  7. Нажмите OK.
  8. На панели Содержание щелкните правой кнопкой слой HBLL_by_zip_2018 и выберите Копировать.
  9. На панели Содержание щелкните правой кнопкой Карта, а затем щелкните Вставить.
  10. Переименуйте новую копию слоя как HBLL_by_zip_2019.
  11. Откройте вкладку Определяющий запрос для слоя HBLL_by_zip_2019.
  12. Выберите Редактировать.

    Кнопка Редактировать для определяющего запроса слоя

    Вы измените определяющий запрос для слоя на 2019 год, чтобы отображать данные 2019 года.

  13. Измените значение года на 2019 и щелкните Применить.

    Тестовый год задан как 2019

  14. Нажмите OK.
  15. Сделайте копию слоя HBLL_by_zip_2019, переименуйте ее в HBLL_by_zip_2020 и используйте описанный выше процесс для обновления определяющего запроса этого слоя, чтобы отобразить данные за 2020 год.

    Далее вы изучите два различных метода агрегирования для достижения минимального порогового значения вашей организации. Ваше руководство определило, что если на какой-то территории, например, в пределах почтового индекса, происходит 5 или более наблюдений, вы можете отобразить данные для этого почтового индекса в слое, который будет опубликован для всех.

  16. Щелкните инструмент Исследовать и затем центральный полигон почтового индекса с небольшим количеством случаев.

    Центральный полигон почтовых индексов с небольшим числом случаев.

    Верхний слой на панели Содержание, HBLL_by_zip_2020, будет показан первым.

    Всплывающее окно для значений 2020

    В 2020 году в этом полигоне было зарегистрировано только 2 случая. Это меньше, чем минимальное пороговое значение в пять случаев, указанное вашей организацией для публикации данных по почтовым индексам.

  17. На панели Всплывающее окно щелкните запись Sacramento для слоя HBLL_by_zip_2019.

    Результаты для 2019

    В 2019 году в этом почтовом индексе было зарегистрировано три случая. Вы можете опубликовать объединенные данные по этому почтовому индексу за 2019 и 2020 годы, поскольку сумма значений за эти два года равна пяти.

Объедините данные за несколько лет

Одним из способов достижения минимального порогового значения вашей организации является агрегирование данных за несколько лет до тех пор, пока вы не получите минимум 5 случаев в каждом почтовом индексе. Этот подход уменьшает временное разрешение для сохранения пространственного разрешения.

  1. На ленте на вкладке Карта в группе Выборка щелкните Выбрать по атрибуту.
  2. На панели Выбрать по атрибутам для Входных строк щелкните ниспадающий список и затем High_Blood_Level_Results.
  3. Щелкните Добавить условие.

    Добавить условие

  4. В разделе Где щелкните ниспадающий список Выбрать поле и затем Blood Level Test Year.

    Опция Blood Level Test Year

  5. Оставьте оператор, указанный по умолчанию - равно.
  6. Щелкните ниспадающий список для значения сравнения и затем 2020.

    Опция 2020

  7. Щелкните Добавить условие.

    Кнопка Добавить условие

  8. Логический оператор для комбинирования выражений в запросе - И. Это позволяет вам создавать запросы для выбора объектов, где значение одного поля является каким-то одним, а значение другого поля — каким-то другим, или где значения находятся в пределах диапазона, если вы используете сравнения «больше» и «меньше». Однако в этом случае вы создадите запрос для выбора объектов, для которых тестовый год 2020 или 2019.
  9. Выберите логический оператор ИЛИ для комбинирования условий.
  10. Щелкните логический оператор И и в ниспадающем списке выберите ИЛИ.

    Опция ИЛИ

  11. Укажите поле Blood Level Test Year и примите выбор оператора по умолчанию - равно.
  12. Щелкните значение в ниспадающем списке и выберите 2019.

    Теперь в инструменте Выбрать по атрибуту все готово к выбору объектов со значениями 2020 или 2019.

    Теперь в инструменте Выбрать по атрибуту все готово к выбору объектов со значениями 2020 или 2019 в поле Blood Level Test Year.

  13. Нажмите OK.

    Выбраны записи объектов High_Blood_Level_Results для 2020 или 2019. Теперь вы можете запустить для них инструмент Суммировать в пределах, чтобы получить количество выбранных объектов по почтовому индексу.

  14. На ленте щелкните вкладку Анализ и в разделе Геообработка щелкните Инструменты.
  15. Найдите и откройте инструмент Суммировать в пределах.

    Инструмент должен быть в списке Последние на панели Геообработка.

  16. Для Входных полигонов выберите Sacramento_Zip_Codes.
  17. Для Входных суммируемых объектов выберите слой High_Blood_Level_Results.
  18. Для параметра Выходной класс объектов укажите HBLL_by_zip_2019_2020.

    Инструмент Суммировать в пределах для случаев 2019 и 2020 годов

    Инструмент Суммировать в пределах предупреждает вас о том, что во входных данных есть выборка и обрабатываться будет только это подмножество записей. Это именно то, что вам нужно.

  19. Оставьте пустыми параметры Поля суммирования и Поле группировки.
  20. Щелкните Запустить.

    Новый слой HBLL_by_zip_2019_2020 добавится на панель Содержание.

  21. На панели Содержание щелкните правой кнопкой слой HBLL_by_zip_2019_2020 и затем Таблица атрибутов.

    Опция меню Таблица атрибутов

  22. Щелкните правой кнопкой заголовок столбца Count of Points и затем Сортировать по возрастанию.

    Сортировать по возрастанию

    В отсортированном столбце показано, что в этом слое нет полигонов почтовых индексов, имеющих менее пяти зарегистрированных случаев.

    Отсортированный столбец с пятью и более случаями в границах почтового индекса.

    В соответствии с минимальным пороговым значением вашей организации сгруппированные данные за 2019 и 2020 годы могут быть опубликованы с детальностью почтовых индексов.

Слияние полигонов почтовых индексов

Предположим, вам нужно передать данные за 2020 год и не включать данные за 2019 год. Вы будете использовать второй метод для достижения минимального допустимого порога вашей организации, агрегируя почтовые индексы за один год, пока в каждой агрегированной области не будет более пяти случаев. Этот подход делает более грубым пространственное разрешение для сохранения временного разрешения.

  1. Откройте панель Геообработка.
  2. В окне Поиск введите построить сбалансированные зоны и найдите в результатах Построить сбалансированные зоны.

    Инструмент Построить сбалансированные зоны в результатах поиска

  3. Для Входных объектов выберите слой HBLL_by_zip_2020.

    В инструменте появится примечание о том, что входные данные имеют фильтр. Это связано с тем, что к слою применяется определяющий запрос, фильтрующий его так, чтобы отображались только данные 2020 года.

  4. Для Выходных объектов введите HBLL_2020_Zones.

    Входные и выходные данные инструмента Построить сбалансированные зоны

  5. Для параметра Метод создания зон примите значение по умолчанию Целевой атрибут.
  6. В разделе Критерий построения зон с целевым атрибутом щелкните Переменная и затемCount of Points [Point_Count_1].

    Переменная задана как Count of Points [Point_Count_1]

  7. В окне Сумма введите 12.

    Это значение выше, чем минимальное значение организации - 5. Инструмент Построить сбалансированные зоны использует Целевые переменные в качестве целевых значений для генетического алгоритма со случайным заполнением, но результаты будут лишь приблизительно соответствовать целевым значениям, поэтому, если вы установите более низкое значение, вполне вероятно, что в некоторых зонах будет меньше пяти случаев. Подробнее о том, как работает инструмент Построить сбалансированные зоны, смотрите в справке.

  8. Для Пространственных ограничений выберите параметр Только совпадающие ребра.

    Диалоговое окно инструмента Построить сбалансированные зоны

    Инструмент Построить сбалансированные зоны готов к запуску.

    Примечание:
    Если бы у вас были другие критерии для зон, например минимальная численность населения, вы могли бы добавить еще одну переменную и значение, но для этой задачи достаточно создать зоны с целевым числом не менее 12 случаев. Подробнее об инструменте можно посмотреть в документации.

  9. Щелкните Запустить.

    Результаты будут добавлены на карту. Исходные полигоны почтового индекса сохраняются, но у них появляются новые атрибуты, распределяющие их по разным зонам. Вы выполните слияние полигонов по этим атрибутам зон.

  10. Щелкните кнопку назад, чтобы вернуться к панели Геообработка, найдите и откройте инструмент Попарное слияние по атрибуту.

    Инструмент Попарное слияние по атрибуту в результатах поиска

  11. В диалоговом окне инструмента Попарное слияние по атрибуту для Входных объектов выберите HBLL_2020_Zones.
  12. Для Выходного класса объектов введите HBLL_2020_Zip_Dissolve.

    Входной и выходной классы объектов для инструмента Попарное слияние по атрибуту

  13. В параметре Поля слияния выберите Zone ID.

    Слияние по атрибуту Zone ID

  14. В параметре Поля статистики выберите Count of Points и примите значение параметра Тип статистики как Сумма по умолчанию.
  15. Снимите отметку с опции Создать составной объект.

    Выбраны параметры Count of Points, Сумма и снята отметка с параметра Создать составной объект

  16. Запустите инструмент.

    Слой с объединенными границами будет добавлен на карту.

    Объединенные зоны

  17. На панели Содержание щелкните правой кнопкой мыши слой HBLL_2020_Zip_Dissolve и щелкните Таблица атрибутов.

    Если смотреть число точек по зонам, то каждая зона набирает более 5.

    Количество точек в зонах превышает 5, а большинство из них имеют более 12 точек. Это соответствует рекомендациям вашей организации.

  18. Как аналитик Программы по предотвращению детского отравления свинцом, вы должны решить, какой метод наиболее подходит для предоставления значимых и действенных данных для юрисдикций, которые часто скрывают свои данные. Агрегирование по годам означает, что ваш конечный пользователь не может распознать временные изменения по объединенным годам, но он может видеть значения для небольших географических областей, которые в противном случае могли бы быть скрыты. Объединение нескольких почтовых индексов может позволить выявить очевидные временные тенденции при нанесении на карту каждого отдельного года, но географическая детализация будет уменьшена. Каждый метод должен быть выбран в соответствии с целевой аудиторией и целями отчетности и обмена данными.

Добавление значений координат к точкам

До этого момента вы создавали карты для заинтересованных сторон, которые сосредоточены на вопросах, касающихся масштабов высоких уровней свинца в крови в округе Сакраменто, общего числа случаев и различных способов рассмотрения пространственных и временных закономерностей в данных.

Теперь вы работаете со своей командой по обеспечению равенства в отношении здоровья. Они хотели бы провести небольшое исследование, чтобы определить, существуют ли какие-либо другие факторы, связанные с высоким уровнем свинца в крови у детей, такие как пол, раса/этническая принадлежность и возраст. Чтобы помочь их работе, вы должны предоставить им обезличенный набор данных уровня точек, который включает все интересующие переменные для каждого ребенка, а также их общее местоположение. Для выполнения этой задачи вы воспользуетесь округлением координат и проверите некоторую статистику, чтобы обосновать уровни округления.

Сначала вы добавите к точечным объектам атрибуты со значениями широты и долготы в десятичных градусах.

  1. На панели Геообработка найдите и откройте инструмент Вычислить атрибуты геометрии.

    Инструмент Вычислить атрибуты геометрии в результатах поиска

  2. Для Входных объектов выберите High_Blood_Level_Results.
  3. В первой строке Атрибутов геометрии в окне Поле (Существующее или новое) введите Latitude.

    Поле (Существующее или новое) задано как Latitude.

    После запуска инструмента в таблицу атрибутов будет добавлено новое поле для хранения значений широты для каждой точки.

  4. В окне Свойство для поля Latitude щелкните ниспадающий список и выберите Координата y точки.

    Координата y точки выбрана для поля Latitude

    Значение координаты y точки будет добавлено к полю Latitude.

  5. Во второй строке Атрибутов геометрии в окне Поле (Существующее или новое) введите Longitude.

    Поле (Существующее или новое) задано как Longitude.

  6. В окне Свойство для поля Longitude щелкните ниспадающий список и выберите Координата x точки.
  7. В окне Формат координат щелкните ниспадающий список и выберите Десятичные градусы.

    Формат координат установлен на Десятичные градусы

  8. Щелкните Выбрать систему координат.

    Кнопка Выбрать систему координат

  9. В окне Система координат в строке поиска введите WGS 1984.
  10. Разверните Географическая система координат и затем Мир.

    Система координат WGS 1984

  11. Щелкните WGS 1984 и затем OK.
  12. В инструменте Вычислить атрибуты геометрии щелкните Запустить.
  13. На панели Содержание щелкните правой кнопкой слой High_Blood_Level_Results и затем Таблица атрибутов, прокрутите таблицу вправо до новых полей Latitude и Longitude.

    Новые поля

    Теперь, когда у вас есть значения широты и долготы точек, хранящиеся в атрибутах, вы можете создать новые поля для хранения округленных значений и расчета новых округленных значений.

    Примечание:

    Существует несколько способов манипулирования координатами широты и долготы, которые представляют собой точки расположения случаев повышенного уровня свинца в крови. Вы можете усечь или округлить координаты, привязав местоположение каждой точки по сетке с более низким разрешением по всей изучаемой области. Вы также можете изменить местоположения, заменив одну или две последние цифры каждой координаты случайным числом. Это перемещает каждую точку на случайное расстояние и направление.

Добавьте поля для хранения округленных значений координат.

Вы создадите два поля для хранения округленных значений координат.

  1. Щелкните правой кнопкой мыши High_Blood_Level_Results, укажите Дизайн данных и щелкните Поля.
  2. Пролистайте до низа списка полей.
  3. Щелкните заголовок строки Latitude и нажмите Ctrl, нажимая при этом заголовок строки Longitude.

    Выбраны поля Latitude и Longitude

  4. Щелкните правой кнопкой мыши заголовок Latitude и затем Копировать.

    Опция Копировать

  5. Щелкните правой кнопкой мыши заголовок Latitude и затем Вставить.
  6. Щелкните столбец Имя поля для поля Latitude1 и введите LatitudeRound.

    Поле Latitude1 изменено на LatitudeRound

  7. Щелкните столбец Имя поля для поля Longitude и введите LongitudeRound.
  8. Щелкните столбец Псевдоним для поля LatitudeRound и введите Latitude Rounded.
  9. Щелкните столбец Псевдоним для поля LongitudeRound и введите Longitude Rounded.

    Имена и псевдонимы для полей настроены

    Имена и псевдонимы для скопированных полей настроены..

  10. На Ленте на вкладке Поля в разделе Изменить щелкните Сохранить.

    Кнопка Сохранить для изменений полей

    Два новых поля добавлены в схему таблицы для класса объектов High_Blood_Level_Results.

  11. Закройте вид Поля.

Округленные значения для координат

Далее вы рассчитаете округленные значения координат и сохраните их в новых полях.

  1. В таблице атрибутов для слоя High_Blood_Level_Results щелкните правой кнопкой мыши на поле Latitude Rounded и затем Вычислить поле.

    Опция Вычислить поле для вычисления нового значения поля Latitude Rounded

  2. В диалоговом окне Вычислить поле щелкните ниспадающее меню Тип выражения и затем Arcade.

    Тип выражения задан как Arcade

    Arcade - это легкий язык выражений, написанный для ArcGIS.

  3. В поле Выражение введите следующее выражение Arcade:

    Round($feature.Latitude,2)

    Выражение округления до двух десятичных знаков

    Этот код использует функцию Arcade Round, устанавливая значение поля Latitude Rounded равным значению в поле Latitude, округленному до двух десятичных знаков. При этом информация о местоположении точек округляется до сотых долей градуса.

  4. Щелкните кнопку Проверить.

    Кнопка Проверить

  5. Щелкните Применить.

    Округленные значения рассчитываются и добавляются в таблицу атрибутов в поле Latitude Rounded.

    Новые значения добавляются в поле.

  6. Используйте тот же метод для расчета значений поля Longitude Rounded.

    Подсказка:
    В инструменте Вычислить поле задайте Имя поля как Longitude Rounded и используйте следующее выражение Arcade:

    Round($feature.Longitude,2)

    Поля Latitude Rounded и Longitude Rounded должны быть округлены до двух десятичных знаков.

    Добавлены значения Longitude Rounded

    Примечание:

    Если бы ваши координаты были в планарной системе координат, такой как California State Plane or UTM, значения координат были бы в линейных единицах, а не в десятичных градусах. В этом случае вам нужно будет рассчитать подходящий интервал для округленных точек и округлить значения до этого интервала. Например, вы можете выбрать округление до ближайших 1000 футов или 100 метров, в зависимости от единиц измерения и желаемой величины смещения.

Создание новых точек по округленным координатам

Теперь, когда у вас есть округленные значения в двух полях, вы можете создать в этих местах новые точки.

  1. На панели Геообработка найдите и откройте инструмент Создать слой событий XY.

    Инструмент Создать слой событий XY

  2. В диалоговом окне Создать слой событий XY для Таблица XY выберите High_Blood_Level_Results.
  3. Для Поля X выберите Longitude [LongitudeRound].
  4. Для Поля Y выберите Latitude [LatitudeRound].
  5. Для Имя слоя укажите High_Blood_Level_Results_Rounded.
    Заполненные параметры инструмента Создать слой событий XY

    При этом будет создан новый слой точек с использованием округленных значений широты и долготы, которые вы вычислили.

  6. Щелкните Запустить.

    Местоположения в значениях округленных координат

    Точки, полученные из округленных значений координат, расположены в виде сетки с интервалом в сотые доли градуса.

    Этот подход перемещает точки из их исходных местоположений, но позволяет сохранить часть исходной пространственной структуры, что может быть полезно для анализа.

    Исходная карта интенсивности

    Карта интенсивности на основе исходных точек

    Карта интенсивности на основе округленных точек

    Карта интенсивности на основе округленных координат точек

    Внимание:

    Помните, что после того, как позиции на уровне точек были замаскированы таким методом, как округление координат, вам все равно следует удалить ненужные идентифицирующие PHI, в том числе имена, дни рождения, поля адреса и исходные значения координат, из таблицы атрибутов, прежде чем передавать эти данные авторизованным коллегам. Перемещение точек по округленным значениям координат не защищает PHI, если вы по-прежнему указываете исходный адрес или координаты.

    Вы можете использовать инструмент Экспорт объектов для экспорта копии класса объектов, чтобы предоставить ее авторизованным участникам вашей организации. В этом инструменте в разделе Поля у вас есть доступ к списку полей, где вы можете удалить поля, содержащие PHI, которые не требуются для проекта.

    Далее вы проведете линии, соединяющие исходную и округленную точки, и определите их длину.

Документирование результатов округления

Для экспертного определения необходима деидентификация, чтобы иметь возможность количественно оценить и задокументировать степень перемещения точек. В этом разделе вы просмотрите некоторые статистические данные, связанные с перемещением точек с использованием метода округления координат, и подведете итоги, сколько точек было перемещено в каждую точку сетки.

  1. Найдите и откройте инструмент XY в линию.

    XY в линию в результатах поиска

  2. Для Входной таблицы выберите High_Blood_Level_Results_Rounded.
  3. Для Выходного класса объектов введите HBLL_dist.

    Исходные поля в инструменте XY в линию

    Этот класс линейных объектов соединит координаты каждой исходной точки с соответствующим местоположением с округленными координатами. Вы будете использовать линейные объекты для расчета величины смещения.

  4. Для Начальное поле X выберите Longitude.
  5. Для Начальное поле Y выберите Latitude.
  6. Для Конечное поле X выберите Longitude [LongitudeRound].
  7. Для Конечное поле Y выберите Latitude [LatitudeRound].

    Инструмент XY в линию с заполненными полями X и Y

  8. В качестве Типа линии выберите Геодезическая.

    Это значение используется по умолчанию. Она представляет собой кратчайшее расстояние между двумя точками на поверхности Земли.

  9. Оставьте поле ID пустым.
  10. В качестве Пространственной привязки примите значение по умолчанию GCS_WGS_1984.

    Итоговые параметры инструмента XY в линию

  11. Щелкните Запустить.

    Слой HBLL_dist добавлен на карту. В зависимости от уровня масштабирования и размера вашей карты ее может быть трудно рассмотреть. Если вы увеличите масштаб одной из областей с более высокой плотностью, вы увидите, что набор линий соединяет каждую из исходных точек с соответствующими местоположениями точек с округленными координатами.

    Приближенное изображение линий HBLL_dist

  12. На панели Содержание щелкните правой кнопкой слой HBLL_dist и щелкните Таблица атрибутов.

    Значение в поле Shape_length представлены небольшими числами с десятичными долями - это градусы. Вы преобразуете длины в планарные единицы измерения.

    Таблица атрибутов слоя HBLL_dist

Добавление поля расстояния и вычисление его значений

Вы добавите новое поле в таблицу атрибутов слоя HBLL_dist и вычислите его значение, чтобы получить расстояния, на которые были смещены точки.

  1. На вкладке таблицы атрибутов для слояHBLL_dist щелкните Добавить.
    Кнопка Добавить для добавления нового поля

    Вы добавите новое поле для хранения расстояний в линейных единицах.

  2. Введите Distance в столбец Имя поля для нового поля.

    Столбец Имя поля для нового поля задан как Distance

  3. В столбце Тип данных для поля Distance щелкните ниспадающее меню и затем Double.
  4. На Ленте на вкладке Поля в разделе Изменить щелкните Сохранить.

    Кнопка Сохранить для нового поля расстояний

  5. Закройте панель Fields: HBLL_dist.
  6. В таблице атрибутов HBLL_dist щелкните правой кнопкой мыши на заголовке столбца Расстояние и затем Вычислить геометрию.

    Кнопка Вычислить геометрию

  7. В диалоговом окне инструмента Вычислить геометрию в ниспадающем меню Свойство для добавляемого значения для поля Distance щелкните Длина (геодезическая).

    Длина (геодезическая)

  8. В качестве Единиц длины выберите Метры.

    В качестве единиц измерения длины заданы метры

  9. Нажмите OK.

    Длины линий в метрах добавляются как атрибуты в поле Distance.

  10. Щелкните правой кнопкой заголовок столбца Distance и щелкните Визуализировать статистику.

    Кнопка Статистика для поля Distance

    Панель Статистика для поля Distance показывает суммарную статистику для поля расстояний. Она показывает, что среднее расстояние, на которое точки переместились к месту с округленными координатами, составило 376 метров, при минимальном расстоянии 18 метров и максимальном расстоянии 684 метра.

    Результаты статистики по расстояниям

    Инструмент Статистика также создает гистограмму значений расстояний, которую вы можете использовать для обоснования своих решений при создании этого обезличенного продукта с использованием округления координат.

    Гистограмма распределения расстояний

  11. Закройте панель Свойства диаграммы.
  12. Закройте диаграмму Distribution of Distance.

Подсчет числа точек в округленных координатах

Далее вы рассчитаете, сколько точек сложится после округления координат. В целях анализа конфиденциальности и деидентификации это можно интерпретировать как подсчет того, сколько случаев в ячейке может отражать идентичность любого отдельного случая. Чем больше случаев у вас в каждом стеке, тем больше пул и тем лучше для целей деидентификации. Вы будете анализировать точки географически, но помните, что вам также необходимо будет проверить уникальность всех атрибутов, которые вы сохранили в таблице, которой планируете поделиться, поскольку определенная комбинация атрибутов также может идентифицировать человека. По этой причине рекомендуется предоставить заинтересованным сторонам минимальный рабочий набор данных.

  1. На панели Геообработка найдите и откройте инструмент Собрать события.
  2. Для Входных объектов событий выберите High_Blood_Level_Results_Rounded.
  3. Для Выходного класса взвешенных точечных объектов введите HBLL_rounded_counts.

    инструмент Собрать события

  4. Щелкните Запустить.

    Результаты работы Собрать события HBLL

    При этом некоторые кластеры имеют до 15 точек, хотя многие имеют только одну или две. При большем наборе данных у вас может быть более плотное расположение точек.

    Вы использовали округление координат, чтобы замаскировать расположение конфиденциальных данных точек, позволяя при этом сохранить несколько дополнительных атрибутов, связанных с точками. У исследователей неравенства в отношении здоровья теперь есть лучшая возможность провести дополнительный анализ и рассказать более полную историю об отравлении свинцом крови среди детей в Сакраменто, используя обезличенные данные. Чтобы документировать свой метод деидентификации, вы рассчитали статистику, связанную со смещением расстояния для каждой точки, и подсчитали пул точек в каждом стеке местоположений сетки. Помните, что также важно удалить атрибуты, которые могут привести к повторной идентификации (например, адрес, исходные координаты местоположения), еще рекомендуется минимизировать количество атрибутов в предоставленном вами наборе данных.

  5. Щелкните Сохранить проект, чтоб сохранить проект.

Обзор передовых подходов

Вы изучили несколько подходов к деидентификации данных для различных сценариев использования. В некоторых ситуациях вам может потребоваться применить более продвинутые методы. В этом разделе вы узнаете о двух передовых методах деидентификации данных: геомаскировании и дифференциальной конфиденциальности.

В зависимости от решаемой задачи и регламентов в ГИС здравоохранения, вы можете углубиться в эту тему и провести собственное исследование следующих методов, чтобы вы могли применять их по мере необходимости.

Геомаскирование

Термин геомаскирование относится к группе методов, которые изменяют географическое положение отдельных точек, но другим и более эффективным способом, чем округление координат. Есть два ключевых аспекта, необходимых для эффективного геомаскирования. Во-первых, искажение точки должно быть непредсказуемым, именно это защищает конфиденциальность данных. Во-вторых, точку следует перемещать таким образом, чтобы сохранить пространственные отношения внутри набора данных. В конце концов, ваша задача в ГИС заключается в поиске закономерностей. В последующих примечаниях вы познакомитесь с конкретным типом геомаскирования — кольцевым методом. Затем вы узнаете, как статистически оценить результат геомаскирования с помощью k-анонимности. Наконец, вам будет представлен инструмент, который автоматизирует весь процесс за вас.

Кольцевой метод геомаскирования

Основная идея кольцевого геомаскирования заключается в том, что она повышает конфиденциальность, гарантируя, что случайно перемещенная точка никогда не сможет оказаться в исходном положении. Это означает, что точку необходимо сместить на минимальное расстояние от исходного местоположения. В то же время, чтобы сохранить пространственные закономерности, для каждой точки также рассчитывается максимальное смещение. Эти два расстояния создают зону смещения в форме кольца, внутри которого можно перемещать исходную точку. Подробнее о кольцевом методе можно в этой статье.

Картинка кольцевого геомаскирования

K-анонимность

Метод деидентификации Экспертное определение включает требование документировать процесс и обосновать, как этот процесс обеспечивает очень низкий риск повторной идентификации человека. При использовании метода геомаскирования статистика K-анонимности является оценочной мерой, подтверждающей это обоснование. Вы можете подробнее узнать о K-анонимности. Общая идея заключается в том, что K-анонимность представляет собой количество домохозяйств в вашем наборе данных, из которых невозможно отличить обезличенного субъекта. Например, если вы решили, что минимальное значение K равно пяти (записано как KMin=5), вы говорите, что существует как минимум пять домохозяйств (или отдельных лиц), которые потенциально могут представлять вашу исходную точку зрения.

Ключевое решение для вашей организации — определить, какое минимальное значение K считается приемлемым для защиты конфиденциальности. Единого стандарта не существует; однако может быть полезно проанализировать политику различных государственных и федеральных агентств в отношении количества малых ячеек. Малые ячейки определяются как количество людей, соответствующих одной и той же комбинации признаков. Согласование с регламентами авторитетных государственных служб может помочь вашей организации с разработкой собственного стандарта. Также учтите, что одно стандартное значение K может не подойти для каждой ситуации.

MapMasq

Если вам регулярно приходится использовать геомаскирование или другие методы деидентификации данных, вы можете рассмотреть возможность использования MapMasq. Это решение от партнера Esri Axim Geospatial. Он работает как любой дополнительный модуль ArcGIS и автоматизирует для вас процесс геомаскирования и оценку K-анонимности.

Дифференциальная конфиденциальность

Дифференциальная конфиденциальность — это новый метод, который, по мнению многих, лучше всего защищает персональные данные. Лучше всего он работает с большими наборами данных. Фактически, это метод, который Бюро переписи населения США использовало для предоставления данных, начиная с переписи 2020 года. При дифференциальной конфиденциальности данные в наборе данных математически изменяются (все данные) таким образом, что делает невозможным идентификацию любого человека, но при этом сохраняет полезность набора данных. Шум вводится в набор данных в соответствии с параметром эпсилон, который называется бюджетом потери конфиденциальности. Использование эпсилона означает, что риск раскрытия данных может быть определен количественно, что полезно для соблюдения организационных регламентов, а также для получения необходимой документации для экспертного заключения.

Один из вариантов объяснения, как работает дифференциальная конфиденциальность, — представить себе одну из тех мозаик изображений, где сотни обычных изображений собраны вместе таким образом, что они создают новое, более крупное изображение. Увеличивая масштаб до уровня отдельного изображения, вы можете заменить несколько изображений или переместить их в разные места, но при уменьшении масштаба общее изображение будет выглядеть практически одинаково. Большое изображение может быть не таким четким, как фотография, но качество улучшается по мере добавления отдельных изображений.

Нам еще многое предстоит узнать о дифференциальной конфиденциальности и ее значении для ГИС здравоохранения. Это тема, о которой вам следует знать, поскольку вы, возможно, уже используете данные переписи населения, которые были переданы с использованием этого метода, и потому что могут существовать инструменты, которые позволяют использовать этот метод в вашей собственной геопространственной работе.

Чтобы узнать больше о влиянии дифференцированной конфиденциальности на данные переписи населения США 2020 года, см. методологический отчет Esri за июнь 2022 года, а также это руководство по предотвращению раскрытия информации от Бюро переписи населения США.

В этом разделе вы узнали о двух продвинутых методах деидентификации данных, которые вы можете добавить в свой набор инструментов для соблюдения HIPAA и других правил конфиденциальности. Геомаскирование фокусируется на перемешивании данных о местоположении, чтобы у вас было KMin количество людей, которые могли бы представлять исходную точку. Дифференциальная конфиденциальность корректирует все, используя бюджет потери конфиденциальности эпсилон, чтобы правильно деидентифицировать людей. Вы уже многое сделали для обеспечения безопасности своих данных и своей организации от нарушений конфиденциальности.

В этом руководстве по обезличиванию данных для визуализации и обмена представлен обзор HIPAA, закона США, направленного на защиту конфиденциальности личной медицинской информации. Вы изучили несколько методов, которые позволяют безопасно отображать и визуализировать информацию. Вы также изучили методы, которые помогут вам делиться данными, будь то в виде динамической веб-карты или в виде набора данных для других, кто может использовать ваши данные для исследований или других целей. Вы также узнали о некоторых продвинутых методах, которые можно использовать, когда вам нужны более мощные возможности для хранения данных на уровне точек.

Одно руководство не может охватить все ситуации. В этом уроке вы научились пространственно думать о проблеме и рассматривать преимущества и недостатки различных методов. Независимо от того, какие методы вы используете при работе с защищенной медицинской информацией, тщательно подумайте и сверьтесь с внутренними инструкциями вашей организации, чтобы оставаться согласованными и оставаться в безопасности.

Вы можете найти больше учебных пособий в галерее учебных пособий.