Importer des secteurs de recensement et joindre des tables
Vous allez préparer une couche d’indicateurs pour la ville de New York. Vous allez combiner des attributs provenant de plusieurs sources de données existantes dans une couche spatiale unique. Lorsque tous les attributs se trouvent dans la couche des secteurs de recensement, vous pouvez cartographier et analyser les secteurs à l’aide des attributs supplémentaires. Vous allez utiliser les données spatiales et tabulaires existantes fournies par l’ACS (American Community Survey), les données raster permettant de mesurer le couvert arboré ainsi que l’analyse de proximité pour mesurer l’accès à des ressources pour femmes spécifiques, afin de créer la couche d’indicateurs.
Télécharger les données et préparer le projet
Vous allez commencer par télécharger les données que vous utiliserez dans le didacticiel.
- Téléchargez les données que vous utiliserez dans le didacticiel.
- Dans Microsoft File Explorer, créez sur l’unité C:\ un dossier nommé IndicatorData.
- Procédez à l’extraction du contenu du fichier .zip téléchargé dans le dossier IndicatorData (DonnéesIndicateur).
- Démarrez ArcGIS Pro. Si vous y êtes invité, connectez-vous via votre compte d’organisation ArcGIS sous licence.
Remarque :
Si vous n’avez pas accès à ArcGIS Pro ou ne disposez pas d’un compte d’organisation ArcGIS, consultez les options disponibles pour accéder aux logiciels.
Lorsque vous ouvrez ArcGIS Pro, vous avez la possibilité de créer un nouveau projet ou d’en ouvrir un existant. Si vous avez créé des projets auparavant, une liste de projets récents s’affiche.
- Sous New Project (Nouveau projet), cliquez sur Map (Carte).
- Dans la fenêtre New Project (Nouveau projet), pour Name (Nom), saisissez Indicators (Indicateurs), pour Location (Emplacement), acceptez le dossier par défaut, puis cliquez sur OK.
Maintenant que vous disposez d’un projet, vous allez ajouter une connexion aux dossiers pour pouvoir accéder facilement à vos données.
- Affichez la fenêtre Catalog (Catalogue). Si vous ne la voyez pas, dans le menu View (Afficher), dans le groupe Windows (Fenêtres), sélectionnez Catalog Pane (Fenêtre Catalogue).
- Dans la fenêtre Catalog (Catalogue), cliquez avec le bouton droit sur Folders (Dossiers) et sélectionnez Add Folder Connection (Ajouter la connexion au dossier).
- Dans la fenêtre Add Folder Connection (Ajouter une connexion aux dossiers), accédez au dossier IndicatorData (DonnéesIndicateur), sélectionnez-le et cliquez sur OK.
- Développez le dossier IndicatorData (DonnéesIndicateur) pour afficher son contenu.
Le dossier contient plusieurs fichiers .csv et .xlsx qui stockent les informations attributaires. Il contient également un shapefile nommé nyct2020 que vous allez importer dans la géodatabase. Une fois le shapefile importé dans la géodatabase en tant que classe d’entités, il servira de base pour les informations d’indicateur restantes. La jointure des informations tabulaires aux données spatiales permet d’analyser et de visualiser toutes les informations.
Importer un shapefile dans la géodatabase
Vous avez téléchargé les données et créé un projet, et vous vous êtes connecté à un dossier pour accéder aux données. À présent, vous allez importer le shapefile dans la géodatabase.
- Dans la fenêtre Catalog (Catalogue), développez Databases (Bases de données).
Chaque projet dans ArcGIS Pro est associé à une géodatabase par défaut, dont le nom est identique à celui du projet. La géodatabase du projet s’appelle Indicators.gdb.
- Cliquez avec le bouton droit de la souris sur Indicators.gdb, pointez le curseur de la souris sur Import (Importer), puis sélectionnez Feature Class(es) [Classe(s) d’entités].
L’outil Feature Class To Geodatabase (Classe d’entités vers géodatabase) s’ouvre.
- Pour Input Features (Entités en entrée), cliquez sur le bouton de parcours, accédez au dossier IndicatorData (DonnéesIndicateur), cliquez sur nyct2020, puis cliquez sur OK.
Comme vous avez cliqué avec le bouton droit de la souris sur la géodatabase et choisi d’importer les données dans la géodatabase, le paramètre Output Geodatabase (Géodatabase en sortie) est déjà défini sur la géodatabase du projet.
- Cliquez sur Run (Exécuter).
- Dans la fenêtre Catalog (Catalogue), développez la géodatabase Indicators (Indicateurs).
Le shapefile a été converti dans la géodatabase et stocké en tant que classe d’entités contenant des polygones. Les classes d’entités sont des collections de données du même type (point, ligne ou polygone).
- Depuis la géodatabase Indicators (Indicateurs), cliquez sur la couche nyct2020 et faites-la glisser sur la carte pour l’ajouter.
Les secteurs de recensement apparaissent sur la carte et sont affichés dans une couleur par défaut.
Remarque :
Ils peuvent apparaître dans une couleur différente de celle utilisée sur la carte.
- Dans la fenêtre Contents (Contenu), cliquez une fois sur la couche nyct2020 pour la sélectionner, puis une deuxième fois pour pouvoir modifier son nom.
- Entrez NY Census Tracts (Secteurs de recensement de New York) et appuyez sur Entrée.
Vous avez importé un shapefile dans une classe d’entités de géodatabase, l’avez ajoutée sur une carte et avez renommé la couche. Maintenant que le jeu de données spatiales se trouve dans la base de données, vous allez ajouter des informations par le biais de jointures de table.
Explorer les données tabulaires
À présent, vous allez joindre des données de l’ACS aux secteurs de recensement. Les données de l’ACS relatives à l’ensemble de l’État de New York se trouvent actuellement dans un fichier .csv ou dans un format non spatial. Vous allez joindre les deux jeux de données en fonction d’un attribut commun afin d’incorporer les données de l’ACS dans les secteurs de recensement.
- Dans la fenêtre Catalog (Catalogue), développez Folders (Dossiers), puis le dossier IndicatorData (DonnéesIndicateur).
Le fichier Data4Join.csv contient les données de l’ACS pour l’ensembe de l’état que vous voulez joindre à la couche NY Census Tracts (Secteurs de recensement de New York).
- Faites glisser le fichier Data4Join.csv sur la carte.
Le fichier .csv apparaît dans la fenêtre Contents (Contenu), sous Standalone Tables (Tables autonomes).
Les tables, par exemple un fichier .csv, ne présentent pas de composante spatiale. Par conséquent, elles sont répertoriées dans la section Standalone Tables (Tables autonomes) de la fenêtre Contents (Contenu). Bien que les données tabulaires n’apparaissent pas sur la carte par défaut, vous pouvez les utiliser pour améliorer vos couches d’entités en joignant des données ou, si la table contient des coordonnées, vous pouvez afficher les données en fonction des coordonnées.
Vous allez maintenant inspecter la table.
- Cliquez avec le bouton droit de la souris sur la table Data4Join.csv et sélectionnez Open (Ouvrir).
La table contient de nombreux attributs que vous pouvez utiliser pour la cartographie. Actuellement, la table est au format .csv et ne possède pas de champ OBJECTID, ce qui signifie que vous ne pouvez pas la joindre à une autre couche. De plus, le type du champ GEO_ID que vous allez utiliser comme champ d’appariement dans la jointure est différent du type de ce champ dans la couche des secteurs de recensement. Pour joindre des tables, vous devez disposer de champs communs dont le type de données est identique.
- Dans la table, cliquez sur le bouton d’options et sélectionnez Fields View (Vue des champs).
- Localisez le champ GEO_ID. Vous remarquerez que sa valeur Data Type (Type de données) est Big Integer (Entier très grand).
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit de la souris sur NY Census Tracts (Secteurs de recensement de New York) et sélectionnez Attribute Table (Table attributaire).
- Comme pour la table .csv, cliquez sur le bouton d’options et sélectionnez Fields View (Vue des champs).
Le champ GEOID dans la couche des secteurs de recensement contient les mêmes informations que le champ GEO_ID dans la table, mais est au format texte.
Les types de champ doivent être identiques pour qu’une jointure fonctionne correctement. Pour vérifier que vous pouvez utiliser cette table dans une jointure, vous allez l’importer dans la géodatabase et ajouter et calculer un champ de texte pour stocker les informations.
- Fermez toutes les tables et les vues Fields (Champs).
Préparer les données pour une jointure
Maintenant que vous avez déterminé qu’il est nécessaire d’importer la table .csv dans votre géodatabase et d’ajouter et de calculer un champ à utiliser pour la jointure, vous allez effectuer ces opérations pour préparer les données correctement.
- Dans la fenêtre Catalog (Catalogue), cliquez avec le bouton droit de la souris sur la géodatabase Indicators (Indicateurs), placez le curseur de la souris sur Import (Importer) et sélectionnez Table.
- Pour Input Table (Table en entrée), cliquez sur le menu déroulant et sélectionnez Data4Join.csv.
- Cliquez sur Run (Exécuter).
- Dans la fenêtre Catalog (Catalogue), dans la géodatabase Indicators (Indicateurs), cliquez avec le bouton droit de la souris sur Data4Join_csv et sélectionnez Rename (Renommer). Entrez ACS_Data (Données_ACS) et appuyez sur Entrée.
- Ajoutez la table ACS_Data (Données_ACS) à la carte.
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit de la souris sur Data4Join.csv et sélectionnez Remove (Supprimer).
Avant de joindre les tables, vous devez ajouter un champ de texte et le calculer.
- Cliquez avec le bouton droit de la souris sur ACS_Data (Données_ACS), placez le curseur de la souris sur Data Design (Conception de données), puis sélectionnez Fields (Champs).
- Au bas de la liste des champs, cliquez sur Click here to add a new field (Cliquez ici pour ajouter un nouveau champ).
- Pour Field Name (Nom du champ), entrez GEOID et pour Data Type (Type de données), sélectionnez Text (Texte).
- Sur le ruban, dans l’onglet Fields (Champs), dans le groupe Manage Edits (Gérer les mises à jour), cliquez sur Save (Enregistrer).
- Fermez la vue Fields (Champs).
- Ouvrez la table ACS_Data (Données_ACS).
- Faites défiler la table jusqu’à la fin et recherchez le champ GEOID. Cliquez dessus avec le bouton droit de la souris et sélectionnez Calculate Field (Calculer un champ).
- Dans la section Expression, pour Fields (Champs), double-cliquez sur GEO_ID pour l’ajouter à l’expression.
Vous utilisez le champ GEO_ID pour remplir le champ GEOID que vous avez ajouté.
- Cliquez sur OK.
Désormais, le champ est du type approprié et rempli avec les informations correctes.
- Fermez la table.
Vous pouvez maintenant effectuer la jointure. En l’occurrence, vous allez joindre la table ACS_Data (Données_ACS) à la couche NY Census Tracts (Secteurs de recensement de New York) pour compléter vos données spatiales.
Joindre des données de l’ACS à la couche des secteurs de recensement
À présent, vous allez joindre des données de l’ACS aux secteurs de recensement. Vous allez joindre les deux jeux de données en fonction d’un attribut commun afin d’incorporer les données de l’ACS dans les secteurs de recensement.
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit de la souris sur la couche NY Census Tracts (Secteurs de recensement de New York), placez le curseur de la souris sur Joins and Relates (Jointures et relations), puis sélectionnez Add Join (Ajouter une jointure).
La fenêtre Add Join (Ajouter une jointure) apparaît. Ici, vous pouvez entrer les paramètres de la jointure, par exemple les tables impliquées et les champs d’appariement.
- Dans l’outil Ajouter une jointure, entrez ou vérifiez les paramètres suivants :
- Pour Input Table (Table en entrée), vérifiez que la table NY Census Tracts (Secteurs de recensement de New York) est sélectionnée.
- Pour Input Field (Champ en entrée), vérifiez que le champ GEOID est sélectionné.
- Pour Join Table (Table de jointure), vérifiez que la table ACS_Data (Données_ACS) est sélectionnée.
- Pour Join Field (Champ de jointure), vérifiez que le champ GEOID est sélectionné.
- Décochez Keep all input records (Conserver tous les enregistrements en entrée).
- Pour Join Operation (Opération de jointure), sélectionnez Join one to first (Joindre un vers premier).
Vous avez entré tous les paramètres de la jointure. À présent, vous allez valider la jointure pour vous assurer qu’elle fonctionne correctement avant d’exécuter l’outil.
- Cliquez sur le bouton Validate Join (Valider la jointure).
La fenêtre Message s’ouvre.
Il existe 2 325 enregistrements correspondants pour la jointure. Ce nombre est identique au nombre de secteurs de recensement dans la couche d’entités. Même si la table ACS contient des données pour l’ensemble de l’État de New York, seules les informations correspondant aux secteurs en fonction des champs communs seront jointes.
- Dans la fenêtre Message, cliquez sur Close (Fermer) et dans la fenêtre Add Join (Ajouter une jointure), cliquez sur OK.
La jointure est terminée, mais aucun changement n’est visible sur la carte. En revanche, des différences sont visibles dans la table attributaire de la couche.
- Ouvrez la table attributaire de NY Census Tracts (Secteurs de recensement de New York).
- Faites-la défiler vers la droite et repérez les champs ACS_Data (Données_ACS).
Désormais, tous les champs de la table ACS_Data (Données_ACS) sont joints aux secteurs de recensement en fonction du champ commun.
- Fermez la table.
- Depuis la Quick Access Toolbar (barre d’outils Accès rapide), cliquez sur Save (Enregistrer) pour enregistrer le projet.
Vous avez joint les attributs ACS à la couche des secteurs de recensement. À présent, vous pouvez utiliser ces champs pour la symbologie, l’étiquetage et l’analyse.
Exporter la couche jointe
La jointure est virtuelle dans la couche, mais elle n’est pas stockée séparément comme sa propre source de données. Vous allez exporter la couche des secteurs de recensement en tant que classe d’entités pour stocker les champs joints avec les entités de secteur de recensement.
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit de la souris sur NY Census Tracts (Secteurs de recensement de New York), placez le curseur de la souris sur Data (Données), puis sélectionnez Export Features (Exporter les entités).
La fenêtre Export Features (Exporter les entités) s’affiche. Le paramètre Input Features (Entités en entrée) est déjà défini correctement car vous avez cliqué avec le bouton droit de la souris sur la couche pour l’exporter.
- Pour Output Feature Class (Classe d’entités en sortie), remplacez le nom par défaut par NY_ACS_Tracts (Secteurs_ACS_NY) et cliquez sur OK.
- Cliquez sur OK.
- Supprimez la couche NY Census Tracts (Secteurs de recensement de New York) de la carte.
- Dans la fenêtre Contents (Contenu), renommez NY_ACS_Tracts (Secteurs_ACS_NY) en NYC Census Tracts (Secteurs de recensement de New York).
Désormais, la couche des secteurs de recensement figurant sur la carte contient tous les attributs de la table ACS et est sa propre source de données. Si vous partagez cette source de données sous quelque forme que ce soit, tous les attributs seront présents.
- Enregistrez le projet.
Ajouter et calculer des champs
À présent, vous allez ajouter et calculer deux champs de pourcentage pour prendre en compte le niveau d’éducation et l’âge de procréer.
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit de la souris sur NYC Census Tracts (Secteurs de recensement de New York), placez le curseur de la souris sur Data Design (Conception de données), puis sélectionnez Fields (Champs).
- Faites défiler l’écran jusqu’à la fin, puis cliquez deux fois sur Click here to add a new field (Cliquez ici pour ajouter un nouveau champ).
Deux lignes apparaissent. À présent, vous allez modifier les propriétés des champs.
- Pour la première ligne, entrez les propriétés suivantes :
- Pour Field Name (Nom du champ), entrez ou copiez et collez Bachelors_degree_higher_women (Baccalauréat_diplôme_supérieur_femmes).
- Pour Alias, entrez ou copiez et collez Is a bachelor’s degree or higher attainable for women? (Les femmes peuvent-elles obtenir le baccalauréat ou un diplôme supérieur ?)
- Pour Data Type (Type de données), sélectionnez Double.
- Pour le deuxième champ, entrez les propriétés suivantes :
- Pour Field Name (Nom du champ), entrez ou collez et copiez Percent_reproductive_age (Pourcentage_âge_de_procréer).
- Pour Alias, entrez ou copiez et collez What percent of women are at reproductive age? (Quel est le pourcentage de femmes en âge de procréer ?)
- Pour Data Type (Type de données), sélectionnez Double.
Remarque :
Les carrés verts à côté du champ indiquent que des modifications n’ont pas été enregistrées.
- Sur le ruban, dans l’onglet Fields (Champs), dans le groupe Manage Edits (Gérer les mises à jour), cliquez sur Save (Enregistrer).
- Fermez la vue Fields (Champs).
Afin de mesurer les indicateurs pour l’éducation et la santé reproductive, vous allez calculer les champs en pourcentages.
- Ouvrez la table attributaire de NYC Census Tracts (Secteurs de recensement de New York) et faites-la défiler jusqu’à la fin pour voir les deux champs que vous venez d’ajouter.
- Cliquez avec le bouton droit de la souris sur Is a bachelor’s degree or higher attainable for women? (Les femmes peuvent-elles obtenir le baccalauréat ou un diplôme supérieur ?) et sélectionnez Calculate Field (Calculer un champ).
- Dans la section Expression, pour EducationForWomen = (ÉducationDesFemmes =), copiez et collez l’expression suivante : (!Women_getting_a_Bachelor_s_Degree_or_higher! / !Total_Female_Population_for_Education!) * 100.
- Cliquez sur la coche verte pour valider l’expression, puis cliquez sur Apply (Appliquer).
Une fenêtre de message contenant un avertissement s’ouvre car les enregistrements ne possèdent pas tous une valeur. Ceci n’est pas problématique et vous pouvez continuer.
- Fermez la fenêtre d’avertissement et cliquez sur OK.
Vous avez calculé le pourcentage de femmes possédant le baccalauréat ou un diplôme supérieur. À présent, vous allez calculer l’autre champ de la même manière.
- Dans la table attributaire, cliquez avec le bouton droit de la souris sur What percent of women are at reproductive age? (Quel est le pourcentage de femmes en âge de procréer ?) et sélectionnez Calculate Field (Calculer un champ).
- Dans la section Expression, pour WomenAtReproductiveAge = (FemmesEnÂgeDeProcréer =), effacez l’expression existante.
- Copiez et collez l’expression suivante : (!Women_at_reproductive_age_15_to_44! / !Total_Female_Population_for__reproductive_health!) * 100 [(!Femmes_en_âge_de_procréer_entre_15_et_44_ans! / !Population_féminine_totale_pour_la_santé_reproductive!) * 100].
- Cliquez sur Apply (Appliquer).
Un avertissement similaire apparaît mais vous pouvez l’ignorer.
- Fermez la fenêtre d’avertissement et cliquez sur OK.
Aux États-Unis, il est communément admis qu’un enseignement supérieur conduit à des revenus plus élevés. Lorsque vous examinez cette table, vous pouvez vous demander si les femmes vivant dans ces quartiers ont de bons modèles de réussite. Le modèle de réussite est mesuré par le revenu médian, le niveau d’éducation et le salaire par rapport aux hommes. Le pourcentage de femmes en âge de procréer peut être utilisé pour mesurer l’impact des changements dans la législation des états, tels que l’interdiction de l’avortement. Vous pouvez utiliser cette mesure pour améliorer l’accès aux services de santé basés sur le genre.
- Fermez la table et enregistrez le projet.
Vous avez ajouté et calculé deux champs pour prendre en compte des indicateurs clés dans votre analyse : le pourcentage de femmes possédant certains niveaux d’éducation et le pourcentage de femmes en âge de procréer.
Vous avez créé une couche d’indicateurs à partir de sources de données existantes, notamment un shapefile et un fichier CSV. Vous avez importé les données dans la géodatabase, ajouté des champs, joint les données, exporté les données et calculé des champs. À présent, vous allez créer un indicateur environnemental à l’aide de données raster.
Utiliser des données raster pour créer une couche de couvert arboré
Dans cette section, vous allez préparer un indicateur permettant de mesurer le couvert arboré. La mesure du couvert arboré est souvent utilisée pour les indicateurs environnementaux et peut être associée à d’autres indicateurs environnementaux, tels que la température, pour fournir une image plus complète de la zone. De plus, historiquement, dans la plupart des villes américaines, le couvert arboré présente souvent une répartition inégale des arbres. Le couvert arboré est un luxe dans un espace urbain tel que la ville de New York. Vous allez utiliser le couvert arboré comme indicateur environnemental pour comprendre la répartition des arbres et savoir quelles sont les femmes ayant accès à des espaces ombragés.
Explorer une image d’occupation du sol
Vous allez commencer par ajouter les données d’occupation du sol créées à partir des données lidar pour la ville de New York. L’image a classé huit types d’occupation du sol.
- Revenez au projet dans ArcGIS Pro.
- Accédez à la connexion au dossier IndicatorData (DonnéesIndicateur) et développez le dossier Land_Cover (Occupation_Sol).
Cette image est un jeu de données raster d’occupation du sol pour la ville de New York, dont la résolution est de 6 pouces.
- Ajoutez l’image à la carte.
- Dans le volet Contents (Contenu), désactivez la couche NYC Census Tracts (Secteurs de recensement de la ville de New York).
Cette couche d’images a été classée dans huit classes. À présent, vous allez examiner les données de l’image en explorant sa table attributaire.
- Ouvrez la table attributaire de la couche NYC_2017_LiDAR_LandCover.img.
Prenez note des huit classifications d’occupation du sol présentes dans la table. 7 446 483 259 cellules dans le raster sont classées en tant que Tree Canopy (Couvert arboré).
Lorsque vous pensez à des endroits tels que New York ou d’autres espaces urbains, vous visualisez sans doute des bâtiments, des trottoirs et des rues animées. Dans ce contexte, les arbres et l’herbe sont un luxe.
- Fermez la table.
Reclasser l’image d’occupation du sol
Parmi les huit classifications d’occupation du sol présentées dans l’image, seule la classification Tree Canopy (Couvert arboré) vous intéresse. Vous allez donc utiliser un outil de géotraitement pour reclasser l’image et isoler les cellules classées en tant que couvert arboré.
- Sur le ruban, cliquez sur l’onglet Analysis (Analyse). Dans le groupe Geoprocessing (Géotraitement), cliquez sur Tools (Outils).
La fenêtre Geoprocessing (Géotraitement) s’affiche. Ici, vous pouvez rechercher des outils par nom ou par boîte à outils.
- Dans la fenêtre Geoprocessing (Géotraitement), dans la barre Find Tools (Rechercher des outils), entrez reclass (reclassement). Cliquez sur l’outil Reclassify (Spatial Analyst Tools) (Reclassification [Outils Spatial Analyst]).
- Dans l’outil Reclassification, définissez les paramètres suivants :
- Pour Input raster (Raster en entrée), cliquez sur le menu déroulant et sélectionnez NYC_2017_LiDAR_LandCover.img.
- Vérifiez que Reclass field (Champ de reclassement) est défini sur Class (Classe).
- Dans la table Reclassification, pour la ligne Tree Canopy (Couvert arboré), laissez la valeur figurant dans la colonne New (Nouveau) définie sur 1. Remplacez la valeur figurant dans la colonne New (Nouveau) pour toutes les autres classes, sauf pour NODATA, par 0.
- Pour Output raster (Raster en sortie), cliquez sur le bouton Browse (Parcourir) et accédez au dossier IndicatorData (DonnéesIndicateur). Pour Name (Nom), entrez TreeCanopyNYC.tif, puis cliquez sur Save (Enregistrer).
Remarque :
Selon votre système, l’exécution de l’outil Reclassification peut prendre jusqu’à 20 minutes.
Vous pouvez également télécharger les données des résultats pour utiliser le fichier image TreeCanopyNYC.tif. Pour utiliser ces données à la place, téléchargez et décompressez le fichier .zip sur votre ordinateur et ajoutez-le à votre projet à la place du fichier TreeCanopyNYC.tif.
- Cliquez sur Run (Exécuter).
Une fois le traitement de l’image terminé, celle-ci apparaît sur la carte.
- Dans la fenêtre Contents (Contenu), supprimez la couche NYC_2017_LiDAR_LandCover.img.
La couche TreeCanopyNYC.tif possède deux classes : Tree Canopy (Couvert arboré) se trouve dans une classe et toutes les autres classifications d’occupation du sol se trouvent dans l’autre classe. Vous pouvez utiliser ce raster pour calculer la présence de la variable de couvert arboré qui constituera la mesure pour l’indicateur environnemental.
- Enregistrez le projet.
Vous allez à présent utiliser l’outil Zonal Statistics as Table (Statistiques zonales en tant que table) pour résumer le niveau de couvert arboré dans chaque secteur de recensement.
Synthétiser le couvert arboré dans chaque secteur de recensement
Pour l’indicateur, c’est la présence d’arbres qui vous intéresse, et une valeur élevée correspond à davantage d’arbres ou à un facteur environnemental positif. Pour déterminer le couvert arboré dans chaque secteur de recensement, vous allez synthétiser les cellules de couvert arboré en fonction des polygones de secteur de recensement.
- Dans la fenêtre Geoprocessing (Géotraitement), cliquez sur le bouton de retour. Recherchez l’outil Statistiques zonales (table) (Outils Spatial Analyst) et ouvrez-le.
Cet outil synthétisera le nombre de cellules de couvert arboré dans chaque polygone de recensement et fournira le nombre total de cellules dans chaque zone (polygone). Ainsi, vous pourrez calculer le pourcentage de cellules du polygone recouvertes par des arbres.
- Dans l’outil Zonal Statistics as Table (Statistiques zonales (table)), saisissez les paramètres suivants :
- Pour Input Raster or Feature Zone Data (Données raster ou vecteur de zones en entrée), sélectionnez NYC Census Tracts (Secteurs de recensement de New York).
- Pour Zone Field (Champ de zone), sélectionnez GEOID [GEOID].
- Pour Input Value Raster (Raster de valeurs en entrée), choisissez TreeCanopyNYC.tif
- Pour Output Table (Table en sortie), entrez TreePixels (PixelsArbre).
- Pour Statistics type (Type de statistique), sélectionnez Sum (Somme).
Remarque :
Selon votre système, l’exécution de l’outil Statistiques zonales (table) peut prendre jusqu’à 30 minutes.
Vous pouvez également télécharger les données des résultats, décompresser le fichier zip et ajouter la table TreePixels à votre projet.
- Cliquez sur Run (Exécuter).
Une fois l’exécution de l’outil terminée, la table TreePixels s’affiche dans le volet Contents (Contenu) sous Standalone Tables (Tables autonomes).
- Ouvrez la table TreePixels.
La table contient deux colonnes intéressantes : COUNT (TOTAL), qui représente le nombre total de pixels dans chaque secteur de recensement et SUM (SOMME), qui représente la somme des pixels de couvert arboré.
Vous allez calculer le pourcentage de couvert arboré pour chaque polygone de recensement avec la formule suivante : PctCouvertArboré = (Somme / Total) * 100.
- Dans la table attributaire, cliquez sur Calculate (Calculer).
L’outil Calculer un champ apparaît. Précédemment, vous avez créé des champs avant d’ouvrir l’outil Calculate Field (Calculer un champ). Cette fois, vous allez créer le champ et le calculer simultanément.
- Dans l’outil Calculate Field (Calculer un champ), pour Field Name (Existing or New) (Nom du champ [existant ou nouveau]), entrez PctTreeCanopy (PctCouvertArboré).
- Pour Field Type (Type de champ), sélectionnez Double (64-bit floating point) (Double [virgule flottante 64 bits]).
- Sous Expression, pour PctTreeCanopy = (PctCouvertArboré =), créez l’expression (!SUM! / !COUNT!)*100 [(!SOMME! / !TOTAL!)*100].
- Cliquez sur OK.
Le champ PctTreeCanopy (PctCouvertArboré) apparaît à la fin de la table attributaire et est calculé.
La valeur PctTreeCanopy (PctCouvertArboré) correspond au pourcentage du secteur de recensement recouvert par des arbres et constitue la mesure pour l’indicateur environnemental.
- Fermez la table TreePixels (PixelsArbre), désactivez TreeCanopyNYC.tif et enregistrez le projet.
Vous avez reclassé une image d’occupation du sol pour isoler les cellules à inclure dans l’indicateur de couvert arboré et synthétisé le couvert arboré par secteurs de recensement. Vous connaissez maintenant le pourcentage de couvert arboré dans chaque secteur de recensement de la ville de New York. La table TreePixels (PixelsArbre) peut désormais être jointe à la couche NYC Census Tracts (Secteurs de recensement de New York).
Ajouter un indicateur basé sur la proximité
Les indicateurs suivants que vous allez créer permettront de mesurer l’accès à des ressources spécifiques. Souvent, les organisations tentent de déterminer où se trouvent les ressources, comme celles basées sur le genre. Une fois leurs localisations identifiées, il est nécessaire de pouvoir y accéder. En général, l’accès à une ressource est mesuré en fonction de sa proximité par rapport à cette localisation. Vous allez créer des couches ponctuelles représentant les localisations des services pour femmes. Ensuite, vous allez créer une zone tampon d’un demi-mile pour ces services afin de déterminer leur proximité. Vous ferez de même pour les localisations des expulsions car les études ont montré que les femmes noires et métisses sont souvent affectées négativement par les évictions forcées. Vous voulez identifier les quartiers de la ville de New York où les femmes subissent des évictions forcées de leur propriété ou location.
Créer des points à partir d’une table
Tout au long de ce didacticiel, vous avez utilisé des données tabulaires, mais jusqu’ici, elles étaient toutes non spatiales ou ne présentaient pas de composante spatiale, telle que des coordonnées. À présent, vous allez cartographier les expulsions à partir d’une table contenant les coordonnées de leurs localisations.
- Dans la fenêtre Catalog (Catalogue), depuis le dossier IndicatorData (DonnéesIndicateur), ajoutez Evictions.csv à la carte.
- Ouvrez la table Evictions.csv et faites-la défiler vers la droite jusqu’à ce que les champs Latitude et Longitude soient visibles.
Les champs Latitude et Longitude stockent les coordonnées de chaque expulsion. Vous allez les utiliser pour cartographier les expulsions sous forme de points sur la carte.
- Fermez la table.
- Sur le ruban, dans l’onglet Map (Carte), dans la section Layer (Couche), cliquez sur XY Table To Point (Table XY vers points).
L’outil Table XY vers points apparaît dans la fenêtre Geoprocessing (Géotraitement).
- Dans l’outil Table XY vers points, définissez ou vérifiez les paramètres suivants :
- Pour Input Table (Table en entrée), sélectionnez Evictions.csv.
- Pour Output Feature Class (Classe d’entités en sortie), remplacez le nom par défaut par Evictions (Expulsions).
- Pour X Field (Champ X), vérifiez que Longitude est sélectionné.
- Pour Y Field (Champ Y), vérifiez que Latitude est sélectionné.
- Pour Coordinate System (Système de coordonnées), vérifiez que GCS_WGS_1984 est sélectionné.
L’outil Table XY vers points sélectionne des valeurs de paramètre par défaut dynamiques en fonction des noms de champ.
- Cliquez sur Run (Exécuter).
Remarque :
Vous pouvez ignorer l’avertissement relatif aux valeurs nulles qui s’affiche.
À présent, vous allez ajouter une table contenant les services pour femmes et cartographier ces localisations à l’aide du même outil.
- Depuis la fenêtre Catalog (Catalogue), ajoutez Womens_Facilities.csv à la carte.
- Dans l’onglet Map (Carte), cliquez sur XY Table To Point (Table XY vers points).
- Dans l’outil XY Table To Point (Table XY vers points), définissez les paramètres suivants :
- Pour Input Table (Table en entrée), sélectionnez Womens_Facilities.csv.
- Pour Output Feature Class (Classe d’entités en sortie), remplacez le nom par WomensResources (RessourcesFemmes).
- Pour X Field (Champ X), sélectionnez Location 2 (Localisation 2).
- Pour Y Field (Champ Y), sélectionnez Location 1 (Localisation 1).
- Pour Coordinate System (Système de coordonnées), vérifiez que GCS_WGS_1984 est sélectionné.
- Cliquez sur Run (Exécuter).
- Dans la fenêtre Contents (Contenu), désactivez Evictions (Expulsions) pour afficher les points WomensResources (RessourcesFemmes).
Remarque :
Vous pouvez changer la couleur pour mieux voir les points.
Vous avez créé deux couches d’entités à partir de tables non spatiales afin de cartographier des critères importants pour les indicateurs.
Filtrer les données pour afficher uniquement certains types d’entités
Maintenant que tous les points sont affichés sur la carte, vous allez restreindre le champ de votre analyse pour inclure uniquement un type spécifique d’expulsion. Concernant les expulsions, seules les évictions vous intéressent. Vous allez donc les filtrer. Une grande partie de l’analyse consiste à restreindre le champ de vos données pour inclure uniquement des éléments spécifiques, tels que le couvert arboré et les évictions.
- Ouvrez la table attributaire pour Evictions (Expulsions).
- Faites-la défiler et localisez le champ Ejectment (Éviction).
Vous allez l’utiliser pour sélectionner des attributs.
- Dans la table, cliquez sur Select By Attributes (Sélectionner selon les attributs).
- Pour Where (Où), cliquez sur le menu déroulant et sélectionnez Ejectment (Éviction).
- Pour le deuxième menu déroulant, conservez is equal to (est égal à) et pour le dernier menu déroulant, sélectionnez Ejectment (Éviction).
- Cliquez sur OK.
- Dans l’angle inférieur gauche de la table, cliquez sur Show Selected Records (Afficher les enregistrements sélectionnés).
À présent, seuls les enregistrements sélectionnés s’affichent. Il devrait y en avoir 67. Vous allez inverser la sélection pour sélectionner les entités que vous ne voulez pas utiliser et les supprimer.
- Dans la table, cliquez sur Switch Selection (Inverser la sélection).
À présent, 89 835 enregistrements dont vous n’avez pas besoin sont sélectionnés.
- Cliquez sur Delete Selection (Supprimer la sélection).
- Cliquez sur Yes (Oui) pour confirmer la suppression.
- Cliquez sur Show All Records (Afficher tous les enregistrements).
- Fermez la table et enregistrez le projet.
Désormais, la table Evictions (Expulsions) ne contient plus que les 67 enregistrements que vous voulez inclure dans votre analyse.
Créer des zones tampons de temps de marche
À présent, vous allez incorporer la proximité des expulsions et des services pour femmes dans votre analyse. Vous allez créer des zones tampons d’un demi-mile autour des entités afin de représenter la distance à pied.
- Dans la fenêtre Geoprocessing (Géotraitement), recherchez et ouvrez l’outil Pairwise Buffer (Zone tampon deux par deux).
- Dans l’outil Pairwise Buffer (Zone tampon deux par deux), définissez les paramètres suivants :
- Pour Input Features (Entités en entrée), sélectionnez WomensResources (RessourcesFemmes).
- Pour Output Feature Class (Classe d’entités en sortie), remplacez la valeur par défaut par ResourcesBuffer (ZoneTamponRessources).
- Pour Distance, entrez 0.5 (0,5).
- Sous Linear Unit (Unité linéaire), sélectionnez US Survey Miles (Miles d’arpentage américains).
- Pour Method (Méthode), sélectionnez Geodesic (shape preserving) [Géodésique (préservation de la forme)].
- Pour Dissolve Type (Type de fusion), sélectionnez Dissolve all output features into a single feature (Fusionner toutes les entités en sortie en une seule entité).
- Cliquez sur Run (Exécuter).
- Dans la fenêtre Contents (Contenu), assurez-vous que les seules couches visibles, en plus des fonds de carte, sont WomensResources (RessourcesFemmes) et ResourcesBuffer (ZoneTamponRessources).
Vous avez créé des zones tampons pour les points de ressources. À présent, vous allez créer des zones tampons pour les entités d’expulsions.
- Dans le volet de l’outil Pairwise Buffer (Zone tampon deux par deux), qui est resté ouvert, mettez à jour les paramètres suivants :
- Pour Input Features (Entités en entrée), sélectionnez Evictions (Expulsions).
- Pour Output Feature Class (Classe d’entités en sortie), remplacez la valeur par défaut par EvictionsBuffer (ZoneTamponExpulsions).
- Cliquez sur Run (Exécuter).
- Dans la fenêtre Contents (Contenu), désactivez WomensResources (RessourcesFemmes) et ResourcesBuffer (ZoneTamponRessources) et activez Evictions (Expulsions) et EvictionsBuffer (ZoneTamponExpulsions).
Vous avez créé des couches pour représenter des zones tampons d’un demi-mile autour des expulsions et des points de ressources pour femmes. Ces zones tampons vous permettent d’intégrer la proximité à votre préparation d’indicateurs.
Créer des tables d’indicateurs
Vous pouvez maintenant créer les tables d’indicateurs.
- Dans la fenêtre Geoprocessing (Géotraitement), cliquez sur la flèche de retour. Recherchez l’outil Croiser les intersections et ouvrez-le.
- Dans l’outil Croiser les intersections, définissez les paramètres suivants :
- Pour Input Zone Features (Entités de zone en entrée), sélectionnez NYC Census Tracts (Secteurs de recensement de New York).
- Pour Zone Fields (Champs de zone), sélectionnez GEOID [GEOID].
- Pour Input Class Features (Entités de classe en entrée), sélectionnez EvictionsBuffer (ZoneTamponExpulsions).
- Pour Output Table (Table en sortie), entrez EvictionsIndicator (IndicateurExpulsions).
- Pour Sum Fields (Champs de somme), sélectionnez SHAPE_Area.
- Cliquez sur Run (Exécuter).
Dans la fenêtre Contents (Contenu), la table EvictionsIndicator (IndicateurExpulsions) apparaît sous Standalone Tables (Tables autonomes).
À présent, vous allez créer la table d’indicateurs pour les ressources pour femmes.
- Dans l’outil Tabulate Intersection (Croiser les intersections), changez uniquement les paramètres suivants :
- Pour Input Class Features (Entités de classe en entrée), sélectionnez ResourcesBuffer (ZoneTamponRessources).
- Pour Output Table (Table en sortie), remplacez le nom par ResourcesIndicator (IndicateurRessources).
- Cliquez sur Run (Exécuter).
Dans la fenêtre Contents (Contenu), la table ResourcessIndicator (IndicateurRessources) apparaît sous Standalone Tables (Tables autonomes).
- Ouvrez les deux tables d’indicateurs.
- Cliquez sur l’onglet de l’une des tables et faites-le glisser jusqu’à ce que l’option d’ancrage soit visible. Ancrez-le à droite de l’autre table.
Chaque table contient un champ PERCENTAGE (POURCENTAGE) qui mesure l’accès à deux ressources différentes.
Les valeurs de pourcentage élevées pour les expulsions sont mauvaises car elles représentent une perte de logement forcée. D’un autre côté, l’accès aux ressources pour femmes constitue une mesure positive. Par conséquent, des pourcentages élevés signifient un meilleur accès aux services basés sur le genre.
- Désancrez la table, fermez les deux tables et enregistrez le projet.
Vous allez maintenant joindre la table des expulsions et la table d’indicateurs de ressources aux secteurs de recensement pour disposer des pourcentages des deux tables pour chaque secteur.
Organiser la fenêtre Contents (Contenu)
Maintenant que vous disposez de toutes les données dont vous avez besoin pour les indicateurs, vous allez rapidement organiser la fenêtre Contents (Contenu) avant de joindre les données. Vous allez créer un groupe de couches pour faciliter l’organisation des couches.
- Dans la fenêtre Contents (Contenu), appuyez sur Ctrl et cliquez sur toutes les couches à l’exception de la couche NYC Census Tracts (Secteurs de recensement de New York) pour les sélectionner simultanément.
- Cliquez avec le bouton droit sur l’une des couches sélectionnées et choisissez Group (Grouper).
Ainsi, toutes les couches sélectionnées sont regroupées dans un groupe nommé New Group Layer (Nouveau groupe de couches).
- Cliquez une fois sur le nom New Group Layer (Nouveau groupe de couches) pour le sélectionner, puis cliquez une deuxième fois pour le rendre modifiable.
- Pour le nom, entrez Working Data (Données de travail).
À présent, vous allez joindre des données d’indicateur.
Joindre des tables d’indicateurs à des secteurs de recensement
Trois indicateurs figurent dans des tables autonomes : TreePixels (PixelsArbre), EvictionsIndicator (IndicateurExpulsions) et ResourcesIndicator (IndicateurRessources). Pour que ces informations soient intégrées dans les secteurs de recensement, vous allez effectuer trois opérations de jointure afin d’ajouter les champs des tables d’indicateurs aux secteurs de recensement.
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit de la souris sur NYC Census Tracts (Secteurs de recensement de New York), placez le curseur de la souris sur Joins and Relates (Jointures et relations), puis sélectionnez Add Join (Ajouter une jointure).
- Dans l’outil Ajouter une jointure, entrez les paramètres suivants :
- Pour Input Table (Table en entrée), sélectionnez NYC Census Tracts (Secteurs de recensement de New York).
- Pour Input Field (Zone en entrée), sélectionnez GEOID [GEOID].
- Pour Join Table (Table de jointure), sélectionnez TreePixels (PixelsArbre).
- Pour Join Field (Champ de jointure), sélectionnez GEOID.
- Laissez la case Keep all input records (Conserver tous les enregistrements en entrée) cochée.
- Pour Join Operation (Opération de jointure), sélectionnez Join one to first (Joindre un vers premier).
- Cliquez sur OK.
Rien ne change sur la carte, mais les attributs sont ajoutés à la table NYC Census Tracts (Secteurs de recensement de New York). Vous allez effectuer les deux autres jointures et explorer la table.
Répétez maintenant la jointure pour les tables EvictionsIndicator (IndicateurExpulsions) et ResourcesIndicator (IndicateurRessources).
- Ouvrez l’outil Ajouter une jointure pour la couche NYC Census Tracts (Secteurs de recensement de New York) et entrez les paramètres suivants :
- Pour Input Table (Table en entrée), sélectionnez NYC Census Tracts (Secteurs de recensement de New York).
- Pour Input Field (Champ en entrée), sélectionnez GEOID (il en existe plusieurs suite aux jointures, et peu importe celui que vous sélectionnez).
- Pour Join Table (Table de jointure), sélectionnez EvictionsIndicator (IndicateurExpulsions).
- Pour Join Field (Champ de jointure), sélectionnez GEOID.
- Pour Join Operation (Opération de jointure), sélectionnez Join one to first (Joindre un vers premier).
- Laissez la case Keep all input records (Conserver tous les enregistrements en entrée) cochée.
- Cliquez sur Run (Exécuter).
Enfin, joignez la table WomensResources (RessourcesFemmes) aux secteurs de recensement.
- Ouvrez l’outil Ajouter une jointure pour la couche NYC Census Tracts (Secteurs de recensement de New York) et entrez les paramètres suivants :
- Pour Input Table (Table en entrée), sélectionnez NYC Census Tracts (Secteurs de recensement de New York).
- Pour Input Field (Champ en entrée), sélectionnez GEOID (il en existe plusieurs suite aux jointures, et peu importe celui que vous sélectionnez).
- Pour Join Table (Table de jointure), sélectionnez WomensResources (RessourcesFemmes).
- Pour Join Field (Champ de jointure), sélectionnez GEOID.
- Pour Join Operation (Opération de jointure), sélectionnez Join one to first (Joindre un vers premier).
- Laissez la case Keep all input records (Conserver tous les enregistrements en entrée) cochée.
Vous avez joint toutes les tables dont vous avez besoin à la couche NYC Census Tracts (Secteurs de recensement de New York). À présent, vous allez exporter la couche jointe dans sa propre classe d’entités et nettoyer les champs dans le traitement.
Exporter les secteurs de recensement
La couche NYC Census Tracts (Secteurs de recensement de New York) comporte désormais quatre tables jointes. Comme précédemment avec la jointure, vous allez exporter la couche dans sa propre source de données.
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit de la souris sur NYC Census Tracts (Secteurs de recensement de New York), placez le curseur de la souris sur Data (Données), puis sélectionnez Export Features (Exporter les entités).
- Dans l’outil Export Features (Exporter les entités), définissez le paramètre Output Feature Class (Classe d’entités en sortie) sur Indicators (Indicateurs).
Lorsque vous joignez des données, vous ajoutez de nombreux champs dans une table et pouvez décider de supprimer ou de renommer certains alias de champ pour que les données soient plus claires. Vous allez maintenant nettoyer les champs avant d’exporter les données.
- Développez Fields (Champs), cochez Use Field Alias as Name (Utiliser l’alias de champ comme nom), puis cliquez sur Edit (Mettre à jour).
La fenêtre Field Properties (Propriétés du champ) apparaît. Vous allez conserver uniquement les champs pour l’analyse exploratoire et renommer les champs d’indicateur.
- Si nécessaire, placez le curseur de la souris sur le séparateur vertical à côté de la section Fields (Champs) et redimensionnez-le pour que les alias de champ complets soient visibles.
- Dans la section Fields (Champs), cliquez sur What’s the median income for women? (Quel est le revenu médian des femmes ?) Dans la section Properties (Propriétés), pour Alias, entrez Median Income Women (Revenu médian des femmes).
- En suivant le même processus, modifiez l’alias de chacun des champs suivants comme suit :
- Remplacez Are women earning more than men? (Les femmes gagnent-elles plus que les hommes ?) par Pay Equity (Égalité salariale).
- Remplacez Is there an abortion ban’? Yes or No (L’avortement est-il interdit ? Oui ou non) par Abortion Ban (Interdiction de l’avortement).
- Remplacez Are child marriages legal? Yes or No (Le mariage des enfants est-il légal ? Oui ou non) par Mariage des enfants.
- Remplacez Percent White Women (Pourcentage de femmes de race blanche) par White Women (Femmes de race blanche).
- Remplacez Percent Black Women (Pourcentage de femmes de race noire) par Black Women (Femmes de race noire).
- Remplacez Percent American Indian or Alaska Native Women (Pourcentage de femmes amérindiennes ou natives de l’Alaska) par AIAN Women (Femmes AIAN).
- Remplacez Percent Asian Women (Pourcentage de femmes asiatiques) par Asian Women (Femmes asiatiques).
- Remplacez Percent Native Hawaiian or Other Pacific Islander Women (Pourcentage de femmes natives d’Hawaï ou d’autres îles du Pacifique) par NHOPI Women (Femmes NHOPI).
- Remplacez Percent Mixed Race Women (Pourcentage de femmes métisses) par Mixed Race Women (Femmes métisses).
- Remplacez Percent Hispanic or Latino Women (Pourcentage de femmes hispaniques ou latino) par Hispanic or Latino Women (Femmes hispaniques ou latino).
- Remplacez EducationForWomen (ÉducationDesFemmes) par Education (Éducation).
- Remplacez WomenAtReproductiveAge (FemmesEnÂgeDeProcréer) par Women at Reproductive Age (Femmes en âge de procréer).
- Remplacez PctTreeCanopy (PctCouvertArboré) par Tree Canopy (Couvert arboré).
- Remplacez PERCENTAGE (EvictionsIndicator.PERCENTAGE) (POURCENTAGE [IndicateurExpulsions.POURCENTAGE]) par Expulsions.
- Remplacez PERCENTAGE (ResourcesIndicator.PERCENTAGE) (POURCENTAGE [IndicateurRessources.POURCENTAGE]) par Ressources basées sur le genre.
À présent, vous allez supprimer les champs dont vous n’avez pas besoin.
- Dans la liste Fields (Champs), cliquez sur Total Female Population for Education (Population féminine totale pour l’éducation), puis cliquez sur le bouton Remove (Supprimer).
- De la même manière, supprimez les champs suivants :
- Women getting a Bachelor’s Degree or higher (Femmes obtenant le baccalauréat ou un diplôme supérieur).
- Total Female Population for reproductive health (Population féminine totale pour la santé reproductive).
- Women at reproductive age 15 to 44 (Femmes en âge de procréer entre 15 et 44 ans).
- Cliquez sur OK pour fermer la fenêtre Field Properties (Propriétés du champ), puis cliquez de nouveau sur OK pour exécuter le rapport.
La couche Indicators (Indicateurs) apparaît sur la carte et dans la fenêtre Contents (Contenu).
- Ouvrez la table attributaire de la couche d’indicateurs et faites-la défiler vers la droite jusqu’à ce que les alias mis à jour utilisés comme en-tête de champ soient visibles.
La modification des alias au cours de l’exportation facilite l’interprétation de la table. À présent, tous les indicateurs sont disponibles dans la couche des secteurs. Vous pouvez utiliser ces champs d’indicateur pour la symbologie, l’étiquetage, l’interrogation et l’analyse.
Vous avez créé des couches ponctuelles à partir de coordonnées figurant dans des tables pour cartographier les expulsions et les ressources pour femmes. Vous avez créé des zones tampons d’un demi-mile pour les expulsions et les points de ressources pour femmes et utilisé les zones tampons afin de créer des indicateurs pour chaque variable. Vous avez également effectué plusieurs jointures pour intégrer tous les indicateurs dans la couche des secteurs de recensement et avez exporté la couche dans sa propre classe d’entités. Les deux tables d’indicateurs que vous avez créées mesurent la proximité, mais pour des raisons très différentes. Les pourcentages élevés d’expulsions sont mauvais car ils représentent une perte de logement forcée, mais il est important de mettre en évidence les quartiers touchés par ce problème. D’un autre côté, l’accès aux ressources pour femmes constitue une mesure positive, les femmes bénéficiant de plus de soutien dans ces quartiers. Vous allez maintenant joindre la table des expulsions et la table des ressources pour femmes aux secteurs de recensement et explorer de façon plus approfondie les relations de données à l’aide de l’analyse de données exploratoire.
Explorer les données à l’aide de diagrammes et de la symbologie
Maintenant que tous les indicateurs se trouvent dans une seule couche, vous allez explorer les variables dans une matrice de nuages de points pour mieux comprendre leurs relations. L’évaluation des données obtenues après calculs est une étape importante de tout processus d’analyse. Cette évaluation vous aidera à déterminer si le jeu de données présente une répartition des données asymétrique, qui pourrait impacter votre analyse et vous indiquera si des ajustements ou des méthodes doivent être mis en œuvre pour obtenir des résultats d’analyse plus précis.
Explorer les données des indicateurs
Vous allez créer une matrice de nuages de points afin de comparer la relation entre chaque indicateur. Ceci est utile pour déterminer les corrélations positives et négatives et l’ampleur de ces corrélations.
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit de la souris sur la couche Indicators (Indicateurs), placez le curseur de la souris sur Create Chart (Créer un diagramme), puis sélectionnez Scatter Plot Matrix (Matrice de nuages de points).
La fenêtre Chart Properties (Propriétés du diagramme) apparaît, ainsi qu’une fenêtre de diagramme vide. Lorsque vous définissez des propriétés dans la fenêtre Chart Properties (Propriétés du diagramme), le diagramme est affiché et mis à jour automatiquement dans la fenêtre de diagramme.
- Dans la section Variables, cliquez sur Select (Sélectionner).
La liste des attributs de la couche Indicators (Indicateurs) apparaît. Pour une matrice de nuages de points, vous devez sélectionner au moins trois variables. L’une des variables que vous voulez explorer est Median Income (Revenu médian), mais elle ne figure pas dans la liste.
- Ouvrir la vue Champs pour la couche Indicators (Indicateurs).
- Recherchez le champ Median Income Women (Revenu médian des femmes) et consultez sa propriété Data Type (Type de données).
Le champ Median Income Women (Revenu médian des femmes) est de type Text (Texte). Vous ne pouvez pas représenter un champ de texte dans une matrice de nuages de points. Vous devez donc ajouter un champ numérique et le calculer pour stocker les valeurs de revenu.
- En vous servant des compétences que vous avez acquises au cours de ce didacticiel, ajoutez un champ nommé WomensMedianIncome (RevenuMédianFemmes) avec Womens Median Income (Revenu médian des femmes) comme Alias et Double comme Data Type (Type de données).
- Calculez le champ WomensMedianIncome (RevenuMédianFemmes) en fonction du champ Median Income Women (Revenu médian des femmes).
Vous pouvez ignorer les avertissements relatifs au calcul.
- Dans la fenêtre Chart Properties (Propriétés du diagramme), cliquez sur Select (Sélectionner).
- Dans la liste des variables, cochez les cases correspondant à Pay Equity (Égalité salariale), Education (Éducation) et Womens Median Income (Revenu médian des femmes).
Les variables sélectionnées sont répertoriées.
Les variables apparaissent dans la matrice de nuages de points.
- Sous Trend (Tendance), cliquez sur Show trend line (Afficher une ligne de tendance).
Les lignes de tendance apparaissent pour chaque variable afin d’indiquer leur tendance.
- Dans la section Matrix Layout (Mise en page de la matrice), pour Lower left (Inférieur gauche), vérifiez que Scatterplots (Nuages de points) est sélectionné et pour Upper right (Supérieur droit), cliquez sur le menu déroulant et sélectionnez Pearson’s r (r de Pearson).
La matrice de nuages de points vous permet d’explorer de nombreuses relations dans un seul diagramme. Elle permet de visualiser la relation bivariée entre les variables que vous sélectionnez. À présent, vous allez explorer la relation des conséquences économiques pour les femmes blanches, noires et latinos.
- Dans la fenêtre Chart Properties (Propriétés du diagramme), pour Variables, cliquez sur Select (Sélectionner) et cochez les cases correspondant à White Women (Femmes de race blanche), Black Women (Femmes de race noire) et Hispanic or Latino Women (Femmes hispaniques ou latino).
Ces mini-nuages affichent les valeurs r à l’aide de couleurs divergentes illustrant la force et la direction de la relation.
Vous allez maintenant trier les mini-nuages.
- Dans la fenêtre Chart Properties (Propriétés du diagramme), dans la section Sort (Trier), cliquez sur le menu déroulant Sort by (Trier par) et sélectionnez Pearson’s r (r de Pearson). Pour Target field (Champ cible), sélectionnez Womens Median Income (Revenu médian des femmes) et pour Sort direction (Sens de tri), sélectionnez Descending (Décroissant).
En général, les valeurs sont comprises entre +1 et -1. Vous pouvez rechercher trois relations dans la matrice de nuages de points :
- Corrélation positive, valeurs proches de +1.
- Aucune corrélation, valeurs proches de 0.
- Corrélation négative, valeurs proches de -1.
Trois nuages présentent une relation positive forte, avec les valeurs 0,8, 0,55 et 0,6 respectivement. Vous allez maintenant explorer les variables pour chaque relation.
- Dans le diagramme, cliquez sur la case contenant la valeur r de Pearson 0.8 (0,8).
Le nuage de points correspondant pour Education (Éducation) et Womens Median Income (Revenu médian des femmes) est indiqué dans la matrice de nuages de points.
Le nuage dont la valeur est 0,8 représente la relation entre les variables Education (Éducation) et Womens Median Income (Revenu médian des femmes). Il est admis que le revenu augmente avec le niveau d’éducation.
- Cliquez sur la case dont la valeur r est 0.55 (0,55).
Le nuage pour la variable White Women (Femmes blanches) est indiqué. Il existe une relation positive forte entre les femmes de race blanche et le revenu médian. Ainsi, lorsque le pourcentage de femmes de race blanche augmente, le revenu médian augmente également.
- Cliquez sur la case dont la valeur r est 0,6.
Le nuage illustrant la relation entre les variables White Women (Femmes blanches) et Education (Éducation) est indiqué. D’après le diagramme, lorsque le pourcentage de femmes de race blanche augmente, le pourcentage de femmes possédant le baccalauréat ou un diplôme supérieur augmente également. À présent, vous allez déterminer s’il existe une relation similaire pour les femmes noires.
- Dans le diagramme, cliquez sur la case contenant la valeur r -0.26 (-0,26) et -0.32 (-0,32).
Les nuages pour Black Women (Femmes noires) se signalent, montrant que les relations entre Femmes noires, revenu et éducation présentent une corrélation négative. Par conséquent, lorsque les pourcentages de ces deux groupes augmentent, le revenu et l’éducation diminuent.
- Pour explorer la relation entre les femmes hispaniques ou latino, le revenu et l’éducation, cliquez sur les valeurs r -0.43 (-0,43) et -0.47 (-0,47).
Les relations entre les femmes hispaniques ou latino, le revenu et l’éducation montrent une corrélation négative. Par conséquent, lorsque les pourcentages de ces deux groupes augmentent, le revenu et l’éducation diminuent.
- Sélectionnez la case dont la valeur r est -0.63 (-0,63).
Le nuage sélectionné illustre la relation entre les pourcentages de femmes noires et de femmes blanches. En d’autres termes, lorsque les pourcentages d’un groupe augmentent, ceux de l’autre diminuent. Par conséquent, il est probable que ces deux groupes ne vivent généralement pas dans les mêmes quartiers.
- Fermez toute fenêtre ouverte, sauf la carte. Fermez la fenêtre Chart Properties (Propriétés du diagramme) et enregistrez le projet.
Vous avez exploré les données à l’aide d’une matrice de nuages de points avec des valeurs r de Pearson. Si vous deviez utiliser ces indicateurs dans un indice, vous détermineriez s’ils sont importants pour les résultats et/ou si l’indicateur est au centre de l’indice. Par exemple, vous n’incluriez pas la race et/ou l’origine ethnique dans les calculs de la valeur d’indice. Par contre, vous pourriez utiliser ces facteurs pour ventiler l’indice. Vous allez maintenant étudier un autre exemple : l’égalité salariale. L’égalité salariale est une variable dérivée du revenu des femmes et des hommes. Elle est très utile pour mesurer la parité des genres en fonction du revenu. Toutefois, pour un indice associé à l’ensemble d’indicateurs actuel, il peut être judicieux de l’exclure. Vous disposez déjà de la variable relative au revenu médian. De plus, si vous élargissiez ces sujets et envisagiez de créer des sous-indices tels que l’économie, avec le revenu médian, l’égalité salariale et quelques autres points, vous obtiendriez de meilleurs résultats.
Cartographier un indicateur
Maintenant que vous avez exploré les données des indicateurs à l’aide d’une matrice de nuages de points et compris les variables, vous allez afficher la couche Indicators (Indicateurs) à l’aide d’une symbologie bivariée. Vous allez créer une carte des relations entre l’éducation et le revenu. Les cartes des relations représentent visuellement les deux variables. Elles vous aideront à voir l’interaction des indicateurs dans plusieurs dimensions, ce que l’on appelle souvent superdiversité ou données intersectionnelles.
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit de la souris sur Indicators (Indicateurs), puis cliquez sur Symbology (Symbologie).
La fenêtre Symbology (Symbologie) apparaît.
- Pour Primary symbology (Symbologie principale), cliquez sur le menu déroulant et sélectionnez Bivariate Colors (Couleurs bivariées).
- Pour Field 1 (Champ 1), sélectionnez Education (Éducation).
- Pour Field 2 (Champ 2), sélectionnez Womens Median Income (Revenu médian des femmes).
- Pour Method (Méthode), vérifiez que Quantile est sélectionné.
- Pour Grid Size (Taille de la grille), vérifiez que 3 x 3 est sélectionné et conservez la combinaison de couleurs Pink-Blue-Purple (Rose-Bleu-Violet).
Vous allez maintenant changer la couleur du contour.
- Pour Template (Modèle), cliquez sur la couleur existante.
- Cliquez sur l’onglet Properties (Propriétés). Pour Outline color (Couleur de contour), cliquez sur la couleur existante et sélectionnez Gray 30% (Gris 30 %).
- Pour Outline width (Largeur de contour), remplacez la valeur actuelle par 0.2 (0,2) point.
- Cliquez sur Apply (Appliquer).
La relation entre l’éducation et le revenu médian est ainsi symbolisée, par ordre croissant. Lorsque l’éducation et le revenu médian des femmes sont tous les deux élevés, ces zones sont ombrées en violet. Il s’agit principalement du quartier de Manhattan et d’une partie du quartier de Brooklyn.
- Remplacez le nom de la couche par Education x Median Income for Women (Éducation x Revenu médian des femmes).
- Enregistrez le projet.
Vous venez d’utiliser deux méthodes d’analyse de données exploratoire : les diagrammes et la cartographie. À l’aide des diagrammes, vous pouvez étudier la force de la relation et identifier les indicateurs à exclure de l’indice. En général, il s’agit d’indicateurs fortement corrélés pouvant fausser les valeurs d’indice. La visualisation cartographique permet de mettre en évidence les motifs de plusieurs indicateurs, ce qui est essentiel pour comprendre les processus sociaux.
Dans ce didacticiel, vous avez ajouté l’approche géographique à l’égalité raciale et à la justice sociale et l’avez appliquée au développement d’indicateurs. Vous avez préparé des couches d’indicateurs en utilisant les données de l’ACS (American Community Survey) pour obtenir des données sur l’éducation, les salaires et le revenu. Vous avez également appris à reclasser une imagerie et à calculer le couvert arboré en fonction des pixels dans les secteurs surfaciques. Ensuite, vous avez développé un indicateur reposant sur la proximité pour étudier l’accès aux ressources basées sur le genre. Enfin, vous avez procédé à une analyse de données exploratoire que vous pouvez utiliser pour identifier les indicateurs fortement corrélés pouvant fausser un indice.
Vous pouvez appliquer cette méthodologie de développement d’indicateurs à d’autres zones d’intérêt dans le monde et pouvez inclure des données propres à votre communauté. Lorsque vous préparez vos propres indicateurs, utilisez un traitement des données et des indicateurs adaptés à vos objectifs à long terme, à vos résultats et à vos populations. Pour plus d’informations sur l’analyse de données exploratoire, lisez ce billet de blog.
Vous trouverez d’autres didacticiels dans la bibliothèque des didacticiels.