Préparer les données pour l'analyse
Avant de commencer votre analyse pour déterminer où implanter le programme de mentorat, vous allez filtrer et adapter certaines données provenant de certaines sources.
Ouvrir le projet
Vous allez d’abord télécharger et ouvrir les données de projet par défaut dans ArcGIS Pro.
- Téléchargez le fichier Identify_Schools.zip.
- Recherchez le fichier téléchargé sur votre ordinateur.
Remarque :
Selon votre navigateur Web, vous avez peut-être été invité à choisir l'emplacement du fichier avant de lancer le téléchargement. Par défaut, la plupart des navigateurs téléchargent les fichiers dans le dossier Téléchargements.
- Cliquez avec le bouton droit sur le fichier à extraire et choisissez un emplacement de destination facile d’accès, par exemple votre dossier Documents.
- Ouvrez le dossier Identify_Schools extrait.
Le dossier contient un fichier de projet empaqueté ArcGIS Pro (.ppkx) et une table de valeurs séparées par des virgules (.csv).
- Si ArcGIS Pro est installé sur votre machine, double-cliquez sur le fichier Identify_Schools.ppkx. Si vous y êtes invité, connectez-vous via votre compte ArcGIS sous licence.
Remarque :
Si vous n’avez pas accès à ArcGIS Pro ou ne disposez pas d’un compte d’organisation ArcGIS, consultez les options disponibles pour accéder aux logiciels.
Le projet contient une carte montrant les établissements scolaires du comté de Chatham, dans l’État de Géorgie des États-Unis, et les secteurs scolaires des lycées. Les établissements scolaires sont représentés sous forme d’entités ponctuelles, et les secteurs sous forme d’entités surfaciques.
Ces deux couches ont été téléchargées à partir du portail SAGIS Open Data, le centre de données d’information officielles pour la zone.
Ajouter un ensemble de définition
Il existe beaucoup plus d’écoles que de secteurs scolaires pour les lycées. Ceci est dû au fait que la couche des écoles contient tous les établissements, et pas seulement les lycées publics. Vous remarquerez que les données émanant de sources officielles contiennent souvent plus d’entités et d’attributs que ce qui est nécessaire pour le projet.
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit sur Schools (Écoles) et cliquez sur Attribute Table (Table attributaire).
Chaque ligne de cette table contient les valeurs d’une école. Le texte en bas de la table vous indique qu’il existe 100 écoles. Les champs de la table contiennent des valeurs décrivant chaque établissement.
Le champ TYPE spécifie le type d’établissement pour chaque point. Puisque c’est le taux de réussite des lycées qui vous intéresse, vous allez utiliser cet attribut pour filtrer la couche afin d’afficher uniquement les lycées. Le champ SCHOOL_TYP identifie les établissements publics et privés.
- Dans la fenêtre Contents (Contenu), double-cliquez sur Schools (Écoles).
La fenêtre Layer Properties (Propriétés de la couche) apparaît.
- Dans la fenêtre Layer Properties (Propriétés de la couche), cliquez sur l’onglet Definition Query (Ensemble de définition), puis sur New definition query (Nouvel ensemble de définition).
Une nouvelle requête, Query 1 (Requête 1)apparaît dans la fenêtre Definition Query (Ensemble de définition). Sur la ligne Where (Où), des listes déroulantes permettent de choisir un champ, une relation et une valeur.
- Choisissez le champ TYPE, puis is equal to (Est égal à), et choisissez High (Lycée).
Cette requête filtrera la couche pour afficher les lycées. Seuls les établissements publics nous intéressent pour ce projet, vous allez donc ajouter une autre clause à la requête avant de l’exécuter.
- Cliquez sur Ajouter une clause.
Une autre ligne s’affiche dans la fenêtre Definition Queries (Ensembles de définition).
- Laissez l’opérateur And (Et) et créez la requête SCHOOL_TYP est égal à Public School.
Les clauses sont jointes à l’aide de l’opérateur And (Et), donc seules les entités ponctuelles d’écoles représentant à la fois des lycées et des écoles publiques seront affichées sur la carte.
Le commutateur SQL en haut à droite du générateur de requêtes vous permet de voir (et de mettre à jour) les clauses des requêtes représentées sous forme de code SQL, mais il est généralement plus simple d’utiliser ces commandes pour générer les requêtes.
- Cliquez sur Apply (Appliquer).
- Cliquez sur OK.
Vous avez filtré la couche Schools à l’aide d’un ensemble de définition. La couche affiche à présent uniquement les lycées publics, c’est-à-dire les établissements qui nous intéressent pour cette partie de l’analyse.
Masquer les champs supplémentaires
La couche Schools (Écoles) comporte plusieurs champs qui ne sont pas indispensables pour ce projet. Vous allez donc les masquer.
- Dans la table attributaire de la couche Schools, cliquez sur l’en-tête du champ GRADES.
Le champ change de couleur pour indiquer que le champ a été sélectionné.
- Maintenez la touche Ctrl enfoncée tout en cliquant sur les en-têtes des champs AFFILIATIO, RESTRICTIO, ADDRESS, CITY et ZIP.
Plusieurs champs sont désormais sélectionnés.
- Cliquez avec le bouton droit sur RESTRICTIO et sélectionnez Hide Field (Masquer le champ).
Ces champs sont encore présents dans la table de données, mais ils sont maintenant masqués.
La couche AttendanceZones (Secteurs scolaires) comporte elle aussi des champs qui ne sont pas nécessaires pour l’instant. Puisque la plupart des champs doivent être masqués dans la couche, vous allez utiliser la vue Fields (Champs) pour masquer les champs.
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit sur AttendanceZones, pointez le curseur sur Data Design (Conception de données) et sélectionnez Fields (Champs).
La vue Fields (Champs) s’ouvre.
- Dans la vue Fields (Champs), désélectionnez la case d’en-tête pour Visible afin de désactiver la visibilité de tous les champs.
- Cochez la case Visible en regard du champ NAME (NOM) pour activer à nouveau ce champ.
- Sur le ruban, sous l’onglet Champs, dans le groupe Modifications, cliquez sur Enregistrer.
- Fermez la fenêtre de la vue Fields (Champs).
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit sur AttendanceZones et sélectionnez Attribute Table (Table attributaire).
La table attributaire de la couche AttendanceZones apparaît et les champs qui ne sont pas nécessaires pour l’analyse sont masqués. Seul le champ NAME est affiché.
Comparer les deux tables.
Vous allez à présent comparer les tables des couches Schools et AttendanceZones.
- Si nécessaire, ouvrez les tables attributaires des couches AttendanceZones et Schools.
Les deux tables peuvent être disposées comme deux onglets dans une seule fenêtre de table. Pour les comparer côte à côte, vous allez faire glisser un des onglets en dehors de cette fenêtre.
- Faites glisser l’onglet AttendanceZones et ancrez-le sur le côté de la table attributaire de la couche Schools.
Alors que vous faites glisser la fenêtre, représentée par une ombre bleue, des cibles d’ancrage apparaissent au centre de la vue tabulaire et sur les bords de la fenêtre d’application. Chaque cible représente une zone dans laquelle la fenêtre peut être positionnée.
- Dans la table Schools, cliquez avec le bouton droit sur l’en-tête du champ NAME et sélectionnez Sort Ascending.
- Dans la table AttendanceZones, cliquez avec le bouton droit sur l’en-tête du champ NAME et sélectionnez Sort Ascending (Tri croissant).
En fonction des deux tables, il ressort que la plupart des élèves des lycées publics fréquentent l’établissement scolaire correspondant à leur secteur, mais que certains fréquentent des écoles attirant des élèves de plusieurs secteurs.
Huit lycées, Beach, Groves, Islands, Jenkins, Johnson et New Hampstead, Windsor Forest et School of Liberal Studies (du lycée de Savannah), se trouvent dans les deux tables.
Il existe cependant trois autres écoles qui ne sont pas dans les zones AttendanceZones (Secteurs scolaires). Ces établissements s’appellent Savannah Arts Academy, Savannah Early College (du lycée de Savannah) et Woodville Tompkins High / Twilight Program. Ces trois écoles attirent des élèves en dehors de leurs secteurs respectifs.
Aux États-Unis, les écoles attractives sont des établissements publics ou des programmes éducatifs qui offrent une grande diversité de cursus particuliers, souvent spécialisés dans un sujet académique comme les mathématiques, les sciences ou la technologie. L’objectif de ces écoles attractives est de permettre aux élèves d’accéder à des spécialisations, quels que soient leur lieu de résidence et leur secteur scolaire. L’admission dans un lycée attractif varie selon les secteurs, mais elle repose souvent à la fois sur le mérite, un système de tirage au sort et d’autres critères.
Ajouter des informations en joignant des tables
Aucune des deux couches actuelles ne contient les données liées au nombre d’élèves ou au taux de réussite aux examens de ces écoles Vous devrez fréquemment améliorer les données existantes en les combinant aux données provenant d’autres sources. Heureusement, un de vos collègues de bureau a trouvé un rapport officiel de l’état contenant ces chiffres et il les a saisis dans un fichier texte de valeurs séparées par des virgules, ou un fichier .csv (le format CSV est un format de table très simple). Vous allez utiliser l’identifiant d’état de l’école pour joindre ces données à la couche Schools.
- Sur le ruban, sous l’onglet Map (Carte), dans le groupe Layer (Couche), cliquez sur le bouton Add Data (Ajouter des données).
La fenêtre Add Data (Ajouter des données) s’affiche.
- Accédez au dossier Identify_Schools extrait et cliquez sur GraduationRates.csv, puis sur OK.
La table est ajoutée à la fenêtre Contenu sous Tables autonomes.
Cette table possède un champ nommé SCHOOLCODE qui contient l’identifiant de l’état correspondant à chaque école. La couche Schools (Écoles) contient les mêmes valeurs de données dans un champ nommé School_ID.
Vous allez connecter les deux tables en joignant les valeurs correspondantes dans ces champs.
Remarque :
Il est parfois possible d’utiliser un champ de nom comme champ de jointure, mais les champs numériques ou de code sont généralement préférables. Les champs de nom comportent fréquemment des différences d’orthographe, de majuscules, et d’exhaustivité qui empêchent les correspondances. Par exemple, les champs NAME (NOM) des couches Schools (Écoles) et AttendanceZones (Secteurs scolaires) utilisent des conventions différentes pour les noms d’écoles. Dans la table Schools (Écoles), le nom est combiné avec High (par exemple, Beach High) et dans la table AttendanceZones (Secteurs scolaires), le nom est combiné avec High School (par exemple, Beach High School). Ces différences peuvent sembler insignifiantes pour une personne, mais elles empêcheraient les tables de se joindre correctement.
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit sur Schools, pointez sur le curseur sur Joins and Relates (Jointures et relations), puis sélectionnez Add Join (Ajouter une jointure).
La fenêtre Add Join (Ajouter une jointure) apparaît.
- Dans la fenêtre Add Join (Ajouter une jointure), saisissez les paramètres suivants :
- Pour Input Table (Table en entrée), vérifiez que Schools (Écoles) est sélectionné.
- Pour Input Join Field (Champ de jointure en entrée), sélectionnez SCHOOL_ID.
- Pour Join Table (Table de jointure), vérifiez que GraduationRates.csv est sélectionné.
- Pour Join Table Field (Champ de table de jointure), choisissez SCHOOLCODE.
Remarque :
Le symbole d’alerte en regard du Input Join Field (Champ de jointure en entrée) apparaît car le champ n’est pas indexé. L’indexation des champs de jointure améliore les performances, mais cela n’est pas nécessaire pour une table aussi petite. Lorsque vous cliquez sur Validate Join (Valider une jointure), l'outil vérifie que l'expression fonctionne.
- Cliquez sur OK.
Les champs GRCLASSZ (taille de la classe Lycées) et GRDNUM (chiffres d’obtention de diplômes) sont joints à la classe d’entités. Vous pouvez maintenant calculer les taux d’obtention de diplômes.
- Fermez la table AttendanceZones (Secteurs scolaires).
Ajouter des champs pour accueillir de nouvelles valeurs
Les données contenues dans les tables peuvent ne pas fournir exactement les informations dont vous avez besoin. Dans le cas présent, la table contient deux champs pertinents contenant la taille de la classe de diplômés et le nombre d’élèves à avoir obtenu leur diplôme. Heureusement, le taux de réussite aux examens peut être calculé à partir de ces valeurs. Vous allez ajouter un champ pour stocker les résultats avant d’effectuer le calcul.
- Dans la table Schools (Écoles), cliquez sur Add (Ajouter).
La vue Fields (Champs) de Schools apparaît avec un nouveau champ modifiable en bas de la table.
- Pour Field Name (Nom du champ), saisissez TauxRéussite. Pour Alias, saisissez Taux de réussite aux examens.
- Définissez le Type de données sur la valeur Réel double.
- Sur le ruban, sous l’onglet Champs, dans le groupe Modifications, cliquez sur Enregistrer.
En ajoutant des champs à la table, vous allez ajouter deux champs supplémentaires pour stocker deux autres éléments d’information concernant les écoles : s’il s’agit d’établissements attractifs ou non (écoles attirant des élèves venant d’autres secteurs scolaires), et si leur taux de réussite aux examens est supérieur ou inférieur à la moyenne de l’état.
- En bas de la vue Fields (Champs), cliquez sur Click here to add a new field (Cliquez ici pour ajouter un nouveau champ).
Un nouveau champ est ajouté.
- Modifiez les paramètres suivants du nouveau champ :
- Pour Field Name (Nom du champ), saisissez Attractif.
- Dans Data Type (Type de données), choisissez Text.
- Pour Length (Longueur), saisissez 5.
Ce champ vous permettra de faire la différence entre les écoles dont les élèves proviennent d’un seul secteur et celles qui attirent des élèves provenant de plusieurs secteurs.
- Ajoutez un autre champ avec les paramètres suivants :
- Pour Field Name (Nom du champ), saisissez Sous82.
- Dans Data Type (Type de données), choisissez Text.
- Pour Length (Longueur), saisissez 5.
Ce champ vous permettra de distinguer les écoles dont le taux de réussite est supérieur ou inférieur à la moyenne de l’état de 82 pour cent.
- Sur le ruban, sous l’onglet Champs, dans le groupe Modifications, cliquez sur Enregistrer.
- Fermez l’onglet de la vue Fields (Champs).
Les nouveaux champs sont ajoutés à la fin de la table Schools (Écoles). Il sera peut-être nécessaire de faire défiler la table vers la droite pour voir ces champs.
Maintenant que les champs ont été ajoutés, vous pouvez calculer le taux de réussite de chaque école et marquer les écoles avec d’autres valeurs en vue de l’analyse.
Calculer de nouvelles valeurs
Vous allez maintenant calculer le taux de réussite aux examens de chaque école. Pour calculer un taux de réussite, vous allez diviser le nombre d’élèves ayant obtenu leur diplôme (GRDNUM) par le nombre total d’élèves dans la classe (GRDCLASSZ). Vous allez multiplier le résultat par 100 pour obtenir le taux de réussite aux examens, exprimé sous forme de pourcentage.
- Dans la table attributaire Schools, cliquez avec le bouton droit sur Taux de réussite aux examens et sélectionnez Calculate Field (Calculer un champ).
L’outil Calculate Field (Calculer un champ) apparaît.
- Dans l’outil Calculer un champ, sous Expression dans la colonne Fields (Champs), double-cliquez sur GRDNUM.
Le texte !GraduationRates.csv.GRDNUM! est ajouté à la zone d’expression de calcul de champ.
Puisque le calcul s’effectue sur une couche avec une jointure, le nom de la table source est ajouté comme préfixe au nom du champ, les noms sont encadrés par des points d’exclamation pour indiquer qu'il s’agit d’un nom de champ.
- Cliquez sur le bouton de division (/).
- Dans la colonne Fields (Champs), double-cliquez sur GRCLASSZ.
- Dans la zone de l’expression, entourez l’expression de parenthèses. À la fin de l’expression, saisissez * 100.
L’expression terminée indique :
(!GraduationRates.csv.GRDNUM! / !GraduationRates.csv.GRCLASSZ!) * 100
C’est-à-dire, la valeur du champ GRDNUM (nombre de diplômés), divisée par la valeur du champ GRCLASSZ (taille de la classe), multipliée par 100. Les champs GRDNUM et GRVLSSZ ont le préfixe GraduationRates.csv pour indiquer qu’ils se trouvent dans la table GraduationRates.csv. La valeur de pourcentage sera stockée dans Schools.GradRate, le champ GradeRate de la table Schools (Écoles).
- Cliquez sur OK.
Les taux de réussite apparaissent dans la colonne Graduation Rate (Taux de réussite aux examens) de la table Schools (Écoles).
Les trois établissements Savannah Arts Academy, Savannah Early College (du lycée de Savannah) et Woodville Tompkins High / Twilight Program attirent des élèves qui résident dans des secteurs scolaires différents. Vous allez ajouter des valeurs dans le champ Attractif pour différencier leur taux de réussite de celui des autres établissements.
- Dans la table attributaire Schools, cliquez sur l’en-tête de la ligne Savannah Arts Academy pour la sélectionner. Appuyez sur la touche Ctrl tout en cliquant sur les numéros de ligne de Savannah Early College et Woodville Tompkins.
Les lignes correspondant à chaque école sont mises en surbrillance indiquant qu’elles sont sélectionnées.
- Dans la table Schools, cliquez avec le bouton droit sur Attractif et sélectionnez Calculate Field (Calculer un champ).
- Dans l’outil Calculate Field (Calculer un champs), dans la zone d’expression, saisissez « Oui ».
Incluez les guillemets autour du mot.
- Cliquez sur Apply (Appliquer). Ne fermez pas l’outil Calculate Field (Calculer un champ)
La valeur Oui est ajoutée à l’attribut Attractif pour les trois écoles sélectionnées.
- Dans la table Schools (Écoles), cliquez sur le bouton Switch Selection (Inverser la sélection).
Les huit autres écoles sont maintenant sélectionnées.
- Dans la fenêtre Calculate Field (Calculer un champ), mettez à jour l’expression sur "No" (« Non ») et cliquez sur OK.
Les valeurs du champ Magnet (Attractif) sont actualisées.
- Cliquez sur le bouton Clear Selection (Effacer la sélection).
La sélection est effacée.
Exporter les données vers une nouvelle classe d'entités
Maintenant que vous avez ajouté les nouvelles données à la couche Schools, vous pouvez analyser les données des taux de réussite élevés des lycées. Vous allez les exporter vers une nouvelle classe d’entités pour enregistrer les champs de jointure et vous passer de l’ensemble de définition.
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit sur Schools, pointez le curseur sur Data (Données) et sélectionnez Export Features (Exporter des entités).
La fenêtre Export Features (Exporter des entités) s’ouvre.
- Vérifiez que le paramètre Input Features (Entités en entrée) est défini sur Schools.
- Pour Output Feature Class (Classe d’entités en sortie), saisissez Lycées.
- Cliquez sur OK.
La nouvelle couche HighSchools (Lycées) est ajoutée à la carte.
- Dans la fenêtre Contents (Contenu), décochez la couche Schools (Écoles) pour la désactiver.
- Fermez la table Schools (Écoles).
- Dans la barre d'outils Accès rapide, cliquez sur Enregistrer pour enregistrer le projet.
Vous avez téléchargé, ouvert et exploré les données initiales du projet. Vous avez également modifié les champs affichés par les couches et ajouté de nouveaux champs. Vous avez joint les données aux écoles à partir d’un fichier .csv, calculé le taux de réussite et marqué les écoles selon deux catégories : attractives et non attractives. Vous avez exporté une nouvelle couche contenant uniquement les lycées et toutes les informations que vous avez ajoutées.
Explorer les données
Vous allez ensuite explorer les données. Vous allez utiliser un diagramme des données pour comprendre comment celle-ci sont réparties, et quel lien existe entre le taux de réussite aux examens et certains lieux spécifiques du comté.
Afficher un histogramme des taux de réussite aux examens
Vous allez tout d'abord ouvrir la table attributaire de la couche HighSchools (Lycées).
- Cliquez avec le bouton droit de la souris sur la couche Lycées et sélectionnez Attribute Table (Table attributaire).
- Dans la table HighSchools, cliquez avec le bouton droit sur l’en-tête du champ Taux de réussite aux examens et sélectionnez Sort Ascending (Tri croissant).
- Cliquez avec le bouton droit de la souris sur l’en-tête du champ Taux de réussite aux examens et sélectionnez Statistics (Statistiques).
Un diagramme apparaît avec les taux de réussite aux examens tracés sous forme d’histogramme et la fenêtre Chart Properties (Propriétés du diagramme) s’affiche, présentant des statistiques descriptives pour les valeurs des champs. Le taux moyen de réussite aux examens des lycées est de 88,63 pour cent, ce qui est plus élevé que la moyenne de l'état de 82 pour cent. Le taux de réussite le plus bas est de 75,3 pour cent, et le plus haut de 100 pour cent.
Par défaut, les données sont divisées en huit groupes pour l’histogramme, mais ceci peut être modifié.
Les chiffres dans ce tableau comportent un nombre de décimales plus important que ce qui est nécessaire. Vous allez à présent modifier la mise en forme des nombres pour ce diagramme.
- Dans la fenêtre Chart Properties (Propriétés du diagramme), cliquez sur l’onglet Axes. Dans la section X-axis (Axe x), pour Number format (Format de nombre), cliquez sur le bouton Determine display formatting for numeric field types (Déterminez le format d’affichage des types de champ numérique).
- Dans la fenêtre qui apparaît, pour Category (Catégorie), sélectionnez Numeric (Numérique). Sous Rounding (Arrondi), pour Decimal places (Décimales), saisissez 1.
Le format numérique pour Graduation Rates (Taux de réussite aux examens) s’actualise sur l’axe x du diagramme.
- Cliquez sur Apply (Appliquer).
- Fermez la fenêtre Chart Properties (Propriétés du diagramme).
- Cliquez sur la première colonne dans l’histogramme.
Lorsque vous cliquez sur la barre du groupe de valeur la plus faible, les deux établissements qui se trouvent dans cette catégorie sont sélectionnés. Ils sont mis en surbrillance sur la carte et dans la table attributaire HighSchools (Lycées).
- Cliquez sur les autres colonnes pour voir les emplacements des lycées dans d’autres groupes.
- Cliquez sur la colonne contenant le taux de réussite aux examens le plus élevé.
Les trois lycées affichant le taux de réussite aux examens le plus élevé sont sélectionnés.
- Dans la table HighSchools (Lycées), examinez les attributs des lycées sélectionnés.
Les trois lycées dont les taux de réussite aux examens sont les plus élevés sont des établissements attractifs. Ces établissements attirent des élèves en dehors de leurs secteurs respectifs. L’admission dans un lycée attractif peut reposer sur plusieurs critères, notamment le mérite, un tirage au sort ou avoir un parent qui a fréquenté l’établissement auparavant. L’attrait de ces établissements auprès des étudiants repose en général sur une spécialité ou un programme en particulier. Un lycée peut par exemple être spécialisé dans l’enseignement artistique, scientifique, mathématique, professionnel ou technique. Les lycées attractifs peuvent également bénéficier d’un financement particulier et recruter des enseignants spécialisés. Ceci peut expliquer en partie pourquoi les établissements attractifs affichent les taux de réussite aux examens les plus élevés parmi ce groupe d’établissements dans votre analyse.
- Dans la table HighSchools (Lycées), cliquez sur Clear (Effacer) pour supprimer la sélection.
Il peut être utile pour votre organisation d’étudier ces établissements afin d’identifier les raisons expliquant leurs taux élevés de réussite aux examens et pouvoir les appliquer dans le cadre du programme de mentorat.
- Fermez la table attributaire Lycées ainsi que la fenêtre de diagramme.
Filtrer les établissements attractifs
Puisque les établissements attractifs attirent des élèves hors de leur secteur respectif, et puisqu'ils enregistrent les meilleurs taux de réussite aux examens, ils ne seront pas utiles pour choisir les lycées et collèges pour le programme de mentorat. Vous allez ajouter un ensemble de définition pour les exclure.
- Dans la fenêtre Contents (Contenu), double-cliquez sur HighSchools (Lycées).
La fenêtre Layer Properties (Propriétés de la couche) apparaît.
- Dans la fenêtre Layer Properties (Propriétés de la couche), cliquez sur l’onglet Definition Query (Ensemble de définition), puis sur New definition query (Nouvel ensemble de définition).
- Créez l’expression Where Magnet is equal to No (Où Attractif est égal à Non).
- Cliquez sur Appliquer, puis sur OK.
Les établissements attractifs ne sont plus affichés sur la carte.
Modifier le symbole attribué aux lycées.
Vous allez maintenant modifier la symbologie des points Lycées pour mieux voir où se trouvent les établissements les plus performants et les moins performants.
- Cliquez avec le bouton droit sur Lycées et sélectionnez Symbology (Symbologie).
La fenêtre Symbology (Symbologie) apparaît.
- Dans la fenêtre Symbology (Symbologie), pour Primary symbology (Symbologie principale), choisissez Graduated Colors (Couleurs graduées). Pour Field (Champ), sélectionnez Graduation Rate (Taux de réussite aux examens).
La méthode de classification par défaut est Seuils naturels.
Dans cette combinaison de couleurs, les établissements présentant les taux de réussite les plus élevés sont affichés sous forme de points bleu foncé, la couleur devenant plus claire à mesure que le taux de réussite aux examens diminue.
Le taux moyen de réussite aux examens pour les lycées était de 88,6 pour cent, quand le taux de réussite aux examens à l’échelle de l’état tout entier était de 82 pour cent en 2020. Votre organisation veut initier un programme de mentorat dans les établissements affichant un taux de réussite inférieur à la moyenne de l’état de 82 pour cent.
Vous allez maintenant modifier la symbologie pour mettre en évidence les établissements ayant un taux de réussite inférieur à 82 %.
- Dans la fenêtre Symbology (Symbologie), pour Classes, sélectionnez 2.
- Sur l’onglet Classes, dans la colonne Upper value (Valeur supérieure ), double-cliquez sur la case de la première ligne. Définissez la première valeur supérieure sur 82 et appuyez sur Entrée.
- Dans la colonne Upper value (Valeur supérieure), double-cliquez sur la case de la seconde ligne. Définissez la valeur supérieure sur 100 et appuyez sur Entrée.
- Cliquez sur le symbole de la première catégorie.
- Dans la bibliothèque des symboles, cliquez sur Circle 3 (Cercle 3).
Les établissements scolaires dont le taux de réussite est inférieur à la moyenne de l'état sont mis en évidence par cette symbologie.
Ces établissements semblent être regroupés dans le centre-nord du comté. Ceci répond en partie à la question de votre organisation — à savoir où se trouvent les lycées ayant un taux de réussite inférieur à la moyenne de l'état. Ces établissements accueilleront le programme de mentorat pour les classes de 3e. Il vous reste à déterminer quels établissements accueillant des classes de 4e participeront.
- Dans la fenêtre Contents (Contenu), activez la couche Schools (Écoles) et désactivez la couche HighSchools (Lycées).
La couche HighSchools (Lycées) comprenant les données de la table GraduationRates.csv, vous pouvez supprimer les données jointes dans la couche Schools (Écoles).
- Cliquez avec le bouton droit sur Schools, pointez le curseur de la souris sur Joins and Relates (Jointures et relations) et sélectionnez Remove All Joins (Supprimer toutes les jointures).
- Dans la fenêtre Remove Joins (Supprimer les jointures) qui apparaît, cliquez sur Yes (Oui).
Afficher l’emplacement des établissements scolaires comportant une classe de 4e
Vous allez ensuite modifier l’ensemble de définition de la couche Schools (Écoles) pour afficher les établissements accueillant une classe de 4e.
- Dans la fenêtre Contents (Contenu), double-cliquez sur Schools (Écoles).
La fenêtre Layer Properties (Propriétés de la couche) apparaît.
- Dans la fenêtre Layer Properties (Propriétés de la couche), sur l’onglet Definition Query (Ensemble de définition), pointez le curseur de la souris sur Query 1 (Requête 1) et cliquez sur le bouton Remove definition query (Supprimer l’ensemble de définition).
- Dans la fenêtre Remove definition query (Supprimer l’ensemble de définition) qui apparaît, cliquez sur Yes (Oui).
La requête est supprimée.
Vous allez à présent créer une requête pour recenser les établissements scolaires classés comme collèges ; certains établissements proposent des classes allant de la maternelle jusqu’au collège ou jusqu’au lycée et seront donc également inclus dans cette catégorie. Vous ajouterez également une clause pour limiter les résultats aux établissements publics.
Précédemment dans ce didacticiel, vous avez utilisé un opérateur And (Et) pour joindre les deux clauses de la requête, afin d’afficher les points pour lesquels la valeur du champ TYPE était High (Lycée) et la valeur du champ SCHOOL_TYP était Public School (École publique). Vous vouliez que la requête affiche uniquement les écoles répondant à ces deux critères.
Dans cette requête, vous allez utiliser les opérateurs Or (Ou) pour combiner trois clauses afin d’identifier les établissements ayant la valeur Middle Ou K-8 Ou K-12 dans le champ TYPE, puis vous utiliserez l’opérateur And (Et) pour rechercher les établissements ayant la valeur Public School pour le champ SCHOOL_TYP.
- Cliquez sur New definition query (Nouvel ensemble de définition).
Vous allez d’abord générer la requête de façon à afficher les collèges.
- Pour Query 1 (Requête 1), générez l’expression Where TYPE is equal to Middle (Où TYPE est Collège).
- Cliquez sur Add Clause (Ajouter une clause) et créez l’expression And TYPE is equal to K-8 (Et TYPE est égal à K-8).
- Cliquez sur Appliquer, puis sur OK.
La carte est mise à jour pour refléter la requête.
La table ne comprend aucun enregistrement. Quel peut être le problème ?
- Dans la fenêtre Contents (Contenu), double-cliquez sur Schools (Écoles).
La fenêtre Layer Properties (Propriétés de la couche) apparaît dans l’onglet Definition Query (Ensemble de définition).
L’origine du problème ici est une erreur de logique. La requête utilise un opérateur incorrect pour connecter les clauses. Avec l’opérateur And (Et), la requête sélectionne les établissements scolaires pour lesquels la valeur du champ TYPE est à la fois égale à Middle (Collège) et à K-8 (Maternelle-collège). Cette expression ne retourne aucun résultat, puisque les établissements scolaires ne comportent qu’une seule valeur de chaîne de texte stockée dans ce champ. Ce dernier ne peut donc pas comporter les deux valeurs à la fois.
Lorsque vous ajoutez une deuxième clause à une expression de requête dans le générateur Definition Query (Ensemble de définition), l’opérateur par défaut est And (Et) puisqu’il s'agit d’un choix habituel. Si ce champ était de type numérique, il pourrait être utile d’avoir deux clauses fonctionnant sur le même champ joint par un opérateur And (Et). Vous pouvez souhaiter par exemple afficher uniquement les établissements scolaires comptabilisant entre 100 et 300 élèves ; pour cela vous pourriez créer une requête afin de trouver les points pour lesquels StudentBody >= 100 et StudentBody <= 300.
La solution consiste à modifier la requête afin d’utiliser un opérateur Or (Ou).
- Pour Query 1 (Requête 1), cliquez sur Edit (Modifier).
- Modifiez And (Et) en Or (Ou).
- Cliquez sur Appliquer, puis sur OK.
Vous pouvez maintenant voir les établissements scolaires pour lesquels le champ TYPE est soit égal à Middle (Collège) soit égal à K-8 (Maternelle-collège). 26 établissements correspondant à cette requête.
- Ouvrez la fenêtre Layer Properties (Propriétés de la couche) pour la couche Schools (Écoles).
- Pour Query 1 (Requête 1), cliquez sur Edit (Modifier). Ajoutez une troisième clause : Or TYPE is equal to K-12 (Ou TYPE est égal à K-12).
- Cliquez sur Appliquer, puis sur OK.
Vous pouvez maintenant voir les établissements scolaires pour lesquels le champ TYPE est égal soit à Middle (Collège), soit à K-8 (Maternelle-collège) ou à K-12 (Maternelle-lycée). 26 établissements correspondant à cette requête.
Exclure les écoles privées et les écoles sous contrat public
Certains de ces établissements sont privés et certains sont de contrat public, qui comme les lycées attractifs, attirent des élèves à travers tout le district. Vous allez exclure les écoles privées et les écoles sous contrat public. Pour cela, vous allez ajouter une clause.
- Ouvrez la fenêtre Layer Properties (Propriétés de la couche) pour la couche Schools (Écoles).
- Sur l’onglet Definition Query (Ensemble de définition), pour Query 1 (Requête 1), cliquez sur Edit (Mettre à jour).
- Cliquez sur Add Clause (Ajouter une clause) et créez l’expression And SCHOOL_TYP is equal to Public School (Et SCHOOL_TYP est égal à École publique).
Cette fois, veillez à bien définir l’opérateur sur And (Et).
- Cliquez sur Appliquer, puis sur OK.
- Ouvrez la table attributaire Schools (Écoles).
Il reste 26 établissements correspondant à la requête. Ce résultat est un peu inattendu, puisque certains de ces établissements auraient dû être supprimés par la requête. Par ailleurs, la table continue de répertorier des écoles privées et sous contrat public. Que se passe-t-il ?
- Ouvrez la fenêtre Layer Properties (Propriétés de la couche) pour la couche Schools (Écoles). Pour Query 1 (Requête 1), cliquez sur Edit (Modifier).
Une partie de l’expression est mise en retrait maintenant.
- Activez le bouton de bascule SQL pour afficher la requête sous forme d’expression SQL.
Dans l’expression SQL, vous pouvez voir que les parenthèses regroupent (TYPE = 'K-12' And SCHOOL_TYP = 'Public School') ensemble.
Le problème est que en SQL, comme en arithmétique, le résultat peut varier selon l’ordre des opérations. La règle stipule que les opérateurs And (Et) sont évalués en premier, suivis par les opérateurs Or (Ou). Les parenthèses ont été ajoutées automatiquement pour indiquer que cette règle était suivie. Dans ce cas, la requête montre en réalité les établissements qui remplissent à la fois les conditions TYPE = K-12 And SCHOOL_TYP = Public School (TYPE = K-12 Et SCHOOL_TYP = Public School) ou les établissements pour lesquels TYPE = K-8 or TYPE = Middle (TYPE = K-8 Ou TYPE = Middle).
- Dans la vue SQL de l’expression, modifiez les parenthèses afin d’encadrer TYPE = 'Middle' Or TYPE = 'K-8' Or TYPE = 'K-12'.
L’expression de requête complète devrait être : (TYPE = 'Middle' Or TYPE = 'K-8' Or TYPE = 'K-12') And SCHOOL_TYP = 'Public School'
- Cliquez sur Appliquer, puis sur OK.
La requête retourne à présent uniquement les établissements publics comportant une classe de 4e.
- Ouvrez la fenêtre Layer Properties (Propriétés de la couche) pour la couche Schools.
- Pour Query 1 (Requête 1), cliquez sur Edit (Modifier). Si nécessaire, désactivez SQL.
La modification apportée au code SQL est reflétée dans le regroupement et l’indentation des clauses. Vous pouvez également modifier le regroupement des clauses dans cette vue.
- Cliquez sur la barre en regard de la clause pour sélectionner les établissements K–8, appuyez sur Ctrl et cliquez sur la barre en regard de la clause pour sélectionner les établissements Middle.
Lorsque deux clauses ou plus sont sélectionnées, les deux boutons en haut de la requête deviennent actifs. Ceci vous permet de modifier les niveaux d’indentation de façon à regrouper ou dégrouper les clauses pour contrôler l’ordre des opérations.
- Cliquez sur Cancel (Annuler) et fermez la fenêtre Layer Properties (Propriétés de la couche). Fermez la table attributaire Schools.
Afficher les établissements scolaires ensemble
Maintenant que vous avez trouvé les établissements scolaires proposant des classes de 4e, vous pouvez les afficher avec les lycées.
- Activez la couche HighSchool (Lycées).
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit sur le symbole ponctuel de la couche Schools et sélectionnez une couleur vert vif, comme Quetzal Green (Vert Quetzal).
Les écoles comportant des classes de 4e apparaissent en vert clair.
- Enregistrez le projet.
Il faut maintenant déterminer quels établissements scolaires proposant des classes de 4e doivent également obtenir des mentors. Vous pouvez sélectionner tous les établissements scolaires se trouvant dans le même secteur qu’un lycée participant. Vous pouvez sélectionner tous les établissements scolaires se trouvant à une certaine distance d’un lycée participant. Ou, vous pouvez utiliser les données démographiques pour vous aider à prendre la décision.
Vous avez identifié les lycées dont le taux de réussite aux examens est inférieur à la moyenne de l'état. Ils accueilleront le programme de mentorat pour les classes de 3e. Vous avez également utilisé un ensemble de définition pour afficher les établissements publics éligibles du district proposant des classes de 4e. Vous allez ensuite afficher et analyser certaines données démographiques pour vous aider à décider quels établissements inclure dans le programme.
Utiliser les données démographiques pour sélectionner les établissements scolaires
Vous allez maintenant ajouter certaines données démographiques à la carte pour faciliter la décision portant sur les écoles à inclure. Vous allez examiner la carte pour visualiser la relation existant entre le taux de réussite et les facteurs démographiques, puis vous utiliserez l’enrichissement des données pour quantifier le problème. Pour finir, vous allez utiliser l’enrichissement des données pour identifier les écoles comprenant des élèves de 4e pouvant participer au programme de mentorat.
Ajouter des données de l’atlas dynamique
Vous allez tout d’abord ajouter une couche contenant des données démographiques à partir de ArcGIS Living Atlas of the World.
- Dans le ruban, dans l’onglet View (Vue) du groupe Windows (Fenêtres), cliquez sur le bouton Catalog Pane (Fenêtre Catalogue).
La fenêtre Catalogue apparaît.
- Dans la fenêtre Catalog (Catalogue), cliquez sur Portal (Portail).
- Cliquez sur l’onglet Living Atlas (Atlas dynamique). Dans la barre de recherche, saisissez ACS et appuyez sur Entrée.
ACS signifie American Community Survey, un projet démographique et de logement basé sur un échantillon de données annuelles du bureau du recensement américain.
Remarque :
Pour plus d‘informations sur les données ACS dans ArcGIS Living Atlas, reportez-vous à la rubrique Recensement et ACS.
Il y a de nombreuses couches ACS. Vous allez affiner la requête de recherche pour en trouver une spécifique.
- Dans la barre de recherche, saisissez ACS poverty et appuyez sur Entrée.
- Cliquez avec le bouton droit sur ACS Poverty Status Variables - Boundaries et sélectionnez Add To Current Map (Ajouter à la carte actuelle).
Les polygones correspondent à des secteurs de recensement. Les secteurs plus petits tendent à être situés dans les zones urbaines présentant les densités de population les plus élevées.
Sur la carte, les couleurs les plus foncées représentent les zones ayant les taux de pauvreté les plus élevés. Les écoles ayant un faible taux de réussite semblent se trouver dans les petits secteurs urbains situés près du centre du comté, et affichant un fort taux de pauvreté.
- Sur la carte, cliquez sur l’un des secteurs à proximité d’un point rouge.
La fenêtre contextuelle du secteur apparaît. La fenêtre contextuelle montre le numéro de secteur, le nombre de personnes vivant dans le secteur, le nombre de personnes vivant sous la limite fédérale fixant le seuil de pauvreté, et le nombre d’enfants vivant dans la pauvreté.
L’histogramme montre la répartition de la population par groupes d’âges (les groupes d’individus les plus jeunes à gauche et les plus âgés à droite).
La fenêtre contextuelle révèle le nombre d’enfants vivant dans la pauvreté de ce secteur et indique qu’une part importante de la population totale de ce secteur vit dans la pauvreté.
- Cliquez sur un secteur de couleur clair près de la limite ouest du comté.
La fenêtre contextuelle révèle que dans ce secteur de recensement, relativement peu d’enfants vivent dans la pauvreté et qu’une petite partie de la population totale de ce secteur vit dans la pauvreté.
Selon l’examen de ces deux secteurs, l’école présentant un faible taux de réussite se trouve dans une zone avec un taux de pauvreté élevé, contrairement à la zone dans laquelle se trouve l’école présentant un taux de réussite supérieur. Plusieurs écoles ayant un taux de réussite élevée sont toutefois situées dans des zones présentant un taux de pauvreté élevé.
L’observation de deux points seulement ne permet pas de conclure qu’il existe une corrélation entre le taux de pauvreté et le taux de réussite aux examens. Vous allez maintenant utiliser l’outil Enrichir pour examiner plus en détail les attributs dans les zones ayant des taux de réussite élevés et faibles.
- Fermez la fenêtre contextuelle.
- Enregistrez le projet.
Ajouter les données démographiques aux secteurs scolaires
Pour examiner les facteurs susceptibles de contribuer aux faibles taux de réussite, vous pouvez aussi synthétiser les données démographiques par secteur scolaire. Ceci permettra d’effectuer une comparaison quantitative.
- Cliquez sur l’onglet Analysis (Analyse), et dans la section Tools (Outils), cliquez sur l’outil Enrich (Enrichir).
La fenêtre Geoprocessing (Géotraitement) s’ouvre sur l’outil Enrichir. Cet outil permet d’ajouter aux entités des informations démographiques à partir de ArcGIS Online.
- Dans la fenêtre Geoprocessing (Géotraitement), pour Input features (Entités en entrée), sélectionnez AttendanceZones.
Vous allez utiliser le nom en sortie par défaut, AttendanceZones_Enrich.
- Pour Variables, cliquez sur le bouton d’ajout.
La fenêtre Data Browser (Navigateur de données) s’ouvre.
- Dans la fenêtre Data Browser (Navigateur de données), double-cliquez sur Education (Enseignement).
- Double-cliquez sur le dossier Education Attainment.
- Sous 2023 Educational Attainment (Niveau d’éducation 2023) (Esri), cochez la case 2023 Pop Age 25+: High School/No Diploma (Population +25 ans 2023 : Lycée/Non diplômé). Cliquez sur le bouton de pourcentage (%) pour ajouter le pourcentage d’adultes ayant suivi une éducation secondaire sans obtenir de diplôme et cliquez sur le bouton de nombre (#) pour le désélectionner.
Remarque :
Les données sont mises à jour régulièrement. Utilisez les données les plus récentes disponibles.
- Dans la fenêtre latérale, cliquez sur Categories (Catégories), puis double-cliquez sur Income (Revenu).
- Double-cliquez sur Household Income (Revenu des ménages).
- Sous 2023 Income (Revenu 2023) (Esri), cochez la case 2023 Median Household Income (Revenu médian des ménages 2023).
Les groupes de variables 2023 Income (Revenu 2023) (Esri) et 2023 Educational Attainment (Niveau d’éducation 2023) (Esri) sont des estimations pour l’année en cours compilées par les démographes Esri à partir des données de recensement les plus récentes et d’autres sources de données. Ils sont continuellement mis à jour avec les informations les plus récentes.
Quelles autres variables démographiques peuvent être utiles pour cette analyse ? Vous pouvez parcourir les différentes catégories ou rechercher d’autres mots-clés. Au cours de ce didacticiel, vous allez uniquement utiliser les deux variables que vous avez choisies.
- Cliquez sur OK.
Les variables sont ajoutées à la fenêtre de l’outil Enrichir.
Remarque :
L’outil Enrich (Enrichir) consomme des crédits en fonction du nombre d’entités enrichies et du nombre de variables ajoutées (1 crédit pour 100 entités-variables). Si vous ajoutez des variables démographiques supplémentaires, l’outil consommera 0,08 crédits par variable additionnelle.
- Dans la fenêtre Geoprocessing (Géotraitement), cliquez sur Estimate Credits (Estimer les crédits) pour connaître le nombre de crédits que cet outil va consommer. Cliquez sur Run (Exécuter).
L’outil s’exécute. La nouvelle couche AttendanceZones_Enrich contient les informations des secteurs scolaires, ainsi que les données des deux variables démographiques que vous avez ajoutées.
Joindre les lycées aux secteurs scolaires
Les secteurs scolaires ont désormais des attributs que vous pouvez utiliser pour quantifier les différences existant entre les secteurs scolaires présentant un taux de réussite plus élevé et les secteurs où le taux de réussite est inférieur. Les secteurs scolaires n’ont pas de taux de réussite, mais vous pouvez utiliser une jointure spatiale pour ajouter ces informations à partir de la couche HighSchools (Lycées).
- Dans la fenêtre Géotraitement, cliquez sur le bouton Retour.
- Dans la zone de recherche, saisissez Jointure spatiale. Dans la liste des résultats, cliquez sur l’outil Jointure spatiale.
L’outil Spatial Join (Jointure spatiale) apparaît.
- Pour Target Features (Entités cible), sélectionnez AttendanceZones_Enrich
Les valeurs des écoles de ces entités seront ajoutées aux attributs de ces entités.
- Pour Join Features (Entités jointes), sélectionnez Lycées et acceptez les autres valeurs par défaut.
Le paramètre Join Operation (Opération de jointure) doit être défini sur Join one to one (Joindre un vers un), puisqu’il existe autant de lycées que de secteurs.
Puisque la couche Lycées comporte un filtre, seules les entités qui apparaissent seront traitées.
- Cliquez sur Run (Exécuter).
L’outil s’exécute et la couche AttendanceZones__SpatialJoin est créée. Ses polygones ont désormais les attributs (y compris le taux de réussite) des points Lycées. Si les secteurs avaient contenu le code de l’école, ceci aurait pu être effectué à l’aide d’une jointure de table, mais les polygones des secteurs scolaires ne comportaient pas de champ avec cette valeur.
Calculer une valeur à l’aide de Python
Vous avez ajouté précédemment une variable nommée Under82 à la couche HighSchools (Lycées). En raison de la jointure spatiale, cette variable figure désormais également dans la table attributaire de la couche AttendanceZones__SpatialJoin. Vous allez à présent ajouter des valeurs dans ce champ afin de faciliter la représentation graphique des données démographiques.
Vous utiliserez un calcul de champ pour définir les valeurs de ce champ sur Above (Supérieur) ou Below (Inférieur). Vous pouvez procéder de la même façon que vous l’avez fait pour définir la variable Magnet (Attractif) précédemment. Une méthode plus rapide dans le cas présent, puisqu’il existe déjà un champ Graduation Rate (Taux de réussite) contenant les informations pertinentes, consiste à créer une fonction Python et à l’utiliser dans le calcul pour ajouter Above lorsque les valeurs sont supérieures et Below lorsqu’elles sont inférieures.
- Ouvrez la table attributaire pour AttendanceZones_SpatialJoin, cliquez avec le bouton droit sur Sous82, puis sélectionnez Calculate Field (Calculer un champ).
La fenêtre Calculate Field (Calculer un champ) apparaît.
- Copiez l’extrait de script suivant et collez-le dans la zone Code Block (Bloc de code) :
def classify_school(gradrate): if gradrate >= 82: return "Above" if gradrate < 82: return "Below"
Ce script est une fonction Python. Une fonction est un bloc de code qui effectue une tâche. Dans le cas présent, la tâche consiste à contrôler les valeurs d’un champ, et à attribuer des valeurs à un autre champ. Les fonctions commencent par def, pour définir une fonction.
Le nom de la fonction est classify_school, et elle intègre un paramètre, nommé gradrate, entre parenthèses après le nom de la fonction. Après le nom et le paramètre, les deux-points indiquent que le code suivant sera exécuté par la fonction.
Les lignes qui suivent sont indentées par quatre (ou huit) espaces. La cohérence de l’indentation est importante dans Python, car cela définit quelles lignes vont ensemble et quand elles sont exécutées.
La fonction comporte deux branches conditionnelles, spécifiées par les instructions if.
Si la valeur du paramètre gradrate que reçoit la fonction est supérieure ou égale à 82, la valeur de chaîne Above est renvoyée.
Si la valeur du paramètre gradrate que reçoit la fonction est inférieure à 82, la valeur de chaîne de chaîne Below est renvoyée.
- Au-dessus de la zone Code Block (Bloc de code), pour Under82 =, saisissez classify_school().
- Cliquez entre les parenthèses. Dans la liste Fields (Champs), double-cliquez sur Taux de réussite aux examens.
Ceci ajoute le nom du champ en tant que paramètre à la fonction. Elle a l’aspect suivant :
classify_school(!GradRate!)
Remarque :
Le véritable nom du champ est inséré, et non pas l’alias de champ (Taux de réussite). Le nom de champ est entouré de points d'exclamation.
Lorsque l’outil est exécuté, le code de la zone Expression est exécuté pour le champ Under82 pour chaque ligne de la table. Ce code appelle la fonction classify_schools que vous avez définie dans la zone Code Block (Bloc de code). Pour chaque ligne, il contrôle si la valeur dans GradRate est supérieure ou inférieure à 82 et met à jour la valeur du champ Under82 avec le résultat renvoyé par la fonction.
- Dans la zone Code Block (Bloc de code), cliquez sur la fin de la dernière ligne de code et appuyez sur Entrée.
La mise en surbrillance jaune disparaît, indiquant que le code s’est exécuté.
- Cliquez sur OK.
Dans la table attributaire, le champ Sous82 affiche maintenant les valeurs Above (Supérieur) et Below (Inférieur) conformément au code Python.
Dans le cas présent, seules quelques entités et valeurs doivent être mises à jour, il n’aurait donc pas fallu beaucoup plus de temps pour calculer ces valeurs à l’aide d’une sélection manuelle ou de l’outil Select by Attribute (Sélectionner selon les attributs). Cependant, lorsque le nombre de valeurs différentes que vous souhaitez calculer et le nombre de conditions sont plus élevés, les expressions Python peuvent vous faire gagner du temps.
- Enregistrez le projet.
Représenter les résultats dans un graphique
Maintenant que vous disposez des secteurs scolaires, données démographiques, taux de réussite et catégories Above (Supérieur) ou Below (Inférieur) pour les mêmes entités, vous pouvez étudier les relations existant entre les variables. La création d'un diagramme est un bon moyen de le faire.
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit sur AttendanceZones__SpatialJoin, pointez le curseur sur Create Chart (Créer un diagramme) et sélectionnez Bar Chart (Diagramme à barres).
Le volet Chart Properties (Propriétés du diagramme) apparait.
- Dans la fenêtre Chart Properties (Propriétés du diagramme), pour Category or Date (Catégorie ou date), sélectionnez NAME.
- Sous Numeric field(s) (Champ(s) numérique(s)), cliquez sur Select (Sélectionner). Sélectionnez 2023 Median Household Income (Revenu médian des ménages 2023) et cliquez sur Apply (Appliquer).
Le diagramme est mis à jour.
Le revenu médian des ménages varie entre les différents secteurs scolaires d’éducation secondaire.
- Dans la fenêtre Chart Properties (Propriétés du diagramme), cliquez sur l’onglet General (Général). Pour Chart title (Titre du diagramme), saisissez Revenu moyen des ménages par secteur scolaire.
- Dans la fenêtre Chart (Diagramme), cliquez sur le bouton Export (Exporter) et sélectionnez Export As Graphic (Exporter sous forme de graphique).
La fenêtre Export (Exporter) s’affiche.
- Enregistrez l’image du diagramme sur votre ordinateur en tant que fichier Median_HH_Income_by_Attendance Zone au format .png.
Vous pouvez ajouter cette image à un document de rapport ou une présentation.
- Dans la fenêtre Chart Properties (Propriétés du diagramme), cliquez sur l’onglet Data (Données). Pour Split by (optional) (Fractionner en (facultatif)), choisissez Under82.
Le diagramme est actualisé pour afficher chaque école en fonction de la valeur du champ Under82.
Lorsque vous fractionnez les valeurs selon que le secteur scolaire se situe au-dessus ou au-dessous du taux de 82 pour cent de réussite, vous pouvez voir que le taux de réussite est d’une certaine façon inférieur lorsque le revenu moyen des ménages est bas. Le point de rupture semble être lorsque le revenu moyen des ménages se situe autour de 55 000 $. Vous pourriez exporter une image de ce diagramme afin de l’utiliser dans une présentation.
- Fermez la vue de diagramme et la table attributaire.
- Dans la fenêtre Contents (Contenu), décochez la couche ACS Poverty Status Variables - Boundaries (Variables de statut de pauvreté ACS - Seuils).
Maintenant que vous avez établi la relation entre revenu moyen et taux de réussite, vous allez utiliser l’enrichissement des données pour rechercher les écoles ayant des classes de 4e dans les zones où le revenu moyen des ménages est faible. Le revenu ne semble pas être le seul facteur ici, puisque deux écoles affichant un taux de réussite supérieur à 82 pour cent se trouvent également dans un secteur scolaire où le revenu médian des ménages est relativement faible. Vous pourriez explorer l’impact d’autres variables démographiques et utiliser une ou plusieurs variables supplémentaires pour prendre votre décision.
Enrichir dans une distance donnée
Une façon de rechercher les écoles comportant des classes de 4e et situées dans un secteur où le revenu médian des ménages est faible, pourrait être de choisir celles qui se trouvent dans le même secteur scolaire d'éducation secondaire que les lycées sélectionnés. Toutefois, la taille des secteurs scolaires est grande et ils peuvent contenir plusieurs quartiers ayant des caractéristiques différentes. Les établissements de type collège, maternelle-collège, maternelle-lycée sont de plus petite taille que les lycées et leur secteur d’influence est plus limité. Puisque vous ne disposez pas de polygones représentant les secteurs scolaires pour ces écoles, vous allez définir leur voisinage approximatif en spécifiant une distance de recherche dans l’outil Enrichir.
- Sur le ruban, cliquez sur l’onglet Analyse. Dans le groupe Tools (Outils), cliquez sur l’outil Enrichir.
- Dans la fenêtre de l’outil Enrichir, pour Input features (Entités en entrée), sélectionnez Schools.
Vous allez accepter le nom en sortie par défaut, Schools_Enrich.
- Pour Variables, cliquez sur le bouton d’ajout.
La fenêtre Data Browser (Navigateur de données) s’ouvre.
- Dans la fenêtre Data Browser (Navigateur de données), sur la barre de recherche, saisissez Median household income et appuyez sur Entrée.
- Cochez la case 2023 Median Household Income (Revenu médian des ménages 2023) et cliquez sur OK.
- Dans la fenêtre de l’outil Enrich (Enrichir), vérifiez que le paramètre Distance or time (Distance ou temps) est défini sur 1 et Units (Unités) sur Miles.
- En haut de la fenêtre de l’outil, cliquez sur Estimate credits (Estimer les crédits). Cliquez sur Run (Exécuter).
L’outil s’exécute et synthétise le revenu médian des ménages dans un rayon d’un mile (1,6 km) autour de chaque école ; ces données seront ajoutées à la table Schools en sortie.
L’utilisation d’un rayon d’un mile autour des points donne une surface d’échantillon de 3,14 miles carrés (8,13 Km carrés). Cette surface est plus importante que la surface de deux milles carrés minimum recommandée pour l’utilisation de l’outil Enrich (Enrichir) sur une surface. Les surfaces de plus petite taille comporteront des résultats moins fiables.
L’outil Enrich (Enrichir) vous permet également de synthétiser les données démographiques à l’aide de zones de déplacement à pied ou de trajet en voiture autour des points. Vous pouvez ainsi obtenir les données démographiques des zones se trouvant à 10 minutes de marche ou à 15 minutes de trajet en voiture de chaque école. Pour ce didacticiel, un simple cercle est suffisant.
Rechercher les écoles dans les zones où le revenu médian des ménages est faible
Vous allez symboliser les écoles en fonction des valeurs de revenu que vous venez d’ajouter et vous sélectionnerez les écoles pour le programme de mentorat de 4e.
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit sur Schools_Enrich et sélectionnez Symbology (Symbologie).
- Dans la fenêtre Symbology (Symbologie), pour Symbology (Symbologie), choisissez Graduated Symbols (Symboles gradués).
- Pour Field (Champ), sélectionnez 2023 Median Household Income (Revenu médian des ménages 2023).
La symbologie de la couche Schools_Enrich est actualisée.
Les cercles de petite taille représentent les revenus médians faibles près d’une école, les cercles de plus grande taille, représentent les revenus médians plus élevés. La plupart des écoles se trouvant dans un rayon d’un mile (1,6 Km) d’une zone à faible revenu médian des ménages sont également proches des trois lycées dont le taux de réussite est inférieur à 82 pour cent.
Vous allez maintenant sélectionner les écoles comportant des classes de 4e pour le programme. Puisque le point de rupture entre les lycées avec un taux de réussite supérieur à 82 pour cent et ceux inférieurs à 82 pour cent se situait autour de 55 000 USD, vous allez utiliser la même valeur de revenu médian des ménages comme critère de sélection des écoles qui comprennent des classes de 4e.
- Sur le ruban, cliquez sur l’onglet Map (Carte). Dans le groupe Selection (Sélection), cliquez sur Select By Attributes (Sélectionner selon les attributs).
- Dans la fenêtre Select By Attributes (Sélectionner par attributs), pour Input Rows (Lignes en entrée), sélectionnez Schools_Enrich.
- Sous Expression, créez l’expression Où 2023 Median Household Income est inférieur ou égal à 55 000.
- Cliquez sur OK.
Les écoles sont sélectionnées.
- Ouvrez la table attributaire de la couche Schools_Enrich.
Les écoles sélectionnées sont mises en surbrillance dans la table. La valeur TYPE est égale à Middle pour cinq écoles et à K-8 pour deux écoles.
- Sur l’en-tête de la table, cliquez sur le bouton Copy Selection (Copier la sélection).
Vous pouvez coller les lignes sélectionnées dans une feuille de calcul ou un document texte pour enregistrer les écoles que vous avez choisies. Vous pouvez également enregistrer les entités sélectionnées dans une nouvelle couche, ou calculer une valeur de champ pour indiquer que ces écoles ont été sélectionnées pour le programme. Vous pouvez également effectuer une sélection par attribut sur la couche HighSchools (Lycées) et copier ces lignes dans votre document.
- Enregistrez le projet.
Dans ce didacticiel, vous avez préparé des données pour analyse, utilisé des ensembles de définition pour sélectionner les bonnes entités à afficher, joint des tables, calculé des valeurs, et symbolisé et représenté les données dans un graphique, joint des couches spatialement, et sélectionné des entités par attribut pour exécuter une requête sur des valeurs spécifiques. Vous avez utilisé une fonction Python pour automatiser la classification des valeurs d’un champ en classes dans un autre champ. Vous avez également utilisé ArcGIS Living Atlas et l’outil Enrich (Enrichir) pour ajouter des données démographiques à votre projet afin de vous aider dans votre prise de décision.
Vous trouverez d’autres didacticiels dans la bibliothèque des didacticiels.