Préparer les données
Pour prendre des décisions avisées en matière de protection de la forêt, vous allez identifier les régions qui partagent des caractéristiques bioclimatiques communes.
Explorer le projet
Vous allez commencer par télécharger les données du didacticiel.
- Téléchargez le paquetage de projet IdentifyRegions.ppkx et localisez le fichier téléchargé sur votre ordinateur.
Remarque :
La plupart des navigateurs Web téléchargent les fichiers dans le dossier Téléchargements de votre ordinateur, par défaut. - Double-cliquez sur le paquetage de projet IdentifyRegions.ppkx.
Les paquetages de projet vous permettent de partager des projets et données ArcGIS Pro. Ce sont des fichiers compressés qui, une fois ouverts, extraient une copie du projet dans votre dossier C:\Users\[user name]\Documents\ArcGIS\Packages.
Le paquetage de projet est extrait et le projet s’ouvre sur une carte qui illustre un fond de carte et le contour de la forêt nationale d’El Yunque.
La forêt nationale d’El Yunque se trouve dans la partie est de Puerto Rico.
Télécharger les données bioclimatiques
Le jeu de données des variables bioclimatiques CHELSA (Climatologies at high resolution for the earth’s land surface areas) est un jeu de données climatique mondial haute résolution qui permet de modéliser la répartition des espèces. Vous allez télécharger un raster d’une variable qui peut être utile à votre analyse.
- Dans un navigateur, accédez à la page CHELSA Bioclim.
- Lisez la description du jeu de données Bioclim.
Remarque :
Lorsque vous envisagez d’utiliser une couche de données, il est important d’étudier sa description, qui fournit des informations importantes sur le contexte, notamment qui les a compilées, comment elles ont été collectées, pour quel usage elles sont destinées et s’il y a des contraintes d’utilisation ou qui peut les utiliser.Vous pouvez utiliser les données CHELSA à condition de mentionner la publication et le jeu de données d’origine.
- Accédez à la table de description des couches.
Cette table qui fournit des informations sur chacune des couches vous aide à déterminer quelles couches utiliser.
La couche bio1 contient des données sur la température de l’air annuelle moyenne. Cela peut être utile pour identifier des régions dans votre forêt.
50 couches sont documentées dans cette table. Les 19 couches dont le préfixe est bio présentent un intérêt pour ce didacticiel. Selon les détails de votre travail de conservation, vous allez choisir différentes combinaisons de couches.
- Au-dessus de la table, cliquez sur le lien de téléchargement THE LAYERS CAN BE DOWNLOADED HERE (LES COUCHES PEUVENT ÊTRE TÉLÉCHARGÉES ICI).
La page S3 File Browser (Explorateur de fichiers S3) s’ouvre. Quatre dossiers sont affichés. Le premier dossier comporte des données historiques pour la période comprise entre 1981 et 2010. Les trois autres dossiers contiennent des données projetées produites à l’aide de modèles climatiques différents.
- Sur la page S3 File Browser (Explorateur de fichiers S3), cliquez sur le bouton de développement en regard du dossier 1981-2010/.
Le dossier se développe.
- Cliquez sur le bouton de développement en regard du dossier bio/.
- Recherchez le fichier dont le nom contient _bio1_ et cliquez sur le bouton de téléchargement correspondant au fichier CHELSA_bio1_1981-2010.V.2.1.tif.
Le fichier CHELSA_bio1_1981-2010.V.2.1.tif est téléchargé sur votre ordinateur. La taille du fichier est de 110 Mo.
Selon la table que vous avez examinée précédemment, ce fichier est un jeu de données raster de la température de l’air annuelle moyenne pour la période comprise entre 1981 et 2010.
Vous allez découper et échantillonner ce fichier afin d’obtenir des données pour votre forêt.
Dans le cadre de ce didacticiel, il n’est pas nécessaire de télécharger d’autres fichiers de données bioclimatiques. Ils ont été téléchargés et découpés et sont stockés dans le projet pour que vous puissiez les utiliser ultérieurement.
Ajouter les données au projet
Maintenant que vous avez téléchargé les données sur la température de l’air, vous allez les ajouter au projet.
- Dans ArcGIS Pro, sur le ruban, cliquez sur l’onglet Map (Carte) et dans la section Layer (Couche), cliquez sur Add Data (Ajouter des données).
- Dans la fenêtre Add Data (Ajouter des données), développez Computer (Ordinateur), développez This PC (Ce PC) et cliquez sur Downloads (Téléchargements).
Si votre navigateur est configuré pour télécharger des fichiers dans un autre emplacement, localisez le fichier dans Microsoft File Explorer et accédez à l’emplacement en question dans la fenêtre Add Data (Ajouter des données).
- Cliquez sur le jeu de données raster CHELSA_bio1_1981-2010.V.2.1.tif et sur OK.
Un message vous demandant si vous souhaitez calculer les statistiques du raster s’affiche.
- Cliquez sur Oui.
La couche CHELSA_bio1_1981-2010_V.2.1.tif apparaît sur la carte.
La couche dispose d’une étendue mondiale, mais cette partie est principalement blanche. Elle couvre le fond de carte qui était visible auparavant. Vous voyez le polygone de limite de la forêt et certains pixels gris clair à l’intérieur de la forêt.
Si vous examinez la plage Value (Valeur) de la couche, vous voyez que les cellules dans ce raster ont des valeurs comprises entre 2 196 et 3 079, dont les valeurs élevées apparaissent en nuances de gris plus claires.
Si vous consultez la table qui décrit les données, vous voyez que les données ont un facteur d’échelle et un décalage.
En convertissant selon ces informations (multiplier par la valeur d’échelle 0,1 et soustraire 273,15), les valeurs du raster sont converties en degrés Celsius, dans une plage comprise entre -53,55 et 34,75.
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit sur la couche CHELSA_bio1_1981-2010.V.2.1.tif et sélectionnez Zoom to Layer (Zoom sur la couche).
La carte affiche la vue générale de la couche.
Vous voyez que les régions équatoriales sont de couleur claire, avec des valeurs de température élevées et que les pôles sont plus foncés, avec des valeurs de températures plus faibles. La limite du parc apparaît sous la forme d’une petite parcelle foncée.
Il est recommandé d’explorer les données que vous téléchargez afin de savoir si elles conviennent à votre analyse.
- Dans la fenêtre Contents (Contenu), cliquez à l’aide du bouton droit sur la couche boundary (limite) et sélectionnez Zoom To Layer (Zoom sur la couche).
Vous avez téléchargé et exploré la couche CHELSA_bio1_1981-2010.V.2.1.tif. Il semble qu’elle va être utile à votre analyse.
Découper le raster
Comme vous n’avez pas besoin de l’étendue entière des données pour votre travail sur la forêt, vous allez découper les données en utilisant la limite de la forêt.
- Sur le ruban, cliquez sur l’onglet Analysis (Analyse), puis, dans la section Geoprocessing (Géotraitement), cliquez sur Tools (Outils).
La fenêtre Geoprocessing (Géotraitement) s’affiche.
- Dans la fenêtre Geoprocessing (Géotraitement), dans la zone de recherche, saisissez découper le raster et dans les résultats, cliquez sur l’outil Clip Raster (Découper le raster).
- Dans l’outil Clip Raster (Découper le raster), pour Input Raster (Raster en entrée), choisissez la couche CHELSA_bio1_1981-2010.V.2.1.tif.
- Pour Output Extent (Étendue en sortie), sélectionnez la couche boundary (limite).
L’outil découpera le raster en entrée selon la vue générale de la couche d’entités de limite, sauf si vous indiquez qu’il doit utiliser les entités de la couche pour le découpage.
- Cochez la case Use Input Features for Clipping Geometry (Utiliser les entités en entrée pour la géométrie de découpage).
Cette opération découpe le raster selon la limite de la forêt.
Le nom Output Raster Dataset (Jeu de données raster en sortie) est par défaut la première partie du nom du raster d’origine avec _Clip ajouté à la fin. Le raster est enregistré dans la géodatabase de votre projet.
- Cliquez sur Run (Exécuter).
Le raster est découpé et la couche CHELSA_bio1_19812010_V_Clip est ajoutée à la carte.
Comme le raster découpé contient une plage de valeurs différente de celle d’origine, la symbologie de la couche est différente et le dégradé de couleurs expose plus clairement la plage des valeurs dans la forêt.
Comme vous n’avez plus besoin du raster d’origine avec la vue générale mondiale, vous allez le supprimer.
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit sur la couche CHELSA_bio1_1981-2010.V.2.1.tif et sélectionnez Remove (Supprimer).
Remarque :
Pour gagner du temps et réduire la taille de téléchargement des données du didacticiel, les rasters des autres variables bioclimatiques ont été découpées pour vous. Si vous deviez le faire vous-même, vous pourriez ouvrir l’outil Clip Raster (Découper le raster) en mode par lots en recherchant l’outil, en cliquant avec le bouton droit et en sélectionnant Batch (Par lots). Dans la fenêtre de configuration de l’outil Par lots, le paramètre de traitement par lots serait Input Raster (Raster en entrée). Vous devriez alors cliquer sur Next (Suivant) pour ouvrir l’outil Batch Clip Raster (Découper le raster par lots). Vous pourriez ensuite ajouter tous les rasters en entrée pour Batch Input Raster (Raster en entrée par lots) et configurer le reste des paramètres d’outil comme vous l’avez fait pour l’outil Clip Raster (Découper le raster). L’exécution de l’outil découperait chaque raster selon l’étendue de la forêt.
Générer des points d’échantillonnage
L’étape suivante consiste à créer un ensemble de points à partir du raster. Cela vous permet de combiner les données de plusieurs rasters de façon à autoriser la visualisation et l’analyse d’agrégation multivariée. Vous allez utiliser l’outil Raster to Point (Raster vers points) pour créer un ensemble de points aux centres des cellules, avec les valeurs raster en tant qu’attribut.
- Dans l’outil Clip Raster (Découper le raster) cliquez sur le bouton Back (Retour).
- Dans la fenêtre Geoprocessing (Géotraitement), dans la zone de recherche, saisissez raster vers points et dans les résultats, cliquez sur l’outil Raster to Point (Raster vers points).
- Dans l’outil Raster to Point (Raster vers points), pour Input Raster (Raster en entrée), choisissez la couche CHELSA_bio1_19812010_V_Clip.tif.
- Pour Field (Champ), acceptez la valeur par défaut de Value (Valeur).
- Pour Output point features (Entités ponctuelles en sortie), entrez points_bioclimatiques.
- Cliquez sur Run (Exécuter).
La couche bioclimate_points (points_bioclimatiques) est ajoutée à la carte.
Vous allez utiliser cette couche pour échantillonner les rasters bioclimatiques. Ces derniers ont été préparés pour vous et se trouvent sur la carte Sample rasters (Rasters d’échantillonnage). Vous allez copier les points que vous venez de créer, puis passer à la carte contenant les rasters.
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit sur la couche bioclimate_points (points_bioclimatiques) et choisissez Copy (Copier).
- Dans la fenêtre cartographique, cliquez sur l’onglet de la carte Sample rasters (Rasters d’échantillonnage).
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit sur Sample rasters (Rasters d’échantillonnage) et choisissez Paste (Coller).
Cette nouvelle carte comporte un groupe de couches BioclimateRasters qui contient une version découpée de chacun des 19 rasters bioclimatiques CHELSA.
Le groupe de couches est configuré avec des options qui vous permettent de passer d’un raster à un autre. Pour plus d’informations, reportez-vous à la rubrique Utiliser les groupes de couches.
Valeurs des rasters d’échantillonnage
Maintenant que vous avez créé des points aux centres des cellules raster, vous allez exécuter l’outil Sample (Échantillon), qui vous permettra de générer des valeurs à partir de chacun des rasters vers ces points.
- Dans l’outil Raster to Point (Raster vers points) cliquez sur le bouton Back (Retour).
- Dans la fenêtre Geoprocessing (Géotraitement), dans la zone de recherche, saisissez échantillon et dans les résultats, cliquez sur l’outil Sample (Échantillon).
- Pour Input rasters (Rasters en entrée), cliquez sur le bouton Add Many (Ajouter plusieurs).
- Cochez la case pour tous les sélectionner.
- Cliquez sur Add (Ajouter).
- Pour Input location raster or features (Raster de localisation ou entités en entrée), sélectionnez bioclimate_points (points_bioclimatiques).
Chaque point de la couche bioclimate_points (points_bioclimatiques) sera utilisé pour échantillonner chacune des valeurs raster à cette localisation.
- Pour Output table or feature class (Table ou classe d'entités en sortie), saisissez Sample_vals.
- Acceptez les valeurs par défaut pour Resampling technique (Technique de rééchantillonnage) et Unique ID field (Champ d’ID unique).
- Cliquez sur Run (Exécuter).
La table Sample_vals est insérée dans la fenêtre Contents (Contenu) dans la section Standalone Tables (Tables autonomes).
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit sur la table Sample_vals et cliquez sur Open (Ouvrir).
- Examinez la table.
Les noms de champ découlent des noms des couches raster. Ils contiennent les informations permettant d’identifier les variables bioclimatiques dont vous avez besoin, mais ils pourraient être plus clairs.
Vous allez attribuer un alias plus compréhensible à un champ afin de faciliter l’interprétation des données.
Définir un alias de champ
Lorsque certains noms de champ sont difficiles à comprendre, vous pouvez attribuer des alias pour faciliter leur utilisation. La page de description CHELSA Bioclim comprenait une table avec des champs à nom court et long. Vous pouvez utiliser cette table pour savoir à quelles variables bioclimatiques les codes (par exemple bio1, bio2, bio3, etc.) correspondent et utiliser ces noms comme alias de champ.
- Dans un navigateur, accédez à la page CHELSA Bioclim.
- Examinez la table de description des couches.
- Dans la fenêtre Contents (Contenu), dans la section Standalone Tables (Tables autonomes), cliquez avec le bouton droit sur la table Sample_vals, pointez sur Data Design (Conception de données) et sélectionnez Fields (Champs).
La fenêtre Fields design (Conception de champs) s’affiche.
- Cliquez dans la colonne Alias correspondant à la variable _bio1_.
D’après la table de la page Web CHELSA Bioclim, la variable _bio1_ correspond à la température de l’air annuelle moyenne.
- Dans la colonne Alias de la variable _bio1_, saisissez température_air_annuelle_moyenne.
Vous pouvez utiliser cette méthode pour mettre à jour les alias de chaque champ. Cependant, il n’est pas nécessaire de définir les alias de tous les champs pour ce didacticiel. Pour gagner du temps, une couche que vous utiliserez plus tard a été préparée.
- Sur le ruban, dans l’onglet Standalone Table (Table autonome), dans la section Manage Edits (Gérer les mises à jour), cliquez sur Save (Enregistrer).
Le nom de la colonne est actualisé dans la table.
Joindre la table d’échantillonnage aux points
La dernière étape pour générer les données bioclimatiques sur des entités ponctuelles à des fins d’analyse consiste à joindre la table que vous avez créée aux points que vous avez générés depuis les centres des cellules.
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit sur bioclimate_points (points_bioclimatiques), pointez sur Joins and Relates (Jointures et relations), puis cliquez sur Add Join (Ajouter une jointure).
L’outil Add Join (Ajouter une jointure) s’ouvre.
- Dans l’outil Add Join (Ajouter une jointure), pour Input Field (Champ en entrée), sélectionnez OBJECTID.
L’outil détecte une table autonome dans le contenu et l’ajoute au paramètre Join Table (Table de jointure). Il détecte également que la table comporte un champ nommé OBJECTID et le définit comme Join Field (Champ de jointure) par défaut.
Ces entrées étant correctes, l’outil est maintenant prêt à s’exécuter. Si vous avez d’autres tables ou si vous voulez les joindre sur d’autres champs, vous pouvez les modifier.
- Cliquez sur OK.
- Cliquez avec le bouton droit de la souris sur la couche bioclimate_points (points_bioclimatiques) et sélectionnez Attribute Table (Table attributaire).
La couche ponctuelle dispose désormais des attributs de la table Sample_vals.
La table affiche l’alias que vous avez défini pour le champ mean_annual_air_temperature (température_air_annuelle_moyenne).
Les données sont maintenant prêtes à être explorées et analysées pour identifier des régions.
Vous avez téléchargé des données bioclimatiques, vous les avez découpées sur votre zone d’intérêt, vous avez créé des points d’échantillonnage à partir des centres des cellules, vous avez échantillonné plusieurs rasters bioclimatiques sur une table, vous avez défini un alias et vous avez joint la table à vos points. Vous allez ensuite explorer les données préparées.
Identifier des variables
Maintenant que vous avez préparé les données bioclimatiques, il est temps d’explorer les variables.
Créer un diagramme de matrice de nuages de points
Un diagramme de matrice de nuages de points est idéal pour comparer des paires de variables lorsque vous devez prendre en compte plusieurs variables numériques. Vous allez créer une matrice de nuages de points des variables bioclimatiques afin d’explorer leurs relations.
- Dans la fenêtre cartographique, cliquez sur l’onglet de la carte Identify variables (Identifier des variables).
La carte Identify variables (Identifier des variables) présente la couche de limite de la forêt et une couche nommée sample_locations (localisations_exemple). La couche sample_locations (localisations_exemple) comporte les données d’échantillonnage des variables bioclimatiques avec des noms de champ et des alias descriptifs.
- Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit de la souris sur la couche sample_locations (localisations_exemple), placez le curseur de la souris sur Create Chart (Créer un diagramme), puis sélectionnez Scatter Plot Matrix (Matrice de nuages de points).
Le volet Chart Properties (Propriétés du diagramme) apparait.
Cette fenêtre vous permet de configurer les propriétés d’un diagramme. Pour configurer une matrice de nuages de points, commencez par sélectionner les variables numériques qui seront représentées les unes par rapport aux autres.
- Dans la fenêtre Chart Properties (Propriétés du diagramme), cliquez sur Select (Sélectionner).
Il y a 19 variables bioclimatiques à sélectionner pour le diagramme de matrice de nuages de points.
- Cliquez sur le bouton Toggle all the check boxes (Activer/désactiver toutes les cases à cocher).
Étant donné le très grand nombre de champs, il est plus simple de tous les sélectionner, puis de décocher ceux que vous ne voulez pas utiliser.
- Décochez les deux premiers champs, pointid et grid_code, puis cliquez sur Apply (Appliquer).
La matrice de nuages de points apparaît dans la fenêtre du diagramme.
Utiliser une matrice de nuages de points pour examiner les relations entre les données
Maintenant que vous avez créé le diagramme de matrice de nuages de points, vous allez l’utiliser pour explorer les données et examiner les relations entre les variables dans différentes localisations de la forêt. Vous allez choisir quelles variables utiliser en fonction de vos critères d’étude et de cette exploration.
Si le diagramme est ancré dans ArcGIS Pro, il peut être trop petit pour être lisible. Vous allez donc commencer par rendre la fenêtre flottante afin de l’agrandir plus facilement.
- Cliquez avec le bouton droit sur l’onglet sample_locations - Scatter plot matrix of Sample_locations (localisations_exemple - Matrice de nuages de points de Localisations d’exemple) et choisissez Float (Flottant).
- Cliquez et faites glisser l’angle de la fenêtre du diagramme Scatter plot matrix of sample_locations (Matrice de nuages de points de localisations_exemple) pour l’agrandir et mieux voir la matrice de points.
Le diagramme montre chacune des variables sur les axes X et Y. Il présente un petit nuage de points pour chaque combinaison de variables.
Si vous survolez l’un des petits graphiques, une fenêtre contextuelle affiche les noms des variables et la valeur R-carré.
- Survolez l’un des graphiques avec une corrélation positive élevée (ligne de points étroite avec une tendance croissante de gauche à droite).
Dans ce jeu de données, pour cette zone d’étude en particulier, les précipitations à chaque localisation au cours du mois le plus sec sont fortement corrélées positivement aux précipitations à chaque localisation au cours du mois le plus humide.
- Survolez l’un des graphiques avec une corrélation négative élevée (ligne de points étroite avec une tendance décroissante de gauche à droite).
Dans ce jeu de données, pour cette zone d’étude, la température annuelle moyenne à chaque localisation est fortement corrélée négativement à la saisonnalité des températures (l’écart type des températures moyennes mensuelles) à chaque localisation.
- Cliquez sur l’un des graphiques avec une corrélation moins claire, puis survolez-le.
Le fait de cliquer sur l’un des graphiques le sélectionne et l’affiche en plus grand format dans la partie supérieure droite de la fenêtre du diagramme.
Dans ce jeu de donnés, pour cette zone d’étude, il ne semble pas y avoir de corrélation forte entre la saisonnalité des températures et les précipitations moyennes au cours du trimestre le plus sec. Il est possible que différentes relations existent entre ces variables pour différents sous-ensembles des données.
- Dans la barre d’outils du diagramme de matrice de nuage de points, cliquez sur l’outil Selection (Sélection).
Les diagrammes et la carte sont liés, de sorte que les sélections dans le diagramme agrandi sont répercutées dans tous les plus petits nuages de points et sur la carte. Cela vous permet de sélectionner des points de données dans le diagramme et d’afficher leur localisation sur la carte de manière interactive.
- Cliquez sur une zone et faites-la glisser pour sélectionner certains des points de la section supérieure droite du nuage de points sélectionné.
La sélection dans le diagramme agrandi est reflétée dans les plus petits diagrammes.
La sélection est également affichée sur la carte.
Vous pouvez utiliser cette méthode pour continuer à explorer les relations entre les différentes variables dans différents endroits de l’ensemble de votre zone d’étude.
- Cliquez sur une partie du diagramme agrandi sans aucun point.
La sélection est effacée dans le diagramme et sur la carte.
- Fermez la fenêtre de diagramme.
Le diagramme est répertorié dans la fenêtre Contents (Contenu). Vous pouvez le rouvrir en double-cliquant dessus.
Le jeu de données CHELSA Bioclimate est polyvalent et s’applique à de nombreux thèmes de recherche. Un grand nombre des 19 variables bioclimatiques sont associées aux températures et aux précipitations et nombre d’entre elles sont fortement corrélées. Elles affichent les tendances annuelles, la saisonnalité, ainsi que les facteurs extrêmes et de limitation. Toutes les données présentes ici ne seront pas utiles pour un projet donné.
Pour l’analyse de régionalisation, préférez des variables qui ne sont pas fortement corrélées. Vous utiliserez les précipitations annuelles, la plage de températures annuelles et la température annuelle moyenne pour définir des régions. Selon la zone et le cas d’utilisation, vous pouvez choisir différentes variables.
Vous avez exploré les relations entre des paires de variables bioclimatiques et vous avez examiné comment différents sous-ensembles géographiques de variables peuvent avoir différentes relations et différents modèles d’agrégation au sein de ce jeu de données. Vous allez maintenant réaliser une analyse de régionalisation sur vos variables sélectionnées.
Identifier des régions
Maintenant que les données ont été préparées et les variables identifiées, l’étape finale consiste à réaliser une analyse de régionalisation.
La régionalisation implique de diviser une zone en régions plus petites en fonction de certains critères qui prévalent dans chaque région, afin de comprendre les caractéristiques de chaque région. L’objectif de la régionalisation est de synthétiser les facteurs environnementaux importants qui prévalent dans des régions spatiales afin de gérer et planifier la protection de l’environnement. Selon les espèces et la zone d’intérêt, différentes variables seront importantes.
Créer des agrégats
Vous allez utiliser l’outil Multivariate Clustering (Agrégation multivariée) pour créer des agrégats en fonction des variables que vous avez sélectionnées.
- Dans la fenêtre cartographique, cliquez sur l’onglet de la carte Identify regions (Identifier des régions).
Cette carte montre la couche sample_locations (localisations_exemple) et la couche boundary (limite).
- Dans la fenêtre Geoprocessing (Géotraitement), dans la zone de recherche, saisissez agrégation multivariée et dans les résultats, cliquez sur l’outil Multivariate Clustering (Agrégation multivariée).
- Dans l’outil Multivariate Clustering (Agrégation multivariée), pour Input Features (Entités en entrée), sélectionnez la couche sample_locations (localisations_exemple).
- Dans la zone Analysis Fields (Champs d’analyse), sélectionnez Annual_precipitation (précipitations_annuelles), Annual_temperature_range (plage_températures_annuelles) et Mean_annual_temperature (température_annuelle_moyenne).
- Acceptez les valeurs par défaut pour Clustering Method (Méthode d’agrégation) et Initialization Method (Méthode d’initialisation).
L’algorithme d’agrégation par défaut est l’algorithme des K-moyennes. La méthode d’initialisation par défaut est la localisation d’origine optimisée. Pour plus d’informations sur ces paramètres, consultez l’aide de l’outil.
- Laissez le paramètre Number of Clusters (nombre d’agrégats) vide.
Si vous avez un nombre prédéterminé d’agrégats que l’outil doit trouver, vous pouvez l’indiquer ici. Pour une exploration initiale des agrégats naturels dans vos données, vous pouvez laisser cette valeur non spécifiée. L’outil identifie un nombre optimal d’agrégats en fonction des données.
- Pour Output Table for Evaluating Number of Clusters (Table en sortie pour évaluer le nombre d’agrégats), saisissez Nombre_agrégats_en_sortie.
Si vous spécifiez cette table en sortie, un diagramme affichant les valeurs de statistique pseudo-F pour différents nombres d’agrégats est également créé. Les valeurs de statistique pseudo-F les plus élevées désignent les solutions les plus performantes pour optimiser à la fois les similitudes dans les agrégats et les différences entre les agrégats.
Vous allez utiliser ce diagramme pour comprendre la sortie de l’outil et prendre votre propre décision concernant le nombre d’agrégats à créer.
- Cliquez sur Run (Exécuter).
L’outil s’exécute et au bout d’un court délai, la couche sample_locations_MultivariateClustering (localisations_exemple_AgrégationMultivariée) est ajoutée à la carte.
Cette couche montre les localisations d’exemple symbolisées par Cluster ID (ID d’agrégat). Trois agrégats ont été identifiés.
Cela est un début, mais les trois agrégats sont volumineux et peuvent ne pas se prêter à une prise de décision écologique détaillée. Vous pouvez demander à l’outil de créer davantage d’agrégats, mais comment en connaître le nombre ?
Comme vous avez indiqué que l’outil doit créer la table Output_number_of_clusters (Nombre_agrégats_en_sortie), il a également généré un diagramme que vous pouvez parcourir afin de mieux comprendre les agrégats dans vos données. Vous allez ensuite affiner votre analyse à l’aide de ces informations.
Affiner l’analyse d’agrégation
Vous allez maintenant examiner les valeurs de statistique pseudo-F que l’outil a enregistrées dans la table Output_number_of_clusters (Nombre_agrégats_en_sortie).
- Dans la fenêtre Contents (Contenu), dans la section Standalone Tables (Tables autonomes), dans la sous-section Charts (Diagrammes), double-cliquez sur Optimized Pseudo-F Statistic Chart (Diagramme statistique de pseudo-F optimisé).
Le diagramme apparaît. Au besoin, redimensionnez-le pour améliorer sa lisibilité.
Ce diagramme affiche les valeurs de statistique de pseudo-F pour les solutions d’agrégation comprises entre 3 et 30. Cette statistique est le ratio de la variance entre agrégats par rapport à la variance au sein d’un agrégat. Les valeurs élevées conviennent mieux pour optimiser à la fois les similitudes dans les agrégats et les différences entre les agrégats.
L’outil a créé trois agrégats car la valeur statistique de pseudo-F la plus élevée est au niveau 3, comme vous le voyez dans le diagramme. On constate un deuxième pic au niveau 6, qui est également une solution acceptable.
- Fermez le diagramme.
- Cliquez sur l’onglet Geoprocessing (Géotraitement).
La fenêtre de l’outil Multivariate Clustering (Agrégation multivariée) affiche les paramètres que vous avez utilisés pour exécuter l’outil. Vous allez modifier le nombre d’agrégats que l’outil va créer et le relancer.
-
Dans l’outil Multivariate Clustering (Agrégation multivariée), dans la zone Number of Clusters (Nombre d’agrégats), saisissez 6.
- Acceptez les valeurs par défaut des autres paramètres et cliquez sur Run (Exécuter).
L’outil s’exécute et génère une nouvelle carte avec six agrégats.
Outre la carte des agrégats ponctuels, l’outil crée un diagramme qui montre les caractéristiques des agrégats. Vous allez l’examiner.
Explorer les caractéristiques des agrégats
Les points dans chacun de ces agrégats tendent à avoir des valeurs similaires pour chacune des trois variables. Le diagramme Multivariate Clustering Box-Plots (Boîtes à moustaches d’agrégation multivariée) présente ces ensembles de valeurs.
- Dans la fenêtre Contents (Contenu), dans la section de la couche sample_locations_MultivariateClustering (localisations_exemple_AgrégationMultivariée), double-cliquez sur le diagramme Multivariate Clustering Box-Plots (Boîtes à moustaches d’agrégation multivariée).
Le diagramme montre les boîtes à moustaches de la distribution des valeurs standardisées pour chacune des variables, ainsi que les lignes qui indiquent les valeurs moyennes de chacun des agrégats pour chaque variable.
Dans ce diagramme, les trois boîtes à moustaches montrent les valeurs standardisées des variables des précipitations annuelles, de la plage de températures annuelles et de la température annuelle moyenne.
Sur ces boîtes à moustaches, des lignes sont tracées pour représenter l’endroit où se trouvent les valeurs moyennes au sein de chacun des agrégats pour chaque variable.
- Dans le diagramme Multivariate Clustering Box-Plots (Boîtes à moustaches d’agrégation multivariée), survolez le point d’agrégat 2 dans la boîte à moustaches des précipitations annuelles.
Dans cet exemple, l’agrégat 2 est représenté en rouge. Les couleurs de diagramme correspondent aux couleurs de point sur la carte, qui sont attribuées de manière aléatoire. Vos points d’agrégat 2 sont peut-être d’une couleur différente.
Une fenêtre contextuelle s’affiche, présentant la valeur Cluster ID (ID d’agrégat) du point, le nom Analysis Fields (Champs d’analyse) et la valeur Mean Value (Valeur moyenne) de cet agrégat.
Vous pouvez utiliser cette méthode pour examiner les valeurs moyennes de chacun des champs de chaque agrégat. Les points d’agrégat sont reliés par des lignes de même couleur.
La ligne rouge, qui représente des points dans l’agrégat 2 dans ce diagramme, montre une valeur moyenne plus élevée pour les précipitations annuelles que les autres agrégats, une valeur intermédiaire pour la plage de températures annuelles et une valeur moyenne plus basse pour la température annuelle moyenne. Cet agrégat représente les zones d’élévation supérieure au centre de la forêt, qui sont plus humides et plus fraîches que les autres zones.
À l’opposé, la ligne bleu clair, qui représente des points dans l’agrégat 1, montre les valeurs de précipitations annuelles moyennes les plus basses, les valeurs de plage de températures annuelles les plus élevées et des valeurs de température annuelle moyenne intermédiaires. Ces points sont des points d’élévation inférieure qui se trouvent sur le bord ouest de la forêt.
Vous avez créé six agrégats, qui représentent six zones bioclimatiquement similaires dans la forêt. Deux des agrégats, agrégat 1 et agrégat 5, comportent des zones qui ne sont pas continues spatialement.
Ces agrégats peuvent convenir pour votre travail.
Dans certains cas, il peut être souhaitable que les agrégats soient spatialement continus. Vous allez utiliser l’outil Spatially Constrained Multivariate Clustering (Agrégation multivariée spatialement contrainte) pour créer des agrégats continus.
Créer des agrégats continus
En matière de protection des espèces, il peut être utile d’avoir des agrégats d’habitat contigus. Si vous avez besoin d’agrégats spatialement contigus, vous pouvez utiliser un outil qui inclut des contraintes spatiales dans le processus d’agrégation.
- Cliquez sur l’onglet Geoprocessing (Géotraitement) et dans la fenêtre de l’outil Multivariate Clustering (Agrégation multivariée), cliquez sur le bouton de retour.
- Dans la fenêtre Geoprocessing (Géotraitement), dans la zone de recherche, saisissez agrégation multivariée spatialement contrainte et dans les résultats de recherche, cliquez sur l’outil Spatially Constrained Multivariate Clustering (Agrégation multivariée spatialement contrainte).
- Dans l’outil Spatially Constrained Multivariate Clustering (Agrégation multivariée spatialement contrainte), pour Input Features (Entités en entrée), sélectionnez la couche sample_locations (localisations_exemple).
- Dans la zone Analysis Fields (Champs d’analse), sélectionnez Annual_precipitation (précipitations_annuelles), Annual_temperature_range (plage_températures_annuelles) et Mean_annual_temperature (température_annuelle_moyenne).
- Pour Cluster Size Contraints (Contraintes de taille d'agrégat), acceptez la valeur par défaut None (Aucune).
Dans ce cas, il n’est pas nécessaire de contraindre la taille des agrégats.
- Dans Number of Clusters (Nombre d’agrégats), saisissez 6.
- Pour Spatial Constraints (Contraintes spatiales), acceptez la valeur par défaut Trimmed Delaunay triangulation (Triangulation de Delaunay avec élimination des points).
- Cliquez sur Run (Exécuter).
L’outil s’exécute et crée un ensemble d’agrégats contraints spatialement. La nouvelle couche s’ajoute à la carte.
Pour plus d’informations sur l’outil Spatially Constrained Multivariate Clustering (Agrégation multivariée spatialement contrainte), consultez l’aide de l’outil.
Vous avez créé des régions bioclimatiques à l’aide de trois variables et de deux outils d’agrégation multivariée. Vous avez vu comment obtenir et étudier les variables en entrée et examiner les caractéristiques des agrégats. Cet exemple simplifié a visé à présenter le processus et les données disponibles. Pour votre propre travail, vous utiliserez probablement un ensemble différent de variables et vous choisirez des variables qui conviennent mieux à la localisation, aux habitats et aux espèces de la zone concernée par votre mission de protection de l’environnement.