Télécharger les données d’observation des espèces

La première étape consiste à acquérir les données d’observation ou les données de présence des espèces qui vous intéressent. Dans cette section, vous allez télécharger les données de GBIF (Global Biodiversity Information Facility), qui combinent les données d’observation de plusieurs sources à des fins scientifiques. Vous ajouterez ensuite les données d’observation des blaireaux à ArcGIS Pro et vous assurerez que les types de données sont corrects pour les types d’analyse à effectuer.

Configurer votre projet ArcGIS

Vous allez commencer par configurer le projet ArcGIS Pro dans lequel vous utiliserez les données. Vous allez ajouter une couche illustrant la frontière nationale de l’Espagne à utiliser par la suite pour les données de découpage dans le didacticiel.

  1. Démarrez ArcGIS Pro. Si vous y êtes invité, connectez-vous via votre compte d’organisation ArcGIS sous licence.
    Remarque :

    Si vous n’avez pas accès à ArcGIS Pro ou ne disposez pas d’un compte d’organisation ArcGIS, consultez les options disponibles pour accéder aux logiciels.

    Lorsque vous ouvrez ArcGIS Pro, vous avez la possibilité de créer un nouveau projet ou d’en ouvrir un existant. Si vous avez créé des projets auparavant, une liste de projets récents s’affiche.

  2. Sous New Project (Nouveau projet), cliquez sur Map (Carte).

    Créez un projet à l’aide du modèle de carte.

  3. Dans la fenêtre New Project (Nouveau projet), pour Name (Nom), saisissez EuropeanBadger_Habitat. Laissez le chemin d’accès inchangé sous Location (Emplacement) et assurez-vous que la case Create a folder for this project (Créer un dossier pour ce projet) est cochée.
  4. Cliquez sur OK.

    Vous allez commencer par ajouter à la carte une couche montrant les frontières de l’Espagne. Cette couche permettra de découper et restreindre les données environnementales.

  5. Sur le ruban, cliquez sur l'onglet Vue. Dans le groupe Windows (Fenêtres), choisissez Catalog Pane (Fenêtre du catalogue).

    Ouvrez la fenêtre Catalog (Catalogue).

    La fenêtre Catalogue apparaît. La fenêtre Catalog (Catalogue) permet d’ajouter des éléments à un projet, d’afficher, de créer et de gérer des éléments et d’obtenir des informations sur leurs propriétés.

  6. Dans la fenêtre Catalog (Catalogue), cliquez sur l’onglet Portal (Portail) et sélectionnez Living Atlas (Atlas dynamique).

    Sélectionnez le portail Living Atlas.

  7. Recherchez la couche Spain Country Boundary (Limite de l’Espagne). Recherchez la couche d’entités Spain Country Boundary (Limite de l’Espagne) qui appartient à esri_dm et faites glisser le résultat sur la carte.

    Ajoutez la couche Spain Country Boundary (Limite de l’Espagne) à la carte.

    La couche apparaît sur la carte et est ajoutée à la fenêtre Contents (Contenu) sous le nom ESP_Country.

Télécharger les données d’observation des animaux depuis GBIF

Vous allez à présent télécharger les données d’observation des animaux depuis GBIF (Global Biodiversity Information Facility). GBIF est un référentiel de données mondial qui collecte les données sur les localisations où les espèces ont été enregistrées. Ces données proviennent de plusieurs sources, telles qu’iNaturalist, et sont mises en forme dans une structure commune pour une utilisation générale.

Remarque : selon le statut de protection des espèces, les données de localisation peuvent être obscurcies pour empêcher le braconnage ou toute autre interférence. Le blaireau européen étant classé comme moins menacé selon la liste rouge IUCN, les données de localisation ne sont pas obscurcies.

  1. Accédez à la page GBIF pour Meles meles.

    La page de vue d’ensemble des espèces apparaît. Cette page contient des informations sur le blaireau et notamment des photos soumises avec des enregistrements d’occurrence, une carte des localisations des observations et une description de l’activité et de l’écologie de cet animal.

  2. Connectez-vous ou inscrivez-vous pour obtenir un compte.

    Connectez-vous au site GBIF.

    Les données GBIF sont disponibles en accès libre, mais ne peuvent être téléchargées que par les utilisateurs possédant un compte. Cela permet à GBIF de générer une citation personnalisée pour chaque utilisateur et jeu de données téléchargés.

  3. Faites défiler la page vers le bas et consultez les informations Description (Description), en payant une attention particulière aux sections Activity (Activité) et Biology Ecology (Biologie Écologie).
  4. Cliquez sur l’onglet Metrics (Métriques) et explorez les statistiques sur les observations.

    Cliquez sur l’onglet Metrics (Métriques).

    Les blaireaux ont été largement observés en Europe, principalement au cours des mois les plus chauds. Dans les climats plus froids, les blaireaux hibernent pour échapper à la météo hivernale. Pour restreindre les résultats, vous pouvez filtrer par pays.

  5. Dans le graphique Occurrences per Country or Area (Occurrences par pays ou zone), cliquez sur Spain (Espagne).

    Cliquez sur la table pour filtrer les enregistrements.

    L’onglet Table (Table) s’ouvre et affiche les enregistrements d’occurrence pour l’Espagne sous forme de tableau. Avant de télécharger les données, vous allez les filtrer pour vous assurer de ne télécharger que les données que vous pouvez cartographier. Vous allez commencer par filtrer les données sous licence Creative Commons ouverte.

  6. Développez License (Licence) et cochez les cases permettant de sélectionner CC0 1.0 et CC BY 4.0.

    Ces types de licence autorisent une utilisation publique des données. CC0 1.0 affiche les données du domaine public. CC BY 4.0 désigne les données qui peuvent être partagées et adaptées à partir du moment où la source de données d’origine et/ou le propriétaire a été attribué et qu’il existe une description des modifications.

  7. Développez Location (Localisation) et sélectionnez Including coordinates (Avec coordonnées).
  8. Développez la section Issues and flags (Problèmes et indicateurs) et examinez les problèmes potentiels relatifs au jeu de données.

    Cette section répertorie les problèmes potentiels associés à chaque point. Notez par exemple que la plupart des coordonnées sont arrondies. Selon la manière dont vous avez l’intention d’utiliser les résultats de votre analyse, ces problèmes peuvent ou non disqualifier les données dans le cadre de votre étude, nécessiter une correction ou être traités comme une erreur potentielle.

  9. En haut de la table, cliquez sur le bouton Download (Télécharger).

    Téléchargez les données GBIF.

  10. Dans la table Download Options (Options de téléchargement), sélectionnez Simple (Simple).
  11. Dans la fenêtre contextuelle, lisez le contrat utilisateur GBIF et les directives liées aux citations, puis cliquez sur Understood (J’ai compris).

    La page de téléchargement des données apparaît. Notez les informations sur la citation et les autres directives d’utilisation des données dans cette page.

  12. Une fois que les données ont été traitées, cliquez sur Download (Télécharger).

Un fichier .csv compressé est téléchargé sur votre ordinateur. Un courrier électronique de confirmation avec votre citation personnalisée est envoyé à l’adresse e-mail que vous avez enregistrée pour votre compte GBIF. Vous l’utiliserez par la suite pour citer votre source de données.

Extraire les données d’observation des animaux

Vous allez maintenant ajouter les données d’observation des blaireaux à ArcGIS Pro. Une fois que vous vous trouvez dans ArcGIS Pro, vous pouvez analyser les données et vous assurer que les types de données sont corrects pour les types d’analyse à effectuer. La structure utilisée par GBIF stocke la date d’observation dans trois champs différents (jour, mois et année), sous forme de champs de texte. Pour analyser les observations par mois, vous allez créer un champ de type date combinant le jour, le mois et l’année.

  1. Dans un explorateur de fichiers, accédez à l’emplacement de téléchargement des données GBIF.
  2. Décompressez le fichier dans votre dossier de projet ArcGIS Pro.

    Par défaut, les dossiers de projet sont créés dans cet emplacement : C:\Users\<username>\Documents\ArcGIS\Projects. Selon l’emplacement dans lequel vous avez téléchargé ArcGIS Pro, votre chemin d’accès aux fichiers peut différer.

    Lorsque le fichier a été téléchargé, il a été nommé avec une chaîne numérique. Vous allez le renommer avant de l’ajouter à votre projet.

  3. Renommez le fichier Melesmeles_GBIF_[date], en spécifiant la date de téléchargement du fichier.

    Renommez le fichier .csv dans votre dossier de projet.

    Vous allez ajouter le fichier comme table de géodatabase pour pouvoir préparer les données avant de les cartographier.

  4. Dans ArcGIS Pro, sur le ruban, cliquez sur l’onglet Analysis (Analyse). Dans le groupe Geoprocessing (Géotraitement), cliquez sur Tools (Outils).

    Outils d’analyse

    La fenêtre Geoprocessing (Géotraitement) s’affiche.

  5. Dans la fenêtre Geoprocessing (Géotraitement), recherchez et ouvrez l’outil Table To Geodatabase (Table vers géodatabase).
  6. Pour Input Table (Table en entrée), cliquez sur Browse (Parcourir) et sélectionnez votre fichier Melesmeles_GBIF_[date].
  7. Pour Output Geodatabase (Géodatabase en sortie), cliquez sur Browse (Parcourir) et sélectionnez la géodatabase par défaut du projet. Cliquez sur Run (Exécuter).

    Outil Table To Geodatabase (Table vers géodatabase)

    La table est ajoutée à votre géodatabase.

  8. Dans la fenêtre Catalog (Catalogue), cliquez sur l’onglet Project (Projet). Développez Databases (Bases de données), puis votre géodatabase EuropeanBadger_Habitat et faites glisser la table Melesmeles_GBIF_[date] sur la carte.

    Ajoutez la table à la carte.

    La table est ajoutée à la fenêtre Contenu sous Tables autonomes. Vous allez à présent observer les données pour déterminer les champs à utiliser et ceux à mettre en forme pour une analyse ultérieure.

  9. Cliquez avec le bouton droit sur la table Melesmeles_GBIF_[date] et sélectionnez Open (Ouvrir).

    Ouvrez la table.

    Cette table contient les données que vous avez vues dans GBIF. Vous allez utiliser les attributs decimalLatitude et decimalLongitude pour cartographier les données. Vous souhaitez également utiliser le champ de date pour l’analyse spatiotemporelle, mais le champ eventDate a été enregistré comme champ de texte. Pour que vous puissiez utiliser ce champ, la date doit être au format date.

  10. En haut de la table, cliquez sur Calculate (Calculer).

    Bouton Calculate (Calculer) dans la table

    L’outil Calculer un champ s’ouvre.

  11. Dans la fenêtre Calculate Field (Calculer un champ), pour Field name (Nom de champ), saisissez stdTime.

    Cela vous permet d’ajouter un nouveau champ pour stocker les données mises en forme.

  12. Pour Expression Type (Type d’expression), sélectionnez Arcade (Arcade) et pour Field Type (Type de champ), sélectionnez Date (Date).

    Type du champ Calculate (Calculer).

  13. Dans la zone Expression (Expression), générez l’expression Concatenate($feature.month, "/", $feature.day, "/", $feature.year).
  14. Dans la partie inférieure de la zone Expression (Expression), cliquez sur la coche verte pour valider l’expression, puis cliquez sur OK (OK).

    Validez et exécutez l’expression.

    Une fois que l’outil a été exécuté, une fenêtre affiche le statut terminé. Les messages vous avertissent que certaines valeurs n’ont pas été enregistrées car certaines des données sont manquantes. Vous allez les ignorer pour le moment.

  15. Fermez la fenêtre de l’outil terminé.

    Pour afficher la dispersion temporelle des données, vous allez créer un diagramme Calendar Heat (Calendrier de zones de chaleur).

    Le diagramme Calendrier de zones de chaleur permet de visualiser les modèles dans les données temporelles en agrégeant les incidents dans une grille de calendrier. Les grilles du calendrier peuvent être configurées pour visualiser les modèles temporels au cours des différents mois de l’année ou des différents jours de la semaine.

  16. Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit sur la table Melesmeles_GBIF_[date], cliquez sur Create Chart (Créer un diagramme), puis sélectionnez Calendar Heat Chart (Diagramme Calendrier de zones de chaleur).

    Créez un diagramme Calendar Heat (Calendrier de zones de chaleur).

    Une fenêtre Chart (Diagramme) vide apparaît.

  17. Dans la fenêtre Chart Properties (Propriétés du diagramme), pour Date (Date), sélectionnez stdTime.

    Représentez le champ stdTime.

    Le diagramme est alimenté et représente les zones de chaleur du mois et du jour de l’observation. Les observations ont eu lieu tout au long de l’année, mais plus souvent au cours des mois plus frais d’automne et d’hiver.

    Diagramme des observations de blaireaux par mois

  18. Fermez la table Melesmeles_GBIF_[date] et le diagramme. Enregistrez le projet.

Maintenant que vous avez téléchargé les données d’observation des Meles meles et que vous les avez intégrées à ArcGIS Pro pour une préparation initiale des données, vous êtes prêt à les cartographier. Chaque point d’observation contient les coordonnées à utiliser pour cartographier les données.


Points de présence de carte ou de pseudo-absence

La modélisation de la distribution des espèces peut être effectuée de différentes manières, avec plusieurs méthodes statistiques. Un certain nombre de ces méthodes requièrent à la fois des données de présence et d’absence ou, dans votre cas, des données de pseudo-absence. Elles nécessitent également des données environnementales pour déterminer quels types de conditions climatiques et d’habitat sont adaptés aux espèces animales. Maintenant que vous disposez des données de présence, vous pouvez générer les données de pseudo-absence ou d’arrière-plan et extraire les données attributaires environnementales à chaque emplacement.

Points de présence de carte

Vous allez commencer par cartographier la présence des blaireaux en convertissant les données tabulaires relatives au blaireau en Europe en classe d’entités. Ensuite, vous allez examiner les données. Selon la méthode de collecte, certaines données pourraient être surreprésentatives des emplacements des blaireaux, par exemple les études qui suivent les déplacements des animaux plutôt que d’indiquer simplement leur observation.

Remarque :

Si vous prévoyez d’utiliser une méthode d’analyse comme la prévision de présence seule (MaxEnt), la préparation des données effectuée dans cette section est incluse dans l’outil de géotraitement. Mais si vous prévoyez d’utiliser d’autres méthodes d’analyse telles que la régression, certaines étapes sont indispensables pour préparer vos données.

  1. Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit que la table Melesmeles_GBIF_[date], pointez le curseur sur Create Points From Table (Créer des points à partir d’une table) et sélectionnez XY Table To Point (Table XY vers points).

    Outil Table XY vers points

  2. Dans la fenêtre XY Table To Point (Table XY vers points), définissez les paramètres suivants et cliquez sur OK :

    • Output Feature Class (Classe d’entités en sortie) : EuropeanBadger_points
    • X Field (Champ X) : decimalLongitude
    • Y Field (Champ Y) : decimalLatitude

    Paramètres de l’outil Table XY vers points

    Une fois l’exécution de l’outil terminée, la couche est ajoutée à la fenêtre Contents (Contenu). Il existe un important regroupement de points autour de Barcelone, et un petit agrégat au sud de Séville.

    Remarque :

    Lors du téléchargement de ces données, il existait 2 214 points d’observation qui répondaient aux exigences en matière de licence et de sélection. Votre jeu de données est susceptible d’être différent.

  3. Effectuez un zoom avant sur l’agrégat au sud de Séville.

    Effectuez un zoom avant sur l’agrégat de points au sud de Séville.

    Cet agrégat de points se trouve dans le parc national de Doñana et semble représenter des traces animales, ce qui signifie que chaque ensemble de points correspond sans doute à un seul animal. Pour voir comment les données ont été recueillies, ouvrez la table attributaire de la couche.

  4. Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit sur la couche EuropeanBadger_points et sélectionnez Attribute Table (Table attributaire).
  5. Sur le ruban, dans l’onglet Map (Carte), dans le groupe Selection (Sélection), cliquez sur Select (Sélectionner) et dessinez un rectangle sur la carte autour des points dans le parc national de Doñana.
  6. Au bas de la table attributaire, cliquez sur Show selected records (Afficher les enregistrements sélectionnés).

    Afficher les enregistrements sélectionnés

    La table est filtrée pour n’afficher que les enregistrements sélectionnés. En fonction de la manière dont vous avez dessiné votre sélection, environ la moitié des points d’observation se trouvent dans le parc national, et vous constatez que la majorité des points ont été obtenus grâce à une étude de suivi. Pour éviter une surreprésentation de cette zone dans les futures analyses, vous allez affiner ces points.

  7. Dans la fenêtre Geoprocessing (Géotraitement), recherchez l’outil Delete Identical (Supprimer l’élément identique) et ouvrez-le.

    En haut de l’outil, un avertissement indique que l’outil modifie le jeu de données en entrée. L’outil Delete Identical (Supprimer l’élément identique) supprime définitivement des points de la couche d’entités que vous allez entrer, mais ne modifie pas la table autonome.

  8. Pour Input Dataset (Jeu de données en entrée), sélectionnez EuropeanBadger_points et laissez le bouton bascule Use the selected records (Utiliser les enregistrements sélectionnés) activé.
  9. Pour Field(s) (Champ(s)), sélectionnez Shape (Forme). Pour XY Tolerance (Tolérance XY), sélectionnez 500 Meters (500 mètres) et cliquez sur Run (Exécuter).

    Supprimez les enregistrements identiques.

    Une fois l’exécution de l’outil terminée, la table attributaire devra être actualisée, car certains des enregistrements sélectionnés sont maintenant supprimés.

  10. Dans la fenêtre Table failed to load (Échec du chargement de la table), cliquez sur OK.
  11. Sur le ruban, dans le groupe Selection (Sélection), cliquez sur Clear (Effacer) pour supprimer la sélection.

    Il reste de nombreux points dans le parc national, mais ils ont été affinés.

  12. Rouvrez la table attributaire et vérifiez le nombre de points de présence restants répertoriés en bas de la table.

    En fonction des points que vous aviez sélectionnés, ce nombre peut varier. Vous voudrez généralement créer le même nombre de points d’arrière-plan que d’observations. Vérifiez donc bien vos points. Vous pouvez maintenant créer l’échantillon aléatoire.

Générer des points de pseudo-absence échantillonnés aléatoirement

Maintenant que vos données de présence sont prêtes, vous allez générer des points de pseudo-absence. La méthode la plus simple consiste à utiliser la génération aléatoire dans la zone d’étude. Pour vous assurer que les points de présence et de pseudo-absence sont équitablement pondérés, vous allez créer le même nombre de points d’arrière-plan que de points de présence.

  1. Dans la fenêtre Geoprocessing (Géotraitement), recherchez et ouvrez l’outil Create Spatial Sampling Locations (Créer des localisations d’échantillonnage spatial).

    L’outil Create Spatial Sampling Locations (Créer des localisations d’échantillonnage spatial) génère des localisations d’échantillonnage dans une zone d’étude continue à l’aide de conceptions d’échantillonnage aléatoire simple, stratifié, systématique (maillé) ou par agrégat.

  2. Saisissez les paramètres suivants et cliquez sur Run (Exécuter) :

    • Input Study Area (Zone d’étude en entrée) : ESP_Country
    • Output Features (Entités en sortie) : ESP_randomsample
    • Sampling Method (Méthode d’échantillonnage) : Simple random (Aléatoire simple)
    • Number of Samples (Nombre d’échantillons) : nombre de points dans votre table EuropeanBadger_points

    Créez une couche de points échantillonnés de manière aléatoire.

    La couche de points aléatoires en Espagne est ajoutée à la carte. Ce jeu de données peut maintenant être associé à votre couche EuropeanBadger_points.

    Points échantillonnés de manière aléatoire

  3. Fermez la table attributaire EuropeanBadger_points.
  4. Dans la fenêtre Geoprocessing (Géotraitement), recherchez et ouvrez l’outil Merge (Fusionner).
  5. Pour Input Datasets (Jeux de données en entrée), choisissez ESP_randomsample et EuropeanBadger_points. Pour Output Dataset (Jeu de données en sortie), saisissez badger_sample_set.

    Dans l’outil Merge (Fusionner), vous pouvez choisir les champs à ajouter à la nouvelle couche et en créer de nouveaux. Vous allez ajouter un nouveau champ Presence (Présence) que vous allez utiliser pour différencier les points d’observation des données GBIF et les points d’arrière-plan de l’échantillon aléatoire.

  6. Pour Field Map (Appariement des champs), cliquez sur le menu déroulant Add Fields (Ajouter des champs) et sélectionnez Add Empty Field (Ajouter un champ vide).

    Ajoutez un champ vide.

  7. Renommez NewField (Nouveau champ) en Presence (Présence) et appuyez sur Entrée.

    Par défaut, le champ Presence (Présence) est défini comme un champ de type Text (Texte).

  8. Pointez sur le champ Presence (Présence) et cliquez sur Edit (Modifier). Dans la fenêtre Field Properties (Propriétés du champ), cliquez sur Type et choisissez Short (Court).

    Définissez le type du champ Presence (Présence) sur Short (Court).

  9. Dans la fenêtre Field Properties (Propriétés du champ), cliquez sur OK, puis exécutez l’outil Merge (Fusionner).

    Remarque :

    Le champ Presence (Présence) inclut un avertissement indiquant qu’il est vide.

  10. Dans la fenêtre Contents (Contenu), décochez les couches ESP_randomsample et EuropeanBadger_points pour les désactiver. Cliquez avec le bouton droit de la souris sur la couche badger_sample_set et sélectionnez Attribute Table (Table attributaire).

    Pour distinguer les points de présence et d’absence sur votre nouvelle couche, vous allez calculer les valeurs pour le champ Presence (Présence). Généralement, les points de présence s’affichent avec la valeur 1 et les points d’arrière-plan avec la valeur 0. Lorsque vous faites défiler la table, notez que les points fusionnés ont de nombreux champs de données nuls. Vous allez utiliser ces champs nuls pour sélectionner les points d’arrière-plan.

  11. Dans la table, cliquez sur Select by Attributs (Sélectionner selon les attributs). Dans la fenêtre Select By Attributes (Sélectionner selon les attributs), créez l’expression Where kingdom is null (Lorsque le royaume est nul) et cliquez sur Apply (Appliquer).

    Sélectionner des points dont l’attribut kingdom (royaume) est nul

  12. Dans la table attributaire, faites défiler l’affichage jusqu’à ce que le champ Presence (Présence) apparaisse. Cliquez avec le bouton droit de la souris sur le nom de la colonne Presence (Présence) et sélectionnez Calculate Field (Calculer un champ).

    Calculer le champ Presence (Présence)

  13. Dans la fenêtre Calculate Field (Calculer un champ), pour Presence = (Présence =), saisissez 0 et cliquez sur OK.
  14. Dans la fenêtre Select By Attributes (Sélectionner selon les attributs), cochez la case Invert Where Clause (Inverser la clause Where) et cliquez sur OK.

    Inverser la clause Where

  15. Cliquez avec le bouton droit de la souris sur le nom de la colonne Presence (Présence) et sélectionnez Calculate Field (Calculer un champ). Créez l’expression Presence =1 et cliquez sur OK.

    Maintenant que les entités sont codées avec une valeur 1 pour la présence observée et une valeur 0 pour la pseudo-absence.

  16. Sur le ruban, cliquez sur Clear (Effacer) pour effacer la sélection. Fermez la table ESP_randomsample et enregistrez le projet.

Extraire les données environnementales

Vous allez ensuite localiser et préparer les variables environnementales qui pourraient aider à déterminer la présence des blaireaux. Souvenez-vous que les données GBIF ont montré que les blaireaux préfèrent une bonne couverture végétale pour leur habitat d’alimentation. Grâce à la description des animaux dans les données GBIF, vous savez que dans le centre de l’Espagne, les blaireaux préfèrent les zones à moyenne altitude avec des forêts et des prairies, et évitent les zones à basse altitude. Dans ce didacticiel, vous allez vous concentrer sur l’acquisition et la configuration des données nécessaires à la modélisation de la distribution des espèces, comme l’occupation du sol, la pente et l’élévation.

  1. Téléchargez le fichier SpainPortugalElev.zip sur votre ordinateur et décompressez-le dans le dossier de projet ArcGIS dans lequel vous travaillez.

    Ce fichier contient deux images raster téléchargées à partir du dossier USGS EROS Archive - Digital Elevation - Global Multi-resolution Terrain Elevation Data 2010 qui ont été mosaïquées ensemble pour couvrir l’ensemble de l’Espagne, puis attachées à l’Espagne et au Portugal. Pour plus d’informations sur la création d’un jeu de données mosaïque, reportez-vous à la documentation. Vous allez utiliser cette image raster pour créer un jeu de données de pente pour l’Espagne.

    Vous pouvez accéder à des données de pente et d’élévation plus détaillées à partir de ArcGIS Living Atlas. Cependant, en raison des limites d’exportation des données, qui limitent les exportations à 4 000 x 4 000 pixels à la fois, les données ArcGIS Living Atlas ne sont pas le meilleur choix pour une zone d’étude aussi grande.

  2. Dans la fenêtre Catalog (Catalogue), cliquez sur l’onglet Project (Projet) et développez le groupe Folder (Dossier), puis le dossier du projet EuropeanBadger_Habitat.
  3. Localisez l’image Spain_GTMED2010 que vous avez décompressée et faites-la glisser sur la carte.

    Remarque :

    Si vous êtes invité à créer des pyramides et à calculer des statistiques pour la couche, cliquez sur OK.

  4. Dans la fenêtre Contents (Contenu), décochez les couches badger_sample_set et ESP_Country pour les désactiver.

    Données d'altitude

    Le raster d’élévation est dessiné sur la carte. Vous pouvez utiliser ce raster pour calculer la pente, une autre variable qui peut aider à déterminer l’habitat des blaireaux.

  5. Dans la fenêtre Geoprocessing (Géotraitement), recherchez et ouvrez l’outil Surface Parameters (Paramètres de surface).
  6. Saisissez les paramètres suivants et cliquez sur Run (Exécuter) :

    • Input surface raster (Raster de surface en entrée) : SpainPortugalElev.tif
    • Output Raster (Raster en sortie) : Spain_Slope
    • Input analysis mask (Masque d’analyse en entrée) : ESP_Country
    • Parameter type (Type de paramètre) : Slope (Pente)
    • Local surface type (Type de surface locale) : Quadratic (Quadratique)
    • Slope measurement (Mesure de pente) : Degree (Degré)

    Couche de pente dérivée du raster d’élévation

    La couche Spain_Slope est ajoutée à la carte. Les valeurs de pente s’affichent en degrés.

    La couche environnementale suivante à rechercher est l’occupation du sol. Pour cela, vous allez utiliser les données WorldCover 2020 de l’Agence spatiale européenne. WorldCover cartographie 11 types d’occupation du sol.

  7. Dans la fenêtre Catalog (Catalogue), cliquez sur l’onglet Portal (Portail) et sélectionnez Living Atlas (Atlas dynamique).
  8. Recherchez la couche ESA WorldCover et faites-la glisser sur la carte.

    Ajouter l’occupation du sol à la carte

    La couche WorldCover est dessinée sur la carte. Cette couche contient 11 classes d’occupation du sol différentes avec une résolution à 10 mètres.

    Couche ESA WorldCover affichant l’occupation du sol pour l’Espagne

    Maintenant que vous disposez de vos données d’habitat, vous allez utiliser l’outil Extract Multi Values to Points (Extraction de valeurs multiples vers des points) pour obtenir les valeurs raster pour l’emplacement de chaque point.

  9. Dans le volet Geoprocessing (Géotraitement), recherchez l’outil Extraire plusieurs valeurs pour les points et ouvrez-le.
  10. Pour Input point features (Entités ponctuelles en entrée), choisissez badger_sample_set.
  11. Pour Input rasters (Rasters en entrée), sélectionnez Spain_Slope, Spain_Elevation et LandCover et donnez-leur le nom de champ en sortie correspondant : slope (pente), elevation (élévation) et landcover (occupation du sol).

    Remarque :

    Le chiffre 1 peut être ajouté au nom du champ d’élévation. Cela n’affectera pas votre sortie.

    Avant d’exécuter l’outil, vous allez définir l’étendue de traitement sur les frontières de l’Espagne que vous avez utilisées. Dans la mesure où la couche WorldCover est un jeu de données mondial, la définition de l’étendue de traitement vous permet d’extraire uniquement les données dont vous avez besoin.

  12. Cliquez sur l'onglet Environnements.

    Cliquez sur l'onglet Environnements.

  13. Développez le groupe Processing Extent (Étendue de traitement). Cliquez sur Extent of a Layer (Étendue d’une couche) et choisissez la couche ESP_Country.

    Définissez l’étendue de traitement.

  14. Cliquez sur Run (Exécuter).

L’exécution de cet outil prend un certain temps. Une fois l’outil exécuté, la couche badger_sample_set présente trois nouvelles variables dans la table attributaire. Vous allez également ajouter des données sur le bioclimat à votre jeu d’échantillons.

Échantillonner des données multidimensionnelles

Outre la pente, l’élévation et l’occupation du sol, d’autres variables utiles à la modélisation de l’habitat des blaireaux sont des données bioclimatiques. Vous allez ajouter la couche Bioclimate Baseline 1970-2000 à partir de ArcGIS Living Atlas et échantillonner ses valeurs à chaque point de présence et d’arrière-plan. La couche Bioclimate Baseline fournit des estimations réduites des variables climatiques et bioclimatiques sous forme de moyennes mensuelles sur la période 1970-2000 à partir de l’interpolation des valeurs enregistrées par les stations de WorldClim 2.1. Cette couche inclut 19 variables bioclimatiques, y compris des données relatives à la température et aux précipitations. Il est possible d’accéder à chaque variable à partir du filtre multidimensionnel.

  1. Dans la fenêtre Catalog (Catalogue), cliquez sur l’onglet Portal (Portail) et sélectionnez Living Atlas (Atlas dynamique).
  2. Recherchez la couche Bioclimate Baseline 1970-2000 et faites-la glisser sur la carte.

    Ajoutez la couche Bioclimate Baseline 1970-2000.

    La couche Bioclimate Baseline 1970-2000 est ajoutée à la carte. ArcGIS Living Atlas contient également des projections dans l’avenir pour chacune des variables bioclimatiques du jeu de données Baseline. Chacun des jeux de données Bioclimate Projections contient des données SSP2-4.5, SSP3-7.0 et SSP5-8.5 pour modéliser les conditions futures potentielles en fonction des émissions de gaz à effet de serre, des stratégies politiques et sociales, et d’autres évolutions. Ces couches peuvent être transférées pour le jeu de données Baseline, mais devront être échantillonnées individuellement.

    Comme auparavant, vous voulez extraire ces variables vers votre jeu d’échantillons sur les blaireaux, mais pour obtenir toutes les variables bioclimatiques, vous allez utiliser l’outil Sample (Échantillonner), qui traite chaque tranche multidimensionnelle. Mais contrairement à l’outil Extract Multi Values to Points (Extraction de valeurs multiples vers des points), l’outil Sample (Échantillonner) crée une nouvelle classe d’entités dans votre géodatabase. Avant d’exécuter cet outil, vous devez vous assurer que la couche badger_sample_set présente un identifiant unique que vous pouvez utiliser pour joindre les résultats de l’outil Sample (Échantillonner) avec la couche badger_sample_set.

  3. Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit sur la couche badger_sample_set et sélectionnez Attribute Table (Table attributaire).

    Dans la table, le champ OID sert d’identifiant unique. Cet identifiant a été créé lorsque vous avez converti le fichier .csv en table de géodatabase. Les OID et les autres identifiants uniques affectés automatiquement, peuvent être réinitialisés ou régénérés. Vous allez donc calculer un nouveau champ unique à utiliser lors de la jointure ultérieure des tables.

  4. Dans la table attributaire, sur le ruban, cliquez sur Calculate (Calculer).
  5. Dans la fenêtre Calculate Field (Calculer un champ), pour Field Name (Nom de champ), saisissez joinID. Dans Field Type (Type de champ), choisissez Long.

    Outil Calculate Field (Calculer un champ) créant un champ joinID (ID de jointure)

    Pour ce calcul, vous allez utiliser les assistants Python, qui fournissent des extraits de code couramment utilisés.

  6. Dans la fenêtre Helpers (Assistants), double-cliquez sur Sequential Number (Numéro séquentiel).

    Utilisez un assistant Python pour calculer des numéros séquentiels.

    L’assistant est ajouté au champ Code Block (Bloc de code). Par défaut, la numérotation séquentielle démarre à 1.

  7. Cliquez sur OK.

    Le champ joinID (ID de jointure) est ajouté à la fin de la table. Vous êtes maintenant prêt à exécuter l’outil Sample (Échantillonner).

  8. Dans la fenêtre Geoprocessing (Géotraitement), recherchez et ouvrez l’outil Sample (Échantillonner).
  9. Dans l’outil Sample (Échantillonner), saisissez les paramètres suivants et cliquez sur Run (Exécuter) :

    • Input rasters (Rasters en entrée) : Bioclimate Baseline 1970:2000
    • Input location raster or features (Raster de localisation ou entités en entrée) : badger_sample_set
    • Output table or feature class (Table ou classe d’entités en sortie) : badger_sample_bioclimatebase
    • Unique ID field (Champ d’ID unique) : joinID (ID de jointure)
    • Case à cocher Process as multidimensional (Traiter comme multidimensionnel) : cochée

    Échantillonner les données bioclimatiques

    Une fois l’exécution de l’outil terminée, la table sample_bioclimatebase est ajoutée à la fenêtre Contents (Contenu). Vous allez la joindre à la couche badger_sample_set.

  10. Dans la fenêtre Geoprocessing (Géotraitement), cliquez sur le bouton de retour. Recherchez et ouvrez l’outil Join Field (Champ de jointure).
  11. Saisissez les paramètres suivants et cliquez sur Run (Exécuter) :

    • Input Table (Table en entrée) : badger_sample_set
    • Input Field (Champ en entrée) : joinID (ID de jointure)
    • Join Table (Table de jointure) : badger_sample_bioclimatebase
    • Input Field (Champ en entrée) : joinID (ID de jointure)
    • Transfer Fields (Transférer des champs) : sélectionnez tous les champs BC

    Les 19 attributs bioclimatiques sont maintenant ajoutés au jeu d’échantillons. Pour plus d’informations sur ce que représente chaque attribut et comment utiliser ces données, reportez-vous à la publication source de l’USGS, ainsi qu’à la page des détails des éléments dans ArcGIS Online.

Utiliser l'ingénierie des données

Vous allez maintenant utiliser les outils d’ingénierie des données pour explorer les données. Les outils d’ingénierie des données dans ArcGIS Pro vous permettent d’explorer, de visualiser, de nettoyer et de préparer vos données pour analyse. Dans cette section, vous allez utiliser les outils d’ingénierie des données pour mieux comprendre les variables environnementales que vous avez extraites dans votre jeu d’échantillons.

  1. Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit sur la couche badger_sample_set et sélectionnez Data Engineering (Ingénierie des données).

    Ouvrez les outils d’ingénierie des données.

    La vue Data Engineering (Ingénierie des données) s’ouvre. Le type de préparation des données que vous choisissez dépend du type de modélisation que vous voulez utiliser pour créer votre modèle d’adéquation de l’habitat. Par exemple, si vous prévoyez d’utiliser l’analyse de régression, vous pouvez utiliser l’outil Transform (Transformer) pour transformer les données asymétriques en distribution normale.

  2. Dans la fenêtre Fields (Champs), cliquez sur le champ landcover (occupation du sol). Maintenez la touche Maj enfoncée et cliquez sur le dernier champ bioclimatique, BC_19.
  3. Faites glisser les champs sélectionnés dans la fenêtre Statistics (Statistiques) vide au milieu de la fenêtre.

    Ajoutez des champs à la fenêtre Statistics (Statistiques).

    Les données environnementales que vous avez recueillies pour votre projet de modélisation de l’habitat sont ajoutées à la fenêtre Statistics (Statistiques).

  4. Dans la fenêtre Data Engineering (Ingénierie des données), sur le ruban, cliquez sur Calculate (Calculer).

    Calculer les statistiques

    Les statistiques pour les champs sont calculées, y compris la moyenne, les valeurs uniques et les points aberrants. Vous pouvez utiliser ces statistiques pour commencer à identifier des modèles dans vos données.

  5. Faites défiler la fenêtre Statistics (Statistiques) jusqu’à la colonne Outliers (Points aberrants).

    Le champ présentant le plus grand nombre de points aberrants statistiques est le champ slope (pente).

  6. Cliquez avec le bouton droit de la souris sur l’enregistrement Outliers (Points aberrants) du champ slope (pente) et sélectionnez Select Outliers (Sélectionner les points aberrants).

    Sélectionnez les points aberrant sur la carte.

    Les points aberrants sont sélectionnés sur la carte. Un grand nombre de points aberrants se trouvent au nord de l’Espagne, dans ou à proximité de la région des monts Cantabriques et des Pyrénées.

    Points aberrants sélectionnés sur la carte

    Il est logique que le terrain soit plus escarpé dans ces régions, mais de nombreux autres points sont également dispersés dans le reste de l’Espagne. Pour visualiser ces valeurs, vous allez utiliser un histogramme.

  7. Dans la fenêtre Statistics (Statistiques), cliquez avec le bouton droit sur l’histogramme pour le champ slope (pente). Cliquez sur Open Histogram (Ouvrir l’histogramme).

    Ouvrir l’histogramme

    L’histogramme du champ slope (pente) s’ouvre. Les points aberrants que vous avez sélectionnés apparaissent sur l’histogramme. Grâce à l’histogramme, vous pouvez voir que tous les points aberrants sont dans la partie haute ou dans des zones avec une pente plus abrupte. Vous allez maintenant vous intéresser au champ BC_01, la température annuelle moyenne.

  8. Sur l’histogramme Distribution of slope (Distribution de la pente), sur le ruban, cliquez sur Clear Selection (Effacer la sélection), puis fermez l’histogramme.

    Effacer les points sélectionnés

  9. Dans la fenêtre Statistics (Statistiques), pour le champ BC_01, cliquez avec le bouton droit sur Chart Preview (Aperçu du diagramme) et sélectionnez Open Histogram (Ouvrir l’histogramme).

    L’histogramme s’ouvre. Pour comprendre quelle température les blaireaux préfèrent, vous allez sélectionner les points de présence du blaireau.

  10. Sur le ruban, cliquez sur l’onglet Map (Carte). Dans le groupe Selection (Sélection), cliquez sur Select by Attributes (Sélectionner selon les attributs).
  11. Dans la fenêtre Select by Attributes (Sélectionner selon les attributs), effacez les expressions existantes et créez l’expression Where Presence is equal to 1 (Où la présence est 1). Cliquez sur OK.

    Les points de présence sont sélectionnés sur la carte et sur le diagramme.

    Points de présence sélectionnés sur la carte

    D’après le diagramme, il semble que les blaireaux préfèrent les températures plus chaudes.

    Conseil :

    Si vous ne voyez pas à la fois les données sélectionnées et non sélectionnées sur le diagramme, sur le ruban du diagramme, dans le groupe Filter (Filtrer), assurez-vous que le filtre Selection (Sélection) est désactivé.

    Vous pouvez utiliser les outils d’ingénierie des données pour étudier les autres variables bioclimatiques et apporter les modifications nécessaires aux données.

  12. Effacez la sélection et fermez le diagramme.

    La dernière étape avant d’utiliser les données pour la modélisation consiste à ajouter une attribution. Il est judicieux d’assurer un suivi de la source de données et, dans la mesure où vous avez téléchargé des données avec des licences CC BY 4.0, vous devez assurer l’attribution du jeu de données.

  13. Sur le ruban, cliquez sur l'onglet Vue. Dans le groupe Windows (Fenêtres), choisissez Catalog View (Vue du catalogue).

    Ouvrez la vue du catalogue.

    La vue Catalog (Catalogue) s’ouvre. La vue Catalog (Catalogue) et la fenêtre Catalog (Catalogue), avec lesquelles vous avez jusqu’à présent travaillé dans ce didacticiel, présentent de nombreuses similitudes, mais les métadonnées peuvent uniquement être modifiées dans la vue Catalog (Catalogue).

  14. Dans la vue Catalog (Catalogue), développez Databases (Bases de données) et EuropeanBadger_Habitat.gdb, puis cliquez sur la couche badger_sample_set.

    Ouvrez les métadonnées de la couche badger_sample_set.

    L’éditeur de métadonnées s’ouvre. Actuellement, les métadonnées sont vierges, sauf l’historique de géotraitement, qui indique les outils Join Field (Joindre un champ) et Calculate Field (Calculer un champ) que vous avez exécutés.

  15. Sur le ruban, sous l’onglet Catalog (Catalogue), dans le groupe Metadata (Métadonnées), cliquez sur Edit (Modifier).

    Modifier les métadonnées de la couche

    L’éditeur de métadonnées s’ouvre.

  16. Saisissez les informations suivantes dans la fenêtre Metadata (Métadonnées) :

    • Title (Titre) : Jeu de données d’échantillons sur le blaireau européen
    • Tags (Étiquettes) : modélisation d’espèce, Meles meles, blaireau européen
    • Summary (Purpose) (Synthèse [Objet]) : Ce jeu de données a été créé dans le didacticiel Learn ArcGIS Échantillonner les espèces et les données environnementales pour la modélisation de distribution afin de modéliser l’habitat du blaireau européen (Meles meles) en Espagne
    • Description (Abstract) (Description [Résumé]) : Le blaireau européen est une espèce importante, qui assure trois fonctions au sein de l’écosystème : dispersion des graines, mélange des couches supérieures du sol et création d’un micro-habitat. Pour modéliser son habitat en Espagne, les données d’observation des animaux ont été téléchargées depuis GBIF et enregistrées dans le champ Presence (Présence) avec une valeur de 1. Les points de pseudo-absence ou d’arrière-plan ont été générés et fusionnés avec les données d’observation. Les données environnementales, y compris la pente, l’élévation, l’occupation du sol et les variables bioclimatiques, ont été extraites vers ces points.

  17. Dans la section Credits (Crédits), saisissez la citation unique générée lors du téléchargement des données GBIF.

    Saisissez la citation GBIF dans la section Credits (Crédits).

    Conseil :

    Cette citation se trouve soit sur la page Download (Télécharger), soit dans l’e-mail de confirmation reçu de la part de downloads@gbif.org.

  18. En bas de l’éditeur de métadonnées, cliquez sur New Bounding Box (Nouvelle emprise).

    Ajouter une nouvelle emprise

  19. Saisissez les coordonnées suivantes :

    OuestEstSudNord

    -17.7532431

    5.6396581

    26.8567504

    44.3051478

  20. Sur le ruban, sous l’onglet Metadata (Métadonnées), cliquez sur Save (Enregistrer).
  21. Fermez l’éditeur de métadonnées et enregistrez le projet.

Vous disposez maintenant d’un jeu de données relatif au blaireau européen, que vous pouvez utiliser pour modéliser la distribution de l’espèce. Le jeu de données contient à la fois les points de présence et de pseudo-absence, ainsi que des données environnementales sur la pente, l’élévation, l’occupation du sol, la température, etc. Ces informations peuvent être utilisées dans les modèles tels que MaxEnt ou la prévision aléatoire des forêts pour procéder à la modélisation de la distribution de l’espèce.