Télécharger les données d’observation des espèces

La première étape consiste à acquérir les données d’observation ou les données de présence des espèces qui vous intéressent. Dans cette section, vous allez télécharger les données de GBIF (Global Biodiversity Information Facility), qui combinent les données d’observation de plusieurs sources à des fins scientifiques. Vous explorerez ensuite les points d’observation dans ArcGIS Pro pour vous assurer que la licence et les types de données sont corrects pour les types d’analyse à effectuer. Vous allez également rechercher les données en double pour éviter une surreprésentation dans votre analyse.

Configurer votre projet ArcGIS

Vous allez commencer par configurer le projet ArcGIS Pro dans lequel vous utiliserez les données. Vous allez ensuite ajouter deux éléments à partir de ArcGIS Living Atlas. Le premier est un outil de géotraitement personnalisé, l’outil Download Species Occurrence Points (Télécharger les points d’occurrence de l’espèce), qui vous permet de télécharger les points de l’espèce pour une zone d’intérêt sélectionnée à partir de GBIF directement dans votre projet ArcGIS Pro. Le deuxième est une couche illustrant la frontière nationale de l’Espagne, que vous utiliserez par la suite pour découper les données dans le didacticiel.

  1. Démarrez ArcGIS Pro. Si vous y êtes invité, connectez-vous via votre compte d’organisation ArcGIS sous licence.
    Remarque :

    Si vous n’avez pas accès à ArcGIS Pro ou ne disposez pas d’un compte d’organisation ArcGIS, consultez les options disponibles pour accéder aux logiciels.

    Lorsque vous ouvrez ArcGIS Pro, vous avez la possibilité de créer un nouveau projet ou d’en ouvrir un existant. Si vous avez créé des projets auparavant, une liste de projets récents s’affiche.

  2. Sous New Project (Nouveau projet), cliquez sur Map (Carte).

    Créez un projet à l’aide du modèle de carte.

  3. Dans la fenêtre New Project (Nouveau projet), pour Name (Nom), saisissez EuropeanBadger_Habitat. Laissez le chemin d’accès inchangé sous Location (Emplacement) et assurez-vous que la case Create a folder for this project (Créer un dossier pour ce projet) est cochée.
  4. Cliquez sur OK.

    Vous allez maintenant ajouter deux éléments à partir du portail. Le premier est l’échantillon de géotraitement Download Species Occurrence Points (Télécharger les points d’occurrence de l’espèce) et le deuxième est une couche illustrant les frontières de l’Espagne. Cette couche permettra de découper et restreindre les données environnementales.

  5. Sur le ruban, cliquez sur l’onglet View (Vue). Dans le groupe Windows (Fenêtres), choisissez Catalog Pane (Fenêtre du catalogue).

    Ouvrez la fenêtre Catalog (Catalogue).

    La fenêtre Catalogue apparaît. La fenêtre Catalog (Catalogue) permet d’ajouter des éléments à un projet, d’afficher, de créer et de gérer des éléments et d’obtenir des informations sur leurs propriétés.

  6. Dans la fenêtre Catalog (Catalogue), cliquez sur l’onglet Portal (Portail) et sélectionnez Living Atlas (Atlas dynamique).

    Sélectionnez le portail Living Atlas.

  7. Dans la barre de recherche, recherchez Download Species Occurrence Points ou collez l’ID d’élément 927944e867624504bfd6c489b0d2aec7 et appuyez sur Entrée.
  8. Cliquez avec le bouton droit sur l’échantillon de géotraitement Download Species Occurrence Points (Télécharger les points d’occurrence de l’espèce), puis sélectionnez Add To Project (Ajouter au projet).

    Ajoutez l’outil Download Species Occurrence Points (Télécharger les points d’occurrence de l’espèce) au projet.

    L’échantillon de géotraitement est ajouté au projet.

  9. Recherchez la couche Spain Country Boundary (Limite de l’Espagne). Recherchez la couche d’entités Spain Country Boundary (Limite de l’Espagne) qui appartient à esri_dm et faites glisser le résultat sur la carte.

    Ajoutez la couche Spain Country Boundary (Limite de l’Espagne) à la carte.

    La couche apparaît sur la carte et est ajoutée à la fenêtre Contents (Contenu) sous le nom ESP_Country.

Télécharger les données d’observation des animaux depuis GBIF

Vous allez à présent télécharger les données d’observation des animaux depuis GBIF (Global Biodiversity Information Facility) à l’aide de l’échantillon de géotraitement Download Species Occurrence Points (Télécharger les points d’occurrence de l’espèce). GBIF est un référentiel de données mondial qui collecte les données sur les localisations où les espèces ont été enregistrées. Ces données proviennent de plusieurs sources, telles qu’iNaturalist, et sont mises en forme dans une structure commune pour une utilisation générale. Commencez par ouvrir la page de l’espèce sur le site GBIF pour vérifier le genre et l’espèce du blaireau européen. L’échantillon de géotraitement Download Species Occurrence Points (Télécharger les points d’occurrence de l’espèce) requiert la saisie de ces informations avec la bonne nomenclature : le nom du genre doit commencer par une majuscule et le nom de l’espèce doit être en minuscules.

Remarque : selon le statut de protection des espèces, les données de localisation peuvent être obscurcies pour empêcher le braconnage ou toute autre interférence. Le blaireau européen étant classé comme moins menacé selon la liste rouge IUCN, les données de localisation ne sont pas obscurcies.

  1. Ouvrez la page GBIF pour Meles meles.

    La page de vue d’ensemble des espèces apparaît. Cette page contient des informations sur le blaireau et notamment des photos soumises avec des enregistrements d’occurrence, une carte des localisations des observations et une description de l’activité et de l’écologie de cet animal.

  2. Faites défiler la page vers le bas et consultez les informations Description (Description), en payant une attention particulière aux sections Activity (Activité) et Biology Ecology (Biologie Écologie).
  3. Cliquez sur l’onglet Metrics (Métriques) et explorez les statistiques sur les observations.

    Cliquez sur l’onglet Metrics (Métriques).

    Les blaireaux ont été largement observés en Europe, principalement au cours des mois les plus chauds. Dans les climats plus froids, les blaireaux hibernent pour échapper à la météo hivernale. Vous allez maintenant télécharger les données d’occurrence dans votre projet.

  4. Dans ArcGIS Pro, dans la fenêtre Catalog (Catalogue), cliquez sur l’onglet Project (Projet) et développez le groupe Toolboxes (Boîtes à outils).

    Le projet comprend deux boîtes à outils. Une boîte à outils par défaut ajoutée lors de la création du projet et DownloadSpeciesOccurrencePoints.pyt.

  5. Développez la boîte à outils DownloadSpeciesOccurrencePoints.pyt, puis cliquez avec le bouton droit sur Download Species Occurrence Points (Télécharger les points d’occurrence de l’espèce) et sélectionnez Open (Ouvrir).

    Ouvrez l’outil Download Species Occurrence Points (Télécharger les points d’occurrence de l’espèce).

    L’outil Download Species Occurrence Points (GBIF) (Télécharger les points d’occurrence de l’espèce) s’ouvre.

  6. Pour Scientific Name (Nom scientifique), saisissez Meles meles.

    Remarque :
    Le paramètre Scientific Name (Nom scientifique) nécessite une mise en majuscules correcte. Vérifiez que le nom du genre commence par une majuscule et que le nom de l’espèce est en minuscules.

    Vous allez ensuite dessiner une zone d’étude. Dans l’outil Download Species Occurrence Points (GBIF) (Télécharger les points d’occurrence de l’espèce), les zones d’intérêt doivent inclure moins de 300 sommets. Le polygone des frontières de l’Espagne que vous avez ajouté à la carte est trop détaillé pour cet outil. Vous allez donc dessiner un polygone approximatif.

  7. Pour Study Area (Zone d’étude), cliquez sur l’outil de dessin et sélectionnez Polygons (Polygones).

    Dessinez un polygone pour le paramètre Study Area (Zone d’étude).

    Différents modèles de mise à jour apparaissent sous le paramètre Study Area (Zone d’étude). Par défaut, le modèle Polygon (Polygone) est sélectionné, mais vous pouvez également choisir d’autres modèles comme des cercles, des rectangles et des lignes à main levée.

  8. Cliquez sur la carte pour dessiner un polygone approximatif autour de l’Espagne.

    Zone d’étude autour de l’Espagne

    La zone d’étude dessinée peut être approximative, tant qu’elle englobe toute l’Espagne. Une fois les données téléchargées, vous allez utiliser l’outil Pairwise Clip (Découpage deux par deux) pour extraire uniquement les points d’observation à l’intérieur des frontières du pays.

  9. Pour Output Species Occurrence Points (Points d’occurrence de l’espèce en sortie), saisissez Melesmeles_GBIF_[date], en spécifiant la date de téléchargement du fichier. Cochez la case Generate and register DOI (Générer et enregistrer le DOI).

    Lorsque cette case est cochée, un identifiant d’objet numérique (DOI) est généré et enregistré avec GBIF.org. Il sert d’adresse permanente pour une description des occurrences enregistrées et téléchargées via l’outil. Cela est requis pour une bonne attribution de la source de données.

  10. Cliquez sur Run (Exécuter).

    Une fois l’exécution de l’outil terminée, la couche Melesmeles_GBIF_[date] est ajoutée à la fenêtre Contents (Contenu).

    Points d’observation de l’espèce

Explorer les données d’observation des animaux

Vous allez maintenant explorer les données d’observation des blaireaux que vous avez ajoutées dans ArcGIS Pro. Vous allez analyser les données extraites et vous assurer que la licence et les types de données sont corrects pour les types d’analyse à effectuer. Vous allez également découper la couche en sortie afin de créer un jeu de données qui contient uniquement les points situés dans votre zone d’intérêt, l’Espagne.

  1. Dans la fenêtre Catalog (Catalogue), cliquez avec le bouton droit sur la couche Melesmeles_GBIF_[date] et sélectionnez Attribute Table (Table attributaire).

    Ouvrez la table.

    La table contient des informations sur chaque observation. Chaque point d’observation s’accompagne d’informations descriptives, notamment un identifiant unique, la méthode d’observation et le type de licence. Pour ce didacticiel, vous pouvez uniquement utiliser des données dont le type de licence autorise l’utilisation publique. Ces licences sont CC0 1.0, qui affichent les données du domaine public, et CC BY 4.0, qui désigne les données qui peuvent être partagées et adaptées à partir du moment où la source de données d’origine et/ou le propriétaire a été attribué et qu’il existe une description des modifications. Vous allez supprimer les enregistrements qui ne correspondent pas à ces types de licences.

    En fonction de l’organisation ou de l’objectif pour lequel vous préparez ces données, vous pourrez peut-être utiliser des données avec une licence présentant des conditions différentes. Par exemple, si vous travaillez sur une recherche universitaire, il est probable que vous puissiez utiliser toutes les données de la couche, y compris les enregistrements définis pour une utilisation non commerciale. En cas de doute, utilisez uniquement les données dont vous êtes certain qu’elles appartiennent au domaine public.

  2. Sur le ruban, si nécessaire, cliquez sur l’onglet Map (Carte). Dans le groupe Selection (Sélection), cliquez sur Select By Attributes (Sélectionner selon les attributs).

    L’outil Select By Attributes (Sélectionner selon les attributs) s’ouvre.

  3. Dans l’outil Select By Attributes (Sélectionner selon les attributs), construisez la requête Where license is equal to http://creativecommons.org/licenses/by-nc/4.0/legalcode (Où la licence est égale à http://creativecommons.org/licenses/by-nc/4.0/legalcode).

    Requête de filtre

  4. Cliquez sur OK.

    Les points disposant d’une licence non commerciale sont à présent sélectionnés sur la carte et dans la table attributaire. Les enregistrements sélectionnés sont mis en surbrillance en bleu.

  5. En haut de la table attributaire, cliquez sur Delete (Supprimer). Dans la fenêtre Delete (Supprimer), cliquez sur Yes (Oui).

    Les enregistrements mis en surbrillance sont supprimés de la couche. Maintenant que le jeu de données contient uniquement des points que vous êtes autorisé à utiliser, vous allez utiliser l’outil Pairwise Clip (Découpage deux par deux) pour supprimer les enregistrements en dehors de l’Espagne.

  6. Dans la fenêtre Geoprocessing (Géotraitement), cliquez sur le bouton de retour. Recherchez et ouvrez l’outil Pairwise Clip (Découpage deux par deux).

    À l’ouverture de l’outil Pairwise Clip (Découpage deux par deux), une bannière en haut de l’outil vous avertit que la couche contient des mises à jour en attente.

  7. Dans l’outil Pairwise Clip (Découpage deux par deux), cliquez sur Save Edits (Enregistrer les modifications).

    Enregistrez les modifications apportées à la couche.

    Les modifications apportées à la couche sont maintenant enregistrées et les points sans licence sont définitivement supprimés de votre projet.

  8. Pour Input Features (Entités en entrée), sélectionnez la couche Melesmeles_GBIF_[date]. Pour Clip Features (Découper des entités), choisissez ESP_Country.
  9. Nommez Output Feature Class (Classe d’entités en sortie) EuropeanBadger_points, puis cliquez sur Run (Exécuter).

    Exécutez l’outil Pairwise Clip (Découpage deux par deux).

  10. Dans la fenêtre Contents (Contenu), désélectionnez les couches Melesmeles_GBIF_[date] et Download Species Occurrence Points (GBIF) Study Area (Polygons), puis fermez la table attributaire. Cliquez avec le bouton droit sur EuropeanBadger_points et sélectionnez Attribute Table (Table attributaire).

    Points de la zone d’étude

    Lors du traitement de ces données, il existait 2 678 points d’observation qui répondaient aux exigences en matière de licence et de sélection. Votre jeu de données est susceptible d’être différent.

Vérifier les types de champ

Maintenant que les données ont été découpées de façon à contenir uniquement les points dans votre zone d’intérêt, vous allez vérifier que vous disposez de tous les types de champs requis pour l’analyse. Selon la façon dont les données sont collectées et traitées, il est courant que les données numériques soient enregistrées sous forme de texte, ou les dates sous forme de nombres. Dans cette analyse, le champ de date est important pour tenir compte des éventuels changements saisonniers. Pour vous assurer que le champ de date est dans le bon format pour une analyse ultérieure, vérifiez l’appariement des champs. Vous allez ensuite créer un diagramme Calendar Heat (Calendrier des zones de chaleur) pour évaluer si des modèles saisonniers s’appliquent aux observations.

  1. Sur le ruban, cliquez sur l’onglet Table. Dans le groupe Field (Champ), cliquez sur Fields (Champs).

    La vue Fields (Champs) s’ouvre. Cette table répertorie tous les champs attributaires de la couche EuropeanBadger_points, leur alias, le type de données et d’autres informations.

  2. Faites défiler la vue Fields (Champs) jusqu’à l’attribut eventDate. Vérifiez que Data Type (Type de données) est défini sur Date Only (Date uniquement).

    Type de champ Date Only (Date uniquement)

    Le champ eventDate est au format correct pour être utilisé dans l’analyse. Si ce champ n’était pas encore présent, vous pouvez également calculer un nouveau champ de date en concaténant les champs year (année), month (mois) et day (jour) dans la table. Notez que ces champs sont actuellement stockés sous forme de champs numériques.

  3. Fermez la vue Fields (Champs).

    Maintenant que vous avez vérifié le type de données du champ de date, vous pouvez l’utiliser pour créer un diagramme.

  4. Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit sur la table EuropeanBadger_points, cliquez sur Create Chart (Créer un diagramme), puis sélectionnez Calendar Heat Chart (Diagramme Calendrier de zones de chaleur).

    Créez un diagramme Calendar Heat (Calendrier de zones de chaleur).

    Une fenêtre Chart (Diagramme) vide apparaît.

  5. Dans la fenêtre Chart Properties (Propriétés du diagramme), pour Date, sélectionnez le champ eventDate.

    Représentez le champ stdTime.

    Le diagramme est alimenté et représente les zones de chaleur du mois et du jour de l’observation. Les observations ont eu lieu tout au long de l’année, mais plus souvent au cours des mois plus frais d’automne et d’hiver.

    Diagramme des observations de blaireaux par mois

Supprimer les points d’observation excédentaires

Un autre élément à prendre en compte lors de la préparation des données est la répétition dans le jeu de données. Selon la méthode de collecte, certains points pourraient être surreprésentatifs des emplacements des blaireaux, par exemple les études qui suivent les déplacements des animaux plutôt que d’indiquer simplement leur observation. Vous allez rechercher les agrégats de points et supprimer ceux qui pourraient influencer l’analyse.

Remarque :

Si vous prévoyez d’utiliser une méthode d’analyse comme la prévision de présence seule (MaxEnt), la préparation des données effectuée dans cette section est incluse dans l’outil de géotraitement. Mais si vous prévoyez d’utiliser d’autres méthodes d’analyse telles que la régression, certaines étapes sont indispensables pour préparer vos données.

  1. Sur la carte, effectuez un zoom avant sur l’agrégat au sud de Séville.

    Effectuez un zoom avant sur l’agrégat de points au sud de Séville.

    Cet agrégat de points se trouve dans le parc national de Doñana et semble représenter des traces animales, ce qui signifie que chaque ensemble de points correspond sans doute à un seul animal.

  2. Sur le ruban, dans l’onglet Map (Carte), dans le groupe Selection (Sélection), cliquez sur Select (Sélectionner) et dessinez un rectangle sur la carte autour des points dans le parc national de Doñana.
  3. Au bas de la table attributaire, cliquez sur Show selected records (Afficher les enregistrements sélectionnés).

    Afficher les enregistrements sélectionnés

    La table est filtrée pour n’afficher que les enregistrements sélectionnés. En fonction de la manière dont vous avez dessiné votre sélection, environ la moitié des points d’observation se trouvent dans le parc national, et vous constatez que la majorité des points ont été obtenus grâce à une étude de suivi. Pour éviter une surreprésentation de cette zone dans les futures analyses, vous allez affiner ces points.

  4. Dans la fenêtre Geoprocessing (Géotraitement), recherchez l’outil Delete Identical (Supprimer l’élément identique) et ouvrez-le.

    En haut de l’outil, un avertissement indique que l’outil modifie le jeu de données en entrée. L’outil Delete Identical (Supprimer l’élément identique) supprime définitivement des points de la couche d’entités que vous allez entrer, mais ne modifie pas la couche Melesmeles_GBIF_[date], au cas où vous ayez besoin d’accéder à certains des points supprimés.

  5. Pour Input Dataset (Jeu de données en entrée), sélectionnez EuropeanBadger_points et laissez le bouton bascule Use the selected records (Utiliser les enregistrements sélectionnés) activé.
  6. Pour Fields (Champs), sélectionnez Shape (Forme). Pour XY Tolerance (Tolérance XY), sélectionnez 500 Meters (500 mètres) et cliquez sur Run (Exécuter).

    Supprimez les enregistrements identiques.

    Une fois l’exécution de l’outil terminée, la table attributaire devra être actualisée, car certains des enregistrements sélectionnés sont maintenant supprimés.

  7. Fermez la table Attribute (Attribut).
  8. Sur le ruban, dans le groupe Selection (Sélection), cliquez sur Clear (Effacer) pour supprimer la sélection.

    Il reste de nombreux points dans le parc national, mais ils ont été affinés.

  9. Rouvrez la table attributaire et vérifiez le nombre de points de présence restants répertoriés en bas de la table.

    En fonction des points que vous aviez sélectionnés, ce nombre peut varier. Vous voudrez généralement créer le même nombre de points d’arrière-plan que d’observations. Vérifiez donc bien vos points.

  10. Enregistrez le projet.

Dans cette section, vous avez téléchargé les données d’observation des Meles meles dans ArcGIS Pro à l’aide de l’outil Download Species Occurrence Points (GBIF) (Télécharger les points d’occurrence de l’espèce). Vous avez ensuite commencé la préparation des données en supprimant les points d’observation avec une licence restrictive et les points hors de votre zone d’intérêt, en vérifiant les types de champs et en supprimant les points en double. Dans la prochaine section, vous allez ajouter des variables environnementales pour préparer les données pour l’analyse.


Points de présence de carte ou de pseudo-absence

La modélisation de la distribution des espèces peut être effectuée de différentes manières, avec plusieurs méthodes statistiques. Un certain nombre de ces méthodes requièrent à la fois des données de présence et d’absence ou, dans votre cas, des données de pseudo-absence. Elles nécessitent également des données environnementales pour déterminer quels types de conditions climatiques et d’habitat sont adaptés aux espèces animales. Maintenant que vous avez téléchargé et nettoyé les données de présence, vous pouvez générer les données de pseudo-absence ou d’arrière-plan et extraire les données attributaires environnementales à chaque emplacement.

Générer des points de pseudo-absence échantillonnés aléatoirement

Maintenant que vos données de présence sont prêtes, vous allez générer des points de pseudo-absence. La méthode la plus simple consiste à utiliser la génération aléatoire dans la zone d’étude. Pour vous assurer que les points de présence et de pseudo-absence sont équitablement pondérés, vous allez créer le même nombre de points d’arrière-plan que de points de présence.

  1. Dans la fenêtre Geoprocessing (Géotraitement), recherchez et ouvrez l’outil Create Spatial Sampling Locations (Créer des localisations d’échantillonnage spatial).

    L’outil Create Spatial Sampling Locations (Créer des localisations d’échantillonnage spatial) génère des localisations d’échantillonnage dans une zone d’étude continue à l’aide de conceptions d’échantillonnage aléatoire simple, stratifié, systématique (maillé) ou par agrégat.

  2. Saisissez les paramètres suivants et cliquez sur Run (Exécuter) :

    • Input Study Area (Zone d’étude en entrée) : ESP_Country
    • Output Features (Entités en sortie) : ESP_randomsample
    • Sampling Method (Méthode d’échantillonnage) : Simple random (Aléatoire simple)
    • Number of Samples (Nombre d’échantillons) : nombre de points dans votre table EuropeanBadger_points

    Créez une couche de points échantillonnés de manière aléatoire.

    La couche de points aléatoires en Espagne est ajoutée à la carte. Ce jeu de données peut maintenant être associé à votre couche EuropeanBadger_points.

    Points échantillonnés de manière aléatoire

  3. Fermez la table attributaire EuropeanBadger_points.
  4. Dans la fenêtre Geoprocessing (Géotraitement), recherchez et ouvrez l’outil Merge (Fusionner).
  5. Pour Input Datasets (Jeux de données en entrée), choisissez ESP_randomsample et EuropeanBadger_points. Pour Output Dataset (Jeu de données en sortie), saisissez badger_sample_set.

    Dans l’outil Merge (Fusionner), vous pouvez choisir les champs à ajouter à la nouvelle couche et en créer de nouveaux. Vous allez ajouter un nouveau champ Presence (Présence) que vous allez utiliser pour différencier les points d’observation des données GBIF et les points d’arrière-plan de l’échantillon aléatoire.

  6. Pour Field Matching Mode (Mode d’appariement de champs), choisissez Use the field map to reconcile field differences (Utiliser l’appariement des champs pour réconcilier les différences de champs).
  7. Pour Field Map (Appariement des champs), cliquez sur le menu déroulant Add Fields (Ajouter des champs) et sélectionnez Add Empty Field (Ajouter un champ vide).

    Ajoutez un champ vide.

  8. Renommez NewField (Nouveau champ) en Presence (Présence) et appuyez sur Entrée.

    Par défaut, le champ Presence (Présence) est défini comme un champ de type Text (Texte).

  9. Pointez sur le champ Presence (Présence) et cliquez sur Edit (Modifier).

    Modifiez le champ Presence (Présence).

  10. Dans la fenêtre Field Properties (Propriétés du champ), cliquez sur Type et choisissez Short (Court).

    Définissez le type du champ Presence (Présence) sur Short (Court).

  11. Dans la fenêtre Field Properties (Propriétés du champ), cliquez sur OK, puis exécutez l’outil Merge (Fusionner).

    Remarque :

    Le champ Presence (Présence) inclut un avertissement indiquant qu’il est vide.

  12. Dans la fenêtre Contents (Contenu), décochez les couches ESP_randomsample et EuropeanBadger_points pour les désactiver. Cliquez avec le bouton droit de la souris sur la couche badger_sample_set et sélectionnez Attribute Table (Table attributaire).

    Pour distinguer les points de présence et d’absence sur votre nouvelle couche, vous allez calculer les valeurs pour le champ Presence (Présence). Généralement, les points de présence s’affichent avec la valeur 1 et les points d’arrière-plan avec la valeur 0. Lorsque vous faites défiler la table, notez que les points fusionnés ont de nombreux champs de données nuls. Vous allez utiliser ces champs nuls pour sélectionner les points d’arrière-plan.

  13. Dans la table, cliquez sur Select By Attributes (Sélectionner selon les attributs). Dans la fenêtre Select By Attributes (Sélectionner selon les attributs), créez l’expression Where kingdom is null (Lorsque le royaume est nul) et cliquez sur Apply (Appliquer).

    Sélectionnez des points dont l’attribut kingdom (royaume) est nul.

  14. Dans la table attributaire, faites défiler l’affichage jusqu’à ce que le champ Presence (Présence) apparaisse. Cliquez avec le bouton droit de la souris sur le nom de la colonne Presence (Présence) et sélectionnez Calculate Field (Calculer un champ).

    Calculez le champ Presence (Présence).

  15. Dans la fenêtre Calculate Field (Calculer un champ), pour Presence = (Présence =), saisissez 0 et cliquez sur OK.
  16. Dans la fenêtre Select By Attributes (Sélectionner selon les attributs), cochez la case Invert Where Clause (Inverser la clause Where) et cliquez sur OK.

    Inversez la clause Where.

  17. Cliquez avec le bouton droit de la souris sur le nom de la colonne Presence (Présence) et sélectionnez Calculate Field (Calculer un champ). Créez l’expression Presence =1 et cliquez sur OK.

    Maintenant que les entités sont codées avec une valeur 1 pour la présence observée et une valeur 0 pour la pseudo-absence.

  18. Sur le ruban, cliquez sur Clear (Effacer) pour effacer la sélection. Fermez la table attributaire et enregistrez le projet.

Préparer les données environnementales

Vous allez ensuite localiser et préparer les variables environnementales qui pourraient aider à déterminer la présence des blaireaux. Souvenez-vous que les données GBIF ont montré que les blaireaux préfèrent une bonne couverture végétale pour leur habitat d’alimentation. Grâce à la description des animaux dans les données GBIF, vous savez que dans le centre de l’Espagne, les blaireaux préfèrent les zones à moyenne altitude avec des forêts et des prairies, et évitent les zones à basse altitude.

  1. Téléchargez le fichier SpainPortugalElev.zip sur votre ordinateur et décompressez-le dans le dossier de projet ArcGIS dans lequel vous travaillez.

    Ce fichier contient un fichier tif nommé SpainPortugalElev. Ce fichier a été créé à partir de deux images raster téléchargées à partir du dossier USGS EROS Archive - Digital Elevation - Global Multi-resolution Terrain Elevation Data 2010 qui ont été mosaïquées ensemble pour couvrir l’ensemble de l’Espagne, puis attachées à l’Espagne et au Portugal. Pour plus d’informations sur la création d’un jeu de données mosaïque, reportez-vous à la documentation. Vous allez utiliser cette image raster pour créer un jeu de données de pente pour l’Espagne.

    Vous pouvez accéder à des données de pente et d’élévation plus détaillées à partir de ArcGIS Living Atlas. Cependant, en raison des limites d’exportation des données, qui limitent les exportations à 4 000 x 4 000 pixels à la fois, les données ArcGIS Living Atlas ne sont pas le meilleur choix pour une zone d’étude aussi grande.

  2. Dans la fenêtre Catalog (Catalogue), cliquez sur l’onglet Project (Projet) et développez le groupe Folder (Dossier), puis le dossier du projet EuropeanBadger_Habitat.
  3. Localisez l’image SpainPortugalElev.tif que vous avez décompressée et faites-la glisser sur la carte.

    Remarque :

    Si vous êtes invité à créer des pyramides et à calculer des statistiques pour la couche, cliquez sur OK.

  4. Dans la fenêtre Contents (Contenu), décochez les couches badger_sample_set et ESP_Country pour les désactiver.

    Données d'altitude

    Le raster d’élévation est dessiné sur la carte. Vous pouvez utiliser ce raster pour calculer la pente, une autre variable qui peut aider à déterminer l’habitat des blaireaux.

    Remarque :
    Si l’image n’apparaît pas immédiatement, vérifiez que la couche est sélectionnée dans la fenêtre Contents (Contenu). Sur le ruban, cliquez sur l’onglet Raster Layer (Couche raster), puis dans le groupe Rendering (Rendu), cliquez sur DRA (Ajustement dynamique de la plage). La fonction d’ajustement dynamique de la plage (DRA) règle automatiquement le type d’étirement actif lorsque vous naviguez dans l’image, en fonction des valeurs de pixel de l’affichage actuel.

  5. Dans la fenêtre Geoprocessing (Géotraitement), recherchez et ouvrez Surface Parameters (Spatial Analyst Tools) (Paramètres de surface [Outils Spatial Analyst]).
  6. Saisissez les paramètres suivants et cliquez sur Run (Exécuter) :

    • Input surface raster (Raster de surface en entrée) : SpainPortugalElev.tif
    • Output Raster (Raster en sortie) : Spain_Slope
    • Input analysis mask (Masque d’analyse en entrée) : ESP_Country
    • Parameter type (Type de paramètre) : Slope (Pente)
    • Local surface type (Type de surface locale) : Quadratic (Quadratique)
    • Slope measurement (Mesure de pente) : Degree (Degré)

    La couche Spain_Slope est ajoutée à la carte. Les valeurs de pente s’affichent en degrés.

    Couche de pente dérivée du raster d’élévation

    La couche environnementale suivante à rechercher est l’occupation du sol. Pour cela, vous allez utiliser les données WorldCover 2021 de l’Agence spatiale européenne. WorldCover cartographie 11 types d’occupation du sol.

  7. Dans la fenêtre Catalog (Catalogue), cliquez sur l’onglet Portal (Portail) et sélectionnez Living Atlas (Atlas dynamique).
  8. Recherchez la couche ESA WorldCover et faites-la glisser sur la carte.

    Ajoutez l’occupation du sol à la carte.

    La couche WorldCover est dessinée sur la carte. Cette couche contient 11 classes d’occupation du sol avec une résolution à 10 mètres.

    Couche ESA WorldCover affichant l’occupation du sol pour l’Espagne

Préparer les données bioclimatiques

Outre la pente, l’élévation et l’occupation du sol, d’autres variables utiles à la modélisation de l’habitat des blaireaux sont des données bioclimatiques. Vous allez ajouter plusieurs couches à partir du projet CHELSA Bioclimate Projections. Les couches CHELSA fournissent des estimations réduites des variables climatiques et bioclimatiques moyennées sur des périodes de 30 ans (2011-2040, 2041-2070 et 2071-2100) à partir de CMIP6 ISIMIP3b. Les expériences sur le climat CMIP6 ISIMIP3b s’appuient sur les trajectoires socio-économiques partagées (SSP) pour modéliser les scénarios climatiques futurs. Pour cette étude, vous allez utiliser SSP3-7.0 sur la période 2011-2040 ou le début du siècle. Ce scénario est adapté, car il ressemble étroitement à la situation mondiale actuelle, y compris en matière de conflits entre les pays, de disparités en termes de richesse et d’inégalité sociale. L’ensemble des horizons temporels et des scénarios SSP sont accessibles à partir de l’onglet Multidimensional (Multidimensionnel).

  1. Dans la fenêtre Catalog (Catalogue), cliquez sur l’onglet Portal (Portail) et sélectionnez Living Atlas (Atlas dynamique).
  2. Dans la barre de recherche, saisissez CHELSA et appuyez sur la touche Entrée.

    Les 19 couches CHELSA Bioclimate Projection apparaissent. Ces prédicteurs bioclimatiques ont été définis par l’USGS. En fonction de l’analyse que vous souhaitez exécuter, de la zone d’étude et du comportement des espèces, toutes ces couches bioclimatiques peuvent être applicables. Dans le cadre de ce didacticiel, vous allez sélectionner trois éléments à ajouter à la couche badger_sample_set. Si vous choisissez d’ajouter davantage de variables, le temps de traitement peut être plus long.

  3. Tout en maintenant la touche Ctrl enfoncée, cliquez sur les couches CHELSA suivantes pour les sélectionner, puis faites-les glisser sur la carte.

    • Température annuelle moyenne (Bio1)
    • Précipitations annuelles (Bio12)
    • Saisonnalité de la température (Bio4)

    Ajoutez les couches Bioclimate Projections.

    Les trois couches bioclimatiques sont ajoutées à la carte. Chaque couche contient trois scénarios : SSP2-4.5, SSP3-7.0 et SSP5-8.5 pour modéliser les conditions futures potentielles en fonction des émissions de gaz à effet de serre, des stratégies politiques et sociales, et d’autres évolutions. Ces informations sont stockées dans chaque couche dans un format multidimensionnel. Pour la modélisation dans ce projet, vous allez utiliser SSP3-7.0 sur la période 2011-2040. Ce scénario représente des émissions élevées et l’évolution moyenne qui peut se produire par rapport aux moyennes climatiques historiques au milieu du siècle.

  4. Dans la fenêtre Contents (Contenu), cliquez sur la couche Annual Mean Temperature (Bio1) pour la sélectionner. Sur le ruban, cliquez sur l’onglet Multidimensional (Multidimensionnel).
  5. Dans le groupe Current Display Slice (Tranche actuellement affichée), remplacez Variable par SSP370 et StdTime par 25-12-01T00:00:00.

    Paramètres de raster multidimensionnel

    Remarque :

    Les périodes 1981-2010, 2011-2040, 2041-2070 et 2071-2100 sont représentées dans le raster multidimensionnel par l’année au milieu de chaque période : 1995, 2025, 2055 et 2085.

  6. Modifiez les paramètres Variable et StdTime pour les couches Annual Precipitation (Bio12) et Temperature Seasonality (Bio4) en utilisant respectivement SSP370 et 25-12-01T00:00:00.

    Les variables bioclimatiques sont maintenant prêtes à être ajoutées au jeu d’échantillons sur le blaireau.

Extraire les données environnementales

Maintenant que vous disposez de données d’habitat et de données bioclimatiques dans le projet, vous allez utiliser l’outil Extract Multi Values to Points (Extraction de valeurs multiples vers des points) pour obtenir les valeurs raster pour l’emplacement de chaque point. Ces valeurs sont ajoutées à la table en entrée.

  1. Dans le volet Geoprocessing (Géotraitement), recherchez l’outil Extraire plusieurs valeurs pour les points et ouvrez-le.
  2. Pour Input point features (Entités ponctuelles en entrée), choisissez badger_sample_set.
  3. Pour Input rasters (Rasters en entrée), cliquez sur Add Many (Ajouter plusieurs), puis sélectionnez Toggle All Checkboxes (Activer/Désactiver toutes les cases à cocher).

    Ajoutez plusieurs rasters.

    Six couches raster sont ajoutées au paramètre Input rasters (Rasters en entrée) : Spain_Slope, SpainPortugalElev, LandCover, Annual Precipitation (Bio12), Temperature Seasonality (Bio4) et Annual Mean Temperature (Bio1).

  4. Pour Output field name (Nom de champ en sortie), modifiez les champs comme suit :

    • annual_mean_temp (temp_annuelle_moy)
    • annual_precip (précip_annuelles)
    • temp_seasonality (saisonnalité_temp)
    • landcover (occupation_sol)
    • pente
    • élévation

    Avant d’exécuter l’outil, vous allez définir l’étendue de traitement sur les frontières de l’Espagne que vous avez utilisées. Dans la mesure où les couches WorldCover et Bioclimate sont des jeux de données mondiaux, la définition de Processing Extent (Étendue de traitement) vous aide à extraire uniquement les données dont vous avez besoin.

  5. Cliquez sur l’onglet Environnements.

    Cliquez sur l'onglet Environnements.

  6. Développez le groupe Processing Extent (Étendue de traitement). Cliquez sur Extent of a Layer (Étendue d’une couche) et choisissez la couche ESP_Country.

    Définissez l’étendue de traitement.

  7. Cliquez sur Run (Exécuter).

    L’exécution de cet outil peut prendre un certain temps. Une fois l’outil exécuté, la couche badger_sample_set présente six nouvelles variables dans la table attributaire. Vous allez utiliser les outils d’ingénierie des données pour explorer les données que vous venez d’ajouter.

Utiliser l'ingénierie des données

Vous allez maintenant utiliser les outils d’ingénierie des données pour explorer les données. Les outils d’ingénierie des données dans ArcGIS Pro vous permettent d’explorer, de visualiser, de nettoyer et de préparer vos données pour analyse. Dans cette section, vous allez utiliser les outils d’ingénierie des données pour mieux comprendre les variables environnementales que vous avez extraites dans votre jeu d’échantillons.

  1. Dans la fenêtre Contents (Contenu), cliquez avec le bouton droit sur la couche badger_sample_set et sélectionnez Data Engineering (Ingénierie des données).

    Ouvrez les outils d’ingénierie des données.

    La vue Data Engineering (Ingénierie des données) s’ouvre. Le type de préparation des données que vous choisissez dépend du type de modélisation que vous voulez utiliser pour créer votre modèle d’adéquation de l’habitat. Par exemple, si vous prévoyez d’utiliser l’analyse de régression, vous pouvez utiliser l’outil Transform (Transformer) pour transformer les données asymétriques en distribution normale.

  2. Dans la fenêtre Fields (Champs), maintenez la touche Maj enfoncée et sélectionnez les six champs que vous venez d’extraire dans le jeu d’échantillons : annual_mean_temp (temp_annuelle_moy), annual_precip (précip_annuelles), temp_seasonality (saisonnalité_temp), landcover (occupation_sol), slope (pente) et elevation (élévation).
  3. Faites glisser les champs sélectionnés dans la fenêtre Statistics (Statistiques) vide au milieu de la fenêtre.

    Ajoutez des champs à la fenêtre Statistics (Statistiques).

    Les données environnementales que vous avez recueillies pour votre projet de modélisation de l’habitat sont ajoutées à la fenêtre Statistics (Statistiques).

  4. Dans la fenêtre Data Engineering (Ingénierie des données), sur le ruban, cliquez sur Calculate (Calculer).

    Calculer les statistiques

    Les statistiques pour les champs sont calculées, y compris la moyenne, les valeurs uniques et les points aberrants. Vous pouvez utiliser ces statistiques pour commencer à identifier des modèles dans vos données.

  5. Faites défiler la fenêtre Statistics (Statistiques) jusqu’à la colonne Outliers (Points aberrants).

    Le champ présentant le plus grand nombre de points aberrants statistiques est le champ annual precipitation (précipitations annuelles).

  6. Cliquez avec le bouton droit de la souris sur l’enregistrement Outliers (Points aberrants) du champ annual_precip (précip_annuelles) et sélectionnez Select Outliers (Sélectionner les points aberrants).

    Sélectionnez les points aberrant sur la carte.

    Les points aberrants sont sélectionnés sur la carte. Un grand nombre de points aberrants se trouvent au nord de l’Espagne, dans ou à proximité de la région des monts Cantabriques et des Pyrénées.

    Points aberrants sélectionnés sur la carte

    Pour visualiser ces valeurs, vous allez utiliser un histogramme.

  7. Dans la fenêtre Statistics (Statistiques), cliquez avec le bouton droit sur l’histogramme pour le champ annual_precip (précip_annuelles). Cliquez sur Open Histogram (Ouvrir l’histogramme).

    Ouvrez l’histogramme.

    L’histogramme du champ annual_precip (précip_annuelles) s’ouvre. Les points aberrants que vous avez sélectionnés apparaissent sur l’histogramme. Grâce à l’histogramme, vous pouvez voir que tous les points aberrants sont dans la partie haute ou dans des zones avec une pente plus abrupte. Vous allez maintenant vous intéresser à la température annuelle moyenne.

  8. Sur l’histogramme Distribution of slope (Distribution de la pente), sur le ruban, cliquez sur Clear Selection (Effacer la sélection), puis fermez l’histogramme.

    Effacez les points sélectionnés.

  9. Dans la fenêtre Statistics (Statistiques), pour le champ annual_mean_temp (temp_annuelle_moy), cliquez avec le bouton droit sur Chart Preview (Aperçu du diagramme) et sélectionnez Open Histogram (Ouvrir l’histogramme).

    L’histogramme s’ouvre. Pour comprendre quelle température les blaireaux préfèrent, vous allez sélectionner les points de présence du blaireau.

  10. Sur le ruban, cliquez sur l’onglet Map (Carte). Dans le groupe Selection (Sélection), cliquez sur Select by Attributes (Sélectionner selon les attributs).
  11. Dans la fenêtre Select by Attributes (Sélectionner selon les attributs), effacez les expressions existantes et créez l’expression Where Presence is equal to 1 (Où la présence est 1). Cliquez sur OK.

    Les points de présence sont sélectionnés sur la carte et sur le diagramme.

    Points de présence sélectionnés sur la carte

    D’après le diagramme, il semble que les blaireaux préfèrent les températures plus chaudes.

    Conseil :

    Si vous ne voyez pas à la fois les données sélectionnées et non sélectionnées sur le diagramme, sur le ruban du diagramme, dans le groupe Filter (Filtrer), assurez-vous que le filtre Selection (Sélection) est désactivé.

    Vous pouvez utiliser les outils d’ingénierie des données pour étudier les autres variables bioclimatiques et apporter les modifications nécessaires aux données.

  12. Effacez la sélection et fermez le diagramme.

    La dernière étape avant d’utiliser les données pour la modélisation consiste à ajouter une attribution.

Modifier les métadonnées

Maintenant que votre jeu de données est nettoyé et contient les variables environnementales requises pour commencer la modélisation, vous devez vérifier que la couche a la bonne attribution. De nombreux points d’observation ont une licence CC BY 4.0, qui nécessite une attribution. Lorsque vous avez utilisé l’outil Download Species Occurrence Points (GBIF) (Télécharger les points d’occurrence de l’espèce) plus tôt, vous avez généré un identifiant d’objet numérique (DOI) qui servira de base à cette attribution.

  1. Sur le ruban, cliquez sur l’onglet Analysis (Analyse). Dans le groupe Geoprocessing (Géotraitement), cliquez sur History (Historique).

    Ouvrir l’historique de géotraitement

  2. Cliquez avec le bouton droit sur l’enregistrement Download Species Occurrence Points (GBIF) (Télécharger les points d’occurrence de l’espèce) et sélectionnez View Details (Afficher les détails).

    La fenêtre des détails de l’outil s’affiche. Cette fenêtre enregistre tous les paramètres avec lesquels vous avez exécuté l’outil, ainsi que les messages générés pendant son exécution. Le DOI est enregistré dans l’onglet Messages.

  3. Cliquez sur l’onglet Messages.
  4. Lisez la section Citation Requirements (Exigences de citation), puis accédez au bas de la table, où figure le DOI.
  5. Copiez le DOI pour votre jeu de données.

    Copiez le DOI.

    Vous allez maintenant créer votre citation.

  6. Sur le ruban, cliquez sur l’onglet View (Vue). Dans le groupe Windows (Fenêtres), choisissez Catalog View (Vue du catalogue).

    Ouvrez la vue du catalogue.

    La vue Catalog (Catalogue) s’ouvre. La vue Catalog (Catalogue) et la fenêtre Catalog (Catalogue), avec lesquelles vous avez jusqu’à présent travaillé dans ce didacticiel, présentent de nombreuses similitudes, mais les métadonnées peuvent uniquement être modifiées dans la vue Catalog (Catalogue).

  7. Dans la vue Catalog (Catalogue), développez Databases (Bases de données) et EuropeanBadger_Habitat.gdb, puis cliquez sur la couche badger_sample_set.

    Ouvrez les métadonnées de la couche badger_sample_set.

    L’éditeur de métadonnées s’ouvre. Actuellement, les métadonnées sont vierges, sauf l’historique de géotraitement, qui indique les outils Join Field (Joindre un champ) et Calculate Field (Calculer un champ) que vous avez exécutés.

  8. Sur le ruban, sous l’onglet Catalog (Catalogue), dans le groupe Metadata (Métadonnées), cliquez sur Edit (Modifier).

    Modifiez les métadonnées de la couche.

    L’éditeur de métadonnées s’ouvre.

  9. Saisissez les informations suivantes dans la fenêtre Metadata (Métadonnées) :

    • Title (Titre) : Jeu de données d’échantillons sur le blaireau européen
    • Tags (Étiquettes) : modélisation d’espèce, Meles meles, blaireau européen
    • Summary (Purpose) (Synthèse [Objet]) : ce jeu de données a été créé dans le didacticiel Échantillonner les espèces et les données environnementales pour la modélisation de distribution afin de modéliser l’habitat du blaireau européen (Meles meles) en Espagne.
    • Description (Abstract) (Description [Résumé]) : Le blaireau européen est une espèce importante, qui assure trois fonctions au sein de l’écosystème : dispersion des graines, mélange des couches supérieures du sol et création d’un micro-habitat. Pour modéliser son habitat en Espagne, les données d’observation des animaux ont été téléchargées depuis GBIF et enregistrées dans le champ Presence (Présence) avec une valeur de 1. Les points de pseudo-absence ou d’arrière-plan ont été générés et fusionnés avec les données d’observation. Les données environnementales, y compris la pente, l’élévation, l’occupation du sol et les variables bioclimatiques, ont été extraites vers ces points.

  10. Dans la section Credits (Crédits), saisissez la citation suivante et copiez le DOI unique généré pour votre jeu de données.

    GBIF.org ([ACCESS DATE]) GBIF Occurrence Download. DOI : [votre DOI]

    Saisissez la citation GBIF dans la section Credits (Crédits).

  11. En bas de l’éditeur de métadonnées, cliquez sur New Bounding Box (Nouvelle emprise).

    Ajoutez une nouvelle emprise.

  12. Saisissez les coordonnées suivantes :

    OuestEstSudNord

    -17.7532431

    5.6396581

    26.8567504

    44.3051478

  13. Sur le ruban, sous l’onglet Metadata (Métadonnées), cliquez sur Save (Enregistrer).
  14. Fermez l’éditeur de métadonnées et enregistrez le projet.

Vous disposez maintenant d’un jeu de données relatif au blaireau européen, que vous pouvez utiliser pour modéliser la distribution de l’espèce. Le jeu de données contient à la fois les points de présence et de pseudo-absence, ainsi que des données environnementales sur la pente, l’élévation, l’occupation du sol, la température, etc. Ces informations peuvent être utilisées dans les modèles tels que MaxEnt ou la prévision aléatoire des forêts pour procéder à la modélisation de la distribution de l’espèce.