Descargar datos de observación de las especies
El primer paso consiste en obtener datos de observación, o datos de presencia, de la especie de interés. En esta sección, descargará datos del Global Biodiversity Information Facility (GBIF), que combina datos de observación de múltiples fuentes para su uso científico. A continuación, agregará los datos de observación del tejón a ArcGIS Pro y se asegurará de que los tipos de datos son correctos para los tipos de análisis que desea realizar.
Configurar su proyecto ArcGIS
En primer lugar, configure el proyecto de ArcGIS Pro en el que trabajará con los datos. Más adelante en el tutorial, agregará una capa que muestre la frontera nacional de España para utilizarla como datos de recorte.
- Inicie ArcGIS Pro. Si se le pide, inicie sesión en su cuenta de organización con licencia de ArcGIS.
Nota:
Si no tiene acceso a ArcGIS Pro o una cuenta de organización de ArcGIS, consulte las opciones de acceso a software.
Al abrir ArcGIS Pro, tendrá la opción de crear un proyecto nuevo o abrir uno existente. Si ya había creado algún proyecto antes, verá una lista de proyectos recientes.
- En Nuevo proyecto, haga clic en Mapa.
- En la ventana Nuevo proyecto, en Nombre, escriba EuropeanBadger_Habitat. Deje Ubicación como está y confirme que Crear una carpeta para este proyecto esté activado.
- Haga clic en Aceptar.
En primer lugar, agregará al mapa una capa que muestre las fronteras de España. Esta capa se utilizará para recortar y restringir los datos medioambientales.
- En la cinta, haga clic en la pestaña Vista. En el grupo Ventanas, elija Panel Catálogo.
Aparece el panel Catálogo. El panel Catálogo se puede utilizar para agregar elementos a un proyecto, ver, crear y administrar elementos y obtener información sobre las propiedades del elemento.
- En el panel Catálogo, haga clic en la pestaña Portal y elija Living Atlas.
- Busque la capa Fronteras de España. Busque la capa de entidades Fronteras de España propiedad de esri_dm y arrastre el resultado al mapa.
La capa se dibuja en el mapa y se agrega al panel Contenido como ESP_Country.
Descargar datos de observación de animales de GBIF
A continuación, descargará datos de observación de animales del Global Biodiversity Information Facility (GBIF). GBIF es un repositorio mundial de datos que recoge información sobre los lugares donde se han registrado especies. Se incluyen datos de múltiples fuentes, como iNaturalist, y se formatean en un esquema común para su uso generalizado.
Nota: en función del estado de protección de la especie, los datos de ubicación pueden estar ocultos para evitar la caza furtiva u otras interferencias. El tejón europeo está clasificado por la Lista Roja de la UICN como de Preocupación Menor, por lo que los datos de ubicación no quedan ocultos.
- Vaya a la Página de GBIF del Meles meles.
Aparece la página de resumen de especies. Esta página muestra información sobre el tejón, incluidas las fotos que se han enviado con los registros de presencia, un mapa de los lugares donde se han producido avistamientos y una descripción de la actividad y la ecología del animal.
- Inicie sesión o regístrese para obtener una cuenta.
Los datos de GBIF son de libre acceso, pero solo pueden descargarlos usuarios con cuenta. Esto permite a GBIF generar una cita personalizada para cada usuario y dataset descargado.
- Desplácese hacia abajo y lea la información de la Descripción, prestando atención a las secciones Actividad y Ecología biológica.
- Haga clic en la pestaña Métricas y explore las estadísticas sobre avistamientos.
Los tejones han sido ampliamente avistados en toda Europa, sobre todo en los meses más cálidos. En los climas más fríos, los tejones hibernan para escapar del clima invernal. Para limitar los resultados, puede filtrar por país.
- En el gráfico Ocurrencias por país o zona, haga clic en España.
Se abre la pestaña Tabla, que muestra los registros de ocurrencias de España en forma de tabla. Antes de descargarlos, filtrará estos datos para asegurarse de que solo va a descargar datos que pueda representar cartográficamente. En primer lugar, filtrará los datos con licencia abierta de Creative Commons.
- Expanda Licencia y marque las casillas para seleccionar CC0 1.0 y CC BY 4.0.
- Expanda Ubicación y elija Incluir coordenadas.
- Amplíe la sección Problemas y banderas y revise los posibles problemas del dataset.
Esta sección enumera los posibles problemas asociados a cada punto. Observe, por ejemplo, que la mayoría de las coordenadas están redondeadas. En función de cómo desee utilizar los resultados de su análisis, estas cuestiones pueden o no descalificar los datos para su estudio, requerir corrección o tratarse como un error potencial.
- En la parte superior de la tabla, haga clic en el botón Descargar.
- En la tabla Opciones de descarga, seleccione Simple.
- En la ventana emergente, lea el acuerdo de usuario de GBIF y las normas de citación, luego haga clic en Entendido.
Aparece el panel de descarga de datos. Tenga en cuenta la información sobre la citación y otras directrices de uso de los datos en esta página.
- Una vez que los datos hayan terminado de procesarse, haga clic en Descargar.
Se descargará un archivo comprimido .csv en su ordenador. Se enviará un correo electrónico de confirmación con su cita personalizada al correo electrónico que registró para su cuenta de GBIF. Esta la utilizará más adelante para citar la fuente de sus datos.
Extraer datos de observación de animales
A continuación, agregará los datos de observación del tejón a ArcGIS Pro. Una vez en ArcGIS Pro, puede analizar los datos y asegurarse de que los tipos de datos son correctos para los tipos de análisis que desea realizar. El esquema que GBIF utiliza almacena la fecha del avistamiento en tres campos diferentes (día, mes y año), y los almacena como campos de texto. Para analizar los avistamientos por meses, creará un campo de tipo fecha que combine día, mes y año.
- En un explorador de archivos, vaya a la ubicación donde haya descargado los datos de GBIF.
- Descomprima el archivo en la carpeta del proyecto de ArcGIS Pro.
De forma predeterminada, las nuevas carpetas de proyecto se crean en esta ubicación: C:\Users\<username>\Documents\ArcGIS\Projects. En función de dónde haya descargado ArcGIS Pro, la ruta de su archivo puede ser diferente.
Cuando se descargó el archivo, se nombró con una cadena de números. Cambiará el nombre del archivo antes de agregarlo al proyecto.
- Cambie el nombre del archivo Melesmeles_GBIF_[date], sustituyéndolo por la fecha en la que haya descargado el archivo.
Agregará el archivo como una tabla de geodatabase para que pueda hacer alguna preparación de datos antes de hacer la representación cartográfica.
- En ArcGIS Pro, en la cinta, haga clic en la pestaña Análisis. En el grupo Geoprocesamiento, haga clic en Herramientas.
Se abre el panel Geoprocesamiento.
- En el panel Geoprocesamiento, busque y abra la herramienta De tabla a geodatabase.
- En Tabla de entrada, haga clic en Examinar y seleccione su archivo Melesmeles_GBIF_[date].
- En Geodatabase de salida, haga clic en Examinar y seleccione la geodatabase predeterminada del proyecto. Haga clic en Ejecutar.
La tabla se agrega a su geodatabase.
- En el panel Catálogo, haga clic en la pestaña Proyecto. Expanda Bases de datos, luego expanda su geodatabase EuropeanBadger_Habitat y arrastre la tabla Melesmeles_GBIF_[date] al mapa.
La tabla se añade al panel Contenido en Tablas independientes. A continuación, echará un vistazo a los datos para ver con qué campos tiene que trabajar y qué podría necesitar formatear para un análisis posterior.
- Haga clic con el botón derecho en la tabla Melesmeles_GBIF_[date] y seleccione Abrir.
La tabla contiene los mismos datos que vio en GBIF. Utilizará los atributos decimalLatitude y decimalLongitude para representar cartográficamente los datos. También desea utilizar el campo de fecha para el análisis espaciotemporal, pero el campo eventDate se ha guardado como campo de texto. Para trabajar con este campo, necesitará tener la fecha en un formato de fecha.
- En la parte superior de la tabla, haga clic en Calcular.
Se abre la herramienta Calcular campo.
- En la ventana Calcular campo, en Nombre de campo, escriba stdTime.
Esto le permitirá agregar un nuevo campo para almacenar la fecha formateada.
- En Tipo de expresión, elija Arcade, y en Tipo de campo, elija Fecha.
- En el cuadro Expresión, construya la expresión Concatenate($feature.month, "/", $feature.day, "/", $feature.year).
- En la parte inferior del cuadro Expresión, haga clic en la marca de verificación verde para validar la expresión y, a continuación, haga clic en Aceptar.
Cuando la herramienta haya terminado de ejecutarse, una ventana mostrará el estado de finalización. Los Mensajes mostrarán una advertencia de que algunos valores no se escribieron porque faltaban algunos datos. Puede ignorarlos de momento.
- Cierre la ventana de la herramienta completada.
Para ver la dispersión temporal de los datos, creará un gráfico de calor de calendario.
Los gráficos de calor de calendario visualizan patrones en datos temporales al consolidar incidentes en una cuadrícula de calendario. Las cuadrículas de calendario se pueden configurar para visualizar patrones temporales a lo largo de los meses de un año o a lo largo de los días de una semana.
- En el panel Contenido, haga clic con el botón derecho en la tabla Melesmeles_GBIF_[date], haga clic en Crear gráfico y seleccione Gráfico de calor del calendario.
Aparece una ventana de Gráfico en blanco.
- En el panel Propiedades del gráfico, en Fecha, seleccione el campo stdTime.
El gráfico se rellena y muestra un gráfico de calor del mes y el día en que se produjeron los avistamientos. Los avistamientos se produjeron durante todo el año, aunque fueron más frecuentes en los meses más fríos de otoño e invierno.
- Cierre la tabla Melesmeles_GBIF_[date] y el gráfico. Guarde el proyecto.
Ahora que ha descargado los datos de observación del Meles meles y los ha introducido en ArcGIS Pro para realizar una primera preparación de los datos, ya está listo para representarlos cartográficamente. Cada punto de observación contiene coordenadas que utilizará para representar cartográficamente los datos.
Representar cartográficamente los puntos de presencia y pseudoausencia
La modelización de la distribución de las especies puede hacerse de varias formas diferentes utilizando diversos métodos estadísticos. Muchos de estos métodos requieren tanto datos de presencia como de ausencia, o en su caso, datos de pseudoaudiencia. También necesitan datos medioambientales para determinar qué tipo de condiciones climáticas y de hábitat son adecuadas para las especies animales. Ahora que tiene los datos de presencia, puede generar los datos de pseudoausencia o fondo y extraer los datos de atributos ambientales en cada ubicación.
Representar cartográficamente puntos de presencia
En primer lugar, representaremos cartográficamente la presencia del tejón convirtiendo los datos tabulares del tejón europeo en una clase de entidad. A continuación, examinará los datos. En función del método de recogida, algunos de los datos pueden ser sobrerrepresentativos de las ubicaciones de los tejones, como los estudios que rastrean el movimiento de los animales en lugar de informar de avistamientos únicos.
Nota:
Si piensa utilizar un método de análisis como la Predicción de solo presencia (MaxEnt), la preparación de los datos que realizará en esta sección está incluida dentro de la herramienta de geoprocesamiento. Pero si planea utilizar otros métodos de análisis como la regresión, estos son pasos necesarios para preparar sus datos.
- En el panel Contenido, haga clic con el botón derecho en la tabla Melesmeles_GBIF_[date], apunte a Crear puntos desde la tabla y seleccione De tabla XY a punto.
- En la ventana De tabla XY a punto, defina los siguientes parámetros y haga clic en Aceptar:
- Clase de entidad de salida: EuropeanBadger_points
- Campo X: decimalLongitude
- Campo Y: decimalLatitude
Cuando la herramienta termina de ejecutarse, la capa se agregará al panel Contenido. Hay una gran agrupación de puntos alrededor de Barcelona, y un apretado grupo al sur de Sevilla.
Nota:
En el momento de descargar estos datos, había 2214 puntos de observación que cumplían los requisitos de licencia y otros de selección. Su dataset puede ser diferente.
- Acérquese al clúster del sur de Sevilla.
Este clúster de puntos se encuentra dentro del Parque Nacional de Doñana y parece representar huellas de animales, lo que significa que cada conjunto de puntos probablemente representa a un único animal. Para ver cómo se recopilaron, abrirá la tabla de atributos de la capa.
- En el panel Contenido, haga clic con el botón derecho en la capa EuropeanBadger_points y seleccione Tabla de atributos.
- En la cinta, en la pestaña Mapa, en el grupo Selección, haga clic en Seleccionar y dibuje un rectángulo en el mapa alrededor de los puntos dentro del Parque Nacional de Doñana.
- En la parte inferior de la tabla de atributos, haga clic en Mostrar registros seleccionados.
La tabla se filtra para mostrar solo los registros seleccionados. En función de cómo se haya hecho la selección, aproximadamente la mitad de los puntos de observación se encuentran dentro del parque nacional, y se puede ver que la mayoría de los puntos se recopilaron mediante un estudio de rastreo. Para evitar que en futuros análisis esta área esté demasiado representada, disminuirá estos puntos.
- En el panel Geoprocesamiento, busque y abra la herramienta Eliminar idéntico.
En la parte superior de la herramienta aparece una advertencia de que la herramienta modifica el dataset de entrada. La herramienta Eliminar idéntico elimina permanentemente los puntos de la capa de entidades que introducirá, pero no modificará la Tabla independiente.
- En Dataset de entrada, elija EuropeanBadger_points y deje activado el botón Utilizar los registros seleccionados.
- En Campo(s), elija Forma. En Tolerancia XY, elija 500 metros y haga clic en Ejecutar.
Cuando la herramienta termine de ejecutarse, será necesario actualizar la tabla de atributos porque algunos de los registros seleccionados se han eliminado.
- En la ventana Error al cargar tabla, haga clic en Aceptar.
- En la cinta, en el grupo Selección, haga clic en Borrar para eliminar la selección.
Todavía quedan muchos puntos dentro del parque nacional, pero se han disminuido.
- Vuelva a abrir la tabla de Atributos y compruebe el número de puntos de presencia restantes que aparece en la parte inferior de la tabla.
En función de los puntos que haya seleccionado, su número puede variar. En general, deseará crear el mismo número de puntos de fondo que de observaciones, así que asegúrese de comprobar sus puntos específicos. Ahora puede crear la muestra aleatoria.
Generar puntos de pseudoausencia muestreados aleatoriamente
Ahora que sus datos de presencia están listos, generará puntos de pseudoausencia. El método más sencillo es utilizar la generación aleatoria dentro de la zona de estudio. Para que los puntos de presencia y pseudoausencia tengan la misma ponderación, creará el mismo número de puntos de fondo que de presencia.
- En el panel Geoprocesamiento, busque y abra la herramienta Crear ubicaciones espaciales de muestreo.
La herramienta Crear ubicaciones espaciales de muestreo crea ubicaciones de muestreo dentro de un área de estudio continua utilizando diseños de muestreo aleatorio simple, estratificado, sistemático (cuadriculado) o por clústeres.
- Introduzca los siguientes parámetros y haga clic en Ejecutar:
- Área de estudio de entrada: ESP_Country
- Entidades de salida: ESP_randomsample
- Método de muestreo: aleatorio simple
- Número de muestras: el número de puntos de su tabla EuropeanBadger_points.
Se agrega al mapa la capa de puntos aleatorios dentro del país España. Este dataset puede combinarse ahora con su capa EuropeanBadger_points.
- Cierre la tabla de atributos EuropeanBadger_points.
- En el panel Geoprocesamiento, busque y abra la herramienta Fusionar.
- En Datasets de entrada, seleccione ESP_randomsample y EuropeanBadger_points. En Dataset de salida, escriba badger_sample_set.
Dentro de la herramienta Fusionar, puede decidir qué campos agregar a la nueva capa y puede crear otros nuevos. Agregará un nuevo campo llamado Presencia que utilizará para diferenciar los puntos de observación de los datos GBIF y los puntos de fondo de la muestra aleatoria.
- En Mapa de campos, haga clic en el menú desplegable Agregar campos y seleccione Agregar campo vacío.
- Cambie el nombre del Nuevo campo a Presencia y pulse Intro.
De manera predeterminada, el campo Presencia está definido como campo Texto.
- Señale el campo Presencia y haga clic en Editar. En la ventana Propiedades de campo, haga clic en Tipo y elija Corto.
- En la ventana Propiedades de campo, haga clic en Aceptar y, a continuación, ejecute la herramienta Fusionar.
Nota:
El campo Presencia tendrá un aviso que indica que está vacío.
- En el panel Contenido, desmarque ESP_randomsample y EuropeanBadger_points para desactivar las capas. Haga clic con el botón derecho en la capa badger_sample_set y haga clic en Tabla de atributos.
Para distinguir los puntos de presencia y ausencia en su nueva capa, calculará valores para el campo Presencia. Normalmente, los puntos de presencia se muestran con un valor de 1 y los puntos de fondo reciben un valor de 0. Al desplazarse por la tabla, observe que los puntos fusionados tienen muchos campos de datos nulos. Utilizará estos campos nulos para seleccionar los puntos de fondo.
- En la tabla, haga clic en Seleccionar por atributos. En la ventana Seleccionar por atributos, construya la expresión Donde reino es nulo y haga clic en Aplicar.
- En la tabla de atributos, desplácese hasta que vea el campo Presencia. Haga clic con el botón derecho del ratón en el nombre de la columna Presencia y seleccione Calcular campo.
- En la ventana Calcular campo, en Presencia =, escriba 0 y haga clic en Aceptar.
- En la ventana Seleccionar por atributos, marque la casilla Invertir cláusula WHERE y haga clic en Aceptar.
- Haga clic con el botón derecho del ratón en el nombre de la columna Presencia y seleccione Calcular campo. Construya la expresión Presencia =1 y haga clic en Aceptar.
Ahora, las entidades se codifican con un valor 1 para la presencia observada y con un valor 0 para la pseudoausencia.
- En la cinta, haga clic en Borrar para eliminar la selección. Cierre la tabla ESP_randomsample y guarde el proyecto.
Extraer datos medioambientales
A continuación, localizará y preparará variables ambientales que puedan ayudar a determinar la presencia de tejones. GBIF recuerda que los tejones prefieren una buena cubierta vegetal en sus hábitats de alimento. A partir de la descripción del animal en GBIF, sabe que en el centro de España, los tejones prefieren las zonas montañosas de mediana altitud con bosques y pastos, y evitan las elevaciones más bajas. En este tutorial, se centrará en la adquisición y configuración de los datos necesarios para modelar la distribución de especies, como la cubierta terrestre, la pendiente y la elevación.
- Descargue el archivo SpainPortugalElev.zip en su ordenador y descomprímalo en la carpeta del proyecto ArcGIS en la que esté trabajando.
Este archivo contiene dos imágenes ráster descargadas de USGS EROS Archive - Digital Elevation - Global Multi-resolution Terrain Elevation Data 2010 que se han unido en mosaico para cubrir toda España y luego se han recortado a los países de España y Portugal. Para más información sobre la creación de un dataset en mosaico, consulte la documentación. Utilizará esta imagen ráster para crear un dataset de pendientes para España.
Puede acceder a datos más detallados sobre pendientes y elevaciones desde ArcGIS Living Atlas. Sin embargo, debido a las limitaciones de exportación de datos, que limitan las exportaciones a 4000 x 4000 píxeles a la vez, los datos de ArcGIS Living Atlas no son la mejor opción para un área de estudio tan grande.
- En el panel Catálogo, haga clic en la pestaña Proyecto, expanda el grupo Carpeta y, a continuación, expanda la carpeta del proyecto EuropeanBadger_Habitat.
- Localice la imagen Spain_GTMED2010 que ha descomprimido y arrástrela al mapa.
Nota:
Si se le pide que construya pirámides y calcule estadísticas para la capa, haga clic en Aceptar.
- En el panel Contenido, desmarque las capas badger_sample_set y ESP_Country para desactivarlas.
El ráster de elevación se dibuja en el mapa. Puede utilizar este ráster para calcular la pendiente, otra variable que puede ayudar a determinar el hábitat del tejón.
- En el panel Geoprocesamiento, busque y abra la herramienta Parámetros de superficie.
- Introduzca los siguientes parámetros y haga clic en Ejecutar:
- Ráster de superficie de entrada: SpainPortugalElev.tif
- Ráster de salida: Spain_Slope
- Máscara de análisis de entrada: ESP_Country
- Tipo de parámetro: Pendiente
- Tipo de superficie local: Cuadrática
- Medición de pendiente: Grados
La capa Spain_Slope se agrega al mapa. Muestra los valores de la pendiente en grados.
La siguiente capa medioambiental que desea encontrar es la cubierta terrestre. Para ello, utilizará los datos WorldCover 2020 de la Agencia Espacial Europea. WorldCover cartografía 11 tipos de cobertura del suelo.
- En el panel Catálogo, haga clic en la pestaña Portal y elija Living Atlas.
- Busque la capa ESA WorldCover y arrástrela al mapa.
La capa WorldCover se dibuja en el mapa. Esta capa contiene 11 clases diferentes de cobertura de suelo con una resolución de 10 metros.
Ahora que ya tiene sus datos de hábitat, utilizará la herramienta Extraer valores múltiples a puntos para obtener los valores ráster de cada ubicación de punto.
- En el panel Geoprocesamiento, busque y abra la herramienta Extraer valores múltiples a puntos.
- Para las Entidades de punto de entrada, elija badger_sample_set.
- Para los Rásteres de entrada, elija Spain_Slope, Spain_Elevation, LandCover y asígneles el Nombre de campo de salida correspondiente: pendiente, elevación y cobertura de suelo.
Nota:
Se puede agregar un número 1 al nombre del campo de elevación. Esto no afectará a la salida.
Antes de ejecutar la herramienta, definirá la Extensión de procesamiento en el límite del país España que ha estado utilizando. Dado que la capa WorldCover es un dataset global, la configuración de la Extensión de procesamiento le permitirá extraer solo los datos que necesite.
- Haga clic en la pestaña Entornos.
- Expanda el grupo Extensión de procesamiento. Haga clic en Extensión de una capa y elija la capa ESP_Country.
- Haga clic en Ejecutar.
Esta herramienta tardará algún tiempo en ejecutarse. Cuando la herramienta termina, la capa badger_sample_set tiene tres nuevas variables en la tabla de atributos. También agregará datos bioclimáticos a su conjunto de muestras.
Muestra de datos multidimensionales
Además de la pendiente, la altitud y la cobertura del suelo, otras variables que pueden ayudar a modelar el hábitat del tejón son las bioclimáticas. Agregará la capa Referencia bioclimática 1970-2000 desde ArcGIS Living Atlas y muestreará sus valores en cada uno de los puntos de presencia y fondo. La capa Referencia bioclimática ofrece estimaciones reducidas de variables climáticas y bioclimáticas en forma de medias mensuales durante el periodo 1970-2000 basadas en mediciones interpoladas de estaciones de WorldClim 2.1. Esta capa contiene 19 variables bioclimáticas, incluidos datos sobre temperatura y precipitaciones. Se puede acceder a cada variable desde el Filtro multidimensional.
- En el panel Catálogo, haga clic en la pestaña Portal y elija Living Atlas.
- Busque la capa Referencia bioclimática 1970-2000 y arrástrela al mapa.
La capa Referencia bioclimática 1970-2000 se agrega al mapa. ArcGIS Living Atlas también contiene proyecciones de futuro para cada una de las variables bioclimáticas del dataset de referencia. Cada uno de los datasets de las Proyecciones bioclimáticas contiene SSP2-4.5, SSP3-7.0 y SSP5-8.5 para modelizar las posibles condiciones futuras en función de las emisiones de gases de efecto invernadero, la política y la sociedad, así como otros cambios. Estas capas pueden intercambiarse por el dataset de referencia, pero tendrán que muestrearse individualmente.
Como antes, deseará extraer estas variables a su conjunto de muestras de tejón, pero para obtener todas las variables bioclimáticas, utilizará la herramienta Muestra, que procesa cada corte multidimensional. Sin embargo, a diferencia de la herramienta Extraer valores múltiples a puntos, Muestra crea una nueva clase de entidad en su geodatabase. Antes de ejecutar esta herramienta, deberá asegurarse de que existe un identificador único en su capa badger_sample_set que pueda utilizar para unir los resultados de la herramienta Muestra con la capa badger_sample_set.
- En el panel Contenido, haga clic con el botón derecho en la capa badger_sample_set y seleccione Tabla de atributos.
En la tabla, el campo OID actúa como identificador único. Este identificador se creó al convertir el archivo .csv en una tabla de geodatabase. Los OID, y otros identificadores únicos asignados automáticamente, pueden restablecerse o regenerarse, por lo que calculará un nuevo campo único para utilizarlo al unir las tablas más adelante.
- En la tabla de atributos, en la cinta de opciones, haga clic en Calcular.
- En la ventana Calcular campo, en Nombre de campo, escriba joinID. En Tipo de campo, elija Largo.
Para este cálculo, utilizará Python Helpers, que ofrecen fragmentos de código de uso común.
- En el panel Helpers, haga doble clic en Número secuencial.
El Helper se agrega al campo Bloque de código. De manera predeterminada, la numeración secuencial comenzará en 1.
- Haga clic en Aceptar.
El campo joinID se agrega al final de la tabla. Ahora está listo para ejecutar la herramienta Muestra.
- En el panel Geoprocesamiento, busque y abra la herramienta Muestra.
- En la herramienta Muestra, introduzca los siguientes parámetros y haga clic en Ejecutar:
- Rásteres de entrada: Referencia bioclimática 1970:2000
- Entidades o ráster de ubicación de entrada: badger_sample_set
- Tabla o clase de entidad de salida: badger_sample_bioclimatebase
- Campo de Id. único: joinID
- Casilla de verificación Procesar como multidimensional: marcada
Cuando la herramienta termina de ejecutarse, la tabla sample_bioclimatebase se agrega al panel Contenido. La unirá a la capa badger_sample_set.
- En el panel Geoprocesamiento, haga clic en el botón Atrás. Busque y abra la herramienta Unir campo.
- Introduzca los siguientes parámetros y haga clic en Ejecutar:
- Tabla de entrada: badger_sample_set
- Campo de entrada: joinID
- Tabla de unión: badger_sample_bioclimatebase
- Campo de entrada: joinID
- Transferir campos: seleccione todos los campos BC
Los 19 atributos bioclimáticos se agregan ahora al conjunto de muestras. Para más información sobre lo que representa cada atributo y cómo utilizar estos datos, consulte la publicación fuente del USGS, enlazada desde la página de detalles del artículo en ArcGIS Online.
Utilizar la ingeniería de datos
A continuación, utilizará las herramientas de Ingeniería de datos para explorar los datos. Con las herramientas de ingeniería de datos de ArcGIS Pro, puede explorar, visualizar, limpiar y preparar sus datos para el análisis. En esta sección, utilizará las herramientas de ingeniería de datos para comprender mejor las variables de entorno que ha extraído a su conjunto de muestras.
- En el panel Contenido, haga clic con el botón derecho en la capa badger_sample_set y seleccione Ingeniería de datos.
Se abre la vista Ingeniería de datos. El tipo de preparación de datos que elija dependerá del tipo de modelización que desee utilizar para crear su modelo de idoneidad para el hábitat. Por ejemplo, si tiene previsto utilizar el análisis de regresión, puede utilizar la herramienta Transformar para transformar los datos sesgados en una distribución normal.
- En el panel Campos, haga clic en el campo de cobertura de suelo. Mantenga pulsada la tecla Mayús y haga clic en el último campo bioclimático, BC_19.
- Arrastre los campos seleccionados al panel Estadísticas vacío situado en el centro de la ventana.
Los datos medioambientales que ha recopilado para su proyecto de modelado de hábitats se agregan al panel Estadísticas.
- En el panel Ingeniería de datos, en la cinta, haga clic en Calcular.
Se calculan las estadísticas de los campos, incluida la media, los valores únicos y los valores atípicos. Puede utilizar estas estadísticas para empezar a identificar patrones en sus datos.
- En el panel Estadísticas, desplácese hasta la columna Valores atípicos.
El campo con más valores estadísticos atípicos es el de la pendiente.
- Haga clic con el botón derecho del ratón en el registro de Valores atípicos para el campo de pendiente y elija Seleccionar valores atípicos.
Los valores atípicos se seleccionan en el mapa. Muchos de los puntos atípicos se encuentran en el norte de España, en la cordillera Cantábrica y los Pirineos o cerca de ellas.
Es lógico que aquí haya un terreno más escarpado, pero también hay muchos puntos repartidos por toda España. Para visualizar estos valores, utilizará un histograma.
- En el panel Estadísticas, haga clic con el botón derecho del ratón en el histograma del campo pendiente. Haga clic en Abrir histograma.
Se abre el histograma del campo pendiente. Los valores atípicos seleccionados se muestran en el histograma. Utilizando el histograma, es posible ver que todos los valores atípicos están en la parte elevada, o en zonas con mayor pendiente. A continuación, veremos BC_01, o temperatura media anual.
- En el histograma Distribución de la pendiente, en la cinta, haga clic en Borrar selección y, a continuación, cierre el histograma.
- En el panel de Estadísticas, haga clic con el botón derecho del ratón en la Vista previa del gráfico para BC_01 y seleccione Abrir histograma.
El histograma se abre. Para saber qué temperaturas prefieren los tejones, seleccionará puntos de presencia de tejones.
- En la cinta, haga clic en la pestaña Mapa. En el grupo Selección, haga clic en Seleccionar por atributos.
- En la ventana Seleccionar por atributos, borre cualquier expresión existente y construya la expresión Donde la presencia es igual a 1. Haga clic en Aceptar.
Los puntos de presencia se seleccionan en el mapa y en el gráfico.
Según el gráfico, parece que los tejones prefieren temperaturas más cálidas.
Sugerencia:
Si no ve tanto los datos seleccionados como los no seleccionados en el gráfico, en la cinta del gráfico, en el grupo Filtrar, asegúrese de que el filtro Selección está desactivado.
Puede utilizar las herramientas de Ingeniería de datos para examinar las demás variables bioclimáticas y realizar los cambios necesarios en los datos.
- Borre la selección y cierre el gráfico.
El último paso antes de utilizar los datos para el modelado es agregar la atribución. Mantener un registro de la fuente de datos es una buena idea y, dado que ha descargado datos con licencias CC BY 4.0, tiene que garantizar la atribución del dataset.
- En la cinta, haga clic en la pestaña Vista. En el grupo Ventanas, seleccione Vista de catálogo.
La vista de Catálogo se abre. La vista Catálogo y el panel Catálogo, con los que ha trabajado hasta ahora en este tutorial, tienen muchas similitudes, pero los metadatos solo se pueden editar en la vista Catálogo.
- En la vista Catálogo, expanda Bases de datos y EuropeanBadger_Habitat.gdb, y haga clic en la capa badger_sample_set.
Se abre el editor de metadatos. Actualmente, los metadatos están vacíos excepto el historial de geoprocesamiento, que muestra las herramientas Unir campo y Calcular campo que ha ejecutado.
- En la cinta, en la pestaña Catálogo, en el grupo Metadatos, haga clic en Editar.
Se abre el editor de metadatos.
- Introduzca la siguiente información en el panel Metadatos:
- Título: Dataset de muestras de tejón europeo
- Etiquetas: modelización de especies, Meles meles, tejón europeo
- Resumen (propósito): Este datasets se creó en el tutorial Tutorial de ArcGIS Aprender a modelar el hábitat del tejón europeo (Meles meles) en España a partir de muestras de datos ambientales y de especies.
- Descripción (resumen): El tejón europeo es una especie importante que presta tres servicios ecosistémicos principales: dispersión de semillas, alteración de la capa superficial del suelo y creación de microhábitats. Para modelizar su hábitat en España, se descargaron de GBIF datos de observación de animales, registrados en el campo Presencia con valor 1. Se generaron puntos de pseudoausencia o de fondo y se fusionaron con los datos de observación. A estos puntos se les extrajeron datos medioambientales, como la pendiente, la elevación, la cobertura del suelo y las variables bioclimáticas.
- En la sección Créditos, introduzca la cita única que se generó cuando descargó los datos de GBIF.
Sugerencia:
Esta cita puede encontrarse en la página de Descarga o en el correo electrónico de confirmación que recibió de downloads@gbif.org.
- En la parte inferior del editor de metadatos, haga clic en Nuevo cuadro de delimitación.
- Introduzca las siguientes coordenadas:
Oeste Este Sur Norte -17.7532431
5.6396581
26.8567504
44.3051478
- En la cinta, en la pestaña Metadatos, haga clic en Guardar.
- Cierre el editor de metadatos y guarde el proyecto.
Ahora dispone de un datasets sobre el tejón europeo que puede utilizar para modelar la distribución de las especies. El dataset contiene puntos de presencia y pseudoausencia, así como datos medioambientales sobre la pendiente, la elevación, la cobertura de suelo, la temperatura, etc. Esta información se puede utilizar en modelos como MaxEnt o la predicción de bosque aleatorio para hacer modelos de distribución de especies.