Preparar datos de entrenamiento

Estimará los hábitats mundiales de posidonia con un enfoque estadístico espacial que utiliza un conjunto de ubicaciones en las que se sabe que existe posidonia y un conjunto de mediciones oceánicas. A partir de estos datos, la herramienta Predicción de solo presencia, que implementa una técnica de aprendizaje automático conocida como entropía máxima (o MaxEnt), estimará la probabilidad de que exista posidonia en otras ubicaciones, teniendo en cuenta las mediciones oceánicas. Para realizar este análisis, tendrá que borrar y preparar datos. En primer lugar, creará puntos que representen la presencia de posidonia en el litoral de Estados Unidos. A continuación, generará superficies de interpolación que representen mediciones oceánicas que sirvan de predictores para su modelo.

Descargar y explorar los datos

En primer lugar, descargará los datos relativos a la posidonia y los explorará.

  1. Descargue el paquete del proyecto Seagrass Habitat Prediction de ArcGIS Pro.
  2. Haga doble clic en el archivo SeagrassPrediction.ppkx para abrir el proyecto en ArcGIS Pro.

    Se abre un mapa mundial. El panel Contenido presenta cuatro clases de entidad:

    • Mediciones oceánicas mundiales: datos puntuales de las Unidades Marinas Ecológicas que contienen mediciones oceánicas hasta una profundidad de 90 metros.
    • Posidonia en Estados Unidos: datos de polígonos sobre la presencia de posidonia. Cada polígono de posidonia de Estados Unidos es un hábitat de posidonia identificado.
    • Aguas poco profundas de EE.UU.: polígono batimétrico poco profundo del territorio continental de Estados Unidos utilizado como zona de estudio para el entrenamiento del modelo.
    • Aguas poco profundas a nivel mundial: polígono batimétrico de aguas poco profundas utilizado para predecir la presencia de posidonia a nivel mundial.

    Las capas de datos corresponden al sistema de coordenadas proyectadas Equal Earth, apropiado para el análisis global.

  3. En el panel Contenido, desactive la capa Global ocean measurements.

    Desactive la capa Global ocean measurements.

    Las áreas poco profundas se muestran en azul claro.

    Las áreas de color azul claro representan las zonas batimétricas poco profundas de todo el mundo donde la profundidad del agua puede permitir el hábitat de posidonia.

  4. En la cinta, haga clic en la pestaña Mapa y, en la sección Navegar, haga clic en Marcadores y luego en Florida.

    El mapa se acerca a Florida.

    Las zonas de color verde brillante son aquellas en las que se han identificado hábitats de posidonia. Utilizará información sobre ubicaciones en las que se conoce la presencia de posidonia en la parte continental de Estados Unidos para hacer predicciones sobre qué otros lugares del mundo podrían tener hábitats de posidonia. Dado que se trata de una predicción a escala mundial, no será tan apropiada para identificar los hábitats de posidonia en zonas más pequeñas, por ejemplo, para identificar los lugares de una bahía específica en los que es más probable que haya posidonia. Más adelante, aprenderá a reutilizar un modelo para otros escenarios de predicción.

  5. En el panel Contenido, seleccione la capa Global ocean measurements para activarla de nuevo.

    La capa de mediciones se vuelve a mostrar.

    Estos puntos de medición oceánica mundial muestran los valores de los datos medios decenales de 50 años de las Unidades Ecológicas Marinas (UEM). La mayoría de los puntos de datos se encuentran fuera de la capa de observación de posidonia. Para desarrollar un buen modelo de predicción utilizando la herramienta de Predicción de solo de presencia, se necesitan muchos puntos en áreas de posidonia conocidas con los datos de mediciones oceánicas correspondientes. Si utiliza solamente la submuestra de puntos EMU_Global_90m que se encuentra en el polígono de posidonia, tendrá muy pocas observaciones.

    Para resolver este problema, creará un conjunto de puntos aleatorios dentro del hábitat de posidonia conocido para entrenar el modelo. También interpolará superficies a partir de las variables de las mediciones oceánicas globales y utilizará los puntos aleatorios del hábitat de posidonia para muestrear los valores de las mediciones interpoladas. Las variables para las mediciones oceánicas mundiales son: temp (temperatura), salinidad, dissO2 (oxígeno disuelto), nitrato, fosfato, silicato y srtm30 (profundidad).

    Primero disolverá los polígonos de posidonia de EE.UU. en una única entidad multiparte y creará un conjunto de 5.000 puntos aleatorios dentro de las áreas de presencia conocida de posidonia.

Crear puntos de entrenamiento

A continuación, creará los datos de entrenamiento que necesitará la herramienta de predicción de presencia para modelar la relación entre la presencia de posidonia y las condiciones oceánicas. Habrá dos tipos de datos de entrenamiento: los puntos que representan las ubicaciones conocidas de presencia de posidonia y los rásteres que representan las siete variables predictoras (mediciones oceánicas). Creará los puntos aleatorios dentro de la extensión de los polígonos de posidonia de EE. UU. Dado que desea crear un número específico de puntos aleatorios a través del área cubierta por estas áreas de hábitat, antes de crear los puntos disolverá los numerosos polígonos de esta capa en un único polígono.

  1. En la cinta, haga clic en Análisis y, en la sección Geoprocesamiento, haga clic en Herramientas.
  2. En el panel Geoprocesamiento, escriba disolver por pares en el cuadro de búsqueda.
  3. En los resultados de la búsqueda, haga clic en la herramienta Disolver por pares para abrirla.

    Abra la herramienta Disolver por pares.

  4. En Entidades de entrada, haga clic en la lista desplegable y seleccione la capa USA seagrass.
  5. Acepte el nombre predeterminado de la Clase de entidad de salida: USAseagrass_PairwiseDissolve.
  6. Acepte los valores predeterminados para los otros parámetros y verifique que la casilla Crear entidades multiparte esté activada.

    Parámetros Disolver por pares

  7. Haga clic en Ejecutar.

    Una vez finalizada la ejecución de la herramienta, la nueva capa de entidades, USAseagrass_Dissolve, se agrega al mapa y aparece en el panel Contenido. Utilizará esta versión de la capa de posidonia, por lo que es mejor eliminar la capa original para mantener su espacio de trabajo limpio y evitar confusiones.

  8. Haga clic con el botón derecho en la capa USA seagrass y, a continuación, haga clic en Eliminar.

    Elimine la capa USA seagrass.

    Ahora generará los puntos aleatorios de localización de presencia de posidonia.

  9. En el panel Geoprocesamiento, haga clic en la flecha atrás y escriba crear puntos aleatorios en el cuadro de búsqueda.
  10. En los resultados de la búsqueda, haga clic en la herramienta Crear puntos aleatorios.

    Herramienta Crear puntos aleatorios

  11. En Clase de entidad de puntos de salida, escriba USA_Train.
  12. En Clase de entidad obligada, haga clic en la lista desplegable y elija USAseagrass_PairwiseDissolve.
  13. En Número de puntos [valor o campo], cambie el valor por 5000.

    Parámetros de Crear puntos aleatorios

  14. Haga clic en Ejecutar.

    Los puntos aleatorios aparecen en el mapa.

    Los puntos aleatorios se agregan al mapa.

    Ahora tiene una nueva clase de entidad con 5000 puntos situados en el hábitat conocido de posidonia de la costa de Estados Unidos, que utilizará para entrenar su modelo de predicción de presencia. Por el momento, no hay variables medioambientales asociadas a estas ubicaciones. La información se almacena en las ubicaciones de los puntos de Mediciones oceánicas mundiales. Para resolver este problema, creará superficies de interpolación continua para las variables medioambientales muestreadas en los puntos de mediciones oceánicas mundiales.

Interpolar los rásteres medioambientales

La clase de entidades Mediciones oceánicas mundiales contiene datos del dataset Unidades Ecológicas Marinas. Esta capa tiene atributos necesarios como variables de predicción en la predicción de presencia. Algunas de estas variables son la salinidad, la temperatura oceánica y el nivel de nitratos. Utilizará el método geoestadístico de kriging bayesiano empírico (EBK) para interpolar superficies ráster de los valores medioambientales almacenados en la capa de mediciones oceánicas mundiales. Después, muestreará los valores de esos rásteres en los puntos USA_Train para que el modelo de predicción de solo presencia tenga acceso a datos explicativos en la ubicación de cada punto de entrenamiento.

  1. En el panel Geoprocesamiento, haga clic en la flecha atrás y escriba Empirical Bayesian Kriging en el cuadro de búsqueda.

    Busque la herramienta Empirical Bayesian Kriging.

  2. Haga clic en la herramienta Empirical Bayesian Kriging en los resultados de la búsqueda y, seguidamente, haga clic en Lote.

    Abra la herramienta EBK en modo de lote.

    Aparece la página Kriging bayesiano empírico en lote.

  3. En Elegir un parámetro de lote, haga clic en la lista desplegable y elija Campo de valores Z.

    Elija Campo de valores Z.

  4. Deje el resto de parámetros con los valores predeterminados y haga clic en Siguiente.
  5. En Entidades de entrada, haga clic en la lista desplegable y seleccione Mediciones oceánicas mundiales.
  6. En Campo de valores Z de lote, haga clic en el botón Agregar muchos.

    Haga clic en la lista desplegable y seleccione Agregar muchos.

    Aparece una lista de los campos.

  7. Active las casillas de las siguientes variables de mediciones oceánicas: temp, salinity, dissO2, nitrate, phosphate, silicate y srtm30, y luego haga clic en Agregar.

    Active las casillas de los siete campos de variables medioambientales.

    Al hacer clic en Agregar, los campos se agregan al panel de la herramienta.

    Los campos se agregan a la herramienta.

  8. Cambie el Ráster de salida por EBK_%Name%.

    Cambie el Ráster de salida por EBK_%Name%.

    De este modo se creará un ráster con el nombre EBK_ más el nombre del campo, para cada uno de los campos.

  9. En Tamaño de celda de salida, cambie el valor por 25000.
  10. En Tipo de modelo de semivariograma, haga clic en la lista desplegable y elija Lineal.

    Tamaño de celda y tipo de modelo de semivariograma

  11. Expanda la sección Parámetros de modelo adicionales y establezca el Número máximo de puntos en cada modelo local en 50.
  12. Establezca el Número de semivariogramas simulados en 50.

    Establezca el número de puntos y semivariogramas en 50.

    Estos ajustes ayudan a aumentar la velocidad de la predicción EBK limitando el número de puntos de cada modelo y el número de semivariogramas simulados. Aumentar estos valores puede mejorar la precisión de las predicciones, pero también aumentará el tiempo de procesamiento de la herramienta. Para comprender mejor estos parámetros, consulte la página de ayuda ¿Qué es el kriging bayesiano empírico?

  13. Expanda la sección Parámetros de búsqueda de vecindario, establezca Vecindad de búsqueda en Estándar circular y reduzca el valor de Mín. de vecinos a 3.

    Establezca los parámetros de la vecindad de búsqueda.

    El uso de una vecindad de búsqueda estándar circular reduce el tiempo de procesamiento de la herramienta. Limitar el requisito de vecinos mínimos garantiza que los valores en ubicaciones desconocidas se estimarán aunque haya pocos vecinos. Consulte la documentación de la herramienta Empirical Bayesian Kriging para obtener más información sobre estos y otros parámetros.

  14. Haga clic en Ejecutar.

    Dado que esta herramienta se ejecutará por lotes para generar siete rásteres de interpolación global independientes, tardará algún tiempo en ejecutarse (aproximadamente cinco minutos).

    La herramienta se completará con advertencias que indican que los valores NODATA fueron ignorados para varias entidades. Esto no supone ningún problema.

    Una vez finalizada la ejecución de la herramienta Batch Empirical Bayesian Kriging, cada superficie de medición oceánica se agrega al mapa. Las superficies deben tener un aspecto similar al siguiente, que muestra el modelo EBK de concentración de nitratos.

    Capa de nitrato EBK

  15. Haga clic en Guardar proyecto.

    Guarde el proyecto.

Ha preparado los datos para el modelado generando puntos aleatorios que representan ubicaciones de presencia de posidonia dentro del hábitat de posidonia alrededor de la costa de Estados Unidos y creando rásteres explicativos con kriging bayesiano empírico. A continuación, utilizará los datos de entrenamiento para crear un modelo que prediga la presencia de hábitats de posidonia en todo el mundo.


Predecir el hábitat y acotar los resultados

Ahora que ya tiene preparados sus datos, utilizará la herramienta Predicción de solo presencia para crear un modelo y realizar una predicción. Predicción de solo presencia utiliza el método de máxima entropía (MaxEnt), que es un método de aprendizaje automático especialmente adecuado para modelar la distribución de las especies, ya que puede manejar situaciones en las que no se dispone de datos de ausencia.

Realizar la predicción de solo presencia

Utilizará la herramienta de geoprocesamiento Predicción de solo presencia (MaxEnt) entrenar un modelo para predecir el hábitat de la posidonia y crear una trama de predicción que muestre la probabilidad de hábitat de la posidonia en las costas de todo el mundo. Evaluará los diagnósticos del modelo e iterará sobre el proceso de modelado para mejorar su modelo.

  1. En el panel Geoprocesamiento, haga clic en la flecha hacia atrás y escriba presencia en el cuadro de búsqueda.
  2. En los resultados de la búsqueda, haga clic en Predicción de solo presencia (MaxEnt).

    Abra la herramienta Predicción de solo presencia.

  3. En Entidades de puntos de entrada, haga clic en la lista desplegable y seleccione la capa USA_Train.

    Entidades de puntos de entrada establecido en USA_Train.

  4. En Rásteres de entrenamiento explicativos, haga clic en el botón Agregar muchos.

    Haga clic en el botón Agregar muchos.

    Se abre una lista de las capas ráster.

  5. Active las casillas de los siguientes siete rásteres de mediciones oceánicas: EBK_dissO2, EBK_nitrate, EBK_phosphate, EBK_salinity, EBK_silicate, EBK_srtm30 y EBK_temp, then click Add.

    Agregue los rásteres explicativos.

    Al hacer clic en Agregar, los rásteres se agregan al panel de la herramienta.

    Los rásteres se agregan a la herramienta.

    Todos estos rásteres son de medición continua, de modo que las casillas de verificación Categórica no están activadas. La herramienta también aceptará variables de entrenamiento que sean categóricas, para lo cual deberá marcar la casilla.

  6. En Expansiones de variables explicativas (Funciones de base), active las casillas para: Original (Lineal), Cuadrado (Cuadrática), Interacción por pares (Producto) y Paso suavizado (Bisagra).

    Expansiones de variables explicativas activadas, funciones de base

    Las funciones de base transforman (o expanden) las variables explicativas para incorporar al modelo relaciones más complejas entre la presencia de posidonia y la variable de interés. La selección de múltiples funciones de base incluye todas las versiones transformadas de las variables en el modelo, a partir de las cuales se seleccionan las variables con mejor rendimiento mediante regularización. En este caso, seleccione todas las opciones menos la de Paso discreto, porque Paso suavizado y Paso discreto son relativamente similares y seleccionar una de estas opciones supondrá un ahorro de tiempo de procesamiento. Revise la documentación de la herramienta para obtener más información sobre cada una de las funciones de base.

  7. En Número de nudos y Área de estudio, acepte los valores predeterminados 10 y Envoltura convexa.

    Acepte los valores predeterminados para Número de nudos y Área de estudio.

    Número de nudos es un ajuste relacionado con la función de base Paso suavizado (Bisagra) que especifica el número de intervalos iguales entre los valores mínimo y máximo de la variable, con lo que se crean variables transformadas tanto en bisagra hacia delante como en bisagra hacia atrás. El ajuste Envoltura convexa significa que el área de estudio se designará como la envoltura convexa de todos los puntos de entrenamiento de entrada. La herramienta generará puntos de fondo, que representan la posible ausencia de posidonia, en las zonas del área de estudio que no contengan puntos de presencia.

  8. Active la casilla de verificación Aplicar Simplificación espacial. Establezca Distancia mínima al vecino más cercano en 2 y seleccione Kilómetros como unidad. Verifique que el Número de iteraciones para simplificación esté establecido en 10.

    Sección de simplificación espacial

    Estos ajustes ayudan a minimizar el posible sesgo de la muestra eliminando los puntos de presencia y de fondo que se encuentran a la distancia especificada entre sí, de modo que las áreas no se sobremuestreen espacialmente. La distancia entre los puntos de fondo se ve afectada por la resolución espacial de los rásteres explicativos, por lo que utilizar una distancia de 2 kilómetros en este caso evitará el sobremuestreo de las áreas de fondo en comparación con las áreas de presencia de posidonia. Utilizar múltiples iteraciones para la simplificación permite a la herramienta realizar múltiples intentos en el proceso de reducción y seleccionar la opción que retiene la mayor cantidad de puntos de entrenamiento.

  9. Deje la casilla Archivo de salida del modelo entrenado en blanco.

    Más adelante le interesará guardar un archivo de modelo para compartir su análisis, pero solo cuando esté seguro de que el modelo funciona bien.

  10. Expanda la sección Opciones de modelo avanzadas y verifique que Peso relativo de la presencia al fondo esté establecido en 100, Transformación de probabilidad de presencia (función de vínculo) en C-log-log y Valor límite de probabilidad de presencia en 0,5.

    Sección Opciones de modelo avanzadas

    El valor 100 de Peso relativo de la presencia al fondo indica que se desconoce si podría haber posidonia en las ubicaciones de los puntos de fondo generados por la herramienta.

    En este escenario, resulta adecuado utilizar C-log-log para Transformación de probabilidad de presencia porque la posidonia presenta una ambigüedad mínima en términos de localización (es decir, no hay que tener en cuenta su movilidad ni migración). El Límite de probabilidad de presencia 0,5 indica que las ubicaciones con una probabilidad superior a 0,5 se clasifican como presentes.

  11. Expanda la sección Salidas de entrenamiento y, en Entidades entrenadas de salida, escriba trainfeatures1.

    Será una clase de entidades de salida que contendrá las entidades entrenadas (puntos de presencia y puntos de fondo, en este caso) utilizadas para generar el modelo.

  12. En Tabla de curvas de respuesta de salida, escriba rc1.
  13. En Tabla de sensibilidad de salida, escriba sensitivity1.

    Sección de salidas de entrenamiento

    La Tabla de curvas de respuesta de salida y la Tabla de sensibilidad de salida son de gran utilidad para comprender el rendimiento del modelo.

  14. Expanda la sección Opciones de predicción y, en Ráster de predicción de salida, escriba seagrass_predict1.

    Sección Opciones de predicción

    Este será el raster de salida que mostrará las predicciones del modelo sobre la probabilidad de presencia de hábitats de posidonia.

  15. Asegúrese de que la tabla Rásteres explicativos coincidentes contiene valores coincidentes para los rásteres Predicción y Entrenamiento.

    Sección Rásteres explicativos coincidentes

    Anteriormente, ha designado rásteres explicativos para entrenar el modelo en los puntos de datos costeros de Estados Unidos y aquí, utiliza los mismos rásteres para hacer una predicción global. En algunos casos, es posible que le interese realizar una predicción utilizando diferentes rásteres explicativos. Por ejemplo, podría utilizar las mismas variables de medición del océano, pero con valores proyectados para 50 años en el futuro, para evaluar cómo el cambio climático puede afectar al hábitat y el área de distribución de la posidonia.

  16. Deje activada la casilla Permitir predicciones fuera de los rangos de datos.

    Dado que para entrenar el modelo solo utiliza datos de la costa de Estados Unidos, tendrá que permitir predicciones fuera de los rangos de datos para realizar predicciones a nivel mundial.

    Nota:

    Una predicción fuera de los intervalos de datos de este tipo puede dar lugar a predicciones menos fiables, especialmente en las regiones en las que los valores están muy alejados de los intervalos de datos de entrenamiento.

    Téngalo en cuenta más adelante cuando examine los resultados de las predicciones para lugares como la Antártida, donde las condiciones son muy diferentes a las de la costa de Estados Unidos.

  17. Expanda la sección Opciones de validación y, en Esquema de remuestreo, haga clic en la lista desplegable y elija Aleatorio, y acepte el valor predeterminado 3 para Número de grupos.

    Sección Opciones de validación

    Estos parámetros indican a la herramienta que realice una validación cruzada de K iteraciones del modelo.

    La herramienta está casi lista para ejecutarse. Antes de ejecutarla, agregará un ajuste Entornos para restringir el área que se procesa.

  18. En la parte superior del panel de la herramienta, haga clic en la pestaña Entornos.

    Haga clic en la pestaña Entornos.

  19. Desplácese hacia abajo y, en la sección Análisis de ráster, en Máscara, haga clic en la lista desplegable y elija la capa Global shallow waters (Aguas poco profundas del mundo).

    Elija la capa Global shallow waters para la máscara.

    Dado que la posidonia crece en aguas poco profundas, se ahorrará tiempo limitando el tratamiento a las áreas de aguas poco profundas.

  20. Haga clic en Ejecutar.

    La herramienta tardará un poco (unos dos minutos) en ejecutarse.

  21. En el panel Contenido, desactive las casillas para desactivar todas las capas, con la excepción de la capa seagrass_predict1 y el mapa base.

    Nota:
    Puede pulsar la tecla Ctrl y hacer clic en las casillas correspondientes para activar o desactivar varias capas al mismo tiempo. Consulte la documentación para obtener más infomración sobre los accesos directos del teclado.

    Capa seagrass_predict1 y mapa base

    El mapa muestra las áreas de hábitat de posidonia, simbolizadas con un color morado más oscuro que representa las áreas con mayor probabilidad de presencia de posidonia. La predicción puede no ser tan precisa en determinadas zonas, como la Antártida, donde las variables explicativas están fuera del rango utilizado para el entrenamiento.

Evaluar la predicción

Después de ejecutar la predicción, evaluará los resultados y determinará si es necesario realizar cambios en su modelo de predicción. Tras revisar los diagnósticos del modelo y actualizar la predicción, guardará un archivo del modelo para compartirlo con otras personas que deseen replicar o ampliar su análisis.

Observando las áreas de hábitat de posidonia, ¿cómo puede saber si el modelo que ha creado es válido o si predice correctamente la variable de interés?

Capa seagrass_predict1 y mapa base

En muchos casos, no es posible saberlo con tan solo mirar el resultado de la predicción. Para evaluar su modelo, tendrá que examinar los datos de entrenamiento y los diagnósticos del modelo.

  1. En el panel Contenido, active la casilla para activar la capa trainfeatures1.
  2. Haga clic con el botón derecho en trainfeatures1 y, a continuación, haga clic en Acercar a capa.

    Acerque la capa trainfeatures1.

    Se muestra la capa trainfeatures1.

    Los puntos grises y verdes representan puntos de entrenamiento de fondo creados por la herramienta para recopilar datos sobre ubicaciones en las que puede o no existir hábitat de posidonia.

    Estos datos plantean un problema importante. La gran mayoría están en tierra, lo que no tiene sentido para un modelo que se supone que predice el hábitat de la posidonia. Se trata de un problema conceptual del modelo, que pone de manifiesto la importancia de tener conocimientos específicos del ámbito y comprender cada uno de los parámetros de la herramienta para garantizar que el modelo se especifica correctamente.

    A continuación, comprobará los diagnósticos del modelo para ver su rendimiento.

  3. En la parte inferior del panel Geoprocesamiento, haga clic en Ver detalles.

    Observe los detalles.

    Nota:
    Para acceder a la ventana Detalles, también puede abrir el panel Historial, hacer clic con el botón derecho en Predicción de solo presencia (MaxEnt) y, a continuación, hacer clic en Ver detalles.

    La ventana Detalles contiene información importante sobre el modelo creado y su rendimiento. También contiene las advertencias de la ejecución de la herramienta. En este caso, las advertencias no suponen un problema para su análisis.

  4. Haga clic en Mensajes y desplácese hasta la tabla Resumen del modelo.

    Tabla Resumen del modelo.‎

    Esta tabla muestra la tasa de omisión del modelo bajo el límite de probabilidad de presencia dado (0,5, en este caso) y el valor AUC. AUC es el área bajo la curva ROC (Receiver Operating Characteristic), que mide el rendimiento del modelo comparando los índices de verdaderos y falsos positivos. El mejor rendimiento del modelo viene indicado por unos índices de omisión más bajos y unos valores de AUC cercanos a 1.

    Nota:
    Puede haber pequeñas diferencias en los valores de Índice de omisión y AUC en los resultados, debido a pequeñas diferencias de interpolación EBK en función del hardware de su equipo.

    El AUC del modelo (cercano a 1) es muy alto, lo que resulta prometedor, pero el índice de omisión (superior a 0,15) también es un poco elevado. En la ventana Detalles también puede revisar otros datos para comprender mejor el modelo, como los coeficientes de regresión y el resumen de validación cruzada.

    Tabla de resumen de validación cruzada y advertencia

    La tabla Resumen de validación cruzada muestra que el % de presencia correctamente clasificada osciló entre el 82 y el 86 por ciento.

    Los últimos aspectos del modelo que evaluará son la curva de respuesta y las tablas de sensibilidad.

  5. Cierre la ventana Detalles.
  6. En el panel Contenido, desplácese hasta la sección Tablas independientes y, en la tabla rc1, en la sección Gráficos, haga doble clic en el gráfico Respuesta parcial de variables continuas.

    Haga doble clic en el gráfico Respuesta parcial de variables continuas.

    El gráfico Respuesta parcial de variables continuas muestra el impacto de los cambios en el valor de cada variable explicativa sobre la probabilidad de presencia, manteniendo constantes todas las demás variables.

    Gráfico Respuesta parcial de variables continuas abierto.

  7. Haga clic en el gráfico EBK_SALINITY.

    El gráfico EBK_SALINITY se muestra ampliado a la derecha.

    Haciendo clic en los gráficos más pequeños se obtienen mejores vistas de sus variables en el gráfico más grande de la derecha. El gráfico EBK_SALINITY el gráfico muestra que la probabilidad de presencia de un hábitat de posidonia alcanza su punto máximo en un estrecho intervalo de valores de salinidad.

  8. Cierre el gráfico Respuesta parcial de variables continuas.
  9. En la sección Tablas independientes, en la tabla sensitivity1, en la sección Gráficos, haga doble clic en el gráfico Índices de omisión y, a continuación, haga doble clic en el gráfico ROC Plot.
  10. Haga clic en las pestañas de los paneles de gráficos y arrástrelas para organizar los gráficos de modo que pueda verlos juntos.

    Índices de omisión y gráficos ROC Plot mostrados conjuntamente.

    Estos dos gráficos aportan un contexto adicional a los diagnósticos de índice de omisión y AUC que ha visto anteriormente.

  11. En el gráfico Índices de omisión, haga clic en una casilla y arrástrela para seleccionar los puntos cercanos al valor límite 0,5.

    Seleccione puntos de datos en el gráfico Índices de omisión.

    El valor límite 0,5 es el valor predeterminado que ha utilizado en el modelo.

    Puede investigar cómo afectaría el cambio del límite de probabilidad de presencia a la clasificación de los puntos de fondo haciendo clic y arrastrando para seleccionar puntos en el gráfico Índices de omisión.

    Si se reduce el valor límite, aumenta la proporción de puntos de fondo clasificados como posible presencia.

  12. Cierre los gráficos.

    Ha revisado los resultados del modelo y examinado algunos de los datos de diagnóstico contextuales. Ahora ajustará el modelo para abordar el problema conceptual de tener puntos de entrenamiento en tierra.

Volver a ejecutar el modelo con una área de estudio mejor

La primera ejecución del modelo creó el conjunto de puntos de clasificación entrenados dentro de la extensión de la envoltura convexa de los puntos de la capa de entidades USA_Train. Aunque los puntos están situados en aguas poco profundas, gran parte de la zona entre ellos está ocupada por tierra. Ahora volverá a ejecutar el modelo pero restringiendo la colocación de los puntos de clasificación entrenados a las áreas que se encuentran dentro de aguas poco profundas.

  1. Haga clic en la pestaña Análisis y, en la sección Geoprocesamiento, haga clic en Historial.

    Abra el historial de geoprocesamiento.

  2. En el panel Historial, haga doble clic en el primer resultado, Predicción de solo presencia (MaxEnt).

    Abra la herramienta Predicción de solo presencia (MaxEnt) para ejecutarla desde el historial de geoprocesamiento.

    Al abrir la herramienta de esta forma, se abre con todos los parámetros anteriores aún cumplimentados.

    Nota:
    Puede llevar algún tiempo volver a rellenar todos los valores de los parámetros en el panel de Geoprocesamiento.

    Solo cambiará algunos parámetros de la herramienta.

  3. En la herramienta Predicción de solo presencia (MaxEnt), desplácese hasta el parámetro Área de estudio, haga clic en la lista desplegable y seleccione Área de estudio poligonal.

    Elija la opción Área de estudio poligonal.

    Una vez que finalice la validación de la herramienta, aparecerá un nuevo parámetro.

  4. En Área de estudio poligonal, haga clic en la lista desplegable y seleccione USA shallow waters.

    Elija la capa USA shallow waters como capa de área de estudio poligonal.

    De este modo, el área de posibles lugares de prueba de presencia y ausencia de hábitats de posidonia se limitará a las áreas costeras de aguas poco profundas alrededor del territorio continental de Estados Unidos.

  5. En Archivo de salida el modelo entrenado, escriba seagrass_model.

    Tras unos instantes, se rellenará la ruta dentro de la estructura de carpetas del proyecto y se agregará la extensión de archivo .ssm al nombre del modelo.

    Nombre y ruta del archivo del modelo entrenado

    Trabajará con este archivo modelo en la siguiente sección del tutorial.

    Nota:
    Normalmente, evaluaría el nuevo modelo para asegurarse de que los resultados son adecuados antes de guardar el archivo del modelo, pero lo generará ahora para ahorrar tiempo.

  6. Expanda la sección Salidas de entrenamiento y agregue un 2 a los nombres de salida indicar que se trata de la segunda ejecución.

    • Entidades de entrenamiento de salida: trainfeatures2
    • Tabla de curvas de respuesta de salida: rc2
    • Tabla de sensibilidad de salida: sensitivity2

    Resultados del entrenamiento actualizados para mostrar que es la segunda vez que se ejecuta el modelo.

  7. Expanda la sección Opciones de predicción y agregue un 2 al nombre de Ráster de predicción de salida para indicar que se trata de la segunda ejecución.

    • Ráster de predicción de salida: seagrass_predict2

    Nombre de ráster de predicción de salida actualizado para mostrar que es la segunda vez que se ejecuta el modelo.

  8. Haga clic en Ejecutar.

    La herramienta tardará un poco (unos dos minutos) en ejecutarse.

    Cuando la herramienta finalice, las capas se agregarán al panel Contenido.

  9. En el panel Contenido, desactive las casillas para desactivar todas las capas, con la excepción de la capa seagrass_predict2 y el mapa base.

    Secundo conjunto de resultados de predicción

  10. En el panel Contenido, active la casilla de la capa trainfeatures2 para activarla.
  11. Haga clic con el botón derecho en la capa trainfeatures2 y seleccione Zoom a capa.

    Todas las entidades de entrenamiento se encuentran en los polígonos de aguas poco profundas.

    Las entidades de entrenamiento (ubicaciones de presencia y de fondo) se encuentran adecuadamente en zonas costeras no terrestres.

  12. En la herramienta Predicción de solo presencia (MaxEnt), haga clic en Ver detalles.

    Observe los detalles.

  13. Haga clic en Mensajes y desplácese hasta la tabla Resumen del modelo.

    Segundo informe de resumen del modelo

    Consulte los valores de Índice de omisión y AUC. Observe que el valor de AUC es similar al modelo anterior, pero el índice de omisión es muy inferior, lo que indica que el rendimiento del modelo ha mejorado.

    La tabla Resumen de validación cruzada muestra que el % de presencia correctamente clasificada osciló entre el 95 y el 96 por ciento.

    Tabla de resumen de validación cruzada

    También podría explorar los gráficos de Sensibilidad y Curva de respuesta de este nuevo modelo y compararlos con el modelo anterior.

  14. Cierre la ventana Detalles.

Comparar las predicciones

A continuación, comparará visualmente las predicciones de los dos modelos.

  1. En la cinta, haga clic en la pestaña Mapa y, en la sección Navegar, haga clic en Marcadores y en Europa.
  2. En el panel Contenido, desactive la visibilidad de todas las capas, con la excepción de seagrass_predict2, seagrass_predict1 y Light Gray Base.

    Las dos capas de predicción de posidonia están activadas en el panel de Contenido.

  3. En el panel Contenido, haga clic en la capa seagrass_predict2.

    Seleccione la capa seagrass_predict2.

    Aparece la pestaña contextual Capa ráster en la cinta. Esta pestaña está disponible al seleccionar una capa ráster en el panel Contenido.

  4. En la cinta, haga clic en la pestaña Capa ráster.

    Haga clic en el menú Capa ráster.

  5. En el grupo Comparar, haga clic en la herramienta Swipe.

    Haga clic en la herramienta Deslizar.

  6. En el panel del mapa, haga clic y arrastre la herramienta Deslizar hacia abajo por el mapa.

    Haga clic y arrastre por el mapa con la herramienta Deslizar.

    La herramienta Deslizar muestra la capa situada debajo de la capa seleccionada.

    La herramienta Deslizar oculta interactivamente la capa seleccionada y revela la capa situada debajo. Puede utilizar esta herramienta para explorar las diferencias entre su primera y su segunda predicción.

    Observe las diferencias en torno al Mar Báltico. Con el modelo inicial, la probabilidad prevista de presencia de hábitats de posidonia era muy baja en el Mar Báltico, especialmente alrededor de Copenhague (Dinamarca), por ejemplo. La probabilidad prevista aumentó en esta región en el segundo modelo. La posidonia es un importante foco de carbono en el Mar Báltico, sobre todo en algunas bahías protegidas de Dinamarca, lo que aumenta la confianza en los resultados del nuevo modelo.

    Normalmente, seguiría explorando las predicciones del modelo y comparándolas con otras ubicaciones conocidas de posidonia fuera de las aguas costeras de EE.UU., pero para los fines de este tutorial, está listo para pasar a compartir el modelo.

Ha predicho la distribución de hábitats de posidonia en zonas costeras de todo el mundo utilizando MaxEnt, trabajando con la herramienta Predicción de presencia única de forma iterativa para ajustar los parámetros y asegurarse de que su modelo se había especificado adecuadamente. A continuación, documentará el modelo y lo compartirá.


Compartir su modelo

Ahora que la predicción está completa y se han evaluado los resultados, el siguiente paso es hacer que el modelado en sí sea más transparente y reproducible. La segunda vez que ejecutó la herramienta Predicción de solo presencia, generó un archivo de modelo de estadística espacial (.ssm).

En este archivo agregará descripciones de variables y unidades para que el modelo esté completamente documentado y listo para ser compartido. Tanto si tiene previsto compartir el archivo del modelo como si no, mantener un archivo del modelo documentado en sus registros le permite volver a revisar análisis anteriores y comprender las variables de entrada previstas y sus unidades, así como revisar el rendimiento del modelo. Además, podrá compartir el modelo con otras personas, como colegas que quieran reproducir su análisis en su región o ampliarlo analizando un área local con datos de mayor resolución.

Documentar el archivo de modelo

Para documentar el archivo de modelo, siga estos pasos:

  1. En el panel Geoprocesamiento, haga clic en la flecha hacia atrás, escriba describir espacial en el cuadro de búsqueda y luego haga clic en Describir archivo de modelo de estadística espacial en los resultados.

    Busque y abra la herramienta Describir archivo de modelo de estadística espacial.

  2. En Archivo de modelo de entrada, haga clic en el botón Examinar y expanda las carpetas Project, Folders, SeagrassPrediction y p30.
  3. Haga clic en el archivo seagrass_model.ssm y luego en Acepatr.

    Vaya al archivo seagrass_model.ssm y ábralo.

    Aparece un mensaje informativo con información básica sobre el modelo, incluido el tipo de modelo y la variable a predecir.

    Información sobre el modelo

  4. Haga clic en Ejecutar.
  5. Una vez que la herramienta se haya ejecutado, haga clic en Ver detalles.

    Consulte los detalles de ejecución de la herramienta.

  6. Expanda la ventana Detalles y revise su contenido.

    Detalles de los parámetros del modelo

    Se proporcionan muchos detalles sobre el modelo, como la fecha de creación del modelo, el tipo de modelo, los predictores y la respuesta, así como las características y diagnósticos del modelo, incluidos AUC e Índice de omisión.

    Es importante destacar que las ubicaciones y valores de entrada no se revelan en un archivo de modelo, por lo que puede compartir un modelo incluso si los datos de entrada son sensibles, como las ubicaciones de anidación de una especie de ave en peligro de extinción.

    No hay información para los campos Descripción y Unidad para la variable a predecir y los rásteres de entrenamiento explicativos. Sin saber qué representa cada variable y sus unidades, otro usuario no podrá utilizar el archivo del modelo. Imaginemos que un usuario supusiera que la temperatura se mide en grados Fahrenheit para este modelo cuando en realidad es en grados Celsius: sus predicciones serían incorrectas.

    A continuación, completará la información que falta.

  7. Cierre la ventana Detalles.
  8. En el panel Geoprocesamiento, haga clic en la flecha hacia atrás, escriba Establecer estadísticas espaciales en el cuadro de búsqueda y luego haga clic en Establecer las propiedades del archivo del modelo de estadísticas espaciales.

    Abra la herramienta Establecer las propiedades del archivo del modelo de estadísticas espaciales.

  9. En Archivo de modelo de entrada, haga clic en el botón Examinar, haga clic en el archivo seagrass_model.ssm y, por último, en Aceptar.

    Se enumeran los nombres de las variables y los rásteres utilizados en el modelo. En los cuadros Descripción y Unidad puede agregar información a la documentación del modelo.

    Vaya al archivo del modelo.

  10. En la sección Variable a predecir, en Solo presencia, en el curado Descripción, escriba Presencia de hábitat de posidonia.

    Descripción de la variable

  11. En la sección Variable a predecir, en Solo presencia, en el cuadro Unidad, escriba Ninguna.

    La unidad es Ninguna para Solo presencia.

  12. En la sección Rásteres de entrenamiento explicativos, cumplimente cada variable Descripción y Unidad como se indica a continuación:
    • Para: EBK_DISSO2, Descripción: Oxígeno disuelto, Unidad: ml/l
    • Para: EBK_NITRATE, Descripción: Nitratos, Unitdad: μmol/l
    • Para: EBK_PHOSPHATE, Descripción: Fosfatos, Unidad: μmol/l
    • Para: EBK_SALINITY, Descripción: Salinidad, Unidad: Ninguna
    • Para: EBK_SILICATE, Descripción: Silicatos, Unidad: μmol/l
    • Para: EBK_SRTM30, Descripción: Profundidad, Unidad: Metros
    • Para: EBK_TEMP, Descripción: Temperatura, Unidad: °C

    Información descriptiva de los rásteres de entrenamiento explicativos

  13. Desplácese hasta la parte superior de la herramienta y haga clic en el cuadro Archivo de modelo de entrada.

    De este modo se debería activar la validación de las variables introducidas. A veces, estos valores se pierden si no se activa la validación de la herramienta antes de ejecutarla.

  14. Haga clic en Ejecutar.
  15. Haga clic en Ver detalles.

    Consulte los detalles de la herramienta Establecer las propiedades del archivo del modelo de estadísticas espaciales.

    La herramienta notifica que los campos se han actualizado.

    Las descripciones y las unidades se han actualizado.

  16. Cierre la ventana Detalles.
  17. En el Historial de geoprocesamiento, haga doble clic en la herramienta Describir el archivo de modelo de estadísticas espaciales.
  18. Haga clic en Ejecutar y luego en Ver detalles.

    Los detalles se actualizan.

    Ha confirmado que las descripciones de las variables y las unidades están ahora correctamente documentadas y que el archivo del modelo está listo para ser compartido por correo electrónico, en una unidad compartida o en línea. Puede conservar este archivo de modelo para realizar una predicción diferente en el futuro o compartirlo con otras personas que deseen realizar predicciones adicionales. Por ejemplo, en esta predicción se utilizaron datos de la media decenal (media de 50 años) de las Unidades Ecológicas Marinas (UEM), pero otro investigador podría querer realizar la predicción utilizando mediciones oceánicas proyectadas para comprender cómo podrían cambiar las distribuciones de la posidonia en condiciones de calentamiento oceánico.

  19. Cierre la ventana Detalles.

En este tutorial, ha preparado datos de entrenamiento y ha creado un modelo de aprendizaje automático para predecir los hábitats de posidonia en las regiones costeras de todo el mundo. También ha hecho que su análisis sea reproducible y ampliable documentando el archivo del modelo para compartirlo con otras personas que quieran reproducir su trabajo o utilizarlo como referencia. Promover la ciencia abierta es una parte importante de los esfuerzos de conservación, incluidos los de la posidonia y los ecosistemas que sustenta. En este tutorial se ha utilizado un enfoque simplificado de modelado de la posidonia y, en algunos casos, se han optimizado los ajustes de los parámetros de las herramientas para acelerar el procesamiento. Los siguientes recursos proporcionan más información sobre los esfuerzos realizados en el mundo real para modelar el hábitat de la posidonia:

  • Aydin, Orhun, Carlos Osorio-Murillo, Kevin A. Butler y Dawn Wright. 2022. "Conservation Planning Implications of Modeling Seagrass Habitats with Sparse Absence Data: A Balanced Random Forest Approach." Journal of Coastal Conservation 26 (3): 22. https://doi.org/10.1007/s11852-022-00868-1.
  • Bertelli, Chiara M., Holly J. Stokes, James C. Bull y Richard K. F. Unsworth. 2022. "The Use of Habitat Suitability Modelling for Seagrass: A Review." Frontiers in Marine Science 9. https://www.frontiersin.org/articles/10.3389/fmars.2022.997831.
  • McKenzie, Len J., Lina M. Nordlund, Benjamin L. Jones, Leanne C. Cullen-Unsworth, Chris Roelfsema y Richard K. F. Unsworth. 2020. "The Global Distribution of Seagrass Meadows." Environmental Research Letters 15 (7): 074041. https://doi.org/10.1088/1748-9326/ab7d06.
  • Wang, Ming, Yong Wang, Guangliang Liu, Yuhu Chen y Naijing Yu. 2022. "Potential Distribution of Seagrass Meadows Based on the MaxEnt Model in Chinese Coastal Waters." Journal of Ocean University of China 21 (5): 1351–61. https://doi.org/10.1007/s11802-022-5006-2.