Preparar los datos

Para tomar decisiones de conservación informadas para su bosque, identificará las regiones que comparten características bioclimáticas comunes.

Explorar el proyecto

Comenzará descargando los datos del tutorial.

  1. Descargue el paquete de proyecto IdentifyRegions.ppkx y localice el archivo descargado en su equipo.

    Nota:
    La mayoría de los navegadores web descargan archivos de manera predeterminada en la carpeta Descargas del equipo.

  2. Haga doble clic en el paquete de proyecto IdentifyRegions.ppkx.

    Los paquetes de proyecto son una forma de compartir proyectos y datos de ArcGIS Pro. Son archivos comprimidos que, al abrirlos, extraen una copia del proyecto a su carpeta C:\Users\[user name]\Documents\ArcGIS\Packages.

    El paquete de proyecto se extrae y el proyecto se abre en un mapa que muestra un mapa base y el contorno del Bosque Nacional de El Yunque.

    Bosque Nacional El Yunque en un mapa

    El Bosque Nacional El Yunque está situado en la parte oriental de Puerto Rico.

Descargar datos bioclimáticos

El dataset de variables bioclimáticas Climatologies at high resolution for the earth’s land surface areas (CHELSA) es un dataset climático global de alta resolución útil para modelar la distribución de las especies. Descargará un ráster de una variable que puede ser útil en su análisis.

  1. En un navegador, vaya a la página CHELSA Bioclim.
  2. Lea la descripción del dataset Bioclim.

    Nota:
    Cuando investigue una capa de datos que pueda resultarle útil, es importante que estudie su descripción, que proporciona información contextual importante sobre los datos, como quién los compiló, cómo se recopilaron, para qué están pensados y si existen restricciones de uso sobre los datos o quién puede utilizarlos.

    Los datos CHELSA están disponibles con la condición de que cite la publicación original y el dataset.

  3. Desplácese hasta la tabla de descripción de la capa.

    Tabla de descripción de la capa.

    Esta tabla proporciona información sobre cada una de las capas que puede ayudarle a determinar qué capas utilizar.

    La capa bio1 contiene datos sobre la temperatura media anual del aire. Podría resultar útil para identificar regiones dentro de su bosque.

    Hay 50 capas documentadas en esta tabla. Las 19 capas precedidas de bio son de interés para este tutorial. En función de los detalles de su trabajo de conservación, elegirá otras combinaciones de capas.

  4. Desplácese hacia arriba, hasta encima de la tabla, y haga clic en el vínculo de descarga LAS CAPAS SE PUEDEN DESCARGAR AQUÍ.

    Vínculo de descarga encima de la tabla

    Se abrirá la página del Explorador de archivos S3. Muestra cuatro carpetas. La primera carpeta contiene los datos históricos del periodo 1981-2010. Las otras tres carpetas contienen datos proyectados elaborados con distintos modelos climáticos.

  5. En la página del Explorador de archivos S3, haga clic en el botón expandir situado junto a la carpeta 1981-2010/.

    El botón Expandir para la fila 1981-2010

    La carpeta se expande.

  6. Haga clic en el botón Expandir situado junto a la carpeta bio/.

    Botón Expandir junto a la carpeta bio

  7. Busque el archivo con _bio1_ en el nombre de archivo y haga clic en el botón de descarga del archivo CHELSA_bio1_1981-2010.V.2.1.tif.

    Vínculo de descarga de CHELSA_bio1_1981-2010.V.2.1.tif

    El archivo CHELSA_bio1_1981-2010.V.2.1.tif se descarga en su equipo. El archivo tiene un tamaño de 110 MB.

    Según la tabla que ha consultado antes, este archivo es un dataset ráster de la temperatura media anual del aire para el periodo 1981-2010.

    Recortará y muestreará este archivo para obtener datos para su bosque.

    Para este tutorial, no necesita descargar ningún otro archivo de datos bioclimáticos. Se han descargado y recortado, y se almacenan en el proyecto para su uso posterior.

Agregar los datos al proyecto

Ahora que ha descargado los datos de la temperatura del aire, los agregará a su proyecto.

  1. En ArcGIS Pro, en la cinta, haga clic en la pestaña Mapa y en la sección Capa, haga clic en Agregar datos.

    El botón Agregar datos de la cinta en la sección Capas de la pestaña Mapa

  2. En la ventana Agregar datos, expanda Equipo, expanda Este PC y haga clic en Descargas.

    Si su navegador está configurado para descargar en otra ubicación, localice el archivo en el Microsoft File Explorer y examine la ubicación en la ventana Agregar datos.

  3. Haga clic en el dataset ráster CHELSA_bio1_1981-2010.V.2.1.tif y pulse Aceptar.

    Agregue datos desde la carpeta Descargas.

    Aparece un mensaje que pregunta si desea calcular estadísticas para el ráster.

  4. Haga clic en .

    Aparece la capa CHELSA_bio1_1981-2010_V.2.1.tif en el mapa.

    La capa agregada al mapa

    La capa tiene una extensión global, pero esta parte aparece mayoritariamente en blanco. Cubre el mapa base que era visible antes. Puede ver el polígono del límite del bosque y algunos píxeles de color gris claro dentro del bosque.

    Si observa el rango Valor de la capa, verá que las celdas de este ráster tienen valores entre 2196 y 3079, con los valores altos dibujados en tonos más claros de gris.

    Si comprueba la tabla que describe los datos, verá que éstos tienen un factor de escala y un desplazamiento.

    Explicación de los datos de la capa bio1

    Haciendo la conversión a partir de esta información (multiplicar por el valor de escala de 0,1 y restar 273,15), los valores del ráster se traducen a grados Celsius, oscilando entre -53,55 y 34,75.

  5. En el panel Contenido, haga clic con el botón derecho en la capa CHELSA_bio1_1981-2010.V.2.1.tif y, a continuación, haga clic en Zoom a capa.

    Zoom a capa

    El mapa muestra toda la extensión de la capa.

    valores de la capa bio1 para el mundo

    Puede ver que las regiones ecuatoriales son de color claro, con valores de temperatura elevados, y los polos son más oscuros, con valores de temperatura bajos. El límite del parque es visible como un pequeño parche oscuro.

    Es bueno explorar los datos que descargue para saber si serán adecuados para su análisis.

  6. En el panel Contenido, haga clic con el botón derecho en la capa boundary y en Acercar a capa.

    Ha descargado y explorado la capa CHELSA_bio1_1981-2010.V.2.1.tif. Parece que será útil para su análisis.

Recortar el ráster

No necesita toda la extensión de los datos para su trabajo en el bosque, así que a continuación recortará los datos utilizando el límite del bosque.

  1. En la cinta, en la pestaña Análisis, en la sección Geoprocesamiento, haga clic en Herramientas.

    Botón Herramientas en la cinta

    Se abre el panel Geoprocesamiento.

  2. En el panel Geoprocesamiento, en el cuadro de búsqueda, escriba recortar ráster y en los resultados de la búsqueda de herramientas, haga clic en la herramienta Recortar ráster.

    Herramienta Recortar ráster en los resultados de la búsqueda

  3. En la herramienta Recortar ráster, en Ráster de entrada, elija la capa CHELSA_bio1_1981-2010.V.2.1.tif.
  4. En Extensión de salida, elija la capa boundary.

    Herramienta Recortar ráster

    La herramienta recortará el ráster de entrada en toda la extensión de la capa de entidades del límite, a menos que especifique que debe utilizar las entidades de la capa para el recorte.

  5. Active la casilla Utilizar entidades de entrada para recortar geometría.

    La casilla Utilizar entidades de entrada para recortar geometría está activada.

    De esta forma, recortará el ráster al límite del bosque.

    El nombre del Dataset ráster de salida es por defecto la primera parte del nombre del ráster original con _Clip incorporado al final. El ráster se guardará en la geodatabase de su proyecto.

  6. Haga clic en Ejecutar.

    El ráster se recorta y la capa CHELSA_bio1_19812010_V_Clip se agrega al mapa.

    Dado que el ráster recortado contiene un rango de valores distinto del original, la simbología de la capa es diferente, y la rampa de colores muestra con mayor claridad el rango de valores del bosque.

    CHELSA_bio1_19812010_V_Clip agregada al mapa

    Ya no necesita el ráster original con toda la extensión global, así que lo eliminará ahora.

  7. En el panel Contenido, haga clic con el botón derecho en la capa CHELSA_bio1_1981-2010.V.2.1.tif y, a continuación, haga clic en Eliminar.
    Nota:

    Para ahorrar tiempo y reducir el tamaño de la descarga de datos del tutorial, se han recortado para usted los rásteres de las demás variables bioclimáticas. Si tuviera que hacerlo usted mismo, podría abrir la herramienta Recortar ráster en modo por lotes buscando la herramienta, haciendo clic con el botón derecho y haciendo clic en Lote. En el panel de configuración de la herramienta por lotes, el parámetro de la herramienta por lotes sería el Ráster de entrada. Haría clic en Siguiente y se abriría la herramienta Recortar ráster por lotes. A continuación, podría agregar todos los rásteres de entrada para el Ráster de entrada por lotes y configurar el resto de los ajustes de la herramienta del mismo modo que lo hizo para la herramienta Recprtar ráster. Al ejecutar la herramienta se recortaría cada ráster a la extensión del bosque.

Generar puntos de muestra

El siguiente paso es crear un conjunto de puntos a partir del ráster. Así podrá combinar datos de varios rásteres de forma que se puedan visualizar y realizar análisis de clústeres multivariantes. Utilizará la herramienta De ráster a punto para crear un conjunto de puntos en los centros de las celdas, con los valores ráster como atributo.

  1. En la herramienta Recortar ráster, haga clic en el botón Atrás.
  2. En el panel Geoprocesamiento, en el cuadro de búsqueda, escriba de ráster a punto y en los resultados de la búsqueda de herramientas, haga clic en la herramienta De ráster a punto.

    Resultados de la búsqueda que muestran la herramienta De ráster a punto

  3. En la herramienta De ráster a punto, en Ráster de entrada, elija la capa CHELSA_bio1_19812010_V_Clip.
  4. En Campo, acepte el valor predeterminado de Valor.
  5. En Entidades de puntos de salida, escriba bioclimate_points.

    La herramienta De ráster a punto está lista para ejecutarse.

  6. Haga clic en Ejecutar.

    La capa bioclimate_points se agrega al mapa.

    Los puntos bioclimáticos en los centros de las celdas ráster

    Utilizará esta capa para muestrear los ráster bioclimáticos. Se han preparado para usted y se encuentran en el mapa Rásteres de muestra. Copiará los puntos que acaba de realizar y, a continuación, pasará al mapa con los rásteres.

  7. En el panel Contenido, haga clic con el botón derecho en la capa bioclimate_points y haga clic en Copiar.

    Panel Contenido y menú contextual con el botón derecho para copiar una capa

  8. En el panel del mapa, haga clic en la pestaña del mapa Rásteres de muestra.

    Las pestañas de mapa en la parte superior del panel Mapa

  9. En el panel Contenido, haga clic con el botón derecho en Rásteres de muestra y haga clic en Pegar.

    Panel Contenido y menú contextual con el botón derecho para pegar una capa

    Este nuevo mapa tiene una capa de grupo BioclimateRasters que contiene una versión recortada de cada uno de los 19 rásteres bioclimáticos de CHELSA.

    La capa de grupo BioclimateRasters en el panel Contenido del mapa Rásteres de muestra

    La capa de grupo está configurada con opciones que le permiten cambiar entre rásteres individuales. Para obtener más información, consulte Trabajar con capas de grupo.

Valores de ráster de muestra

Ahora que ha creado puntos en los centros de las celdas ráster, el siguiente paso es ejecutar la herramienta Muestra, que utilizará para obtener valores de cada uno de los rásteres en esos puntos.

  1. En la herramienta De ráster a punto, haga clic en el botón Atrás.
  2. En el panel Geoprocesamiento, en el cuadro de búsqueda, escriba muestra y en los resultados de la búsqueda de herramientas, haga clic en la herramienta Muestra.

    Resultados de la búsqueda que muestran la herramienta Muestra

  3. En Rásteres de entrada, haga clic en el botón Agregar muchos.

    El botón Agregar muchos sirve para agregar varios rásteres de entrada.

  4. Active la casilla para seleccionar todo.

    Active la casilla para seleccionar todos los rásteres.

  5. Haga clic en Agregar.

    Agregue todos los rásteres seleccionados a la sección Rásteres de entrada.

  6. En Entidades o ráster de ubicación de entrada, elija bioclimate_points.
    Elija la capa bioclimate_points para muestrear los rásteres.

    Cada punto de la capa bioclimate_points se utilizará para muestrear cada uno de los valores ráster de esa ubicación.

  7. En Tabla o clase de entidad de salida, escriba Sample_vals.

    El nombre de la tabla de salida es Sample_vals.

  8. Acepte los valores predeterminados para Técnica de remuestreo y Campo de Id. único.
  9. Haga clic en Ejecutar.

    La tabla Sample_vals se agrega al panel Contenido en la sección Tablas independientes.

  10. En el panel Contenido, haga clic con el botón derecho en la tabla Sample_vals y haga clic en Abrir.

    Abra la tabla.

  11. Examine la tabla.

    Los nombres de los campos se derivan de los nombres de las capas ráster. Contienen la información necesaria para identificar las variables bioclimáticas que necesita, pero podrían ser más claras.

    Los nombres de campo de las variables bioclimáticas muestreadas se basan en nombres de ráster.

    Dará a un campo un alias más comprensible para facilitar la interpretación de los datos.

Establecer un alias de campo

Cuando tenga nombres de campo difíciles de entender, puede asignarles alias para que sea más fácil trabajar con ellos. La página de descripción de CHELSA Bioclim incluía una tabla con campos de nombre corto y nombre largo. Puede utilizar esta tabla para identificar a qué variables bioclimáticas corresponden los códigos, como bio1, bio2, bio3, etc., y utilizar esos nombres como alias de campo.

  1. En un navegador, vaya a la página CHELSA Bioclim.
  2. Revise la tabla de descripción de la capa.

    La tabla de descripción de la capa de la página CHELSA Bioclim tiene columnas de nombre corto y nombre largo.

  3. En el panel Contenido, en la sección Tablas independientes, haga clic con el botón derecho en la tabla Sample_vals, señale Diseño de datos y haga clic en Campos.

    Opción del menú contextual Diseño de datos que muestra la opción Campos

    Aparece el panel Diseñar campos.

  4. Haga clic en la columna Alias de la variable _bio1_.

    La columna Alias de la variable.

    Utilizando la tabla de la página web de CHELSA Bioclim, la variable _bio1_ corresponde a la Temperatura media anual del aire.

  5. En la columna Alias de la variable _bio1_, escriba mean_annual_air_temperature.

    Panel Diseñar campos para la tabla Sample_vals

    Puede utilizar este método para actualizar los alias de cada campo. Sin embargo, para este tutorial, no es necesario establecer alias para todos los campos. Se ha preparado una capa que utilizará más tarde, para guardar tiempo.

  6. En la cinta, en la pestaña Tabla independiente, en la sección Administrar ediciones, haga clic en Guardar.

    El botón Guardar de la sección Administrar ediciones le permite guardar los cambios en los alias de los campos.

    El nombre de la columna se actualiza en la tabla.

    La tabla Sample_vals muestra ahora el alias mean_annual_air_temperature.

Unir la tabla de muestras a los puntos

El último paso para obtener los datos bioclimáticos en características puntuales para su análisis es unir la tabla que ha creado con los puntos que ha obtenido de los centros de las celdas.

  1. En el panel Contenido, haga clic con el botón derecho en la capa bioclimate_points, apunte a Uniones y relaciones y haga clic en Agregar unión.

    Se abrirá la herramienta Agregar unión.

  2. En la herramienta Agregar unión, en Campo de entrada, elija OBJECTID.

    La herramienta detecta que hay una tabla independiente en el contenido y la agrega al parámetro Unir tabla. También detecta que la tabla tiene un campo llamado OBJECTID y lo establece como Campo de unión predeterminado.

    La herramienta Agregar unión con tablas y campos agregados

    Estas son las entradas correctas, por lo que la herramienta ya está lista para ejecutarse. Si tuviera otras tablas, o quisiera unirse en otros campos, podría cambiarlas.

  3. Haga clic en Aceptar.
  4. Haga clic con el botón derecho en la capa bioclimate_points y haga clic en Tabla de atributos.

    La capa de puntos tiene ahora los atributos de la tabla Sample_vals.

    La tabla muestra el alias que ha establecido para el campo mean_annual_air_temperature.

    La capa de entidades de punto tiene ahora atributos de la tabla a la que se ha unido.

    Los datos ya están listos para su exploración y análisis con el fin de identificar regiones.

Ha descargado datos bioclimáticos, los ha recortado a su área de interés, ha creado puntos de muestreo a partir de los centros de las celdas, ha muestreado varios datos ráster bioclimáticos en una tabla, ha establecido un alias y ha unido la tabla a sus puntos. A continuación, explorará los datos preparados.


Identificar variables

Ahora que ha preparado los datos bioclimáticos, es hora de explorar las variables.

Cree una matriz de gráficos de dispersión

Una matriz de gráficos de dispersión es una buena forma de comparar pares de variables cuando tiene varias variables numéricas que considerar. Creará una matriz de dispersión de las variables bioclimáticas para explorar las relaciones entre ellas.

  1. En el panel del mapa, haga clic en la pestaña del mapa Identificar variables.

    La pestaña del mapa Identificar variables

    El mapa Identificar variables muestra la capa del límite del bosque y una capa denominada sample_locations. La capa sample_locations tiene los datos de la muestra de la variable bioclimática con nombres de campo descriptivos y alias.

  2. En el panel Contenido, haga clic con el botón derecho en la capa sample_locations, apunte a Crear gráfico y haga clic en Matriz de gráficos de dispersión.

    El menú contextual para crear una matriz de dispersión para una capa

    Aparece el panel Propiedades de gráfico.

    Este panel le permite configurar las propiedades de un gráfico. El primer paso para configurar una matriz de gráficos de dispersión es seleccionar las variables numéricas que se trazarán unas contra otras.

  3. En el panel Propiedades de gráfico, haga clic en Seleccionar.

    El panel Propiedades del gráfico muestra el botón Seleccionar campos numéricos

    Hay 19 variables bioclimáticas para seleccionar en la matriz de gráficos de dispersión.

  4. Haga clic en el botón Activar todas las casillas de verificación.

    La casilla de selección Campo con el botón Activar todas las casillas de verificación

    Como hay tantos campos, es más fácil seleccionar todos los campos y desmarcar los que no desee utilizar.

  5. Desmarque los dos primeros campos, pointid y grid_code y haga clic en Aplicar.

    Los campos de la variable bioclima están activados y pointid y grid_code están desactivados.

    La matriz de gráficos de dispersión aparece en el panel de gráficos.

Utilizar una matriz de gráficos de dispersión para examinar las relaciones entre los datos

Ahora que ha creado la matriz de gráficos de dispersión, la utilizará para explorar los datos y examinar las relaciones entre variables en diferentes ubicaciones del bosque. Usted decidirá qué variables utilizar en función de los requisitos de su estudio y de esta exploración.

Si el gráfico está anclado en ArcGIS Pro, puede resultar demasiado pequeño para leerlo, por lo que primero flotará el panel para facilitar su ampliación.

  1. Haga clic con el botón derecho del ratón en la pestaña sample_locations - Matriz de gráficos de dispersión de Sample_locations y haga clic en Flotar.

    La opción Flotar del menú contextual de la pestaña de la matriz de gráficos de dispersión

  2. Haga clic y arrastre la esquina de la ventana del gráfico Matriz de gráficos de dispersión de sample_locations para agrandarla y poder ver mejor la matriz de trazados.

    La ventana Matriz de gráficos de dispersión

    El gráfico muestra cada una de las variables en los ejes X e Y. Muestra un pequeño gráfico de dispersión para cada combinación de variables.

    Si mantiene el puntero sobre uno de los pequeños gráficos, un elemento emergente mostrará los nombres de las variables y el valor de R cuadrado.

  3. Mantenga el puntero sobre uno de los gráficos con una alta correlación positiva (una línea estrecha de puntos con una tendencia ascendente de izquierda a derecha).

    Mantenga el puntero sobre un punto para obtener un elemento emergente con los nombres de las variables y el valor R cuadrado de la relación.

    En este dataset, para esta área de estudio en particular, la precipitación en cada ubicación durante el mes más seco está fuertemente correlacionada de forma positiva con la precipitación en cada ubicación en el mes más húmedo.

  4. Mantenga el puntero sobre uno de los gráficos con una alta correlación negativa (una línea estrecha de puntos con una tendencia descendente de izquierda a derecha).

    Mantenga el puntero sobre un punto para obtener un elemento emergente con los nombres de las variables y el valor R cuadrado de la relación.

    En este dataset, para esta área de estudio, la temperatura media anual en cada ubicación está fuertemente correlacionada de forma negativa con la estacionalidad de la temperatura (la desviación estándar de las temperaturas medias mensuales) en cada ubicación.

  5. Haga clic en uno de los gráficos con una correlación menos clara y, a continuación, mantenga el puntero sobre el gráfico.

    Haga clic en una parcela para seleccionarla y, a continuación, mantenga el puntero sobre ella.

    Al hacer clic en uno de los gráficos, se selecciona y también se muestra como un gráfico más grande en la parte superior derecha de la ventana del gráfico.

    El gráfico seleccionado se amplía en la parte superior derecha de la ventana.

    En este dataset, para esta área de estudio, no parece existir una fuerte correlación entre la estacionalidad de la temperatura y la precipitación media durante el trimestre más seco. Es posible que existan relaciones diferentes entre estas variables para subconjuntos distintos de los datos.

  6. En la barra de herramientas de la matriz de gráficos de dispersión, haga clic en la herramienta Selección.

    La herramienta de selección en la ventana de la matriz de gráficos de dispersión

    Los gráficos y el mapa están vinculados, por lo que las selecciones en el gráfico grande se reflejan en todos los gráficos de dispersión más pequeños y en el mapa. Esto le permite seleccionar de forma interactiva puntos de datos en el gráfico y ver su ubicación en el mapa.

  7. Haga clic y arrastre un recuadro para seleccionar algunos de los puntos de la sección superior derecha del diagrama de dispersión seleccionado.

    Haga clic y arrastre un recuadro en el gráfico para seleccionar algunos puntos de datos.

    Matriz de gráficos de dispersión que muestra una selección

    La selección en el gráfico grande se refleja en los gráficos más pequeños.

    La selección también se muestra en el mapa.

    Puntos seleccionados resaltados en el mapa

    Podría utilizar este método para seguir explorando las relaciones entre las distintas variables en otros lugares de su área de estudio.

  8. Haga clic en un área del gráfico grande sin puntos.

    Un área sin puntos en el gráfico

    La selección se borra en el gráfico y en el mapa.

  9. Cierra la ventana del gráfico.

    El gráfico se muestra en el panel Contenido. Puede volver a abrirlo haciendo doble clic sobre él.

    Matriz de gráficos de dispersión en el panel Contenido

    El dataset Bioclimate de CHELSA es un dataset polivalente, aplicable a muchos temas de investigación. De las 19 variables bioclimáticas, muchas están relacionadas con la temperatura y las precipitaciones, y muchas de estas variables están altamente correlacionadas. Muestran las tendencias anuales, la estacionalidad y los factores extremos o limitantes. No todos los datos aquí recogidos serán útiles para un proyecto determinado.

    Para el análisis de la regionalización, quiere variables que no estén altamente correlacionadas. Utilizará la precipitación anual, el rango de temperatura anual y la temperatura media anual para definir las regiones. Dependiendo de su área y de su caso de uso, podría elegir otras variables.

Ha explorado las relaciones entre pares de variables bioclimáticas y cómo diferentes subconjuntos geográficos de variables pueden tener diferentes relaciones y patrones de clústeres dentro de este dataset. Ahora realizará un análisis de regionalización de las variables seleccionadas.


Identificar regiones

Una vez preparados los datos e identificadas las variables, el último paso consiste en realizar un análisis de regionalización.

La regionalización consiste en dividir un área en regiones más pequeñas en función de criterios específicos que prevalecen dentro de cada región, para comprender las características de cada una de ellas. El propósito de la regionalización es resumir los importantes factores medioambientales predominantes en regiones espaciales para la planificación y administración de la conservación. En función de la especie y el área de interés, serán importantes distintas variables.

Crear clústeres

Utilizará la herramienta Clustering multivariante para crear clústeres basados en las variables que haya seleccionado.

  1. En el panel del mapa, haga clic en la pestaña del mapa Identificar regiones.

    La pestaña del mapa Identificar regiones

    Este mapa muestra la capa sample_locations y la capa boundary.

  2. En el panel Geoprocesamiento, en el cuadro de búsqueda, escriba multivariate clustering y, en los resultados de la búsqueda de herramientas, haga clic en la herramienta Clustering multivariante.

    La herramienta Clustering multivariante en los resultados de búsqueda de la herramienta de geoprocesamiento

  3. En la herramienta Clustering multivariante, en Entidades de entrada, elija la capa sample_locations.

    La capa sample_locations es el parámetro Entidades de entrada.

  4. En el cuadro Campos de análisis, active Annual_precipitation, Annual_temperature_range y Mean_annual_temperature.

    El cuadro Campos de análisis con tres variables activadas

  5. Acepte los valores predeterminados para Método de clustering y Método de inicialización.

    El algoritmo de agrupación predeterminado es el algoritmo de valores medios K. El método de inicialización predeterminado es la ubicación optimizada de valores de inicialización. Para obtener más información sobre estos parámetros, consulte la ayuda de la herramienta.

  6. Deje vacío el parámetro Número de clústeres.

    Si tiene un número predeterminado de clústeres que desea que encuentre la herramienta, puede especificarlo aquí. Para una exploración inicial de los clústeres naturales de sus datos, puede dejar este valor sin especificar. La herramienta identificará un número óptimo de clústeres en base a los datos.

  7. En Tabla de salida para la evaluación del número de clústeres, escriba Output_number_of_clusters.

    Se ha rellenado el parámetro opcional Tabla de salida para la evaluación del número de clústeres, por lo que se crearán la tabla y el gráfico.

    Al especificar esta tabla de salida también se creará un gráfico que mostrará los valores del pseudo índice estadístico F para distintos números de clústeres. Los valores más elevados del pseudo índice estadístico F indican las soluciones que obtienen mejores resultados al maximizar tanto las similitudes dentro de un mismo clúster como las diferencias entre clústeres.

    Utilizará este gráfico para comprender el resultado de la herramienta y tomar su propia decisión sobre cuántos clústeres crear.

  8. Haga clic en Ejecutar.

    La herramienta se ejecuta y, al cabo de poco tiempo, la capa sample_locations_MultivariateClustering se agrega al mapa.

    La capa sample_locations_MultivariateClustering se agrega al mapa.

    Esta capa muestra las ubicaciones de las muestras simbolizadas por Id. de clúster. Se han identificado tres clústeres.

    Es un comienzo, pero los tres clústeres son grandes y quizá no se presten a una toma de decisiones ecológicas detalladas. Podría especificar que la herramienta creara más clústeres, pero ¿cómo saber cuántos clústeres deberían ser?

    Como ha especificado que la herramienta cree la tabla Output_number_of_clusters, también ha elaborado un gráfico que puede explorar para comprender mejor los clústeres de sus datos. A continuación, afinará su análisis utilizando esta información.

Afinar el análisis de clústeres

Ahora consultará los valores del pseudo índice estadístico F que la herramienta registró en la tabla Output_number_of_clusters.

  1. En el panel Contenido, en la sección Tablas independientes, en la subsección Gráficos, haga doble clic en el Gráfico de pseudo índice estadístico F optimizado.

    El Gráfico de pseudo índice estadístico F optimizado fue agregado por la herramienta al panel Contenido.

    Aparece el gráfico. En caso necesario, cambie el tamaño para que se vea mejor.

    Gráfico de pseudo índice estadístico F optimizado abierto en el panel Gráfico

    Este gráfico muestra los valores del pseudo índice estadístico F para soluciones de clúster entre 3 y 30. Esta estadística es el ratio entre la varianza entre clústeres y la varianza dentro del clúster. Los valores más grandes son mejores para maximizar tanto las similitudes dentro de un mismo clúster como las diferencias entre clústeres.

    La herramienta creó tres clústeres porque el valor más alto del pseudo índice estadístico F está en 3, como puede verse en el gráfico. Hay un segundo pico en 6, que también es una solución aceptable.

  2. Cierre el gráfico.
  3. Haga clic en la pestaña Geoprocesamiento.

    El panel de la herramienta Clustering multivariante muestra los ajustes que utilizó al ejecutar la herramienta. Cambiará el número de clústeres que harán las herramientas y lo ejecutará de nuevo.

  4. En la herramienta Clustering multivariante, en el recuadro Número de clústeres, escriba 6.

    Establezca el número de clústeres en 6.

  5. Acepte los valores predeterminados de los otros parámetros y haga clic en Ejecutar.

    La herramienta se ejecuta y genera un nuevo mapa con seis clústeres.

    Mapa de resultados de herramientas con seis clústeres

    Además del mapa de los clústeres de puntos, la herramienta crea un gráfico que muestra las características de los clústeres. Lo examinará a continuación.

Explorar las características de los clústeres

Los puntos de cada uno de estos clústeres tienden a tener valores similares para cada una de las tres variables. El gráfico Diagramas de caja de clustering multivariante muestra estos conjuntos de valores.

  1. En el panel Contenido, en la sección de la capa sample_locations_MultivariateClustering, haga doble clic en el gráfico Diagramas de caja de clustering multivariante.

    El elemento del gráfico Diagramas de caja de clustering multivariante del panel Contenido

    El gráfico muestra diagramas de caja de la distribución de los valores estandarizados para cada una de las variables, y líneas que indican los valores medios de cada uno de los clústeres para cada variable.

    Gráfico Diagramas de caja de clustering multivariante

    En este gráfico, los tres diagramas de caja muestran los valores estandarizados de las variables de precipitación anual, rango de temperatura anual y temperatura media anual.

    Sobre estos diagramas de caja se trazan líneas que representan dónde se sitúan los valores medios dentro de cada uno de los clústeres para cada variable.

  2. En el gráfico Diagramas de caja de clustering multivariante, mantenga el puntero sobre el punto del clúster 2 en el diagrama de cajas de precipitaciones anuales.

    En este ejemplo, el clúster 2 se representa en rojo. Los colores del gráfico coinciden con los colores de los puntos del mapa, que se asignan aleatoriamente. Los puntos de su clúster 2 pueden ser de otro color.

    El punto del clúster 2 en el diagrama de cajas de precipitaciones anuales

    Aparece un elemento emergente que muestra el Id. de clúster del punto, el nombre de los Campos de análisis y el Valor medio de ese clúster.

    Puede utilizar este método para examinar los valores medios de cada uno de los campos de cada clúster. Los puntos de los clústeres están conectados por líneas del mismo color.

    La línea roja, que representa los puntos del clúster 2 en este gráfico, muestra un valor medio de las precipitaciones anuales superior al de los otros clústeres, un valor intermedio del rango de temperaturas anuales y un valor medio inferior de la temperatura media anual. Este clúster representa las áreas de mayor elevación en el centro del bosque, que son más húmedas y frescas que otras áreas.

    Por el contrario, la línea azul claro, que representa los puntos del clúster 1, tiene los valores medios anuales de precipitación más bajos, los valores anuales de rango de temperatura más altos y los valores medios anuales de temperatura intermedios. Se trata de puntos de menor elevación en el borde occidental del bosque.

    Ha creado seis clústeres, que representan seis áreas bioclimáticamente similares dentro del bosque. Dos de los clústeres, el 1 y el 5, tienen áreas que no son espacialmente continuas.

    Estos clústeres pueden ser apropiados para su trabajo.

    En algunos casos, puede ser deseable que los clústeres sean espacialmente continuos. Utilizará la herramienta Clustering multivariante restringido espacialmente para crear clústeres continuos.

Crear clústeres continuos

Disponer de clústeres de hábitats contiguos puede ser útil para la conservación de las especies. Si necesita que sus clústeres sean espacialmente contiguos, puede utilizar una herramienta que incluya restricciones espaciales en el proceso de agrupación.

  1. Haga clic en la pestaña Geoprocesamiento y, en el panel de la herramienta Clustering multivariante, haga clic en el botón de retroceso.

    El botón de retroceso de la herramienta Clustering multivariante

  2. En el panel Geoprocesamiento, en el cuadro de búsqueda, escriba spatially constrained multivariate clustering y, en los resultados de la búsqueda de herramientas, haga clic en la herramienta Clustering multivariante restringido espacialmente.

    Resultados de la búsqueda de la herramienta Clustering multivariante restringido espacialmente.

  3. En la herramienta Clustering multivariante restringido espacialmente, en Entidades de entrada, elija la capa sample_locations.
  4. En el cuadro Campos de análisis, active Annual_precipitation, Annual_temperature_range y Mean_annual_temperature.

    El cuadro Campos de análisis con tres variables activadas

  5. En Restricciones del tamaño de clústeres, acepte el valor predeterminado de Ninguna.

    En este caso, no es necesario restringir el tamaño de los clústeres.

  6. En Número de clústeres, escriba 6.

    El número de clústeres establecido en 6

  7. En Restricciones espaciales, acepte el valor predeterminado de Triangulación de Delaunay restringida.
  8. Haga clic en Ejecutar.

    La herramienta se ejecuta y crea un conjunto de clústeres restringidos espacialmente. La nueva capa se agrega al mapa.

    Los clústeres restringidos espacialmente en el mapa

    Para más información sobre la herramienta Clustering multivariante restringido espacialmente, consulte la ayuda de la herramienta.

Ha creado regiones bioclimáticas utilizando tres variables y dos herramientas de clústeres multivariantes. Ha visto cómo obtener e investigar las variables de entrada y examinar las características de los clústeres. Se trata de un ejemplo simplificado para mostrar el flujo de trabajo y los datos disponibles. Para su propio trabajo, probablemente utilizaría un conjunto diferente de variables y elegiría las variables más relevantes para la ubicación, los hábitats y las especies de interés del área en la que realiza su trabajo de conservación.