Crear mapas y explorar datos de niveles de oxígeno mediante gráficos

Primero, utilizará gráficos de líneas e histogramas para explorar las propiedades y características de sus datos. La exploración de sus datos es un primer paso importante de prácticamente cualquier flujo de trabajo analítico. A continuación, con estos gráficos, determinará si los datos son viables para un flujo de trabajo de interpolación. Al utilizar un gráfico de líneas para ver cómo cambian los niveles de oxígeno disuelto con el paso del tiempo, puede elegir ventanas de tiempo adecuadas para el análisis. Una vez elegidas las ventanas de tiempo, el gráfico de histograma le permite ver los distintos niveles de oxígeno disuelto en toda la bahía.

Descargar y abrir el proyecto

Se proporciona una carpeta con datos de calidad del agua recopilados de los estuarios de la bahía de Chesapeake y varias capas de datos en un paquete de ArcGIS Pro. Estos datos fueron suministrados por el programa Chesapeake Bay Program.

  1. Descargue el archivo Chesapeake_WaterQuality.zip.
  2. Busque el archivo descargado en su equipo.
    Nota:

    Dependiendo de su navegador web, puede que se le pida que elija la ubicación de archivo antes de iniciar la descarga. La mayoría de los navegadores descargan los archivos de manera predeterminada en la carpeta Descargas del equipo.

  3. Haga clic con el botón derecho en el archivo y extraiga el contenido a un lugar conveniente de su equipo, por ejemplo, su carpeta Documentos.
  4. Abra la carpeta descomprimida para ver el contenido.
  5. Si tiene ArcGIS Pro instalado en su equipo, haga doble clic en Chesapeake_WaterQuality.ppkx para abrir el proyecto.
    Nota:

    Si no tiene acceso a ArcGIS Pro o una cuenta de organización de ArcGIS, consulte las opciones de acceso a software.

  6. Si se le pide, inicie sesión en su cuenta con licencia de ArcGIS.

    El proyecto contiene un mapa con el nombre Chesapeake Bay Dissolved O2 que contiene un mapa base topográfico y las siguientes capas de datos:

    • La capa DissolvedO2 muestra las ubicaciones en las que se llevan monitorizando el oxígeno disuelto y otros muchos compuestos desde 1984. Aunque solo vea 131 puntos en el mapa, cada ubicación contiene cientos o incluso miles de mediciones históricas.
    • La capa Bay representa un polígono simplificado de la línea de costa de la bahía.
    Nota:

    El oxígeno disuelto se mide in miligramos por litro de agua (mg/l). Según la Administración Atmosférica y Oceánica Nacional (NOAA)[1], cualquier nivel de oxígeno disuelto persistente por debajo de los 5,0 mg/l se considera perjudicial para la salud y cualquier ubicación que presente niveles persistentes inferiores a los 0,2 mg/l se consideran zonas muertas en las que no pueden sobrevivir peces ni plantas.

  7. En el panel Contenido del mapa Chesapeake Bay Dissolved O2, active la capa Bay.

    Casilla de verificación para activar la capa Bay

    Nota:

    En función de su configuración predeterminada de ArcGIS Pro, es posible que el panel Contenido no se abra automáticamente. Si es necesario, en la cinta, haga clic en la pestaña Ver. En el grupo Ventanas, haga clic en Contenido.

  8. En la pestaña Mapa, en el grupo Navegar, haga clic en el botón Explorar.

    Herramienta Explorar

  9. Haga clic y desplace el mapa hasta la punta septentrional de la bahía de Chesapeake.

    Punta septentrional de la bahía de Chesapeake

  10. En el panel Contenido, haga clic en la capa Bay para seleccionarla. En la cinta, haga clic en la pestaña Capa de entidades. En el grupo Comparar, haga clic en Swipe.

    Herramienta Swipe

    Al apuntar al mapa, el puntero cambia.

  11. Haga clic en el mapa y mueva el puntero hacia arriba y hacia abajo o hacia la izquierda y la derecha para ocultar la capa Bay.

    Deslice la capa Bay

    Nota:

    La extensión del polígono de capa Bay no se corresponde exactamente con el mapa base Topográfico subyacente. La capa Bay se ha simplificado y generalizado a partir del límite real de la bahía de Chesapeake. La generalización agilizará el análisis futuro.

  12. En la pestaña Mapa, haga clic en Explorar. Desplace la rueda del ratón para aplicar el zoom de nuevo a la extensión completa de la bahía de Chesapeake.

    Al habilitar la herramienta Explorar, se desactiva el efecto de deslizamiento, lo que le permite desplazar y usar el zoom con normalidad.

  13. En el panel Contenido, desactive la capa Bay y active la capa DissolvedO2.
    Nota:

    La capa DissolvedO2 proviene de un archivo .csv descargado de la base de datos Chesapeake Bay Program Water Quality Database (1984 – present). Los datos fueron geocodificados, proyectados y filtrados para conservar los datos muestreados entre principios de 2014 y finales de 2015 que estaban relacionados con el oxígeno disuelto.

  14. Use la herramienta Explorar para visualizar la distribución de las mediciones de oxígeno disuelto en toda la bahía de Chesapeake.

    Mediciones de oxígeno disuelto en la bahía de Chesapeake

    Sugerencia:

    Con el vínculo Chesapeake Bay Program Water Quality Database (1984 – present), puede descargar datos adicionales de nutrientes para varios años, para investigarlos por su cuenta.

Crear un gráfico de líneas

Ahora que ha explorado los datos, creará un gráfico de líneas para los niveles de oxígeno disuelto. El gráfico de líneas es un tipo de gráfico que muestra cómo un valor cambia con el tiempo. Su gráfico de líneas mostrará cómo el nivel medio de oxígeno disuelto de toda la bahía cambió durante 2014 y 2015.

La configuración de SampleDate como el campo de variable Fecha o número especifica que la fecha y la hora en que se realizó cada medición de DissolvedO2 se traza en el eje x horizontal del gráfico de líneas.

  1. En el panel Contenido, haga clic con el botón derecho en DissolvedO2, apunte a Crear gráfico y elija Gráfico de líneas.

    Crear un gráfico de líneas

    Se abren los paneles Propiedades de gráfico - DissolvedO2 y Dissolved02 – Chart of DissolvedO2.

  2. En el panel Propiedades de gráfico, en la pestaña Datos, en Fecha o número, elija SampleDate. En Agregación, elija Valor medio.

    Introducir el parámetro Fecha o número

  3. En Campo numérico(s), haga clic en Seleccionar. Marque MeasureValue y haga clic en Aplicar.

    Configurar el parámetro Campos

    El gráfico ahora muestra el medio (valor medio) de las mediciones de oxígeno disuelto para cada fecha.

    Las mediciones de oxígeno disuelto almacenadas en el campo MeasureValue se trazan en el eje y vertical del gráfico de líneas. Ahora puede agregar los datos de otra forma. Como los atributos SampleDate están almacenados como fechas, la opción predeterminada es Recuento. Este método cuenta el número de días en los que se registraron las observaciones. MeasureValue está almacenado como número, lo cual permite aplicar distintas operaciones aritméticas.

  4. En la sección Opciones de colocación de tiempo, confirme que Tamaño del intervalo esté establecido en 5 días. En Bins vacíos, elija Línea de conexión.

    Conectar las líneas de los bins vacíos

    Línea de conexión mejora la legibilidad del gráfico de líneas al garantizar que la línea se conecte incluso si existen fechas sin mediciones disponibles.

    El título del gráfico y del panel del gráfico se actualizan a Dissolved02 – Mean of MeasureValue over SampleDate, lo cual refleja las variables utilizadas para generar el gráfico de líneas.

  5. En el panel del gráfico, identifique visualmente los niveles medios de oxígeno disuelto superiores a los 12–13 mg/l observados entre el 1/4/2014 y el 1/4/2015. Además, identifique las fechas en verano que corresponden a los niveles medios de oxígeno disuelto inferiores a 5–6 mg/l.
    Nota:

    Es posible que el contenido de su gráfico tenga un aspecto distinto al de la imagen de ejemplo, ya que la resolución del monitor y el tamaño del gráfico repercuten en las fechas de muestra y los valores de medición que se muestran en los ejes horizontal y vertical. El color de línea de su gráfico también puede ser distinto, pero los resultados son los mismos.

    Gráfico de líneas

    Existe un claro ciclo estacional de oxígeno disuelto en la bahía de Chesapeake. El nivel medio de oxígeno disuelto alcanza su máximo durante el invierno (con niveles medios que suben hasta los 12–13 mg/l) y su mínimo durante el verano (con niveles medios que bajan hasta los 5–6 mg/l). Como todo lo que baje de los 5,0 mg/l se considera perjudicial para la salud, el nivel de oxígeno disuelto entre junio y septiembre ha de ser investigado. No obstante, es alentador ver que el nivel medio de oxígeno disuelto en ningún momento rondó los 0,2 mg/l, que indica la incapacidad de sostener la vida marina.

Filtrar el gráfico de líneas

Aunque ha observado un ciclo estacional en los niveles de oxígeno disuelto, le conviene mirar cada estación de cerca. Aunque la tendencia general de los datos asciende y desciende, existe mucha variación entre cada observación. Utilizará una tarea para seleccionar las mediciones realizadas entre el 15 de junio de 2014 y el 15 de septiembre de 2014 y muestreadas a profundidades mayores de 5 metros. Una tarea es un conjunto de pasos preconfigurados que guían al usuario por un flujo de trabajo. La tarea para esta consulta de selección está incluida en su proyecto.

  1. En la cinta, haga clic en la pestaña Vista. En el grupo Ventanas, haga clic en panel Catálogo.

    Botón del panel Catálogo

  2. En el panel Catálogo, expanda la carpeta Tareas y haga doble clic en la tarea Filter Samples for Summer 2014 and Summer 2015

    Carpeta Tareas en el panel Catálogo

    Aparece el panel Tareas.

  3. En el panel Tareas, haga doble clic en Apply Summer 2014 Filter.

    Aplicar filtro

    La tarea se abre. Esta tarea consta de un paso que ejecuta una consulta de tres partes en la capa DissolvedO2.

    Tarea Apply Summer 2014 Filter

    Sugerencia:

    Puede redimensionar el panel apuntando al lado derecho del panel y arrastrando el panel a un tamaño mayor.

    Los parámetros de la tarea son los siguientes:

    • En Filas de entrada, seleccione DissolvedO2.
    • En Tipo de selección, seleccione Nueva selección.

    La expresión utiliza las siguientes consultas de SQL:

    • Donde TotalDepth es mayor que 5
    • Y SampleDate es después de 15/6/2014 12:00:00 AM
    • Y SampleDate es antes de 16/9/2014 12:00:00 AM

    Las expresiones de la consulta seleccionan todas las muestras tomadas a profundidades mayores de 5 metros entre el 15 de junio de 2014 y el 15 de septiembre de 2014.

    Sugerencia:

    Para aprender a escribir su propia expresión de consulta SQL, consulte Escribir una consulta en el generador de consultas.

  4. Haga clic en Ejecutar.

    El filtro de tarea selecciona los puntos del verano de 2014 en el gráfico de líneas.

    Gráfico de líneas con selección

  5. En la parte superior del gráfico de líneas, haga clic en el botón Filtrar por selección.

    Gráfico de líneas filtrado del verano de 2014

    El gráfico se actualiza para mostrar únicamente los puntos seleccionados.

    Gráfico que muestra solo los puntos seleccionados

    En los meses de verano de 2014, el nivel medio de oxígeno disuelto fluctúa sin ningún patrón claro. Las tendencias estacionales que podría ver en todo el dataset desaparecen al visualizar una única estación. Se trata de algo bueno, ya que las tendencias pueden dar lugar a dificultades en los flujos de trabajo de interpolación. Parece que, si solo utiliza las mediciones de dentro de este periodo de tres meses, puede ignorar las tendencias estacionales.

  6. En el panel Tareas, haga clic en Finalizar para detener la ejecución de la tarea. Cierre el panel Tareas.

Crear un gráfico de histograma filtrado

En la sección anterior, utilizó un gráfico de líneas para determinar que debe limitar su análisis a los meses de verano de 2014. Estos son los meses en los que los niveles medios de oxígeno disuelto rondan valores perjudiciales para la salud. Sin embargo, el gráfico de líneas solo mostró el nivel medio de oxígeno disuelto de toda la bahía. ¿Qué pasa si algunas partes de la bahía tienen niveles bajos y otras tienen niveles altos? ¿Es posible que el promedio esté ocultando algunos niveles muy bajos? Para responder estas preguntas, creará un gráfico de histograma para los datos seleccionados.

  1. En el panel Contenido, haga clic con el botón derecho en DissolvedO2, apunte a Crear gráfico y elija Histograma.
  2. En el panel Propiedades de gráfico, en la pestaña Datos, realice los siguientes cambios:
    • En Variable, en Número, elija MeasureValue.
    • En Bins, escriba 64.

    Configurar las propiedades del gráfico de histograma

    El panel DissolveO2 – Distribution of MeasureValue se actualiza y muestra un histograma de DissolvedO2 para todas las muestras.

    Observe que las muestras del verano de 2014 permanecen seleccionadas en azul.

    Histograma con bins del verano de 2014 seleccionados

  3. En la parte superior del gráfico de líneas, haga clic en el botón Filtrar por selección para habilitarlo.

    Histograma de datos filtrados

    El histograma se actualiza para mostrar únicamente las muestras seleccionadas del verano de 2014. En el verano de 2014, la mayoría de las mediciones de datos oscilaban entre los 3 mg/l y los 9 mg/l de oxígeno disuelto. El nivel medio (valor medio) de los tres meses de verano fue 5,26 mg/l.

    Sin embargo, cabe mencionar las dos barras del extremo izquierdo del histograma, ya que los niveles de oxígeno disuelto están muy por debajo del promedio y se observan en muchas muestras. Esto es lo que va a investigar ahora.

  4. En el histograma Distribution of MeasureValue, sitúe el puntero en el primer bin de datos (barras) de la izquierda, entre 150 y 200, para mostrar los valores de MeasureValue y Recuento del bin de datos.
    Nota:

    Los valores de las mediciones pueden variar levemente debido al redondeo.

    Valores del bin más pequeño

    Las propiedades del bin revelan que 185 muestras de las 4.086 muestras totales tenían niveles de oxígeno disuelto que oscilaban entre 0 y 0,2. Revela una zona muerta, y el resultado debería ser muy preocupante. Sin embargo, una zona muerta solo sucede cuando el nivel de oxígeno disuelto es bajo de forma persistente durante largos periodos de tiempo. En el siguiente módulo se centrará en averiguar si estas ubicaciones mantienen unos niveles bajos de oxígeno disuelto.

  5. Cierre el panel Gráfico y el panel Propiedades de gráfico.

    Si cierra los gráficos, no se eliminarán del proyecto.

  6. En la Barra de herramientas de acceso rápido, haga clic en el botón Guardar proyecto. Si se le solicita, haga clic en para proceder a guardar en una versión más actual de ArcGIS Pro.

    Botón Guardar proyecto de la barra de herramientas de acceso rápido

Ha utilizado un gráfico de líneas e histograma para explorar sus datos mientras aplicaba un filtro de selección. El gráfico de líneas indicaba un sólido patrón estacional de la distribución del oxígeno disuelto, y los niveles más bajos tenían lugar en los meses de verano. En el verano de 2014, el promedio de oxígeno disuelto de la bahía rondó los 5 mg/l, un nivel perjudicial para la salud.

En el histograma, se apreciaba claramente que algunos puntos individuales tenían niveles indicadores de zonas muertas si los niveles de oxígeno disuelto seguían siendo muy bajos durante periodos prolongados. Ahora es crucial determinar si existen áreas de la bahía con niveles de oxígeno disuelto constantemente bajos.


Realizar interpolaciones y comparar resultados

La precisión del modelo de interpolación se define por la medida en que el valor predicho de una ubicación coincide con el valor real en esa ubicación. Sin embargo, esta definición de la precisión presenta inmediatamente una aparente contradicción. Si solo se midió el oxígeno disuelto en un conjunto determinado de ubicaciones, ¿hasta qué punto es buena la predicción del modelo de interpolación en nuevas ubicaciones? Si no conoce los valores reales de las nuevas ubicaciones, ¿qué base tiene usted en cuanto a la precisión de la predicción? Podría parecer una contradicción irresoluble, pero existe una resolución aceptada a esta contradicción, denominada validación cruzada.

La validación cruzada es un método estadístico basado en "dejar un elemento fuera". La precisión de un modelo se evalúa eliminando secuencialmente cada punto medido del dataset y utilizando los puntos restantes para predecir un valor en la ubicación del punto eliminado. Si su modelo de interpolación es fiable, los demás puntos deben predecir con precisión el valor real (medido) del punto oculto. A continuación, puede comparar la predicción con el valor medido real y ver hasta qué punto coinciden. La diferencia entre el valor real y el valor predicho de un punto determinado se conoce como error de validación cruzada. Tras realizar una validación cruzada de todos los puntos medidos, es posible generar distintos diagnósticos numéricos y gráficos para permitirle evaluar la precisión global de su modelo. Interpretará los diagnósticos de validación cruzada mediante una interpolación de los niveles medios de oxígeno disuelto del verano de 2014 y comparando el resultado con los del verano de 2015.

Interpolar datos con un asistente

A continuación, usará los valores de O2 medidos conocidos para interpolar aquellos niveles de oxígeno en los que no se capturaron mediciones. La interpolación da como resultado una superficie que puede utilizar para la representación cartográfica o para análisis posteriores. Utilizará las entidades de la capa Bay como barreras para aislar la interpolación a la bahía de Chesapeake.

Para interpolar los datos de verano de 2014, utilizará el Geostatistical Wizard, un conjunto dinámico de páginas, diseñado para guiarle por el proceso de construcción y evaluación del rendimiento de un modelo de interpolación.

  1. En la cinta, en la pestaña Análisis del grupo Flujos de trabajo, haga clic en Asistente de geoestadística.

    Botón Geostatistical Wizard

    Aparece el asistente de geoestadística.

  2. En la primera página de Geostatistical Wizard, para Interpolación con barreras, elija Interpolación kernel.

    Elija Interpolación kernel con barreras

  3. En Dataset, para Dataset de origen, confirme que DisslovedO2 está seleccionado y, para Data Field, elija MeasuredValue. En Entidades de barrera, elija Bahía.

  4. Haga clic en Siguiente.

    Aparece la página Cargando datos.

  5. En la página Cargando datos, en Dataset, elija Utilizar valor medio.

    Opción Utilizar valor medio

  6. Haga clic en Siguiente.

    Aparece la página Interpolación kernel.

    La página Interpolación kernel incluye un mapa, Propiedades generales y Resultados de identidad para un único punto.

    El parámetro Ancho de banda es importante, pero no se introdujo ningún valor. Ancho de banda controla el radio del círculo de búsqueda en la vista previa de superficie. Para estos datos, el ancho de banda está medido en metros, y el software ofrece un valor predeterminado basado en una optimización sencilla. Puede dejarlo en blanco y dejar que ArcGIS Pro lo calcule en función de sus datos.

    Los valores que aparecen en Identificar resultado corresponden a la ubicación actual indicada por el punto de mira. Si lo desea, es posible hacer clic en otras ubicaciones para ver sus valores.

    Nota:

    Dado que hay una selección en la capa DissolvedO2, la interpolación utilizará solo las entidades seleccionadas en sus cálculos.

  7. Haga clic en Siguiente.

    Aparece la página Validación cruzada.

    Página Validación cruzada

    Más adelante en el tutorial, explorará la validación cruzada en detalle.

  8. Haga clic en Finalizar. En la ventana Informe de método, haga clic en Aceptar.

    La capa de salida aparece en el mapa.

    Capa de resultados Kernel Interpolation

    La capa Kernel Interpolation es un tipo de capa personalizada que solo se utiliza en Extensión ArcGIS Geostatistical Analyst. Está optimizada para una visualización y un cálculo rápidos y se puede exportar a una capa ráster o de entidades.

    En el mapa, los colores rojo y naranja representan los niveles medios de oxígeno disuelto más elevados. Recuerde que la mayoría de estos valores elevados se dan en la sección meridional de la bahía cerca del océano atlántico y las puntas de las calas. Los niveles más bajos (reflejados en azul y verde) se encuentran en las partes central y alta de la bahía.

  9. Guarde el proyecto.

    Ha utilizado Geostatistical Wizard, parte de Extensión ArcGIS Geostatistical Analyst, para interpolar niveles medios de oxígeno disuelto durante el verano de 2014 en la bahía de Chesapeake. Según el mapa interpolado, puede deducir que algunas áreas de la bahía de Chesapeake pueden haber estado por debajo del nivel de oxígeno disuelto que resulta saludable durante el verano de 2014, pero no hay indicación alguna de que existieran zonas muertas constantes donde los peces y las plantas no podrían sobrevivir.

Explorar los resultados de la validación cruzada

A continuación, examinará la ventana Validación cruzada de la capa que creó e interpretará sus distintos elementos.

  1. En el panel Contenido, haga clic con el botón derecho en la capa Kernel Interpolation y seleccione Validación cruzada.

    Menú contextual de la capa de estadísticas geográficas

    Nota:

    La validación cruzada es una propiedad de una capa de estadísticas geográficas y no se admite en ningún otro tipo de capa.

    Aparece la ventana Validación cruzada para la capa Kernel Interpolation.

    Nota:

    Para saber más acerca de las distintas pestañas y estadísticas disponibles en la ventana Validación cruzada, consulte Realizar la validación cruzada y la validación.

  2. En el lado derecho de la ventana Validación cruzada, haga clic en la pestaña Tabla.

    La tabla contiene resultados de validación cruzada de todos los puntos medidos.

  3. En caso necesario, redimensione la ventana para mostrar la columna Error.

    Pestaña Tabla

    Para cada punto, se conservan el valor Medido para el punto, así como el valor Predicho de la validación cruzada. El valor Error se calcula restando el valor Medido del valor Predicho. El valor Error es mayor que cero, lo que significa que la predicción de la validación cruzada fue mayor que el valor real. Si el valor Error es menor que cero, la predicción fue menor que el valor real.

  4. Haga clic en el título de la columna Error para ordenar de menor a mayor.

    Ordenar la columna Error

    En la columna Error reordenada, el error de validación cruzada más bajo es de -2,76. Significa que la validación cruzada predijo un nivel de oxígeno disuelto 2,76 mg/l menor que el valor real en esa ubicación.

  5. Haga clic en el título de la columna Error para ordenar de mayor a menor.

    El error de validación cruzada más alto es de aproximadamente 3,03. Significa que la validación cruzada predijo un nivel de oxígeno disuelto aproximadamente 3,03 mg/l mayor que el valor medido en ese punto.

  6. Haga clic en la primera fila para seleccionar el punto que presenta el máximo error de validación cruzada.

    Al seleccionar el registro en la tabla, se resalta el punto asociado en el gráfico de la izquierda. Para este informe, el punto está en el eje X del gráfico.

    Seleccionar el registro de validación cruzada más alto

    Esta gráfica muestra un gráfico de dispersión de los valores predichos frente a los valores medidos para cada punto, junto con una línea de regresión azul para los puntos. En una situación ideal, los valores predichos serán cercanos a los valores medidos, de forma que querrá ver que la línea de regresión sigue un ángulo de 45 grados. Se muestra una línea de referencia de color gris en la ventana para evaluar la cercanía de la línea de regresión a este ángulo ideal de 45 grados. Para este punto, la línea de regresión azul es un poco más plana que la línea de referencia gris y existe una gran variabilidad en los puntos alrededor de las líneas. Sin embargo, la diferencia no parece ser demasiado grave. Si la línea azul estuviera cerca de ser totalmente plana o vertical, indicaría problemas graves que no se deberían aceptar.

  7. En la parte de diagnóstico gráfico de la ventana, haga clic en la pestaña Error.

    Pestaña Error

    La pestaña Error muestra un gráfico de dispersión de los valores medidos respecto de los errores de validación cruzada. Este gráfico se utiliza para determinar si los errores de validación cruzada son independientes de los valores medidos.

    La independencia entre los errores y los valores medidos es importante porque es deseable realizar predicciones igualmente exactas para los niveles bajo, medio y alto de oxígeno disuelto. La independencia entre los errores y los valores medidos se indica con una línea de regresión plana. En su gráfico, la línea de regresión es decreciente, lo que indica que los valores medidos más altos estaban predichos por defecto y los valores medidos más bajos estaban predichos por exceso.

    Esto se denomina como suavizado y se trata de un fenómeno común. El grado de suavizado de su gráfico es típico, pero debe recordar que este suavizado significa que el modelo podría estar prediciendo incorrectamente niveles seguros de oxígeno disuelto en ubicaciones que, en realidad, tienen niveles peligrosos o perjudiciales para la salud. Esta situación no debe disuadirle de continuar con su análisis, pero es algo que se debe revelar al comunicar sus conclusiones.

  8. En la parte de diagnóstico numérico de la ventana de Validación cruzada, haga clic en la pestaña Resumen.

    Pestaña Resumen

    La pestaña Resumen presenta estadísticas de resumen para la información en la pestaña Tabla y proporciona una forma simple y útil de evaluar los resultados de la validación cruzada.

    Root-Mean-Square es la estadística más importante a la hora de evaluar la precisión de un modelo. Su valor siempre será mayor que cero, pero, cuanto más cercano es a cero, más cercanas son las predicciones de la validación cruzada a los valores medidos, en promedio. Su valor de Root-Mean-Square de aproximadamente 1,12 indica que, en promedio, los errores de la validación cruzada se desviaron de los valores reales en poco más de 1 mg/l de oxígeno disuelto. Todas las demás estadísticas ofrecen información útil acerca del modelo, pero el valor de Root-Mean-Square es el único que mide directamente la precisión de las predicciones.

    La otra estadística de resumen en la que debe centrarse es Valor medio. Este es el promedio (valor medio) de los errores de validación cruzada y se usa para evaluar si el modelo tiende a predecir por exceso o por defecto (lo que se conoce como desviación). Si el modelo no está desviado, este valor debe ser cercano a cero. Si este valor es considerablemente mayor que cero, significa que el modelo está realizando sistemáticamente unas predicciones excesivamente altas. De forma similar, si el valor es considerablemente menor que cero, significa que el modelo está realizando sistemáticamente unas predicciones excesivamente bajas. Su valor de aproximadamente 0,045 indica que este modelo tiene muy poca desviación. En promedio, está realizando predicciones que son aproximadamente 0,045 mg/l demasiado altas, aunque es una cantidad muy reducida. Con un Valor medio tan bajo, puede suponer con cierta seguridad que su modelo no está desviado.

  9. Cierre la ventana Validación cruzada.

Ver gráficos para 2015

A continuación, seleccionará las mediciones de oxígeno disuelto tomadas durante el verano de 2015. Explorará los datos mediante gráficos.

  1. En caso necesario, abra la tarea Filter Samples for Summer 2014 and Summer 2015.
    Sugerencia:

    En la cinta, seleccione Ver, haga clic en Panel Catálogo. Expanda la carpeta Tareas.

  2. Haga doble clic en Apply Summer 2015 Filter.
  3. Haga clic en Ejecutar.

    Se seleccionan las mediciones tomadas entre el 15 de junio de 2015 y el 15 de septiembre de 2015 a profundidades mayores de 5 metros.

  4. Haga clic en Finalizar y cierre el panel Tareas.
  5. En el panel Contenido, haga clic en el botón Lista por orden de dibujo.

    Botón Lista por orden de dibujo

    En la lista del panel Contenido puede ver los gráficos creados anteriormente. Los gráficos se almacenan como un tipo de propiedad de capa que usted puede administrar junto con la lista de capas en el panel Contenido del mapa.

  6. Haga doble clic en Distribución de MeasureValue para reabrir el histograma. Confirme que el botón Filtrar por selección está habilitado, de modo que solo se muestren las muestras seleccionadas para el verano de 2015.

    Datos de Histograma del verano de 2015

  7. En el panel Propiedades de gráfico, en Estadísticas, active Mediana y Desviación estándar. .

    El histograma se actualiza para incluir los valores.

    Histograma del verano de 2015 con mediana y desviación estándar mostradas.

    Este histograma tiene un aspecto similar al del histograma del verano de 2014. La mayoría de las mediciones de oxígeno disuelto están entre aproximadamente 3 mg/l y 9 mg/l, y también existe una barra de gran tamaño en el lado izquierdo, en niveles cercanos al nivel peligroso de 0,2 mg/l.

  8. En el panel Contenido, haga doble clic en Valor medio de MeasureValue medio superior a SampleDate para reabrir el gráfico de líneas.
  9. En el panel Propiedades de gráfico, en Opciones de colocación de tiempo, cambie Tamaño del intervalo a 5 días.

    Actualizar colocación de tiempo

  10. En caso necesario, haga clic en el botón Filtrar por selección para mostrar únicamente las muestras seleccionadas del verano de 2015

    Gráfico de líneas del verano de 2015

    El gráfico de líneas también tiene un aspecto similar al del verano de 2014. El nivel medio global de oxígeno disuelto de la bahía de Chesapeake aumenta y se reduce sin ningún patrón claro. Significa que puede obtener con seguridad medias seguras de los valores de cada ubicación durante este periodo de tiempo.

  11. Cierre el panel Propiedades de gráfico y los dos gráficos.

Interpolar datos con una herramienta

Antes usó el Geostatistical Wizard para interpolar las mediciones del verano de 2014. Sin embargo, la mayoría de los métodos de interpolación que estaban disponibles en el Geostatistical Wizard también están disponibles como herramientas de geoprocesamiento. A continuación, interpolará los niveles medios de oxígeno disuelto del verano de 2015 empleando la herramienta de geoprocesamiento Kernel Interpolation With Barriers.

  1. En la cinta, en la pestaña Análisis del grupo Geoprocesamiento, haga clic en Herramientas.

    Se abre el panel Geoprocesamiento.

  2. En el panel Geoprocesamiento, busque Kernel.

    La búsqueda devuelve varias herramientas de geoprocesamiento posibles que implementan o contienen el término buscado.

  3. Haga clic en Kernel Interpolation With Barriers.

    Resultados de la búsqueda de geoprocesamiento

    Se abre la herramienta de geoprocesamiento Kernel Interpolation With Barriers en el panel Geoprocesamiento.

  4. En Entidades de entrada, seleccione DissolvedO2.

    Este parámetro especifica que la capa DissolvedO2 contiene los puntos que desea interpolar.

  5. Para Campo de valores Z, seleccione MeasureValue.

    Este parámetro especifica que el campo MeasureValue contiene las mediciones de oxígeno disuelto.

  6. Para Capa de estadísticas geográficas de salida, escriba Verano de 2015.

    Este parámetro especifica el nombre de la capa de estadísticas geográficas resultante.

  7. En Entidades de barrera absolutas de entrada, seleccione Bay.

    Este parámetro especifica que la capa Bay se usará como barrera en la interpolación. De esta forma, la herramienta podrá utilizar distancias en el agua.

  8. Acepte los valores predeterminados restantes.

    Parámetros de Kernel Interpolation With Barriers

    Si deja vacío el parámetro Ancho de banda, la herramienta determinará el valor del ancho de banda que resulta en el mínimo error posible de validación cruzada Root-Mean-Square. Así es también cómo el Geostatistical Wizard determinó el ancho de banda óptimo.

    Nota:

    La herramienta Kernel Interpolation With Barriers tomará de forma predeterminada el valor medio de todos los puntos coincidentes, por lo que no es necesario especificarlo explícitamente en la herramienta de geoprocesamiento. Los otros métodos de agregación de puntos coincidentes se encuentran en la pestaña Entornos de la herramienta.

  9. Haga clic en Ejecutar.

    Se ejecuta la herramienta. Se agrega una capa denominada Verano de 2015 al mapa Chesapeake Bay Dissolved O2. Esta capa representa el nivel medio predicho de oxígeno disuelto en el conjunto de la bahía de Chesapeake en el verano de 2015.

  10. Cierre todas las ventanas de resumen relacionadas con la ejecución de la herramienta. En el panel Contenido, desactive la capa DissolvedO2.
  11. En el panel Contenido, active y desactive la capa Verano de 2015 y compárela con la capa Kernel Interpolation, que contiene datos del verano de 2014.

    Oxígeno disuelto del verano de 2015

    Al igual que en el verano de 2014, los niveles máximos medios de oxígeno disuelto del verano de 2015 se producen en las puntas de los estuarios y cerca del océano atlántico en la parte meridional de la bahía. De nuevo, los niveles más bajos de oxígeno disuelto se encuentran en las partes central y alta de la bahía.

Comparar capas con validación cruzada

A continuación, visualizará la ventana Validación cruzada de la capa creada en la sección anterior y comparará los números y gráficos con el mapa del verano de 2014.

  1. En el panel Contenido, haga doble clic en la capa Kernel Interpolation.

    Aparece la ventana Propiedades de capa.

  2. En la pestaña General, en Nombre, elimine Kernel Interpolation y escriba Verano de 2014.

    Al cambiar el nombre de la capa a Verano de 2014, le resultará más fácil diferenciar y comparar los resultados de 2014 y 2015.

  3. Haga clic en Aceptar.
  4. En el panel Contenido, haga clic con el botón derecho en Verano de 2014 y seleccione Validación cruzada.

    Aparece la ventana Validación cruzada de los niveles de oxígeno disuelto del verano de 2014.

  5. En el panel Contenido, haga clic con el botón derecho en Verano de 2015 y seleccione Validación cruzada.

    Aparece la ventana Validación cruzada de los niveles de oxígeno disuelto del verano de 2015.

  6. Compare los valores Root-Mean-Square y Valor medio del verano de 2014 y el verano de 2015.

    ResumenVerano de 2014Verano de 2015

    Recuento

    78

    85

    Valor medio cuadrático

    1,117

    1,002

    Valor medio

    0,036

    0,021

    El valor Root-Mean-Square se redujo de 1,117 en el verano de 2014 a 1,002 en el verano de 2015. Indica que las predicciones de la validación cruzada fueron alrededor de un 10 por ciento más exactas en el verano de 2015 que en el verano de 2014. Se trata de algo probable ya que en el verano de 2015 se contó con cerca de un 10 por ciento más de datos (85 puntos frente a 78 puntos), como se indica en el valor Recuento.

    El Valor medio cambió de 0,036 en el verano de 2014 a 0,021 en el verano de 2015. Este valor debe ser lo más cercano posible a cero, de forma que el verano de 2015 presentó una desviación levemente menor que en el verano de 2014 (aunque en ambos veranos existió un bajo nivel de desviación).

  7. En los diagnósticos gráficos, haga clic en la pestaña Predicho tanto de Verano de 2014 como de Verano de 2015.
  8. Compare los gráficos de la pestaña Predicho. En caso necesario, coloque las ventanas Verano de 2014 y Verano de 2015 una al lado de la otra para compararlas.

    Comparación de gráficos de validación cruzada

    La línea de regresión azul de Verano de 2015 (derecha) parece estar más cerca de la línea de referencia gris que la línea de regresión de Verano de 2014 (izquierda).

  9. En los diagnósticos gráficos, haga clic en la pestaña Error tanto de Verano de 2014 como de Verano de 2015.

    Comparación de gráfico de error

    Los gráficos de la pestaña Error de Verano de 2014 y Verano de 2015 parecen ser prácticamente idénticos. Quizá recuerde que, idealmente, la línea de regresión azul debería ser plana. Una línea de regresión decreciente, como las de Verano de 2014 y Verano de 2015, indica que el modelo está suavizando los datos y está realizando predicciones por defecto en los valores grandes y por exceso en los valores pequeños.

  10. Compare la pendiente de la función Regresión, situada en la parte inferior izquierda de cada gráfico.

    Función de regresión del verano de 2014Función de regresión del verano de 2015

    -0,668

    -0,581

    La función Regresión muestra que la pendiente de la línea de regresión azul es levemente más negativa en Verano de 2014 que en Verano de 2015 (-0,668 frente a -0,581). Indica que existe un poco más de suavizado en Verano de 2014 que en Verano de 2015.

    Por tanto, puede concluir que la interpolación de Verano de 2015 es levemente menos probable que la interpolación de Verano de 2014 para predecir incorrectamente los niveles seguros de oxígeno disuelto en las ubicaciones en las que los niveles reales son peligrosos o perjudiciales para la salud. Sin embargo, ninguno de estos años presenta niveles graves de suavizado.

  11. Cierre las dos ventanas de Validación cruzada.
  12. Guarde el proyecto.

    Ha evaluado y comparado la precisión y fiabilidad de un modelo de interpolación mediante la validación cruzada. Al aprender sobre la tabla de validación cruzada, las estadísticas de resumen y los gráficos, ahora está en mejor disposición para cuantificar la precisión y fiabilidad de un modelo de interpolación. Estas habilidades también le permiten lograr revelaciones importantes acerca de las limitaciones de sus modelos. Es necesario revelar que sus modelos parecen estar suavizando los datos y que esto podría ocultar potencialmente algunos niveles de oxígeno disuelto peligrosos en la bahía de Chesapeake.

    Con los componentes estadísticos del análisis están completos, necesita presentar esta información para que sea fácilmente comprensible para sus compañeros y los responsables de la toma de decisiones. Incluso el mejor de los análisis no tendrá ningún impacto si no se alerta de su contenido a las personas indicadas o éstas no pueden comprenderlo rápidamente.

    Por ejemplo, puede exportar sus capas de estadísticas geográficas a rásteres y aplicar una rampa de colores significativa. A continuación, es posible agregar mapas individuales a un diseño para crear un póster con los resultados. Podría crear una visualización como la de este póster. Consulte la serie de tutoriales Elaborar un diseño en ArcGIS Pro para obtener orientación sobre cómo crear diseños.

En este tutorial, utilizó el Extensión ArcGIS Geostatistical Analyst. Ha utilizado las herramientas de geoprocesamiento Geostatistical Wizard e Interpolación kernel con barreras para analizar los niveles medios de oxígeno disuelto en la bahía de Chesapeake durante los veranos de 2014 y 2015. Mediante interpolación, ha creado capas de estadísticas geográficas que predijeron los niveles medios de oxígeno disuelto de toda la bahía. A continuación, ha realizado una validación cruzada de los resultados para cuantificar la precisión de la interpolación.

Basándose en sus resultados para la bahía de Chesapeake, los niveles medios nunca estuvieron cerca del nivel peligroso de 0,2 mg/l, pero muchas mediciones individuales estuvieron cerca o por debajo de este nivel bajo crítico. Aunque se deben tomar medidas de mitigación para devolver los niveles de oxígeno disuelto de la bahía de Chesapeake a valores superiores a los 5,0 mg/l saludables, su análisis proporciona una conclusión científica y estadísticamente defendible de que, incluso en los peores momentos de los meses del verano, los niveles de oxígeno disuelto fueron suficientes para sostener un ecosistema marino floreciente.

Las zonas muertas son un problema en todo el mundo. Se podrían utilizar procesos similares para interpolar los niveles de oxígeno disuelto en lugares tales como el golfo de México, el Canal de la Mancha y el mar de China oriental. El proceso de explorar los datos mediante gráficos, interpolar los datos y evaluar la precisión de sus resultados con validación cruzada es común a casi todos los flujos de trabajo de interpolación. Le animamos a descargar datos de otras fuentes y para otros años de la base de datos Chesapeake Bay Program Water Quality Database (1984 – present) y repetir los pasos con estos datos nuevos o actualizados.

Encontrará más tutoriales en la galería de tutoriales.