Importar distritos censales y unir tablas
Preparará una capa de indicadores para la ciudad de Nueva York. Combinará atributos de varias fuentes de datos existentes en una capa espacial. Al disponer de todos los atributos en la capa de distritos censales, puede representar cartográficamente y analizar los distritos utilizando los atributos adicionales. Utilizará los datos espaciales y tabulares existentes de la Encuesta sobre la Comunidad Estadounidense (ACS), datos ráster para medir la cobertura arbórea y análisis de proximidad para medir el acceso a recursos específicos de mujeres para crear la capa de indicadores.
Descargar los datos y preparar el proyecto
En primer lugar, descargará los datos que utilizará en el tutorial.
- Descargue los datos que utilizará en el tutorial.
- En Microsoft File Explorer, cree una carpeta en la unidad C:\ con el nombre IndicatorData.
- Extraiga el contenido del archivo .zip descargado a la carpeta IndicatorData.
- Inicie ArcGIS Pro. Si se le pide, inicie sesión en su cuenta de organización con licencia de ArcGIS.
Nota:
Si no tiene acceso a ArcGIS Pro o una cuenta de organización de ArcGIS, consulte las opciones de acceso a software.
Al abrir ArcGIS Pro, tendrá la opción de crear un proyecto nuevo o abrir uno existente. Si ya había creado algún proyecto antes, verá una lista de proyectos recientes.
- En Nuevo proyecto, haga clic en Mapa.
- En la ventana Nuevo proyecto, para Nombre, escriba Indicadores; para Ubicación, acepte la carpeta predeterminada y haga clic en Aceptar.
Ahora que tiene un proyecto, agregará una conexión a carpetas para poder acceder fácilmente a sus datos.
- Visualice el panel Catálogo. Si no lo ve, en el menú Vista, en el grupo Ventanas, elija Panel Catálogo.
- En el panel Catálogo, haga clic con el botón derecho en Carpetas y elija Agregar conexión a carpetas.
- En la ventana Agregar conexión a carpetas, busque y seleccione la carpeta IndicatorData, selecciónela y haga clic en Aceptar.
- Expanda la carpeta IndicatorData para ver su contenido.
En la carpeta hay varios archivos .csv y .xlsx que guardan información sobre atributos. También hay un shapefile con el nombre nyct2020 que importará a la geodatabase. Una vez importado el shapefile a la geodatabase como clase de entidad, servirá de base para el resto de información de los indicadores. Unir la información tabular a los datos espaciales permite analizar y visualizar toda la información.
Importar un shapefile a la geodatabase
Ha descargado los datos, ha creado un proyecto y se ha conectado a una carpeta para acceder a los datos. Ahora importará el shapefile a la geodatabase.
- En el panel Catálogo, expanda Bases de datos.
Cada proyecto en ArcGIS Pro viene con una geodatabase predeterminada, denominada igual que el proyecto. La geodatabase del proyecto se llama Indicadores.gdb.
- Haga clic con el botón derecho en Indicadores.gdb, apunte a Importar y elija Clase(s) de entidad.
Se abre la herramienta De clase de entidad a geodatabase.
- En Entidades de entrada, haga clic en el botón Examinar, vaya a la carpeta IndicatorData, haga clic en nyct2020 y luego en Aceptar.
Dado que ha hecho clic con el botón derecho en la geodatabase y ha elegido importar datos en ella, el parámetro Geodatabase de salida ya está establecido en la geodatabase del proyecto.
- Haga clic en Ejecutar.
- En el panel Catálogo, expanda la geodatabase Indicadores.
El shapefile se ha convertido en la geodatabase y se almacenó como una clase de entidad que contiene polígonos. Las clases de entidad son conjuntos de datos del mismo tipo: punto, línea o polígono.
- En la geodatabase Indicadores, haga clic en la capa nyct2020 y arrástrela al mapa para agregarla.
Los distritos censales aparecen en el mapa y se muestran con un color predeterminado.
Nota:
Es posible que sus distritos censales se muestren con un color diferente al de la imagen.
- En el panel Contenido, haga clic una vez en la capa nyct2020 para seleccionarla y vuelva a hacer clic para que el nombre sea editable.
- Escriba Distritos censales de Nueva York y pulse Intro.
Ha importado un shapefile a una clase de entidad de geodatabase, lo ha agregado a un mapa y ha cambiado el nombre de la capa. Ahora que tiene el dataset espacial base en la base de datos, le agregará información mediante uniones de tablas.
Explorar datos tabulares
A continuación, unirá los datos de la ACS a los distritos censales. Los datos de la ACS de todo el estado de Nueva York se encuentran actualmente en un archivo .csv o en un formato no espacial. Unirá los dos datasets en función de un atributo común para incorporar los datos de la ACS a los distritos censales.
- En el panel Catálogo, expanda Carpetas y expanda la carpeta IndicatorData.
El archivo Data4Join.csv contiene los datos de la ACS de todo el estado que desea unir a la capa Distritos censales de Nueva York.
- Arrastre el archivo Data4Join.csv sobre el mapa.
El archivo .csv aparece en el panel Contenido, en Tablas independientes.
Las tablas como, por ejemplo, un archivo .csv no tienen un componente espacial, por lo que aparecen en la sección Tablas independientes del panel Contenido. Aunque los datos tabulares no aparecen en el mapa de forma predeterminada, puede utilizarlos para mejorar sus capas de entidades uniendo datos o, si la tabla tiene coordenadas, puede mostrar los datos en función de las coordenadas.
A continuación, inspeccionará la tabla.
- Haga clic con el botón derecho en la tabla Data4Join.csv y elija Abrir.
La tabla contiene muchos atributos que puede utilizar para la asignación. Actualmente, la tabla está en formato .csv y no tiene un campo OBJECTID, lo que significa que no puede unirla con otra capa. Además, el campo GEO_ID que utilizará como campo coincidente en la unión es de un tipo diferente al del mismo campo de la capa de distritos censales. Para unir tablas, debe tener campos comunes que tengan el mismo tipo de datos.
- En la tabla, haga clic en el botón de opciones y elija Vista de campos.
- Localice el campo GEO_ID y observe que su valor de Tipo de datos es Entero grande.
- En el panel Contenido, haga clic con el botón derecho en Distritos censales de Nueva York y elija Tabla de atributos.
- Como hizo con la tabla .csv, haga clic en el botón de opciones y elija Vista de campos.
El campo GEOID de la capa de distritos censales contiene la misma información que el campo GEO_ID de la tabla, pero en formato de texto.
Los tipos de campo deben coincidir para que una unión funcione correctamente. Para asegurarse de que puede utilizar esta tabla en un join, la importará a la geodatabase y agregará y calculará un campo de texto para almacenar la información.
- Cierre todas las tablas y vistas de Campos.
Preparar los datos para una unión
Ahora que ha identificado la necesidad de importar la tabla .csv a su geodatabase y de agregar y calcular un campo para utilizarlo en la unión, realizará estas operaciones para preparar los datos adecuadamente.
- En el panel Catálogo, haga clic con el botón derecho en la geodatabase Indicadores, apunte a Importar y elija Tabla.
- En Tabla de entrada, haga clic en el menú desplegable y elija Data4Join.csv.
- Haga clic en Ejecutar.
- En el panel Catálogo, en la geodatabase Indicadores, haga clic con el botón derecho en Data4Join_csv y elija Cambiar nombre. Escriba Datos_ACS y pulse Intro.
- Agregue la tabla Datos_ACS al mapa.
- En el panel Contenido, haga clic con el botón derecho en Data4Join.csv y seleccione Quitar.
Antes de unir las tablas, debe agregar un campo de texto y calcularlo.
- Haga clic con el botón derecho en la tabla Datos_ACS, apunte a Diseño de datos y elija Campos.
- En la parte inferior de la lista de campos, haga clic en Haga clic aquí para agregar un campo nuevo.
- En Nombre de campo, escriba GEOID y, en Tipo de datos, elija Texto.
- En la cinta, en la pestaña Campos, en el grupo Administrar ediciones, haga clic en Guardar.
- Cierre la vista Campos.
- Abra la tabla Datos_ACS.
- Desplácese hasta el final y busque el campo GEOID. Haga clic con el botón derecho en él y elija Calcular campo.
- En la sección Expresión, en Campos, haga doble clic en GEO_ID para agregarlo a la expresión.
Está utilizando el campo GEO_ID para rellenar el campo GEOID que ha agregado.
- Haga clic en Aceptar.
El campo es ahora del tipo correcto y está rellenado con la información correcta.
- Cierre la tabla.
Ahora ya tiene todo listo para realizar la unión. En este caso, unirá la tabla Datos_ACS a la capa Distritos censales de Nueva York para complementar sus datos espaciales.
Unir datos de la ACS a la capa de distritos censales
A continuación, unirá los datos de la ACS a los distritos censales. Unirá los dos datasets en función de un atributo común para incorporar los datos de la ACS a los distritos censales.
- En el panel Contenido, haga clic con el botón derecho en la capa Distritos censales de Nueva York, apunte a Uniones y relaciones y elija Agregar unión.
Aparece la ventana Agregar unión. Aquí puede introducir los parámetros para la unión, como las tablas implicadas y los campos coincidentes.
- En la herramienta Agregar unión, introduzca o verifique los siguientes parámetros:
- En Tabla de entrada, verifique que Distritos censales de Nueva York esté seleccionada.
- En Campo de entrada, verifique que GEOID esté seleccionado.
- En Tabla de unión, verifique que Datos_ACS esté seleccionada.
- En Campo de unión, verifique que GEOID esté seleccionado.
- Desactive Mantener todos los registros de entrada.
- En Operación de unión, elija Unir uno al primero.
Ha introducido todos los parámetros para la unión. A continuación, validará la unión para asegurarse de que funcionará correctamente antes de ejecutar la herramienta.
- Haga clic en el botón Validar unión.
Aparece la ventana Mensaje.
Hay 2.325 registros coincidentes para la unión. Es el mismo número de distritos censales que hay en la capa de entidades. Aunque la tabla ACS contiene datos de todo el estado de Nueva York, solo unirá la información que coincida con los distritos, basándose en los campos comunes.
- En la ventana Mensaje, haga clic en Cerrar y, en la ventana Agregar unión, haga clic en Aceptar.
La unión se ha completado, pero no hay ningún cambio visible en el mapa. Donde verá la diferencia es en la tabla de atributos de la capa.
- Abra la tabla de atributos de Distritos censales de Nueva York.
- Desplácese a la derecha y observe los campos de Datos_ACS.
Ahora todos los campos de la tabla Datos_ACS están unidos a los distritos censales según el campo común.
- Cierre la tabla.
- En la Barra de herramientas de acceso rápido, haga clic en Guardar para guardar el proyecto.
Ha unido los atributos de ACS a la capa de distritos censales. Ahora puede utilizar estos campos para simbología, etiquetado y análisis.
Exportar la capa unida
La unión es virtual en la capa, pero no se almacena por separado como su propia fuente de datos. Exportará la capa de distritos censales como una clase de entidad para almacenar los campos unidos con las entidades de distritos censales.
- En el panel Contenido, haga clic con el botón derecho en Distritos censales de Nueva York, apunte a Datos y elija Exportar entidades.
Aparece la ventana Exportar entidades. El parámetro Entidades de entrada ya está configurado correctamente porque ha hecho clic con el botón derecho en la capa para exportarla.
- En Clase de entidad de salida, sustituya el nombre predeterminado por Distritos_ACS_NY y haga clic en Aceptar.
- Haga clic en Aceptar.
- Elimine la capa Distritos censales de Nueva York del mapa.
- En el panel Contenido, cambie el nombre de Distritos_ACS_NY a Distritos censales de la ciudad de Nueva York.
Ahora la capa de distritos censales que tiene en el mapa contiene todos los atributos de la tabla ACS y es su propia fuente de datos. Si comparte esta fuente de datos de cualquier forma, todos los atributos estarán presentes.
- Guarde el proyecto.
Agregar y calcular campos
A continuación, agregará y calculará dos campos, ambos porcentuales, para tener en cuenta el nivel educativo y la edad reproductiva.
- En el panel Contenido, haga clic con el botón derecho en Distritos censales de la ciudad de Nueva York, apunte a Diseño de datos y elija Campos.
- Desplácese hasta la parte inferior y haga clic dos veces en Haga clic aquí para agregar un campo nuevo.
Aparecen dos filas. A continuación, editará las propiedades de los campos.
- En la primera fila, introduzca las siguientes propiedades:
- En Nombre de campo, escriba o copie y pegue Titulo_grado_superior_mujeres.
- En Alias, escriba o copie y pegue ¿Es posible para las mujeres obtener un título de grado o superior?
- En Tipo de datos, elija Doble.
- Para el segundo campo, introduzca las siguientes propiedades:
- En Nombre de campo, escriba o copie y pegue Porcentaje_edad_reproductiva.
- En Alias, escriba o copie y pegue ¿Qué porcentaje de mujeres está en edad reproductiva?
- En Tipo de datos, elija Doble.
Nota:
Las casillas verdes junto al campo indican que hay cambios sin guardar.
- En la cinta, en la pestaña Campos, en el grupo Administrar ediciones, haga clic en Guardar.
- Cierre la vista Campos.
Para medir los indicadores de educación y salud reproductiva, calculará los campos en porcentajes.
- Abra la tabla de atributos de Distritos censales de la ciudad de Nueva York y desplácese hasta el final de la tabla para ver los dos campos que acaba de agregar.
- Haga clic con el botón derecho en ¿Es posible para las mujeres obtener un título de grado o superior? y elija Calcular campo.
- En la sección Expresión, en EducationForWomen =, copie y pegue la siguiente expresión: (!Women_getting_a_Bachelor_s_Degree_or_higher! / !Total_Female_Population_for_Education!) * 100.
- Haga clic en la marca de verificación verde para validar la expresión y haga clic en Aplicar.
Aparece una ventana de mensaje que indica una advertencia porque no todos los registros tienen un valor. Está bien así y puede continuar.
- Cierre la ventana de advertencia y haga clic en Aceptar.
Ha calculado el porcentaje de mujeres con un título de grado o superior. A continuación, calculará el otro campo de forma similar.
- En la tabla de atributos, haga clic con el botón derecho en ¿Qué porcentaje de mujeres está en edad reproductiva? y elija Calcular campo.
- En la sección Expresión, en WomenAtReproductiveAge =, borre la expresión existente.
- Copie y pegue la siguiente expresión: (!Women_at_reproductive_age_15_to_44! / !Total_Female_Population_for__reproductive_health!) * 100.
- Haga clic en Aplicar.
Aparece una advertencia similar, lo cual está bien y es de esperar.
- Cierre la ventana de advertencia y haga clic en Aceptar.
En Estados Unidos, es de conocimiento general que la educación superior conduce a mayores ingresos. Al observar esta tabla, puede pensar si las mujeres que viven en estas áreas tienen buenos modelos de éxito. Este modelo de éxito se mide por los ingresos medios, el nivel educativo y los ingresos en relación con los hombres. El porcentaje de mujeres en edad reproductiva puede utilizarse para medir el impacto de los cambios en las leyes estatales, como la prohibición del aborto. Puede utilizar la medida para aumentar el alcance de los servicios sanitarios específicos para cada sexo.
- Cierra la tabla y guarda el proyecto.
Ha agregado y calculado dos campos para tener en cuenta indicadores clave en su análisis: los porcentajes de mujeres en determinados niveles educativos y en edad reproductiva.
Ha creado una capa de indicadores a partir de fuentes de datos existentes, incluidos un shapefile y un archivo CSV. Ha importado los datos a la geodatabase, ha agregado campos, ha unido los datos, los ha exportado y ha calculado campos. A continuación, creará un indicador medioambiental utilizando datos ráster.
Utilizar datos ráster para crear una capa de cobertura arbórea
En esta sección, preparará un indicador que mida la cobertura arbórea. La cobertura arbórea es con frecuencia una medida utilizada para los indicadores medioambientales y puede asociarse a otros indicadores medioambientales como la temperatura para proporcionar una imagen más completa del área. Otro aspecto de la cobertura arbórea es que, históricamente, suele haber una distribución desigual de los árboles en muchas de las ciudades de Estados Unidos. La cobertura arbórea es un lujo en un espacio urbano como Nueva York. Utilizará la cobertura arbórea como indicador medioambiental para comprender la distribución de los árboles y saber qué mujeres tienen acceso a la sombra.
Explorar una imagen de cobertura del suelo
Empezará agregando datos de cobertura del suelo creados a partir de datos LIDAR para la ciudad de Nueva York. La imagen ha clasificado ocho tipos de cobertura del suelo.
- Vuelva al proyecto en ArcGIS Pro.
- Vaya a la conexión a carpetas IndicatorData y expanda la carpeta Land_Cover.
Esta imagen es un dataset ráster de 6 pulgadas de resolución de la cobertura del suelo de la ciudad de Nueva York.
- Agregue la imagen al mapa.
- En el panel Contenido, desactive la capa Distritos censales de la ciudad de Nueva York.
Esta capa de imagen se ha clasificado en ocho clases. A continuación, revisará los datos de la imagen explorando su tabla de atributos.
- Abra la tabla de atributos de la capa NYC_2017_LiDAR_LandCover.img.
Observe las ocho clasificaciones de cobertura del suelo presentes en la tabla. Hay 7.446.483.259 celdas en el ráster clasificadas como Cubierta arbórea.
Cuando piensa en lugares como la ciudad de Nueva York u otros espacios urbanos, probablemente le vengan a la mente todos los edificios, aceras y calles concurridas. Esta realidad hace que los árboles y el césped sean un lujo.
- Cierre la tabla.
Reclasificar la imagen de cobertura del suelo
De las ocho clasificaciones de cobertura del suelo de la imagen, solo le interesa la clasificación Cobertura arbórea. A continuación, utilizará una herramienta de geoprocesamiento para reclasificar la imagen y aislar solamente las celdas clasificadas como cobertura arbórea.
- En la cinta, haga clic en la pestaña Análisis. En el grupo Geoprocesamiento, haga clic en Herramientas.
Se abre el panel Geoprocesamiento. Desde aquí, puede buscar las herramientas por su nombre o por la caja de herramientas en la que están almacenadas.
- En el panel Geoprocesamiento, en la barra Buscar herramientas, escriba reclasificar. Haga clic en la herramienta Reclasificar (herramientas de Spatial Analyst).
- En la herramienta Reclasificar, defina los siguientes parámetros:
- En Ráster de entrada, haga clic en el menú desplegable y seleccione NYC_2017_LiDAR_LandCover.img.
- Asegúrese de que Reclasificar campo se ha configurado en Clase.
- En la tabla Reclasificación, en la fila Cubierta arbórea, deje el valor de la columna Nuevo en 1. Cambie el valor de la columna Nuevo de todas las demás clases, excepto NODATA, a 0.
- En Ráster de salida, haga clic en el botón Examinar y vaya a la carpeta IndicatorData. En Nombre, escriba TreeCanopyNYC.tif y haga clic en Guardar.
Nota:
Dependiendo de su sistema, la herramienta Reclasificar puede tardar hasta 20 minutos en completarse.
Si lo desea, también puede descargar los datos de los resultados para utilizar el archivo de imagen TreeCanopyNYC.tif. Para utilizar estos datos, descargue y extraiga el archivo .zip en su equipo y agréguelo a su proyecto en lugar de TreeCanopyNYC.tif.
- Haga clic en Ejecutar.
Cuando la imagen termina de procesarse, aparece en el mapa.
- En el panel Contenido, elimine la capa NYC_2017_LiDAR_LandCover.img.
La capa TreeCanopyNYC.tif tiene dos clases: Cubierta arbórea en una clase y todas las demás clasificaciones de la cobertura del suelo en la otra clase. Puede utilizar este ráster para calcular la variable de presencia de cobertura arbórea que será la medida para el indicador medioambiental.
- Guarde el proyecto.
A continuación, utilizará la herramienta Estadísticas zonales como tabla para resumir la cantidad de cobertura arbórea en cada distrito censal.
Resumir la cobertura arbórea dentro de cada distrito censal
Para el indicador, le interesa la presencia de árboles, y el valor más alto representará más árboles o un factor medioambiental positivo. Para determinar la cobertura arbórea en cada distrito censal, resumirá las celdas de cobertura arbórea basándose en los polígonos de distritos censales.
- En el panel Geoprocesamiento, haga clic en el botón Atrás. Busque y abra la herramienta Estadísticas zonales como tabla (herramientas de Spatial Analyst).
Esta herramienta resumirá el número de celdas de cobertura arbórea dentro de cada polígono censal y proporcionará un recuento del número total de celdas dentro de cada zona (polígono). Esto le permitirá calcular el porcentaje de las celdas del polígono cubiertas de árboles.
- En la herramienta Estadísticas zonales como tabla, introduzca los siguientes parámetros:
- En Datos de zonas de entidad o ráster de entrada, elija Distritos censales de la ciudad de Nueva York.
- En Campo de zona, elija GEOID [GEOID].
- Para Ráster de valor de entrada, elija TreeCanopyNYC.tif.
- En Tabla de salida, escriba TreePixels.
- En Tipo de estadísticas, seleccione Suma.
Nota:
Dependiendo de su sistema, la herramienta Estadísticas zonales como tabla puede tardar hasta 30 minutos en completarse.
Si lo desea, también puede descargar los datos de los resultados, extraer el archivo zip y agregar la tabla TreePixels a su proyecto.
- Haga clic en Ejecutar.
Cuando la herramienta finaliza, la tabla TreePixels aparece en el panel Contenido, en Tablas independientes.
- Abra la tabla TreePixels.
La tabla contiene dos columnas de interés: COUNT, que es el número total de píxeles dentro de cada distrito censal, y SUM, que es la suma de píxeles de cobertura arbórea.
Calculará el porcentaje de cobertura arbórea de cada polígono censal mediante la siguiente fórmula: PctTreeCanopy = (Sum / Count) * 100.
- En la tabla de atributos, haga clic en Calcular.
Aparece la herramienta Calcular campo. Anteriormente, creó los campos antes de abrir la herramienta Calcular campo. Esta vez, creará el campo y lo calculará simultáneamente.
- En la herramienta Calcular campo, en Nombre de campo (existente o nuevo), escriba PctTreeCanopy.
- En Tipo de campo, elija Doble (punto flotante de 64 bits).
- En Expresión, en PctTreeCanopy =, cree la expresión (!SUM! / !COUNT!)*100.
- Haga clic en Aceptar.
El campo PctTreeCanopy aparece al final de la tabla de atributos y se ha calculado.
El valor de PctTreeCanopy representa el porcentaje del distrito censal con cubierta arbórea y es la medida para el indicador medioambiental.
- Cierre la tabla TreePixels, desactive TreeCanopyNYC.tif y guarde el proyecto.
Ha reclasificado una imagen de cobertura del suelo para aislar las celdas que desea incluir en el indicador, cobertura arbórea, y ha resumido la cobertura arbórea por distritos censales. Ahora ya conoce el porcentaje de cubierta arbórea de cada distrito censal de la ciudad de Nueva York. La tabla TreePixels está lista para unirse a la capa Distritos censales de la ciudad de Nueva York.
Agregar un indicador basado en la proximidad
Los próximos indicadores que cree medirán el acceso a cosas específicas. A menudo, las organizaciones intentan determinar dónde se ubican las cosas, por ejemplo, recursos basados en el género. Una vez identificadas las ubicaciones, el siguiente paso es determinar el acceso a estas ubicaciones. Normalmente, el acceso a algo se mide en función de la proximidad a esa ubicación. Creará capas de puntos que representen las ubicaciones de las instalaciones para mujeres. A continuación, creará una zona de influencia de media milla alrededor de las instalaciones para determinar la proximidad a las mismas. También hará lo mismo con las ubicaciones de los desahucios porque los estudios han demostrado que las mujeres negras y de piel morena suelen verse afectadas negativamente por los desalojos forzosos. Desea conocer las áreas de la ciudad de Nueva York donde las mujeres están sufriendo desalojos forzosos de sus viviendas o alquileres.
Crear puntos a partir de una tabla
Ha trabajado con datos tabulares a lo largo de este tutorial, pero, hasta ahora, todos ellos eran no espaciales o no tenían ningún tipo de componente espacial, como las coordenadas. A continuación, representará cartográficamente los desahucios a partir de una tabla que contiene las coordenadas de sus ubicaciones.
- En el panel Catálogo, desde la carpeta IndicatorData, agregue Evictions.csv al mapa.
- Abra la tabla Evictions.csv y desplácese hacia la derecha hasta que vea los campos Latitud y Longitud.
Los campos Latitud y Longitud almacenan las coordenadas de cada desahucio. Utilizará estos campos para representar cartográficamente los desahucios como puntos en el mapa.
- Cierre la tabla.
- En la cinta, en la pestaña Mapa, en la sección Capa, haga clic en De tabla XY a punto.
La herramienta De tabla XY a punto aparece en el panel Geoprocesamiento.
- En la herramienta De tabla XY a punto, defina o verifique los siguientes parámetros:
- En Tabla de entrada, elija Evictions.csv.
- En Clase de entidad de salida, sustituya el nombre predeterminado por Evictions.
- En Campo X, compruebe Longitud esté seleccionado.
- En Campo Y, compruebe que Latitud esté seleccionado.
- En Sistema de coordenadas, verifique que GCS_WGS_1984 esté seleccionado.
La herramienta De tabla XY a punto elige los valores predeterminados de los parámetros inteligentes en función de los nombres de los campos.
- Haga clic en Ejecutar.
Nota:
Aparecerá una advertencia sobre valores nulos, que puede ignorar.
A continuación, agregará una tabla que contiene instalaciones para mujeres y representará cartográficamente esas ubicaciones utilizando la misma herramienta.
- En el panel Catálogo, agregue Womens_Facilities.csv al mapa.
- En la pestaña Mapa, haga clic en De tabla XY a punto.
- En la herramienta De tabla XY a punto, defina los siguientes parámetros:
- En Tabla de entrada, elija Womens_Facilities.csv.
- En Clase de entidad de salida, cambie el nombre a WomensResources.
- En Campo X, elija Ubicación 2.
- En Campo Y, elija Ubicación 1.
- En Sistema de coordenadas, verifique que GCS_WGS_1984 esté seleccionado.
- Haga clic en Ejecutar.
- En el panel Contenido, desactive Evictions para ver los puntos de WomensResources.
Nota:
Para ver mejor los puntos, puede cambiar el color.
Ha creado dos capas de entidades a partir de tablas no espaciales para representar cartográficamente criterios importantes para los indicadores.
Filtrar datos para mostrar solo determinados tipos de entidades
Ahora que tiene todos los puntos en el mapa, acotará el enfoque de su análisis para incluir solo un tipo específico de desahucio. En el caso de los desahucios, solo le interesan los desalojos, así que filtrará lo que necesite. Una gran parte del análisis consiste en acotar el enfoque de sus datos para incluir solo cosas específicas, como la cobertura arbórea y los desalojos.
- Abra la tabla de atributos de Evictions.
- Desplácese y localice el campo Ejectment.
Utilizará este campo para realizar la selección de atributos.
- En la tabla, haga clic en Seleccionar por atributos.
- En Donde, haga clic en el menú desplegable y elija Ejectment.
- En el segundo menú desplegable, mantenga es igual a y, en el último menú desplegable, elija Ejectment.
- Haga clic en Aceptar.
- En la esquina inferior izquierda de la tabla, haga clic en Mostrar registros seleccionados.
Ahora solo se muestran los registros seleccionados. Debería haber 67 registros seleccionados. Cambiará la selección para seleccionar las entidades que no desea utilizar y eliminarlas.
- En la tabla, haga clic en Cambiar selección.
Ahora se seleccionan 89.835 registros que no necesita.
- Haga clic en Eliminar selección.
- Haga clic en Sí para confirmar la eliminación.
- Haga clic en Mostrar todos los registros.
- Cierra la tabla y guarda el proyecto.
Ahora la tabla Evictions contiene solo los 67 registros que desea incluir en su análisis.
Crear zonas de influencia de tiempo de recorrido
A continuación, incorporará a su análisis la proximidad a los desahucios y las instalaciones para mujeres. Creará zonas de influencia de media milla alrededor de las entidades para representar la distancia a pie.
- En el panel Geoprocesamiento, busque y abra la herramienta Zona de influencia por pares.
- En la herramienta Zona de influencia por pares, establezca los siguientes parámetros:
- En Entidades de entrada, elija WomensResources.
- En Clase de entidad de salida, sustituya el valor predeterminado por ResourcesBuffer.
- En Distancia, escriba 0.5.
- En Unidad lineal, elija Millas de agrimensura de EE. UU.
- En Método, elija Geodésico (conservación de forma).
- En Tipo de disolución, elija Disolver todas las entidades de salida en una única entidad.
- Haga clic en Ejecutar.
- En el panel Contenido, asegúrese de que las únicas capas visibles, aparte de los mapas base, sean WomensResources y ResourcesBuffer.
Ha creado zonas de influencia para los puntos de recursos. A continuación, creará zonas de influencia para las entidades de desahucios.
- En el panel de la herramienta Zona de influencia por pares, que aún está abierto, actualice los siguientes parámetros:
- En Entidades de entrada, elija Evictions.
- En Clase de entidad de salida, sustituya el valor predeterminado por EvictionsBuffer.
- Haga clic en Ejecutar.
- En el panel Contenido, desactive WomensResources y ResourcesBuffer y active Evictions y EvictionsBuffer.
Ha creado capas para representar zonas de influencia de media milla alrededor de los puntos de desahucios y de recursos para mujeres. Disponer de estas zonas de influencia le permite incorporar la proximidad a la preparación de sus indicadores.
Crear tablas de indicadores
Ahora ya tiene todo listo para crear las tablas de indicadores.
- En el panel Geoprocesamiento, haga clic en la flecha hacia atrás. Busque y abra la herramienta Tabular intersección.
- En la herramienta Tabular intersección, configure los siguientes parámetros:
- En Entidades de zona de entrada, elija Distritos censales de la ciudad de Nueva York.
- En Campos de zona, elija GEOID [GEOID].
- En Entidades de clase de entrada, elija EvictionsBuffer.
- En Tabla de salida, escriba EvictionsIndicator.
- Para Campos de suma, elija SHAPE_Area.
- Haga clic en Ejecutar.
En el panel Contenido, la tabla EvictionsIndicator aparece en Tablas independientes.
A continuación, creará la tabla de indicadores de recursos para mujeres.
- En la herramienta Tabular intersección, modifique solo los siguientes parámetros:
- En Entidades de clase de entrada, elija ResourcesBuffer.
- En Tabla de salida, cambie el nombre a ResourcesIndicator.
- Haga clic en Ejecutar.
En el panel Contenido, la tabla ResourcessIndicator aparece en Tablas independientes.
- Abra ambas tablas de indicadores.
- Haga clic en la pestaña de una de las tablas y arrástrela hasta que vea las opciones de acoplamiento. Acóplela a la derecha de la otra tabla.
Cada tabla contiene un campo PERCENTAGE que mide el acceso a dos cosas diferentes.
Los valores porcentuales más altos de desahucios son malos porque representan el desalojo forzoso de personas. Por otro lado, el acceso a los recursos para mujeres es una buena medida. Por lo tanto, unos porcentajes más altos significan un mayor acceso a servicios específicos de género.
- Desacople la tabla, cierre ambas tablas y guarde el proyecto.
A continuación, unirá las tablas de indicadores de desahucios y recursos a los distritos censales para tener los porcentajes de cada uno de ellos para cada distrito.
Organizar el panel Contenido
Ahora que tiene todos los datos que desea para los indicadores, organizará rápidamente el panel Contenido antes de unir los datos. Creará una capa de grupo para ayudar a organizar las capas.
- En el panel Contenido, pulse Ctrl y haga clic en todas las capas excepto Distritos censales de la ciudad de Nueva York para seleccionarlas a la vez.
- Haga clic con el botón derecho en una de las capas seleccionadas y elija Grupo.
Se agrupan todas las capas seleccionadas en un grupo llamado Nueva capa de grupo.
- Haga clic una vez en el nombre Nueva capa de grupo para seleccionarlo y vuelva a hacer clic para que sea editable.
- Para el nombre, escriba Datos de trabajo.
A continuación, unirá los datos de los indicadores.
Unir tablas de indicadores a los distritos censales
Tiene tres indicadores en tablas independientes: TreePixels, EvictionsIndicator y ResourcesIndicator. Para tener esta información en los distritos censales, realizará tres operaciones de unión para incorporar los campos de las tablas de indicadores a los distritos censales.
- En el panel Contenido, haga clic con el botón derecho en Distritos censales de la ciudad de Nueva York, apunte a Uniones y relaciones y elija Agregar unión.
- En la herramienta Agregar unión, introduzca los siguientes parámetros:
- En Tabla de entrada, elija Distritos censales de la ciudad de Nueva York.
- En Campo de entrada, elija GEOID [GEOID].
- En Tabla de unión, elija TreePixels.
- En Campo de unión, elija GEOID.
- Deje la opción Mantener todos los registros de entrada activada.
- En Operación de unión, elija Unir uno al primero.
- Haga clic en Aceptar.
No ocurre nada en el mapa, pero los atributos se incorporan a la tabla de Distritos censales de la ciudad de Nueva York. Completará las otras dos uniones y explorará la tabla.
A continuación, repetirá la unión para las tablas EvictionsIndicator y ResourcesIndicator.
- Abra la herramienta Agregar unión para la capa Distritos censales de la ciudad de Nueva York e introduzca los siguientes parámetros:
- En Tabla de entrada, elija Distritos censales de la ciudad de Nueva York.
- En Campo de entrada, elija GEOID (ahora hay muchos debido a las uniones, pero cualquiera servirá).
- En Tabla de unión, elija EvictionsIndicator.
- En Campo de unión, elija GEOID.
- En Operación de unión, elija Unir uno al primero.
- Deje la opción Mantener todos los registros de entrada activada.
- Haga clic en Ejecutar.
Por último, unirá la tabla WomensResources a los distritos censales.
- Abra la herramienta Agregar unión para la capa Distritos censales de la ciudad de Nueva York e introduzca los siguientes parámetros:
- En Tabla de entrada, elija Distritos censales de la ciudad de Nueva York.
- En Campo de entrada, elija GEOID (ahora hay muchos debido a las uniones, pero cualquiera servirá).
- En Tabla de unión, elija WomensResources.
- En Campo de unión, elija GEOID.
- En Operación de unión, elija Unir uno al primero.
- Deje la opción Mantener todos los registros de entrada activada.
Ha unido todas las tablas que necesita a la capa Distritos censales de la ciudad de Nueva York. A continuación, exportará la capa unida a su propia clase de entidad y limpiará los campos en el proceso.
Exportar distritos censales
La capa Distritos censales de la ciudad de Nueva York tiene ahora cuatro tablas unidas a ella. Como hizo anteriormente con la unión, exportará la capa a su propia fuente de datos.
- En el panel Contenido, haga clic con el botón derecho en Distritos censales de la ciudad de Nueva York, apunte a Datos y elija Exportar entidades.
- En la herramienta Exportar entidades, cambie el parámetro Clase de entidad de salida a Indicadores.
Cuando une datos, está incorporando muchos campos en una tabla y es posible que desee eliminar o cambiar el nombre de algunos alias de campo para hacer los datos más claros. A continuación, limpiará los campos antes de exportar los datos.
- Expanda Campos, marque Usar alias de campo como nombre y haga clic en Editar.
Aparece la ventana Propiedades de campo. Conservará solo los campos para el análisis exploratorio y cambiará el nombre de los campos de indicadores.
- Si es necesario, apunte al divisor vertical situado junto a la sección Campos y cambie su tamaño para poder ver los alias de campo completos.
- En la sección Campos, haga clic en ¿Cuál es la mediana de ingresos de las mujeres? En la sección Propiedades, en Alias, escriba Mediana de ingresos de las mujeres.
- Utilizando el mismo flujo de trabajo, cambie el alias de cada uno de los siguientes campos como se indica:
- Cambie ¿Ganan más las mujeres que los hombres? a Igualdad salarial.
- Cambie ¿Está prohibido el aborto? Sí o No a Prohibición del aborto.
- Cambie ¿Son legales los matrimonios infantiles? Sí o No a Matrimonios infantiles.
- Cambie Porcentaje de mujeres blancas a Mujeres blancas.
- Cambie Porcentaje de mujeres negras a Mujeres negras.
- Cambie Porcentaje de mujeres indígenas americanas o nativas de Alaska a Mujeres AIAN.
- Cambie Porcentaje de mujeres asiáticas a Mujeres asiáticas.
- Cambie Porcentaje de mujeres nativas de Hawái u otras islas del Pacífico a Mujeres NHOPI.
- Cambie Porcentaje de mujeres mestizas a Mujeres mestizas.
- Cambie Porcentaje de mujeres hispanas o latinas a Mujeres hispanas o latinas.
- Cambie EducationForWomen a Educación.
- Cambie WomenAtReproductiveAge a Mujeres en edad reproductiva.
- Cambie PctTreeCanopy a Cobertura arbórea.
- Cambie PERCENTAGE (EvictionsIndicator.PERCENTAGE) a Desahucios.
- Cambie PERCENTAGE (ResourcesIndicator.PERCENTAGE) a Recursos basados en el género.
A continuación, eliminará algunos campos que no necesita.
- En la lista Campos, haga clic en Total Female Population for Education y haga clic en el botón Eliminar.
- Del mismo modo, elimine los siguientes campos:
- Women getting a Bachelor's Degree or higher.
- Total Female Population for reproductive health.
- Women at reproductive age 15 to 44.
- Haga clic en Aceptar para cerrar la ventana Propiedades de campo y vuelva a hacer clic en Aceptar para ejecutar la exportación.
La capa Indicadores aparece en el mapa y en el panel Contenido.
- Abra la tabla de atributos de la capa Indicadores y desplácese hacia la derecha hasta que vea los alias actualizados utilizados como encabezado de campo.
Modificar los alias durante la exportación ha sido una buena forma de hacer que la tabla sea más fácil de interpretar. Ahora tiene todos los indicadores disponibles en la capa de distritos. Puede utilizar esos campos de indicadores para la simbología, el etiquetado, la realización de consultas y el análisis.
Ha creado capas de puntos a partir de coordenadas de tablas para representar cartográficamente los desahucios y los recursos para mujeres. Ha creado zonas de influencia de media milla alrededor de los puntos de desahucios y de recursos para mujeres y ha utilizado las zonas de influencia para crear indicadores para cada variable. También ha realizado varias uniones para tener todos los indicadores en la capa de distritos censales y la ha exportado a su propia clase de entidad. Las dos tablas de indicadores que ha creado miden la proximidad, pero por razones muy diferentes. Los porcentajes más altos de desahucios son malos porque representan el desalojo forzoso, pero es importante destacar las áreas más castigadas por este problema. Por otro lado, el acceso a los recursos para mujeres es una medida positiva porque las mujeres tienen más apoyo en estas áreas. A continuación, unirá las tablas de desahucios y recursos para mujeres a los distritos censales y profundizará en las relaciones de los datos utilizando el análisis de datos exploratorio.
Explorar los datos mediante gráficos y simbología
Ahora que tiene todos los indicadores en una capa, explorará las variables en una matriz de gráficos de dispersión para comprender mejor sus relaciones. Una parte importante de la realización de cualquier análisis es evaluar los datos resultantes una vez completados los cálculos. Esto le ayudará a determinar si el dataset contiene una distribución de datos sesgada, lo que podría afectar su análisis e informarle si es necesario implementar ajustes o métodos adicionales para obtener resultados de análisis más precisos.
Explorar los datos de los indicadores
Creará una matriz de gráficos de dispersión para comparar la relación entre cada indicador. Esta es una forma útil de determinar correlaciones positivas y negativas y el grado o magnitud de esas correlaciones.
- En el panel Contenido, haga clic con el botón derecho en la capa Indicadores, apunte a Crear gráfico y elija Matriz de gráficos de dispersión.
Aparece el panel Propiedades de gráfico y una ventana de gráfico vacía. Cuando defina propiedades en el panel Propiedades de gráfico, el gráfico se mostrará y actualizará automáticamente en la ventana de gráfico.
- En la sección Variables, haga clic en Seleccionar.
Aparece una lista de los atributos de la capa Indicadores. Para una matriz de gráficos de dispersión, debe seleccionar al menos tres variables. Una de las variables que desea explorar es la Mediana de ingresos, pero no aparece en la lista.
- Abra la vista Campos de la capa Indicadores.
- Localice el campo Mediana de ingresos de las mujeres y vea su Tipo de datos.
El campo Mediana de ingresos de las mujeres es de tipo Texto. No puede representar un campo de texto en una matriz de gráficos de dispersión, de modo que debe agregar un campo numérico y calcularlo para almacenar los valores de ingresos.
- Con las capacidades que ha utilizado en este tutorial, agregue un campo llamado WomensMedianIncome con un Alias de Mediana de ingresos de mujeres y un Tipo de datos Doble.
- Calcule el WomensMedianIncome basándose en el campo Mediana de ingresos de las mujeres.
Puede hacer caso omiso de cualquier advertencia en el cálculo.
- En el panel Propiedades de gráfico, haga clic en Seleccionar.
- En la lista de variables, marque las casillas de Igualdad salarial, Educación y Mediana de ingresos de mujeres.
Se enumeran las variables seleccionadas.
Las variables aparecen en la matriz de gráficos de dispersión.
- En Tendencia, haga clic en Mostrar línea de tendencia.
Las líneas de tendencia aparecen para cada variable para indicar la tendencia de la variable.
- En la sección Diseño de matriz, en Inferior izquierda, compruebe que Gráficos de dispersión esté seleccionado y, en Superior derecha, haga clic en el menú desplegable y elija R de Pearson.
La matriz de gráficos de dispersión le permite explorar muchas relaciones en un solo gráfico. Visualiza la relación bivariante entre las variables seleccionadas. A continuación, explorará la relación de los resultados económicos de las mujeres blancas, negras y latinas.
- En el panel Propiedades de gráfico, en Variables, haga clic en Seleccionar y marque las casillas de Mujeres blancas, Mujeres negras y Mujeres hispanas o latinas.
Estos minigráficos muestran valores R con colores divergentes que corresponden a la intensidad y dirección de la relación.
A continuación, ordenará los minigráficos.
- En el panel Propiedades de gráfico, en la sección Ordenar, haga clic en el menú desplegable Ordenar por y elija R de Pearson. En Campo de destino, elija Mediana de ingresos de mujeres y, en Dirección de ordenación, elija Descendente.
Generalmente, los valores estarán entre +1 y -1. Hay tres relaciones que buscar en la matriz de gráficos de dispersión:
- Correlación positiva, valores más cercanos a +1.
- Sin correlación, valores cercanos a 0.
- Correlación negativa, valores cercanos a -1.
Tres gráficos muestran una relación positiva sólida, con valores de 0,8, 0,55 y 0,6, respectivamente. A continuación, explorará las variables de cada una de las relaciones.
- En el gráfico, haga clic en el cuadro con el valor R de Pearson de 0,8.
Se describe el gráfico de dispersión correspondiente para Educación y Mediana de ingresos de las mujeres en el gráfico de matriz de dispersión.
El gráfico con un valor de 0,8 representa la relación entre las variables Educación y Mediana de ingresos de mujeres. Se espera que, a medida que aumente la educación, aumenten también los ingresos.
- Haga clic en el cuadro con el valor R de 0,55.
Se describe el gráfico de la variable Mujeres blancas. Existe una relación positiva sólida entre las mujeres blancas y la mediana de ingresos, de modo que, a medida que aumenta el porcentaje de mujeres blancas, también lo hace la mediana de ingresos.
- Haga clic en el cuadro con el valor R de 0,6.
Se describe el gráfico que muestra la relación entre las variables Mujeres blancas y Educación. Según el gráfico, a medida que aumenta el porcentaje de mujeres blancas, también aumenta el porcentaje de mujeres con un título de grado o superior. A continuación, explorará si existe una relación similar para Mujeres negras.
- En el gráfico, haga clic en el cuadro con el valor R de -0,26 y -0,32.
Los gráficos de Mujeres negras resaltan que las relaciones entre las mujeres negras, los ingresos y la educación muestran una correlación negativa; por lo tanto, a medida que aumentan los porcentajes de estos dos grupos, disminuyen tanto los ingresos como la educación.
- Para explorar la relación entre las mujeres hispanas o latinas, los ingresos y la educación, haga clic en los valores R de -0,43 y -0,47.
Las relaciones entre las mujeres hispanas o latinas, los ingresos y la educación muestran una correlación negativa; por lo tanto, a medida que aumentan los porcentajes de estos dos grupos, disminuyen tanto los ingresos como la educación.
- Seleccione el cuadro con el valor R de -0,63.
El gráfico seleccionado representa la relación entre los porcentajes de mujeres negras y blancas, lo que significa que, a medida que aumentan los porcentajes de un grupo, disminuyen los del otro. Por lo tanto, es probable que estos dos grupos no vivan a menudo en las mismas áreas.
- Cierre todas las ventanas abiertas excepto el mapa. Cierre el panel Propiedades de gráfico y guarde el proyecto.
Acaba de explorar los datos utilizando una matriz de gráficos de dispersión con valores R de Pearson. Si tuviera que utilizar estos indicadores en un índice, tendría que considerar si son importantes para los resultados o si el indicador es el enfoque del índice. Por ejemplo, no incluiría la raza o la etnia en los cálculos del valor del índice; sin embargo, puede utilizar estos factores para desglosar el índice. A continuación, considerará otro ejemplo: la igualdad salarial. La igualdad salarial es una variable derivada de los ingresos entre las mujeres y sus homólogos masculinos. La igualdad salarial ofrece una gran perspectiva de cómo se mide la paridad de género en función de los ingresos, pero, para un índice con el conjunto actual de indicadores, quizá le convenga excluirla. Ya tiene la mediana de ingresos como variable. Además, si fuera a ampliar estas áreas temáticas y considerara la posibilidad de tener subíndices como la economía con una mediana de ingresos, la igualdad salarial y algunos otros datos, funcionaría mejor.
Representar cartográficamente un indicador
Ahora que ha explorado los datos de los indicadores utilizando una matriz de gráficos de dispersión y ha comprendido mejor las variables, visualizará la capa Indicadores utilizando simbología bivariante. Creará un mapa de relaciones de educación e ingresos. Los mapas de relaciones muestran una representación visual de dos variables. Esto le ayudará a ver la interacción de los indicadores en más de una dimensión, lo que a menudo se denomina superdiversidad o interseccionalidad.
- En el panel Contenido, haga clic con el botón derecho en la capa Indicadores y haga clic en Simbología.
Aparece el panel Simbología.
- En Simbología principal, haga clic en el menú desplegable y elija Colores bivariantes.
- En Campo 1, elija Educación.
- En Campo 2, elija Mediana de ingresos de mujeres.
- En Método, verifique que Cuantil esté seleccionado.
- En Tamaño de cuadrícula, verifique que 3 x 3 esté seleccionado y mantenga el esquema de color Rosa-azul-morado.
A continuación, cambiará el color del contorno.
- En Plantilla, haga clic en el color existente.
- Haga clic en la pestaña Propiedades. En Color de contorno, haga clic en el color existente y elija Gris 30%.
- En Ancho del contorno, cambie el valor actual a 0.2 pt.
- Haga clic en Aplicar.
De este modo, se simbolizará la relación entre la educación y la mediana de ingresos de baja a alta. Las áreas en las que tanto la educación como la mediana de ingresos de las mujeres sean elevadas aparecerán sombreadas en morado. Esta área se encuentra principalmente en Manhattan y en una parte de Brooklyn.
- Cambie el nombre de la capa a Educación x Mediana de ingresos de las mujeres.
- Guarde el proyecto.
Acaba de completar dos métodos de análisis de datos exploratorio: los gráficos y la representación cartográfica. Con los gráficos, puede investigar la intensidad de las relaciones e identificar los indicadores que deben excluirse de un índice. Normalmente, se tratará de indicadores muy correlacionados que pueden sesgar los valores del índice. Las visualizaciones cartográficas permiten ver patrones de varios indicadores, lo que es clave para comprender los procesos sociales.
En este tutorial, ha introducido el enfoque geográfico a la igualdad racial y la justicia social y lo ha aplicado al desarrollo de indicadores. Ha preparado capas de indicadores utilizando los datos de la Encuesta sobre la Comunidad Estadounidense para obtener datos sobre educación, salarios e ingresos. También ha aprendido a reclasificar las imágenes y a calcular la cobertura arbórea a partir de los píxeles de los distritos poligonales. Después, ha desarrollado un indicador basado en la proximidad para observar el acceso a los recursos basados en el género. El último paso ha sido realizar un análisis de datos exploratorio que puede utilizar para identificar indicadores altamente correlacionados, los cuales pueden sesgar un índice.
Puede aplicar esta metodología de desarrollo de indicadores a otras áreas de interés en todo el mundo y puede incluir datos específicos de su comunidad. Cuando prepare sus propios indicadores, utilice el procesamiento de datos e indicadores específicos para sus objetivos a largo plazo, resultados y poblaciones. Encontrará más información sobre el análisis de datos exploratorio en esta entrada de blog.
Encontrará más tutoriales en la galería de tutoriales.