Analizar los datos espacialmente

Examinará los datos de check-in y los analizará para determinar tendencias espaciales.

Abrir el proyecto

Primero, descargará y abrirá un paquete de proyecto de ArcGIS Pro que contiene un mapa de los datos de check-in. Después, se familiarizará con los atributos de los datos.

  1. Descargue el paquete de proyecto Bay Area Popular Places.
  2. Localice el paquete de proyecto Bay_Area_Popular_Places descargado en su equipo y haga doble clic en él para abrirlo en ArcGIS Pro. Si se le pide, inicie sesión con su cuenta de ArcGIS con licencia o con la cuenta de ArcGIS Enterprise.
    Nota:

    Si no tiene acceso a ArcGIS Pro o una cuenta de organización de ArcGIS, consulte las opciones de acceso a software.

    Mapa y datos predeterminados

    El proyecto contiene un mapa con datos de puntos del área de la bahía de San Francisco. Los datos se recopilaron a través de la plataforma de la red social Gowalla, que estuvo activa entre 2007 y 2012. Gowalla permitía a los usuarios hacer check-ins en las ubicaciones que visitaban. Cada punto representa una ubicación en la que un usuario de Gowalla hizo un check-in.

    Según el mapa, responda las siguientes preguntas:

    • ¿Hay algunos lugares que contengan más check-ins que otros?
    • ¿Cómo podría definir que un área es popular mediante estos check-ins?
    • Los datos están agrupados en clústeres densamente. ¿Cuánta perspectiva puede obtener con solo mirar el mapa?

    A continuación, investigará los atributos de los datos.

  3. En el panel Contenido, haga clic con el botón derecho en la capa Bay Area Gowalla Check-ins y seleccione Tabla de atributos.

    Opción Tabla de atributos de la capa Bay Area Gowalla Check-ins

    Aparece la tabla.

    Tabla de atributos de la capa Bay Area Gowalla Check-ins

    Los campos User ID y Location ID contienen Id. únicos para usuarios y ubicaciones. No tiene acceso a una clave para estos Id., así que estos campos no resultan útiles para determinar la popularidad. Los campos Check-in Latitude y Check-in Longitude proporcionan la información espacial de los datos, mientras que el campo Check-in Time proporciona su información temporal.

  4. Cierre la tabla.

Cambiar el sistema de coordenadas

Al analizar las relaciones espaciales entre entidades, es importante asegurarse de que esté utilizando un sistema de coordenadas que sea adecuado para los datos. Un sistema de coordenadas proyectadas es un proceso matemático que transforma el mundo tridimensional en un mapa bidimensional. No hay una forma perfecta de hacer esta transformación, de modo que todos los sistemas de coordenadas proyectadas contienen algún tipo de distorsión. Esta distorsión no solo afecta a la apariencia del mapa, sino que también puede alterar los resultados del análisis espacial.

Para reducir la distorsión y asegurar la máxima precisión de los resultados, proyectará los datos a un sistema de coordenadas proyectadas que se centre en torno al área de San Francisco. Este sistema de coordenadas minimiza la distorsión cerca de San Francisco, a costa de incrementar la distorsión en otras áreas. Como no se centrará en áreas fuera de San Francisco, este sistema de coordenadas es adecuado para su mapa y sus datos.

  1. En la cinta, haga clic en la pestaña Análisis. En el grupo Geoprocesamiento, haga clic en Herramientas.

    Botón Herramientas de la pestaña Análisis

    Se abre el panel Geoprocesamiento.

  2. En el panel Geoprocesamiento, en la barra de búsqueda, escriba Proyectar. En la lista de resultados, haga clic en la herramienta Proyectar para abrirla.

    Herramienta Proyectar en el panel Geoprocesamiento

  3. En el panel de la herramienta Proyectar, en Clase de entidad o dataset de entrada, elija Bay Area Gowalla Check-ins. En Clase de entidad o dataset de salida, escriba Check_ins_proyectados.
  4. En Sistema de coordenadas de salida, haga clic en el botón Seleccionar sistema de coordenadas.

    Botón Seleccionar sistema de coordenadas

  5. En la ventana Sistema de coordenadas, en el cuadro de búsqueda, escriba San Francisco y pulse Intro.
  6. Expanda Sistema de coordenadas proyectadas y Sistemas de condado. Haga clic en NAD 1983 (2011) San Francisco CS13 (US Feet).

    Ventana Sistema de coordenadas con el nuevo sistema de coordenadas seleccionado

  7. Haga clic en Aceptar. En el panel Geoprocesamiento, haga clic en Ejecutar.

    Se agrega al mapa la capa de salida denominada Bay Area Gowalla Check-ins.

  8. En el panel Contenido, haga clic con el botón derecho en la segunda capa Bay Area Gowalla Check-ins (la original) y seleccione Quitar.

    Opción Quitar de la capa original de check-ins

    Se elimina la capa. Aunque ha proyectado la capa, la apariencia del mapa no ha cambiado. El mapa sigue utilizando el sistema de coordenadas proyectadas original, que se centra en todo Estados Unidos (lo que supone que California, en el límite de Estados Unidos, está algo distorsionada). Actualizará la proyección del mapa.

  9. En el panel Contenido, haga doble clic en Mapa.

    Aparece la ventana Propiedades de mapa.

  10. En la ventana Propiedades del mapa, haga clic en Sistemas de coordenadas. Busque San Francisco. Expanda Sistemas de condado y elija el sistema de coordenadas NAD 1983 (2011) San Francisco CS13 (Pies EE. UU.).
  11. Haga clic en Aceptar.

    El mapa cambia para utilizar el sistema de coordenadas seleccionado.

    Actualizaciones de mapa con diferentes sistemas de coordenadas

Agregar check-ins

Es difícil determinar qué áreas son populares mirando el mapa, ya que casi todos los lugares poblados del área de la bahía de San Francisco están cubiertos de puntos de check-in. Para obtener una perspectiva más significativa, hará un recuento del número de check-ins de cada área. Creará una cuadrícula de bins hexagonales que abarque el área de la bahía de San Francisco y utilizará esta cuadrícula para agregar check-ins. Después, simbolizará la capa de resultados para determinar qué áreas tienen más check-ins.

  1. En el panel Geoprocesamiento, haga clic en el botón Atrás.

    Botón Atrás

  2. Busque y abra la herramienta Generar estructura en teselas.

    Esta herramienta crea una cuadrícula de entidades poligonales normales, como hexágonos, cuadrados o triángulos, para abarcar una extensión especificada.

  3. En Clase de entidad de salida, escriba Teselación_hexagonal. En Extensión, seleccione Bay Area Gowalla Check-ins.

    Parámetro Extensión de la herramienta Generar teselación

  4. En Tamaño, escriba 12 y elija Millas terrestres cuadradas. En Referencia espacial, compruebe que NAD_1983_2011_San_Francisco_CS13_ftUS esté elegida.

    Parámetros de la herramienta Generar teselación

  5. Haga clic en Ejecutar.

    La herramienta se ejecuta y se agrega una cuadrícula hexagonal al mapa. (La simbología predeterminada es aleatoria y puede ser diferente de la de la imagen de ejemplo).

    Teselación hexagonal en el mapa

    A continuación, hará un recuento del número de check-ins que contiene cada bin hexagonal. No le interesan las áreas en las que no se hizo ningún check-in o no se recopiló ningún dato, así que primero seleccionará los bins que intersecan al menos un check-in.

    Al ejecutar una herramienta de geoprocesamiento en una capa que tiene una selección activa, como una cuadrícula hexagonal, la herramienta utiliza solamente las entidades seleccionadas para el análisis. Las entidades que no estén seleccionadas no se usarán en el análisis.

  6. En la cinta, haga clic en la pestaña Mapa. En el grupo Selección, haga clic en Seleccionar por ubicación.

    Botón Seleccionar por ubicación

    Aparece la ventana Seleccionar capa por ubicación.

  7. En la ventana Seleccionar capa por ubicación, introduzca los siguientes parámetros:
    • En Entidades de entrada, confirme que Teselación_hexagonal esté seleccionado.
    • En Relación, confirme que se ha seleccionado Intersecar.
    • En Entidades de selección, elija Bay Area Gowalla Check-ins.

    Parámetros de la herramienta Seleccionar capa por ubicación

  8. Haga clic en Aceptar. En el panel Contenido, desmarque Bay Area Gowalla Check-ins para desactivarla.

    En el mapa, se seleccionan los bins hexagonales que intersecan al menos un check-in.

    Mapa con bins hexagonales seleccionados

    A continuación, unirá las entidades de check-in con los hexágonos seleccionados. La unión agregará un campo de atributo a la cuadrícula hexagonal que incluirá el número de check-ins que tiene cada hexágono.

  9. En el panel Geoprocesamiento, haga clic en el botón Atrás. Busque y abra la herramienta Unión espacial.
  10. En la herramienta Unión espacial, introduzca los siguientes parámetros:
    • En Entidades de destino, elija Teselación_hexagonal.
    • En Unir entidades, elija Bay Area Gowalla Check-ins.
    • En Clase de entidad de salida, escriba Recuentos_check_ins.

    Parámetros de la herramienta Unión espacial

  11. Haga clic en Ejecutar.

    La herramienta se ejecuta y se agrega al mapa una nueva capa que contiene solo los bins hexagonales seleccionados. Los recuentos de check-ins de cada bin se incluyen en un campo de atributo de la capa. Para visualizar los recuentos en el mapa, cambiará la simbología de la capa.

  12. En el panel Contenido, haga clic con el botón derecho en Teselación_hexagonal y seleccione Quitar. Desactive la capa Bay Area Gowalla Check-ins.
  13. Haga clic con el botón derecho en Recuentos_check_ins y haga clic en Simbología.

    Aparece el panel Simbología.

  14. En el panel Simbología, para Simbología principal, seleccione Colores graduados.
  15. En Clases, elija 10. En Esquema de color, elija Cian a morado.

    Parámetros del panel Simbología

    La simbología se aplica al mapa.

    Mapa con bins hexagonales simbolizados

    En el mapa, los bins hexagonales rosas presentan un mayor número de check-ins, mientras que los bins azules tienen un número menor. Los bins con más check-ins tienden a agruparse en torno a San Francisco y San José, las ciudades más grandes del área.

  16. Cierre el panel Simbología. En la barra de herramientas de acceso rápido, haga clic en el botón Guardar.

    Botón Guardar en la barra de herramientas de acceso rápido

    Nota:

    Puede aparecer un mensaje que le avisa que guardar este archivo de proyecto con la versión actual de ArcGIS Pro le impedirá volver a abrirlo en una versión anterior. Si ve este mensaje, haga clic en para continuar.

Cuantificar la importancia de las agregaciones

Los check-ins agregados muestran algunos patrones. Pero ¿estos patrones son estadísticamente significativos o podrían deberse a una varianza aleatoria o un error de muestreo? Para averiguarlo, cuantificará la importancia estadística de los check-ins agregados. Utilizará la estadística I de Moran global para probar si los patrones de sus resultados están agrupados en clústeres, dispersos o son aleatorios.

I de Moran global cuantifica los patrones espaciales de un atributo. Como sus datos de check-in originales no tienen atributos que pueda utilizar para determinar la densidad de check-ins, ha sido necesario agregar los check-ins antes de ejecutar la estadística. Los bins hexagonales tienen el campo Join_Count, que I de Moran global puede cuantificar.

Nota:

Para obtener más información sobre los cálculos matemáticos de I de Moran global, consulte Cómo funciona Autocorrelación espacial (I de Moran global).

  1. En el panel Geoprocesamiento, haga clic en el botón Atrás. Busque y abra la herramienta Autocorrelación espacial (I de Moran global).
  2. En la herramienta Autocorrelación espacial (I de Moran global), en Clase de entidad de entrada, elija Recuentos_check_ins y, en Campo de entrada, elija Join_Count.
  3. Active Generar informe.

    Parámetros de la herramienta Autocorrelación espacial (I de Moran global)

  4. Haga clic en Ejecutar.

    La herramienta se ejecuta, pero no se agrega ninguna capa al mapa. En su lugar, se ha creado un archivo de informe. Puede encontrar la ruta a este archivo de informe visualizando la información sobre la herramienta.

  5. En la parte inferior del panel Geoprocesamiento, haga clic en Ver detalles.

    Ver detalles

    Aparece la ventana Autocorrelación espacial (I de Moran global). En esta ventana aparece el tiempo de ejecución de la herramienta, los parámetros que utilizó para ejecutar la herramienta y los mensajes de advertencia.

  6. En la ventana Autocorrelación espacial (I de Moran global), haga clic en la pestaña Parámetros. En Archivo de informe, haga clic en la ruta al archivo de informe.

    Vínculo de la ruta del archivo de informe en la pestaña Parámetros

    El archivo de informe aparece en una nueva pestaña de navegador.

    Archivo de informe

    El informe incluye el índice de Moran, la puntuación z y el valor P. Para determinar la importancia estadística, la puntuación z es el más importante de estos valores.

    La puntuación z indica el número de desviaciones estándar al que se encuentra un valor respecto del valor medio. Las puntuaciones z positivas son valores por encima de la media, mientras que las puntuaciones z negativas son valores por debajo de la media. En este caso, el valor que se mide es la cantidad de autocorrelación espacial que existe entre las entidades de su dataset.

    La puntuación z de sus datos es superior a 7, lo que significa que sus datos tienen una autocorrelación espacial considerablemente mayor que un conjunto hipotético de datos distribuidos aleatoriamente. El informe también contiene un gráfico que representa la puntuación z en el extremo derecho de la curva de campana. El gráfico indica que existe una importancia estadística en la distribución de sus datos y que están agrupados en clústeres (es decir, los valores similares de los datos están más juntos).

  7. Cierre el informe. En ArcGIS Pro, cierre la ventana Autocorrelación espacial (I de Moran global).

Detectar clústeres espaciales

Al agregar los datos y determinar su importancia estadística, sabe con seguridad que los check-ins no se distribuyen aleatoriamente, sino que se agrupan en clústeres. A continuación, realizará un análisis clúster espacial para detectar áreas de gran popularidad.

  1. En el panel Geoprocesamiento, haga clic en el botón Atrás. Busque y abra la herramienta Clustering basado en densidad.

    Esta herramienta ofrece tres métodos de clustering espacial, cada uno de los cuales requiere una definición distinta de lo que se considera denso y no denso. Ejecutará la herramienta tres veces, una para cada método, y ponderará las ventajas y desventajas de cada uno.

    Primero, utilizará el método de distancia definido, también conocido como DBSCAN, que es el método de clustering basado en densidad más sencillo. En este método, la densidad se define por tener un número especificado de puntos en una distancia especificada. En cada punto, comprueba si el punto cumple el número mínimo de entidades en una distancia de búsqueda definida. Si un punto cumple el criterio, se marca como punto agrupado en clúster. Para ejecutar la herramienta, debe definir el número mínimo de entidades. También puede definir la distancia de búsqueda, pero si no la define, la herramienta utiliza un valor optimizado.

    El número mínimo de entidades por clúster depende de sus datos y el problema que quiere resolver. Quiere identificar lugares populares en el área de la bahía. No conoce el número exacto de check-ins que hacen que un lugar se considere popular, pero puede definir un número basado en las circunstancias de su negocio. Por ejemplo, imagine que quiere abrir una discoteca en el área de la bahía y pretende cobrar una entrada que requerirá un mínimo de 500 clientes al día para obtener beneficios. En este ejemplo, puede definir que el número mínimo de entidades por clúster sea 500. Puede definir que la distancia de búsqueda sea de unas 0,1 millas, aproximadamente el tamaño de una manzana.

  2. En la herramienta Clustering basado en densidad, introduzca los siguientes parámetros:
    • En Entidades de puntos de entrada, elija Bay Area Gowalla Check-ins.
    • En Entidades de salida, escriba DBSCAN_500.
    • En Método de clustering, elija Distancia definida (DBSCAN).
    • En Entidades mínimas por clúster, escriba 500.
    • En Distancia de búsqueda, escriba 0.1 y elija Millas de agrimensura de EE. UU.

    Parámetros de la herramienta Clustering basado en densidad con el método DBSCAN

  3. Haga clic en Ejecutar.

    La herramienta se ejecuta y la capa de resultados se agrega al mapa.

  4. En el panel Contenido, desactive la capa Recuentos_check_ins.

    Mapa con la capa de resultados DBSCAN

    En el mapa, los puntos de colores representan clústeres densos de puntos de check-in. Los puntos grises representan ruido o cualquier ubicación que no se ajusta a su definición de denso.

    La leyenda proporciona información sobre la simbología:

    Leyenda de la capa DBSCAN

    Clustering basado en densidad puede encontrar cientos de clústeres en un dataset. En lugar de simbolizar cada clúster con un color diferente, se utilizan ocho colores distintos. Los resultados se muestran de manera que los clústeres con colores similares no estén juntos, lo que hace más clara la distinción entre clústeres en el mapa. Los colores no se corresponden con ningún atributo de los datos.

    En el mapa, los clústeres se localizan principalmente en San Francisco y la bahía sur, con algunos clústeres localizados en otros lugares. Cambiará el mapa base y se acercará para obtener más información.

  5. En la cinta, en la pestaña Mapa, en el grupo Capa, haga clic en Mapa base y seleccione Híbrido de imágenes.

    Mapa base Híbrido de imágenes

  6. Acérquese a San Francisco.

    Clústeres de San Francisco

    San Francisco contiene varios clústeres, incluido un clúster azul especialmente grande en el noreste. Este clúster es el centro de San Francisco.

  7. Haga un desplazamiento panorámico hacia el noreste, cruzando la bahía, hasta que vea Berkeley.

    Clústeres de Berkeley

    Berkeley contiene un clúster único, situado en el centro de la ciudad.

  8. Haga un desplazamiento panorámico hacia el sur de la bahía hasta que vea Palo Alto.

    Clústeres de Palo Alto

    Palo Alto y el área de alrededor contienen algunos clústeres. El centro comercial de Stanford (naranja) y el centro de Palo Alto (rosa) se detectan como clústeres.

  9. Haga un desplazamiento panorámico hasta que vea San José.

    Clústeres de San José

    San José es la ciudad más poblada del área de la bahía, incluso más que San Francisco. Sin embargo, contiene menos clústeres que San Francisco.

  10. En el panel Contenido, haga clic con el botón derecho en Bay Area Gowalla Check-ins y elija Zoom a capa.

    La extensión del mapa vuelve a mostrar toda el Área de la Bahía.

    En conjunto, solo hay algunos clústeres fuera de San Francisco. Una de las limitaciones del método de clustering DBSCAN es que utiliza una distancia fija para determinar la densidad. (cuando ejecutó la herramienta, estableció esta distancia en 0,1 millas). La distancia elegida puede influir considerablemente en los resultados. Aunque una distancia menor podría ser adecuada para áreas como el centro de San Francisco, donde las tiendas y otros puntos de interés están próximos, puede que no sea adecuada para áreas suburbanas o rurales, donde las tiendas están más dispersas.

    Su área de estudio comprende ciudades, suburbios y áreas rurales, por lo que usar una distancia fija única podría no proporcionar los mejores resultados. A continuación, realizará un clustering basado en densidad mediante el método de autoajuste, también llamado HDBSCAN.

    HDBSCAN detecta clústeres en varias distancias de búsqueda, de modo similar a si se ejecutara DBSCAN varias veces. En cada distancia de búsqueda, detecta distintos clústeres en ubicaciones diferentes. Después, DBSCAN intenta fusionar estos clústeres para crear clústeres más grandes que tengan una densidad de puntos similar. Los clústeres resultantes no están definidos por una única distancia de búsqueda.

  11. En el panel de la herramienta Clustering basado en densidad, en Entidades de salida, escriba HDBSCAN_500. En Método de clustering, elija Autoajuste (HDBSCAN).

    Parámetros de la herramienta Clustering basado en densidad con el método HDBSCAN

    La herramienta ya no necesita una distancia de búsqueda.

  12. Haga clic en Ejecutar. Cuando finalice la ejecución de la herramienta (puede tardar unos 10 minutos aproximadamente), desactive la capa DBSCAN_500.

    Mapa con la capa de resultados HDBSCAN

    En comparación con el método DBSCAN, el método HDBSCAN detecta más clústeres. Aparecen clústeres en toda el área de la bahía, incluso en áreas rurales, y algunos de estos clústeres son lo bastante grandes para abarcar ciudades enteras, como los clústeres de Santa Rosa o Vallejo. Aunque estos resultados indican las ubicaciones más populares del área de la bahía, puede que los resultados no sean suficientes para identificar el mejor lugar para abrir un nuevo negocio.

    A continuación, utilizará el tercer método de clustering espacial, escala múltiple (también llamado OPTICS).

    El método OPTICS registra la distancia entre la primera entidad de un dataset (Id. de orden 0) y su vecino más cercano. Esta distancia se denomina distancia de alcanzabilidad. Después, este método registra la distancia de alcanzabilidad entre el vecino más cercano y su vecino más cercano. Este proceso se repite de forma continua hasta que se ha cubierto todo el dataset. No se repite ningún vecino más cercano; si el vecino más cercano de una entidad era también el vecino más cercano de una entidad anterior, se utiliza en su lugar el siguiente vecino más cercano.

    A continuación, el método OPTICS representa gráficamente todas las distancias de alcanzabilidad y busca picos y valles en el gráfico. Un valle, o un grupo de entidades con distancias de alcanzabilidad relativamente pequeñas, es un clúster de puntos próximos entre sí. Una vez que se han representado gráficamente todos los puntos de un clúster, el siguiente punto, que no forma parte del clúster, tendrá una distancia de alcanzabilidad relativamente grande, lo que corresponde a un pico en el gráfico.

    El siguiente diagrama muestra un ejemplo de gráfico de alcanzabilidad y los correspondientes clústeres de puntos:

    Diagrama con el método de clustering OPTICS

    En este ejemplo, todos los puntos azules están próximos entre sí, de modo que entre ellos hay una distancia de alcanzabilidad pequeña. (las líneas rojas representan la distancia de alcanzabilidad de un punto a otro). En el gráfico, estos puntos corresponden al valle azul. A continuación, hay una distancia relativamente grande entre el último punto azul y su siguiente único vecino más cercano, lo que se corresponde con un drástico incremento de la distancia de alcanzabilidad en el gráfico.

    En el valle verde, hay un pico relativamente pequeño en comparación con los dos picos más grandes a cada lado del valle. Según la sensibilidad de clúster del algoritmo OPTICS, este pequeño pico puede dividir el valle en dos o puede seguir considerándose parte del valle.

  13. En el panel Geoprocesamiento, en Entidades de salida, escriba OPTICS_500. En Método de clustering, elija Escala múltiple (OPTICS).

    Parámetros de la herramienta Clustering basado en densidad con el método HDBSCAN

    Este método requiere una distancia de búsqueda. De forma predeterminada, la distancia de búsqueda está configurada con la distancia que utilizó antes, 0,1 millas. Este método tiene también un parámetro opcional, Sensibilidad de clúster. Obtendrá más información sobre este parámetro más adelante. Por ahora, lo dejará vacío.

  14. Haga clic en Ejecutar. Cuando finalice la ejecución de la herramienta, desactive la capa HDBSCAN_500.
    Sugerencia:

    Ahora que ha agregado algunas capas a su mapa, puede resultar útil contraer las leyendas de las capas que no está usando para que sea más fácil encontrarlas en el panel Contenido. Para contraer una leyenda, haga clic en la flecha situada junto al nombre de la capa.

    Mapa con la capa de resultados OPTICS

    Los resultados de este método de clustering son similares a los resultados del método DBSCAN. El método OPTICS es similar al método DBSCAN, pero el método OPTICS tiene en cuenta los clústeres de densidades variables en función de los picos y valles relativos en lugar de las distancias absolutas.

    Lo que el método considera un pico y un valle depende de su sensibilidad de clúster. No definió ninguna sensibilidad de clúster, de modo que la herramienta utiliza un valor de sensibilidad basado en la dispersión estadística de los datos. Visualizará los detalles de la herramienta para ver qué sensibilidad se utilizó.

  15. En la parte inferior del panel Geoprocesamiento, haga clic en Ver detalles.

    Aparece la ventana Clustering basado en densidad con información sobre el valor de sensibilidad de clúster utilizado.

    Parámetros de la herramienta Clustering basado en densidad

    La herramienta utilizó una sensibilidad de clúster de 28. (El valor de sensibilidad es siempre un entero entre 0 y 100). Ejecutará de nuevo la herramienta con distintas sensibilidades de clúster para ver cómo cambian los resultados.

  16. Cierre la ventana Clustering basado en densidad. En el panel de la herramienta Clustering basado en densidad, cambie Entidades de salida a OPTICS_500_Sensibilidad_0 y, en Sensibilidad de clúster, escriba 0.

    Panel Clustering basado en densidad actualizado a sensibilidad de clúster 0

  17. Haga clic en Ejecutar. Cuando finalice la ejecución de la herramienta, desactive OPTICS_500 y acérquese a San Francisco.
    Sugerencia:

    Para ver mejor los clústeres resultantes, en el panel Contenido, desactive Capa de referencia híbrida.

    Resultados de OPTICS con una sensibilidad de 0

    Con esta sensibilidad, los clústeres son relativamente grandes.

  18. En el panel de la herramienta Clustering basado en densidad, cambie Entidades de salida a OPTICS_500_Sensibilidad_100 y cambie Sensibilidad de clúster a 100. Haga clic en Ejecutar.
  19. Cuando finalice la ejecución de la herramienta, desactive la capa OPTICS_500_Sensibilidad_0.

    La capa OPTICS_500_Sensibilidad_0, con una sensibilidad mayor, da como resultado clústeres más pequeños y compactos.

    Resultados de OPTICS con una sensibilidad de 100

    Para su problema, localizar un lugar popular donde abrir un negocio, probablemente resulte más útil usar una sensibilidad mayor. Mientras que una sensibilidad menor puede ayudarle a delinear áreas más amplias de popularidad, una sensibilidad mayor indica lugares donde existen números elevados de check-ins, es decir, donde la gente va realmente.

  20. Desactive la capa OPTICS_500_Sensibilidad_100, active la capa Bay Area Gowalla Check-ins y haga zoom a la extensión completa de los datos. Vuelva a cambiar el mapa base a Topográfico.
  21. Guarde el proyecto.

Ha analizado sus datos espacialmente. Mediante agregación y clustering espacial, ha determinado ubicaciones en las que existen densidades especialmente elevadas de check-ins y ha aprendido algunas formas de ajustar los resultados de su análisis según sus objetivos específicos.

Sus datos tienen otro componente que todavía no ha analizado: el tiempo. A continuación, analizará los datos temporalmente para determinar lugares populares en el área de la bahía.


Analizar los datos temporalmente

Sus datos tienen un componente espacial y temporal. Analizar tendencias espaciales es útil, pero no refleja el espectro completo. Después de todo, los lugares populares pueden cambiar con el tiempo, especialmente en centros urbanos densos donde se abren y cierran nuevas tiendas con frecuencia. Sería mucho mejor abrir su negocio en una ubicación que esté ganando popularidad y no perdiéndola.

Convertir el campo de tiempo

El campo Check-in Time contiene la fecha y la hora en que se creó el check-in. Sin embargo, este campo contiene una cadena de texto concatenada que ArcGIS Pro no reconoce automáticamente como marca de tiempo. Para usar este campo para un análisis temporal, lo convertirá en un formato de campo de datos reconocido.

  1. Si es necesario, abra su proyecto Bay Area Popular Places en ArcGIS Pro.
  2. En el panel Geoprocesamiento, busque y abra la herramienta Convertir campo de tiempo.

    Esta herramienta convierte los valores de hora y fecha de una cadena de texto a un campo de fecha.

  3. En el panel de la herramienta Convertir campo de tiempo, en Tabla de entrada, elija Bay Area Gowalla Check-ins. Para Campo de tiempo de entrada, elija Check-in Time.

    A continuación, definirá el formato de tiempo de entrada (el formato que utiliza actualmente el campo). El formato se escribe con letras para representar las distintas unidades de tiempo, como "y" para el año y "H" para la hora. El formato utilizado en la tabla es yyyy-MM-ddTHH:mm:ssZ, donde "T" y "Z" son constantes que no reflejan ninguna unidad de tiempo.

  4. Para Formato de tiempo de entrada, escriba yyyy-MM-ddTHH:mm:ssZ.
    Sugerencia:

    Para configurar el parámetro, puede escribir el formato o hacer clic en el botón Definir formato y elegir de una lista de formatos. El formato que utiliza el campo Check-in Time no es ninguno de los formatos de la lista, así que, en este ejemplo, es necesario introducir el formato.

    Parámetros de la herramienta Convertir campo de tiempo

    Los demás parámetros se dejarán como están.

  5. Haga clic en Ejecutar.

    Se ejecuta la herramienta.

  6. En el panel Contenido, haga clic con el botón derecho en Bay Area Gowalla Check-ins y haga clic en Tabla de atributos.

    Se ha agregado el campo Check_in_Time_Converted al final de la tabla con los tiempos de check-in convertidos.

    Campo de tiempo de check-in convertido

  7. Cierre la tabla.

Representar gráficamente los datos temporales

Su clase de entidad contiene datos de tiempo que ArcGIS Pro puede procesar y analizar. A continuación, creará un reloj de datos. Un reloj de datos es un tipo de gráfico que resume los datos temporales. Utilizará este gráfico para buscar patrones en los tiempos en los que la gente registró check-ins.

  1. En el panel Contenido, haga clic con el botón derecho en Bay Area Gowalla Check-ins, apunte a Crear gráfico y elija Reloj de datos.

    Tipo de gráfico Reloj de datos en la lista de gráficos

    Aparecen la vista Bay Area Gowalla Check-ins - Data Clock 1 y el panel Propiedades de gráfico. Para crear el gráfico, cambiará los parámetros del panel. Creará un gráfico en el que se visualice el número total de check-ins por año y mes.

  2. En el panel Propiedades de gráfico, en Fecha, elija Check_in_Time_Converted. Confirme que Anillos esté definido como Años, Cuñas esté definido como Meses y Agregación esté definido como Recuento.

    Variable de fecha en el panel Propiedades de gráfico

    Se crea el reloj de datos.

    Gráfico de reloj de datos predeterminado

    En este reloj de datos, cada círculo concéntrico (anillo) representa un año y cada segmento de un círculo (cuña) representa un mes. El color de cada cuña representa el número total de check-ins realizados en ese mes, donde los colores azules más oscuros se corresponden con más check-ins. Las cuñas grises no contienen datos.

    Su reloj de datos tiene dos anillos: 2009 y 2010. Los datos de check-in se recopilaron por primera vez en marzo de 2009 y por última vez en octubre de 2010. Hubo un número bajo de check-ins hasta finales de 2009, cuando el servicio Gowalla recibió más usuarios. Los meses con mayor número de check-ins fueron marzo, abril, agosto y septiembre de 2010.

  3. En el panel Propiedades de gráfico, en Anillos, elija Semanas. En Cuñas, elija Días de la semana.

    El reloj de datos se actualiza.

    Gráfico de reloj de datos con semanas y días de la semana

    El reloj de datos contiene muchos más anillos, pero solo siete cuñas en cada anillo, una por cada día de la semana. Según este reloj de datos, los fines de semana (sábados y domingos) presentan el mayor número de check-ins. Este patrón es lógico, ya que la mayoría de la gente no tiene que trabajar el fin de semana y tiene más tiempo de ocio para visitar lugares.

    En función del tipo de negocio que esté pensando abrir, puede que le interese también la hora del día en que se produjeron los check-ins. Visualizar los datos por horas de todo un año sería difícil, de modo que creará una clase de entidad que solo contenga un subconjunto de los datos y creará un gráfico de este.

  4. En el panel Propiedades de gráfico, cambie Anillos a Años y Cuñas a Meses. En el reloj de datos, pulse Ctrl mientras hace clic en las cuñas de agosto de 2010 y septiembre de 2010 para seleccionarlas.

    Reloj de datos con cuñas de agosto y septiembre de 2010 seleccionadas

    Sugerencia:

    Otra forma de seleccionar varias cuñas es dibujar un cuadro a su alrededor.

    Todos los check-ins realizados en las fechas seleccionadas se seleccionan también en el mapa.

    Check-ins seleccionados en el mapa

    En ArcGIS Pro, cualquier herramienta de geoprocesamiento ejecutada en un dataset se ejecutará solamente en las entidades seleccionadas si se ha realizado una selección. A continuación, copiará las entidades seleccionadas en un nuevo dataset.

  5. Abra el panel Geoprocesamiento y haga clic en el botón Atrás. Busque y abra la herramienta Copiar entidades.
  6. En el panel de la herramienta Copiar entidades, en Entidades de entrada, elija Bay Area Gowalla Check-ins. En Clase de entidad de salida, escriba Check_ins_Ago_Sep_2010.

    Parámetros de la herramienta Copiar entidades

  7. Haga clic en Ejecutar.

    La clase de entidad copiada se agrega al mapa.

  8. En el panel Contenido, haga clic con el botón derecho en Check_ins_Ago_Sep_2010, apunte a Crear gráfico y elija Reloj de datos.

    Se crea un nuevo reloj de datos.

  9. En el panel Propiedades de gráfico, en Fecha, elija Check_in_Time_Converted. En Anillos, elija Días y, en Cuñas, elija Horas.

    El reloj de datos se actualiza automáticamente con 24 cuñas, una por cada hora del día.

    Gráfico de reloj de datos con días y horas

    Poca gente registró check-ins en las primeras horas de la jornada laboral, con recuentos especialmente bajos entre las 6:00 y las 14:00 horas. El mayor volumen de check-ins se produjo entre las 19:00 y las 21:00 horas y entre la 1:00 y las 2:00. Estas tendencias podrían indicar una elevada afluencia de clientes en restaurantes durante las primeras horas de la noche o en discotecas de madrugada.

  10. Cierre el reloj de datos Counts of Check_in_Time_Converted by Hours over Days. En el panel Contenido, haga clic con el botón derecho en Check_ins_Ago_Sep_2010 y seleccione Quitar.

    Para su siguiente análisis, trabajará solamente con los datos de check-in de diciembre de 2009 a septiembre de 2010, los diez meses en los que se produjo un mayor número de check-ins. Al usar este subconjunto de los datos en el siguiente análisis, se eliminarán los registros de cuando la aplicación de redes sociales todavía estaba consiguiendo usuarios. Estos periodos de bajo uso podrían distorsionar los resultados.

  11. En el reloj de datos Counts of Check_in_Time_Converted by Months over Years, pulse Ctrl mientras selecciona los meses de diciembre de 2009 a septiembre de 2010.

    Reloj de datos con meses de diciembre de 2009 a septiembre de 2010 seleccionados

  12. Cierre el reloj de datos. Guarde el proyecto.

Analizar tendencias con un cubo de espacio-tiempo

Los gráficos que ha creado le han ayudado a entender las tendencias en el número de check-ins de todo el dataset. Pero ¿y si quisiera analizar tendencias tanto temporales como espaciales? ¿Qué vecindarios presentan el mayor número de check-ins? ¿Algún vecindario en concreto se está volviendo más o menos popular con el tiempo? La respuesta a estas preguntas puede ser vital a la hora de decidir dónde abrir un nuevo negocio.

Para analizar juntos los elementos espaciales y temporales de sus datos, deberá crear una estructura de datos espaciotemporal (una estructura de datos que tenga en cuenta tanto el espacio como el tiempo). Esta estructura de datos resumirá los puntos de check-in mediante un área fija y un incremento fijo de tiempo.

Utilizará la herramienta Crear cubo de espacio-tiempo para definir una estructura de datos espaciotemporal para sus datos. El dataset resultante se puede interpretar como un cubo porque tiene tres dimensiones: dos de área (x e y) y una tercera de tiempo (t).

  1. En el panel Geoprocesamiento, haga clic en el botón Atrás. Busque Crear cubo de espacio-tiempo.

    La búsqueda devuelve tres resultados para Crear cubo de espacio-tiempo.

    Resultados de búsqueda de Crear cubo de espacio-tiempo

    La herramienta que elija dependerá de sus datos. Sus datos de check-in provienen de una variedad de ubicaciones de puntos en el espacio, así que deberá agregar puntos. Si sus datos se basaran en estaciones u otras ubicaciones con geografías fijas (como cámaras de tráfico o puestos de peaje), crearía un cubo de espacio-tiempo a partir de ubicaciones definidas. Si sus datos provinieran de una capa ráster multidimensional, elegiría la herramienta correspondiente.

  2. Haga clic en Crear cubo de espacio-tiempo agregando puntos.
  3. En Entidades de entrada, elija Bay Area Gowalla Check-ins. En Cubo de espacio-tiempo de salida, escriba CET_check_ins.

    Una vez escrito el nombre de salida, se agrega automáticamente la extensión .nc al final. Esta extensión significa netCDF, el tipo de archivo utilizado en cubos de espacio-tiempo.

  4. En Campo de tiempo, elija Check_in_Time_Converted.

    Parámetros de entrada y salida de la herramienta Crear cubo de espacio-tiempo

    A continuación, elegirá el intervalo de tiempo para agregar puntos o el bin de tiempo. El intervalo de bin de tiempo debe ser adecuado para la escala de tiempo relevante para su análisis. Quiere saber si ha habido alguna tendencia a largo plazo en la popularidad de los vecindarios, así que un bin por horas o días no sería útil. En su lugar, utilizará un intervalo de meses. (Si quisiera abrir un negocio que tuviera una mayor actividad a determinadas horas del día, como una cafetería, quizá le interesaría más un bin por horas para ver qué lugares son más populares a esas horas).

  5. En Intervalo de periodo de tiempo, escriba 1 y elija Meses.

    También elegirá la forma del área para la agregación espacial. Utilizará un área de agregación hexagonal, ya que los hexágonos tienen el mayor número de vecinos espaciales (6) de las formas disponibles. Además, en una cuadrícula hexagonal, todos los hexágonos vecinos están a una distancia constante. Más adelante, definirá vecindarios espaciotemporales por distancia, de modo que los hexágonos tendrán una ventaja sobre una cuadrícula de red (cuadrada), donde algunos vecinos están más lejos que otros.

    Diagrama con vecinos de cuadrícula cuadrada y hexagonal

    Establecerá 1 milla de ancho para estos hexágonos.

  6. En Tipo de forma de agregación, elija Cuadrícula hexagonal. En Intervalo de distancia, escriba 1 y elija Millas de agrimensura de EE. UU.

    Parámetros de intervalos de tiempo y distancia de la herramienta Crear cubo de espacio-tiempo

  7. Haga clic en Ejecutar.

    La herramienta se ejecuta y crea un archivo de cubo de espacio-tiempo. No se agrega ninguna salida al mapa. Para visualizar el cubo de espacio-tiempo, ejecutará otra herramienta.

  8. Haga clic en el botón Atrás. Busque y abra la herramienta Visualizar cubo de espacio-tiempo en 2D.

    Esta herramienta crea una capa 2D basada en un archivo .nc.

  9. En la herramienta Visualizar cubo de espacio-tiempo en 2D, en Cubo de espacio-tiempo de entrada, haga clic en el botón Examinar.

    Botón Examinar

  10. En la ventana Cubo de espacio-tiempo de entrada, abra la carpeta p20. Haga doble clic en CET_check_ins.nc.
  11. Cambie los parámetros siguientes:
    • En Variable de cubo, elija COUNT.
    • En Tema de visualización, elija Tendencias.
    • Marque Habilitar series temporales emergentes.
    • En Entidades de salida, escriba CET_check_ins_2D.

    Parámetros de la herramienta Visualizar cubo de espacio-tiempo en 2D

    Estos parámetros representarán cartográficamente las tendencias de los recuentos mensuales de check-ins. Al habilitar series temporales emergentes, puede ver una serie temporal de cada bin con recuentos en el tiempo.

  12. Haga clic en Ejecutar.

    La herramienta se ejecuta y la capa se agrega al mapa.

  13. En el panel Contenido, desactive la capa Bay Area Gowalla Check-ins. En el mapa, acérquese a San Francisco y haga clic en un bin hexagonal morado.

    Serie temporal emergente

    La ventana emergente contiene un gráfico de serie temporal que muestra el número de check-ins en el tiempo en esa ubicación. Si bien hay algunos descensos en el tiempo, en general hay una fuerte tendencia al alza en los bins morados.

    Los números del eje vertical del gráfico de serie temporal indican el número de check-ins. El hexágono de la imagen de ejemplo ha variado de 160 check-ins al mes a unos 360.

  14. Haga clic en un hexágono verde.

    Gráfico de serie temporal de un hexágono con una tendencia a la baja

    Los hexágonos verdes son aquellos en los que se detectó una tendencia a la baja. Muchos de estos hexágonos tienen bajos recuentos de check-ins en general. En la imagen de ejemplo, el área experimentó una disminución de un nivel alto de más de 900 check-ins a un nivel bajo de menos de 600. Aunque la tendencia es decreciente, incluso los valores más bajos de esta área son mayores que los valores máximos del área donde la tendencia era creciente.

    Los hexágonos blancos son áreas en las que no se detectó ninguna tendencia, ya sea al alza o a la baja. Estos hexágonos pueden tener números estables de check-ins al mes o números muy erráticos.

  15. Cierre la ventana emergente y vuelva a la extensión completa de los datos.

    Cuando analizó los datos espacialmente, descubrió que el centro de San Francisco era el área más popular. Sin embargo, una gran parte del centro de San Francisco no muestra ninguna tendencia al alza ni a la baja en cuanto a la popularidad. Por otro lado, las áreas de San José y el Este de la Bahía están ganando popularidad. Puede ser aconsejable considerar estas áreas como lugares para abrir su negocio.

    A continuación, visualizará el cubo de espacio-tiempo en 3D, lo que permitirá ver con más facilidad los cambios en el tiempo en el mapa. (El tiempo es la tercera dimensión en un cubo de espacio-tiempo). Primero, insertará una nueva escena.

  16. En la cinta, en la pestaña Insertar, en el grupo Proyecto, haga clic en la flecha desplegable Nuevo mapa y elija Nueva escena local.

    Opción Nueva escena local

    Se agrega una vista de escena al proyecto.

  17. En el panel Geoprocesamiento, haga clic en el botón Atrás. Busque y abra la herramienta Visualizar cubo de espacio-tiempo en 3D.
  18. En la herramienta Visualizar cubo de espacio-tiempo en 3D, cambie los siguientes parámetros:
    • En Cubo de espacio-tiempo de entrada, busque el archivo CET_check_ins.nc.
    • En Variable de cubo, elija COUNT.
    • En Tema de visualización, elija Valor.
    • En Entidades de salida, escriba CET_check_ins_3D.

    Parámetros de la herramienta Visualizar cubo de espacio-tiempo en 3D

  19. Haga clic en Ejecutar.

    La herramienta se ejecuta y la capa de resultados se agrega a la escena.

  20. Use las funciones de desplazamiento panorámico, zoom e inclinación de la escena para explorar los resultados.
    Sugerencia:

    Para inclinar, pulse V y arrastre el mapa. Para desplazar, pulse C y arrastre el mapa.

    Visualización del cubo de espacio-tiempo en 3D

    En esta visualización, cada bin hexagonal tiene una altura compuesta de segmentos, donde cada segmento corresponde a un mes distinto. El color de cada segmento indica el número de check-ins realizados en esa área durante ese mes.

    A diferencia de la visualización en 2D, cada segmento está simbolizado por el recuento total de check-ins, no por tendencias al alza o a la baja. Como vio en su análisis espacial, el centro de San Francisco presenta el mayor recuento de check-ins, aunque no sea un área que esté ganando popularidad. La mayoría de bins de otras ubicaciones tienen pocos check-ins y están simbolizados con el color blanco.

  21. Guarde el proyecto.

Detectar clústeres temporales

A continuación, detectará clústeres temporales de check-ins en su cubo de espacio-tiempo. El clustering temporal se asemeja al clustering espacial en que identifica ubicaciones con entidades densamente agrupadas. La única diferencia es que el clustering temporal agrupa clústeres por proximidad temporal en lugar de por proximidad espacial.

  1. Encima de la escena, haga clic en la pestaña Mapa.

    Pestaña de vista de mapa

    Vuelve a la vista de mapa.

  2. En el panel Geoprocesamiento, haga clic en el botón Atrás. Busque y abra la herramienta Clustering de serie temporal.
  3. En la herramienta Clustering de serie temporal, en Cubo de espacio-tiempo de entrada, busque y seleccione Check_ins_STC.nc. En Variable de análisis, elija COUNT y, en Entidades de salida, escriba Clústeres_temporales_mensuales_de_check_ins.

    También puede agrupar los datos en clústeres por una de las tres características de interés. Más adelante conocerá el resto de características, pero, por ahora, hará clústeres de manera que se agrupen ubicaciones con valores similares en el tiempo.

  4. En Características de interés, elija Valor.

    También puede definir el número de clústeres que crea la herramienta. Si se deja sin cambios, la herramienta utilizará un número óptimo basado en los datos. Creará tres clústeres, que corresponderán a grupos de alta, media y baja popularidad.

  5. En Número de clústeres, escriba 3. Marque Habilitar series temporales emergentes.

    También creará una tabla de salida para poder representar gráficamente los resultados.

  6. En Tabla de salida para gráficos, escriba Tablas_clustering.

    Parámetros de la herramienta Clustering de serie temporal

  7. Haga clic en Ejecutar. Cuando finalice la ejecución de la herramienta, desactive la capa CET_check_ins_2D.

    Aparece la capa de clústeres en el mapa.

    Mapa con clústeres temporales

    Los bins hexagonales se agrupan en tres clústeres: azul, rojo y verde. Para averiguar qué significan estos clústeres, abrirá el gráfico que ha creado con la herramienta.

  8. En el panel Contenido, en Tablas independientes, haga doble clic en Series temporales medias por clúster. (Es posible que tenga que desplazarse para verlo).

    Opción de gráfico Series temporales medias por clúster

    Aparece el gráfico.

    Gráfico con las series temporales medias por clúster

    Nota:

    Los colores asignados a cada bin se asignan aleatoriamente y el suyo puede diferir de las imágenes de ejemplo. Independientemente del color, los números son los mismos y los datos cuentan la misma historia.

    En el gráfico Series temporales medias por clústeres mostrado anteriormente, los hexágonos azules son ubicaciones que históricamente tienen pocos check-ins. (Todos han tenido al menos un check-in o no se incluirían en absoluto). Los hexágonos verdes son ubicaciones con más check-ins; aunque los recuentos de check-in son elevados, el número de check-ins fluctúa significativamente de mes a mes. En el mapa, solo se identificó un hexágono verde (en el centro de San Francisco). Estas fluctuaciones pueden deberse a las variaciones estacionales del turismo. El clúster rojo contiene ubicaciones del centro que puede frecuentar la población local, lo que da lugar a una popularidad relativamente uniforme durante todo el año.

  9. En el mapa, acerque el centro de San Francisco y haga clic en el hexágono verde.
    Nota:

    El color del hexágono puede diferir en su pantalla. Haga clic en el hexágono de color diferente al de los que lo rodean.

    Hexágono verde en San Francisco

    La ventana emergente muestra el gráfico de series temporales de esa ubicación. La línea verde de puntos muestra el promedio de check-ins de los hexágonos del clúster verde.

  10. Cierre la ventana emergente y el gráfico.

    Ha identificado clústeres de ubicaciones con cantidades similares de check-ins en el tiempo. También puede identificar clústeres de áreas con tendencias temporales similares. Por ejemplo, imaginemos que dos áreas presentan aumentos y disminuciones similares de check-ins en el tiempo por los cambios estacionales del turismo. Sin embargo, una de estas áreas tiene un número total de check-ins considerablemente mayor que la otra. Al agrupar en clústeres según el valor, estas áreas no se agrupan en el mismo clúster. pero al agrupar en clústeres según el perfil, sí lo hacen.

    El clustering de ubicaciones por perfil es útil para empresas cuyo grupo objetivo sea una multitud estacional específica. El clustering por perfil se puede realizar mediante dos métodos. Utilizará el método de clustering de series temporales basado en la familia Fourier. El método Fourier identifica áreas con distintos cambios de popularidad durante el año.

  11. En la herramienta Clustering de serie temporal, en Entidades de salida, escriba Clústeres_temporales_mensuales_de_check_ins_Fourier. En Características de interés, elija Perfil (Fourier).

    Puede ignorar determinadas características de sus series temporales al ejecutar la herramienta. Ignorará la característica Rango (en este caso, el recuento de check-ins). De esta forma, identificará ubicaciones con tendencias de popularidad similares, independientemente del número absoluto de check-ins. También dejará que la herramienta determine el número óptimo de clústeres que se crearán.

  12. En Características de serie temporal que ignorar, marque Rango. En Número de clústeres, escriba 3.
  13. Marque Habilitar series temporales emergentes.
  14. En Tabla de salida para gráficos, escriba Tablas_clustering_Fourier.

    Parámetros de la herramienta Clustering de serie temporal con el método Fourier

  15. Haga clic en Ejecutar. Cuando finalice la ejecución de la herramienta, desactive la capa Clústeres_temporales_mensuales_de_check_ins.

    Aparece la capa de clústeres en el mapa.

    Mapa con los resultados del método Fourier

    Hay muchos más hexágonos de cada color cuando se usa Perfil (Fourier).

  16. En el panel Contenido, en Tablas_clustering_Fourier, haga doble clic en Series temporales medias por clúster.

    Gráfico con los resultados del método Fourier

    En este gráfico, el rojo corresponde a hexágonos con más check-ins, especialmente en primavera. El azul corresponde a hexágonos con menos check-ins a lo largo del año y el verde corresponde a hexágonos con check-ins crecientes. Cada tipo de clúster se puede encontrar por toda el área de la bahía, en lugar de estar vinculados a áreas que tienen más check-ins en general (como el centro de San Francisco).

  17. Cierre el gráfico y guarde el proyecto.

Ha analizado tendencias temporales en sus datos para buscar ubicaciones que se están volviendo más populares con el tiempo y ubicaciones con ciclos estacionales de popularidad. Está un paso más cerca de comprender completamente sus datos y poder tomar una decisión informada sobre dónde abrir su nuevo negocio.


Completar el análisis

A lo largo de este tutorial, ha analizado sus datos espacial y temporalmente. En función del método estadístico que elija para detectar clústeres en sus datos, sus resultados pueden variar significativamente. A continuación, combinará sus resultados y tomará una decisión sobre dónde abrir su negocio.

Detectar puntos calientes espaciales y temporales

Su análisis final examinará los datos espacial y temporalmente al mismo tiempo. Con la herramienta Análisis de puntos calientes emergentes (EHSA), clasificará los patrones de su cubo de espacio-tiempo en una de las 17 categorías posibles.

A diferencia del clustering de series temporales, EHSA determina si los vecinos de un bin del cubo de espacio-tiempo contienen un número de check-ins considerablemente mayor (punto caliente) o menor (punto frío) que la media global. Una vez que a todas las ubicaciones del cubo de espacio-tiempo se les ha designado un punto caliente, un punto frío o ninguno de los dos, EHSA examina variaciones en la puntuación z de cada ubicación en el tiempo para determinar si la ubicación es un punto caliente o frío consecutivo, creciente, decreciente o esporádico.

El resultado final tiene en cuenta las variaciones espaciales y temporales de los datos.

  1. Si es necesario, abra su mapa Bay Area Popular Places en ArcGIS Pro.
  2. En el panel Geoprocesamiento, busque y abra la herramienta Análisis de puntos calientes emergentes. Introduzca los siguientes parámetros:
    • En Cubo de espacio-tiempo de entrada, busque y seleccione CET_check_ins.nc.
    • En Variable de análisis, elija COUNT.
    • En Entidades de salida, escriba Puntos_calientes_emergentes_check_ins.
    • En Distancia de vecindad, escriba 1 y elija Millas.

    Parámetros de la herramienta Análisis de puntos calientes emergentes

    En cada ubicación, EHSA examinará cada ubicación vecina a menos de una milla para realizar su análisis. Anteriormente, creó un cubo de espacio-tiempo con una cuadrícula hexagonal, lo que es ideal para el análisis de vecindad porque cada hexágono es equidistante.

  3. Haga clic en Ejecutar. Cuando la herramienta termine, desactive la capa Clústeres_temporales_mensuales_de_check_ins_Fourier.

    Puntos calientes emergentes en el mapa

    Los puntos calientes se localizan en el centro de San Francisco y en varias ciudades más pequeñas al sur de la bahía, como Palo Alto, Mountain View y San José. La mayoría de los puntos calientes del centro de San Francisco son puntos calientes persistentes, es decir, han sido puntos calientes de forma constante en el tiempo. Las demás áreas son principalmente nuevos puntos calientes, lo que significa que han sido puntos calientes solamente al final de la serie temporal, o puntos calientes esporádicos, lo que significa que han sido puntos calientes unas veces sí y otras no.

    Observe que las áreas que se caracterizaban por clústeres de recuentos elevados y medios en el clustering de series temporales se muestran como puntos calientes consecutivos. Implica que la proximidad de estas áreas es mayor que el promedio de check-ins del área de la bahía en la mayoría de periodos de tiempo. Dicho de otro modo, estas áreas fueron más populares que el resto del área de la bahía en la mayoría de periodos de tiempo del cubo de espacio-tiempo. A diferencia de San Francisco, la popularidad de estas áreas parece ir aumentando con el tiempo.

    También puede visualizar los resultados en 3D.

  4. En el panel Contenido, haga clic con el botón derecho en la capa Puntos_calientes_emergentes_check_ins y elija Copiar. Encima del mapa, haga clic en la pestaña Escena para volver a su escena.
  5. En el panel Contenido, haga clic con el botón derecho en Escena y elija Pegar.

    La capa de puntos calientes aparece en la escena.

    El punto caliente emergente da como resultado una escena

    Ahora que ha ejecutado EHSA en su cubo de espacio-tiempo, puede visualizar según los resultados del análisis.

  6. En el panel Geoprocesamiento, haga clic en el botón Atrás. Busque y abra la herramienta Visualizar cubo de espacio-tiempo en 3D e introduzca los siguientes parámetros:
    • En Cubo de espacio-tiempo de entrada, busque y seleccione CET_check_ins.nc.
    • En Variable de cubo, elija COUNT.
    • En Tema de visualización, elija Resultados de puntos calientes y fríos.
    • En Entidades de salida, escriba Puntos_calientes_CET_check_ins.
  7. Haga clic en Ejecutar.
  8. Desactive la capa CET_check_ins_3D. Explore la escena.

    Puntos calientes emergentes en la escena

    En áreas consideradas como nuevos puntos calientes, solo se considera punto caliente el mes más reciente (el bin hexagonal superior de la columna). Los puntos calientes esporádicos alternan entre la condición de ser puntos calientes y de no serlo. En el centro de San Francisco, las áreas son puntos calientes todos los meses, lo que las convierte en puntos calientes persistentes.

  9. Haga clic en la pestaña Mapa para volver a la vista de Mapa.

    Cuando ejecutó EHSA, eligió una distancia de vecindad de 1 milla. Si se cambia la distancia de vecindad, varían también los resultados.

  10. En el panel Geoprocesamiento, haga clic en el botón Atrás. Busque y abra la herramienta Análisis de puntos calientes emergentes e introduzca los siguientes parámetros:
    • En Cubo de espacio-tiempo de entrada, busque y seleccione CET_check_ins.nc.
    • En Variable de análisis, elija COUNT.
    • En Entidades de salida, escriba Puntos_calientes_emergentes_check_ins_5mi.
    • En Distancia de vecindad, escriba 5 y elija Millas de agrimensura de EE. UU.
  11. Haga clic en Ejecutar. Cuando finalice la ejecución de la herramienta, desactive la capa Puntos_calientes_emergentes_check_ins.

    Mapa de puntos calientes con una vecindad de 5 millas

    Si se utiliza un tamaño de vecindad mayor, las áreas más grandes se consideran puntos calientes.

Decidir dónde abrir el negocio

A continuación, determinará la mejor ubicación para abrir su nuevo negocio. Para ello, superpondrá sus clústeres espaciales, clústeres temporales y puntos calientes emergentes. Los criterios sobre cómo combinar estas capas dependerán de cuáles considere que son las condiciones ideales para su negocio.

Primero, seleccionará áreas con clústeres espaciales densos de check-ins. Estas áreas indican un tráfico peatonal elevado, lo que es bueno para un nuevo negocio. Realizó análisis clúster espaciales con tres métodos distintos: DBSCAN, HDBSCAN y OPTICS. De los tres, HDBSCAN resultó el más adecuado para su área de estudio, ya que tuvo en cuenta las diferencias de población entre las ubicaciones urbanas, suburbanas y rurales del área de la bahía.

  1. En la cinta, en la pestaña Mapa, en el grupo Selección, haga clic en Seleccionar por atributos.

    Cuando efectuó los análisis clúster, las capas de resultados incluían el campo de atributo Id. de clúster. En este campo, cualquier entidad con un valor de -1 no era un clúster. Seleccionará todas las áreas que eran clústeres.

  2. En la ventana Seleccionar por atributos, en Filas de entrada, elija HDBSCAN_500. En Expresión, cree la expresión Id. de clúster no es igual a -1.

    Parámetros de cláusula

  3. Haga clic en Aplicar. Desactive la capa Puntos_calientes_emergentes_check_ins_5mi y active la capa HDBSCAN_500.

    Se seleccionan todas las áreas indicadas como clústeres.

    Clústeres seleccionados

    A continuación, quitará la cláusula que acaba de ejecutar y seleccionará ubicaciones que sean puntos calientes nuevos, consecutivos o persistentes.

  4. En la herramienta Seleccionar por atributo, haga clic en Quitar cláusula.

    Botón Quitar cláusula

  5. En Filas de entrada, seleccione Puntos_calientes_emergentes_check_ins.
  6. Cree la expresión Donde Pattern Type COUNT incluye el valor Punto caliente consecutivo, Nuevo punto caliente, Punto caliente persistente.

    Parámetros para seleccionar puntos calientes en la capa EHSA

  7. Haga clic en Aplicar. Desactive la capa HDBSCAN_500 y active la capa Puntos_calientes_emergentes_check_ins.

    Se seleccionan los puntos calientes.

    Puntos calientes seleccionados en el mapa

    A continuación, seleccionará clústeres temporales mensuales que experimenten un aumento del tráfico en una estación específica. En función del tipo de negocio que pretenda abrir, puede que lo ideal sean áreas con más tráfico en distintas estaciones. Para el propósito de este ejercicio, seleccionará áreas con más tráfico en verano.

  8. En la herramienta Seleccionar capa por atributo, borre la expresión. En Filas de entrada, elija Clústeres_temporales_mensuales_de_check_ins_Fourier.

    En esta capa, el clúster temporal que se corresponde con patrones de tráfico elevado en los meses de verano es el clúster verde, que tiene un Id. de 3.

  9. Cree la expresión Id. de clúster de serie temporal es igual a 3.

    Parámetros para seleccionar áreas que son más populares en verano

  10. Haga clic en Aceptar. Desactive la capa Puntos_calientes_emergentes_check_ins y active la capa Clústeres_temporales_mensuales_de_check_ins_Fourier.

    Clústeres seleccionados

    Ha seleccionado áreas según tres criterios. A continuación, creará una capa que contenga solamente bins hexagonales que estén seleccionados en las tres capas (es decir, que cumplen los tres criterios). Puede ajustar, agregar o eliminar criterios, según las necesidades específicas de su negocio. Para el propósito de este ejercicio, tres criterios son suficientes.

  11. En el panel Geoprocesamiento, haga clic en el botón Atrás. Busque y abra la herramienta Intersecar.
    Nota:

    Dependiendo de su versión de ArcGIS Pro, es posible que reciba un mensaje para usar la herramienta Intersecar por pares para una funcionalidad mejorada. En este caso, no puede usar esa herramienta ya que toma un máximo de dos entradas y usted tienes tres.

  12. En Entidades de entrada, elija HDBSCAN_500. En la siguiente fila, elija Puntos_calientes_emergentes_check_ins y, en la siguiente, Clústeres_temporales_mensuales_de_check_ins_Fourier.
    Nota:

    Para elegir más de dos entidades de entrada, debe tener una licencia ArcGIS Pro Advanced.

    Los mensajes aparecen debajo de cada entidad de entrada, lo que explica que estas capas tengan selecciones activas.

  13. En Clase de entidad de salida, escriba Ubicaciones_ideales. En Atributos para unir, elija Solo Id. de entidad.

    Parámetros de la herramienta Intersecar

  14. Haga clic en Ejecutar. Cuando finalice la ejecución de la herramienta, desactive la capa Clústeres_temporales_mensuales_de_check_ins_Fourier.

    Ubicaciones ideales en el mapa

    Las ubicaciones ideales se encuentran en San Francisco, Mountain View y San José.

  15. Acérquese a los distintos puntos del mapa.

    Su análisis ha identificado algunas áreas en San Francisco que serían ubicaciones ideales para abrir un negocio.

    Si bien se han identificado varios puntos en Mountain View, todos ellos se agrupan en torno a una única área: el centro de Mountain View. Si quisiera una alternativa a San Francisco (tal vez porque los costes son demasiado elevados), esta área sería ideal.

  16. Vuelva a la extensión completa de los datos. Guarde el proyecto.

En este tutorial, ha realizado operaciones de ciencia de datos espaciotemporales para identificar lugares populares del área de la bahía de San Francisco en el espacio y el tiempo. Según los resultados, determinó varias ubicaciones ideales para abrir su negocio, así como las ventajas y limitaciones de diversos métodos de agregación espacial y temporal.

Encontrará más tutoriales en la galería de tutoriales.