Die Daten räumlich analysieren
Sie untersuchen und analysieren die Check-In-Daten, um räumliche Trends zu ermitteln.
Öffnen des Projekts
Zunächst laden Sie ein ArcGIS Pro-Projektpaket mit einer Karte der Check-In-Daten herunter und öffnen es. Anschließend machen Sie sich mit den Datenattributen vertraut.
- Laden Sie das Projektpaket Bay Area Popular Places herunter.
- Navigieren Sie auf Ihrem Computer zu dem heruntergeladenen Projektpaket Bay_Area_Popular_Places, und doppelklicken Sie darauf, um es in ArcGIS Pro zu öffnen. Melden Sie sich mit Ihrem lizenzierten ArcGIS- oder ArcGIS Enterprise-Konto an, falls Sie dazu aufgefordert werden.
Hinweis:
Wenn Sie über keinen Zugriff auf ArcGIS Pro oder über kein ArcGIS-Organisationskonto verfügen, informieren Sie sich über die Optionen für den Zugriff auf die Software.
Das Projekt enthält eine Karte mit Punktdaten in der San Francisco Bay Area, der Region um San Francisco. Die Daten wurden mit der Social-Media-Plattform Gowalla erfasst, die zwischen 2007 und 2012 aktiv war. Mit Gowalla konnten die Benutzer bei besuchten Orten "einchecken". Die einzelnen Punkte stellen Orte dar, bei denen ein Gowalla-Benutzer eingecheckt hat.
Beantworten Sie auf Grundlage der Karte die folgenden Fragen:
- Liegen an bestimmten Orten mehr Check-Ins als an anderen vor?
- Wie könnten Sie auf Grundlage dieser Check-Ins die Definition für ein beliebtes Gebiet festlegen?
- Es liegen dichte Daten-Cluster vor. Können Sie durch die reine Betrachtung der Karte viele Erkenntnisse daraus ziehen?
Als Nächstes untersuchen Sie die Attribute der Daten.
- Klicken Sie im Bereich Inhalt mit der rechten Maustaste auf den Layer Bay Area Gowalla Check-ins, und wählen Sie Attributtabelle aus.
Die Tabelle wird angezeigt.
Die Felder User ID und Location ID enthalten eindeutige IDs für Benutzer und Positionen. Ihnen liegt kein Schlüssel für die IDs vor, sodass diese Felder bei der Bestimmung der Beliebtheit nicht von Nutzen sind. Den Feldern Check-in Latitude und Check-in Longitude können Sie die räumlichen Informationen für die Daten entnehmen und dem Feld Check-in Time die zeitlichen Informationen.
- Schließen Sie die Tabelle.
Koordinatensystem ändern
Für die Analyse der räumlichen Beziehungen zwischen Features ist es wichtig, ein Koordinatensystem zu verwenden, das für die Daten geeignet ist. Bei einem projizierten Koordinatensystem wird ein mathematischer Prozess angewendet, durch den die dreidimensionale Welt in eine zweidimensionale Karte umgewandelt wird. Da es nicht möglich ist, eine ideale Transformation zu erzielen, sind alle projizierten Koordinatensysteme auf die eine oder andere Weise verzerrt. Diese Verzerrung wirkt sich nicht nur auf das Aussehen der Karte aus, sondern auch auf die Ergebnisse der räumlichen Analyse.
Um die Verzerrung zu reduzieren und die höchst mögliche Ergebnisgenauigkeit sicherzustellen, projizieren Sie die Daten in ein projiziertes Koordinatensystem, dessen Fokus auf San Francisco und Umgebung liegt. Durch dieses Koordinatensystem sinkt die Verzerrung um San Francisco, während gleichzeitig die Verzerrung in anderen Gebieten steigt. Da jedoch Gebiete außerhalb von San Francisco nicht in Ihrem Interessenbereich liegen, eignet sich dieses Koordinatensystem für Ihre Karte und die Daten.
- Klicken Sie im Menüband auf die Registerkarte Analyse. Klicken Sie in der Gruppe Geoverarbeitung auf Werkzeuge.
Daraufhin wird der Bereich Geoverarbeitung angezeigt.
- Geben Sie in die Suchleiste im Bereich Geoverarbeitung den Begriff Projizieren ein. Klicken Sie in der Ergebnisliste auf das Werkzeug Projizieren, um es zu öffnen.
- Wählen Sie im Werkzeugbereich Projizieren als Eingabe-Dataset oder -Feature-Class den Eintrag Bay Area Gowalla Check-ins aus. Geben Sie für Ausgabe-Dataset oder -Feature-Class den Namen Check_ins_Projected ein.
- Klicken Sie für Ausgabe-Koordinatensystem auf die Schaltfläche Koordinatensystem auswählen.
- Geben Sie im Fenster Koordinatensystem den Suchbegriff San Francisco in das Suchfeld ein, und drücken Sie die Eingabetaste.
- Blenden Sie Projiziertes Koordinatensystem und County Systems ein. Klicken Sie auf NAD 1983 (2011) San Francisco CS13 (US Feet).
- Klicken Sie auf OK. Klicken Sie im Bereich Geoverarbeitung auf Ausführen.
Ein Ausgabe-Layer namens Bay Area Gowalla Check-ins wird der Karte hinzugefügt.
- Klicken Sie im Bereich Inhalt mit der rechten Maustaste auf den zweiten Layer namens Bay Area Gowalla Check-ins (den ursprünglichen), und wählen Sie Entfernen aus.
Der Layer wird entfernt. Obwohl Sie für den Layer eine Projizierung durchgeführt haben, hat sich das Aussehen der Karte nicht geändert. In der Karte wird weiterhin das ursprüngliche projizierte Koordinatensystem verwendet, dessen Fokus auf den gesamten USA liegt. Dadurch ist Kalifornien, das am Rand der Vereinigten Staaten liegt, mit einer gewissen Verzerrung dargestellt. Sie aktualisieren auch die Kartenprojektion.
- Doppelklicken Sie im Bereich Inhalt auf Karte.
Das Fenster Karteneigenschaften wird angezeigt.
- Klicken Sie im Fenster Karteneigenschaften auf die Registerkarte Koordinatensysteme. Suchen Sie nach San Francisco. Blenden Sie County Systems ein, und wählen Sie das Koordinatensystem NAD 1983 (2011) San Francisco CS13 (US Feet) aus.
- Klicken Sie auf OK.
Die Karte wird entsprechend geändert, sodass das ausgewählte Koordinatensystem verwendet wird.
Check-Ins aggregieren
Durch die reine Betrachtung ist es schwer zu sagen, welche Gebiete sich großer Beliebtheit erfreuen, da fast alle bewohnten Orte in der San Francisco Bay Area mit Check-In-Punkten bedeckt sind. Um aussagekräftige Einblicke zu erhalten, zählen Sie die Check-Ins in den einzelnen Gebiete. Sie erstellen ein Gitternetz aus Hexagonabschnitten, die die San Francisco Bay Area abdecken, und aggregieren damit die Check-Ins. Als Nächstes symbolisieren Sie den Ergebnis-Layer, um zu ermitteln, welche Gebiete die meisten Check-Ins aufweisen.
- Klicken Sie im Bereich Geoverarbeitung auf die Schaltfläche Zurück.
- Suchen Sie nach dem Werkzeug Mosaik generieren und öffnen Sie es.
Das Werkzeug erstellt ein Gitternetz aus regelmäßigen Polygon-Features, z. B. aus Hexagonen, Quadraten oder Dreiecken, und deckt damit eine angegebene Ausdehnung ab.
- Geben Sie für Ausgabe-Feature-Class den Namen Hexagon_Tessellation ein. Wählen Sie als Ausdehnung den Eintrag Bay Area Gowalla Check-ins aus.
- Geben Sie für Größe den Wert 12 ein, und wählen Sie Quadratmeilen (Britisch) aus. Prüfen Sie, ob für Raumbezug der Bezug NAD_1983_2011_San_Francisco_CS13_ftUS ausgewählt ist.
- Klicken Sie auf Ausführen.
Das Werkzeug wird ausgeführt und ein Hexagongitter der Karte hinzugefügt. (Die Standardsymbolisierung ist zufällig und kann sich vom Beispielbild unterscheiden.)
Als Nächstes ermitteln Sie die Anzahl an Check-Ins in jedem Hexagonabschnitt. Gebiete, in denen keine Check-Ins vorliegen oder keine Daten erfasst wurden, sind für Sie nicht von Interesse. Sie wählen daher als Erstes die Abschnitte aus, die sich mit mindestens einem Check-In überschneiden.
Bei der Ausführung eines Geoverarbeitungswerkzeugs in einem Layer, für den eine aktive Auswahl vorliegt, wie in Ihrem Hexagongitter, werden nur die ausgewählten Features für die Analyse verwendet. Features, die nicht ausgewählt sind, werden nicht in der Analyse berücksichtigt.
- Klicken Sie auf dem Menüband auf die Registerkarte Karte. Klicken Sie in der Gruppe Auswahl auf Lagebezogen auswählen.
Das Fenster Layer lagebezogen auswählen wird geöffnet.
- Geben Sie im Fenster Lagebezogen auswählen die folgenden Parameter ein:
- Vergewissern Sie sich, dass für Eingabe-Features der Eintrag Hexagon_Tessellation ausgewählt ist.
- Vergewissern Sie sich, dass für Beziehung die Option Überschneiden (Intersect) ausgewählt ist.
- Wählen Sie als Auswahl-Features den Eintrag Bay Area Gowalla Check-ins aus.
- Klicken Sie auf OK. Deaktivieren Sie im Bereich Inhalt den Layer Bay Area Gowalla Check-ins, um ihn auszublenden.
Auf der Karte werden Hexagonabschnitte, die mindestens einen Check-In überschneiden, ausgewählt.
Als Nächstes verbinden Sie die Check-In-Features mit den ausgewählten Hexagonen. Durch die Verbindung wird dem Hexagongitter ein Attributfeld hinzugefügt, in dem die Anzahl an Check-Ins pro Hexagon enthalten ist.
- Klicken Sie im Bereich Geoverarbeitung auf die Schaltfläche Zurück. Navigieren Sie zum Werkzeug Räumliche Verbindung, und öffnen Sie es.
- Geben Sie im Werkzeug Räumliche Verbindung die folgenden Parameter ein:
- Wählen Sie unter Ziel-Features den Eintrag Hexagon_Tessellation aus.
- Wählen Sie als Verbindungs-Features den Eintrag Bay Area Gowalla Check-ins aus.
- Geben Sie für Ausgabe-Feature-Class den Namen Check_in_Counts ein.
- Klicken Sie auf Ausführen.
Das Werkzeug wird ausgeführt und ein neuer Layer, der nur die ausgewählten Hexagonabschnitte enthält, der Karte hinzugefügt. Die Anzahl an Check-Ins pro Abschnitt ist in einem Attributfeld des Layers enthalten. Zur Visualisierung der Anzahlwerte auf der Karte ändern Sie die Layer-Symbolisierung.
- Klicken Sie im Bereich Inhalt mit der rechten Maustaste auf Hexagon_Tessellation, und wählen Sie Entfernen aus. Deaktivieren Sie den Layer Bay Area Gowalla Check-ins.
- Klicken Sie mit der rechten Maustaste auf Check_in_Counts, und klicken Sie auf Symbolisierung.
Der Bereich Symbolisierung wird angezeigt.
- Wählen Sie im Bereich Symbolisierung für Primäre Symbolisierung den Eintrag Abgestufte Farben aus.
- Wählen Sie für Klassen den Wert 10. Wählen Sie unter Farbschema die Option Cyan zu Violett aus.
Die Symbolisierung wird auf die Karte angewendet.
Die pinkfarbenen Hexagonabschnitte auf der Karte weisen eine höhere Anzahl an Check-Ins auf, wohingegen die blauen Hexagonabschnitte eine niedrigere Anzahl aufweisen. Die Abschnitte mit einer höheren Anzahl an Check-Ins liegen tendenziell in der Nähe von San Francisco und San Jose, den größten Städten der Region.
- Schließen Sie den Bereich Symbolisierung. Klicken Sie auf der Symbolleiste für den Schnellzugriff auf die Schaltfläche Speichern.
Hinweis:
Möglicherweise werden Sie in einer Meldung gewarnt, dass Sie nach dem Speichern der Projektdatei in der aktuellen ArcGIS Pro-Version die Datei nicht mehr in einer früheren Version öffnen können. Wenn diese Meldung angezeigt wird, klicken Sie auf Ja, um fortzufahren.
Die Signifikanz der Aggregationen quantifizieren
Die aggregierten Check-Ins weisen einige Muster auf. Handelt es sich dabei um statistisch signifikante Muster, oder sind sie durch zufällige Varianzen bzw. Stichprobenfehler entstanden? Um dies herauszufinden, quantifizieren Sie die statistische Signifikanz der aggregierten Check-Ins. Mithilfe der Global Morans I-Statistik testen Sie, ob die Muster in den Ergebnissen geclustert, gestreut oder zufällig sind.
Durch Global Morans I werden die räumlichen Muster eines Attributs quantifiziert. Da die ursprünglichen Check-In-Daten keine Attribute aufweisen, mit denen Sie die Dichte der Check-Ins bestimmen können, mussten die Check-Ins aggregiert werden, bevor die Erstellung der Statistik möglich war. Die Hexagonabschnitte weisen das Feld Join_Count auf, das für die Quantifizierung durch Global Morans I verwendet werden kann.
Hinweis:
Weitere Informationen zu dem mathematischen Verfahren, das Global Morans I zugrunde liegt, finden Sie unter Funktionsweise von räumlicher Autokorrelation (Global Morans I).
- Klicken Sie im Bereich Geoverarbeitung auf die Schaltfläche Zurück. Navigieren Sie zum Werkzeug Räumliche Autokorrelation (Global Morans I).
- Wählen Sie im Werkzeug Räumliche Autokorrelation (Global Morans I) für Eingabe-Feature-Class den Eintrag Check_in_Counts und für Eingabefeld das Feld Join_Count aus.
- Aktivieren Sie Bericht erstellen.
- Klicken Sie auf Ausführen.
Das Werkzeug wird ausgeführt, jedoch wird kein Layer der Karte hinzugefügt. Stattdessen wird eine Berichtsdatei erstellt. Den Pfad zu der Datei finden Sie in den Informationen zum Werkzeug.
- Klicken Sie am unteren Rand des Bereichs Geoverarbeitung auf Details anzeigen.
Das Fenster Räumliche Autokorrelation (Global Morans I) wird angezeigt. In dem Fenster sind die Ausführungszeit des Werkzeugs, die bei der Ausführung verwendeten Parameter und ggf. Warnmeldungen aufgeführt.
- Klicken Sie im Fenster Räumliche Autokorrelation (Global Morans I) auf die Registerkarte Parameter. Klicken Sie für Berichtsdatei auf den Pfad zur Berichtsdatei.
Die Berichtsdatei wird in einer neuen Browser-Registerkarte angezeigt.
Der Bericht enthält den Morans-Index, den Z-Wert und den p-Wert. Von diesen Werten hat der Z-Wert die größte Bedeutung bei der Bestimmung der statistischen Signifikanz.
Der Z-Wert gibt für einen Wert die Anzahl an Standardabweichungen vom Durchschnittswert an. Ein positiver Z-Wert bedeutet Werte über dem Durchschnitt, wohingegen ein negativer Z-Wert für Werte unter dem Durchschnitt steht. In diesem Fall entspricht der gemessene Wert der Anzahl an räumlichen Autokorrelationen, die zwischen den Features in Ihrem Dataset vorliegen.
Für Ihre Daten haben Sie einen Z-Wert über 7 erhalten. In Ihren Daten liegt also eine signifikant höhere Anzahl an räumlichen Autokorrelationen vor, als dies bei einer hypothetischen Sammlung von zufällig verteilten Daten der Fall wäre. Der Bericht umfasst ebenfalls ein Diagramm, in dem der Z-Wert am rechten äußeren Ende einer Glockenkurve dargestellt ist. Das Diagramm ist ein Hinweis dafür, dass die Verteilung Ihrer Daten statistisch signifikant ist und die Daten geclustert sind (d. h., dass ähnliche Datenwerte näher beieinander liegen).
- Schließen Sie den Bericht. Schließen Sie in ArcGIS Pro das Fenster Räumliche Autokorrelation (Global Morans I).
Räumliche Cluster erkennen
Durch die Aggregation der Daten und die Bestimmung der statistischen Signifikanz können Sie nun mit Sicherheit sagen, dass die Check-Ins nicht zufällig verteilt, sondern geclustert sind. Als Nächstes führen Sie eine räumliche Cluster-Analyse durch, um Gebiete mit großer Beliebtheit zu ermitteln.
- Klicken Sie im Bereich Geoverarbeitung auf die Schaltfläche Zurück. Navigieren Sie zum Werkzeug Dichte-basierte Cluster-Bildung, und öffnen Sie es.
In diesem Werkzeug stehen drei Methoden für das räumliche Clustering zur Verfügung, wobei sich die Definitionen dafür, was als dicht und nicht dicht betrachtet wird, unterscheiden. Sie führen das Werkzeug dreimal aus, je ein Durchgang pro Methode, sodass Sie die Vor- und Nachteile der einzelnen Methoden abwägen können.
Zunächst verwenden Sie die Methode "Definierte Entfernung", die auch DBSCAN genannt wird. Dabei handelt es sich um die einfachste Methode für die Dichte-basierte Cluster-Bildung. Bei dieser Methode ist Dichte dadurch definiert, dass in einer bestimmten Entfernung eine bestimmte Anzahl an Punkten vorliegt. An jedem Punkt wird geprüft, ob der Punkt in einer festgelegten Suchentfernung die Mindestanzahl an Features aufweist. Erfüllt ein Punkt dieses Kriterium, wird er als geclusterter Punkt markiert. Zur Ausführung des Werkzeugs müssen Sie die minimale Anzahl an Features angeben. Sie können auch die Suchentfernung festlegen. Wenn Sie keine Angabe machen, wird vom Werkzeug ein optimierter Wert verwendet.
Die minimale Anzahl an Features pro Cluster hängt von Ihren Daten und der Problemstellung ab. Hier möchten Sie beliebte Orte in der San Francisco Bay Area bestimmen. Zwar können Sie keine genaue Anzahl an Check-Ins angeben, ab der ein Ort beliebt ist, doch können Sie die Anzahl entsprechend Ihren Unternehmensanforderungen festlegen. Nehmen Sie beispielsweise an, dass Sie eine Diskothek in der San Francisco Bay Area eröffnen möchten. Bei dem angesetzten Eintrittspreis benötigen Sie mindestens 500 Kunden pro Tag, um einen Gewinn zu erzielen. In diesem Beispiel können Sie also die minimale Anzahl an Features pro Cluster auf 500 festlegen. Sie können die Suchentfernung auf etwa 0,1 Meilen (160 Meter) festlegen, da dies der Größe eines Gebäudeblocks entspricht.
- Geben Sie im Werkzeug Dichte-basierte Cluster-Bildung die folgenden Parameter ein:
- Wählen Sie als Eingabe-Punkt-Features den Eintrag Bay Area Gowalla Check-ins aus.
- Geben Sie für Ausgabe-Features den Namen DBSCAN_500 an.
- Wählen Sie als Methode der Cluster-Bildung die Option Definierte Entfernung (DBSCAN) aus.
- Geben Sie für Minimale Anzahl Features pro Cluster den Wert 500 ein.
- Geben Sie als Suchentfernung den Wert 0,1 ein, und wählen Sie Meilen (US Survey) aus.
- Klicken Sie auf Ausführen.
Das Werkzeug wird ausgeführt, und der Ergebnis-Layer wird der Karte hinzugefügt.
- Deaktivieren Sie im Bereich Inhalt den Layer Check_in_Counts.
Die farbigen Punkte auf der Karte stellen dichte Cluster von Check-In-Punkten dar. Die grauen Punkte stellen Rauschen dar bzw. Positionen, die nicht der angegebenen Dichtedefinition entsprechen.
Die Legende gibt Aufschluss über die Symbolisierung:
Mit der Dichte-basierten Cluster-Bildung können Hunderte von Clustern in einem Dataset gefunden werden. Anstatt jedes Cluster mit einer anderen Farbe zu symbolisieren, werden acht verschiedene Farben verwendet. Die Ergebnisse werden so angezeigt, dass Cluster mit ähnlichen Farben nicht beieinander liegen, damit die Unterscheidung der Cluster auf der Karte einfacher ist. Die Farben entsprechen keinem Attribut in den Daten.
Die Cluster auf der Karte befinden sich hauptsächlich in San Francisco und im Süden der Bucht. Einige wenige Cluster befinden sich auch an anderen Orten. Sie ändern die Grundkarte und vergrößern die Ansicht, um mehr herauszufinden.
- Klicken Sie auf dem Menüband auf der Registerkarte Karte in der Gruppe Layer auf Grundkarte, und wählen Sie Imagery Hybrid aus.
- Zoomen Sie auf San Francisco.
San Francisco enthält mehrere Cluster, darunter ein besonders großes Cluster im Nordosten. Bei diesem Cluster handelt es sich um die Innenstadt von San Francisco.
- Schwenken Sie nach Nordosten über die Bucht hinaus, bis Sie Berkeley sehen.
Berkeley enthält ein einzelnes Cluster, das sich im Stadtzentrum befindet.
- Schwenken Sie nach Süden, bis Sie Palo Alto sehen.
Palo Alto und Umland enthalten einige Cluster. Das Einkaufszentrum Stanford (orange) und die Innenstadt von Palo Alto (pink) wurden als Cluster erkannt.
- Schwenken Sie nach Südosten, bis Sie San Jose sehen.
San Jose ist die bevölkerungsreichste Stadt in der Bay Area und hat damit sogar mehr Einwohner als San Francisco. Jedoch sind weniger Cluster als in San Francisco vorhanden.
- Klicken Sie im Bereich Inhalt mit der rechten Maustaste auf den Layer Bay Area Gowalla Check-ins, und wählen Sie Auf Layer zoomen aus.
Als Kartenausdehnung wird nun wieder die gesamte Bay Area angezeigt.
Insgesamt sind nur wenige Cluster außerhalb von San Francisco zu finden. Eine Einschränkung der DBSCAN-Methode besteht darin, dass eine festgelegte Entfernung zur Dichtebestimmung verwendet wird. (Bei der Ausführung des Werkzeugs haben Sie diese Entfernung auf 0,1 Meilen festgelegt.) Die ausgewählte Entfernung kann einen bedeutenden Einfluss auf die Ergebnisse haben. Eine geringe Entfernung mag für kleinere Gebiete wie die Innenstadt von San Francisco geeignet sein, da Geschäfte und andere Points of Interest nah beieinander liegen. Doch für umliegende Vororte oder ländliche Gebiete, wo sich die Geschäfte in größerer Entfernung zueinander befinden, ist sie eher nicht geeignet.
Ihr Untersuchungsgebiet umfasst Städte, Vororte und ländliche Gebiete. Daher erhalten Sie durch die Verwendung einer einzigen, festgelegten Entfernung nicht unbedingt die besten Ergebnisse. Als Nächstes führen Sie die Dichte-basierte Cluster-Bildung mit der Methode "Automatische Anpassung" aus, die auch HDBSCAN genannt wird.
Bei HDBSCAN werden Cluster unter Verwendung mehrerer Suchentfernungen ermittelt, was in etwa mit einer mehrmaligen Ausführung von DBSCAN vergleichbar ist. Für jede Suchentfernung werden andere Cluster an anderen Positionen ermittelt. Wo möglich, führt HDBSCAN diese Cluster zusammen, um größere Cluster mit ähnlicher Punktdichte zu erstellen. Die entstandenen Cluster ergeben sich also nicht nur aus einer einzelnen Suchentfernung.
- Geben Sie im Werkzeugbereich Dichte-basierte Cluster-Bildung den Namen HDBSCAN_500 für Ausgabe-Features ein. Wählen Sie für Methode der Cluster-Bildung die Option Automatische Anpassung (HDBSCAN) aus.
Bei dieser Option ist keine Suchentfernung erforderlich.
- Klicken Sie auf Ausführen. Blenden Sie nach der Ausführung des Werkzeugs (dies kann rund 10 Minuten dauern) den Layer DBSCAN_500 aus.
Im Vergleich zur DBSCAN-Methode werden mit der HDBSCAN-Methode mehr Cluster erkannt. Cluster sind im gesamten Bereich der Bay Area vorhanden, auch in den ländlichen Gegenden. Einige der Cluster bedecken sogar ganze Städte, z. B. die Cluster in Santa Rosa oder Vallejo. Obwohl diese Ergebnisse auf weitere beliebte Orte in der Bay Area hinweisen, reichen sie möglicherweise nicht aus, um den besten Standort für ein neues Unternehmen zu bestimmen.
Als Nächstes verwenden Sie die dritte Methode für das räumliche Clustering: Mehrere Maßstäbe (auch OPTICS genannt).
Die OPTICS-Methode erfasst die Entfernung zwischen dem ersten Feature in einem Dataset (Reihenfolge-ID 0) und dem nächsten Nachbarn. Diese Entfernung wird als die Erreichbarkeitsentfernung bezeichnet. Anschließend erfasst die Methode die Erreichbarkeitsentfernung zwischen dem bereits ermittelten nächsten Nachbarn und dessen nächsten Nachbarn. Dieser Vorgang wird solange wiederholt, bis das gesamte Dataset abgedeckt ist. Keiner der nächsten Nachbarn wird mehrmals erfasst. Wenn der nächste Nachbar eines Features gleichzeitig der nächste Nachbar eines zuvor erfassten Features ist, wird stattdessen der übernächste Nachbar verwendet.
Anschließend stellt die OPTICS-Methode alle Erreichbarkeitsentfernungen in einem Diagramm dar und ermittelt, falls vorhanden, Spitzen und Tiefpunkte. Ein Tiefpunkt ist eine Gruppe von Features mit relativ niedrigen Erreichbarkeitsentfernungen und ist somit ein Cluster aus Punkten, die nah beieinander liegen. Sind alle Punkte eines Clusters im Diagramm dargestellt, ist zu erkennen, dass der nächste Punkt, der nicht mehr Teil des Clusters ist, eine relativ hohe Erreichbarkeitsentfernung aufweist und einer Spitze im Diagramm entspricht.
Das folgende Diagramm stellt ein beispielhaftes Erreichbarkeitsdiagramm und das zugehörige Punkt-Cluster dar:
In diesem Beispiel liegen alle blauen Punkte nah beieinander, was bedeutet, dass die Erreichbarkeitsentfernung zwischen ihnen gering ist. (Die roten Linien geben die Erreichbarkeitsentfernung von Punkt zu Punkt an.) Im Diagramm entsprechen diese Punkte dem blauen Tiefpunkt. Weiterhin ist zwischen dem letzten blauen Punkt und dessen eindeutig nächsten Nachbarn eine relativ große Entfernung festzustellen. Im Diagramm entspricht dies einer starken Zunahme der Erreichbarkeitsentfernung.
Innerhalb des grünen Tiefpunktes liegt eine Spitze, die sich im Vergleich zu den Spitzen rechts und links vom Tiefpunkt relativ klein ausnimmt. Hierbei bestimmt die Cluster-Empfindlichkeit des OPTICS-Algorithmus, ob der Tiefpunkt aufgrund dieser kleinen Spitze aufgeteilt wird oder ob sie als Teil des Tiefpunktes betrachtet wird.
- Geben Sie im Bereich Geoverarbeitung den Namen OPTICS_500 für Ausgabe-Features ein. Wählen Sie für Methode der Cluster-Bildung die Option Mehrere Maßstäbe (OPTICS) aus.
Für diese Methode ist eine Suchentfernung erforderlich. Standardmäßig wird die Suchentfernung auf die zuvor verwendete Entfernung von 0,1 Meilen festgelegt. Diese Methode weist außerdem den optionalen Parameter Cluster-Empfindlichkeit auf. Später werden Sie mehr über diesen Parameter erfahren. Lassen Sie ihn zunächst leer.
- Klicken Sie auf Ausführen. Blenden Sie nach der Werkzeugausführung den Layer HDBSCAN_500 aus.
Tipp:
Da Sie der Karte bereits einige Layer hinzugefügt haben, bietet es sich an, die Legenden der nicht verwendeten Layer auszublenden, um einen besseren Überblick über den Bereich Inhalt zu haben. Klicken Sie zum Ausblenden einer Legende auf den Pfeil neben dem Layer-Namen.
Die Ergebnisse dieser Cluster-Bildungsmethode ähneln den Ergebnissen der DBSCAN-Methode, da die OPTICS-Methode der DBSCAN-Methode in der Tat ähnelt. Jedoch basieren die von der OPTICS-Methode ermittelten Cluster mit verschiedenen Dichten nicht auf absoluten Entfernungen, sondern auf relativen Spitzen und Tiefpunkten.
Die ermittelten Spitzen und Tiefpunkte wiederum hängen von der Cluster-Empfindlichkeit ab. Da Sie keine Cluster-Empfindlichkeit festgelegt haben, verwendet das Werkzeug einen Empfindlichkeitswert, der auf der statistischen Streuung der Daten beruht. Sie zeigen die Werkzeugdetails an, um die verwendete Empfindlichkeit zu überprüfen.
- Klicken Sie am unteren Rand des Bereichs Geoverarbeitung auf Details anzeigen.
Das Fenster Dichte-basierte Cluster-Bildung mit Informationen zum verwendeten Cluster-Empfindlichkeitswert wird angezeigt.
Vom Werkzeug wurde eine Empfindlichkeit von 28 verwendet. (Der Empfindlichkeitswert ist immer eine ganze Zahl zwischen 0 und 100.) Sie führen das Werkzeug mit verschiedenen Werten für die Cluster-Empfindlichkeit aus, um zu sehen, wie sich die Ergebnisse ändern.
- Schließen Sie das Fenster Dichte-basierte Cluster-Bildung. Ändern Sie im Werkzeugbereich Dichte-basierte Cluster-Bildung den Parameter Ausgabe-Features zu OPTICS_500_Sensitivity_0, und geben Sie für Cluster-Empfindlichkeit den Wert 0 ein.
- Klicken Sie auf Ausführen. Blenden Sie den Layer OPTICS_500 nach der Werkzeugausführung aus, und zoomen Sie auf San Francisco.
Tipp:
Deaktivieren Sie zur besseren Ansicht der Ergebnis-Cluster den Eintrag Hybrid Reference Layer im Bereich Inhalt.
Bei dieser Empfindlichkeit sind die Cluster relativ groß.
- Ändern Sie im Werkzeugbereich Dichte-basierte Cluster-Bildung den Parameter Ausgabe-Features zu OPTICS_500_Sensitivity_100 und den Parameter Cluster-Empfindlichkeit zu 100. Klicken Sie auf Ausführen.
- Blenden Sie nach der Werkzeugausführung den Layer OPTICS_500_Sensitivity_0 aus.
Mit einem höheren Empfindlichkeitswert weist der Layer OPTICS_500_Sensitivity_0 kleinere, kompaktere Cluster auf.
Bei Ihrer Problemstellung, der Suche nach einem beliebten Ort für ein neues Unternehmen, ist die Verwendung einer höheren Empfindlichkeit wahrscheinlich sinnvoller. Mit einer niedrigeren Empfindlichkeit können größere beliebte Gebiete abgegrenzt werden, wohingegen bei einer höheren Empfindlichkeit Orte mit vielen Check-Ins ermittelt werden – d. h. die Orte, die von den Menschen tatsächlich aufgesucht werden.
- Blenden Sie den Layer OPTICS_500_Sensitivity_100 aus, blenden Sie den Layer Bay Area Gowalla Check-ins ein, und zoomen Sie auf die volle Ausdehnung der Daten. Wechseln Sie zurück zur Grundkarte Topografisch.
- Speichern Sie das Projekt.
Sie haben Ihre Daten räumlich analysiert. Durch Aggregation und räumliches Clustering haben Sie Positionen bestimmt, die besonders hohe Dichten von Check-Ins aufweisen. Zudem haben Sie einige Möglichkeiten kennengelernt, wie Sie die Analyseergebnisse entsprechend Ihren Zielen anpassen können.
Die Daten weisen jedoch noch eine weitere Komponente auf, die bisher keine Beachtung gefunden hat: Zeit. Als Nächstes führen Sie zur Bestimmung von beliebten Orten in der Bay Area eine zeitliche Analyse für die Daten durch.
Die Daten zeitlich analysieren
Die Daten weisen sowohl eine räumliche als auch eine zeitliche Komponente auf. Die Analyse der räumlichen Trends ist von großem Nutzen, doch bildet sie nur einen Teil der Geschichte ab. Denn die Beliebtheit eines Ortes kann sich im Laufe der Zeit ändern, besonders in dicht besiedelten Innenstädten, wo häufig neue Geschäfte geöffnet und andere geschlossen werden. Es ist sehr viel sinnvoller, Ihr Unternehmen in einem Gebiet anzusiedeln, das an Beliebtheit gewinnt, statt in einem Gebiet, das an Beliebtheit verliert.
Das Zeitfeld konvertieren
Das Feld Check-in Time enthält das Datum und die Uhrzeit, zu denen ein Check-In erstellt wurde. Jedoch enthält das Feld eine verkettete Textzeichenfolge, die von ArcGIS Pro nicht automatisch als Zeitstempel erkannt wird. Damit Sie das Feld für die zeitliche Analyse verwenden können, konvertieren Sie es in ein von ArcGIS Pro erkanntes Datenfeldformat.
- Öffnen Sie ggf. das Projekt Bay Area Popular Places in ArcGIS Pro.
- Suchen Sie im Bereich Geoverarbeitung das Werkzeug Zeitfeld konvertieren, und öffnen Sie es.
Mit diesem Werkzeug werden Zeit- und Datumswerte in einer Textzeichenfolge in ein Datumsfeld konvertiert.
- Wählen Sie im Werkzeugbereich Zeitfeld konvertieren für Eingabetabelle den Eintrag Bay Area Gowalla Check-ins aus. Wählen Sie für Eingabe-Zeitfeld den Eintrag Check-in Time aus.
Als Nächstes legen Sie das Eingabe-Zeitformat fest. Dabei handelt es sich um das aktuell vom Feld verwendete Format. Das Format wird mit Buchstaben angegeben, die für die verschiedenen Zeiteinheiten stehen, z. B. "y" für Jahr und "H" für Stunde. Das in der Tabelle verwendete Format ist "yyyy-MM-ddTHH:mm:ssZ", wobei T und Z Konstanten sind, die keine Zeiteinheiten darstellen.
- Geben Sie für Eingabe-Zeitformat das Format yyyy-MM-ddTHH:mm:ssZ ein.
Tipp:
Beim Festlegen des Parameters können Sie das Format manuell eingeben oder auf die Schaltfläche Format festlegen klicken und eine Auswahl aus der Liste von Formaten treffen. Das vom Feld Check-in Time verwendete Format entspricht keinem der aufgeführten Formate, sodass das Format eingegeben werden muss.
Lassen Sie die anderen Parameter unverändert.
- Klicken Sie auf Ausführen.
Das Werkzeug wird ausgeführt.
- Klicken Sie im Bereich Inhalt mit der rechten Maustaste auf Bay Area Gowalla Check-ins, und klicken Sie auf Attributtabelle.
Am Ende der Tabelle wurde das Feld Check_in_Time_Converted mit den konvertierten Check-In-Zeiten hinzugefügt.
- Schließen Sie die Tabelle.
Die Zeitdaten in einem Diagramm darstellen
Die Feature-Class enthält Zeitdaten, die von ArcGIS Pro verarbeitet und analysiert werden können. Als Nächstes erstellen Sie eine Datenuhr. Eine Datenuhr ist ein Diagrammtyp, der eine Zusammenfassung der Zeitdaten zeigt. Anhand dieses Diagramms suchen Sie nach Mustern in den Check-In-Zeiten der Benutzer.
- Klicken Sie im Bereich Inhalt mit der rechten Maustaste auf Bay Area Gowalla Check-ins, zeigen Sie auf Diagramm erstellen, und wählen Sie Datenuhr aus.
Die Ansicht Bay Area Gowalla Check-ins - Datenuhr 1 und der Bereich Diagrammeigenschaften werden angezeigt. Im Rahmen der Diagrammerstellung ändern Sie die Parameter im Bereich. Sie erstellen ein Diagramm, in dem die Gesamtzahl an Check-Ins nach Jahr und Monat visualisiert wird.
- Wählen Sie im Bereich Diagrammeigenschaften für Datum den Eintrag Check_in_Time_Converted aus. Überprüfen Sie, ob Ringe auf Jahre festgelegt ist, Keile auf Monate und Aggregation auf Anzahl.
Die Datenuhr wird erstellt.
In dieser Datenuhr steht jeder konzentrische Kreis (Ring) für ein Jahr, während die Kreissegmente (Keile) für die Monate stehen. Die Farbe der einzelnen Keile entspricht der Gesamtzahl an Check-Ins in einem Monat. Je dunkler das Blau, desto mehr Check-Ins liegen vor. Für Keile in grau liegen keine Daten vor.
Die Datenuhr weist zwei Ringe auf: 2009 und 2010. Der erste Check-In wurde im März 2009 erfasst und der letzte im Oktober 2010. Bis Ende 2009 ist die Anzahl an Check-Ins gering, dann nahm jedoch die Zahl der Benutzer des Gowalla-Service zu. In den Monaten März, April, August und September des Jahres 2010 lag jeweils die höchste Anzahl an Check-Ins vor.
- Wählen Sie im Bereich Diagrammeigenschaften für Ringe die Option Wochen aus. Wählen Sie für Keile die Option Tage aus.
Die Datenuhr wird aktualisiert.
Die Datenuhr enthält bedeutend mehr Ringe, doch nur sieben Keile pro Ring, da sie die Wochentage darstellen. Auf Grundlage dieser Datenuhr kann festgestellt werden, dass an den Wochenenden (samstags und sonntags) die höchste Anzahl an Check-Ins vorliegt. Dieses Muster ergibt Sinn, da die meisten Menschen am Wochenende nicht arbeiten müssen und somit mehr Zeit für Freizeitausflüge haben.
Je nach dem, welche Art von Unternehmen Sie eröffnen möchten, sind für Sie auch die Tageszeiten der Check-Ins relevant. Da sich die Visualisierung von stündlichen Daten für ein komplettes Jahr schwierig gestaltet, erstellen Sie eine Feature-Class, die nur eine Teilmenge der Daten enthält. Daraus erstellen Sie dann wiederum ein Diagramm.
- Ändern Sie im Bereich Diagrammeigenschaften den Parameter Ringe zu Jahre und Keile zu Monate. Halten Sie in der Datenuhransicht die Strg-Taste gedrückt, während Sie auf die Keile für August und September 2010 klicken, um sie auszuwählen.
Tipp:
Eine Mehrfachauswahl der Keile ist ebenfalls dadurch möglich, dass Sie einen Rahmen um die entsprechenden Keile aufziehen.
Alle Check-Ins im ausgewählten Datumsbereich werden auf der Karte ausgewählt.
Wurde eine Auswahl getroffen, werden Geoverarbeitungswerkzeuge in ArcGIS Pro nur für die ausgewählte Features eines Datasets ausgeführt. Als Nächstes kopieren Sie die ausgewählten Features in ein neues Dataset.
- Öffnen Sie den Bereich Geoverarbeitung, und klicken Sie auf die Schaltfläche Zurück. Navigieren Sie zum Werkzeug Features kopieren, und öffnen Sie es.
- Wählen Sie im Werkzeugbereich Features kopieren für Eingabe-Features den Eintrag Bay Area Gowalla Check-ins aus. Geben Sie für Ausgabe-Feature-Class den Namen Check_ins_Aug_Sep_2010 ein.
- Klicken Sie auf Ausführen.
Die kopierte Feature-Class wird der Karte hinzugefügt.
- Klicken Sie im Bereich Inhalt mit der rechten Maustaste auf Check_ins_Aug_Sep_2010, zeigen Sie auf Diagramm erstellen, und wählen Sie Datenuhr aus.
Eine neue Datenuhr wird erstellt.
- Wählen Sie im Bereich Diagrammeigenschaften für Datum den Eintrag Check_in_Time_Converted aus. Wählen Sie für Ringe die Option Tage und für Keile die Option Stunden aus.
Die Datenuhr wird automatisch mit 24 Keilen aktualisiert, die jeweils für eine Tagesstunde stehen.
Nur wenige Menschen haben in den ersten Stunden der Öffnungszeiten eingecheckt. Besonders niedrig ist die Anzahl an Check-Ins zwischen 06:00 und 14:00 Uhr. Die meisten Check-Ins finden zwischen 19:00 und 21:00 Uhr sowie zwischen 1:00 und 2:00 Uhr statt. Diese Trends weisen auf einen großen Zustrom von Kunden hin, wobei anzunehmen ist, dass es sich abends um Restaurantbesucher handelt und nachts um Nachtclubbesucher.
- Schließen Sie die Datenuhr Anzahl von Check_in_Time_Converted nach Hours über Days. Klicken Sie im Bereich Inhalt mit der rechten Maustaste auf Check_ins_Aug_Sep_2010, und wählen Sie Entfernen aus.
In darauffolgenden Analysen arbeiten Sie nur mit den Check-In-Daten in dem 10-Monats-Zeitraum von Dezember 2009 bis September 2010, der die höchste Anzahl an Check-Ins aufweist. Dadurch werden diejenigen Datensätze entfernt, die erfasst wurden, als die App noch niedrige Benutzerzahlen aufwies. Der Einbezug der Zeiträume, in denen die Plattform weniger genutzt wurde, kann zu einer Verzerrung der Ergebnisse führen.
- Halten Sie in der Ansicht der Datenuhr Counts of Check_in_Time_Converted by Months over Years die Strg-Taste gedrückt, während Sie die Monate von Dezember 2009 bis September 2010 auswählen.
- Schließen Sie die Datenuhr. Speichern Sie das Projekt.
Trends mithilfe eines Raum-Zeit-Würfels analysieren
Anhand der erstellten Diagramme konnten Sie die Anzahl an Check-Ins im gesamten Dataset besser verstehen. Was aber, wenn Sie sowohl räumliche als auch zeitliche Trends analysieren möchten? In welchen Gebieten wurde die höchste Anzahl an Check-Ins verzeichnet? Gewinnen oder verlieren bestimmte Gebiete im Laufe der Zeit an Beliebtheit? Die Beantwortung dieser Fragen ist grundlegend für die Entscheidung, an welchem Standort ein neues Unternehmen angesiedelt werden soll.
Zur gemeinsamen Analyse der räumlichen und zeitlichen Elemente Ihrer Daten müssen Sie eine spatiotemporale Datenstruktur erstellen (eine Struktur, in der sowohl Raum als auch Zeit berücksichtigt werden). Bei dieser Datenstruktur werden die Check-In-Punkte mit einer festen Fläche und einem festen Zeitschritt zusammengefasst.
Mithilfe des Werkzeugs Raum-Zeit-Würfel erstellen definieren Sie eine spatiotemporale Datenstruktur für Ihre Daten. Sie können sich das Ergebnis-Dataset als Würfel vorstellen, da es drei Dimensionen aufweist: die beiden Flächendimensionen (X und Y) und eine dritte Dimension für die Zeit (t).
- Klicken Sie im Bereich Geoverarbeitung auf die Schaltfläche Zurück. Suchen Sie nach Raum-Zeit-Würfel erstellen.
Es werden drei Ergebnisse für Raum-Zeit-Würfel erstellen zurückgegeben.
Sie wählen das Werkzeug in Abhängigkeit von Ihren Daten aus. Die Check-In-Daten basieren auf einer Vielzahl an Punktpositionen im Raum, weshalb Sie eine Punktaggregation durchführen möchten. Würden Ihre Daten stattdessen auf Stationen oder anderen Positionen mit fester Geographie beruhen (z. B. Verkehrsampeln oder Mautstationen), würden Sie einen Raum-Zeit-Würfel aus definierten Positionen erstellen. Würden Ihre Daten aus einem multidimensionalen Raster-Layer stammen, würden Sie das entsprechende Werkzeug auswählen.
- Klicken Sie auf Raum-Zeit-Würfel durch Aggregieren von Punkten erstellen.
- Wählen Sie als Eingabe-Features den Eintrag Bay Area Gowalla Check-ins aus. Geben Sie für Ausgabe-Raum-Zeit-Würfel den Namen Check_ins_STC ein.
Im Anschluss an die Eingabe des Ausgabenamens wird die Erweiterung .nc automatisch an das Ende angehängt. Die Erweiterung steht für netCDF, den von Raum-Zeit-Würfeln verwendeten Dateityp.
- Wählen Sie unter Zeitfeld den Eintrag Check_in_Time_Converted aus.
Als Nächstes wählen Sie das Zeitintervall für die Punktaggregation aus, also den Zeitabschnitt. Das Intervall für den Zeitabschnitt sollte der Zeitskala entsprechen, die für Ihre Analyse relevant ist. Aktuell möchten Sie herausfinden, ob langfristige Trends hinsichtlich der Beliebtheit in den Stadtvierteln bestehen. Daher sind Stunden oder Tage als Abschnittsintervall nicht angemessen. Stattdessen verwenden Sie ein Monatsintervall. (Je nachdem, welche Art von Unternehmen Sie eröffnen möchten, bieten sich auch stündliche Abschnitte an, was z. B. bei einem Café der Fall wäre, da dort zu bestimmten Tageszeiten erhöhte Aktivitäten verzeichnet werden. So kann festgestellt werden, welche Orte zu bestimmten Zeiten beliebter sind.)
- Geben Sie für Zeitschrittintervall den Wert 1 ein, und wählen Sie Monate.
Sie wählen ebenfalls die Form der Fläche für die räumliche Aggregation aus. Sie verwenden eine sechseckige Aggregationsfläche, da Hexagone unter den verfügbaren Formen die höchste Anzahl an räumlichen Nachbarn (6) aufweisen. Außerdem befinden sich in einem Hexagongitter alle benachbarten Hexagone in einer konstanten Entfernung. In einem späteren Schritt ermitteln Sie spatiotemporale Nachbarn nach Entfernung. Aus diesem Grund ist ein Hexagongitter vorteilhafter als ein Quadratgitter, da die Nachbarn in einem Quadratgitter unterschiedliche Entfernungen aufweisen.
Sie legen für die Hexagone eine Breite von einer Meile fest.
- Wählen Sie für Aggregations-Shape-Typ die Option Hexagongitter. Geben Sie für Entfernungsintervall den Wert 1 ein, und wählen Sie Meilen (US Survey) aus.
- Klicken Sie auf Ausführen.
Das Werkzeug wird ausgeführt, und es wird eine Datei mit dem Raum-Zeit-Würfel erstellt. Der Karte werden keine Ausgaben hinzugefügt. Zur Visualisierung des Raum-Zeit-Würfels führen Sie ein weiteres Werkzeug aus.
- Klicken Sie auf die Schaltfläche Zurück. Navigieren Sie zum Werkzeug Raum-Zeit-Würfel in 2D visualisieren, und öffnen Sie es.
Mit diesem Werkzeug wird ein 2D-Layer erstellt, der auf einer .nc-Datei basiert.
- Klicken Sie im Werkzeug Raum-Zeit-Würfel in 2D visualisieren für Eingabe-Raum-Zeit-Würfel auf die Schaltfläche Durchsuchen.
- Öffnen Sie im Fenster Eingabe-Raum-Zeit-Würfel den Ordner p20. Doppelklicken Sie auf Check_ins_STC.nc.
- Ändern Sie die folgenden Parameter:
- Wählen Sie unter Würfel-Variable den Eintrag COUNT aus.
- Wählen Sie für Anzeigedesign den Eintrag Trends aus.
- Aktivieren Sie Zeitserien-Pop-ups aktivieren.
- Geben Sie für Ausgabe-Features den Namen Check_ins_STC_2D an.
Durch diese Parameter werden die Trends als monatliche Anzahl an Check-Ins auf der Karte dargestellt. Indem Sie Zeitserien-Pop-ups aktivieren, können Sie für die einzelnen Abschnitte Zeitserien mit der Anzahl an Check-Ins im Zeitverlauf anzeigen.
- Klicken Sie auf Ausführen.
Das Werkzeug wird ausgeführt und der Layer zur Karte hinzugefügt.
- Blenden Sie im Bereich Inhalt den Layer Bay Area Gowalla Check-ins aus. Zoomen Sie auf der Karte auf San Francisco, und klicken Sie auf einen violetten Hexagonabschnitt.
Das Pop-up enthält ein Zeitseriendiagramm mit der Anzahl an Check-Ins im Zeitverlauf für diese Position. Obwohl im Laufe der Zeit einige Abfälle zu verzeichnen sind, ist im Allgemeinen ein starker Anstieg in den violetten Abschnitten zu erkennen.
Die Anzahl auf der vertikalen Achse des Zeitseriendiagramms steht für die Anzahl an Check-Ins. Für das Hexagon im Beispielbild kann ein Anstieg der monatlichen Check-Ins von ca. 160 auf rund 360 festgestellt werden.
- Klicken Sie auf ein grünes Hexagon.
Grüne Hexagone sind Hexagone, in denen ein Abwärtstrend erkannt wurde. Viele dieser Hexagone weisen ganz allgemein eine geringe Anzahl an Check-Ins auf. Im Beispielbild jedoch wurde für das Gebiet ein Abfall von einem Höchststand von über 900 Check-Ins auf weniger als 600 Check-Ins verzeichnet. Obwohl es sich um einen Abwärtstrend handelt, liegen selbst die Tiefstwerte in diesem Gebiet über den Höchstwerten des vorherigen Gebiets, in dem ein Aufwärtstrend festgestellt wurde.
Weiße Hexagone stellen Gebiete dar, in denen kein Trend festgestellt wurde, weder aufwärts noch abwärts. Diese Hexagone weisen entweder eine stabile monatliche Anzahl an Check-Ins auf oder starke Schwankungen.
- Schließen Sie das Pop-up, und kehren Sie zur vollen Ausdehnung der Daten zurück.
Bei der räumlichen Analyse der Daten haben Sie herausgefunden, dass die Innenstadt von San Francisco das beliebteste Gebiet ist. Jedoch sind in der Innenstadt von San Francisco keine Aufwärts- oder Abwärtstrends bei der Beliebtheit festzustellen. Hingegen sind Gebiete in San Jose und im Osten der Bay Area im Kommen. Es kann sich also anbieten, diese Gebiete bei der Standortwahl in Betracht zu ziehen.
Als Nächstes visualisieren Sie den Raum-Zeit-Würfel in 3D, wodurch die Änderungen im Zeitverlauf leichter auf der Karte zu erkennen sind. (Zeit ist die dritte Dimension in einem Raum-Zeit-Würfel.) Als Erstes fügen Sie eine neue Szene ein.
- Klicken Sie auf der Registerkarte Einfügen des Menübands in der Gruppe Projekt auf den Dropdown-Pfeil Neue Karte, und wählen Sie Neue lokale Szene aus.
Dem Projekt wird eine Szenenansicht hinzugefügt.
- Klicken Sie im Bereich Geoverarbeitung auf die Schaltfläche Zurück. Navigieren Sie zum Werkzeug Raum-Zeit-Würfel in 3D visualisieren, und öffnen Sie es.
- Öffnen Sie das Werkzeug Raum-Zeit-Würfel in 3D visualisieren, und legen Sie die folgenden Parameter fest:
- Navigieren Sie für Eingabe-Raum-Zeit-Würfel zu der Datei San_Francisco_Crimes_Space_Time_Cube.nc.
- Wählen Sie unter Würfel-Variable den Eintrag COUNT aus.
- Wählen Sie für Anzeigedesign den Eintrag Wert aus.
- Geben Sie für Ausgabe-Features den Namen Check_ins_STC_3D an.
- Klicken Sie auf Ausführen.
Das Werkzeug wird ausgeführt, und der Ergebnis-Layer wird der Szene hinzugefügt.
- Schwenken, zoomen und neigen Sie die Szene, um die Ergebnisse zu untersuchen.
Tipp:
Zum Neigen der Szene drücken Sie die Taste V und ziehen die Karte. Zum Schwenken der Szene drücken Sie die Taste C und ziehen die Karte.
In dieser Visualisierung besteht die Höhe der einzelnen Hexagonabschnitte aus Segmenten. Jedes Segment steht dabei für einen anderen Monat. Die Farbe der einzelnen Segmente repräsentiert die Anzahl an Check-Ins im jeweiligen Monat für das entsprechende Gebiet.
Im Gegensatz zur 2D-Visualisierung sind die einzelnen Segmente nach Gesamtzahl von Check-Ins symbolisiert und nicht nach Aufwärts- und Abwärtstrends. Wie durch die räumliche Analyse festgestellt, weist die Innenstadt von San Francisco die höchste Anzahl an Check-Ins auf, obwohl das Gebiet keinen Zuwachs an Beliebtheit verzeichnet. An anderen Orten weisen die meisten Abschnitte wenige Check-Ins auf und sind daher weiß symbolisiert.
- Speichern Sie das Projekt.
Zeitliche Cluster erkennen
Als Nächstes ermitteln Sie zeitliche Cluster von Check-Ins im Raum-Zeit-Würfel. Wie auch beim räumlichen Clustering werden beim zeitlichen Clustering Positionen ermittelt, an denen Features dicht beieinander liegen. Der einzige Unterschied besteht darin, dass durch das zeitliche Clustering Cluster nach zeitlicher Nähe statt nach räumlicher Nähe gruppiert werden.
- Klicken Sie oberhalb der Szene auf die Registerkarte Karte.
Sie kehren zur Kartenansicht zurück.
- Klicken Sie im Bereich Geoverarbeitung auf die Schaltfläche Zurück. Navigieren Sie zum Werkzeug Zeitserien-Cluster-Bildung, und öffnen Sie es.
- Navigieren Sie im Werkzeug Zeitserien-Cluster-Bildung für Eingabe-Raum-Zeit-Würfel zu der Datei Check_ins_STC.nc, und wählen Sie sie aus. Wählen Sie für Analysevariable den Eintrag COUNT aus, und geben Sie für Ausgabe-Features den Namen Check_ins_Monthly_Time_Clusters ein.
Sie können die Daten auch nach einer der drei Interesseneigenschaften clustern. Zunächst clustern Sie die Positionen so, dass Positionen mit ähnlichen Werten in der zeitlichen Dimension ein Cluster bilden. Zu den anderen Interesseneigenschaften erfahren Sie später mehr.
- Wählen Sie für Interesseneigenschaft die Option Wert aus.
Sie können auch die Anzahl der Cluster festlegen, die vom Werkzeug erstellt werden. Wird keine Änderung vorgenommen, verwendet das Werkzeug eine auf den Daten basierende optimale Anzahl. Sie erstellen drei Cluster, die großer Beliebtheit, mittlerer Beliebtheit und geringer Beliebtheit entsprechen.
- Geben Sie für Anzahl der Cluster den Wert 3 ein. Aktivieren Sie Zeitserien-Pop-ups aktivieren.
Sie erstellen ebenfalls eine Ausgabetabelle, damit die Ergebnisse in einem Diagramm dargestellt werden können.
- Geben Sie für Ausgabetabelle für Diagramme den Namen Clustering_Tables ein.
- Klicken Sie auf Ausführen. Blenden Sie nach der Werkzeugausführung den Layer Check_ins_STC_2D aus.
Der Cluster-Layer wird auf der Karte angezeigt.
Die Hexagonabschnitte werden in drei verschiedenfarbige Gruppen geclustert: blau, rot und grün. Um die Bedeutung dieser Cluster zu ergründen, öffnen Sie das Diagramm, das Sie mit dem Werkzeug erstellt haben.
- Doppelklicken Sie im Bereich Inhalt unter Standalone-Tabellen auf Durchschnittliche Zeitserie pro Cluster. (Sie müssen möglicherweise einen Bildlauf durchführen, um den Eintrag zu sehen.)
Das Diagramm wird angezeigt.
Hinweis:
Die Farben werden den einzelnen Abschnitten zufallsbasiert zugewiesen, weshalb die Farbzuweisung bei Ihnen von den Beispielbildern abweichen kann. Ungeachtet der Farbzuweisung ist die Anzahl der Abschnitte gleich, sodass die Daten dieselben Informationen vermitteln.
Im oben gezeigten Diagramm Durchschnittliche Zeitserie pro Cluster befinden sich die blauen Hexagone an Positionen, an denen historisch wenige Check-Ins vorliegen. (Alle Hexagone weisen mindestens einen Check-In auf, da sie sonst nicht einbezogen worden wären.) Die grünen Hexagone entsprechen Positionen mit einer höheren Anzahl an Check-Ins. Obwohl die Anzahl an Check-Ins hoch ist, schwankt die Anzahl von Monat zu Monat stark. Auf der Karte wurde nur ein grünes Hexagon ermittelt (in der Innenstadt von San Francisco). Die Schwankungen sind möglicherweise auf saisonbedingte Unterschiede in der Tourismusbranche zurückzuführen. Das rote Cluster enthält Positionen in der Innenstadt, die möglicherweise von den Einheimischen aufgesucht werden, sodass sie sich über das gesamte Jahr hinweg einer relativ konstanten Beliebtheit erfreuen.
- Zoomen Sie auf der Karte auf die Innenstadt von San Francisco, und klicken Sie auf das grüne Hexagon.
Hinweis:
Auf Ihrem Bildschirm ist möglicherweise eine andere Farbe zu sehen. Klicken Sie somit auf das Hexagon, dessen Farbe sich von der der umgebenden Hexagone unterscheidet.
Das Pop-up zeigt das Zeitseriendiagramm für diese Position. Die gepunktete grüne Linie steht für die durchschnittliche Anzahl an Check-Ins für Hexagone im grünen Cluster.
- Schließen Sie das Pop-up und das Diagramm.
Sie haben Cluster von Positionen mit einer ähnlichen Anzahl an Check-Ins im Zeitverlauf ermittelt. Sie können ebenfalls Cluster von Gebieten mit ähnlichen zeitlichen Trends ermitteln. Nehmen Sie beispielsweise an, dass für zwei Gebiete aufgrund von saisonalen Schwankungen in der Touristenanzahl ähnliche Zu- und Abnahmen an Check-Ins im Laufe der Zeit zu verzeichnen sind. Eines der Gebiete weist jedoch eine bedeutend höhere Gesamtzahl an Check-Ins auf. Bei der Cluster-Bildung nach Wert werden diese beiden Gebiete nicht zusammen gruppiert, bei der Cluster-Bildung nach Profil hingegen schon.
Das Clustern von Positionen nach Profil bietet sich für Unternehmen an, die eine saisonabhängige Zielgruppe erschließen möchten. Für die profilbasierte Cluster-Bildung haben Sie zwei Möglichkeiten. Sie verwenden die familienbasierte Fourier-Methode der Cluster-Bildung. Bei der Fourier-Methode werden Gebiete ermittelt, die im Jahresverlauf unterschiedliche Änderungsraten hinsichtlich der Beliebtheit aufweisen.
- Geben Sie im Werkzeug Zeitserien-Cluster-Bildung für Ausgabe-Features den Namen Check_ins_Monthly_Time_Clusters_Fourier ein. Wählen Sie für Interesseneigenschaft die Option Profil (Fourier) aus.
Bei der Ausführung des Werkzeugs können Sie einige der Eigenschaften ignorieren. Sie ignorieren die Eigenschaft Bereich (in diesem Fall die Anzahl an Check-Ins). Auf diese Weise werden Positionen mit ähnlichen Beliebtheitstrends unabhängig von der Gesamtanzahl an Check-Ins ermittelt. Die Bestimmung der optimalen Anzahl an zu erstellenden Clustern überlassen Sie dem Werkzeug.
- Aktivieren Sie für Zu ignorierende Zeitserieneigenschaften die Eigenschaft Bereich. Geben Sie für Anzahl der Cluster den Wert 3 ein.
- Aktivieren Sie Zeitserien-Pop-ups aktivieren.
- Geben Sie für Ausgabetabelle für Diagramme den Namen Clustering_Tables_Fourier ein.
- Klicken Sie auf Ausführen. Blenden Sie nach der Werkzeugausführung den Layer Check_ins_Monthly_Time_Clusters aus.
Der Cluster-Layer wird auf der Karte angezeigt.
Bei Verwendung der Methode "Profil (Fourier)" ergeben sich für jede Farbe bedeutend mehr Hexagone.
- Doppelklicken Sie im Bereich Inhalt unter Clustering_Tables_Fourier auf Durchschnittliche Zeitserie pro Cluster.
In diesem Diagramm steht die Farbe Rot für Hexagone mit einer höheren Anzahl an Check-Ins, die insbesondere im Frühjahr zu verzeichnen sind. Die Farbe Blau entspricht Hexagonen mit weniger Check-Ins im Jahresverlauf, während die Farbe Grün für Hexagone mit einer steigenden Anzahl an Check-Ins steht. Die einzelnen Cluster-Typen sind in der gesamten Bay Area vertreten und nicht nur in Gebieten, die allgemein mehr Check-Ins aufweisen (wie die Innenstadt von San Francisco).
- Schließen Sie das Diagramm, und speichern Sie das Projekt.
Sie haben zeitliche Trends in Ihren Daten analysiert, um Positionen zu bestimmen, die mit der Zeit beliebter geworden sind, sowie Positionen, die in Bezug auf die Beliebtheit saisonale Zyklen aufweisen. Dies stellt einen weiteren Schritt in Richtung Ihres Zieles dar: ein umfassendes Verständnis Ihrer Daten zu erlangen und für Ihr neues Unternehmen eine fundierte Entscheidungsfindung in Hinsicht auf die Standortwahl zu ermöglichen.
Eine Analyse durchführen
Im Verlauf dieses Lernprogramms haben Sie Daten räumlich und zeitlich analysiert. Je nachdem, welche statistische Methode Sie zum Erkennen von Clustern in Ihren Daten auswählen, können sich die Ergebnisse erheblich voneinander unterscheiden. Als Nächstes kombinieren Sie die Ergebnisse und treffen eine Entscheidung darüber, wo Sie Ihr Unternehmen ansiedeln möchten.
Räumliche und zeitliche Hot-Spots suchen
In einer abschließenden Analyse werden die Daten sowohl räumlich als auch zeitlich untersucht. Mit dem Werkzeug Trendanalyse von Hot-Spots (Emerging Hot Spot Analysis, EHSA) klassifizieren Sie Muster in einem Raum-Zeit-Würfel in eine von 17 möglichen Kategorien.
Im Gegensatz zur Zeitserien-Cluster-Bildung ermittelt die EHSA, ob die benachbarten Abschnitte eines Raum-Zeit-Würfel-Abschnittes Check-Ins enthalten, deren Anzahl über (Hot-Spot) oder unter (Cold-Spot) dem globalen Durchschnitt liegt. Nachdem die einzelnen Positionen im Raum-Zeit-Würfel als Hot-Spot, Cold-Spot oder keines von beiden definiert wurde, untersucht die EHSA Variationen hinsichtlich des Z-Wertes der Positionen im Zeitverlauf, um zu bestimmen, ob es sich bei der jeweiligen Position um einen konsekutiven, sich verstärkenden, sich abschwächenden oder zeitweiligen Hot-Spot oder Cold-Spot handelt.
Das Endergebnis berücksichtigt sowohl räumliche als auch zeitliche Variationen in den Daten.
- Öffnen Sie ggf. die Karte Bay Area Popular Places in ArcGIS Pro.
- Navigieren Sie im Bereich Geoverarbeitung zum Werkzeug Trendanalyse von Hot-Spots, und öffnen Sie es. Geben Sie die folgenden Parameter ein:
- Navigieren Sie für Eingabe-Raum-Zeit-Würfel zu der Datei Check_ins_STC.nc, und wählen Sie sie aus.
- Wählen Sie unter Analysevariable den Eintrag COUNT.
- Geben Sie für Ausgabe-Features den Text Check_ins_Emerging_Hot_Spots ein.
- Geben Sie als Nachbarschaftsentfernung den Wert 1 ein, und wählen Sie Meilen aus.
Die EHSA analysiert für jede Position alle benachbarten Positionen im Umkreis von 1 Meile (1,6 Kilometern). Sie haben zuvor einen Raum-Zeit-Würfel mit einem Hexagongitter erstellt, der sich ideal für die Nachbarschaftsanalyse eignet, da jedes Sechseck äquidistant ist.
- Klicken Sie auf Ausführen. Blenden Sie nach der Ausführung des Werkzeugs den Layer Check_ins_Monthly_Time_Clusters_Fourier aus.
Hot-Spots befinden sich in der Innenstadt von San Francisco sowie in mehreren kleineren Städten südlich der Bucht wie Palo Alto, Mountain View und San Jose. Die meisten Hot-Spots in der Innenstadt von San Francisco sind dauerhafte Hot-Spots, d. h. sie waren über eine bestimmte Zeit hinweg konsistent Hot-Spots. Bei den anderen Gebieten handelt es sich meist entweder um neue Hot-Spots, d. h. sie waren nur am Ende der Zeitserie Hot-Spots, oder um zeitweilige Hot-Spots, d. h. sie waren nur in bestimmten Zeitabschnitten Hot-Spots.
Gebiete, die im Rahmen der Zeitserien-Cluster-Bildung als Cluster mit hoher und niedriger Punktanzahl charakterisiert wurden, werden als konsekutive Hot-Spots angezeigt. Dies bedeutet, dass die Umgebung dieser Gebiete in den meisten Zeitintervallen eine durchschnittlich höhere Anzahl an Check-Ins verzeichnet als die Bay Area. Folglich waren diese Gebiete in den meisten Zeitintervallen im Raum-Zeit-Würfel beliebter als die übrige Bay Area. Anscheinend erfreuen sich diese Gebiete im Gegensatz zu San Francisco im Laufe der Zeit einer wachsenden Beliebtheit.
Sie haben auch die Möglichkeit, die Ergebnisse in 3D zu visualisieren.
- Klicken Sie im Bereich Inhalt mit der rechten Maustaste auf den Layer Check_ins_Emerging_Hot_Spots, und wählen Sie Kopieren aus. Klicken Sie über der Karte auf die Registerkarte Szene, um zu Ihrer Szene zurückzukehren.
- Klicken Sie im Bereich Inhalt mit der rechten Maustaste auf Szene, und wählen Sie Einfügen aus.
Der Hot-Spots-Layer wird in der Szene angezeigt.
Nachdem Sie die EHSA für Ihren Raum-Zeit-Würfel ausgeführt haben, können Sie ihn basierend auf den Analyseergebnisse visualisieren.
- Klicken Sie im Bereich Geoverarbeitung auf die Schaltfläche Zurück. Navigieren Sie zum Werkzeug Raum-Zeit-Würfel in 3D visualisieren, und geben Sie die folgenden Parameter ein:
- Navigieren Sie für Eingabe-Raum-Zeit-Würfel zu der Datei Check_ins_STC.nc, und wählen Sie sie aus.
- Wählen Sie unter Würfel-Variable den Eintrag COUNT aus.
- Wählen Sie für Anzeigedesign den Eintrag Hot- und Cold-Spot-Ergebnisse aus.
- Geben Sie für Ausgabe-Features den Text Check_ins_STC_Hot_Spots ein.
- Klicken Sie auf Ausführen.
- Deaktivieren Sie den Layer Check_ins_STC_3D. Erkunden Sie die Szene.
Gebiete, die als neue Hot-Spots klassifiziert wurden, waren nur im letzten Monat (dargestellt durch den obersten Hexagonabschnitt auf der Säule) Hot-Spots. Zeitweilige Hot-Spots wechseln zwischen den Status "Hot-Spot" und "Nicht-Hot-Spot". Die Innenstadtgebiete von San Francisco gelten in allen Monaten als Hot-Spots und sind deshalb dauerhafte Hot-Spots.
- Klicken Sie auf die Registerkarte Karte, um zur Kartenansicht zurückzukehren.
Für die Ausführung der EHSA haben Sie eine Nachbarschaftsentfernung von einer Meile (1,6 Kilometer) ausgewählt. Wenn Sie die Nachbarschaftsentfernung ändern, ändern sich auch die Ergebnisse.
- Klicken Sie im Bereich Geoverarbeitung auf die Schaltfläche Zurück. Navigieren Sie zum Werkzeug Trendanalyse von Hot-Spots, und geben Sie die folgenden Parameter ein:
- Navigieren Sie für Eingabe-Raum-Zeit-Würfel zu der Datei Check_ins_STC.nc, und wählen Sie sie aus.
- Wählen Sie unter Analysevariable den Eintrag COUNT.
- Geben Sie für Ausgabe-Features den Namen Check_ins_Emerging_Hot_Spots_5mi an.
- Geben Sie als Nachbarschaftsentfernung den Wert 5 ein, und wählen Sie Meilen (US Survey) aus.
- Klicken Sie auf Ausführen. Blenden Sie nach der Ausführung des Werkzeugs den Layer Check_ins_Emerging_Hot_Spots aus.
Bei Verwendung einer größeren Nachbarschaftsentfernung werden größere Gebiete als Hot-Spots betrachtet.
Den Standort für Ihr Unternehmen auswählen
Als Nächstes bestimmen Sie den besten Standort für Ihr neues Unternehmen. Dazu überlagern Sie die räumlichen und zeitlichen Cluster und die Hot-Spots. Die Kriterien zum Kombinieren dieser Layer hängen davon ab, welche idealen Bedingungen Sie für Ihr Unternehmen definiert haben.
Zunächst wählen Sie Flächen mit dichten räumlichen Check-In-Clustern aus. Diese Flächen weisen auf eine hohe Passantenfrequenz hin – ein wichtiger Aspekt beim Eröffnen eines neuen Geschäfts. Sie haben eine räumliche Cluster-Analyse mit drei verschiedenen Methoden – DBSCAN, HDBSCAN und OPTICS – durchgeführt. Von diesen drei Methoden war die HDBSCAN-Methode für Ihr Untersuchungsgebiet am besten geeignet, da sie die Unterschiede in der Bevölkerungszahl der städtischen, vorstädtischen und ländlichen Gebieten der Bay Area berücksichtigt.
- Klicken Sie auf dem Menüband auf der Registerkarte Karte in der Gruppe Auswahl auf Nach Attributen auswählen.
Bei der Durchführung der Cluster-Analyse wiesen die Ergebnis-Layer das Attributfeld Cluster-ID auf. In diesem Feld galt jedes Feature mit einem Wert von -1 nicht als Cluster. Wählen Sie alle Flächen aus, die als Cluster eingestuft wurden.
- Wählen Sie im Fenster Nach Attributen auswählen unter Eingabezeilen die Option HDBSCAN_500 aus. Erstellen Sie unter Ausdruck den Ausdruck Cluster ID ist ungleich -1.
- Klicken Sie auf Übernehmen. Blenden Sie den Layer Check_ins_Emerging_Hot_Spots_5mi aus, und aktivieren Sie den Layer HDBSCAN_500.
Alle als Cluster gekennzeichneten Flächen werden ausgewählt.
Als Nächstes entfernen Sie die eben ausgeführte Klausel und wählen Positionen aus, die neue, konsekutive oder dauerhafte Hot-Spots darstellen.
- Klicken Sie im Werkzeug Nach Attributen auswählen auf Klausel entfernen.
- Wählen Sie für Eingabezeilen die Option Check_ins_Emerging_Hot_Spots aus.
- Erstellen Sie den Ausdruck Wobei gilt: Pattern Type COUNT enthält die Werte Consecutive Hot Spot, New Hot Spot, Persistent Hot Spot.
- Klicken Sie auf Übernehmen. Blenden Sie den Layer HDBSCAN_500 aus, und aktivieren Sie den Layer Check_ins_Emerging_Hot_Spots.
Die Hot-Spots werden ausgewählt.
Als Nächstes wählen Sie monatliche Zeitcluster mit einer höheren Passantenfrequenz in einer bestimmten Jahreszeit aus. Je nach Art des Unternehmens, das Sie eröffnen möchten, sind möglicherweise Gebiete mit einer höheren Passantenfrequenz zu verschiedenen Jahreszeiten besonders geeignet. In dieser Übung wählen Sie Gebiete mit einer höheren Passantenfrequenz in den Sommermonaten aus.
- Entfernen Sie den Ausdruck im Werkzeug Layer nach Attributen auswählen. Wählen Sie für Eingabezeilen die Option Check_ins_Monthly_Time_Clusters_Fourier aus.
In diesem Layer entspricht der zeitliche Cluster, der Muster mit hoher Passantenfrequenz in den Sommermonaten aufweist, dem grünen Cluster mit der ID 3.
- Erstellen Sie den Ausdruck Time-Series Cluster ID ist gleich 3.
- Klicken Sie auf OK. Blenden Sie den Layer Check_ins_Emerging_Hot_Spots aus, und aktivieren Sie den Layer Check_ins_Monthly_Time_Clusters_Fourier.
Sie haben Bereiche anhand von drei Kriterien ausgewählt. Als Nächstes erstellen Sie einen Layer, der nur Hexagonabschnitte enthält, die in allen drei Layern ausgewählt wurden (d. h. sie entsprechen allen drei Kriterien). Basierend auf den spezifischen Anforderungen Ihres Unternehmens können Sie die Kriterien anpassen, weitere Kriterien hinzufügen oder Kriterien entfernen. Für diese Übung sind drei Kriterien ausreichend.
- Klicken Sie im Bereich Geoverarbeitung auf die Schaltfläche Zurück. Navigieren Sie zum Werkzeug Überschneiden (Intersect), und öffnen Sie es.
Hinweis:
Je nach verwendeter ArcGIS Pro-Version erhalten Sie eine Meldung, in der Sie zur Verwendung des Werkzeugs Paarweise überschneiden aufgefordert werden, um von der verbesserten Funktionalität Gebrauch zu machen. In diesem Fall ist die Verwendung des Werkzeugs nicht möglich, da maximal zwei Eingaben zulässig sind, Sie jedoch über drei Eingaben verfügen.
- Wählen Sie für Eingabe-Features die Option HDBSCAN_500 aus. Wählen Sie in der nächsten Zeile den Layer Check_ins_Emerging_Hot_Spots aus, und aktivieren Sie in der nächsten Zeile den Layer Check_ins_Monthly_Time_Clusters_Fourier.
Hinweis:
Für die Auswahl von mehr als zwei Eingabe-Features ist eine ArcGIS Pro Advanced-Lizenz erforderlich.
Unter jedem Eingabe-Feature werden Meldungen angezeigt, um Sie darauf hinzuweisen, dass die Layer über eine aktive Auswahl verfügen.
- Geben Sie für Ausgabe-Feature-Class den Namen Ideal_Locations ein. Wählen Sie für Zu verbindende Attribute die Option Nur Feature-IDs aus.
- Klicken Sie auf Ausführen. Blenden Sie nach der Ausführung des Werkzeugs den Layer Check_ins_Monthly_Time_Clusters_Fourier aus.
Die idealen Positionen befinden sich in San Francisco, Mountain View und San Jose.
- Zoomen Sie in der Karte auf die verschiedenen Punkte.
Bei der Analyse wurden einige Gebiete in San Francisco ermittelt, die ideale Standorte für die Eröffnung eines Unternehmens wären.
Es wurden zwar zahlreiche Punkte in Mountain View identifiziert, die jedoch alle um ein einziges Gebiet – das Stadtzentrum von Mountain View – gruppiert sind. Wenn Sie eine Alternative zu San Francisco möchten (vielleicht weil die Kosten zu hoch sind), wäre dieses Gebiet ideal.
- Kehren Sie zur vollen Ausdehnung der Daten zurück. Speichern Sie das Projekt.
In diesem Lernprogramm haben Sie spatiotemporale Data Science durchgeführt, um beliebte Orte in der Bay Area raum- und zeitübergreifend zu identifizieren. Basierend auf den Ergebnissen haben Sie mehrere ideale Standorte für die Eröffnung Ihres Unternehmens ermittelt sowie die Vorteile und Einschränkungen verschiedener Methoden der räumlichen und zeitlichen Aggregation kennengelernt.
Weitere Lernprogramme finden Sie in der Lernprogrammgalerie.