Den prozentualen Anteil der Senioren in Polen interpolieren
Wenn Sie die Werte der meisten Features in Ihrem Dataset kennen, können Sie sie verwenden, um kontinuierliche Werte bezogen auf das gesamte Gebiet vorherzusagen. Gehen Sie wie folgt vor, um die räumliche Verteilung der Senioren in Polen zu erfassen.
- Laden Sie das Projektpaket "FillGaps" herunter.
- Suchen Sie die heruntergeladene Datei auf Ihrem Computer. Doppelklicken Sie auf FillGaps.ppkx, um das Paket zu öffnen.
Hinweis:
Wenn Sie über keinen Zugriff auf ArcGIS Pro oder über kein ArcGIS-Organisationskonto verfügen, informieren Sie sich über die Optionen für den Zugriff auf die Software.
Das Projekt wird in ArcGIS Pro geöffnet.
In dieser Karte sind Powiaty in Polen dargestellt. Powiaty sind polnische Verwaltungseinheiten und entsprechen in etwa unseren Landkreisen. Die Polygone sind so eingefärbt, dass sie den prozentualen Anteil der Bevölkerung im Alter ab 65 Jahren darstellen. Leider sind die Daten nicht vollständig. Zehn Powiaty enthalten keinen Wert für den prozentualen Anteil der Senioren.
Die räumlichen Daten finden Sie in ArcGIS Living Atlas of the World. Die Werte für den prozentualen Anteil an Senioren wurden vom polnischen Statistikamt bereitgestellt. (Die fehlenden Werte wurden eigens für dieses Lernprogramm künstlich entfernt.)
Demografische Daten können oftmals nur schwer mit Geostatistiken modelliert werden, da Stadtgebiete vollkommen andere Muster aufweisen als ländliche Gebiete. In diesem Fall ist die räumliche Variation in diesen Daten relativ glatt, ohne dramatisch ausgeprägte Unterbrechungen. Das bedeutet, dass die Daten u. U. für die Geostatistik geeignet sind.
- Klicken Sie im Menüband auf die Registerkarte Analyse. Klicken Sie in der Gruppe Workflows auf Geostatistical Wizard.
Daraufhin wird das Fenster Geostatistical Wizard angezeigt.
- Wählen Sie im Fenster Geostatistical Wizard unter Geostatistische Methoden den Eintrag Flächeninterpolation aus.
Für die meisten Interpolationsmethoden sind als Eingabe Punktdaten erforderlich, aber bei der Flächeninterpolation werden Polygone verwendet. In diesem Lernprogramm verwenden Sie Polygone, die nahezu vollständig sind und wie Puzzleteile zusammenpassen. Sie können auch Polygone verwenden, die weit auseinanderliegen oder sich überlappen. Beispielsweise können Sie über Daten verfügen, mit denen die Beobachtung von Vögeln dargestellt wird und die für den Boden, für den die einzelnen Beobachter zuständig sind, in Polygonen gespeichert werden.
Hinweis:
Weitere Informationen über diese geostatistische Methode finden Sie unter Was ist Flächeninterpolation?
Bei der Flächeninterpolation werden Werte unterschiedlich verarbeitet, wenn sie Durchschnittswerte, Anteile oder Ereignisse darstellen. Sie ordnen den prozentualen Anteil einer Bevölkerung über ein bestimmtes Alter, die Rate, zu.
- Wählen Sie unter Eingabe-Dataset 1 als Typ den Eintrag Anteil aus. Wählen Sie als Quellen-Dataset den Eintrag Powiaty_Seniors aus.
- Wählen Sie unter Zählfeld den Eintrag 2017 Senior Population und unter Feld mit Grundgesamtheit den Eintrag 2017 Total Population aus.
- Klicken Sie auf Weiter.
Im nächsten Fenster wird ein Kovarianz-Diagramm angezeigt. Die blauen Kreuze stehen für Ihre Daten ohne jede Modellierung. Die blaue Linie stellt das Modell dar, das zur Vorhersage des prozentualen Anteils der Senioren in dem gesamten Gebiet verwendet wird. Sie möchten die Parameter des Modells bearbeiten, bis die Modelllinie dem Pfad der Kreuze folgt und 90 % der Kreuze innerhalb der roten Konfidenzintervalle liegen. Aktuell ist dies nicht der Fall.
Die Linie liegt nicht nur nicht nah bei den Kreuzen, sondern es liegen zwei Kreuze weit abseits des Pfades. In vielen Fällen werden Sie das Ziel eines idealen Modells nicht erreichen, aber Sie können versuchen, ihm so nahe wie möglich zu kommen. Am besten beginnen Sie damit, den Abstand zu verkleinern. Dadurch reduzieren Sie die Fläche, die bei der Referenzpunkterfassung zur Generierung der blauen Kreuze durchsucht wird.
- Geben Sie unter Allgemeine Eigenschaften für Größe der Entfernungsstufen den Wert 12000 ein.
Das Modell verändert sich. Die Kreuze liegen jetzt jedoch noch weiter von den Konfidenzintervallen entfernt.
Als Nächstes versuchen Sie, das Modell zu optimieren, indem Sie seine Form ändern.
- Wählen Sie für Modell die Option Stabil aus.
Hinweis:
Mit den Modelloptionen "Stabil" und "K-Bessel" werden oftmals die besten Ergebnisse erzielt, aber es dauert auch länger, sie zu verarbeiten.
Ein perfektes Modell zu generieren kann schwierig oder sogar unmöglich sein, ganz besonders, wenn Sie mit demografischen Daten und nicht mit einem natürlichen Phänomen arbeiten. In diesem Szenario folgt die Modelllinie den Kreuzen relativ nah, obwohl nur eines der Kreuze innerhalb des Konfidenzintervalls liegt. Dieses Modell ist nicht perfekt, aber es ist ein zweckmäßiger Kompromiss.
- Klicken Sie auf Weiter.
Das nächste Fenster enthält eine Kartenvorschau.
- Klicken Sie auf verschiedene Teile dieser Kartenvorschau.
Auf der Karte werden benachbarte Polygone markiert, mit denen der vorhergesagte Wert der Position ermittelt wird, auf die Sie geklickt haben. Rot gefärbte Polygone werden in der Analyse höher gewichtet als grün gefärbte.
- Klicken Sie auf Weiter.
Die Seite Kreuzvalidierung wird angezeigt. Mithilfe der Kreuzvalidierung wird die Genauigkeit einer vorhergesagten Oberfläche beurteilt. Dies geschieht, indem ein einzelnes Polygon aus dem Dataset entfernt wird und die verbleibenden Daten zur Vorhersage eines Wertes innerhalb des entfernten Polygons verwendet werden.
Das Scatterplot Predicted für dieses Modell sieht nicht gut aus. Idealerweise sollten die roten Werte dem Trend der blauen und grauen Linien folgen. Ihr Diagramm sieht eher aus wie eine Wolke aus willkürlich gesetzten Punkten. Andererseits sehen die auf der Registerkarte Zusammenfassung aufgeführten Werte gut aus. Diese Zahlen sollten alle nahe bei Null liegen, außer bei Root-Mean-Square Standardized, wo sie nahe bei 1 liegen sollten. Der Wert 0,02 unter Root-Mean-Square bedeutet, dass der vorhergesagte Anteil der Senioren im Durchschnitt um 2 Prozent vom realen Wert abweicht. Diese Fehlerspanne ist akzeptabel. Diese Werte sagen mehr über die Qualität Ihres Modells aus als der Scatterplot.
- Klicken Sie auf Fertig stellen. Klicken Sie im Fenster Methodenbericht auf OK.
Der Karte wird ein interpolierter Layer hinzugefügt.
- Deaktivieren Sie im Bereich Inhalt den Eintrag Powiaty_Seniors, und aktivieren Sie Powiaty_Seniors outlines.
In den Flächen mit dicken schwarzen Umrisslinien fehlen Daten.
Polygone aus der Interpolation erstellen
Die Interpolation, die Sie erstellt haben, ist kontinuierlich. Die Polygon-Umrisslinien werden dabei ignoriert. Im Rahmen der Geostatistik wurden die demografischen Daten so geglättet, dass eine graduelle Oberfläche erschaffen wurde. Während sie bekannten Daten nicht unbedingt genau entsprechen, eignen sich nahtlose Interpolationen wie diese oftmals besser zur Vorhersage unbekannter Werte.
Als Nächstes konvertieren Sie die kontinuierliche Interpolationsoberfläche in Polygone.
- Klicken Sie auf dem Menüband auf die Registerkarte Karte. Klicken Sie in der Gruppe Navigieren auf Lesezeichen, und wählen Sie Kluczborski aus.
Die Karte wechselt zum Powiat Kluczborski.
Der Layer Areal Interpolation ist ein geostatistischer Layer, was bedeutet, dass sich die Werte aller Positionen auf der Karte leicht unterscheiden. Einige der Polygone, die Sie ausfüllen müssen, wie z. B. dieser, weisen eine große Bandbreite an vorhergesagten Werten auf. Konvertieren Sie diese vorhergesagte Oberfläche in einen Polygon-Layer mit einem einzelnen vorhergesagten Wert für jeden Powiat.
- Klicken Sie im Menüband auf die Registerkarte Analyse. Klicken Sie in der Gruppe Geoverarbeitung auf Werkzeuge.
Daraufhin wird der Bereich Geoverarbeitung angezeigt.
- Geben Sie in die Suchleiste im Bereich Geoverarbeitung den Text Areal Interpolation Layer ein, und wählen Sie in der Ergebnisliste das Werkzeug Flächeninterpolations-Layer in Polygone aus.
- Geben Sie für das Werkzeug Flächeninterpolations-Layer in Polygone Folgendes ein:
- Wählen Sie unter Geostatistischer Eingabe-Layer für die Flächeninterpolation die Option Flächeninterpolation aus.
- Wählen Sie unter Eingabe-Polygon-Features die Option Powiaty_Seniors aus.
- Ändern Sie unter Ausgabe-Polygon-Feature-Class den Ausgabenamen in Interpolated_Polygons. Fügen Sie unbedingt den Unterstrich ein.
- Klicken Sie auf Ausführen.
Daraufhin wird der Karte der Layer Interpolated_Polygons hinzugefügt.
- Klicken Sie auf dem Menüband auf die Registerkarte Karte. Klicken Sie in der Gruppe Navigieren auf die Schaltfläche Volle Ausdehnung, um zur Standardansicht der Karte zurückzukehren.
- Ziehen Sie im Bereich Inhalt den Layer Interpolated_Polygons unter den Layer Powiaty_Seniors outlines.
- Deaktivieren Sie die Option Flächeninterpolation.
Jetzt weist jedes Polygon einen Wert für den prozentualen Anteil der Senioren auf.
Bei den meisten dieser Polygone liegen Ihnen zwar die realen Werte vor, doch möchten Sie die vorhergesagten Werte nur für 10 der Polygone verwenden. Sie wählen die 10 Polygone mit fehlenden Werten aus und fügen mithilfe des Werkzeugs Feld berechnen ausschließlich Werte zu diesen Polygonen hinzu.
- Klicken Sie mit der rechten Maustaste auf Interpolated_Polygons, und wählen Sie Attributtabelle aus.
Die Attributtabelle wird angezeigt. Sie enthält alle Daten aus dem Layer Powiaty_Seniors und weist zudem drei neue Felder auf: Included, Predicted und Standard Error.
- Doppelklicken Sie auf die Kopfzeile der Spalte Percent Seniors, um sie zu sortieren.
Jetzt sind alle leeren Datensätze in der Tabelle oben. Als Nächstes ersetzen Sie die <Null>-Werte durch die Daten aus dem Feld Predicted.
- Wählen Sie alle Zeilen aus, in denen die Seniorendaten fehlen.
Hinweis:
Klicken Sie zum Auswählen von mehreren Zeilen auf die Zeilennummer des ersten Datensatzes, und halten Sie beim Auswählen die Umschalttaste gedrückt. Alternativ können Sie den Cursor über die Zeilennummern ziehen, die Sie auswählen möchten. Sie können auch das Werkzeug Nach Attributen auswählen verwenden.
- Klicken Sie oben in der Attributtabelle auf die Schaltfläche Berechnen.
Das Werkzeug Feld berechnen wird in einem Pop-up-Fenster geöffnet. Die Feldberechnung wird lediglich auf die ausgewählten Zeilen angewendet.
- Wählen Sie Percent Seniors als Feldname aus.
- Führen Sie in der Liste Felder einen Bildlauf nach unten durch, und doppelklicken Sie auf Predicted.
Das Feld PercentSeniors = wird auf !Predicted! gesetzt. Hierbei werden die Werte aus dem Feld Predicted übernommen und in das Feld Percent Seniors eingefügt. Die vorhandenen Werte in diesen beiden Feldern werden jedoch als Dezimalzahlen formatiert und nicht als Prozentwerte. Um sie zu konvertieren, müssen Sie sie mit 100 multiplizieren.
- Geben Sie nach !Predicted! den Multiplikator *100 ein.
- Klicken Sie auf Übernehmen.
- Klicken Sie in der Attributtabelle auf die Schaltfläche Ausgewählte Datensätze anzeigen.
Die <Null>-Werte in der Spalte Percent Seniors wurden ersetzt. Zeilen, die nicht ausgewählt wurden, bleiben unverändert.
- Klicken Sie über der Attributtabelle auf Löschen, um die Auswahl aufzuheben.
- Schließen Sie die Attributtabelle.
Die Karte symbolisieren
Schließlich symbolisieren Sie den neuen Layer so, dass er dem ursprünglichen entspricht. Anstatt die Symbolisierungsparameter nacheinander festzulegen, importieren Sie sie aus dem Layer Powiaty_Seniors.
- Deaktivieren Sie im Bereich Inhalt die Option Powiaty_Seniors outlines und klicken Sie auf Interpolated_Polygons, um sie auszuwählen.
- Klicken Sie auf dem Menüband auf der Registerkarte Feature-Layer in der Gruppe Darstellung auf Importieren.
Das Fenster Symbolisierung importieren wird angezeigt.
- Wählen Sie im Fenster Symbolisierung importieren für Symbolisierungs-Layer den Layer Powiaty_Seniors aus.
- Klicken Sie auf Übernehmen und dann auf OK.
Die Symbolisierung von Areal_Interpolation_Polygons entspricht jetzt der des Layers Powiaty_Seniors, Ihres Ausgangs-Layers, aber die Daten weisen keine Lücken mehr auf.
- Klicken Sie auf der Symbolleiste für den Schnellzugriff auf die Schaltfläche Speichern.
Der Prozess der Ersetzung von Werten als Ersatz für fehlende Daten wird "Anrechnung" genannt. Oftmals werden Werte unter Verwendung des Durchschnitts des verbleibenden Datasets angerechnet. Wenn es sich bei den Daten um räumliche Daten handelt, stehen Ihnen bessere Optionen zur Verfügung, da Sie davon ausgehen können, dass Dinge, die näher beieinander liegen, einander ähnlicher sind als Dinge, die weiter auseinander liegen. In diesem Lernprogramm haben Sie mithilfe der Flächeninterpolation eine kontinuierliche Oberfläche für ganz Polen erstellt, um den prozentualen Anteil der Bevölkerung zu modellieren, der älter als 65 Jahre ist. Dann haben Sie Stichproben dieser Oberfläche genommen, um die Werte für die Polygone vorherzusagen, für die Daten fehlten.
Teilen Sie den Lesern Ihrer Karten in jedem Fall mit, dass es sich bei einigen Werten um angerechnete Werte handelt. Dies können Sie mithilfe von Beschriftungen, Listen oder Symbolisierungen tun. Wenn Ihre Karte Bestandteil eines Berichts ist, können Sie die Anrechnungsmethode beschreiben.
Das Werkzeug Fehlende Werte ausfüllen erfüllt denselben Zweck. Bei einigen Datasets erzielt dieses Werkzeug bessere Ergebnisse. Für andere wiederum eignet sich die Geostatistik besser. Bevor Sie nicht beide ausprobiert haben, ist es schwierig zu entscheiden, welcher Weg der bessere ist. Wenn aber der räumliche Übergang zwischen den Werten nicht nahtlos erfolgt, wird empfohlen, das Werkzeug Fehlende Werte ausfüllen zu verwenden.
Hinweis:
Als zusätzliche Herausforderung können Sie das Werkzeug Fehlende Werte ausfüllen im Bereich Geoverarbeitung ausfindig machen und zum Berechnen der fehlenden Werte im Layer Powiaty_Seniors verwenden. Vergleichen Sie Ihre Ergebnisse mit den tatsächlichen Werten im Dataset Powiaty_full_dataset, das Sie im Bereich Katalog aufrufen können. Öffnen Sie dazu den Katalogbereich, blenden Sie den Ordner Karten ein, und doppelklicken Sie auf die Karte Full Dataset.
Weitere Informationen finden Sie unter Fehlende Werte ausfüllen (Space Time Pattern Mining) und im ArcUser-Artikel Dealing with Missing Data.
Weitere Lernprogramme finden Sie in der Lernprogrammgalerie.