Eine Data Pipeline konstruieren

Um das von den Projektbeteiligten gewünschte endgültige Dataset zu erstellen, muss Ihre Data Pipeline die Daten transformieren, indem die Verortung aktiviert wird, nicht benötigte Attribute entfernt werden und neue Felder berechnet werden.

Sie werden die Ausgangstabelle mit den Informationen über die Investitionsprojekte hinzufügen, das Dataset filtern, seine Geometrie mit Koordinaten erstellen, die Daten neu projizieren und ein Feld berechnen.

Eine Data Pipeline erstellen

Zuerst müssen Sie sich bei ArcGIS Online anmelden und eine leere Data Pipeline erstellen.

  1. Melden Sie sich bei Ihrem ArcGIS-Organisationskonto an.
    Hinweis:

    Wenn Sie über kein Organisationskonto verfügen, informieren Sie sich über die Optionen für den Zugriff auf die Software.

  2. Klicken Sie im Menüband auf die Schaltfläche "App-Startprogramm". Wählen Sie Data Pipelines aus.

    Schaltfläche "Data Pipelines"

    Daraufhin wird eine Browser-Registerkarte mit einer Galerie aller Ihrer vorhandenen Data Pipelines geöffnet.

  3. Klicken Sie auf Data Pipeline erstellen.

    Schaltfläche "Data Pipeline erstellen"

    Der Data Pipelines-Editor wird angezeigt. In dieser Bearbeitungsumgebung können Sie Dateneingaben hinzufügen, auf Werkzeuge zum Transformieren von Daten zugreifen und die verarbeiteten Daten in einen Feature-Layer übertragen.

    Data Pipelines-Editor

    Während der Bearbeitung im Data Pipelines-Editor sind Sie mit einer Rechenressource verbunden, die im Dialog "Verbindungsdetails" angegeben ist.

    Dialog "Verbindungsdetails"

    Hinweis:

    Durch die Verwendung von ArcGIS Data Pipelines werden Credits verbraucht. Credits werden dann verbraucht, wenn sich die Editorseite im Status Verbunden befindet. Weitere Informationen zum Credit-Verbrauch und zu ArcGIS Data Pipelines finden Sie unter Verbraucht Data Pipelines Credits und Rechenressourcen.

Eine CSV-Tabelle als Eingabe hinzufügen

Nachdem Sie den Data Pipelines-Editor geöffnet haben, können Sie Ihr erstes Eingabe-Dataset hinzufügen. Dies ist die Tabelle der Investitionsprojekte (Capital Projects) des DPR. Da diese Tabelle häufig aktualisiert wird, wäre eine exportierte Tabelle schnell veraltet. Deshalb sollten Sie auf die CSV-Tabelle direkt an ihrer Quelle zugreifen.

  1. Öffnen Sie die OpenData-Seite von New York City (NYC OpenData) für das Dataset Capital Project Tracker.

    Daraufhin wird eine Browser-Registerkarte mit einer Übersicht über das Dataset Capital Project Tracker geöffnet. Dort sind wertvolle Informationen enthalten, zum Beispiel die Häufigkeit der Aktualisierung des Datasets, das Datum der letzten Aktualisierung und eine Beschreibung der einzelnen Spalten in der CSV-Tabelle.

    Übersichtsseite für Capital Project Tracker

  2. Klicken Sie auf die Schaltfläche Exportieren.

    Schaltfläche "Exportieren"

    Das Fenster Dataset exportieren wird angezeigt.

  3. Klicken Sie im Fenster Dataset exportieren auf die Schaltfläche API-Endpunkt.

    Schaltfläche "API-Endpunkt"

    Hinweis:

    Wegen der Änderungen, die im Laufe der Zeit in diesem Dataset stattfinden, kann die Anzahl der Zeilen, die Sie in diesem Lernprogramm in diesem Dataset und in anderen Datasets sehen, leicht von den dargestellten Bildern abweichen.

    Der API-Endpunkt ermöglicht den Zugriff auf das Dataset über eine URL.

    Daraufhin wird eine Warnung angezeigt. Darin wird darauf hingewiesen, dass Sie nur auf 1.000 Zeilen von den 2.542‏ Zeilen, die in diesem Dataset enthalten sind, zugreifen können. Dieses Limit werden Sie später auf 3.000 Zeilen erhöhen.

    Warnung, die darauf hinweist, dass das Standard-API-Limit überschritten wurde

    Obwohl Data Pipelines auch JSON-Datenformate akzeptiert, sollten Sie das Datenformat auf CSV festlegen.

  4. Wählen Sie für Datenformat das Format CSV aus.

    Option "Datenformat"

    Als Nächstes sollten Sie die URL für dieses Dataset kopieren.

  5. Klicken Sie auf In Zwischenablage kopieren.

    Schaltfläche "In Zwischenablage kopieren"

    Jetzt können Sie diese CSV-Tabelle als Eingabe des TypsÖffentliche URL zu Ihrer Data Pipeline hinzufügen.

  6. Klicken Sie auf der Werkzeugleiste Editor auf Eingaben. Wählen Sie im Bereich Eingaben unter Datei die Option Öffentliche URL aus.

    Option "Öffentliche URL"

    Hinweis:

    Damit die Namen der Schaltflächen auf der Werkzeugleiste Editor angezeigt werden, klicken Sie auf die Schaltfläche Einblenden am unteren Rand der Werkzeugleiste.

    Das Fenster URL hinzufügen wird angezeigt.

  7. Klicken Sie in das Textfeld URL, und fügen Sie mit Strg+V die URL ein, die Sie von der Website "NYC OpenData" kopiert haben.

    URL-Parameter

    Der Parameter Datenformat wird automatisch ausgewählt.

    Für die URL gilt ein Limit von 1.000 Zeilen aus dem Quellen-Dataset. Um diese Einschränkung zu umgehen, sollten Sie der vorhandenen URL einen URL-Parameter hinzufügen, mit dem dieses Limit auf 3.000 Zeilen erhöht wird. Das Limit sollte auf 3.000 Zeilen erhöht werden, da in der Tabelle 2.542 Zeilen enthalten sind. Ein Limit von 3.000 Zeilen reicht für die aktuelle Größe des Datasets aus und lässt auch zukünftiges Wachstum zu.

  8. Klicken Sie einmal auf das Ende der von Ihnen eingefügten URL. Geben Sie den Text ?$limit=3000 ein.

    Aktualisierte URL mit einem Limit von 3.000 Zeilen

    Die erste Eingabe ist vollständig.

  9. Klicken Sie auf Hinzufügen.

    Der Zeichenfläche wird das Element Öffentliche URL hinzugefügt.

    Erstes Eingabeelement

    Der Name des Elements wurde aus dem Namen der CSV-Tabelle, auf die Sie zugegriffen haben, abgeleitet. Diesen Namen sollten Sie ändern.

  10. Klicken Sie auf der Aktionsleiste für das Element auf die Schaltfläche Umbenennen.

    Schaltfläche "Umbenennen"

  11. Löschen Sie den Text im Textfeld, geben Sie den Text Capital Project Tracker ein, und drücken Sie die Eingabetaste. Erweitern Sie das Element, damit der Name sichtbar ist.

    Umbenanntes Element

    Da das Element in der Zeichenfläche ausgewählt ist, wurde der Bereich Öffentliche URL geöffnet. Hier können Sie das auf der Zeichenfläche ausgewählte Element konfigurieren oder neu konfigurieren.

    Bereich "Öffentliche URL"

    Als Nächstes sollten Sie eine Vorschau des von Ihnen hinzugefügten Datasets anzeigen.

  12. Klicken Sie im Bereich Öffentliche URL auf Vorschau.

    Schaltfläche "Vorschau"

    Das Vorschaufenster wird angezeigt. Im Moment wird die Tabellenvorschau angezeigt. In der Vorschau sehen Sie, wie Ihre Daten aussehen werden, wenn Sie die Data Pipeline ausführen.

    Hinweis:

    Sie können eine Vorschau Ihrer Daten auch anzeigen, indem Sie auf der Aktionsleiste eines Elements auf die Schaltfläche Vorschau klicken.

    Am oberen Rand der Tabelle ist angegeben, dass die Anzahl der Datensätze 2.554 beträgt. Dies stimmt mit der Anzahl der Zeilen auf der OpenData-Website möglicherweise nicht überein. Diese Zahlen stimmen dann nicht überein, wenn einige der Datensätze ein Zeichen enthalten, das aus einem einzeiligen Datensatz einen Datensatz mit mehreren Zeilen macht. Im Bereich Öffentliche URL können Sie dies berücksichtigen.

    Tabellenvorschau

  13. Aktivieren Sie im Bereich Öffentliche URL den Parameter Hat mehrzeilige Daten.

    Parameter "Hat mehrzeilige Daten"

  14. Klicken Sie auf die Schaltfläche Vorschau.

    Die Vorschau wird aktualisiert. Die Anzahl der Datensätze beträgt jetzt 2.542.

    Anzahl der Vorschaudatensätze

  15. Führen Sie einen Bildlauf durch die Tabelle durch, um sich die Daten von NYC OpenData genau anzusehen.
  16. Klicken Sie auf die Schaltfläche Kartenvorschau.

    Die Schaltfläche "Kartenvorschau"

    Da dies nur eine Tabelle ist und keine Geometrie definiert wurde, ist keine Kartenvorschau verfügbar. Um die Verfügbarkeit einer Kartenvorschau werden Sie sich in einem späteren Abschnitt kümmern.

  17. Klicken Sie auf die Schaltfläche Schema.

    Schaltfläche "Schema"

    Damit wird eine Liste aller Felder im Dataset mit ihren Feldtypen aufgelistet. Im Rest dieses Lernprogramms werden Sie einige dieser Felder zum Transformieren Ihrer Daten verwenden, zum Beispiel currentphase, designstart, latitude und longitude.

    Schema des Datasets

  18. Klicken Sie auf die Schaltfläche Meldungen.

    Schaltfläche "Meldungen"

    Hier werden alle Warnungen oder Fehlermeldungen in Ihrem Vorschau-Dataset aufgelistet.

  19. Schließen Sie das Vorschaufenster.

Daten nach Attribut filtern

Nachdem Sie die CSV-Tabelle zur Data Pipeline hinzugefügt haben, sollten Sie mit einem Werkzeugelement das Dataset so filtern, dass nur die Investitionsprojekte angezeigt werden, deren aktuelle Phase Bau lautet und die falsche Breiten- und Längengradwerte enthalten.

  1. Klicken Sie auf der Werkzeugleiste Editor auf Werkzeuge.

    Schaltfläche "Werkzeuge"

    Der Bereich Werkzeuge wird angezeigt. Mit den nach Kategorie aufgelisteten Werkzeugen können Sie die Datasets in Ihrer Data Pipeline bearbeiten. Fügen Sie das Werkzeug Nach Attribut filtern hinzu, damit Sie alle Zeilen, deren aktuelle Phase nicht Bau lautet, entfernen können. Sie sollten auch alle Zeilen herausfiltern, bei denen als Längen- oder Breitengrad der Wert 0 lautet.

  2. Klicken Sie im Fenster Werkzeuge unter Bereinigen auf Nach Attribut filtern.

    Werkzeug "Nach Attribut filtern"

    Der Zeichenfläche wird ein Element hinzugefügt. Es muss mit einem vorhandenen Element, das Daten enthält, verbunden werden. Anschließend muss es konfiguriert werden.

  3. Verschieben Sie das Element Nach Attribut filtern rechts neben das Element Öffentliche URL.

    Element "Nach Attribut filtern"

  4. Klicken Sie im Bereich Nach Attribut filtern unter Eingabe-Dataset auf Dataset. Wählen Sie im Fenster Dataset auswählen das Dataset Capital Project Tracker aus.

    Option "Capital Project Tracker"

    Die zwei Elemente werden verbunden. Wenn später die Data Pipeline ausgeführt wird, dann fließen die Daten von der CSV-Datei in das Werkzeug Nach Attribut filtern.

    Verbundene Elemente "Öffentliche URL" und "Nach Attribut filtern"

    Hinweis:

    Elemente in einer Data Pipeline können Sie auch verbinden, indem Sie den Zeiger vom Ausgabeport des einen Elements zum Eingabeport eines anderen Elements ziehen.

    Als Nächstes sollten Sie den Filter so konfigurieren, dass alle Zeilen mit dem Wert 0 für Breiten- oder Längengrad ausgeschlossen und nur die Zeilen, deren aktuelle Phase den Wert Bau hat, angezeigt werden.

  5. Klicken Sie im Bereich Nach Attribut filtern auf Neue Abfrage erstellen.

    Schaltfläche "Neue Abfrage erstellen"

    Das Fenster Abfrage-Manager wird angezeigt.

  6. Stellen Sie sicher, dass die Option Ausdruck ausgewählt ist, und klicken Sie auf Weiter.

    Option "Ausdruck"

  7. Legen Sie beim ersten Ausdruck das Feld auf latitude und den Operator auf ist ungleich fest. Geben Sie als Wert den Wert 0 ein.

    Erster Ausdruck

  8. Klicken Sie auf die Schaltfläche Ausdruck.

    Schaltfläche "Ausdruck"

  9. Erstellen Sie einen zweiten Ausdruck mit dem Text longitude ist ungleich 0.

    Zweiter Ausdruck

  10. Fügen Sie einen weiteren Ausdruck zum Abfragen der Zeilen mit dem folgenden Text hinzu: currentphase ist gleich Bau.
    Hinweis:

    Anstatt den Wert einzugeben, können Sie ihn auch in der Dropdown-Liste auswählen.

    Dritter Ausdruck

  11. Klicken Sie auf Hinzufügen.

    Als Nächstes sollten Sie die Ergebnisse überprüfen.

  12. Klicken Sie im Bereich Nach Attribut filtern auf Vorschau.

    Das Vorschaufenster wird angezeigt. Unterhalb des Titels dieser Tabelle wird die Anzahl der Datensätze angezeigt. Zuvor waren dies über 2.500 Datensätze. Nachdem die Filter angewendet wurden, sind jetzt weniger als 200 übrig.

  13. Führen Sie einen Bildlauf durch die Tabelle durch, um sich die Werte für die Felder latitude, longitude und currentphase anzusehen.

    Diese Werte erfüllen die Kriterien Ihrer Abfrage.

  14. Schließen Sie das Vorschaufenster.

    Als der Zeichenfläche das Werkzeugelement hinzugefügt wurde, erhielt es den Standardnamen Nach Attribut filtern. Diesen Namen sollten Sie ändern, damit er aussagekräftiger ist.

  15. Klicken Sie auf der Aktionsleiste für das Element auf Umbenennen, und geben Sie Filter for Construction Phase ein. Passen Sie die Größe des Elements an, damit der Name sichtbar ist.

    Umbenanntes Filterelement

    Bevor Sie zusätzliche Elemente hinzufügen, sollten Sie Ihre Data Pipeline speichern.

  16. Klicken Sie auf der Werkzeugleiste Editor auf Speichern und öffnen und anschließend auf Speichern unter.

    Option "Speichern unter"

    Das Fenster Data Pipeline speichern wird angezeigt.

  17. Geben Sie als Titel den Text Capital Projects Data Pipeline ein.

    Titel der Data Pipeline

  18. Klicken Sie auf Speichern.

    Die Data Pipeline wird gespeichert.

Punktgeometrie erstellen

Sie sollten die Spalten für Breiten- und Längengrad im gefilterten Dataset verwenden, um dieses Dataset mit einer Geometrie zu versehen, die auf der Karte angezeigt werden kann.

  1. Klicken Sie auf der Werkzeugleiste Editor auf Werkzeuge. Klicken Sie im Bereich Werkzeuge unter Konstruieren auf Geometrie erstellen.

    Der Zeichenfläche wird das Element Geometrie erstellen hinzugefügt.

  2. Verschieben Sie das Element Geometrie erstellen rechts neben das Element Nach Attribut filtern.

    Element "Geometrie erstellen"

  3. Klicken Sie auf den Ausgabeport des Elements Nach Attribut filtern, und ziehen Sie den Zeiger zum Eingabeport des Elements Geometrie erstellen.

    Verbundene Elemente "Nach Attribut filtern" und "Geometrie erstellen"

    Die zwei Elemente werden verbunden. Als Nächstes können Sie das Element Geometrie erstellen konfigurieren. Da diese Tabelle Werte für den Längen- und den Breitengrad enthält, können Sie eine Punktgeometrie erstellen.

  4. Wählen Sie im Bereich Geometrie erstellen für Geometrietyp den Typ Punkt aus. Wählen Sie für Geometrieformat das Format XYZ aus.

    Parameter "Geometrietyp" und "Geometrieformat"

    Zusätzliche Parameter werden angezeigt. Mit diesen Parametern können Sie bestimmen, welche Felder in Ihrer Tabelle die X-, Y- und Z-Werte enthalten. Da Ihr Dataset keine Z-Werte enthält, wird dieser Parameter nicht verwendet.

  5. Wählen Sie für X-Feld das Feld longitude aus. Wählen Sie für Y-Feld das Feld latitude aus.

    Parameter "X-Feld" und "Y-Feld"

  6. Klicken Sie auf die Schaltfläche Vorschau.
  7. Klicken Sie im Vorschaufenster auf die Schaltfläche Kartenvorschau.

    Die Positionen des Investitionsprojektes sind auf der Karte sichtbar. Wenn Sie auf einzelne Features klicken, dann werden ihre Attribute in einem Pop-up-Fenster angezeigt.

    Positionen des Investitionsprojektes auf einer Karte

  8. Schließen Sie das Vorschaufenster.

Punktdaten projizieren

Ihre Punkte wurden mit Breiten- und Längengradwerten im geographischen Koordinatensystem WGS 1984 erstellt. Für New York City ist dieses Koordinatensystem nicht ideal. Sie sollten Ihre Daten in ein besser geeignetes Koordinatensystem projizieren.

Hinweis:

Wenn Sie mit Koordinatensystemen nicht vertraut sind, dann finden Sie weitere Informationen unter Koordinatensysteme: Was ist der Unterschied?.

  1. Klicken Sie auf der Werkzeugleiste Editor auf Werkzeuge. Klicken Sie im Bereich Werkzeuge unter Format auf Geometrie projizieren.

    Der Zeichenfläche wird das Element Geometrie projizieren hinzugefügt.

  2. Verschieben Sie das Element Geometrie projizieren rechts neben das Element Geometrie erstellen.
  3. Klicken Sie auf den Ausgabeport des Elements Geometrie erstellen, und ziehen Sie den Zeiger zum Eingabeport des Elements Geometrie projizieren.

    Verbundene Elemente "Geometrie erstellen" und "Geometrie projizieren"

    Die zwei Elemente werden verbunden. Als Nächstes können Sie das Element Geometrie projizieren konfigurieren.

  4. Klicken Sie im Bereich Geometrie projizieren unter Raumbezug auf Koordinatensysteme durchsuchen.

    Parameter "Raumbezug"

    Als projiziertes Koordinatensystem sollten Sie NAD 1983 (2011) StatePlane New York Long Isl FIPS 3104 (Meters) verwenden. Die ID-Nummer lautet 6538.

  5. Geben Sie im Fenster Koordinatensysteme durchsuchen den Text 6538 in das Suchfeld ein. Wählen Sie NAD 1983 (2011) StatePlane New York Long Isl FIPS 3104 (Meters) aus.

    Fenster "Koordinatensysteme durchsuchen"

  6. Klicken Sie auf Fertig.

Ein neues Feld berechnen

Als letzten Schritt beim Vorbereiten Ihres anfänglichen Eingabe-Datasets sollten Sie ein neues Feld berechnen lassen. Das Dataset enthält das Feld designstart. Dort wird aufgezeichnet, wann ein Projekt begonnen hat. Sie sollten ein zusätzliches Feld berechnen lassen, das die Zeit in Jahren und Tagen enthält, die seit dem Beginn eines Projektes verstrichen ist.

  1. Klicken Sie auf der Werkzeugleiste Editor auf Werkzeuge. Klicken Sie im Bereich Werkzeuge unter Konstruieren auf Feld berechnen.

    Der Zeichenfläche wird das Element Feld berechnen hinzugefügt.

  2. Verschieben Sie das Element Feld berechnen rechts neben das Element Geometrie projizieren.
  3. Klicken Sie auf den Ausgabeport des Elements Geometrie projizieren, und ziehen Sie den Zeiger zum Eingabeport des Elements Feld berechnen.

    Verbundene Elemente "Geometrie projizieren" und "Feld berechnen"

    Die zwei Elemente werden verbunden. Als Nächstes können Sie das Element Feld berechnen konfigurieren. Als Erstes sollten Sie dem neuen Feld einen Namen geben.

  4. Geben Sie im Bereich Feld berechnen unter Neuer Feldname den Text Elapsed_Time ein.

    Parameter "Neuer Feldname"

    Hinweis:

    Feldnamen dürfen keine Sonderzeichen, wie zum Beispiel Leerzeichen, enthalten.

    Als Nächstes müssen Sie den Typ für dieses Feld auswählen. Da dieses Feld Text- und numerische Zeichen enthalten wird, muss es ein Zeichenfolge-Feld sein.

  5. Wählen Sie als Neuer Feldtyp den Typ Zeichenfolge aus.

    Parameter "Neuer Feldtyp"

    Als Nächstes müssen Sie einen Ausdruck zum Berechnen des Feldes erstellen. Dieses Werkzeug verwendet ArcGIS Arcade-Ausdrücke zum Berechnen von Feldern.

    Hinweis:

    Weitere Informationen zu ArcGIS Arcade finden Sie unter Learn ArcGIS Arcade in Four Easy Steps.

  6. Klicken Sie unter Arcade-Ausdruck auf Arcade-Ausdruck erstellen.

    Schaltfläche "Arcade-Ausdruck erstellen"

    Das Fenster Arcade-Ausdruck wird angezeigt. Hier können Sie Arcade-Ausdrücke zum Berechnen von Feldwerten erstellen. Einen Code, der die Anzahl der Jahre und Tage seit dem Beginn eines Investitionsprojektes zurückgibt, können Sie auch kopieren und einfügen.

    Fenster "Arcade-Ausdruck"

  7. Löschen Sie im Fenster Arcade-Ausdruck den Beispielcode.
  8. Kopieren Sie den folgenden Code, und fügen Sie ihn im Fenster Arcade-Ausdruck ein:

    //Convert time between 2 fields to count years and days 
    
    //Determine the total number of days
    var TotalDays = DateDiff(now(), $record.designstart, "days")
    
    //Determine the number of days
    var RemainderDays = Floor(TotalDays % 365)
    
    //Determine the number of years
    var RemainderYears = Floor(DateDiff(now(), $record.designstart, "years"))
    
    //Format the final text to account for year(s) and day(s)
    if(RemainderYears == 1 && RemainderDays == 1){
      return RemainderYears + " year and " + RemainderDays + " day"
    }
    else if (RemainderYears == 1 && RemainderDays != 1){
      return RemainderYears + " year and " + RemainderDays + " days"
    }
    else if (RemainderYears != 1 && RemainderDays == 1){
      return RemainderYears + " years and " + RemainderDays + " day"
    }
    else{
      return RemainderYears + " years and " + RemainderDays + " days"
    }

    Der Arcade-Ausdruck

    Das gewünschte Format dieser Berechnung lautet X Jahre und Y Tage. Dazu bestimmt der Ausdruck zuerst die Anzahl der Tage seit dem Beginn eines Investitionsprojektes. Da die Anzahl der Tage mehr als ein Jahr ergeben kann, dividiert der Code die Anzahl der Tage durch 365 und gibt den Rest zurück. Damit wird der Y-Wert im gewünschten Format zurückgegeben. Danach berechnet der Ausdruck die Anzahl der Jahre seit dem Beginn des Projektes. Damit wird der X-Wert im gewünschten Format zurückgegeben. Der letzte Teil des Ausdrucks, der auf Zeile 12 beginnt, formatiert basierend auf der Anzahl der Tage oder Jahre seit dem Beginn des Projektes den Text für die Jahre und Tage als Singular oder Plural.

  9. Klicken Sie auf Speichern.

    Das Feld Elapsed_Time wird der Tabelle hinzugefügt und berechnet.

  10. Klicken Sie im Bereich Feld berechnen auf Vorschau.
  11. Führen Sie im Vorschaufenster einen Bildlauf nach unten zum Feld Elapsed_Time durch.

    Das Feld "Elapsed_Time"

    Für jedes Projekt wird die Anzahl der Jahre und Tage seit dem Beginn des Projektes in einem verständlichen Format aufgezeichnet.

  12. Schließen Sie das Vorschaufenster.

    Damit klar ist, was in diesem Feld berechnet wird, sollten Sie dieses Element umbenennen.

  13. Benennen Sie das Element Feld berechnen in Calculate Elapsed Time um.
  14. Erweitern Sie das Element, damit der vollständige Name sichtbar ist.

    Aktualisiertes Element "Feld berechnen"

    Als Letztes sollten Sie Ihre Data Pipeline speichern.

  15. Klicken Sie auf der Werkzeugleiste Editor auf Speichern und öffnen und anschließend auf Speichern.

Bisher haben Sie eine CSV-Tabelle hinzugefügt und mit dem Transformieren der Daten der Investitionsprojekte begonnen. Außerdem haben Sie die Daten gefiltert, sie mit einer Punktgeometrie mit Koordinaten versehen, sie in ein geeignetes Koordinatensystem projiziert und ein Feld zum Berechnen der verstrichenen Zeit seit dem Beginn eines Projektes hinzugefügt.


Räumliche Verbindungen erstellen

Zu diesem Zeitpunkt sind die Daten zu den Investitionsprojekten hinzugefügt und teilweise formatiert worden, aber sie brauchen noch eine Attribuierung aus anderen Datasets. Für jedes Investitionsprojekt müssen Sie herausfinden, in welches Berechnungsgebiet und welchen Gemeindebezirk es fällt. Sowohl die Berechnungsgebiete des Stadtteils als auch die Gemeindebezirke liegen als öffentlich verfügbare Polygon-Datasets vor. Sie fügen diese beiden Datasets zu Ihrer Data Pipeline hinzu und verwenden räumliche Verbindungen, um die Namen der Stadtteile und Bezirke an die einzelnen Investitionsprojekte anzuhängen.

Eine GeoJSON als Eingabe hinzufügen

Zunächst fügen Sie das Dataset mit dem Berechnungsgebiet des Stadtteils Ihrer Data Pipeline hinzu. Diese sind auf der Website "NYC OpenData" im GeoJSON-Format verfügbar.

  1. Öffnen Sie auf der Website "NYC OpenData" die Seite für das Dataset 2020 Neighborhood Tabulation Areas (NTAs) - Tabular.

    Daraufhin wird eine Browser-Registerkarte mit einer Übersicht über das Dataset 2020 Neighborhood Tabulation Areas (NTAs) - Tabular geöffnet. Wie das Dataset Capital Project Tracker bietet diese Seite einen Überblick über das Dataset und die Häufigkeit der Updates.

    Übersichtsseite des Berechnungsgebiets des Stadtteils

  2. Klicken Sie auf die Schaltfläche Exportieren.

    Schaltfläche "Exportieren"

    Das Fenster Dataset exportieren wird angezeigt. Da dieses Dataset weniger als 1.000 Zeilen umfasst, müssen Sie nicht zu URL wechseln wie im Dataset Capital Project Tracker.

  3. Klicken Sie im Fenster Dataset exportieren auf die Schaltfläche API-Endpunkt.

    Schaltfläche "API-Endpunkt"

    Hinweis:

    Wegen der Änderungen, die im Laufe der Zeit in diesem Dataset stattfinden, kann die Anzahl der Zeilen, die Sie in diesem Dataset sehen, leicht von dem dargestellten Bild abweichen.

    Das standardmäßig aufgelistete Format ist JSON. Um dieses Dataset zur Data Pipeline hinzuzufügen und eine Polygongeometrie zu erstellen, ist es jedoch sinnvoller, das GeoJSON-Format zu verwenden.

  4. Wählen Sie für Datenformat das Format GeoJSON aus.

    Option "GeoJSON"

    Als Nächstes kopieren Sie die URL für dieses Dataset.

  5. Klicken Sie auf In Zwischenablage kopieren.

    Fügen Sie diese GeoJSON als Eingabe des Typs Öffentliche URL zu Ihrer Data Pipeline hinzu.

  6. Klicken Sie im Data Pipelines-Editor auf der Werkzeugleiste Editor auf Eingaben. Wählen Sie im Bereich Eingaben unter Datei die Option Öffentliche URL aus.

    Option "Öffentliche URL"

    Das Fenster URL hinzufügen wird angezeigt.

  7. Fügen Sie für URL die URL ein, die Sie von der Website "NYC OpenData" kopiert haben.

    URL-Parameter

    Der Parameter Datenformat wird automatisch ausgewählt.

  8. Klicken Sie auf Hinzufügen.

    Der Zeichenfläche wird das Element Öffentliche URL hinzugefügt.

    Zweites Eingabeelement

    Auch dieser Name ist nicht intuitiv. Benennen Sie dieses Element um.

  9. Benennen Sie das Element Öffentliche URL in Neighborhood Tabulation Areas um.
  10. Passen Sie die Größe des Elements Öffentliche URL an, sodass der Name sichtbar ist.
  11. Verschieben Sie das Element unter das Element Geometrie projizieren.

    Dataset "Neighborhood Tabulation Areas"

    Als Nächstes zeigen Sie eine Vorschau des von Ihnen hinzugefügten Datasets an.

  12. Klicken Sie im Bereich Öffentliche URL auf Vorschau.

    Vorschaufenster

    Beobachten Sie im Vorschaufenster die Felder, die mit diesem Dataset bereitgestellt werden. Das Feld ntaname ist das Attribut, das Sie dem Punkt-Layer der Investitionsprojekte mithilfe einer räumlichen Verbindung hinzufügen werden.

  13. Klicken Sie auf die Schaltfläche Kartenvorschau.

    Es wird eine Karte angezeigt, in der die Stadtteile als Polygone eingezeichnet sind.

    Kartenvorschau

  14. Schließen Sie das Vorschaufenster.

Polygondaten projizieren

Wie die Punkte des Investitionsprojekts verwendet auch das GeoJSON der Stadtteile das geographische Koordinatensystem WGS 1984. Daher fügen Sie ein anderes Werkzeug Geometrie projizieren hinzu, um die Stadtteile auf dieselbe State Plane-Zone zu projizieren, die Sie für die Standorte des Investitionsprojekts verwendet haben. Um Zeit zu sparen, kopieren Sie das vorhandene Element Geometrie projizieren.

  1. Wählen Sie auf der Zeichenfläche das Element Geometrie projizieren aus.
  2. Drücken Sie Strg+C, um das Element zu kopieren.
  3. Drücken Sie Strg+V, um das Element auf der Zeichenfläche einzufügen.
  4. Verschieben Sie das Element Geometrie projizieren rechts neben das Element Öffentliche URL für Neighborhood Tabulation Areas.

    Geometrieelement projizieren

  5. Klicken Sie auf den Ausgabeport des Elements Öffentliche URL, und ziehen Sie den Zeiger zum Eingabeport des Elements Geometrie projizieren.

    Verbundene Elemente "Öffentliche URL" und "Geometrie projizieren"

    Die zwei Elemente werden verbunden. Da Sie das Element kopiert haben, ist das Koordinatensystem bereits ausgewählt. Das Stadtteil-Dataset verwendet jetzt das richtige Koordinatensystem.

Räumliches Verbinden von Investitionsprojekten und Stadtteilen

Nachdem Ihre beiden Datasets nun dasselbe Koordinatensystem verwenden, fügen Sie Ihrer Data Pipeline eine räumliche Verbindung hinzu. Die räumliche Verbindung bestimmt, in welchem Stadtteil jedes Investitionsprojekt liegt, und fügt die Stadtteilattribute dem Punkt des Investitionsprojekts hinzu.

  1. Klicken Sie auf der Werkzeugleiste Editor auf Werkzeuge. Klicken Sie im Bereich Werkzeuge unter Integrieren auf Verbinden.

    Der Zeichenfläche wird das Element Verbinden hinzugefügt.

  2. Verschieben Sie das Element Verbinden rechts neben die Elemente Feld berechnen und Geometrie projizieren.

    Element verbinden

    Als Nächstes verbinden Sie die Elemente Feld berechnen und Geometrie projizieren mit dem Element Verbinden. Das Element Verbinden hat zwei Eingabeports. Der obere Eingabeport ist für das Ziel-Dataset bestimmt. Das Ziel-Dataset ist das Dataset, dem weitere Attribute hinzugefügt werden. Der untere Eingabeport ist für das Verbindungs-Dataset bestimmt. Dies ist das Dataset, das seine Attribute für das Ziel-Dataset freigibt. In diesem Fall sollen die Investitionsprojekte die Attribute des Stadtteil-Datasets erhalten. Daher ist das Element Feld berechnen das Ziel-Dataset und wird mit dem oberen Eingabeport verbunden.

  3. Klicken Sie auf den Ausgabeport des Elements Feld berechnen, und ziehen Sie den Zeiger zum oberen Eingabeport des Elements Verbinden. Klicken Sie auf den Ausgabeport des Elements Geometrie projizieren, und ziehen Sie den Zeiger zum unteren Eingabeport des Elements Verbinden.

    Verbundene Elemente "Feld berechnen", "Geometrie projizieren" und "Elemente verbinden"

    Die zwei Eingabeelemente werden mit dem Element Verbinden verbunden. Im Fenster Verbinden werden die Felder Ziel-Dataset und Verbinden-Dataset anhand der verknüpften Elemente ausgefüllt.

    Parameter "Ziel-Dataset" und "Verbinden Dataset"

    Als Nächstes legen Sie fest, dass das Element Verbinden eine räumliche Beziehung verwendet.

  4. Aktivieren Sie im Fenster Verbinden unter Räumliche Beziehung die Option Räumliche Beziehung verwenden.

    Parameter "Räumliche Beziehung verwenden"

    Zusätzliche Parameter werden angezeigt. Die Parameter Zielgeometrie und Geometrie verbindenwerden automatisch ausgefüllt. Sie müssen jedoch noch eine Räumliche Beziehung wählen. Diese definiert, wie die Ziel- und Verbindungs-Datasets verbunden werden. Da die Punkte des Investitionsprojekts in den Stadtteil-Polygons liegen, verwenden Sie die Beziehung Schneidet.

  5. Wählen Sie unter Räumliche Beziehung die Option Schneidet.

    Parameter "Räumliche Beziehung"

  6. Klicken Sie auf die Schaltfläche Vorschau.

    Das Vorschaufenster wird angezeigt. Dieses Dastaset repräsentiert weiterhin die Punkte des Investitionsprojekts. In der Tabellenvorschau stammen die zuerst angezeigten Felder von den Punkten des Investitionsprojekts.

  7. Führen Sie in der Tabellenvorschau einen Bildlauf bis zum Ende der Tabelle durch, wo sich das Feld ntaname befindet.

    Feld "ntaname"

    Die Felder ganz am Ende der Tabelle sind Felder aus den Stadtteilen. Jetzt wissen Sie, in welchen Stadtteil jedes Investitionsprojekt fällt.

    Je mehr Verbindungen Sie durchführen, desto unübersichtlicher wird die Anzahl der Felder, insbesondere da viele Felder nicht von den Projektbeteiligten gewünscht wurden. Löschen Sie daher später unnötige Attributfelder.

  8. Schließen Sie das Vorschaufenster.

    Im nächsten Abschnitt fügen Sie eine zweite räumliche Verbindung hinzu. Um Verwirrungen zu vermeiden, benennen Sie das erste Element Verbinden um.

  9. Benennen Sie das Element Verbinden in Neighborhood Join um.

    Umbenanntes Element "Verbinden"

Einen Feature-Layer als Eingabe hinzufügen

Einige Projektbeteiligte haben sich gewünscht, dass die endgültige Ausgabe auch Informationen zu dem Gemeindebezirk enthält, in den die einzelnen Investitionsprojekte fallen. Zu diesem Zweck verwenden Sie ein zweites Element Verbinden. Zunächst brauchen Sie jedoch das Polygon-Dataset, das die Gemeindebezirke enthält. Anstatt das Eingabeelement Öffentlich URL zu verwenden, fügen Sie das Eingabeelement Feature-Layer hinzu, da sich dieses Dataset in ArcGIS Online befindet.

  1. Klicken Sie auf der Werkzeugleiste Editor auf Eingaben. Wählen Sie im Bereich Eingaben unter ArcGIS die Option Feature-Layer.

    Option "Feature-Layer"

    Das Fenster Feature-Layer auswählen wird angezeigt. Sie können Datasets aus unterschiedlichen Quellen wie ArcGIS Living Atlas oder eigene Inhalte in ArcGIS Online hinzufügen.

  2. Klicken Sie auf Eigene Inhalte, und wählen Sie ArcGIS Online aus.

    Option "ArcGIS Online"

    Suchen Sie nach einem öffentlich verfügbaren Dataset aus New York City, das die Gemeindebezirke enthält.

  3. Geben Sie in das Suchfeld New York City Community District ein.
  4. Führen Sie einen Bildlauf nach unten bis zum Layer Community District durch, das Data Owner gehört.

    Feature-Layer "Community District"

    Da Feature-Layer mehrere Sublayer enthalten können, wählen Sie den Sublayer CommunityDistrict aus, um ihn zur Data Pipeline hinzuzufügen.

  5. Klicken Sie für Community District auf Layer auswählen. Wählen Sie CommunityDistrict.

    Sublayer "CommunityDistrict"

  6. Klicken Sie auf Hinzufügen.

    Der Zeichenfläche wird das Element Feature-Layer hinzugefügt.

  7. Verschieben Sie das Element Feature-Layer unter das Element Geometrie projizieren für das Stadtteil-Dataset.

    Feature-Layer-Element "CommunityDistrict"

    Als Nächstes zeigen Sie eine Vorschau des von Ihnen hinzugefügten Datasets an.

  8. Klicken Sie im Fenster Feature-Layer auf Vorschau.
  9. Führen Sie den Bildlauf durch die Vorschautabelle durch. Suchen Sie das Feld COMMDIST.

    Feld "COMMDIST"

    Das Feld COMMDIST ist das Attribut, das Sie dem Punkt-Layer der Investitionsprojekte mithilfe einer räumlichen Verbindung hinzufügen werden.

  10. Klicken Sie auf die Schaltfläche Kartenvorschau.

    Es wird eine Karte angezeigt, in der die Gemeinebezirke als Polygone eingezeichnet sind.

    Kartenvorschau

  11. Schließen Sie das Vorschaufenster.

Einen Feature-Layer projizieren

Das hinzugefügte Feature verwendet das projizierte Koordinatensystem Web Mercator (Auxiliary Sphere). Um die Genauigkeit der Daten zu gewährleisten, projizieren Sie diesen Feature-Layer so, dass er dasselbe Koordinatensystem verwendet wie die neu projizierten Punkte des Investitionsprojekts.

  1. Wählen Sie auf der Zeichenfläche eines der Elemente Geometrie projizieren aus.
  2. Drücken Sie Strg+C, um das Element zu kopieren.
  3. Drücken Sie Strg+V, um das Element auf der Zeichenfläche einzufügen.
  4. Verschieben Sie das Element Geometrie projizieren rechts neben das Element Feature-Layer.
  5. Klicken Sie auf den Ausgabeport des Elements Feature-Layer, und ziehen Sie den Zeiger zum Eingabeport des Elements Geometrie projizieren.

    Verbundene Elemente "Feature-Layer" und "Geometrie projizieren"

    Die zwei Elemente werden verbunden. Das Gemeindebezirk-Dataset verwendet jetzt das richtige Koordinatensystem.

Räumliches Verbinden von Investitionsprojekten und Gemeindebezirken

Nachdem das Gemeindebezirk-Dataset nun projiziert wurde, führen Sie eine zweite räumliche Verbindung durch, um zu bestimmen, in welchen Gemeindebezirk die einzelnen Investitionsprojekte fallen.

  1. Klicken Sie auf der Werkzeugleiste Editor auf Werkzeuge. Klicken Sie im Bereich Werkzeuge unter Integrieren auf Verbinden.

    Der Zeichenfläche wird das Element Verbinden hinzugefügt.

  2. Verschieben Sie das Element Verbinden rechts neben das erste Element Verbinden und das Element Geometrie projizieren.

    Element "Verbinden"

    Als Nächstes verbinden Sie das erste Elemente Verbinden und das Element Geometrie projizieren mit dem zweiten Element Verbinden. Das erste Element Verbinden wird der Ziel-Dataset-Parameter, und das Element Geometrie projizieren wird der Verbinden-Dataset-Parameter.

  3. Klicken Sie auf den Ausgabeport des ersten Elements Verbinden, und ziehen Sie den Zeiger zum oberen Eingabeport des zweiten Elements Verbinden. Klicken Sie auf den Ausgabeport des Elements Geometrie projizieren, und ziehen Sie den Zeiger zum unteren Eingabeport des zweiten Elements Verbinden.

    Verbundene Elemente "Geometrie projizieren" und "Elemente verbinden"

    Als Nächstes legen Sie fest, dass das zweite Element Verbinden eine räumliche Beziehung verwendet.

  4. Aktivieren Sie im Fenster Verbinden unter Räumliche Beziehung die Option Räumliche Beziehung verwenden.
  5. Wählen Sie unter Räumliche Beziehung die Option Schneidet.

    Parameter "Räumliche Beziehung"

  6. Klicken Sie auf die Schaltfläche Vorschau.

    Das Vorschaufenster wird angezeigt.

  7. Führen Sie in der Tabellenvorschau einen Bildlauf zum Ende der Tabelle durch.

    Tabellenvorschau mit dem Feld "COMMDIST"

    Die ersten Felder, die Sie sehen, stammen aus dem Investitionsprojekt-Dataset. Dann sehen Sie die Felder aus dem Stadtteil-Dataset. Am Ende der Tabelle sehen Sie die Felder des Gemeindebezirk-Datasets. Jetzt gibt es zu jedem Investitionsprojekt Informationen zu dem Gemeindebezirk, in den es fällt.

  8. Schließen Sie das Vorschaufenster.

    Da es noch ein weiteres Element Verbinden auf der Zeichenfläche gibt, benennen Sie dieses zweite Element Verbinden um, um Verwirrungen zu vermeiden.

  9. Benennen Sie das zweite Element Verbinden in Community District Join um. Passen Sie die Größe des Elements an, sodass der vollständige Elementname sichtbar ist.

    Umbenanntes Element "Verbinden"

  10. Speichern Sie Ihre Data Pipeline.

In diesem Modul haben Sie zwei öffentliche Polygon-Layer mit Attributierung hinzugefügt, die Sie dem Investitionsprojekt-Dataset hinzufügen wollten. Ein Dataset ist ein GeoJSON von der Website "NYC OpenData", das andere ist ein Feature-Layer aus ArcGIS Online. Anschließend haben Sie beide Datasets projiziert und räumlich mit dem Investitionsprojekt-Dataset verbunden.


Die Daten bereinigen

Nachdem Sie die Daten hinzugefügt und räumlich verbunden haben, sind alle Attribute, die von den Projektbeteiligten in verschiedenen Abteilungen angefordert wurden, verfügbar. Es sind jedoch noch viele weitere Felder vorhanden, die nicht benötigt werden und es erschweren, sich in der Attributtabelle zurechtzufinden. Außerdem tragen einige der gewünschten Felder Namen, die nicht leicht interpretiert werden können.

Als Nächstes sollten Sie die Attribute bereinigen, bevor die Ergebnisse in ein Ausgabe-Dataset geschrieben werden.

Felder auswählen

Zuerst sollten Sie nur die Felder auswählen, an denen Ihre Projektbeteiligten interessiert sind. Dies sind mehrere Felder im Dataset der Investitionsprojekte: Das Feld Time_Elapsed, das Sie berechnet haben, das Feld ntaname und das Feld COMMDIST.

  1. Klicken Sie auf der Werkzeugleiste Editor auf Werkzeuge. Klicken Sie im Bereich Werkzeuge unter Bereinigen auf Felder auswählen.

    Der Zeichenfläche wird das Element Felder auswählen hinzugefügt.

  2. Verschieben Sie das Element Felder auswählen rechts neben das zweite Verbinden-Element.

    Element "Felder auswählen"

    Als Nächstes müssen Sie die Elemente Verbinden und Felder auswählen verbinden.

  3. Klicken Sie auf den Ausgabeport des Elements Verbinden, und ziehen Sie den Zeiger zum Eingabeport des Elements Felder auswählen.

    Verbundene Elemente "Verbinden" und "Felder auswählen"

    Als Nächstes müssen Sie die Felder auswählen, die im Ausgabe-Dataset enthalten sein sollen.

  4. Klicken Sie im Bereich Felder auswählen unter Felder auf Feld.

    Parameter "Felder"

    Das Fenster Felder auswählen wird angezeigt. Wählen Sie die Felder aus, an denen Ihre Projektbeteiligten interessiert sind. Sie sollten auch das Feld GEOMETRY auswählen. Dieses Feld ist erforderlich, damit Ihre Ausgabe-Datasets als Punkte angezeigt werden können. Andernfalls wäre die Ausgabe ein nichträumlicher Feature-Layer oder eine gehostete Tabelle.

  5. Wählen Sie im Fenster Felder auswählen die folgenden Felder aus:
    • fmsid
    • currentphase
    • GEOMETRY
    • Elapsed_Time
    • ntaname
    • COMMDIST

    Fenster "Felder auswählen"

  6. Klicken Sie auf Fertig.
  7. Klicken Sie im Bereich Felder auswählen auf Vorschau.

    Das Vorschaufenster wird angezeigt.

    Tabellenvorschau mit ausschließlich den ausgewählten Feldern

    Statt einer Vielzahl möglicher Felder enthält Ihr Ausgabe-Dataset nur diese sechs Felder, die von den Projektbeteiligten gewünscht wurden.

  8. Klicken Sie auf die Schaltfläche Kartenvorschau.

    Karte der Investitionsprojektpunkte

    Da das Feld GEOMETRY eines Ihrer ausgewählten Felder ist, ist eine Karte der Investitionsprojektpunkte sichtbar.

  9. Schließen Sie das Vorschaufenster.

Felder aktualisieren

Nachdem Sie nur die Felder, an denen Ihre Projektbeteiligten interessiert sind, ausgewählt haben, sollten Sie einige der Feldnamen ändern, um sie lesbarer zu gestalten.

  1. Klicken Sie auf der Werkzeugleiste Editor auf Werkzeuge. Klicken Sie im Bereich Werkzeuge unter Bereinigen auf Felder aktualisieren.

    Der Zeichenfläche wird das Element Felder aktualisieren hinzugefügt.

  2. Verschieben Sie das Element Felder aktualisieren rechts neben das Element Felder auswählen.

    Element "Felder auswählen"

    Als Nächstes müssen Sie die Elemente Felder auswählen und Felder aktualisieren verbinden.

  3. Klicken Sie auf den Ausgabeport des Elements Felder auswählen, und ziehen Sie den Zeiger zum Eingabeport des Elements Felder aktualisieren.

    Verbundene Elemente "Felder auswählen" und "Felder aktualisieren"

    Als Nächstes müssen Sie die Felder, die aktualisiert werden sollen, auswählen und konfigurieren. Beim Aktualisieren von Feldern können Sie ihren Namen und den Feldtyp ändern. Sie sollten die Namen von drei Feldern aktualisieren.

    Das erste Feld, das Sie aktualisieren sollten, ist das Feld fmsid. Dieses Feld stammt aus dem Dataset Capital Project Tracker und enthält eine Projektidentifikationsnummer.

  4. Wählen Sie im Bereich Felder aktualisieren unter Aktualisierungen für Zu aktualisierendes Feld das Feld fmsid aus.

    Parameter "Zu aktualisierendes Feld"

    Als Nächstes geben Sie einen anderen Namen für dieses Feld an.

  5. Geben Sie unter Neuer Feldname den Text Project_ID ein.

    Parameter "Neuer Feldname"

    Hinweis:

    Wie beim Werkzeug Feld berechnen dürfen Feldnamen keine Sonderzeichen, wie zum Beispiel Leerzeichen, enthalten.

    Das erste Feld wurde aktualisiert. Außerdem sollten Sie noch die zwei Felder ntaname und COMMDIST aktualisieren.

    Hinweis:

    Zum Ändern des Typs eines Feldes, zum Beispiel von "String" in "Integer" können Sie den Parameter Neuer Feldtyp nicht verwenden.

  6. Klicken Sie auf Hinzufügen.

    Schaltfläche "Hinzufügen"

  7. Wählen Sie für Zu aktualisierendes Feld das Feld ntaname aus. Geben Sie unter Neuer Feldname den Text Neighborhood ein.

    Parameter "Zu aktualisierendes Feld" und Parameter "Neuer Feldname" für das Stadtteilattribut

  8. Klicken Sie auf Hinzufügen.
  9. Wählen Sie für Zu aktualisierendes Feld das Feld COMMDIST aus. Geben Sie unter Neuer Feldname den Text Community ein.

    Parameter "Zu aktualisierendes Feld" und Parameter "Neuer Feldname" für das Gemeindebezirksattribut

  10. Klicken Sie auf die Schaltfläche Vorschau.

    In der Tabellenvorschau wurden die Spaltenüberschriften aktualisiert. Die Feldüberschriften in Ihrer Tabelle sind nun für Ihre Projektbeteiligten intuitiver.

    Tabelle mit aktualisierten Feldnamen

  11. Schließen Sie das Vorschaufenster.

Einen Ausgabe-Feature-Layer erstellen

Bis zu diesem Punkt kann Ihre Data Pipeline Ihre Daten erfassen und transformieren. Im letzten Schritt sollen diese Daten in einen Feature-Layer geladen werden.

  1. Klicken Sie auf der Werkzeugleiste Editor auf Ausgaben. Klicken Sie im Bereich Ausgaben unter ArcGIS auf Feature-Layer.

    Der Zeichenfläche wird das Element Feature-Layer hinzugefügt.

  2. Verschieben Sie das Element Feature-Layer rechts neben das Element Felder aktualisieren.

    Element "Feature-Layer"

    Als Nächstes müssen Sie die Elemente Felder aktualisieren und Feature-Layer verbinden.

  3. Klicken Sie auf den Ausgabeport des Elements Felder aktualisieren, und ziehen Sie den Zeiger zum Eingabeport des Elements Feature-Layer.

    Verbundene Elemente "Felder aktualisieren" und "Feature-Layer"

    Als Nächstes müssen Sie die Ausgabeeinstellungen für den Feature-Layer, der erstellt werden soll, konfigurieren. Mit ArcGIS Data Pipelines ist es auch möglich, mit der Ausgabe einen vorhandenen Feature-Layer zu ersetzen oder Features in einem vorhandenen Feature-Layer hinzuzufügen und zu aktualisieren.

  4. Stellen Sie im Bereich Feature-Layer unter Ausgabeeinstellungen sicher, dass Ausgabemethode auf Erstellen festgelegt ist.

    Parameter "Ausgabemethode"

    Als Nächstes sollten Sie dem Feature-Layer einen Namen geben.

  5. Geben Sie für Ausgabename den Text DPR Capital Projects ein.

    Parameter "Ausgabename"

  6. Klicken Sie auf die Schaltfläche Vorschau.

    Im Vorschaufenster sehen Sie, was in Ihren Feature-Layer geschrieben wird, wenn Sie die Data Pipeline ausführen.

  7. Schließen Sie das Vorschaufenster.
  8. Passen Sie die Größe des Elements Feature-Layer an, damit der vollständige Name sichtbar ist.

    Element "Feature-Layer"

    Ihre Data Pipeline ist vollständig.

    Data Pipeline

    Wenn Sie mit der Anordnung der Elemente Ihrer Data Pipeline nicht zufrieden sind, dann können Sie mit der Schaltfläche Autolayout-Diagramm die Elemente so positionieren, dass der Fluss der Eingaben, Werkzeuge und Ausgaben besser zu überblicken ist.

  9. Klicken Sie auf der Aktionsleiste für die Zeichenfläche auf Autolayout-Diagramm.

    Schaltfläche "Autolayout-Diagramm"

    Die Elemente auf der Zeichenfläche werden neu positioniert.

    Aktualisiertes Layout der Data Pipeline

  10. Speichern Sie Ihre Data Pipeline.

In diesem Modul haben Sie die Daten, die aus den vorherigen räumlichen Verbindungen erstellt wurden, bereinigt. Sie haben nicht benötigte Felder entfernt und Felder, deren Namen nicht intuitiv waren, umbenannt. Als Letztes müssen Sie noch festlegen, dass die Data Pipeline das Ausgabe-Dataset in einen gehosteten Feature-Layer in Ihrer ArcGIS Online-Organisation schreiben soll.


Ergebnisse überprüfen

Als Nächstes können Sie die von Ihnen erstellte Data Pipeline ausführen und die Ergebnisse auswerten. Danach sollten Sie festlegen, dass die Data Pipeline automatisch nach einem Zeitplan ausgeführt werden soll, damit die Informationen in ArcGIS Online immer aktuell sind.

Die Data Pipeline ausführen

Da Ihre Data Pipeline nun vollständig ist, können Sie sie ausführen, um einen Feature-Layer zu erstellen.

  1. Klicken Sie auf der Aktionsleiste für die Zeichenfläche auf Ausführen.

    Schaltfläche "Ausführen"

    Das Fenster Details der letzten Ausführung wird mit der geöffneten Registerkarte Ausführungsdetails angezeigt. Dieses Fenster enthält Informationen zur Ausführung der Data Pipeline. Dort werden auch die Fehlermeldungen und Warnungen, die während der Bearbeitung auftreten, angezeigt.

    Fenster "Details der letzten Ausführung"

    Nach der Ausführung der Data Pipeline können Sie die Ergebnisse auswerten. Die Verarbeitung dauert etwa eine Minute.

  2. Klicken Sie im Fenster Details der letzten Ausführung auf die Registerkarte Ausgabeergebnisse.

    Registerkarte "Ausgabeergebnisse"

    Diese Registerkarte enthält eine Liste aller durch die Data Pipeline erstellten Ausgaben. Die Liste enthält den Feature-Layer DPR Capital Projects.

    Registerkarte "Ausgabeergebnisse" mit dem Feature-Layer "DPR Capital Projects"

    Als Nächstes sollten Sie die Elementdetails Ihres Feature-Layers überprüfen und den Feature-Layer für Ihre Organisation freigeben.

  3. Klicken Sie für den Layer DPR Capital Projects auf Optionen, und wählen Sie Details anzeigen aus.

    Option "Details anzeigen"

    Auf einer Browser-Registerkarte wird die Elementdetailseite für DPR Capital Projects geöffnet.

    Elementdetailseite

    Diese Seite enthält Informationen zu dem Feature-Layer, der durch die Data Pipeline erstellt wurde. Als Nächstes können Sie die Ergebnisse für Ihre Organisation freigeben.

  4. Klicken Sie auf die Schaltfläche Freigeben.

    Schaltfläche "Freigeben"

    Das Fenster Freigeben wird geöffnet.

  5. Wählen Sie im Fenster Freigeben für Freigabeebene festlegen die Option Organisation aus.

    Option "Organisation"

  6. Klicken Sie auf Speichern.

    Der Layer DPR Capital Projects ist für den Zugriff durch andere Benutzer Ihrer Organisation freigegeben. Wenn die Data Pipeline ausgeführt wird, aktualisiert sie diesen Feature-Layer für jeden Benutzer, der ihn den Karten oder Apps hinzugefügt hat.

    Hinweis:

    Wenn Sie eine Data Pipeline erstellen, dann wird sie als Element in Ihrem ArcGIS Online-Konto gespeichert. Dieses Element muss nicht für Ihre Organisation freigegeben werden, damit Benutzer auf den Ausgabe-Feature-Layer einer Data Pipeline können.

    Als Nächstes sollten Sie das Ergebnis auf einer Karte anzeigen.

  7. Klicken Sie auf In Map Viewer öffnen.

    Schaltfläche "In Map Viewer öffnen"

    Es wird eine Karte geöffnet, der der Feature-Layer DPR Capital Projects hinzugefügt wurde.

    Karte mit dem Feature-Layer "DPR Capital Projects"

  8. Klicken Sie auf einen der Punkte.

    Daraufhin wird ein Pop-up mit den Attributen, die Sie in der Data Pipeline angegeben haben, angezeigt.

    Pop-up mit Attributen

    Dieses Dataset kann für Webkarten und Apps Ihrer Projektbeteiligten weiter symbolisiert, analysiert und konfiguriert werden.

Die Data Pipeline aktualisieren

Nachdem Ihre Data Pipeline erfolgreich ausgeführt wurde, ist ein Feature-Layer der DPR Capital Projects für Sie verfügbar. Allerdings werden die Quelldaten regelmäßig aktualisiert, und Ihre Projektbeteiligten wünschen, dass ihre Webkarten und Apps immer die aktuellen Informationen enthalten. Sie sollten das Ausgabeelement Feature-Layer so aktualisieren, dass in Zukunft der Feature-Layer DPR Capital Projects bei jeder Ausführung der Data Pipeline ersetzt wird.

Hinweis:

Wenn Data Pipelines in Ihrer Organisation nur einmal ausgeführt werden muss, dann ist das Aktualisieren des Elements Feature-Layer nicht notwendig.

  1. Schließen Sie im Data-Pipeline-Editor das Fenster Details der letzten Ausführung.
  2. Klicken Sie auf der Zeichenfläche auf das Feature-Layer-Element, das Ihren Ausgabe-Feature-Layer darstellt.
  3. Legen Sie im Bereich Feature-Layer unter Ausgabeeinstellungen den Parameter Ausgabemethode auf Ersetzen fest.

    Parameter "Ausgabemethode"

    Der Parameter Feature-Layer wird angezeigt. Dieser Parameter legt fest, welcher Feature-Layer in Ihrer Organisation durch die Data Pipeline ersetzt werden soll, wenn sie in Zukunft ausgeführt wird.

  4. Klicken Sie für Feature-Layer auf Layer auswählen.

    Parameter "Layer auswählen"

    Das Fenster Feature-Layer auswählen wird angezeigt. Wählen Sie den Feature-Layer aus, der ersetzt werden soll.

    Vorsicht:

    Beim Auswählen eines zu ersetzenden Feature-Layers ist Vorsicht geboten. Wenn Sie den falschen Feature-Layer auswählen, könnten die Daten unwiederbringlich verloren sein.

  5. Suchen Sie den Feature-Layer DPR Capital Projects. Klicken Sie auf Layer auswählen, und wählen Sie DPR Capital Projects aus.

    Feature-Layer "DPR Capital Projects"

  6. Klicken Sie auf Bestätigen.

    Wenn ab jetzt die Data Pipeline ausgeführt wird, dann wird der vorhandene Feature-Layer überschrieben, wodurch Fehler vermieden werden.

  7. Speichern Sie die Data Pipeline.

Die Data Pipeline planen

Da die Eingabe-Datasets ständig geändert werden, sollten Sie einen Zeitplan für die automatische Ausführung der Data Pipeline in der Zukunft erstellen.

  1. Klicken Sie auf ArcGIS Data Pipelines.

    Schaltfläche "ArcGIS Data Pipelines"

  2. Klicken Sie auf Zeitplanung verwalten.

    Schaltfläche "Zeitplanung verwalten"

    Jetzt müssen Sie einen Task erstellen. Mit einem Task können Sie steuern, wie oft Ihre Data Pipeline ausgeführt wird.

  3. Klicken Sie auf Task erstellen.

    Schaltfläche "Task erstellen"

    Das Fenster Task erstellen wird angezeigt. Hier können Sie die von Ihnen erstellte Data Pipeline auswählen.

  4. Wählen Sie Capital Projects Data Pipeline aus.

    Fenster "Task erstellen"

  5. Klicken Sie auf Weiter.

    Sie sollten die automatische Ausführung Ihrer Data Pipeline planen, damit die Informationen im Ziel-Feature-Layer immer aktuell sind. Das Planen der Ausführung einer Data Pipeline verbraucht Credits wie das Arbeiten im Editor. Da dies ein Lernprogramm ist, sollten Sie diese Data Pipeline nur einmal ausführen lassen, um Credits zu sparen. In einer Produktionsumgebung müssen Sie jedoch je nachdem, wie oft Ihre Eingabe-Datasets aktualisiert werden, möglicherweise eine monatliche, tägliche oder noch häufigere Ausführung festlegen.

    Als Erstes sollten Sie diesem Task einen Titel geben.

  6. Geben Sie als Titel den Text DPR Capital Projects Update ein.

    Parameter "Titel"

    Sie sollten diese Data Pipeline alle 15 Minuten ausführen lassen.

  7. Wählen Sie für Wiederholungstyp die Option Minute aus. Lassen Sie für Wiederholungsintervall den Standardwert von 15 Minuten unverändert.

    Parameter "Wiederholungstyp" und "Wiederholungsintervall"

    Als Nächstes müssen Sie sicherstellen, dass die Data Pipeline nur einmal ausgeführt wird.

  8. Wählen Sie für Ende die Option Nach Anzahl der Ausführungen aus. Geben Sie für Anzahl der Ausführungen den Wert 1 ein.

    Parameter "Ende" und "Anzahl der Ausführungen"

    Hinweis:

    Weitere Informationen zum Planen von Tasks finden Sie unter Planen eines Data-Pipeline-Tasks.

  9. Klicken Sie auf Speichern.

    Der Task wird angezeigt und informiert Sie über den Zeitpunkt seiner nächsten Ausführung.

    Geplanter Task

    Hinweis:

    Zum Bearbeiten, Anhalten oder Löschen eines Tasks klicken Sie auf die Schaltfläche Optionen ganz am Ende der Tabelle. Sie können zudem auf den Link zum Anzeigen oder Bearbeiten Ihrer Data Pipeline klicken.

    Nach der Ausführung des Tasks können Sie den Ausführungsverlauf des Tasks anzeigen.

  10. Klicken Sie auf den Task DPR Capital Projects Update.

    Task "DPR Capital Projects Update"

    Im Bereich Task-Ausführungen werden der Task und der Status der abgeschlossenen Ausführungen angezeigt. Ein grünes Häkchen gibt an, dass die Ausführung erfolgreich war. Ein rotes Sechseck gibt an, dass die Ausführung fehlgeschlagen ist.

    Vorheriger Task-Status

    Unter Ausgabeergebnisse wird eine Übersicht der Ergebnisse aus der Data Pipeline angezeigt.

    Ausgabeergebnisse und Ausführungsdetails

In diesem Lernprogramm haben Sie eine Data Pipeline zum Integrieren der Daten aus verschiedenen dynamischen Quellen erstellt, zusätzliche Attribute hinzugefügt, irrelevante Attribute entfernt, Felder umbenannt und die Ergebnisse in einen Feature-Layer geschrieben. Sie haben auch festgelegt, dass die Data Pipeline automatisch nach einem Zeitplan ausgeführt werden soll. Durch Konfigurieren einer Data Pipeline können Sie den mühsamen Prozess zum manuellen Bearbeiten von Daten und Aktualisieren von Feature-Layern bei jeder Änderung in den Quelldaten umgehen.

Weitere Lernprogramme finden Sie in der Lernprogrammgalerie.