Daten vorbereiten
Damit Sie fundierte Entscheidungen zum Schutz des Waldes treffen können, identifizieren Sie Regionen mit übereinstimmenden bioklimatischen Eigenschaften.
Projekt erkunden
Als Erstes laden Sie die Lernprogrammdaten herunter.
- Laden Sie das Projektpaket IdentifyRegions.ppkx herunter, und navigieren Sie auf Ihrem Computer zu der heruntergeladenen Datei.
Hinweis:
In den meisten Webbrowsern werden heruntergeladene Dateien standardmäßig im Ordner "Downloads" gespeichert. - Doppelklicken Sie auf das Projektpaket IdentifyRegions.ppkx.
Projektpakete stellen eine Möglichkeit für die Freigabe von ArcGIS Pro-Projekten und -Daten dar. Dabei handelt es sich um komprimierte Dateien. Beim Öffnen dieser Dateien wird eine Kopie des Projekts im Ordner C:\Users\[user name]\Documents\ArcGIS\Packages auf dem eigenen Computer extrahiert.
Das Projektpaket wird extrahiert, und das Projekt wird mit einer Karte geöffnet, bei der es sich um eine Grundkarte mit dem Umriss des El Yunque National Forest handelt.
El Yunque National Forest befindet sich im östlichen Teil von Puerto Rico.
Bioklimadaten herunterladen
Das Bioklima-Variablen-Dataset "Climatologies at high resolution for the earth’s land surface areas" (CHELSA) ist ein globales Klima-Dataset in hoher Auflösung, das sich für die Modellierung der Verteilung der Arten als hilfreich erwiesen hat. Sie laden ein Raster einer Variable herunter, die bei Ihrer Analyse hilfreich sein kann.
- Rufen Sie in einem Browser die Seite CHELSA Bioclim auf.
- Lesen Sie die Beschreibung des Bioclim-Datasets.
Hinweis:
Bei der Untersuchung eines Daten-Layers, der für Sie nützlich sein könnte, sollten Sie sich die Beschreibung näher ansehen, da diese wichtige Kontextinformationen zu den Daten enthält. Dabei handelt es sich um Informationen dazu, wer die Daten kompiliert hat und wie die Daten erfasst wurden sowie zum vorgesehenen Verwendungszweck und dazu, ob für die Daten Beschränkungen hinsichtlich der Nutzung oder dazu, wer die Daten nutzen darf, bestehen.Die CHELSA-Daten werden unter der Bedingung zur Verfügung gestellt, dass die ursprüngliche Veröffentlichung und das Dataset genannt werden.
- Führen Sie einen Bildlauf nach unten zur Tabelle mit der Layer-Beschreibung durch.
Diese Tabelle umfasst Informationen zu den einzelnen Layern, mit denen Sie bestimmen können, welche Layer verwendet werden sollen.
Der Layer "bio1" enthält Informationen zur jährlichen mittleren Lufttemperatur. Dies kann Ihnen dabei helfen, Regionen innerhalb des Waldes zu identifizieren.
In dieser Tabelle werden 50 Layer dokumentiert. Die 19 Layer mit dem Präfix bio sind in diesem Lernprogramm relevant. Abhängig von den besonderen Gegebenheiten Ihrer Arbeit im Naturschutz wählen Sie jeweils verschiedene Layer-Kombinationen aus.
- Führen Sie einen Bildlauf nach oben über die Tabelle aus, und klicken Sie auf den Download-Link THE LAYERS CAN BE DOWNLOADED HERE.
Die Seite S3 File Browser wird geöffnet. Darin werden vier Ordner angezeigt. Der erste Ordner umfasst historische Daten aus den Jahren 1981 bis 2010. Die anderen drei Ordner enthalten projizierte Daten, die mit verschiedenen Klimamodellen erzeugt wurden.
- Klicken Sie auf der Seite S3 File Browser auf die Erweiterungsschaltfläche neben dem Ordner 1981-2010/.
Der Ordner wird eingeblendet.
- Klicken Sie auf die Erweiterungsschaltfläche neben dem Ordner bio/.
- Suchen Sie nach der Datei mit dem Bestandteil _bio1_ im Dateinamen, und klicken Sie auf die Schaltfläche zum Herunterladen für die Datei CHELSA_bio1_1981-2010.V.2.1.tif.
Die Datei CHELSA_bio1_1981-2010.V.2.1.tif wird auf den Computer heruntergeladen. Sie ist 110 MB groß.
In der Tabelle, die Sie zuvor gesehen haben, wird diese Datei als Raster-Dataset der jährlichen mittleren Lufttemperatur in den Jahren 1981 bis 2010 beschrieben.
Sie schneiden Daten in der Datei aus und erfassen Stichproben, um Daten für den Wald zu erhalten.
Für dieses Lernprogramm müssen Sie keine der anderen Bioklima-Datendateien herunterladen. Die Daten wurden heruntergeladen und ausgeschnitten und werden für die spätere Verwendung im Projekt gespeichert.
Daten dem Projekt hinzufügen
Nachdem Sie die Lufttemperaturdaten jetzt heruntergeladen haben, fügen Sie sie dem Projekt hinzu.
- Klicken Sie in ArcGIS Pro auf dem Menüband auf die Registerkarte Karte und im Abschnitt Layer auf Daten hinzufügen.
- Blenden Sie im Fenster Daten hinzufügen den Eintrag Computer und danach den Eintrag Dieser PC ein, und klicken Sie auf Downloads.
Wenn im Browser der Download an einen anderen Speicherort eingestellt ist, suchen Sie die Datei im Microsoft File Explorer, und navigieren Sie zu dem Speicherort im Fenster Daten hinzufügen.
- Klicken Sie auf das Raster-Dataset CHELSA_bio1_1981-2010.V.2.1.tif und dann auf OK.
Es wird eine Meldung eingeblendet, in der Sie gefragt werden, ob Sie Statistiken für das Raster berechnen möchten.
- Klicken Sie auf Ja.
Der Layer CHELSA_bio1_1981-2010_V.2.1.tif wird auf der Karte angezeigt.
Der Layer verfügt über eine globale Ausdehnung, dieser Teil wird jedoch größtenteils weiß angezeigt. Er erstreckt sich über die Grundkarte, die davor sichtbar war. Sie können das Waldgrenzen-Polygon und einige hellgraue Pixel innerhalb des Waldes erkennen.
Wenn Sie sich den Bereich Wert des Layers ansehen, können Sie erkennen, dass Zellen in diesem Raster Werte zwischen 2.196 und 3.079 aufweisen, wobei hohe Werte in helleren Grauschattierungen dargestellt werden.
Wenn Sie in der Tabelle mit der Datenbeschreibung nachsehen, erfahren Sie, dass die Daten über einen Skalierungsfaktor und einen Versatz verfügen.
Bei der Konvertierung auf Grundlage dieser Informationen (mit dem Maßstabswert 0,1 multiplizieren und 273,15 subtrahieren) werden die Werte des Rasters in Grad Celsius umgerechnet und reichen von -53,55 bis 34,75.
- Klicken Sie im Bereich Inhalt mit der rechten Maustaste auf den Layer CHELSA_bio1_1981-2010.V.2.1.tif, und klicken Sie auf Auf Layer zoomen.
In der Karte wird die vollständige Ausdehnung des Layers angezeigt.
Sie können erkennen, dass die Regionen um den Äquator hell gefärbt sind und hohe Temperaturwerte aufweisen, die Pole dagegen dunkler mit niedrigeren Temperaturwerten. Die Parkgrenze ist als kleiner dunkler Fleck sichtbar.
Es ist hilfreich, heruntergeladene Daten zu erkunden, um zu verstehen, ob sie sich für die Analyse eignen.
- Klicken Sie im Bereich Inhalt mit der rechten Maustaste auf den Layer boundary, und klicken Sie auf Auf Layer zoomen.
Sie haben den Layer CHELSA_bio1_1981-2010.V.2.1.tif heruntergeladen und untersucht. Er scheint hilfreich für Ihre Analyse zu sein.
Raster ausschneiden
Sie benötigen nicht die gesamte Ausdehnung der Daten für Ihre Arbeit im Wald, deshalb schneiden Sie die Daten an der Waldgrenze aus.
- Klicken Sie auf dem Menüband auf der Registerkarte Analyse im Abschnitt Geoverarbeitung auf Werkzeuge.
Daraufhin wird der Bereich Geoverarbeitung angezeigt.
- Geben Sie im Bereich Geoverarbeitung Raster ausschneiden im Suchfeld ein, und klicken Sie in den Ergebnissen zur Werkzeugsuche auf das Werkzeug Raster ausschneiden.
- Wählen Sie im Werkzeug Raster ausschneiden für Eingabe-Raster den Layer CHELSA_bio1_1981-2010.V.2.1.tif.
- Wählen Sie für Ausgabeausdehnung den Layer boundary aus.
Mit diesem Werkzeug wird das Eingabe-Raster auf die volle Ausdehnung des boundary-Feature-Layers ausgeschnitten, wenn Sie nicht angeben, dass die Features im Layer dem Ausschneidevorgang zugrunde gelegt werden sollen.
- Aktivieren Sie das Kontrollkästchen Eingabe-Features als Geometrie zum Ausschneiden verwenden.
Dadurch wird das Raster an der Waldgrenze ausgeschnitten.
Der Name für das Ausgabe-Raster-Dataset ist standardmäßig der erste Teil des ursprünglichen Raster-Namens, an dessen Ende _Clip angehängt wird. Das Raster wird in der Projekt-Geodatabase gespeichert.
- Klicken Sie auf Ausführen.
Das Raster wird ausgeschnitten und der Layer CHELSA_bio1_19812010_V_Clip der Karte hinzugefügt.
Da das ausgeschnittene Raster einen anderen Wertebereich als das ursprüngliche Raster enthält, unterscheidet sich auch die Symbolisierung davon. Der neue Farbverlauf lässt den Wertebereich im Wald klarer hervortreten.
Da Sie das ursprüngliche Raster mit der vollen globalen Ausdehnung nicht mehr benötigen, entfernen Sie es jetzt.
- Klicken Sie im Bereich Inhalt mit der rechten Maustaste auf den Layer CHELSA_bio1_1981-2010.V.2.1.tif, und klicken Sie auf Entfernen.
Hinweis:
Um Zeit zu sparen und die Größe der herunterzuladenden Lernprogrammdaten zu reduzieren, wurden die Raster für die anderen Bioklimavariablen bereits ausgeschnitten. Wenn Sie dies noch tun müssten, würden Sie folgendermaßen vorgehen: Öffnen Sie das Werkzeug Raster ausschneiden im Batch-Modus, indem Sie nach dem Werkzeug suchen, mit der rechten Maustaste darauf klicken und danach auf Batch klicken. Im Einrichtungsbereich des Batch-Werkzeugs entspricht dem Batch-Parameter für das Batch-Werkzeug die Option Eingabe-Raster. Klicken Sie auf Weiter. Das Werkzeug Batch Raster ausschneiden wird geöffnet. Danach können Sie alle Eingabe-Raster für das Batch-Eingabe-Raster hinzufügen und die verbleibenden Werkzeugeinstellungen so konfigurieren wie für das Werkzeug Raster ausschneiden. Bei der Ausführung des Werkzeugs wird dann jedes Raster mit der Ausdehnung des Waldes ausgeschnitten.
Stichprobenpunkte generieren
Im nächsten Schritt wird eine Reihe von Punkten aus dem Raster erstellt. Auf diese Weise können Sie Daten aus mehreren Rastern kombinieren und entsprechend visualisieren sowie in einer multivariaten Cluster-Analyse verwenden. Sie verwenden das Werkzeug Raster in Punkt, um verschiedene Punkte an den Zellmittelpunkten zu erstellen, wobei die Raster-Werte als Attribut verwendet werden.
- Klicken Sie im Werkzeug Raster ausschneiden auf die Schaltfläche Zurück.
- Geben Sie im Bereich Geoverarbeitung Raster in Punkt im Suchfeld ein, und klicken Sie in den Ergebnissen der Werkzeugsuche auf das Werkzeug Raster in Punkt.
- Wählen Sie im Werkzeug Raster in Punkt für Eingabe-Raster den Layer CHELSA_bio1_19812010_V_Clip aus.
- Übernehmen Sie für Feld den Standardwert Wert.
- Geben Sie für Ausgabe-Punkt-Features den Text bioclimate_points ein.
- Klicken Sie auf Ausführen.
Der Layer bioclimate_points wird der Karte hinzugefügt.
Sie verwenden diesen Layer, um Stichproben der Bioklima-Raster zu nehmen. Diese wurden bereits vorbereitet und befinden sich in der Karte Sample rasters. Sie kopieren die eben erstellten Punkte und wechseln dann zu der Karte mit den Rastern.
- Klicken Sie im Bereich Inhalt mit der rechten Maustaste auf den Layer bioclimate_points, und klicken Sie auf Kopieren.
- Klicken Sie im Kartenbereich auf die Karteregisterkarte Sample rasters.
- Klicken Sie im Bereich Inhalt mit der rechten Maustaste auf Sample rasters, und klicken Sie auf Einfügen.
Diese neue Karte enthält den Gruppen-Layer BioclimateRasters mit einer ausgeschnittenen Version der 19 CHELSA-Bioklima-Raster.
Für den Gruppen-Layer sind Optionen konfiguriert, über die Sie zwischen den einzelnen Rastern wechseln können. Weitere Informationen finden Sie unter Arbeiten mit Gruppen-Layern.
Stichproben-Raster-Werte
Sie haben nun Punkte an den Mittelpunkten der Raster-Zellen erstellt. Im nächsten Schritt führen Sie das Werkzeug Stichprobe aus, um Werte aus den einzelnen Rastern für diese Punkte abzurufen.
- Klicken Sie im Werkzeug Raster in Punkt auf die Schaltfläche Zurück.
- Geben Sie im Bereich Geoverarbeitung sample im Suchfeld ein, und klicken Sie in den Ergebnissen der Werkzeugsuche auf das Werkzeug Stichprobe.
- Klicken Sie für Eingabe-Raster auf die Schaltfläche Viele hinzufügen.
- Kontrollkästchen aktivieren, um alles auszuwählen.
- Klicken Sie auf Hinzufügen.
- Wählen Sie für Eingabe-Positions-Raster oder -Features den Layer bioclimate_points aus.
Jeder Punkt im Layer bioclimate_points wird verwendet, um Stichproben der Raster-Werte an dieser Position zu nehmen.
- Geben Sie für Ausgabetabelle oder -Feature-Class den Namen Sample_vals ein.
- Übernehmen Sie die Standardwerte für Resampling-Methode und Feld für die eindeutige ID.
- Klicken Sie auf Ausführen.
Die Tabelle Sample_vals wird dem Bereich Inhalt im Abschnitt Standalone-Tabellen hinzugefügt.
- Klicken Sie im Bereich Inhalt mit der rechten Maustaste auf die Tabelle Sample_vals, und klicken Sie auf Öffnen.
- Untersuchen Sie die Tabelle.
Die Feldnamen werden von den Namen der Raster-Layer abgeleitet. Sie enthalten Informationen, über die sich die erforderlichen Bioklimavariablen identifizieren lassen, könnten jedoch aussagekräftiger sein.
Sie geben einem Feld einen verständlicheren Aliasnamen, damit die Daten einfacher interpretiert werden können.
Feldaliasnamen festlegen
Wenn die vorhandenen Feldnamen schwer verständlich sind, können Sie Aliasnamen zuweisen, um ihre Verwendung zu vereinfachen. Die Beschreibungsseite von CHELSA Bioclim enthielt eine Tabelle mit shortname- und longname-Feldern. Anhand dieser Tabelle können Sie feststellen, welchen Bioklimavariablen die Codes (z. B. "bio1", "bio2" und "bio3") entsprechen, und diese Namen als Feldaliasnamen verwenden.
- Rufen Sie in einem Browser die Seite CHELSA Bioclim auf.
- Sehen Sie sich die Tabelle mit der Layer-Beschreibung an.
- Klicken Sie im Bereich Inhalt im Abschnitt Standalone-Tabellen mit der rechten Maustaste auf die Tabelle Sample_vals, zeigen Sie auf Datendesign, und klicken Sie auf Felder.
Der Designbereich Felder wird angezeigt.
- Klicken Sie in die Spalte Alias für die Variable _bio1_.
Über die Tabelle auf der Webseite "CHELSA Bioclim" lässt sich feststellen, dass die Variable _bio1_ der jährlichen mittleren Lufttemperatur entspricht.
- Geben Sie in die Spalte Alias für die Variable _bio1_ die Bezeichnung mean_annual_air_temperature ein.
Mit dieser Methode können Sie die Aliasnamen für die einzelnen Felder aktualisieren. Bei diesem Lernprogramm müssen Sie jedoch keine Aliasnamen für alle Felder festlegen. Um Zeit zu sparen, wurde ein Layer vorbereitet, den Sie später verwenden können.
- Klicken Sie auf dem Menüband auf der Registerkarte Standalone-Tabelle im Abschnitt Änderungen verwalten auf Speichern.
Der Name der Spalte wird in der Tabelle aktualisiert.
Stichprobentabelle mit den Punkten verbinden
Der letzte Schritt beim Übertragen der Bioklimadaten in Punkt-Features für die Analyse besteht darin, die generierte Tabelle mit den aus den Zellenmittelpunkten erstellten Punkten zu verbinden.
- Klicken Sie im Bereich Inhalt mit der rechten Maustaste auf den Layer bioclimate_points, zeigen Sie auf Verbindungen und Beziehungen, und klicken Sie auf Verbindung hinzufügen.
Das Werkzeug Verbindung hinzufügen wird geöffnet.
- Wählen Sie im Werkzeug Verbindung hinzufügen für Eingabefeld die Option OBJECTID aus.
Das Werkzeug erkennt eine Standalone-Tabelle im Inhalt und fügt diese dem Parameter Join-Tabelle hinzu. Außerdem erkennt es, dass die Tabelle über ein Feld namens OBJECTID verfügt, und legt es als standardmäßiges Join-Feld fest.
Da diese Eingaben alle korrekt sind, kann das Werkzeug jetzt ausgeführt werden. Sollten Sie über andere Tabellen verfügen oder andere Felder verbinden wollen, können Sie die Eingaben ändern.
- Klicken Sie auf OK.
- Klicken Sie mit der rechten Maustaste auf den Layer bioclimate_points, und klicken Sie auf Attributtabelle.
Der Punkt-Layer enthält nun die Attribute aus der Tabelle Sample_vals.
In der Tabelle wird der Aliasname angezeigt, den Sie für das Feld mean_annual_air_temperature festgelegt haben.
Die Daten können nun untersucht und analysiert werden, um Regionen zu identifizieren.
Sie haben Bioklimadaten heruntergeladen, auf den relevanten Bereich ausgeschnitten, Stichprobenpunkte aus Zellenmittelpunkten erstellt, Stichproben aus mehreren Bioklima-Rastern in eine Tabelle übernommen, einen Aliasnamen festgelegt und die Tabelle mit den Punkten verbunden. Als Nächstes untersuchen Sie die vorbereiteten Daten.
Variablen identifizieren
Nachdem Sie nun die Bioklimadaten vorbereitet haben, ist es an der Zeit, die Variablen zu untersuchen.
Scatterplotmatrix-Diagramm erstellen
Ein Scatterplotmatrix-Diagramm stellt eine hervorragende Möglichkeit dar, Variablenpaare zu vergleichen, wenn mehrere numerische Variablen zu berücksichtigen sind. Sie erstellen eine Scatterplotmatrix der Bioklimavariablen, um die Beziehungen zwischen diesen zu erkunden.
- Klicken Sie im Kartenbereich auf die Kartenregisterkarte Identify variables.
Die Karte Identify variables zeigt den Layer mit der Waldgrenze und einen Layer namens sample_locations. Der Layer sample_locations enthält die Stichprobendaten der Bioklimavariablen mit beschreibenden Feldnamen und Aliasnamen.
- Klicken Sie im Bereich Inhalt mit der rechten Maustaste auf den Layer sample_locations, zeigen Sie auf Diagramm erstellen, und klicken Sie auf Scatterplotmatrix.
Der Bereich Diagrammeigenschaften wird angezeigt.
In diesem Bereich können Sie die Eigenschaften eines Diagramms konfigurieren. Der erste Schritt zum Konfigurieren einer Scatterplotmatrix besteht aus der Auswahl der numerischen Variablen, die einander gegenübergestellt werden.
- Klicken Sie im Bereich Diagrammeigenschaften auf Auswählen.
Es gibt 19 Bioklimavariablen, die für das Scatterplotmatrix-Diagramm ausgewählt werden sollen.
- Klicken Sie auf die Schaltfläche Alle Kontrollkästchen umschalten.
Da es so viele Felder gibt, ist es einfacher, alle Felder auszuwählen und dann diejenigen zu deaktivieren, die Sie nicht verwenden möchten.
- Deaktivieren Sie die ersten beiden Felder, pointid und grid_code, und klicken Sie auf Übernehmen.
Die Scatterplotmatrix wird im Diagrammbereich angezeigt.
Datenbeziehungen mit einer Scatterplotmatrix untersuchen
Sie haben jetzt das Scatterplotmatrix-Diagramm erstellt und verwenden es als Nächstes, um die Daten zu erkunden und Beziehungen zwischen Variablen an verschiedenen Positionen im Wald zu untersuchen. Sie entscheiden, welche Variablen basierend auf den Untersuchungsanforderungen und dieser Erkundung verwendet werden sollen.
Wenn das Diagramm in ArcGIS Pro verankert ist, wird es möglicherweise so klein angezeigt, dass es nicht gut lesbar ist. Deshalb heben Sie zunächst die Verankerung des Bereichs auf, damit es sich besser vergrößern lässt.
- Klicken Sie mit der rechten Maustaste auf die Registerkarte sample_locations - Scatterplotmatrix von Sample_locations, und klicken Sie auf Float.
- Ziehen Sie die Ecke des Diagrammfensters Scatterplotmatrix von sample_locations bei gedrückter Maustaste, um es zu vergrößern und das Array der Plots besser erkennen zu können.
Das Diagramm zeigt alle Variablen auf den X- und Y-Achsen. Für jede Variablenkombination wird ein kleines Scatterplot dargestellt.
Wenn Sie den Mauszeiger über einen der kleinen Plots bewegen, werden der Variablenname und der R-Squared-Wert in einem Pop-up angezeigt.
- Bewegen Sie den Mauszeiger über einen der Plots mit einer hohen positiven Korrelation (eine schmale Punktlinie mit einem von links nach rechts zunehmenden Trend).
In diesem Dataset weist der Niederschlag in diesem speziellen Untersuchungsgebiet an jeder Position während des trockensten Monats eine starke positive Korrelation mit dem Niederschlag an jeder Position während des feuchtesten Monats auf.
- Bewegen Sie den Mauszeiger über einen der Plots mit einer hohen negativen Korrelation (eine schmale Punktlinie mit einem von links nach rechts fallenden Trend).
In diesem Dataset weist die jährliche mittlere Temperatur an jeder Position dieses Untersuchungsgebiets eine starke negative Korrelation mit den jahreszeitlichen Temperaturschwankungen (die Standardabweichung von den monatlichen mittleren Temperaturen) an jeder Position auf.
- Klicken Sie auf einen der Plots mit einer weniger eindeutigen Korrelation, und bewegen Sie den Mauszeiger dann über den Plot.
Durch Klicken auf einen der Plots wird dieser ausgewählt und vergrößert im oberen rechten Teil des Diagrammfensters angezeigt.
In diesem Dataset scheint für das Untersuchungsgebiet keine enge Korrelation zwischen den jahreszeitlichen Temperaturschwankungen und den mittleren Niederschlagswerten während des trockensten Vierteljahres zu bestehen. Es ist möglich, dass verschiedene Beziehungen zwischen diesen Variablen für verschiedene Teilmengen der Daten vorhanden sind.
- Klicken Sie in der Werkzeugleiste des Scatterplotmatrix-Diagramms auf das Werkzeug Auswahl.
Die Diagramme und die Karte sind miteinander verknüpft, deshalb wird die Auswahl im großen Diagramm in allen kleineren Scatterplots und auf der Karte übernommen. Auf diese Weise können Sie interaktiv Datenpunkte im Diagramm auswählen und deren Position auf der Karte anzeigen.
- Ziehen Sie bei gedrückter Maustaste einen Rahmen auf, um einige der Punkte im oberen rechten Abschnitt des ausgewählten Scatterplots auszuwählen.
Die Auswahl im großen Diagramm wird in die kleineren Diagramme übernommen.
Die Auswahl wird auch auf der Karte angezeigt.
Sie können diese Methode verwenden, um die Beziehungen zwischen den verschiedenen Variablen an verschiedenen Orten im gesamten Untersuchungsgebiet zu untersuchen.
- Klicken Sie auf einen Bereich des großen Diagramms, der keine Punkte aufweist.
Die Auswahl wird im Diagramm und auf der Karte aufgehoben.
- Schließen Sie das Diagrammfenster.
Das Diagramm wird im Bereich Inhalt aufgeführt. Sie können es erneut öffnen, indem Sie darauf doppelklicken.
Das CHELSA-Bioklima-Dataset ist ein für mehrere Zwecke verwendbares Dataset, das sich für viele Forschungsthemen eignet. Viele der 19 Bioklimavariablen beziehen sich auf die Temperatur und den Niederschlag, wobei diese Variablen eine enge Korrelation aufweisen. Sie zeigen jährliche Trends, saisonale Schwankungen und extreme oder einschränkende Faktoren. Nicht alle hier vorliegenden Daten sind bei jedem Projekt hilfreich.
Für die Regionalisierungsanalyse benötigen Sie Variablen, die keine enge Korrelation aufweisen. Anhand des jährlichen Niederschlags, des Temperaturbereichs innerhalb eines Jahres und der jährlichen mittleren Temperatur definieren Sie einzelne Regionen. Abhängig vom jeweiligen Gebiet und Anwendungsfall können Sie verschiedene Variablen auswählen.
Sie haben die Beziehungen zwischen Bioklima-Variablenpaaren untersucht und festgestellt, dass verschiedene geographische Variablenteilmengen über verschiedene Beziehungen und Cluster-Muster innerhalb dieses Datasets verfügen können. Nun führen Sie eine Regionalisierungsanalyse mit den ausgewählten Variablen durch.
Regionen identifizieren
Die Daten wurden jetzt vorbereitet und die Variablen identifiziert, jetzt führen Sie im letzten Schritt eine Regionalisierungsanalyse durch.
Bei der Regionalisierung wird ein Gebiet in kleinere Regionen aufgeteilt, um die Eigenschaften der einzelnen Regionen zu verstehen. Grundlage hierfür sind spezifische Kriterien, die innerhalb der Regionen vorherrschen. Der Zweck der Regionalisierung ist die Zusammenfassung der wichtigen vorherrschenden Umgebungsfaktoren in räumliche Regionen, um den Naturschutz planen und organisieren zu können. Abhängig von den Arten und dem Interessenbereich können verschiedene Variablen wichtig sein.
Cluster erstellen
Sie erstellen mit dem Werkzeug Multivariate Cluster-Bildung Cluster basierend auf den Variablen, die Sie selbst ausgewählt haben.
- Klicken Sie im Kartenbereich auf die Kartenregisterkarte Identify regions.
Auf dieser Karte werden die Layer sample_locations und boundary angezeigt.
- Geben Sie im Bereich Geoverarbeitung im Suchfeld Multivariate Cluster-Bildung ein, und klicken Sie in den Suchergebnissen auf das Werkzeug Multivariate Cluster-Bildung.
- Wählen Sie im Werkzeug Multivariate Cluster-Bildung unter Eingabe-Features den Layer sample_locations aus.
- Aktivieren Sie unter Analysefelder die Kontrollkästchen Annual_precipitation, Annual_temperature_range und Mean_annual_temperature.
- Übernehmen Sie die Standardwerte für Methode der Cluster-Bildung und Initialisierungsmethode.
Der standardmäßige Cluster-Algorithmus ist der k-Means-Algorithmus. Als Initialisierungsmethode ist standardmäßig "Optimierte Ursprungspositionen" ausgewählt. Weitere Informationen zu diesen Parametern finden Sie in der Werkzeughilfe.
- Lassen Sie das Feld des Parameters Anzahl der Cluster leer.
Wenn das Werkzeug eine bestimmte Anzahl von Clustern für Sie suchen soll, können Sie dies hier angeben. Bei der ersten Untersuchung der natürlichen Cluster in den Daten müssen Sie keinen Wert angeben. Das Werkzeug identifiziert die optimale Anzahl von Clustern basierend auf den Daten.
- Geben Sie unter Ausgabetabelle zur Auswertung der Anzahl der Cluster die Bezeichnung Output_number_of_clusters ein.
Wenn Sie diese Ausgabetabelle angeben, wird zusätzlich ein Diagramm mit der Pseudo-F-Statistik bei unterschiedlicher Cluster-Anzahl angezeigt. Die höchsten Werte der Pseudo-F-Statistik weisen auf Lösungen hin, mit denen bei Maximierung sowohl der Ähnlichkeiten innerhalb von Clustern als auch der Unterschiede zwischen Clustern eine optimale Performance erzielt werden kann.
Mit diesem Diagramm können Sie die Werkzeugausgabe verstehen und selbst entscheiden, wie viele Cluster erstellt werden sollen.
- Klicken Sie auf Ausführen.
Das Werkzeug wird ausgeführt, und kurz darauf wird der Layer sample_locations_MultivariateClustering der Karte hinzugefügt.
Dieser Layer zeigt die Stichprobenpositionen, symbolisiert durch die zugehörige Cluster-ID. Es wurden drei Cluster identifiziert.
Dies ist ein Anfang, die drei Cluster sind jedoch groß und ermöglichen möglicherweise keine Entscheidungen aufgrund von detaillierten ökologischen Informationen. Sie können angeben, dass mehr Cluster vom Werkzeug erstellt werden sollen. Auf welche Weise entscheiden Sie jedoch, wie viele Cluster empfehlenswert wären?
Da Sie im Werkzeug angegeben haben, dass die Tabelle Output_number_of_clusters erstellt werden soll, wurde auch ein Diagramm erzeugt. Dieses können Sie jetzt untersuchen und so zu einem besseren Verständnis der Cluster in den Daten gelangen. Als Nächstes verfeinern Sie die Analyse anhand dieser Informationen.
Cluster-Analyse verfeinern
Jetzt prüfen Sie die Pseudo-F-Statistikwerte, die vom Werkzeug in der Tabelle Output_number_of_clusters aufgezeichnet wurden.
- Doppelklicken Sie im Bereich Inhalt im Abschnitt Standalone-Tabellen im Unterabschnitt Diagramme auf Optimiertes Schema zur Pseudo-F-Statistik.
Das Diagramm wird angezeigt. Passen Sie ggf. die Größe an, um die Informationen besser erkennen zu können.
Dieses Diagramm zeigt die Pseudo-F-Statistikwerte für Cluster-Lösungen zwischen 3 und 30. Die Statistik stellt das Verhältnis zwischen der Varianz zwischen Clustern und der Varianz innerhalb von Clustern dar. Höhere Werte eignen sich besser für die Maximierung von Ähnlichkeiten innerhalb von Clustern und Unterschieden zwischen Clustern.
Vom Werkzeug wurden drei Cluster erstellt, da der höchste Pseudo-F-Statistikwert 3 lautet, wie im Diagramm zu sehen. Es gibt einen zweiten Spitzenwert bei 6, was ebenfalls eine akzeptable Lösung wäre.
- Schließen Sie das Diagramm.
- Klicken Sie auf die Registerkarte Geoverarbeitung.
Im Werkzeugbereich Multivariate Cluster-Bildung werden die verwendeten Einstellungen bei der Ausführung des Werkzeugs angezeigt. Sie ändern die Anzahl der Cluster, die vom Werkzeug erstellt werden, und führen es erneut aus.
-
Geben Sie im Werkzeug Multivariate Cluster-Bildung im Feld Anzahl der Cluster die Zahl 6 ein.
- Übernehmen Sie die Standardwerte für die anderen Parameter, und klicken Sie auf Ausführen.
Das Werkzeug wird ausgeführt und generiert eine neue Karte mit sechs Clustern.
Zusätzlich zur Karte der Punkt-Cluster erstellt das Werkzeug ein Diagramm, aus dem die Eigenschaften der Cluster hervorgehen. Dieses untersuchen Sie als Nächstes.
Eigenschaften der Cluster untersuchen
Die Punkte in jedem dieser Cluster tendieren zu ähnlichen Werten für jede der drei Variablen. Im Diagramm Box-Plots zur multivariaten Cluster-Bildung werden diese Wertgruppen angezeigt.
- Doppelklicken Sie im Bereich Inhalt im Layer-Abschnitt sample_locations_MultivariateClustering auf das Diagramm Box-Plots zur multivariaten Cluster-Bildung.
Das Diagramm zeigt Box-Plots der Verteilung von standardisierten Werten für die einzelnen Variablen sowie Linien, die die Mittelwerte der einzelnen Cluster für jede Variable anzeigen.
In diesem Diagramm zeigen die drei Box-Plots standardisierte Werte der Variablen für den jährlichen Niederschlag, den Temperaturbereich innerhalb eines Jahres und die jährliche mittlere Temperatur.
Über diesen Box-Plots werden Linien dargestellt, die angeben, wo die Mittelwerte innerhalb der einzelnen Cluster für jede Variable liegen.
- Zeigen Sie im Diagramm Box-Plots zur multivariaten Cluster-Bildung auf den Cluster-2-Punkt des Box-Plots zum jährlichen Niederschlag.
In diesem Beispiel wird Cluster 2 rot dargestellt. Die Diagrammfarben stimmen mit den Punktfarben in der Karte überein, die nach dem Zufallsprinzip zugewiesen wurden. Die Cluster-2-Punkte können bei Ihnen eine andere Farbe aufweisen.
Es wird ein Pop-up mit der Cluster-ID für den Punkt, dem Namen der Analysefelder und dem Mittelwert für den Cluster geöffnet.
Auf diese Weise können Sie die Mittelwerte für alle Felder der einzelnen Cluster untersuchen. Die Cluster-Punkte sind durch Linien derselben Farbe miteinander verbunden.
Die rote Linie stellt Punkte in Cluster 2 des Diagramms dar und lässt einen höheren Mittelwert für den jährlichen Niederschlag im Vergleich zu den anderen Clustern, einen Zwischenwert für den Temperaturbereich innerhalb eines Jahres und einen niedrigeren Mittelwert für die jährliche mittlere Temperatur erkennen. Dieser Cluster befindet sich in den höher gelegenen Gebieten mitten im Wald, wo es feuchter und kühler ist als in anderen Gebieten.
Im Gegensatz dazu stellt die hellblaue Linie Punkte in Cluster 1 dar und weist die niedrigsten Werte beim Mittelwert für den jährlichen Niederschlag, die höchsten Werte beim Temperaturbereich innerhalb eines Jahres und einen Zwischenwert bei der jährlichen mittleren Temperatur auf. Diese Punkte entsprechen niedriger gelegenen Gebieten am westlichen Waldrand.
Sie haben sechs Cluster erstellt, die sechs bioklimatisch ähnliche Gebiete innerhalb des Waldes darstellen. Zwei der Cluster, Cluster 1 und Cluster 5, umfassen räumlich nicht zusammenhängende Gebiete.
Diese Cluster eignen sich ggf. für Ihre Arbeit.
In einigen Fällen kann es wünschenswert sein, wenn die Cluster räumlich zusammenhängende Gebiete umfassen. Sie verwenden das Werkzeug Räumlich eingeschränkte multivariate Cluster-Bildung, um zusammenhängende Cluster zu erstellen.
Zusammenhängende Cluster erstellen
Beim Artenschutz kann es hilfreich sein, wenn zusammenhängende Lebensraum-Cluster vorliegen. Wenn Cluster räumlich zusammenhängen sollen, können Sie ein Werkzeug verwenden, das räumliche Einschränkungen bei der Cluster-Bildung ermöglicht.
- Klicken Sie auf die Registerkarte Geoverarbeitung und dann im Werkzeugbereich Multivariate Cluster-Bildung auf die Schaltfläche "Zurück".
- Geben Sie im Bereich Geoverarbeitung im Suchfeld Räumlich eingeschränkte multivariate Cluster-Bildung ein, und klicken Sie in den Ergebnissen der Werkzeugsuche auf das Werkzeug Räumlich eingeschränkte multivariate Cluster-Bildung.
- Wählen Sie im Werkzeug Räumlich eingeschränkte multivariate Cluster-Bildung für Eingabe-Features den Layer sample_locations aus.
- Aktivieren Sie unter Analysefelder die Kontrollkästchen Annual_precipitation, Annual_temperature_range und Mean_annual_temperature.
- Übernehmen Sie für Cluster-Größenbeschränkungen die Standardeinstellung Keine.
In diesem Fall müssen Sie die Größe der Cluster nicht einschränken.
- Geben Sie für Anzahl der Cluster den Wert 6 ein.
- Übernehmen Sie für Räumliche Einschränkungen die Standardeinstellung Gekürzte Delaunay-Triangulation.
- Klicken Sie auf Ausführen.
Das Werkzeug wird ausgeführt und erstellt verschiedene räumlich eingeschränkte Cluster. Der neue Layer wird zur Karte hinzugefügt.
Weitere Informationen zum Werkzeug Räumlich eingeschränkte multivariate Cluster-Bildung finden Sie in der Werkzeughilfe.
Sie haben bioklimatische Regionen mithilfe von drei Variablen und zwei Werkzeugen für die multivariate Cluster-Bildung erstellt. Sie haben erfahren, wie Sie die Eingabevariablen erhalten und erkunden sowie die Eigenschaften von Clustern untersuchen können. Dies war ein vereinfachtes Beispiel, um den Workflow und die verfügbaren Daten vorzustellen. Für Ihre eigene Arbeit würden Sie wahrscheinlich andere Variablensätze verwenden und die Variablen auswählen, die für den jeweiligen Ort, die Lebensräume und betreffenden Arten in dem Gebiet, das Sie schützen möchten, die höchste Relevanz haben.