データの準備

森林保全に関する情報に基づいた意思決定を行うために、共通の生気候学的特徴を持つ地域を特定します。

プロジェクトの探索

最初に、チュートリアル データをダウンロードします。

  1. IdentifyRegions.ppkx プロジェクト パッケージをダウンロードし、ダウンロードしたファイルをコンピューター上で見つけます。

    注意:
    ほとんどの Web ブラウザーでは、デフォルトでコンピューターのダウンロード フォルダーにファイルがダウンロードされます。

  2. [IdentifyRegions.ppkx] プロジェクト パッケージをダブルクリックします。

    プロジェクト パッケージは、ArcGIS Pro プロジェクトとデータを共有する 1 つの方法です。 これらは圧縮ファイルであり、開くとプロジェクトのコピーが C:\Users\[user name]\Documents\ArcGIS\Packages フォルダーに抽出されます。

    プロジェクト パッケージが抽出されるとプロジェクトが開き、ベースマップとエル・ユンケ国立公園のアウトラインを示すマップが表示されます。

    マップ上のエル・ユンケ国立公園

    エル・ユンケ国立公園はプエルトリコ東部に位置します。

生気候データのダウンロード

CHELSA (The Climatologies at high resolution for the earth’s land surface areas) の生気候変数データセットは、高解像度の全球気候データセットであり、種の分布をモデル化するのに役立ちます。 解析に役立ちそうな 1 つの変数のラスターをダウンロードします。

  1. ブラウザーで、CHELSA Bioclim ページに移動します。
  2. Bioclim データセットの説明を読みます。

    注意:
    役に立つ可能性のあるデータ レイヤーを調査する場合は、その説明をよく読むことが重要です。誰がデータを編集したか、どのように収集されたか、何に使用する予定か、データに使用上の制約があるかどうか、誰がデータを使用できるかなど、データに関する重要なコンテキスト情報が提供されています。

    CHELSA のデータは公開元とデータセットを明示することを条件に利用可能です。

  3. レイヤーの説明が書かれたテーブルまで下にスクロールします。

    レイヤーの説明が書かれたテーブル

    このテーブルには各レイヤーに関する情報が書かれており、使用するレイヤーを決めるのに役立ちます。

    bio1 レイヤーには、年平均気温データが含まれています。 これは森林内の地域を特定するのに役立つ可能性があります。

    このテーブルには 50 個のレイヤーについて記載されています。 このチュートリアルでは、[bio] が先頭に付いた 19 のレイヤーを扱います。 保全活動の詳細に応じて、さまざまなレイヤーの組み合わせを使用します。

  4. テーブルの上までスクロールし、[THE LAYERS CAN BE DOWNLOADED HERE] ダウンロード リンクをクリックします。

    テーブルの上のダウンロード リンク

    [S3 File Browser] ページが開きます。 4 つのフォルダーが表示されます。 1 つ目のフォルダーは、1981 年から 2010 年までの期間の過去のデータです。 他の 3 つのフォルダーには、さまざまな気候モデルを使用して作成した予測データが含まれています。

  5. [S3 File Browser] ページで、[1981-2010/] フォルダーの横の展開ボタンをクリックします。

    1981-2010 行の展開ボタン

    フォルダーが展開します。

  6. [bio/] フォルダーの横の展開ボタンをクリックします。

    bio フォルダーの横の展開ボタン

  7. ファイル名に [_bio1_] を含むファイルを探して、[CHELSA_bio1_1981-2010.V.2.1.tif] ファイルのダウンロード ボタンをクリックします。

    CHELSA_bio1_1981-2010.V.2.1.tif ダウンロード リンク

    [CHELSA_bio1_1981-2010.V.2.1.tif] ファイルがコンピューターにダウンロードされます。 このファイルは 110 MB です。

    先ほど確認したテーブルによると、このファイルは 1981 年から 2010 年までの期間の年平均気温データのラスター データセットです。

    このファイルをクリップしてサンプリングし、森林に関するデータを取得します。

    このチュートリアルでは、他の生気候データ ファイルをダウンロードする必要はありません。 他のファイルは、後で使用するためにあらかじめダウンロードしてクリップされ、プロジェクトに保存されています。

プロジェクトへのデータの追加

気温データをダウンロードしたので、プロジェクトに追加します。

  1. ArcGIS Pro のリボンの [マップ] タブをクリックし、[レイヤー] セクションで [データの追加] をクリックします。

    マップ タブのレイヤーセクションにあるデータの追加ボタン

  2. [データの追加] ウィンドウで [コンピューター][PC] の順に展開し、[ダウンロード] をクリックします。

    別の場所にダウンロードするようブラウザーが設定されている場合、Microsoft File Explorer でファイルを見つけ、[データの追加] ウィンドウでその場所を参照します。

  3. [CHELSA_bio1_1981-2010.V.2.1.tif] ラスター データセットをクリックして、[OK] をクリックします。

    ダウンロード フォルダーからのデータの追加

    ラスターの統計情報の計算を実行するか確認するメッセージが表示されます。

  4. [はい] をクリックします。

    [CHELSA_bio1_1981-2010_V.2.1.tif] レイヤーがマップ上に表示されます。

    マップに追加されたレイヤー

    このレイヤーは地球規模の範囲ですが、この部分はほとんどが白く表示されています。 前に表示されていたベースマップをカバーしています。 森林境界ポリゴンと、森林内にいくつかの明るい灰色のピクセルが確認できます。

    レイヤーの [値] の範囲を見ると、このラスター内のセルの値は 2196 から 3079 の間で、値が高いほどより明るい灰色の階調で描かれていることがわかります。

    データについて書かれたテーブルを確認すると、データには縮尺係数とオフセットが含まれていることがわかります。

    bio1 レイヤー データの説明

    この情報に基づいて変換して (縮尺係数 0.1 を掛けて、273.15 を引く) 、ラスターの値を摂氏で表すと -53.55 から 34.75 の範囲になります。

  5. [コンテンツ] ウィンドウで、[CHELSA_bio1_1981-2010.V.2.1.tif] レイヤーを右クリックして [レイヤーにズーム] をクリックします。

    レイヤーにズーム

    マップにレイヤーの範囲全体が表示されます。

    世界全体の bio1 レイヤー値

    気温値の高い赤道地域は明るい色、気温値の低い両極は暗い色になっていることがわかります。 公園の境界は小さな暗い斑点として表されています。

    解析に適しているか理解するために、ダウンロードするデータを探索することをおすすめします。

  6. [コンテンツ] ウィンドウで、[boundary] レイヤーを右クリックし、[レイヤーにズーム] をクリックします。

    [CHELSA_bio1_1981-2010.V.2.1.tif] レイヤーをダウンロードし、探索しました。 このデータは解析に役立ちそうです。

ラスターのクリップ

森林保全活動にデータの全範囲は必要ないので、次に、森林境界を使用してこのデータをクリップします。

  1. リボンの [解析] タブの [ジオプロセシング] セクションで、[ツール] をクリックします。

    リボン上の [ツール] ボタン

    [ジオプロセシング] ウィンドウが表示されます。

  2. [ジオプロセシング] ウィンドウの検索ボックスに「ラスターのクリップ」と入力し、ツールの検索結果から [ラスターのクリップ] ツールをクリックします。

    検索結果のラスターのクリップ ツール

  3. [ラスターのクリップ] ツールの [入力ラスター][CHELSA_bio1_1981-2010.V.2.1.tif] レイヤーを選択します。
  4. [出力範囲] には [boundary] レイヤーを選択します。

    ラスターのクリップ ツール

    このツールは、レイヤー内のフィーチャをクリップに使用するように指定しない限り、入力ラスターを境界フィーチャ レイヤーの全範囲にクリップします。

  5. [入力フィーチャをクリップ ジオメトリとして使用] チェックボックスをオンにします。

    入力フィーチャをクリップ ジオメトリとして使用がオン

    これで、ラスターが森林境界でクリップされます。

    [出力ラスター データセット] 名は、デフォルトで、元のラスター名の最初の部分の終わりに [_Clip] を追加した名前になっています。 ラスターはプロジェクト ジオデータベースに保存されます。

  6. [実行] をクリックします。

    ラスターがクリップされ、[CHELSA_bio1_19812010_V_Clip] レイヤーがマップに追加されます。

    クリップされたラスターは値の範囲が元とは異なるため、レイヤーのシンボルは、森林の値の範囲をよりはっきりと示すカラー ランプに変化しています。

    マップに追加された CHELSA_bio1_19812010_V_Clip

    元の地球規模の範囲のラスターはもう必要なくなったため、削除します。

  7. [コンテンツ] ウィンドウで [CHELSA_bio1_1981-2010.V.2.1.tif] レイヤーを右クリックし、[削除] をクリックします。
    注意:

    時間およびチュートリアル データのダウンロード サイズを節約するため、他の生気候変数のラスターはあらかじめクリップされています。 自ら行う必要がある場合、[ラスターのクリップ] ツールをバッチ モードで開けます。このためには、ツールを検索し、右クリックして [バッチ] をクリックします。 バッチ ツールの設定ウィンドウで、バッチ ツールのバッチ パラメーターは [入力ラスター] になっています。 [次へ] をクリックすると、[ラスターのクリップのバッチ処理] ツールが開きます。 すべての入力ラスターを [入力ラスターのバッチ処理] に追加し、残りのツール設定を [ラスターのクリップ] ツールで行ったやり方で構成します。 ツールを実行すると、各ラスターが森林範囲でクリップされます。

サンプル ポイントの生成

次のステップでは、ラスターから一連のポイントを作成します。 これにより複数のラスターのデータを結合でき、視覚化および多変量クラスター分析が可能になります。 [ラスター → ポイント] ツールを使用して、セルの中心にラスター値を属性として持つ一連のポイントを作成します。

  1. [ラスターのクリップ] ツールで [戻る] ボタンをクリックします。
  2. [ジオプロセシング] ウィンドウで検索ボックスに「ラスター → ポイント」と入力し、ツールの検索結果から [ラスター → ポイント] ツールをクリックします。

    ラスター → ポイント ツールが表示された検索結果

  3. [ラスター → ポイント] ツールの [入力ラスター][CHELSA_bio1_19812010_V_Clip] レイヤーを選択します。
  4. [フィールド] はデフォルト値の [Value] をそのまま使用します。
  5. [出力ポイント フィーチャ] に「bioclimate_points」と入力します。

    実行準備ができたフィーチャ → ラスター ツール。

  6. [実行] をクリックします。

    [bioclimate_points] レイヤーがマップに追加されました。

    ラスター セルの中心の生気候ポイント

    このレイヤーを使用して生気候ラスターをサンプリングします。 生気候ラスターはあらかじめ準備されており、[Sample rasters] マップに含まれています。 作成したポイントをコピーし、生気候ラスターのマップに切り替えます。

  7. [コンテンツ] ウィンドウで、[bioclimate_points] レイヤーを右クリックし、[コピー] をクリックします。

    コンテンツ ウィンドウでショートカット メニューを右クリックしてレイヤーをコピー

  8. マップ ウィンドウで [Sample rasters] マップ タブをクリックします。

    マップ ウィンドウ上部のマップ タブ

  9. [コンテンツ] ウィンドウで、[Sample raster] を右クリックして [貼り付け] をクリックします。

    コンテンツ ウィンドウでショートカット メニューを右クリックしてレイヤーを貼り付け

    新しいマップには、19 個の CHELSA 生気候ラスターをクリップしたバージョンを収める [BioclimateRasters] グループ レイヤーが含まれています。

    Sample rasters マップのコンテンツ ウィンドウの BioclimateRasters グループ レイヤー

    このグループ レイヤーには各ラスター間で切り替えができるオプションが設定されています。 詳細については、「グループ レイヤーの操作」をご参照ください。

ラスター値のサンプリング

ラスター セルの中心にポイントを作成したので、次のステップでは [サンプル] ツールを実行し、これらのポイントに各ラスターの値を取り込みます。

  1. [ラスター → ポイント] ツールで [戻る] ボタンをクリックします。
  2. [ジオプロセシング] ウィンドウで検索ボックスに「サンプル」と入力し、ツールの検索結果から [サンプル] ツールをクリックします。

    サンプル ツールが表示された検索結果

  3. [入力ラスター][複数追加] ボタンをクリックします。

    複数追加ボタンで複数の入力ラスターを追加

  4. チェックボックスをオンにし、すべて選択します。

    チェックボックスをオンにし、すべてのラスターを選択

  5. [追加] をクリックします。

    すべての選択したラスターを入力ラスター セクションに追加

  6. [入力ロケーション ラスターまたはフィーチャ] で、[bioclimate_points] を選択します。
    bioclimate_points レイヤーを選択してラスターをサンプリング

    [bioclimate_points] レイヤーの各ポイントを使用して、その位置の各ラスター値をサンプリングします。

  7. [出力テーブルまたはフィーチャクラス] に、「Sample_vals」と入力します。

    出力テーブルの名前を Sample_vals に設定

  8. [リサンプリング手法][一意の ID フィールド] は、デフォルト値をそのまま使用します。
  9. [実行] をクリックします。

    [Sample_vals] テーブルが [コンテンツ] ウィンドウの [スタンドアロン テーブル] セクションに追加されます。

  10. [コンテンツ] ウィンドウで、[Sample_vals] テーブルを右クリックして [開く] をクリックします。

    テーブルを開きます。

  11. テーブルを確認します。

    フィールド名は、ラスター レイヤー名から付けられています。 必要な生気候変数を特定する情報が含まれていますが、これらはよりわかりやすくできます。

    ラスター名に基づく、サンプリングされた生気候変数フィールド名

    データを解釈しやすくするために、フィールドによりわかりやすいエイリアスを作成します。

フィールド エイリアスの設定

フィールド名がわかりづらい場合、エイリアスを割り当てることで作業がしやすくなります。 CHELSA Bioclim の説明ページのテーブルには、ショートネームとロングネームのフィールドがあります。 このテーブルを使用して、生気候変数と対応する bio1、bio2、bio3 などのコードを特定し、それらの名前をフィールド エイリアスとして使用できます。

  1. ブラウザーで、CHELSA Bioclim ページに移動します。
  2. レイヤーの説明が書かれたテーブルを確認します。

    CHELSA Bioclim ページでレイヤーについて説明する、ショートネームとロングネームの列があるテーブル

  3. [コンテンツ] ウィンドウの [スタンドアロン テーブル] セクションで、[Sample_vals] テーブルを右クリックして [データ設計] にカーソルを合わせ、[フィールド] をクリックします。

    データ設計ショートカット メニュー オプションのフィールド オプション

    [フィールドの設計] ウィンドウが表示されます。

  4. [エイリアス] 列の [_bio1_] 変数をクリックします。

    エイリアス列の変数

    CHELSA Bioclim Web ページのテーブルを見ると、[_bio1_] 変数は年平均気温に対応します。

  5. [エイリアス] 列の [_bio1_] 変数に「mean_annual_air_temperature」と入力します。

    フィールドの設計ウィンドウの Sample_vals テーブル

    この方法を使用して、各フィールドのエイリアスを更新できます。 ただし、このチュートリアルでは、すべてのフィールドにエイリアスを設定する必要はありません。 時間を節約するため、後で使用するレイヤーはあらかじめ準備されています。

  6. リボンの [スタンドアロン テーブル] タブの [編集の管理] セクションで、[保存] をクリックします。

    編集の管理セクションの保存ボタンで、フィールド エイリアスの変更を保存

    テーブルの列名が更新されます。

    エイリアス mean_annual_air_temperature を表示する Sample_vals テーブル

サンプル テーブルをポイントに結合

解析のために生気候データをポイント フィーチャに取り込む最後のステップとして、セルの中心に作ったポイントに、作成したテーブルを結合します。

  1. [コンテンツ] ウィンドウで、[bioclimate_points] レイヤーを右クリックし、[テーブルの結合とリレート] にカーソルを合わせて [結合] をクリックします。

    [テーブルの結合] ツールが開きます。

  2. [テーブルの結合] ツールの [入力フィールド][OBJECTID] を選択します。

    ツールはコンテンツにスタンドアロン テーブルがあることを検出し、[結合テーブル] パラメーターに追加します。 同時に、このテーブルに [OBJECTID] の名前を持つフィールドがあることを検出し、[フィールドの結合] のデフォルトとして設定します。

    テーブルの結合ツールにテーブルとフィールドを追加

    これらは正しい入力であるため、ツールを実行する準備が整いました。 他のテーブルがある場合、または他のフィールドを結合したい場合は、これらを変更できます。

  3. [OK] をクリックします。
  4. [bioclimate_points] レイヤーを右クリックし、[属性テーブル] をクリックします。

    ポイント レイヤーに [Sample_vals] テーブルの属性が追加されました。

    テーブルの [mean_annual_air_temperature] フィールドには設定したエイリアスが表示されています。

    結合したテーブルからの属性を持つポイント フィーチャ レイヤー

    これで、地域の特定のためにデータの探索と解析を行う準備ができました。

生気候データのダウンロード、対象地域のクリップ、セルの中心によるサンプル ポイントの作成、テーブルへの複数の生気候ラスターのサンプリング、エイリアスの設定、ポイントへのテーブルの結合を行いました。 次に、準備したデータにいくつか調査を行います。


変数の特定

生物気候データを準備できたので、次は変数を確認します。

散布図マトリックス チャートの作成

散布図マトリックス チャートは、考慮すべき数値変数が複数ある場合に変数ペアを比較するのに適した方法です。 生物気候変数の散布図マトリックスを作成して、変数間のリレーションシップを調べます。

  1. マップ ウィンドウで、[Identify variables] マップ タブをクリックします。

    Identify variables マップ タブ

    [Identify variables] マップに、森林境界レイヤーと [sample_locations[ という名前のレイヤーが表示されます。 [sample_locations] レイヤーには、説明的なフィールド名とエイリアスが付いた生物気候変数のサンプル データがあります。

  2. [コンテンツ] ウィンドウで、[sample_locations] レイヤーを右クリックし、[チャートの作成] をポイントして [散布図マトリックス] を選択します。

    レイヤーの散布図マトリックス作成するためのショートカット メニュー

    [チャート プロパティ] ウィンドウが表示されます。

    このウィンドウで、チャートのプロパティを設定できます。 散布図マトリックスを設定する最初のステップは、互いにプロットされる数値変数の選択です。

  3. [チャート プロパティ] ウィンドウで、[選択] をクリックします。

    数値フィールドの選択ボタンが表示されているチャート プロパティ ウィンドウ

    散布図マトリックス チャートには、19 の生物気候変数から選択できます。

  4. [すべてのチェック ボックスの切り替え] ボタンをクリックします。

    すべてのチェック ボックスの切り替えボタンが表示されたフィールド選択ボックス

    非常に多くのフィールドがあるため、すべてのフィールドを選択してから使用しないフィールドをオフにする方が簡単です。

  5. 最初の 2 つのフィールド [pointid][grid_code] をオフにして、[適用] をクリックします。

    生物気候変数フィールドはオン、pointid と grid_code はオフになっている。

    チャート ウィンドウに散布図マトリックスが表示されます。

散布図マトリックスを使用したデータ リレーションシップの確認

散布図マトリックス チャートを作成したので、これを使用してデータを調べ、森林のさまざまな位置における変数間のリレーションシップを確認します。 研究要件とこの調査に基づいて、使用する変数を決定します。

チャートが ArcGIS Pro にドッキングしている場合は、小さすぎて読み取りにくいことがあるため、最初にウィンドウをフローティングして拡大しやすくします。

  1. [sample_locations - Scatter plot matrix of Sample_locations] タブを右クリックして、[Float] をクリックします。

    散布図マトリックス チャート タブのショートカット メニューの Float オプション

  2. [Scatter plot matrix of sample_locations] チャート ウィンドウの隅をクリックしてドラッグし、プロットの配列が見やすくなるように拡大します。

    散布図マトリックス ウィンドウ

    チャートでには、X 軸と Y 軸上に各変数が表示されます。 変数の組み合わせごとに小さい散布図が表示されます。

    小さいプロットの 1 つにカーソルを合わせると、変数名と相関係数の二乗値がポップアップ表示されます。

  3. 正の相関が高いプロット (左から右に上昇傾向があるポイントの細い線) の 1 つにカーソルを合わせます。

    ポイントにカーソルを合わせると、変数名とリレーションシップの相関係数の二乗値がポップアップ表示されます。

    このデータセットでは、この特定の分析範囲において、最乾燥月の各位置の降水量が最湿潤月の各位置の降水量と強い正の相関を示しています。

  4. 負の相関が高いプロット (左から右に下降傾向があるポイントの細い線) の 1 つにカーソルを合わせます。

    ポイントにカーソルを合わせると、変数名とリレーションシップの相関係数の二乗値がポップアップ表示されます。

    このデータセットでは、この分析範囲において、各位置の年間平均気温が各位置の気温の季節性 (月平均気温の標準偏差) と強い負の相関を示しています。

  5. 相関がはっきりしないプロットの 1 つをクリックして、カーソルを合わせます。

    プロットをクリックして選択し、カーソルを合わせる。

    プロットの 1 つをクリックして選択すると、チャート ウィンドウの右上部分に拡大図が表示されます。

    選択したチャートがウィンドウの右上部分に拡大表示されます。

    このデータセットでは、この分析範囲において、気温の季節性と最乾季の平均降水量の間に強い相関はないようです。 データの異なるサブセットでは、これらの変数間に異なるリレーションシップが存在する可能性があります。

  6. 散布図マトリックス チャートのツールバーで、[選択] ツールをクリックします。

    散布図マトリックス チャート ウィンドウの選択ツール

    チャートとマップはリンクしているため、大きいチャートで選択した内容は、すべての小さい散布図とマップに反映されます。 これにより、チャート上のデータ ポイントを対話的に選択し、マップ上の位置を確認できます。

  7. ボックスをクリックしてドラッグし、選択した散布図の右上部分にあるポイントの一部を選択します。

    チャート上のボックスをクリックしてドラッグし、データ ポイントの一部を選択します。

    選択の様子を示す散布図マトリックス

    大きいチャートで選択した内容は、小さいチャートに反映されます。

    選択内容は、マップにも表示されます。

    選択したポイントはマップ上にハイライト表示されます。

    この方法を使用して、分析範囲内のさまざまな場所で異なる変数間のリレーションシップを継続して調査できます。

  8. 大きいチャートのポイントがないエリアをクリックします。

    チャート上のポイントがないエリア

    チャートとマップ上の選択が解除されます。

  9. チャート ウィンドウを閉じます。

    チャートが [コンテンツ] ウィンドウに表示されます。 ダブルクリックすると、再度開くことができます。

    コンテンツ ウィンドウの散布図マトリックス チャート

    CHELSA の生物気候データセットは、多くの研究トピックに適用できる多目的データセットです。 19 の生物気候変数のうち、多くの変数は気温と降水量に関連しており、これらの変数の多くが高度に相関しています。 これらの変数は、年間の傾向、季節性、極端な要因や制限要因を示します。 ここで紹介したすべてのデータがあらゆるプロジェクトの役に立つわけではありません。

    地域化の分析では、相関の高くない変数が必要です。 地域の定義には、年間降水量、年間温度範囲、年間平均気温を使用します。 エリアと使用例に応じて、さまざまな変数を選択できます。

生物気候変数ペア間のリレーションシップを調べ、変数のさまざまな地理サブセットがどのようにしてこのデータセット内で異なるリレーションシップやクラスタリング パターンを持つことがあるのかを確認しました。 次は、選択した変数で地域化の分析を行います。


地域の特定

データが準備され、変数が指定されたので、最後のステップは地域化分析の実行です。

地域化とは、各地域内の主要な特定基準に基づいて 1 つのエリアをさらに小さな地域に分割し、各地域の特性を把握することです。 地域化の目的は、保全計画と管理のために、重要かつ主要な環境要因を空間的地域に集約することです。 種と対象地域によって、異なる変数が重要になります。

クラスターの作成

[多変量クラスター分析] ツールを使用し、選択した変数に基づいてクラスターを作成します。

  1. マップ ウィンドウで、[Identify regions] マップ タブをクリックします。

    Identify regions マップ タブ

    このマップには、[sample_locations] レイヤーと [boundary] レイヤーが表示されます。

  2. [ジオプロセシング] ウィンドウの検索ボックスに、「多変量クラスター分析」と入力し、ツールの検索結果に表示された [多変量クラスター分析] ツールをクリックします。

    ジオプロセシング ツールの検索結果に表示された多変量クラスター分析ツール

  3. [多変量クラスター分析] ツールの [入力フィーチャ] で、[sample_locations] レイヤーを選択します。

    入力フィーチャ パラメーターは sample_locations レイヤーにします。

  4. [分析フィールド] ボックスで、[Annual_precipitation][Annual_temperature_range]、および [Mean_annual_temperature] をオンにします。

    3 つの変数がオンになった分析フィールド ボックス

  5. [クラスター分析手法][初期化方法] のデフォルト値をそのまま使用します。

    デフォルトのクラスタリング アルゴリズムは、K 平均アルゴリズムです。 デフォルトの初期化方法は、最適化されたシード ロケーションです。 これらのパラメーターの詳細については、ツールのヘルプをご参照ください。

  6. [クラスターの数] パラメーターは空白のままにします。

    ツールが検索するクラスターの数を事前に決めている場合は、ここで指定できます。 データ内の自然クラスターを最初に検索する場合は、この値を未指定のままにすることができます。 ツールが、データに基づいて最適なクラスター数を指定します。

  7. [クラスター数の評価に使用する出力テーブル] に「Output_number_of_clusters」と入力します。

    クラスター数の評価に使用する出力テーブルの任意のパラメーターが入力されたため、テーブルとチャートが作成されます。

    この出力テーブルを指定すると、さまざまなクラスター数の疑似 F 統計値を示すチャートも作成されます。 疑似 F 統計値が最大となるソリューションでは、同じクラスターに属するフィーチャ同士の相似性、違うクラスターに属するフィーチャ同士の相違性が両方とも最大になります。

    このチャートを使用して、ツールの出力を把握し、作成するクラスターの数を決定します。

  8. [実行] をクリックします。

    ツールが実行され、しばらくすると、[sample_locations_MultivariateClustering] レイヤーがマップに追加されます。

    sample_locations_MultivariateClustering レイヤーがマップに追加されます。

    このレイヤーには、[クラスター ID] によってシンボル表示されたサンプル位置が表示されます。 3 つのクラスターが特定されています。

    ここから始めるわけですが、3 つのクラスターだと大きく、詳細な生態学的決定を下すには適さない可能性があります。 さらに多くのクラスターを作成するようにツールを設定できますが、必要なクラスター数を判断するにはどうすればよいのでしょうか?

    [Output_number_of_clusters] テーブルを作成するようにツールを設定したため、データ内のクラスターを確認してより適切に把握できるチャートも作成されています。 次は、この情報を使用して分析を調整します。

クラスター分析の調整

ツールが [Output_number_of_clusters] テーブルに記録した疑似 F 統計値を確認します。

  1. [コンテンツ] ウィンドウの [スタンドアロン テーブル] セクションにある [チャート] サブセクションで、[最適化された疑似 F 統計チャート] をダブルクリックします。

    ツールによって、最適化された疑似 F 統計チャートがコンテンツ ウィンドウに追加されました。

    チャートが開きます。 必要に応じて、サイズを変更してわかりやすくします。

    チャート ウィンドウに表示される最適化された疑似 F 統計チャート

    このチャートには、クラスタリング ソリューションの疑似 F 統計値が 3 から 30 まで表示されています。 この統計は、クラスター間の分散とクラスター内の分散の比率です。 クラスター内の相似性とクラスター間の相違性の両方を最大化するには、値が大きいほど適しています。

    チャートに示されているとおり、クラスター数が 3 のときに疑似 F 統計値が最も大きくなるため、ツールは 3 つのクラスターを作成しました。 2 番目のピークは 6 のときで、これも許容できるソリューションです。

  2. チャートを閉じます。
  3. [ジオプロセシング] タブをクリックします。

    [多変量クラスター分析] ツール ウィンドウに、ツールの実行時に使用した設定が表示されます。 ツールが作成するクラスターの数を変更して、再度実行します。

  4. [多変量クラスター分析] ツールの [クラスターの数] ボックスに、「6」と入力します。

    クラスターの数を 6 に設定します。

  5. その他のパラメーターはデフォルトのままにし、[実行] をクリックします。

    ツールが実行され、6 つのクラスターがある新しいマップが生成されます。

    6 つのクラスターが生成されたツールのマップ

    ポイント クラスターのマップに加えて、ツールはクラスターの特性を示すチャートも作成します。 次は、クラスターの特性を調べます。

クラスターの特性の調査

各クラスターのポイントは、3 つの変数のそれぞれと似た値になる傾向があります。 [多変量クラスター分析の箱ひげ図] チャートには、これらの値セットが表示されます。

  1. [コンテンツ] ウィンドウの [sample_locations_MultivariateClustering] レイヤー セクションで、[多変量クラスター分析の箱ひげ図] チャートをダブルクリックします。

    コンテンツ ウィンドウに表示される多変量クラスター分析の箱ひげ図チャートの項目

    チャートには、各変数の標準化された値の分布を示す箱ひげ図と、各変数における各クラスターの平均値を示すラインが表示されます。

    多変量クラスター分析の箱ひげ図チャート

    このチャートには、年間降水量、年間温度範囲、年間平均気温変数の標準化された値を示す 3 つの箱ひげ図が表示されています。

    これらの箱ひげ図には、各クラスター内の平均値が各変数のどこに位置するかを示すラインが表示されています。

  2. [多変量クラスター分析の箱ひげ図] チャートで、年間降水量箱ひげ図のクラスター 2 のポイントにカーソルを合わせます。

    この例では、クラスター 2 は赤で描画されています。 チャートの色はマップ上のポイントの色と一致します。色はランダムに割り当てられます。 クラスター 2 のポイントの色は異なる場合があります。

    年間降水量箱ひげ図のクラスター 2 のポイント

    ポイントの [クラスター ID][分析フィールド] 名、クラスターの [平均値] を示すポップアップが表示されます。

    この方法を使用して、各クラスターのそれぞれのフィールドの平均値を確認できます。 クラスターのポイントは、同じ色のラインで結ばれます。

    このチャートのクラスター 2 のポイントを示す赤色のラインは、他のクラスターよりも年間降水量の平均値が高く、年間温度範囲は中間値で、年間平均気温の平均値は低いことを示しています。 このクラスターは、森林の中央にある標高が高いエリアを表しており、そこは他のエリアよりも湿度が高く涼しいことを示しています。

    一方で、クラスター 1 のポイントを示す水色のラインは、年間平均降水量の値が最も低く、年間温度範囲の値は最も高く、年間平均気温の値は中間であることを示しています。 これらのポイントは、森林の西端にある標高がより低い地点です。

    森林内の生物気候的に類似する 6 つのエリアを表す 6 つのクラスターを作成しました。 このクラスターのうち 2 つ (クラスター 1 とクラスター 5) には、空間的に連続していないエリアがあります。

    このようなクラスターが作業に適している場合があります。

    また、空間的に連続しているクラスターが望ましい場合もあります。 [空間的に制限された多変量クラスター分析] ツールを使用して、連続したクラスターを作成します。

連続するクラスターの作成

隣接する生息地クラスターがあると、種の保全に役立つことがあります。 クラスターを空間的に隣接させる必要がある場合は、クラスタリング プロセスに空間的な制限を含むツールを使用できます。

  1. [ジオプロセシング] タブをクリックし、[多変量クラスター分析] ツール ウィンドウで、戻るボタンをクリックします。

    多変量クラスター分析ツールの戻るボタン

  2. [ジオプロセシング] ウィンドウの検索ボックスに「空間的に制限された多変量クラスター分析」と入力し、ツールの検索結果の [空間的に制限された多変量クラスター分析] ツールをクリックします。

    空間的に制限された多変量クラスター分析ツールが表示されたツールの検索結果

  3. [空間的に制限された多変量クラスター分析] ツールの [入力フィーチャ] で、[sample_locations] レイヤーを選択します。
  4. [分析フィールド] ボックスで、[Annual_precipitation][Annual_temperature_range]、および [Mean_annual_temperature] をオンにします。

    3 つの変数がオンになった分析フィールド ボックス

  5. [クラスター サイズの制約] で、デフォルト値の [なし] をそのまま使用します。

    このケースでは、クラスターのサイズを制限する必要はありません。

  6. [クラスターの数] に「6」と入力します。

    6 に設定されたクラスターの数

  7. [空間的制限] で、デフォルト値の [ドロネー三角形分割の切り詰め] をそのまま使用します。
  8. [実行] をクリックします。

    ツールが実行され、一連の空間的に制限されたクラスターが作成されます。 新しいレイヤーがマップに追加されます。

    マップ上の空間的に制限されたクラスター

    [空間的に制限された多変量クラスター分析] ツールの詳細については、ツールのヘルプをご参照ください。

3 つの変数と 2 つの多変量クラスター分析ツールを使用して、生物気候的域を作成しました。 入力変数の取得および調査方法とクラスター特性の検証方法を確認しました。 これは、ワークフローと利用可能なデータを示すための簡単な例です。 実際の作業では、異なる変数セットを使用する可能性が高くなります。また、保全活動を行うエリアで重視する位置、生息地、種に最も関連性の高い変数を選択することになるでしょう。