種の観測データのダウンロード
最初のステップは、対象とする種の観測データ、つまり存在データの取得です。 このセクションでは、科学的利用のために複数の情報源からの観測データをまとめている GBIF (Global Biodiversity Information Facility) からデータをダウンロードします。 その後、アナグマの観測データを ArcGIS Pro に追加し、データ タイプが、実行する解析タイプに適していることを確認します。
ArcGIS プロジェクトの設定
最初に、データを操作する ArcGIS Pro プロジェクトを設定します。 このチュートリアルで後ほどデータをクリップするために使用する、スペイン国境を示すレイヤーを追加します。
- ArcGIS Pro を起動します。 サイン インを求められたら、ライセンスが割り当てられた ArcGIS 組織アカウントを使用してサイン インします。
注意:
ArcGIS Pro へのアクセス権限または組織アカウントがない場合は、ソフトウェア アクセスのオプションをご参照ください。
ArcGIS Pro を開くと、新しいプロジェクトを作成するか、既存のプロジェクトを開くかを選択できるオプションが表示されます。 以前プロジェクトを作成したことがある場合は、最近使用したプロジェクトのリストが表示されます。
- [新しいプロジェクト] の下の [マップ] をクリックします。
- [新しいプロジェクト] ウィンドウで、[名前] に「EuropeanBadger_Habitat」と入力します。 [位置] は変更せず、[このプロジェクトのフォルダーを作成] がオンになっていることを確認します。
- [OK] をクリックします。
まず、スペイン国境を示すレイヤーをマップに追加します。 後でこのレイヤーを使用して、環境データのクリップと制限を行います。
- リボンの [表示] タブをクリックします。 [ウィンドウ] グループで、[カタログ ウィンドウ] を選択します。
[カタログ] ウィンドウが表示されます。 [カタログ] ウィンドウを使用すると、アイテムをプロジェクトに追加することや、アイテムを表示、作成、管理することや、アイテムのプロパティに関する情報を入手することができます。
- [カタログ] ウィンドウで、[ポータル] タブをクリックして [Living Atlas] を選択します。
- [Spain Country Boundary] レイヤーを検索します。 [esri_dm] が所有する [Spain Country Boundary] フィーチャ レイヤーを検索し、結果をマップにドラッグします。
このレイヤーがマップに描画され、[コンテンツ] ウィンドウに ESP_Country として追加されます。
GBIF からの動物観測データのダウンロード
次に、GBIF (Global Biodiversity Information Facility) から動物観測データをダウンロードします。 GBIF は種が記録された場所についてのデータを収集するグローバルなデータ リポジトリです。 iNaturalist などの複数の情報源からのデータが含まれ、広く利用できるように、データの形式が共通のスキーマで指定されています。
注意: 種の保護状況によっては、密漁やその他の干渉を防止するために位置データが不鮮明になっていることがあります。 ヨーロッパ アナグマは IUCN レッドリストで低危険種と分類されており、位置データは不鮮明になっていません。
- GBIF のヨーロッパ アナグマのページに移動します。
種の概要ページが表示されます。 このページには、オカレンス レコードとともに送信された写真、目撃された場所の地図、この動物の活動と生態の説明など、アナグマに関する情報が表示されています。
- ログインするか、アカウントをサイン アップします。
GBIF データは無料で提供されていますが、ダウンロードできるのはアカウントを持っているユーザーのみです。 このようにすることで、GBIF は各ユーザーとダウンロードされたデータセットのカスタム引用を生成できるようにしています。
- 下にスクロールして [説明] 情報で [Activity] および [Biology Ecology] セクションを確認します。
- [Metrics] タブをクリックして目撃に関する統計情報を調べます。
アナグマは主に温暖な月にヨーロッパ全域で広く観測されています。 寒冷地では、アナグマは冬眠して冬の気候を乗り越えます。 結果を絞り込むため、国でフィルターできます。
- [Occurrences per Country or Area] グラフで [Spain] をクリックします。
[Table] タブが開き、スペインのオカレンス レコードが表形式で表示されます。 ダウンロードする前に、マッピング可能なデータのみをダウンロードするようにこのデータをフィルターします。 まず、Creative Commons でオープン ライセンスになっているデータをフィルターします。
- [License] を展開し、[CC0 1.0] および [CC BY 4.0] チェックボックスをオンにします。
- [Location] を展開して [Including coordinates] を選択します。
- [Issues and flags] セクションを展開してデータセットの潜在的な問題を確認します。
このセクションには各ポイントに関連付けられた潜在的な問題が一覧表示されます。 たとえば、ほとんどの座標が四捨五入されていることに注意してください。 解析結果を使用しようとする方法によっては、これらの問題によって調査データが不適格になる場合や、修正が必要になる場合や、潜在的エラーとして対処される場合もあれば、そうでない場合もあります。
- 表の上部にある [Download] ボタンをクリックします。
- [Download Options] テーブルで、[Simple] を選択します。
- ポップアップ ウィンドウで GBIF のユーザー契約と引用に関するガイドラインを読み、[Understood] をクリックします。
データのダウンロード ページが表示されます。 このページで、引用に関する情報とその他のデータ使用に関するガイドラインを確認します。
- データの処理が完了した後、[Download] をクリックします。
コンピューターに zip 圧縮された .csv ファイルがダウンロードされます。 カスタム引用を含む確認の電子メールが、GBIF アカウントに登録した電子メール アドレス宛に送信されます。 後でこれをデータ ソースの引用に使用します。
動物観測データの抽出
次に、アナグマの観測データを ArcGIS Pro に追加します。 ArcGIS Pro にログインした後、データを解析し、データ タイプが、実行する解析タイプに適していることを確認できます。 GBIF が使用しているスキーマでは、目撃日が 3 つの異なるフィールド (日、月、年) に格納され、テキスト フィールドとして格納されます。 目撃を月ごとに解析するため、日、月、年を組み合わせた日付タイプ フィールドを作成します。
- ファイル ブラウザーで、GBIF データをダウンロードした場所を参照します。
- ファイルを ArcGIS Pro プロジェクト フォルダーに解凍します。
デフォルトでは、新しいプロジェクト フォルダーは C:\Users\<username>\Documents\ArcGIS\Projects に作成されます。 ファイル パスは、ArcGIS Pro をダウンロードした場所によって異なる場合があります。
ファイルがダウンロードされた時点では、ファイル名が数字の文字列となっています。 プロジェクトに追加する前にファイル名を変更します。
- ファイル名を「Melesmeles_GBIF_[date]」に変更します (ただし、[date] をファイルのダウンロード日に置き換えます)。
マッピングの前にデータを準備できるように、ファイルをジオデータベース テーブルとして追加します。
- ArcGIS Pro で、リボンの [解析] タブをクリックします。 [ジオプロセシング] グループで、[ツール] をクリックします。
[ジオプロセシング] ウィンドウが表示されます。
- [ジオプロセシング] ウィンドウで [テーブル → ジオデータベース] ツールを検索して開きます。
- [入力テーブル] で [参照] をクリックして、[Melesmeles_GBIF_[date]] ファイルを選択します。
- [出力ジオデータベース] で [参照] をクリックし、プロジェクトのデフォルトのジオデータベースを選択します。 [実行] をクリックします。
テーブルがジオデータベースに追加されます。
- [カタログ] ウィンドウで、[プロジェクト] タブをクリックします。 [データベース] を展開し、[EuropeanBadger_Habitat] ジオデータベースを展開して、[Melesmeles_GBIF_[date]] テーブルをマップにドラッグします。
テーブルが [コンテンツ] ウィンドウの [スタンドアロン テーブル] の下に追加されます。 次にデータを見て、操作するフィールドと、後で解析するために形式を指定する必要のあるものを確認します。
- [Melesmeles_GBIF_[date]] テーブルを右クリックして [開く] を選択します。
このテーブルに、GBIF で見たものと同じデータが含まれています。 [decimalLatitude] 属性および [decimalLongitude] 属性を使用してデータをマッピングします。 また、時空間解析にも日付フィールドを使用しますが、[eventDate] フィールドはテキスト フィールドとして保存されています。 このフィールドを操作するには、日付が日付の形式である必要があります。
- テーブルの上部にある [計算] をクリックします。
[フィールド演算] ツールが開きます。
- [フィールド演算] ウィンドウの [フィールド名] で「stdTime」と入力します。
これで、形式を指定した日付を格納するための新しいフィールドを追加できます。
- [式の種類] で [Arcade] を選択し、[フィールド タイプ] で [Date] を選択します。
- [式] ボックスで式 Concatenate($feature.month, "/", $feature.day, "/", $feature.year) を作成します。
- [式] ボックスの下部で緑色のチェックマークをクリックしてその式が有効であることを確認し、[OK] をクリックします。
ツールの実行が終了すると、ウィンドウに完了ステータスが表示されます。 データの一部が欠けていたため書き込まれなかった値があるという警告がメッセージに表示されます。 この時点では、これは無視します。
- 完了したツール ウィンドウを閉じます。
データの時間的広がりを見るために、カレンダー ヒート チャートを作成します。
カレンダー ヒート チャートは、インシデントをカレンダー グリッドに集約することで、時系列データのパターンを視覚化します。 カレンダー グリッドは、1 年間の月単位、または 1 週間の曜日単位で時間的パターンを表示するよう構成できます。
- [コンテンツ] ウィンドウで、[Melesmeles_GBIF_[date]] テーブルを右クリックして、[チャートの作成] をクリックし、[カレンダー ヒート チャート] を選択します。
空白の [チャート] ウィンドウが表示されます。
- [チャート プロパティ] ウィンドウの [日付] で、[stdTime] フィールドを選択します。
チャートが入力され、目撃があった月と日のヒート チャートが表示されます。 目撃は 1 年中ありましたが、目撃数が多いのは気温の低い秋と冬の月でした。
- [Melesmeles_GBIF_[date]] テーブルとチャートを閉じます。 プロジェクトを保存します。
これでヨーロッパ アナグマの観測データをダウンロードし、初期データ準備のために ArcGIS Pro に追加したため、マッピングする準備が整いました。 各観測ポイントに、データのマッピングに使用する座標が含まれています。
存在ポイントと偽不在ポイントのマッピング
種の分布のモデリングは、さまざまな統計手法を使用して、複数の方法で実行できます。 それらの手法の多くで、存在データと不在データ (このチュートリアルのケースでは偽不在データ) の両方が必要になります。 また、動物種に適した気候条件や生息地条件の種類を判断するための環境データも必要です。 すでに存在データはあるため、偽不在データまたは背景データを生成して、各地の環境属性データを抽出できます。
存在ポイントのマッピング
最初に、ヨーロッパ アナグマの表形式データをフィーチャクラスに変換して、アナグマの存在をマッピングします。 次に、データを検証します。 データ収集の方法 (1 回の目撃の報告ではなく、動物の移動の追跡調査など) によっては、一部のデータがアナグマの位置を過剰に表している場合があります。
注意:
Presence Only 予測 (MaxEnt) などの分析方法を使用する予定であれば、ジオプロセシング ツール内に、このセクションで実行するデータ準備も含まれています。 しかし、回帰などの他の分析方法を使用する予定であれば、以下の操作はデータ準備のための必須のステップとなります。
- [コンテンツ] ウィンドウで、[Melesmeles_GBIF_[date]] テーブルを右クリックして、[テーブルからポイントを作成] をポイントし、[XY テーブル → ポイント] を選択します。
- [XY テーブル → ポイント] ウィンドウで、次のパラメーターを設定して [OK] をクリックします。
- [出力フィーチャクラス]: 「EuropeanBadger_points」
- [X フィールド]: [decimalLongitude]
- [Y フィールド]: [decimalLatitude]
このツールの実行が終了すると、レイヤーが [コンテンツ] ウィンドウに追加されます。 バルセロナの周辺に大きな観測ポイントのグループがあり、セビリアの南に密なクラスターがあります。
注意:
このデータをダウンロードした時点で、ライセンス要件やその他の選択要件を満たす観測ポイントは 2,214 個ありました。 お使いのデータセットはこれとは異なる可能性があります。
- セビリアの南にあるクラスターを拡大します。
この観測ポイント クラスターはドニャーナ国立公園内にあり、動物の移動追跡を表しているようです。つまり、観測ポイントの各セットが 1 動物個体を表している可能性が高いということです。 このデータの収集方法を確認するために、レイヤーの属性テーブルを開きます。
- [コンテンツ] ウィンドウで、[EuropeanBadger_points] レイヤーを右クリックして、[属性テーブル] を選択します。
- リボンの [マップ] タブにある [選択] グループで、[選択] をクリックして、マップ上のドニャーナ国立公園内のポイント周辺に四角形を描画します。
- 属性テーブルの下部にある [選択レコードの表示] をクリックします。
テーブルがフィルターされ、選択したレコードのみが表示されます。 選択領域の描画方法によって異なりますが、観測ポイントのおおよそ半数がこの国立公園内に収まるため、ポイントのほとんどが追跡調査によって収集されたと見なすことができます。 今後の解析でこのエリアを過剰に表すことがないように、これらのポイントを間引きます。
- [ジオプロセシング] ウィンドウで、[同一値を持つレコードの削除] ツールを検索して開きます。
ツールの上部に、このツールによって入力データセットが変更されるという警告が表示されます。 [同一値を持つレコードの削除] ツールは、入力するフィーチャ レイヤーからポイントを完全に削除しますが、[スタンドアロン テーブル] を変更することはありません。
- [入力データセット] で、[EuropeanBadger_points] を選択し、[選択されているレコードを使用] 切り替えボタンをオンのままにします。
- [フィールド] で、[Shape] を選択します。 [XY 許容値] で、[500 メートル] を選択して [実行] をクリックします。
ツールの実行が完了したら、属性テーブルを更新する必要があります。選択したレコードの一部が削除されたためです。
- [テーブルの読み込みに失敗しました] ウィンドウで、[OK] をクリックします。
- リボン上の [選択] グループで [選択解除] をクリックして、選択を解除します。
国立公園内にはまだ多くのポイントが残っていますが、これは間引かれた結果です。
- [属性] テーブルをもう一度開き、テーブル下部に表示される残りの存在ポイントの数を確認します。
選択したポイントに応じて、この数は変化します。 通常はこれ以降の操作で観測ポイントと同じ数の背景ポイントを作成することになるため、ここでは必ず具体的なポイント数を確認してください。 これで、ランダム サンプルを作成できるようになりました。
ランダム サンプリングによる偽不在ポイントの生成
存在データの準備ができましたので、次に偽不在ポイントを生成します。 最も単純な方法は、分析範囲内でランダム生成を使用することです。 存在ポイントと偽不在ポイントに等しく加重するため、存在ポイントと同じ数の背景ポイントを作成します。
- [ジオプロセシング] ウィンドウで、[空間サンプリング位置の作成] ツールを検索して開きます。
[空間サンプリング位置の作成] ツールは、単純ランダム、層化、系統 (グリッド)、またはクラスター サンプリング設計を使用して、連続する分析範囲内にサンプル位置を生成します。
- 次のパラメーターを入力し、[実行] をクリックします。
- [入力分析範囲]: [ESP_Country]
- [出力フィーチャ]: [ESP_randomsample]
- [サンプリング方法]: [単純ランダム]
- [サンプル数]: [EuropeanBadger_points] テーブルのポイント数
スペイン国内のランダム ポイントのレイヤーがマップに追加されます。 このデータセットを EuropeanBadger_points レイヤーと結合できるようになりました。
- [EuropeanBadger_points] 属性テーブルを閉じます。
- [ジオプロセシング] ウィンドウで、[マージ] ツールを検索して開きます。
- [入力データセット] で、[ESP_randomsample] と [EuropeanBadger_points] を選択します。 [出力データセット] に「badger_sample_set」と入力します。
[マージ] ツールでは、新しいレイヤーに追加するフィールドを指定でき、新しいフィールドを作成することもできます。 ここでは、[Presence] という新しいフィールドを追加します。このフィールドを使用して、GBIF データの観測ポイントとランダム サンプルの背景ポイントを区別することにします。
- [フィールド マップ] で、[フィールドの追加] ドロップダウン メニューをクリックし、[空のフィールドの追加] を選択します。
- [新しいフィールド] の名前を [Presence] に変更して Enter キーを押します。
デフォルトでは、[Presence] フィールドは [Text] フィールドとして設定されます。
- [Presence] フィールドをポイントし、[編集] をクリックします。 [フィールド プロパティ] ウィンドウで、[タイプ] をクリックして [Short] を選択します。
- [フィールド プロパティ] ウィンドウで [OK] をクリックして、[マージ] ツールを実行します。
注意:
[Presence] フィールドが空であることを示す警告が表示されます。
- [コンテンツ] ウィンドウで、[ESP_randomsample] と [EuropeanBadger_points] をオフにして、レイヤーを無効にします。 [badger_sample_set] レイヤーを右クリックし、[属性テーブル] をクリックします。
新しいレイヤーで存在ポイントと不在ポイントを区別するために、[Presence] フィールドの値を計算します。 通常、存在ポイントは値 1 として表示され、背景ポイントには値 0 が付与されます。 テーブルをスクロールして、マージ後のポイントには多数の NULL データ フィールドがあることに注目してください。 これらの NULL フィールドを使用して背景ポイントを選択します。
- テーブルで、[属性条件で選択] をクリックします。 [属性条件で選択] ウィンドウで [Where 句 kingdom が NULL である] という式を作成し、[適用] をクリックします。
- 属性テーブルで、[Presence] フィールドが表示されるまでスクロールします。 [Presence] の列名を右クリックして、[フィールド演算] を選択します。
- [フィールド演算] ウィンドウで、[Presence =] に「0」と入力し、[OK] をクリックします。
- [属性条件で選択] ウィンドウで、[WHERE 句の反転] チェックボックスをオンにして [OK] をクリックします。
- Presence の列名を右クリックして、[フィールド演算] を選択します。 [Presence =1] という式を作成し、[OK] をクリックします。
これで、観測された存在に対しては値 1、偽不在に対しては値 0 として、フィーチャにコード値が設定されます。
- リボン上で [選択解除] をクリックして、選択を解除します。 [ESP_randomsample] テーブルを閉じて、プロジェクトを保存します。
環境データの抽出
次に、アナグマの存在の判断に役立つ可能性のある環境変数を特定して準備します。 前述のとおり GBIF によると、アナグマは狩りや採餌をする生息地内の良好な植生被覆を好みます。 GBIF での動物に関する説明では、スペイン中部のアナグマは、森林と草地がある中高度の山岳地帯を好み、標高の低い場所を避けるということです。 このチュートリアルでは、土地被覆、傾斜角、標高など、種の分布のモデリングに必要なデータの取得と設定に焦点を当てます。
- SpainPortugalElev.zip ファイルをコンピューターにダウンロードし、作業中の ArcGIS プロジェクト フォルダーに解凍します。
このファイルには、USGS EROS Archive - Digital Elevation - Global Multi-resolution Terrain Elevation Data 2010 からダウンロードされた 2 つのラスター画像が含まれています。これらの画像はスペイン全土をカバーするようにまとめてモザイク化され、その後スペインとポルトガルの各国にクリップされています。 モザイク データセットの作成の詳細については、このドキュメントをご参照ください。 ここでは、このラスター画像を使用して、スペインの傾斜角データセットを作成します。
より詳細な傾斜角と標高のデータには ArcGIS Living Atlas からアクセスできます。 ただし、データのエクスポートに制限があり、一度にエクスポートできるデータは 4,000x4,000 ピクセルまでであるため、ArcGIS Living Atlas データは、対象の分析範囲の大きさには適していません。
- [カタログ] ウィンドウで [プロジェクト] タブをクリックして、[フォルダー] グループを展開し、[EuropeanBadger_Habitat] プロジェクト フォルダーを展開します。
- 解凍した [Spain_GTMED2010] 画像を見つけて、マップ上にドラッグします。
注意:
レイヤーのピラミッドを構築し統計情報を計算するよう求められたら、[OK] をクリックします。
- [コンテンツ] ウィンドウで、[badger_sample_set] レイヤーと [ESP_Country] レイヤーをオフにして、非表示にします。
標高ラスターがマップに描画されます。 このラスターを使用して傾斜角を計算できます。傾斜角は、アナグマの生息地を判断する上で役立つ可能性のある変数の 1 つです。
- [ジオプロセシング] ウィンドウで、[サーフェス パラメーター] ツールを検索して開きます。
- 次のパラメーターを入力し、[実行] をクリックします。
- [入力サーフェス ラスター]: [SpainPortugalElev.tif]
- [出力ラスター]: 「Spain_Slope」
- [入力解析マスク]: [ESP_Country]
- [パラメーター タイプ]: [傾斜角]
- [ローカル サーフェス タイプ]: [二次]
- [傾斜角の計測]: [度]
Spain_Slope レイヤーがマップに追加されます。 このレイヤーは傾斜角の値 (度) を示します。
次に確認したい環境レイヤーは土地被覆です。 そのために、European Space Agency's WorldCover 2020 データを使用します。 WorldCover は 11 個の土地被覆タイプをマッピングしています。
- [カタログ] ウィンドウで、[ポータル] タブをクリックして [Living Atlas] を選択します。
- [ESA WorldCover] レイヤーを検索し、マップにドラッグします。
WorldCover レイヤーがマップ上に描画されます。 このレイヤーには、座標精度が 10 メートルである 11 種類の土地被覆クラスが含まれています。
生息地データを準備できたので、[複数の抽出値 → ポイント] ツールを使用して、各ポイント位置のラスター値を取得します。
- [ジオプロセシング] ウィンドウで、[複数の抽出値 → ポイント] ツールを検索して開きます。
- [入力ポイント フィーチャ] で、[badger_sample_set] を選択します。
- [入力ラスター] で、[Spain_Slope]、[Spain_Elevation]、[LandCover] を選択し、これらに対応する [出力フィールド名] として、「slope」、「elevation」、「landcover」と入力します。
注意:
フィールド名の elevation の末尾に数値 1 が付加される場合があります。 これによる出力への影響はありません。
ツールを実行する前に、[処理範囲] を、これまで使用してきたスペインの国境に設定します。 WorldCover レイヤーはグローバルなデータセットであるため、[処理範囲] の設定により、必要なデータだけを抽出できます。
- [環境] タブをクリックします。
- [処理範囲] グループを展開します。 [レイヤーの範囲] をクリックし、[ESP_Country] レイヤーを選択します。
- [実行] をクリックします。
このツールの実行には少し時間がかかります。 ツールの実行が完了すると、[badger_sample_set] レイヤーの属性テーブルに新しい変数が 3 つ表示されます。 さらに、サンプル セットに生気候データを追加します。
多次元データのサンプリング
傾斜角、標高、土地被覆に加えて、アナグマの生息地のモデリングに役立つ可能性のある変数として生気候があります。 ここでは、ArcGIS Living Atlas の Bioclimate Baseline 1970-2000 レイヤーを追加し、存在ポイントと背景ポイントのそれぞれで生気候の値をサンプリングします。 Bioclimate Baseline レイヤーは、気候と生気候の変数に関するダウンスケールした推定値を提供しており、これらの値は、WorldClim 2.1 から取得した観測所測定値の内挿後の値に基づく、1970 年から 2000 年までの期間における毎月の平均値となっています。 このレイヤーには、気温、降水量に関するデータを含む 19 種類の生気候変数があります。 各変数には [多次元フィルター] からアクセスできます。
- [カタログ] ウィンドウで、[ポータル] タブをクリックして [Living Atlas] を選択します。
- Bioclimate Baseline 1970-2000 レイヤーを検索し、マップにドラッグします。
Bioclimate Baseline 1970-2000 レイヤーがマップに追加されます。 ArcGIS Living Atlas には、Baseline データセットのそれぞれの生気候変数に関する将来の予測も含まれています。 Bioclimate Projections の各データセットには、SSP2-4.5、SSP3-7.0、SSP5-8.5 が含まれており、温室効果ガス排出量、政治的方策や社会的方策、その他の変化に応じて将来起こりうる状況をモデリングできます。 これらのレイヤーは Baseline データセット向けに入れ替え可能ですが、個別にサンプリングする必要があります。
これまでの手順と同様に、これらの変数をアナグマ サンプル セットに抽出したいと思いますが、ここではすべての生気候変数を取得するために、[サンプル] ツールを使用します。このツールは、多次元スライスのそれぞれを処理します。 ただし、[複数の抽出値 → ポイント] ツールとは異なり、[サンプル] はジオデータベース内に新しいフィーチャクラスを作成します。 このツールを実行する前に、badger_sample_set レイヤー内に、[サンプル] ツールの結果を badger_sample_set レイヤーと結合するために使用できる、一意の識別子があることを確認する必要があります。
- [コンテンツ] ウィンドウで、[badger_sample_set] レイヤーを右クリックして、[属性テーブル] を選択します。
このテーブル内の OID フィールドが一意の識別子となります。 この識別子は .csv ファイルをジオデータベース テーブルに変換したときに作成されたものです。 OID やその他の自動的に割り当てられた一意の識別子はリセットまたは再生成が可能であるため、後でテーブルを結合する際に使用するための新しい一意のフィールドを計算します。
- 属性テーブルのリボンで、[計算] をクリックします。
- [フィールド演算] ウィンドウの [フィールド名] に「joinID」と入力します。 [フィールド タイプ] で [Long] を選択します。
この計算では、Python ヘルパーを使用します。このヘルパーは、使用頻度の高いコード スニペットを提供しています。
- [ヘルパー] ウィンドウで、[連番] をダブルクリックします。
ヘルパーが [コード ブロック] フィールドに追加されます。 デフォルトでは、連番は 1 から始まります。
- [OK] をクリックします。
[joinID] フィールドがテーブルの最後に追加されます。 これで [サンプル] ツールを実行する準備ができました。
- [ジオプロセシング] ウィンドウで、[サンプル] ツールを検索して開きます。
- [サンプル] ツールで次のパラメーターを入力し、[実行] をクリックします。
- [入力ラスター]: [Bioclimate Baseline 1970:2000]
- [入力ロケーション ラスターまたはフィーチャ]: [badger_sample_set]
- [出力テーブルまたはフィーチャクラス]: [badger_sample_bioclimatebase]
- [一意の ID フィールド]: joinID
- [多次元として処理] チェックボックス: オン
ツールの実行が完了すると、sample_bioclimatebase テーブルが [コンテンツ] ウィンドウに追加されます。 次に、このテーブルを badger_sample_set レイヤーに結合します。
- [ジオプロセシング] ウィンドウの戻るボタンをクリックします。 [フィールドの結合] ツールを検索して開きます。
- 次のパラメーターを入力し、[実行] をクリックします。
- [入力テーブル]: [badger_sample_set]
- [入力フィールド]: [joinID]
- [結合テーブル]: [badger_sample_bioclimatebase]
- [入力フィールド]: [joinID]
- [転送フィールド]: すべての BC フィールドを選択
19 個の生気候属性がサンプル セットに追加されました。 各属性が表す内容やこのデータの使用方法の詳細については、情報源の USGS 出版物をご参照ください。この情報は ArcGIS Online のアイテムの詳細ページからリンクされています。
データ エンジニアリングの使用
次に、データ エンジニアリング ツールを使用してデータを調べてみます。 ArcGIS Pro のデータ エンジニアリング ツールでは、解析のために、データを探索、視覚化、クリーニング、準備することができます。 このセクションでは、データ エンジニアリング ツールを使用して、サンプル セットに抽出した環境変数への理解を深めます。
- [コンテンツ] ウィンドウで、[badger_sample_set] レイヤーを右クリックして、[データ エンジニアリング] を選択します。
[データ エンジニアリング] ビューが開きます。 選択して実行するデータ準備のタイプは、生息地の適合性モデルを作成するために使用するモデリングのタイプによって異なります。 たとえば、回帰分析を使用する予定の場合は、[変換] ツールを使用して、偏ったデータを正規分布に変換できます。
- [フィールド] ウィンドウの [landcover] フィールドをクリックします。 Shift キーを押しながら、最後の生気候フィールドである [BC_19] をクリックします。
- 選択したフィールドを、中央の空の [統計] ウィンドウまでドラッグします。
生息地モデリング プロジェクト用に収集した環境データが [統計] ウィンドウに追加されます。
- [データ エンジニアリング] ウィンドウのリボンで、[計算] をクリックします。
平均値、個別値、外れ値などのフィールドの統計情報が計算されます。 これらの統計情報を使用してデータのパターン識別を始めることができます。
- [統計] ウィンドウで、[外れ値] 列にスクロールします。
統計的な外れ値が最も多いフィールドは slope フィールドです。
- [slope] フィールドの [外れ値] レコードを右クリックして、[外れ値を選択] を選択します。
外れ値がマップ上で選択されます。 多数の外れ値ポイントがスペイン北部、すなわちカンタブリア山脈およびピレネー山脈とその付近にあります。
この付近は急傾斜のテレインだろうと判断できますが、まだ多数のポイントがスペイン全域に散らばっています。 これらの値を視覚化するために、ヒストグラムを使用します。
- [統計] ウィンドウで、[slope] フィールドのヒストグラムを右クリックします。 [ヒストグラムを開く] をクリックします。
slope フィールドのヒストグラムが開きます。 選択した外れ値がヒストグラム上に表示されます。 このヒストグラムを見ると、すべての外れ値が高い側にある、つまり急傾斜のエリア内にあるということがわかります。 次に、年平均気温を表す BC_01 を調べます。
- [slope の分布] ヒストグラムのリボンで、[選択解除] をクリックした後、ヒストグラムを閉じます。
- [統計] ウィンドウで、[BC_01] の [チャートのプレビュー] を右クリックし、[ヒストグラムを開く] を選択します。
ヒストグラムが開きます。 アナグマが好むと思われる気温を把握するために、アナグマの存在ポイントを選択します。
- リボンの [マップ] タブをクリックします。 [選択] グループで、[属性条件で選択] をクリックします。
- [属性条件で選択] ウィンドウで、入力済みの式を削除し、[Where 句 Presence が 1 に等しい] という式を作成します。 [OK] をクリックします。
存在ポイントがマップとチャートで選択されます。
このチャートより、アナグマは暖かい気温を好むと言えそうです。
ヒント:
選択したデータと選択されていないデータの両方がチャートに表示されない場合は、チャートのリボンにある [フィルター] グループで、[選択] フィルターがオフになっていることを確認します。
データ エンジニアリング ツールを使用して、他の生気候変数を検証し、必要に応じてデータを変更することができます。
- 選択を解除してチャートを閉じます。
データをモデリングで使用するための最後の手順は、帰属の追加です。 データ ソースの記録は重要なことであり、また、[CC BY 4.0] ライセンスのデータをダウンロードしたため、データセットの帰属を確実に示す必要があります。
- リボンの [表示] タブをクリックします。 [ウィンドウ] グループで、[カタログ ビュー] を選択します。
[カタログ] ビューが開きます。 [カタログ] ビューと、このチュートリアルで使用してきた [カタログ] ウィンドウには多くの類似点がありますが、メタデータの編集ができるのは [カタログ] ビューだけです。
- [カタログ] ビューで [データベース]、[EuropeanBadger_Habitat.gdb] の順に展開し、[badger_sample_set] レイヤーをクリックします。
メタデータ エディターが開きます。 現時点で、メタデータはジオプロセシング履歴を除き空になっています。ジオプロセシング履歴には、実行した [フィールドの結合] ツールと [フィールド演算] ツールが表示されます。
- リボンの [カタログ] タブの [メタデータ] グループで、[編集] をクリックします。
メタデータ エディターが開きます。
- [メタデータ] ウィンドウで、次の情報を入力します。
- [タイトル]: [European Badger Sample Dataset]
- [タグ]: 「species modeling, Meles meles, European badger」
- [サマリー (目的)]: 「This dataset was created in the Learn ArcGIS tutorial Sample species and environmental data for distribution modeling to model European badger (Meles meles) habitat in Spain.」
- [説明 (要約)]: 「The European badger is an important species, providing three main ecosystem services: seed dispersal, topsoil disturbances and microhabitat creation. To model its habitat in Spain, animal observation data was downloaded from GBIF, recorded in the Presence field with a value of 1. Pseudo-absence or background points were generated and merged with the observation data. Environmental data, including slope, elevation, land cover, and bioclimate variables, were extracted to these points.」
- [著作権] セクションに、この GBIF データをダウンロードしたときに生成された固有の引用文を入力します。
ヒント:
この引用文は、[ダウンロード] ページか、または downloads@gbif.org から受信した確認メールに記載されています。
- メタデータ エディターの下部にある [新しい境界ボックス] をクリックします。
- 次の座標を入力します。
西 東 南 北 -17.7532431
5.6396581
26.8567504
44.3051478
- リボンの [メタデータ] タブで、[保存] をクリックします。
- メタデータ エディターを閉じて、プロジェクトを保存します。
これで、種の分布のモデリングに使用できるヨーロッパ アナグマのデータセットを準備できました。 このデータセットには、存在ポイント、偽不在ポイントの両方が含まれており、さらに、傾斜角、標高、土地被覆、気温などに関する環境データも含まれています。 この情報は、MaxEnt やランダム フォレスト予測などのモデルで、種の分布のモデリングを実行するために使用できます。