Geostatistical Wizard を使用した温度の内挿

データ分布のヒストグラムの作成

最初にプロジェクト パッケージをダウンロードし、チュートリアル全体を通してこのパッケージに格納されているデータを使用し、Geostatistical Wizard を使用して温度を内挿します。

  1. InterpolateTemperatures プロジェクト パッケージをダウンロードします。
  2. コンピューター上で、ダウンロードしたファイルを選択します。 InterpolateTemperatures.ppkx をダブルクリックして ArcGIS Pro で開きます。

    注意:

    ArcGIS Pro にサイン インしていない場合は、サイン イン画面が表示されます。 サイン インしている場合は、プロジェクトが開きます。 サイン インしていない場合は、ステップ 3 のみを実行してステップ 4 に進みます。 ArcGIS Pro が、Enterprise ポータルを使用してライセンスを受けている場合は、その認証情報を使用してサイン インできます。 それ以外の場合は、ArcGIS Online アカウントを使用して ArcGIS Pro にライセンスを付与します。

  3. ArcGIS の組織アカウント」または ArcGIS Enterprise 指定ユーザー アカウントを使用してサイン インします。
    注意:

    組織アカウントがない場合は、ソフトウェア アクセスのオプションをご参照ください

  4. 少しの間、マップを視覚的に調べてみます。

    アフリカと中東をカバーする温度ポイント データが表示されているマップ

    マップ上のポイントは温度サンプルを表しています。 各ポイントに月ごとの平均温度値が格納されています。 これらのフィールドの一部でデータ分布を調べて、内挿にどれを使用するかを決定します。

    注意:

    完全なデータセットは ArcGIS Living Atlas of the WorldWorld Historical Climate – Monthly Averages for GHCND Stations for 1984 - 2010 にあります。

  5. [コンテンツ] ウィンドウで [Temperature] レイヤーを右クリックします。 [チャートの作成] をポイントし、[ヒストグラム] を選択します。

    レイヤーのショートカット メニューでの [Chart Histogram] オプションの作成

    [チャート プロパティ] ウィンドウと空のチャート ビューが表示されます。

  6. [チャート プロパティ] ウィンドウで [数値][Jan Avg. Temp C] (「January Average Temperature in Celsius」の省略形) に変更し、[正規分布の表示] チェックボックスをオンにします。

    Jan Avg. Temp C に設定されている数値変数を示すチャート プロパティ ウィンドウ

    チャート ビューが更新され、ポイント データの最高温度値を表すヒストグラムが表示されます。 値の範囲が摂氏 -10.2° ~ 30.1° になっているのがわかります。 ウィンドウの幅に応じて、軸に表示される値が異なる場合があります。

    より高い値に関する詳細なデータが表示されている Jan Avg. Temp C の分布のヒストグラム

    青い曲線はチャートの正規分布を表しています。 正規分布があるデータは釣鐘型の曲線を描きます。 1 月の平均温度が正規分布になっておらず、右の裾野が長いことがわかります。

  7. [チャート プロパティ] ウィンドウで [数値][Aug Avg. Temp C] に変更します。 ヒストグラムが更新され、新しいフィールドが表示されます。

    正規分布が表示されている Aug Avg. Temp C の分布のヒストグラム

    8 月の温度がより正規分布に近くなっています。 データが正規 (釣鐘型) 分布に近く、一部の地球統計学的手法でデータが正規分布である必要がある場合に内挿方法が最も高い効果を発揮します。 そのため、このチュートリアルの残りでは [Aug Avg. Temp C] を使用します。

    注意:

    データが釣鐘型の曲線を描いていない場合、変換を適用して正規分布に近づけることができます。 このプロセスの詳細については、「Box-Cox、逆正弦、ログの変換」をご参照ください。

  8. チャート ビューを閉じます。
  9. [コンテンツ] ウィンドウで [Temperature] レイヤーを右クリックして [シンボル] を選択します。

    [シンボル] ウィンドウが表示されます。

  10. [フィールド][Aug Avg. Temp C] に変更します。

    フィールドが Aug Avg. Temp C に設定されている Temperature レイヤーの [シンボル] ウィンドウ

    マップが更新され、8 月の温度が表示されます。

逆距離加重を使用した地球統計学的サーフェスの作成

次に、サンプル データを使用してアフリカと中東全域をカバーする予測温度値を持つサーフェスを作成します。

地球統計学では、遠く離れた場所にある物よりも近接している物のほうが類似性が高いという前提に立つことができます。 そのため、未知の場所とそこに最も近い既知の場所では値が類似する傾向にあります。

ArcGIS Pro の Geostatistical Wizard には予測サーフェスを作成するためのさまざまな内挿方法が用意されています。 通常であれば、複数の方法を試してその結果を比較しないことにはどれが最適かはわかりません。 最初に試す方法が逆距離加重で、IDW と呼ばれることもあります。

IDW は正確な方法です。 つまり、生成されるサーフェスがサンプル値と異なることはありません。 実行するのが比較的簡単な方法の 1 つでもあります。 IDW の詳細については「逆距離加重内挿法のしくみ」をご参照ください。

  1. [コンテンツ] ウィンドウで [Temperature] レイヤーを右クリックして [プロパティ] を選択します。

    [レイヤー プロパティ: Temperature] ウィンドウが表示されます。

  2. [ソース] タブをクリックします。
  3. 画面を下にスクロールし、[空間参照] をクリックしてこのセクションを展開します。

    テーブルの最初のパラメーターは [投影座標系] です。

    投影座標系として Africa Equidistant Conic が表示されている Temperature レイヤーのレイヤー プロパティ

    地球統計学は距離の計測に依存しています。 これらの距離の歪みを最小限に抑えるため、入力データでは (地理ではなく) 投影座標系を使用する必要があります。 [投影変換 (Project)] ジオプロセシング ツールを使用して投影座標系を用意できます。

    このデータでは、アフリカの中心にある Equidistant Conic 投影法を使用します。 マップ上のすべての距離を完璧に保持できる投影法はありませんが、正距方位図法は他の投影法よりはこの点で優れています。 大陸などの広大なエリアをマッピングする際に、どの投影法を選択するかがより重要になります。

  4. [キャンセル] をクリックして [レイヤー プロパティ] ウィンドウを閉じます。
  5. リボンの [解析] タブの [ワークフロー] グループで、[Geostatistical Wizard] をクリックします。

    リボンの Geostatistical Wizard ボタン

    [Geostatistical Wizard] が表示されます。

  6. [Deterministic methods][Inverse Distance Weighting] を選択します。 (このオプションを表示するためにスクロールが必要になる場合があります)
  7. [データ フィールド][Aug Avg. Temp C] を選択します。

    Geostatistical Wizard の Inverse Distance Weighting と Aug Avg. Temp C

  8. [次へ] をクリックします。

    Geostatistical Wizard の Inverse Distance Weighting プロパティとプレビュー マップ

    このページでは、IDW 方法のパラメーターを対話的に変更し、モデルがどのように反応するかをプレビュー マップで確認できます。 [Identify Result] セクションを見ることで、任意の場所の予測値がわかります。

  9. [Geostatistical Wizard] でプレビュー マップを何か所かクリックし、クリックしたエリアの予測温度を [Identify Result] セクションで確認します。
  10. [General Properties][Neighborhood Type][Smooth] に変更します。 Smooth オプションを使用すると、より滑らかで突出部の少ない予測サーフェスが作成されます。

    プレビュー マップが更新されます。 [Neighborhood Type][Standard] の場合、プレビュー マップには円が 1 つだけ表示されます。 [Smooth] の場合は同心円が 3 つ表示されます。

    1 つの円を 3 つの円と比較している Geostatistical Wizard のプレビュー マップ

    プレビュー マップの円は近傍検索を表しています。 新しい値を予測する場合は、近傍検索内の近傍にあるサンプル ポイントだけが考慮されます。 スムージング近傍タイプなど、このプロセスの詳細については「近傍検索」をご参照ください。

  11. [スムージング ファクター][0.2] に設定されていることを確認します。
  12. [完了] をクリックします。
  13. [Method Report][OK] をクリックします。

    アフリカ地域の最高温度のサーフェスを表す新しいレイヤーがマップに追加されます。

  14. [コンテンツ] ウィンドウで [Inverse Distance Weighting] を選択し、キーボードで F2 を押して名前を編集可能状態にします。
  15. レイヤー名を「IDW Smooth」に変更します。
  16. [Inverse Distance Weighting][Oceans] の上にドラッグして展開します。

    IDW Smooth レイヤーが選択されているウィンドウ

    温度データがない場所の温度予測がマップに表示されるようになりました。

    温度ポイント データと内挿サーフェスが表示されているマップ

    次に、同じデータと方法を使ってさきほどと若干異なるサーフェスを作成します。

  17. [Geostatistical Wizard] を開きます。
    ヒント:

    リボンの [解析] タブで [Geostatistical Wizard] をクリックします。

  18. 方法として [Inverse Distance Weighting] が選択されており、[Data Field][Aug Avg. Temp C] が選択されていることを確認して [Next] をクリックします。
  19. [Neighborhood Type][Smooth] を選択します。
  20. [Power] パラメーターで [Click to optimize] ボタンをクリックします。

    General Properties の Power コントロールにある Optimize ボタン

    [Power] の値が 3.1076 に変わります。

    近傍検索内のすべてのポイントが等しいと見なされるわけではありません。 予測対象場所に近いポイントほど、計算で重み付けが高くなります。

    [Power] が 0 の場合、近傍のすべてのポイントが等しく重み付けされます。 累乗が高いほど、距離に応じて重みが減るスピードも速くなります。 遠くのポイントほど影響が小さくなるため、累乗を 3.1 に上げると、局所性が高くあまり一般的ではないサーフェスが生成されます。

  21. [Weights] を展開してリストをスクロールし、さまざまな色の重みを見つけます。

    このリストには検索範囲内のすべてのポイントがあり、各ポイントに割り当てられている重み付けが含まれます。

    393 の近傍があるリストの一部の重み付け

    リストの値をいくつかクリックし、プレビュー マップで選択したポイントを確認します。 緑よりも赤のポイントの方が予測に対する影響力が大きくなります。

  22. [ウェイト] を折りたたんで [次へ] をクリックします。

    [Cross validation] ウィンドウには内挿の信頼度がどの程度になるかに関する情報が表示されます。

    散布図と要約値が表示されている Geostatistical Wizard の Cross validation ページ

    このページの情報は予測サーフェスの精度評価に役立ちます。 これは、データセットから 1 つのポイントを削除し、残りのポイントを使用して削除したポイントの値を予測することで、行います。

    散布図は (x 軸の) 予測値と (y 軸の) 計測値を比較し、細いグレーのラインが太い青のラインと一致する場合に最適と見なされます。

    [Mean] の値を見ることで、高すぎる、または低すぎる予測値にモデルが偏っているかどうかがわかります。 0 に最も近い場合に最適と見なされます。

    [Root-Mean-Square] の値はほぼ 2.5 です。 つまり、平均すると、予測温度値と測定値の間に摂氏約 2.5° の誤差があるということになります。

  23. [完了] をクリックし、[Method Report] ウィンドウで [OK] をクリックします。

    新しいレイヤーがマップに追加されます。

  24. レイヤー名を「IDW Smooth Optimized」に変更します。
  25. [コンテンツ] ウィンドウで [Temperature] ポイント レイヤーをオフにします。
  26. [IDW Smooth Optimized] のオフとオンを切り替えて [IDW Smooth] と比較します。

    IDW Smooth Optimized サーフェスと IDW Smooth サーフェスの比較
    IDW Smooth Optimized (左) と IDW Smooth (右) を比較しています。

    2 つのレイヤーは似ていますが、新しいレイヤーの方が赤がより濃くなっています。 どちらの方が良いでしょうか? 2 つのレイヤーの正確度を比較することで判断しやすくなります。

  27. [コンテンツ] ウィンドウで [IDW Smooth][IDW Smooth Optimized] の両方を選択します。
    注意:

    複数のレイヤーを選択するには、Shift を押しながらレイヤーを選択します。

  28. 右クリックして [Cross Validation] を選択します。

    コンテンツ ウィンドウで選択されている IDW Smooth Optimized と IDW Smooth、ショートカット メニューで選択されている Cross Validation

    各レイヤーに対し、2 つの [Cross validation] ウィンドウが表示されます。 一方のレイヤーが他方の表示をさえぎっています。

  29. ウィンドウをわきに移動して両方が同時に表示されるようにします。

    Cross Validation ウィンドウ

    [Geostatistical Wizard] に表示されていたのと同じ [Cross Validation] ウィンドウがあります。 このうちの 1 つはすでに確認しましたが、複数の予測サーフェス間で結果を比較することでさらに活用できる場合があります。

    [サマリー] タブには各サーフェスの数値エラーが表示されています。 [Root-Mean-Square] の値が [0] に近いほど、作成されるサーフェスの正確度が高くなります。

    Root-Mean-Square の値は IDW Smooth Optimized で 2.4998、IDW Smooth で 2.669 となっています。

    IDW Smooth Optimized の方が誤差値が小さいため、より信頼性の高い予測サーフェスと見なすことができます。

  30. [Cross validation] ウィンドウを閉じます。
  31. [コンテンツ] ウィンドウで [IDW Smooth] だけを選択します。 このレイヤーを右クリックし、[削除] を選択します。
  32. リボンの上隅にあるツールバーの [保存] ボタンをクリックします。

    クイック アクセス ツールバーの保存ボタン

    逆距離加重は簡単かつスピーディな内挿法と見なされています。 マッピングする現象の初期状態を確認するのに適しています。また、計測値に正確に従うため、逆距離加重を使用する必要がある場合もあります。 一方で、データ内の島の周囲にリング効果を発生させる場合もあります。

クリギングを使用した地球統計学的サーフェスの作成

次に、クリギングでより正確度の高い結果が得られるかどうかを確認します。 クリギングは非常に柔軟性の高い地球統計学的方法です。 データに合わせてさまざまな方法でクリギングを調整できますが、その分選ぶべき選択肢も増えます。

  1. [Geostatistical Wizard] を開きます。
  2. [Geostatistical methods] の下で [Kriging / CoKriging] を選択して [次へ] をクリックします。
  3. [Ordinary Kriging] の下で [Prediction] を選択し、IDW を使ってさきほど作成したものと類似する予測値を持つサーフェスを作成します。

    [Dataset #1] オプションが [None] に設定されており、[Ordinary Kriging] で [Prediction] オプションが選択されている

    今回は、通常クリギングがデフォルト パラメーターに設定されているサーフェスを作成します。

  4. [Finish][OK] の順にクリックします。

    新しいレイヤーがマップに追加されます。

  5. レイヤー名を「Kriging Default」に変更します。
  6. [Kriging Default][IDW Smooth Optimized] を比較します。

    Kriging Default サーフェスと IDW Smooth Optimized サーフェスの比較
    Kriging Default (左) と IDW Smooth Optimized (右) を比較しています。

    新しいレイヤーの方がパターンがより一般的です。 次に、パラメーターをいくつか変更してより優れた地球統計学的サーフェスを作成してみます。

  7. [Geostatistical Wizard] を開きます。
  8. 方法として [Kriging / CoKriging] が選択されていることを確認したら [次へ] をクリックします。
  9. [Ordinary Kriging] の下で [Prediction] を選択し、[次へ] をクリックします。
  10. [Semivariogram/Covariance Modeling] ページで、[Optimize model] ボタンをクリックします。

    General Properties で一番最初に表示されるオプションが Optimize ボタンです。

    [Optimize] ボタンをクリックすると、予測誤差が最小になるパラメーターがわかります。 セミバリオグラム マップと一部のパラメーターが変更されていることに着目してください。 このケースでは変更は最小限です。

  11. [次へ] をクリックします。
  12. [Searching Neighborhood] ページで [Sector Type][8 Sectors] に変更します。

    Searching Neighborhood ページで 8 Sectors に設定されている Sector Type

    セクター数を増やすことで、すべての方向で近傍が検索され、1 つの方向のみの近傍ポイントの大きなクラスターが予測値にすべての影響を及ぼさなくなります。

  13. [Next] をクリックし、[Cross validation] ウィンドウで結果を確認します。 逆距離加重よりもクリギングの方が値が多いことに注意してください。

    Cross Validation ウィンドウに表示されている 6 つの値

  14. [Finish][OK] の順にクリックします。

    もう 1 つのレイヤーがマップに追加されます。

  15. レイヤー名を「Kriging Modified」に変更します。
  16. [Kriging Modified][Kriging Default] を比較します。

    Kriging Modified サーフェスと Kriging Default サーフェスの比較
    Kriging Modified (左) と Kriging Default (右) を比較しています

    これらはよく似ています。

  17. [コンテンツ] ウィンドウで [Kriging Default][Kriging Modified] を選択します。 右クリックして [Cross Validation] を選択します。
  18. 両方が同時に表示されるようにウィンドウを調整します。 [サマリー] タブの値を解析します。

    Kriging Default

    Kriging Modified

    Mean

    -0.013

    -0.024

    Root-Mean-Square

    2.294

    2.283

    Mean Standardized

    0.001

    0.003

    Root-Mean-Square Standardized

    0.854

    0.841

    平均標準誤差

    2.740

    2.775

    数値がゼロに近いほど正確度が高くなります。 例外は [Root-Mean-Square Standardized] です。 この場合、値が 1 に近いほど正確度が高くなります。

    これらの値を見ただけでは、どちらのサーフェスの方が良いのかすぐにはわかりません。 [Root-Mean-Square] を除き、すべてのカテゴリで [Kriging Default] の方が値が良くなっています。 ただし、これだけで Kriging Default の方が優れているとは判断できません。

    これらの値のいずれかが遠すぎる場合はそのレイヤーを削除する必要があります。 ただし、今回のシナリオではどちらのレイヤーも交差検証の結果が良好であるため、[Root-Mean-Square] をタイ ブレーカー値として使用できます。 また、[Root-Mean-Square][Average Standard Error] の値がお互いに近いことが望まれます。 これらの値の差が大きい場合、予測が不安定である可能性があります。

    [Cross validation] レポートを見ると、[Kriging Modified] の方が [Kriging Default] よりも若干信頼性が高いことがわかります。

  19. [IDW Smooth Optimized][Cross validation] ウィンドウを開きます。

    このサーフェスでは [Root-Mean-Square] の値が 2.5 になっています。 どちらのクリギング サーフェスよりも信頼性が低くなっています。

  20. 3 つの [Cross Validation] ウィンドウをすべて閉じます。
  21. [IDW Smooth Optimized][Kriging Default] をマップから削除します。
  22. プロジェクトを保存します。

    クリギングは IDW よりも高度な方法で、判断することも多くなります。 一方で、データと現象に適したものが見つかるまで、さまざまなパラメーターを試すことができます。 次に作成する標準誤差推定のマップなど、結果の正確度を評価するためのツールもクリギングには多く用意されています。

標準誤差推定のマッピング

アフリカと中東をカバーする 4 つの異なる温度サーフェスを作成しました。 いずれも同じデータから内挿されましたが、それぞれ異なるサーフェスが表示されました。 これらの予測が有用なのは明らかですが、事実として受け取ることはできません。 サーフェスの一部 (多くのデータ ポイントがある場所) は他 (データがまばらな場所) よりも正確度と信頼性が高いと見なすことができます。 こうした不確実性の度合いをマッピングすることで、意思決定者の支援に役立てることができます。

  1. [コンテンツ] ウィンドウで [Kriging Modified] を選択します。
  2. リボンの [Geostatistical レイヤー] タブで、[表示タイプ][標準誤差] に変更します。

    Geostatistical Layer コンテキスト リボンの表示設定タブで標準誤差に設定されている表示タイプ

    マップの大半が赤くなります。

  3. [コンテンツ] ウィンドウで [Temperature] をオンにします。

    温度ポイントと赤い標準誤差サーフェスがあるマップ

    標準誤差とは、予測値の不確実性の測定値です。 マップ上の濃い赤のエリアで標準誤差値が大きいため、予測値の確実性が低くなります。 色の薄いエリアは結果の信頼性が高い場所です。 結果では海で標準誤差が最も大きいことがこのマップからわかります。 海にはサンプル計測ポイントがなかったため (小さな島にはいくつかありましたが)、これは当然の結果です。

  4. [Kriging Modified] レイヤーで [表示タイプ][Prediction] に戻します。

    このマップでは陸地温度の予測だけを行うため、海はマスクされていてもかまいません。

  5. [コンテンツ] ウィンドウで [Oceans] レイヤーを [Kriging Modified] の上にドラッグします。

    内挿されたサーフェスの一部が Oceans レイヤーで覆われているマップ

  6. プロジェクトを保存します。

不連続ポイント データしかない場合でも、地球統計学では多くの現象を連続するサーフェスとしてマッピングできます。 パターンの視覚化と解析の実行でこれが非常に役立ちます。 分析範囲に測候所がなくても、あらゆる場所の温度の理解と予測に必要なデータが幅広い地域の一連の測候所から手に入ります。

Geostatistical Wizard にはさまざまな内挿方法が用意されており、異なる結果を生成するために調整できるパラメーターがそれぞれにあります。 なぜでしょうか? マッピングする現象と用意しているデータによっては、あるモデルがもう一方のモデルより結果の信頼性が高くなる場合があります。 内挿されたサーフェスに基づいて判断を下す場合、最も正確度の高いモデルを見つけることが非常に重要になります。

クロス評価結果を比較することでデータに最適な方法を判断できます。 サーフェスを作成すると、一部で他よりも予測の正確度が高くなります。 標準予測誤差ごとにサーフェスを視覚化することで、最も信頼性が高い予測を把握できます。

作成した 4 つのマップはいずれも同じ入力データをベースにしていますが、それぞれ見た目が異なります。 内挿されたサーフェスがあるマップがどのように作成されるかがわかりましたが、その信頼性はどうなっているのでしょうか。 地球統計学的モデルを調整してより正確度の高い結果を生成できます。 一方で、マップ作成者にはアピールしたい特定のテーマがあったり、トレンドを強調するために地球統計学的パラメーターを調整したりする場合があります。

このプロジェクトには他の大陸用に、さらに 5 つのマップが用意されています。 これらは [カタログ] ウィンドウの [プロジェクト] タブの [マップ] フォルダーにあります。

6 つのマップが表示されている、カタログ ウィンドウのプロジェクト タブのマップ フォルダー

さらに学習する場合は、これらのマップのいずれかを使用してこのチュートリアルを再度受講してください。 アフリカと中東では [Aug Avg. Temp C] が最良のフィールドで、[Kriging Modified] が最良のサーフェスでした。 他の大陸では、別のパラメーターの方が良い結果が出る場合があります。

他のチュートリアルについては、チュートリアル ギャラリーをご覧ください。