Geostatistical Wizard を使用した温度の内挿
データ分布のヒストグラムの作成
最初にプロジェクト パッケージをダウンロードし、チュートリアル全体を通してこのパッケージに格納されているデータを使用し、Geostatistical Wizard を使用して温度を内挿します。
- InterpolateTemperatures プロジェクト パッケージをダウンロードします。
- コンピューター上で、ダウンロードしたファイルを選択します。 InterpolateTemperatures.ppkx をダブルクリックして ArcGIS Pro で開きます。
注意:
ArcGIS Pro にサイン インしていない場合は、サイン イン画面が表示されます。 サイン インしている場合は、プロジェクトが開きます。 サイン インしていない場合は、ステップ 3 のみを実行してステップ 4 に進みます。 ArcGIS Pro が、Enterprise ポータルを使用してライセンスを受けている場合は、その認証情報を使用してサイン インできます。 それ以外の場合は、ArcGIS Online アカウントを使用して ArcGIS Pro にライセンスを付与します。
- ArcGIS の組織アカウントまたは ArcGIS Enterprise 指定ユーザー アカウントを使用してサイン インします。
注意:
組織アカウントがない場合は、ソフトウェア アクセスのオプションをご参照ください。
- 少しの間、マップを視覚的に調べてみます。
マップ上のポイントは温度サンプルを表しています。 各ポイントに月ごとの平均温度値が格納されています。 これらのフィールドの一部でデータ分布を調べて、内挿にどれを使用するかを決定します。
注意:
完全なデータセットは ArcGIS Living Atlas of the World の World Historical Climate – Monthly Averages for GHCN-D Stations for 1981 - 2010 にあります。
- [コンテンツ] ウィンドウで [Temperature] レイヤーを右クリックします。 [チャートの作成] をポイントし、[ヒストグラム] を選択します。
[チャート プロパティ] ウィンドウと空のチャート ビューが表示されます。
- [チャート プロパティ] ウィンドウで [数値] を [Jan Avg. Temp C] (「January Average Temperature in Celsius」の省略形) に変更し、[正規分布の表示] チェックボックスをオンにします。
チャート ビューが更新され、ポイント データの最高温度値を表すヒストグラムが表示されます。 値の範囲が摂氏 -10.2° ~ 30.1° になっているのがわかります。 ウィンドウの幅に応じて、軸に表示される値が異なる場合があります。
青い曲線はチャートの正規分布を表しています。 正規分布があるデータは釣鐘型の曲線を描きます。 1 月の平均温度が正規分布になっておらず、右の裾野が長いことがわかります。
- [チャート プロパティ] ウィンドウで [数値] を [Aug Avg. Temp C] を選択します。 ヒストグラムが更新され、新しいフィールドが表示されます。
8 月の温度がより正規分布に近くなっています。 データが正規 (釣鐘型) 分布に近く、一部の地球統計学的手法でデータが正規分布である必要がある場合に内挿方法が最も高い効果を発揮します。 そのため、このチュートリアルの残りでは [Aug Avg. Temp C] を使用します。
注意:
データが釣鐘型の曲線を描いていない場合、変換を適用して正規分布に近づけることができます。 このプロセスの詳細については、「Box-Cox、逆正弦、ログの変換」をご参照ください。
- チャート ビューを閉じます。
- [コンテンツ] ウィンドウで [Temperature] レイヤーを右クリックして [シンボル] を選択します。
[シンボル] ウィンドウが表示されます。
- [フィールド] を [Aug Avg. Temp C] を選択します。
マップが更新され、8 月の温度が表示されます。
逆距離加重を使用した地球統計学的サーフェスの作成
次に、サンプル データを使用してアフリカと中東全域をカバーする予測温度値を持つサーフェスを作成します。
地球統計学では、遠く離れた場所にある物よりも近接している物のほうが類似性が高いという前提に立つことができます。 そのため、未知の場所とそこに最も近い既知の場所では値が類似する傾向にあります。
ArcGIS Pro の Geostatistical Wizard には予測サーフェスを作成するためのさまざまな内挿方法が用意されています。 通常であれば、複数の方法を試してその結果を比較しないことにはどれが最適かはわかりません。 最初に試す方法が逆距離加重で、IDW と呼ばれることもあります。
IDW は正確な方法です。 つまり、生成されるサーフェスがサンプル値と異なることはありません。 実行するのが比較的簡単な方法の 1 つでもあります。 IDW の詳細については「逆距離加重内挿法のしくみ」をご参照ください。
- [コンテンツ] ウィンドウで [Temperature] レイヤーを右クリックして [プロパティ] を選択します。
[レイヤー プロパティ: Temperature] ウィンドウが表示されます。
- [ソース] タブをクリックします。
- 画面を下にスクロールし、[空間参照] をクリックしてこのセクションを展開します。
テーブルの最初のパラメーターは [投影座標系] です。
地球統計学は距離の計測に依存しています。 これらの距離の歪みを最小限に抑えるため、入力データでは (地理ではなく) 投影座標系を使用する必要があります。 [投影変換 (Project)] ジオプロセシング ツールを使用して投影座標系を用意できます。
このデータでは、アフリカの中心にある Equidistant Conic 投影法を使用します。 マップ上のすべての距離を完璧に保持できる投影法はありませんが、正距方位図法は他の投影法よりはこの点で優れています。 大陸などの広大なエリアをマッピングする際に、どの投影法を選択するかがより重要になります。
- [キャンセル] をクリックして [レイヤー プロパティ] ウィンドウを閉じます。
- リボンの [解析] タブの [ワークフロー] グループで、[地球統計ウィザード] をクリックします。
[地理統計ウィザード] が表示されます。
- [決定論的方法] で[逆距離加重法] を選択します。 (このオプションを表示するためにスクロールが必要になる場合があります)
- [データ フィールド] で [Aug Avg. Temp C] を選択します。
- [次へ] をクリックします。
このページでは、IDW 方法のパラメーターを対話的に変更し、モデルがどのように反応するかをプレビュー マップで確認できます。 [結果の確認] セクションを見ることで、任意の場所の予測値がわかります。
- [地球統計ウィザード] でプレビュー マップを何か所かクリックし、クリックしたエリアの予測温度を [結果の確認] セクションで確認します。
- [一般プロパティ] で [近傍タイプ] を [スムージング] に変更します。 スムージング オプションを使用すると、より滑らかで突出部の少ない予測サーフェスが作成されます。
プレビュー マップが更新されます。 [近傍タイプ] が [標準] の場合、プレビュー マップには円が 1 つだけ表示されます。 [スムージング] の場合は同心円が 3 つ表示されます。
プレビュー マップの円は近傍検索を表しています。 新しい値を予測する場合は、近傍検索内の近傍にあるサンプル ポイントだけが考慮されます。 スムージング近傍タイプなど、このプロセスの詳細については「近傍検索」をご参照ください。
- [スムージング ファクター] が [0.2] に設定されていることを確認します。
- [完了] をクリックします。
- [方法レポート] で [OK] をクリックします。
アフリカ地域の最高温度のサーフェスを表す新しいレイヤーがマップに追加されます。
- [コンテンツ] ウィンドウで [逆距離加重法] を選択し、キーボードで F2 を押して名前を編集可能状態にします。
- レイヤー名を「IDW Smooth」に変更します。
- [逆距離加重法] を [Oceans] の上にドラッグして展開します。
温度データがない場所の温度予測がマップに表示されるようになりました。
次に、同じデータと方法を使ってさきほどと若干異なるサーフェスを作成します。
- [地球統計ウィザード] を開きます。
ヒント:
リボンの [解析] タブで [地球統計ウィザード] をクリックします。
- 方法として [逆距離加重法] が選択されており、[データ フィールド] で [Aug Avg. Temp C] が選択されていることを確認して [次へ] をクリックします。
- [近傍タイプ] で [スムージング] を選択します。
- [累乗] パラメーターで [クリックして最適化] ボタンをクリックします。
[累乗] の値が 3.1076 に変わります。
近傍検索内のすべてのポイントが等しいと見なされるわけではありません。 予測対象場所に近いポイントほど、計算で重み付けが高くなります。
[累乗] が 0 の場合、近傍のすべてのポイントが等しく重み付けされます。 累乗が高いほど、距離に応じて重みが減るスピードも速くなります。 遠くのポイントほど影響が小さくなるため、累乗を 3.1 に上げると、局所性が高くあまり一般的ではないサーフェスが生成されます。
- [加重] を展開してリストをスクロールし、さまざまな色の重みを見つけます。
このリストには検索範囲内のすべてのポイントがあり、各ポイントに割り当てられている重み付けが含まれます。
リストの値をいくつかクリックし、プレビュー マップで選択したポイントを確認します。 緑よりも赤のポイントの方が予測に対する影響力が大きくなります。
- [加重] を折りたたんで [次へ] をクリックします。
[交差検証] ウィンドウには内挿の信頼度がどの程度になるかに関する情報が表示されます。
このページの情報は予測サーフェスの精度評価に役立ちます。 これは、データセットから 1 つのポイントを削除し、残りのポイントを使用して削除したポイントの値を予測することで、行います。
散布図は (x 軸の) 予測値と (y 軸の) 計測値を比較し、細いグレーのラインが太い青のラインと一致する場合に最適と見なされます。
[平均] の値を見ることで、高すぎる、または低すぎる予測値にモデルが偏っているかどうかがわかります。 0 に最も近い場合に最適と見なされます。
[二乗平均平方根] の値はほぼ 2.5 です。 つまり、平均すると、予測温度値と測定値の間に摂氏約 2.5° の誤差があるということになります。
- [完了] をクリックし、[方法レポート] ウィンドウで [OK] をクリックします。
新しいレイヤーがマップに追加されます。
- レイヤー名を「IDW Smooth Optimized」に変更します。
- [コンテンツ] ウィンドウで [Temperature] ポイント レイヤーをオフにします。
- [IDW Smooth Optimized] のオフとオンを切り替えて [IDW Smooth] と比較します。
IDW Smooth Optimized (左) と IDW Smooth (右) を比較しています。 2 つのレイヤーは似ていますが、新しいレイヤーの方が赤がより濃くなっています。 どちらの方が良いでしょうか? 2 つのレイヤーの正確度を比較することで判断しやすくなります。
- [コンテンツ] ウィンドウで [IDW Smooth] と [IDW Smooth Optimized] の両方を選択します。
注意:
複数のレイヤーを選択するには、Shift を押しながらレイヤーを選択します。
- 右クリックして [交差検証] を選択します。
各レイヤーに対し、2 つの [交差検証] ウィンドウが表示されます。 一方のレイヤーが他方の表示をさえぎっています。
- ウィンドウをわきに移動して両方が同時に表示されるようにします。
[地球統計ウィザード] に表示されていたのと同じ [交差検証] ウィンドウがあります。 このうちの 1 つはすでに確認しましたが、複数の予測サーフェス間で結果を比較することでさらに活用できる場合があります。
[サマリー] タブには各サーフェスの数値エラーが表示されています。 [二乗平均平方根] の値が [0] に近いほど、作成されるサーフェスの正確度が高くなります。
IDW Smooth Optimized の方が誤差値が小さいため、より信頼性の高い予測サーフェスと見なすことができます。
- [交差検証] ウィンドウを閉じます。
- [コンテンツ] ウィンドウで [IDW Smooth] だけを選択します。 このレイヤーを右クリックし、[削除] を選択します。
- リボンの上隅にあるツールバーの [保存] ボタンをクリックします。
逆距離加重は簡単かつスピーディな内挿法と見なされています。 マッピングする現象の初期状態を確認するのに適しています。また、計測値に正確に従うため、逆距離加重を使用する必要がある場合もあります。 一方で、データ内の島の周囲にリング効果を発生させる場合もあります。
クリギングを使用した地球統計学的サーフェスの作成
次に、クリギングでより正確度の高い結果が得られるかどうかを確認します。 クリギングは非常に柔軟性の高い地球統計学的方法です。 データに合わせてさまざまな方法でクリギングを調整できますが、その分選ぶべき選択肢も増えます。
- [地球統計ウィザード] を開きます。
- [地球統計学的方法] の下で [クリギング / コクリギング] を選択して [次へ] をクリックします。
- [通常クリギング] の下で [推定] を選択し、IDW を使ってさきほど作成したものと類似する予測値を持つサーフェスを作成します。
今回は、通常クリギングがデフォルト パラメーターに設定されているサーフェスを作成します。
- [完了]、[OK] の順にクリックします。
新しいレイヤーがマップに追加されます。
- レイヤー名を「Kriging Default」に変更します。
- [Kriging Default] と [IDW Smooth Optimized] を比較します。
Kriging Default (左) と IDW Smooth Optimized (右) を比較しています。 新しいレイヤーの方がパターンがより一般的です。 次に、パラメーターをいくつか変更してより優れた地球統計学的サーフェスを作成してみます。
- [地球統計ウィザード] を開きます。
- 方法として [クリギング / コクリギング] が選択されていることを確認したら [次へ] をクリックします。
- [通常クリギング] の下で [推定] を選択し、[次へ] をクリックします。
- [セミバリオグラム/共分散モデリング] ページで、[モデルの最適化] ボタンをクリックします。
[最適化] ボタンをクリックすると、予測誤差が最小になるパラメーターがわかります。 セミバリオグラム マップと一部のパラメーターが変更されていることに着目してください。 このケースでは変更は最小限です。
- [次へ] をクリックします。
- [検索近傍] ページで [セクター タイプ] を [8 セクター] に変更します。
セクター数を増やすことで、すべての方向で近傍が検索され、1 つの方向のみの近傍ポイントの大きなクラスターが予測値にすべての影響を及ぼさなくなります。
- [次へ] をクリックし、[交差検証] ウィンドウで結果を確認します。 逆距離加重よりもクリギングの方が値が多いことに注意してください。
- [完了]、[OK] の順にクリックします。
もう 1 つのレイヤーがマップに追加されます。
- レイヤー名を「Kriging Modified」に変更します。
- [Kriging Modified] と [Kriging Default] を比較します。
Kriging Modified (左) と Kriging Default (右) を比較しています これらはよく似ています。
- [コンテンツ] ウィンドウで [Kriging Default] と [Kriging Modified] を選択します。 右クリックして [交差検証] を選択します。
- 両方が同時に表示されるようにウィンドウを調整します。 [サマリー] タブの値を解析します。
Kriging Default
Kriging Modified
平均
-0.013
-0.024
二乗平均平方根
2.294
2.283
標準化平均
0.001
0.003
標準化二乗平均平方根
0.854
0.841
平均標準誤差
2.740
2.775
数値がゼロに近いほど正確度が高くなります。 例外は [標準化二乗平均平方根] です。 この場合、値が 1 に近いほど正確度が高くなります。
これらの値を見ただけでは、どちらのサーフェスの方が良いのかすぐにはわかりません。 [二乗平均平方根] を除き、すべてのカテゴリで [Kriging Default] の方が値が良くなっています。 ただし、これだけで Kriging Default の方が優れているとは判断できません。
これらの値のいずれかが遠すぎる場合はそのレイヤーを削除する必要があります。 ただし、今回のシナリオではどちらのレイヤーも交差検証の結果が良好であるため、[二乗平均平方根] をタイ ブレーカー値として使用できます。 また、[二乗平均平方根] と [平均標準誤差] の値がお互いに近いことが望まれます。 これらの値の差が大きい場合、予測が不安定である可能性があります。
[交差検証] レポートを見ると、[Kriging Modified] の方が [Kriging Default] よりも若干信頼性が高いことがわかります。
- [IDW Smooth Optimized] の [交差検証] ウィンドウを開きます。
このサーフェスでは [二乗平均平方根] の値が 2.5 になっています。 どちらのクリギング サーフェスよりも信頼性が低くなっています。
- 3 つの [交差検証] ウィンドウをすべて閉じます。
- [IDW Smooth Optimized] と [Kriging Default] をマップから削除します。
- プロジェクトを保存します。
クリギングは IDW よりも高度な方法で、判断することも多くなります。 一方で、データと現象に適したものが見つかるまで、さまざまなパラメーターを試すことができます。 次に作成する標準誤差推定のマップなど、結果の正確度を評価するためのツールもクリギングには多く用意されています。
標準誤差推定のマッピング
アフリカと中東をカバーする 4 つの異なる温度サーフェスを作成しました。 いずれも同じデータから内挿されましたが、それぞれ異なるサーフェスが表示されました。 これらの予測が有用なのは明らかですが、事実として受け取ることはできません。 サーフェスの一部 (多くのデータ ポイントがある場所) は他 (データがまばらな場所) よりも正確度と信頼性が高いと見なすことができます。 こうした不確実性の度合いをマッピングすることで、意思決定者の支援に役立てることができます。
- [コンテンツ] ウィンドウで [Kriging Modified] を選択します。
- リボンの [地球統計レイヤー] タブで、[表示タイプ] を [標準誤差] に変更します。
マップの大半が赤くなります。
- [コンテンツ] ウィンドウで [Temperature] をオンにします。
標準誤差とは、予測値の不確実性の測定値です。 マップ上の濃い赤のエリアで標準誤差値が大きいため、予測値の確実性が低くなります。 色の薄いエリアは結果の信頼性が高い場所です。 結果では海で標準誤差が最も大きいことがこのマップからわかります。 海にはサンプル計測ポイントがなかったため (小さな島にはいくつかありましたが)、これは当然の結果です。
- [Kriging Modified] レイヤーで [表示タイプ] を [推定] に戻します。
このマップでは陸地温度の予測だけを行うため、海はマスクされていてもかまいません。
- [コンテンツ] ウィンドウで [Oceans] レイヤーを [Kriging Modified] の上にドラッグします。
- プロジェクトを保存します。
不連続ポイント データしかない場合でも、地球統計学では多くの現象を連続するサーフェスとしてマッピングできます。 パターンの視覚化と解析の実行でこれが非常に役立ちます。 分析範囲に測候所がなくても、あらゆる場所の温度の理解と予測に必要なデータが幅広い地域の一連の測候所から手に入ります。
地球統計ウィザードにはさまざまな内挿方法が用意されており、異なる結果を生成するために調整できるパラメーターがそれぞれにあります。 なぜでしょうか? マッピングする現象と用意しているデータによっては、あるモデルがもう一方のモデルより結果の信頼性が高くなる場合があります。 内挿されたサーフェスに基づいて判断を下す場合、最も正確度の高いモデルを見つけることが非常に重要になります。
クロス評価結果を比較することでデータに最適な方法を判断できます。 サーフェスを作成すると、一部で他よりも予測の正確度が高くなります。 標準予測誤差ごとにサーフェスを視覚化することで、最も信頼性が高い予測を把握できます。
作成した 4 つのマップはいずれも同じ入力データをベースにしていますが、それぞれ見た目が異なります。 内挿されたサーフェスがあるマップがどのように作成されるかがわかりましたが、その信頼性はどうなっているのでしょうか。 地球統計学的モデルを調整してより正確度の高い結果を生成できます。 一方で、マップ作成者にはアピールしたい特定のテーマがあったり、トレンドを強調するために地球統計学的パラメーターを調整したりする場合があります。
このプロジェクトには他の大陸用に、さらに 5 つのマップが用意されています。 これらは [カタログ] ウィンドウの [プロジェクト] タブの [マップ] フォルダーにあります。
さらに学習する場合は、これらのマップのいずれかを使用してこのチュートリアルを再度受講してください。 アフリカと中東では [Aug Avg. Temp C] が最良のフィールドで、[Kriging Modified] が最良のサーフェスでした。 他の大陸では、別のパラメーターの方が良い結果が出る場合があります。
他のチュートリアルについては、チュートリアル ギャラリーをご覧ください。