チャートを使用した酸素濃度データのマッピングと探索

最初に、ライン チャートとヒストグラム チャートを使用して、データのプロパティと特性を調査します。 データの調査は、ほとんどの解析ワークフローの重要な最初のステップです。 次に、これらのチャートを使用して、データが内挿ワークフローに対して有効であるかどうかを確認します。 ライン チャートを使用して、時間経過に伴う溶存酸素濃度の変化を表示することで、解析に適したタイム ウィンドウを選択できます。 タイム ウィンドウの選択後、ヒストグラム チャートを使用して、湾全体にわたる溶存酸素のさまざまな濃度を確認できます。

プロジェクトをダウンロードして開く

ArcGIS Pro パッケージ内の、チェサピーク湾の入り江から収集された水質データといくつかのデータ レイヤーを含むフォルダーが提供されています。 このデータは、Chesapeake Bay Program によって提供されたものです。

  1. Chesapeake_WaterQuality.zip ファイルをダウンロードします。
  2. コンピューター上で、ダウンロードしたファイルを選択します。
    注意:

    お使いの Web ブラウザーによっては、ダウンロードを開始する前に、ファイルの場所を選択するよう求めるメッセージが表示される場合があります。 ほとんどのブラウザーでは、デフォルトでコンピューターのダウンロード フォルダーがダウンロード先の場所になります。

  3. ファイルを右クリックして、コンピューター上の便利な場所 (ドキュメント フォルダーなど) にコンテンツを展開します。
  4. 展開したフォルダーを開き、コンテンツを表示します。
  5. コンピューターに ArcGIS Pro がインストールされている場合は、[Chesapeake_WaterQuality.ppkx] をダブルクリックしてプロジェクトを開きます。
    注意:

    ArcGIS Pro へのアクセス権限または組織アカウントがない場合は、ソフトウェア アクセスのオプションをご参照ください

  6. サイン インを求められたら、ライセンスが割り当てられた ArcGIS アカウントを使用してサイン インします。

    プロジェクトには [Chesapeake Bay Dissolved O2] という名前のマップが含まれ、このマップには地形図ベースマップと次のデータ レイヤーが含まれています。

    • [DissolvedO2] レイヤーには、1984 年以降に溶存酸素や他の多くの化合物が監視された場所が表示されます。 マップ上には 131 のポイントしか表示されませんが、各場所には何百または何千もの履歴計測値が含まれています。
    • [Bay] レイヤーは、湾の海岸線の単純化されたポリゴンを表します。
    注意:

    溶存酸素は、水 1 リットルあたりのミリグラム数 (mg/L) で計測されます。 米国海洋大気庁 (NOAA)[1] によると、溶存酸素濃度が持続的に 5.0 mg/L を下回ると不健全であると見なされ、持続的に 0.2 mg/L を下回る場所は魚類や植物が生き延びることができないデッド ゾーンとなります。

  7. [Chesapeake Bay Dissolved O2] マップの [コンテンツ] ウィンドウで、[Bay] レイヤーをオンにします。

    Bay レイヤーのチェックボックスをオンにする

    注意:

    ArcGIS Pro のデフォルト構成によっては、[コンテンツ] ウィンドウが自動的に開かない場合があります。 必要に応じて、リボンの [表示] タブをクリックします。 [ウィンドウ] グループで、[コンテンツ] をクリックします。

  8. [マップ] タブの [ナビゲーション] グループにある [マップ操作] をクリックします。

    マップ操作ツール

  9. マップをクリックし、チェサピーク湾の北端に移動します。

    チェサピーク湾の北端

  10. [コンテンツ] ウィンドウで、[Bay] レイヤーをクリックして選択します。 リボンの [フィーチャ レイヤー] タブをクリックします。 [比較] グループの [スワイプ] をクリックします。

    スワイプ ツール

    マップをポイントすると、ポインターが変化します。

  11. マップをクリックし、ポインターを上下または左右に動かして、[Bay] レイヤーを非表示にします。

    Bay レイヤーのスワイプ

    注意:

    [Bay] レイヤー ポリゴンの範囲は、下にある [地形図] ベースマップと完全には一致しません。 [Bay] レイヤーは、実際のチェサピーク湾の境界線から単純化およびジェネラライズされています。 ジェネラライズにより、今後の解析がより高速になります。

  12. [マップ] タブで [マップ操作] をクリックします。 マウス ホイールをスクロールし、チェサピーク湾の全体表示に戻します。

    [マップ操作] ツールを有効化すると、スワイプ効果が無効になるため、通常の画面移動とズームができるようになります。

  13. [コンテンツ] ウィンドウで、[Bay] レイヤーをオフにして、[DissolvedO2] レイヤーをオンにします。
    注意:

    [DissolvedO2] レイヤーは、Chesapeake Bay Program Water Quality Database (1984 – present) からダウンロードされた .csv ファイルをソースとしています。 このデータは、2014 年の初めから 2015 年末までの間にサンプリングされた溶存酸素関連のデータを保持するように、ジオコーディング、投影、およびフィルタリングされています。

  14. [マップ操作] ツールを使用して、チェサピーク湾全体の溶存酸素計測の分布を視覚化します。

    チェサピーク湾の溶存酸素計測

    ヒント:

    Chesapeake Bay Program Water Quality Database (1984 – present) リンクを使用して、複数年にわたる追加の養分データをダウンロードし、独自に調査できます。

ライン チャートの作成

データを探索したので、溶存酸素濃度のライン チャートを作成します。 ライン チャートは、時間経過に伴う値の変化を示すグラフの一種です。 作成するライン チャートは、2014 年から 2015 年までの間に湾全体の平均溶存酸素濃度がどのように変化したかを示します。

[日付または数値] 変数フィールドとして [SampleDate] を設定すると、[DissolvedO2] の各計測値が取得された日時がライン チャートの水平 X 軸にプロットされるよう指定されます。

  1. [コンテンツ] ウィンドウで、[DissolvedO2] を右クリックして [チャートの作成] をポイントし、[ライン チャート] を選択します。

    ライン チャートの作成

    [チャート プロパティ - DissolvedO2] ウィンドウと [Dissolved02 – DissolvedO2 のチャート] ウィンドウが表示されます。

  2. [チャート プロパティ] ウィンドウの [データ] タブで、[日付または数値][SampleDate] を選択します。 [集約] で、[平均値] を選択します。

    日付または数値パラメーターの指定

  3. [数値フィールド][選択] をクリックします。 [MeasureValue] をオンにして [適用] をクリックします。

    フィールド パラメーターの設定

    これで、チャートに各日付の溶存酸素計測値の平均が表示されるようになりました。

    [MeasureValue] フィールドに格納されている溶存酸素計測値が、ライン チャートの垂直 Y 軸にプロットされます。 これで、データを個別に集約できるようになりました。 [SampleDate] 属性は日付として格納されているため、デフォルトのオプションは [個数] です。 この方法では、観測データが記録された日数がカウントされます。 [MeasureValue] は数値として格納されているため、別の算術演算を適用できます。

  4. [時間ビニング オプション] セクションで、[間隔サイズ][5 日] に設定されていることを確認します。 [空のビン] で、[ラインの接続] を選択します。

    空のビンでのラインの接続

    [ラインの接続] では、使用可能な計測値を持たない日付がある場合でもラインが確実に接続されるため、ライン チャートが読みやすくなります。

    チャートのタイトルとチャート ウィンドウが更新されて [Dissolved02 - SampleDate の MeasureValue の平均] になり、ライン チャートの生成に使用された変数を反映します。

  5. チャート ウィンドウで、2014 年 4 月 1 日~ 2015 年 4 月 1 日に観測された 12 ~ 13 mg/L を超える平均溶存酸素濃度を目視で確認します。 さらに、5 ~ 6 mg/L 未満の平均溶存酸素濃度に該当する夏の日付も確認します。
    注意:

    モニターの解像度やチャートのサイズが原因で、チャートのコンテンツの表示が画像例と異なることがあります。モニターの解像度やチャートのサイズは、どのサンプル日付および計測値が横軸と縦軸に表示されるかに影響を及ぼします。 チャートのライン色は異なる場合がありますが、結果は同じです。

    ライン チャート

    チェサピーク湾の溶存酸素には、明確な季節周期があります。 平均溶存酸素濃度は冬の間に最高になり (平均濃度が 12 ~ 13 mg/L にまで上がり)、夏の間に最低になります (平均濃度が 5 ~ 6 mg/L にまで下がります)。 5.0 mg/L 未満の場合は不健全であると見なされるため、6 月から 9 月までの間の溶存酸素濃度を調査する必要があります。 ただし、平均溶存酸素濃度が 0.2 mg/L (海洋生物を維持できないことを示す) に近いときがなかったことを確認できたのは朗報です。

ライン チャートのフィルター

溶存酸素濃度の季節周期を確認しましたが、個々の季節をさらに詳しく見ていきたいと思います。 データの全般的な傾向としては上がったり下がったりしていますが、各観測データの間にはかなりばらつきがあります。 タスクを使用して、2014 年 6 月 15 日から 2014 年 9 月 15 日までの間に取得され、5 メートルを超える深さでサンプリングされた計測値を選択します。 タスクとは、ワークフローの手順をわかりやすく説明した事前設定済みの一連のステップです。 この選択クエリのタスクは、プロジェクトに含まれています。

  1. リボンの [表示] タブをクリックします。 [ウィンドウ] グループで、[カタログ ウィンドウ] をクリックします。

    カタログ ウィンドウ ボタン

  2. [カタログ] ウィンドウで、[タスク] フォルダーを展開して [Filter Samples for Summer 2014 and Summer 2015] タスクをダブルクリックします。

    カタログ ウィンドウのタスク フォルダー

    [タスク] ウィンドウが表示されます。

  3. [タスク] ウィンドウで、[Apply Summer 2014 Filter] をダブルクリックします。

    フィルターの適用

    タスクが開きます。 このタスクは、[DissolvedO2] レイヤーに対して 3 つの部分から成るクエリを実行する 1 つのステップで構成されています。

    Apply Summer 2014 Filter タスク

    ヒント:

    ウィンドウの右側にポインターを合わせてドラッグすると、ウィンドウのサイズを大きくできます。

    タスクのパラメーターは次のとおりです。

    • [入力行][DissolvedO2] を選択します。
    • [選択タイプ][新しい選択] を選択します。

    式は次の SQL クエリを使用します。

    • TotalDepth5 より大きい
    • かつ SampleDate6/15/2014 12:00:00 AM より後
    • かつ SampleDate9/16/2014 12:00:00 AM より前

    クエリの式により、2014 年 6 月 15 日から 2014 年 9 月 15 日までの間に 5 メートルを超える深さで取得されたすべてのサンプルが選択されます。

    ヒント:

    独自の SQL クエリ式を記述する方法については、「検索条件設定でのクエリの作成」をご参照ください。

  4. [実行] をクリックします。

    タスクのフィルターにより、ライン チャートで 2014 年の夏のポイントが自動的に選択されます。

    選択セットを含むライン チャート

  5. ライン チャートの上部にある [選択セットによるフィルタリング] ボタンをクリックします。

    2014 年の夏のフィルタリングされたライン チャート

    チャートが更新されて、選択されたポイントのみが表示されます。

    選択されたポイントのみを表示するチャート

    2014 年の夏の数か月間は、平均溶存酸素濃度が明確なパターンなしで上下に変動しています。 1 つの季節だけを見ると、データセット全体で確認できる季節的な傾向が消えます。 これは好都合です。季節的な傾向があると、内挿ワークフローで問題が発生する可能性があります。 この 3 か月間の計測値だけを使用する場合は、季節的な傾向を無視できるようです。

  6. [タスク] ウィンドウで [完了] をクリックして、タスクの実行を停止します。 [タスク] ウィンドウを閉じます。

フィルタリングされたヒストグラム チャートを作成する

前のセクションでは、ライン チャートを使用して、解析を 2014 年の夏の数か月に制限する必要があることを確認しました。 これらは、平均溶存酸素濃度が不健全なレベルに近い月です。 ただし、ライン チャートでは湾全体の平均溶存酸素濃度だけが表示されていました。 湾の中で、濃度が低い部分もあれば、高い部分もある場合はどうなるでしょうか。 いくつかの非常に低い濃度が平均値によって隠されている可能性がありませんか。 これらの質問に答えるため、選択されたデータのヒストグラム チャートを作成します。

  1. [コンテンツ] ウィンドウで、[DissolvedO2] を右クリックして [チャートの作成] をポイントし、[ヒストグラム] を選択します。
  2. [チャート プロパティ] ウィンドウの [データ] タブで、次の変更を加えます。
    • [変数][数値][MeasureValue] を選択します。
    • [ビン] に「64」と入力します。

    ヒストグラム チャートのプロパティの設定

    [DissolveO2 - MeasureValue の分布] ウィンドウが更新され、すべてのサンプルについての DissolvedO2 のヒストグラムが表示されます。

    2014 年の夏のサンプルが、青で選択されたままの状態です。

    選択された 2014 年夏のビンが選択された状態のヒストグラム

  3. ライン チャートの上部にある [選択セットによるフィルター] ボタンをクリックして有効にします。

    フィルタリングされたデータのヒストグラム

    ヒストグラムが更新され、2014 年の夏の選択されたサンプルだけが表示されます。 2014 年の夏は、ほとんどのデータ計測値が溶存酸素 3 mg/L ~ 9 mg/L の範囲内でした。 夏の 3 か月間の平均濃度は 5.26 mg/L でした。

    しかし、ヒストグラムの左端の 2 つのバーは注目に値します。溶存酸素濃度が平均よりかなり低いうえに、非常に多くのサンプルでそれらの溶存酸素濃度が観測されています。 次に、これらを調査します。

  4. [MeasureValue の分布] ヒストグラムで、左側にある [150][200] の最初のデータ ビン (バー) にポインターを合わせて、そのデータ ビンの [MeasureValue][個数] の値を表示します。
    注意:

    計測値は、丸め処理のために少し異なる可能性があります。

    最低のビンの値

    ビンのプロパティにより、全部で 4086 のサンプルのうち 185 のサンプルの溶存酸素濃度が 0 ~ 0.2 であったことが明らかにされます。 これはデッド ゾーンの兆候であるため、この結果は非常に懸念すべきものです。 ただし、デッド ゾーンは、溶存酸素濃度が長期間にわたって持続的に低い場合にのみ発生します。 これらの場所の溶存酸素濃度が持続的に低いかどうかが、次のモジュールの焦点になります。

  5. [チャート] ウィンドウと [チャート プロパティ] ウィンドウを閉じます。

    チャートを閉じても、チャートはプロジェクトから削除されません。

  6. [クイック アクセス ツールバー][プロジェクトの保存] ボタンをクリックします。 現在使用しているバージョンよりも新しいバージョンの ArcGIS Pro に保存するよう求められたら、[はい] をクリックして新しいバージョンを保存します。

    クイック アクセス ツールバーのプロジェクトの保存ボタン

ここでは、ライン チャートとヒストグラムを使用して、選択フィルターを適用しながらデータを調査しました。 ライン チャートでは、溶存酸素分布の強い季節的パターンと、夏の数か月間に発生する最低濃度が示されました。 2014 年の夏には、湾の平均溶存酸素が 5 mg/L という不健全なレベルに近くなっていました。

ヒストグラムでは、いくつかの個別ポイントが、デッド ゾーン (溶存酸素濃度が長期間にわたって非常に低い状態が続くと発生) の兆候となるレベルであったことが明らかになりました。 これで、湾内に溶存酸素濃度が持続的に低いエリアがあるかどうかを確認することが重要となりました。


内挿の実行と結果の比較

内挿モデルの精度は、ある位置の予測値がその位置の実際の値にどれだけ近いかによって定義されます。 ただし、このような精度の定義は、すぐに見せかけの矛盾を生みます。 特定の位置群だけで溶存酸素を計測した場合、新しい位置で内挿モデルがどれだけ適切に予測しているかをどのようにして評価できるでしょうか。 新しい位置の実際の値がわからない場合、予測の精度にどのような基準があるのでしょうか。 これは克服できない矛盾のように思われますが、このような矛盾には、交差検証と呼ばれる一般的に広く受け入れられた解決策があります。

交差検証は、「leave-one-out」統計手法です。 データセットから各計測ポイントを順次削除し、残りのポイントを使用して、削除したポイントの位置の値を予測することで、モデルの精度が評価されます。 内挿モデルの信頼性が高い場合は、残りのポイントによって、隠されたポイントの実際の (計測された) 値が正確に予測されるはずです。 その後、予測を実際の計測値と比較して、予測がどれだけ近いかを確認できます。 特定のポイントの実際の値と予測値の差は、交差検証誤差と呼ばれます。 各計測ポイントを交差検証した後、さまざまな数値診断とグラフィックス診断を生成して、モデルの全体的な精度を評価できます。 2015 年の夏の平均溶存酸素濃度を内挿し、その結果を 2014 年の夏の平均溶存酸素濃度と比較することで、交差検証の診断を解釈します。

ウィザードを使用したデータの内挿

次に、既知の計測済み O2 値を使用して、計測値が取得されなかった酸素濃度を内挿します。 マッピングまたは詳細な解析に使用できるサーフェスの内挿結果 [Bay] レイヤーのフィーチャをバリアとして使用し、内挿をチェサピーク湾に限定します。

2014 年の夏のデータを内挿するために、Geostatistical Wizard を使用します。これは、内挿モデルを構築し、そのパフォーマンスを評価するプロセスを順を追って実行するために設計されたページのダイナミックなセットです。

  1. リボンの [解析] タブの [ワークフロー] グループで、[地球統計ウィザード] をクリックします。

    地球統計ウィザード ボタン

    [地理統計ウィザード] が表示されます。

  2. [地球統計ウィザード] の最初のページの [バリアを使用した内挿] で、[カーネル内挿] を選択します。

    バリアを使用したカーネル内挿を選択

  3. [データセット] の下の [ソース データセット][DisslovedO2] が選択されていることを確認し、[データ フィールド][MeasuredValue] を選択します。 [バリア フィーチャ][Bay] を選択します。

  4. [次へ] をクリックします。

    [データの読み込み] ページが表示されます。

  5. [データの読み込み] ページの [データセット][平均を使用] を選択します。

    平均を使用オプション

  6. [次へ] をクリックします。

    [カーネル内挿] ページが表示されます。

    カーネル内挿ページには、マップ、一般プロパティ、単一のポイントに対する結果の確認が表示されます。

    [バンド幅] パラメーターは重要なパラメーターですが、値が入力されていません。 [バンド幅] は、プレビュー サーフェス内の検索サークルの半径を制御します。 このデータでは、バンド幅がメートルで計測されます。デフォルトは、簡単な最適化に基づいて、ソフトウェアによって指定されます。 空白のまま、ユーザーのデータに基づいて計算するように ArcGIS Pro を設定できます。

    [結果の確認] の下には十字線で示された現在の位置の値が表示されます。 必要に応じて、他の位置をクリックして値を確認できます。

    注意:

    [DissolvedO2] レイヤーに選択セットが存在するため、選択されたフィーチャだけが内挿の計算に使用されます。

  7. [次へ] をクリックします。

    [交差検証] ページが表示されます。

    交差検証ページ

    交差検証については、このチュートリアルの後半で説明します。

  8. [完了] をクリックします。 [方法レポート] ウィンドウで、[OK] をクリックします。

    出力レイヤーがマップ上に表示されます。

    Kernel Interpolation の結果レイヤー

    [Kernel Interpolation] レイヤーは、ArcGIS Geostatistical Analyst エクステンション だけで使用されるカスタム レイヤー タイプです。 このレイヤーは素早い視覚化と計算に向けて最適化されており、ラスター レイヤーまたはフィーチャ レイヤーにエクスポートできます。

    このマップでは、赤色とオレンジ色が最高の平均溶存酸素濃度を表します。 これらの高い値のほとんどが、湾の南部の大西洋に近い部分と入り江の先端にあります。 最低の濃度 (青色および緑色で示される) は、湾の中央部と上部にあります。

  9. プロジェクトを保存します。

    ここでは、ArcGIS Geostatistical Analyst エクステンション の一部である Geostatistical Wizard を使用して、2014 年夏のチェサピーク湾の平均溶存酸素濃度を内挿しました。 内挿されたマップに基づいて、チェサピーク湾の一部のエリアでは 2014 年の夏に溶存酸素濃度が健全なレベルを下回った可能性があることを推測できますが、魚類や植物が生き延びることができない持続的なデッド ゾーンが存在したことは示されませんでした。

交差検証結果の調査

次に、作成したレイヤーの [交差検証] ウィンドウを確認して、そのさまざまなエレメントについて理解します。

  1. [コンテンツ] ウィンドウで [カーネル内挿] レイヤーを右クリックし、[交差検証] を選択します。

    Geostatistical レイヤーのショートカット メニュー

    注意:

    交差検証は Geostatistical レイヤーのプロパティであり、他のレイヤー タイプではサポートされていません。

    [カーネル内挿] レイヤーの [交差検証] ウィンドウが表示されます。

    注意:

    [交差検証] ウィンドウで使用できるさまざまなタブや統計情報については、「交差検証と検証の実行」をご参照ください。

  2. [交差検証] ウィンドウの右側で、[テーブル] タブをクリックします。

    このテーブルには、各計測ポイントの交差検証結果が含まれています。

  3. 必要に応じて、[エラー] 列が表示されるようにウィンドウのサイズを変更します。

    テーブル タブ

    ポイントごとに、ポイントの [計測済み] の値と交差検証の [推定] の値が保持されています。 [エラー] の値は、[推定] の値から [計測済み] の値を引いて算出されます。 [エラー] の値が 0 より大きい場合は、交差検証の予測が実際の値よりも高かったことを意味します。 [エラー] の値が 0 より小さい場合は、予測が実際の値よりも低かったことを意味します。

  4. [エラー] 列のタイトルをクリックして、昇順に並べ替えます。

    エラー列の並べ替え

    並べ替えられた [エラー] 列では、最小の交差検証誤差が -2.76 になっています。 これは、交差検証で予測された溶存酸素濃度が、その位置の実際の値よりも 2.76 mg/L 低かったことを意味します。

  5. [エラー] 列のタイトルをクリックして、降順に並べ替えます。

    最大の交差検証誤差は、約 3.03 です。 これは、交差検証で予測された溶存酸素濃度が、そのポイントの計測値よりも約 3.03 mg/L 高かったことを意味します。

  6. 最初の行をクリックして、最大の交差検証誤差を持つポイントを選択します。

    テーブル内のレコードを選択すると、左側のグラフで、関連付けられたポイントがハイライト表示されます。 このレコードでは、ポイントはグラフの X 軸上にあります。

    最大の交差検証誤差を持つレコードの選択

    このグラフでは、各ポイントの予測値に対する計測値の散布図が、ポイントの青い回帰直線とともに表示されています。 予測値が計測値と近いのが理想的です。そのため、回帰直線が 45 度の角度に沿っていることを期待します。 回帰直線がこの理想の 45 度の角度にどれだけ近いかを評価するために、ウィンドウにグレーの参照ラインが表示されています。 ここでは、青い回帰直線がグレーの参照ラインよりも少し平らになっており、これらのラインの周りのポイントにかなりのばらつきがあります。 ただし、この違いはあまり重大でないように思われます。 青いラインが完全な平らまたは完全な垂直に近かった場合は、受け入れるべきではない重大な問題を示します。

  7. ウィンドウのグラフィックス診断の部分で、[エラー] タブをクリックします。

    エラー タブ

    [エラー] タブには、計測値に対する交差検証誤差の散布図が表示されています。 このグラフは、交差検証誤差が計測値に依存していないかどうかを確認するために使用されます。

    溶存酸素濃度が低くても、中間でも、高くても、同じように正確な予測を行いたいため、誤差と計測値の間の非依存性は重要です。 誤差と計測値の間の非依存性は、平らな回帰直線によって示されます。 このグラフでは、回帰直線が下降しています。これは、非常に高い計測値が低めに、非常に低い計測値が高めに予測されたことを示します。

    これはスムージングと呼ばれ、一般的な現象です。 グラフ内のスムージングの程度は標準的です。ただし、このスムージングのおかげで、実際には不健全または危険な溶存酸素濃度を持つ位置で、モデルが間違って安全な濃度を予測している可能性があることに注意する必要があります。 これで解析の続行を断念する必要はありませんが、解析結果を報告するときにこれを開示する必要があります。

  8. [交差検証] ウィンドウの数値診断部分で、[サマリー] タブをクリックします。

    サマリー タブ

    [サマリー] タブでは、[テーブル] タブ上の情報に関する統計情報のサマリーが表示され、交差検証の結果を評価するための簡単で便利な方法が提供されます。

    [二乗平均平方根] は、モデルの精度を評価するための最も重要な統計情報です。 この値は常に 0 より大きくなりますが、この値が 0 に近づくほど、交差検証の予測が計測値に近くなります。 ここでの約 1.12 という [二乗平均平方根] の値は、平均で、予測値が溶存酸素 1 mg/L より少し多く実際の値から外れていたことを示します。 その他すべての統計情報はモデルに関する有用な情報を提供しますが、[二乗平均平方根] の値は予測の精度を直接計測する唯一の値です。

    注目すべきもう 1 つの統計情報のサマリーは、[平均] の値です。 これは、交差検証誤差の平均で、モデルが高すぎる予測をする傾向にあるか、低すぎる予測をする傾向にあるかを評価するために使用されます (これはバイアスと呼ばれます)。 モデルにバイアスがない場合、この値は 0 に近くなります。 この値が 0 よりかなり大きい場合は、モデルが体系的に高すぎる予測をしていることを意味します。 同様に、この値が 0 よりかなり小さい場合は、モデルが体系的に低すぎる予測をしていることを意味します。 ここでの約 0.045 という値は、このモデルが非常に小さいバイアスを持つことを示します。 平均して、このモデルは約 0.045 mg/L 高い予測をしていますが、これはごく少量です。 このような [平均] の小さな値に基づき、モデルにバイアスがないと見なしても差し支えないでしょう。

  9. [交差検証] ウィンドウを閉じます。

2015 年のチャートの表示

次に、2015 年の夏に取得された溶存酸素計測値を選択します。 チャートでデータを探索します。

  1. 必要に応じて、[Filter Samples for Summer 2014 and Summer 2015] タスクを開きます。
    ヒント:

    リボンの [表示] を選択して、[カタログ] ウィンドウをクリックします。 [タスク] フォルダーを展開します。

  2. [Apply Summer 2015 Filter] をダブルクリックします。
  3. [実行] をクリックします。

    2015 年 6 月 15 日から 2015 年 9 月 15 日までの間に 5 メートルを超える深さで取得された計測値が選択されます。

  4. [完了] をクリックして [タスク] ウィンドウを閉じます。
  5. [コンテンツ] ウィンドウで [描画順にリスト] ボタンをクリックします。

    描画順にリスト ボタン

    先に作成したチャートが [コンテンツ] ウィンドウに表示されていることを確認できます。 チャートは、一種のレイヤー プロパティとして格納されており、マップの [コンテンツ] ウィンドウにあるレイヤー リストで管理します。

  6. [MeasureValue の分散] をダブルクリックして、ヒストグラムを再度開きます。 [選択によるフィルター] ボタンが有効であることを確認し、2015 年夏の選択されたサンプルだけが表示されるようにします。

    2015 年夏のデータのヒストグラム

  7. [チャート プロパティ] ウィンドウの [統計][中央値] および [標準 偏差] をオンにします。

    値が含まれるようにヒストグラムが更新されます。

    中央値と標準偏差が表示された 2015 年夏のヒストグラム

    このヒストグラムは、2014 年の夏のヒストグラムと似ています。 ほとんどの溶存酸素計測値は約 3 mg/L ~ 9 mg/L で、ここでも左側に 0.2 mg/L という危険な濃度に近いレベルの大きなバーがあります。

  8. [コンテンツ] ウィンドウで、[SampleDate を超える平均 MeasureValue] をダブルクリックして、ライン チャートをもう一度開きます。
  9. [チャート プロパティ] ウィンドウの [時間ビニング オプション] で、[間隔サイズ][5 日] に変更します。

    時間ビニングの更新

  10. 必要に応じて、[選択セットによるフィルタリング] ボタンをクリックし、2015 年の夏の選択されたサンプルだけを表示します。

    2015 年の夏のライン チャート

    このライン チャートも 2014 年の夏のライン チャートと似ています。 チェサピーク湾の全体的な平均溶存酸素濃度が、明確なパターンなしで上下に変動しています。 これは、この期間中の各位置の値の平均を問題なく求められることを意味します。

  11. [チャート プロパティ] ウィンドウと両方のチャートを閉じます。

ツールを使用したデータの内挿

以前に、Geostatistical Wizard を使用して、2014 年の夏の計測値を内挿しました。 ただし、Geostatistical Wizard で使用できるほとんどの内挿法は、ジオプロセシング ツールとしても使用できます。 次に、[バリアを使用したカーネル内挿] ジオプロセシング ツールを使用して、2015 年の夏の平均溶存酸素濃度を内挿します。

  1. リボンの [解析] タブの [ジオプロセシング] グループで、[ツール] をクリックします。

    [ジオプロセシング] ウィンドウが表示されます。

  2. [ジオプロセシング] ウィンドウで、「Kernel」を検索します。

    この検索用語を実装するまたは含むいくつかのジオプロセシング ツールが返されます。

  3. [バリアを使用したカーネル内挿] をクリックします。

    ジオプロセシングの検索結果

    [ジオプロセシング] ウィンドウに [バリアを使用したカーネル内挿] ジオプロセシング ツールが開きます。

  4. [入力フィーチャ] で、[DissolvedO2] を選択します。

    このパラメーターでは、内挿したいポイントが [DissolvedO2] レイヤーに含まれていることを指定します。

  5. [Z 値フィールド] で、[MeasureValue] を選択します。

    このパラメーターでは、溶存酸素計測値が [MeasureValue] フィールドに含まれていることを指定します。

  6. [出力地球統計レイヤー] で、「Summer 2015」と入力します。

    このパラメーターでは、結果として生成される Geostatistical レイヤーの名前を指定します。

  7. [入力絶対バリア フィーチャ] で、[Bay] を選択します。

    このパラメーターでは、[Bay] レイヤーが内挿でバリアとして使用されることを指定します。 これにより、ツールが水域距離を使用できるようになります。

  8. 残りのデフォルト値は、そのまま使用します。

    バリアを使用したカーネル内挿のパラメーター

    [バンド幅] パラメーターを空のままにしておくことで、バンド幅の値がツールによって決定されるため、[二乗平均平方根] の交差検証誤差が可能な限り小さくなります。 今回も、このように Geostatistical Wizard によって最適なバンド幅が決定されました。

    注意:

    [バリアを使用したカーネル内挿] ツールは、デフォルトで、すべての一致ポイントの平均を取ります。そのため、このジオプロセシング ツールで明示的にこれを指定する必要はありません。 一致ポイントのその他の集約方法は、ツールの [環境] タブにあります。

  9. [実行] をクリックします。

    ツールが実行されます。 [Summer 2015] という名前のレイヤーが [Chesapeake Bay Dissolved O2] マップに追加されます。 このレイヤーは、2015 年の夏のチェサピーク湾全体の予測された平均溶存酸素濃度を表します。

  10. ツールの実行に関連するサマリー ウィンドウをすべて閉じます。 [コンテンツ] ウィンドウで [DissolvedO2] レイヤーをオフにします。
  11. [コンテンツ] ウィンドウで、[Summer 2015] レイヤーをオンおよびオフにして、2014 年の夏のデータを含んでいる [カーネル内挿] レイヤーと比較します。

    2015 年の夏の溶存酸素

    2014 年の夏と同様に、2015 年の夏に平均溶存酸素濃度が非常に高かった場所は、入り江の先端と湾の南部の大西洋に近い部分です。 最低の溶存酸素濃度も、同様に湾の中央部と上部にあります。

交差検証を使用したレイヤーの比較

次に、前のセクションで作成したレイヤーの [交差検証] ウィンドウを表示して、その数値とグラフを 2014 年の夏のマップと比較します。

  1. [コンテンツ] ウィンドウで、[カーネル内挿] レイヤーをダブルクリックします。

    [レイヤー プロパティ] ウィンドウが表示されます。

  2. [一般] タブの [名前] で、[カーネル内挿] を削除して「Summer 2014」と入力します。

    レイヤーの名前を「Summer 2014」に変更すると、2014 年の結果と 2015 年の結果を簡単に区別して比較できます。

  3. [OK] をクリックします。
  4. [コンテンツ] ウィンドウで、[Summer 2014] を右クリックし、[交差検証] を選択します。

    Summer 2014 の溶存酸素濃度についての [交差検証] ウィンドウが表示されます。

  5. [コンテンツ] ウィンドウで、[Summer 2015] を右クリックし、[交差検証] を選択します。

    Summer 2015 の溶存酸素濃度についての [交差検証] ウィンドウが表示されます。

  6. Summer 2014 と Summer 2015 の両方の [二乗平均平方根] および [平均] の値を比較します。

    サマリーSummer 2014Summer 2015

    個数

    78

    85

    二乗平均平方根

    1.117

    1.002

    平均

    0.036

    0.021

    [二乗平均平方根] は、Summer 2014 では 1.117 でしたが、Summer 2015 では 1.002 に下がりました。 これは、Summer 2015 の交差検証の予測の精度が、Summer 2014 よりも約 10% 高かったことを示します。 その理由は、[個数] の値で示されているように、Summer 2015 に約 10% 多くのデータが含まれていたためであると考えられます (78 ポイントに対して 85 ポイント)。

    [平均] の値は、Summer 2014 では 0.036 でしたが、Summer 2015 では 0.021 に変わりました。 この値は 0 にできるだけ近い必要があります。ここでは、Summer 2015 のバイアスが Summer 2014 のバイアスよりも少し低かったことになります (ただし、どちらの夏のバイアスも低いレベルです)。

  7. グラフィックス診断で、[Summer 2014][Summer 2015] の両方の [推定] タブをクリックします。
  8. [推定] タブのグラフを比較します。 必要に応じて、比較のために [Summer 2014][Summer 2015] のウィンドウを横に並べて配置します。

    交差検証のグラフの比較

    [Summer 2015] (右側) の青い回帰直線は、[Summer 2014] (左側) の回帰直線よりもグレーの参照ラインに近いように見えます。

  9. グラフィックス診断で、[Summer 2014][Summer 2015] の両方の [エラー] タブをクリックします。

    エラーのグラフの比較

    [Summer 2014][Summer 2015][エラー] タブのグラフは、ほとんど同じであるように見えます。 青い回帰直線が平らであるのが理想だということを思い出すかもしれません。 [Summer 2014][Summer 2015] の両方で見られるような回帰直線の降下は、モデルがデータをスムージングし、大きな値を小さめに、小さな値を大きめに予測していることを示します。

  10. 各グラフの左下にある [回帰関数] の傾きを比較します。

    Summer 2014 の回帰関数Summer 2015 の回帰関数

    -0.668

    -0.581

    [Regression function] は、[Summer 2014] の青い回帰直線が、[Summer 2015] の青い回帰直線よりも少し右下がりに傾いていることを示します (-0.581 に対して -0.668)。 これは、[Summer 2014] には [Summer 2015] よりも少し多くのスムージングがあることを示します。

    そのため、[Summer 2015] の内挿では、実際には不健全または危険な溶存酸素濃度を持つ位置で、間違って安全な濃度を予測している可能性が、[Summer 2014] の内挿よりも少し低いという結論に至ることができます。 ただし、どちらの年も重大なレベルのスムージングは示していません。

  11. [交差検証] ウィンドウを閉じます。
  12. プロジェクトを保存します。

    ここでは、交差検証を使用して、内挿モデルの精度と信頼性を評価および比較しました。 交差検証のテーブル、統計情報のサマリー、およびグラフについて学習することで、内挿モデルの精度と信頼性を定量化できるようになりました。 これらのスキルによって、モデルの欠点に関する重要な開示を行うこともできます。 モデルがデータをスムージングしているように思われることを開示する必要があります。なぜなら、これによってチェサピーク湾の危険な溶存酸素濃度の一部が隠されている可能性があるためです。

    解析の統計コンポーネントがすべて揃ったので、同僚や意志決定者が簡単に理解できるような形でこの情報を提示します。 最適な解析を行っても、適切な人が警告を受けなかったり、すぐに理解できなかったりすると、何も効果がありません。

    たとえば、地球統計レイヤーをラスターにエクスポートして、意味のあるカラー ランプを適用します。 その後、各マップをレイアウトに追加して、解析結果のポスターを作成することができます。 このポスターのように視覚化されたポスターの作成が可能です。 レイアウトの作成の詳細については、チュートリアル シリーズ「ArcGIS Pro でのレイアウトの設計」をご参照ください。

このチュートリアルでは、ArcGIS Geostatistical Analyst エクステンション を使用しました。 Geostatistical Wizard[バリアを使用したカーネル内挿] ジオプロセシング ツールを使用して、2014 年と 2015 年の夏のチェサピーク湾における平均溶存酸素濃度を解析しました。 内挿を使用して、湾全体の平均溶存酸素濃度を予測する地球統計レイヤーを作成しました。 次に、結果を交差検証し、内挿の精度を定量化しました。

チェサピーク湾についての結果によると、平均濃度が 0.2mg/L という危険なレベルに近かったことはないが、多くの個別計測値がこの非常に低い濃度に近いか、それを下回っていました。 チェサピーク湾の溶存酸素濃度を、5.0 mg/L を超える健全なレベルに引き上げるために、緩和の取り組みが必要です。ただし、この解析によって導き出された科学的かつ統計的に正当な結論は、夏の数か月間の最悪のときでも、繁栄する海洋生態系を持続できるだけの十分な溶存酸素濃度があったというものです。

デッド ゾーンは世界中の問題です。 メキシコ湾、イギリス海峡、東シナ海などのさまざまな場所で、溶存酸素濃度を内挿する同様のプロセスを使用できます。 チャートでデータを探索し、データを内挿して、交差検証で結果の精度を評価するというプロセスは、ほぼすべての内挿ワークフローに共通しています。 Chesapeake Bay Program Water Quality Database (1984 – present) から他のソースのデータや他の年のデータをダウンロードし、その新しいまたは更新されたデータを使用して手順を繰り返すことをお勧めします。

他のチュートリアルについては、チュートリアル ギャラリーをご覧ください。