Skip To Content

R-ArcGIS Bridge のインストールおよび統計解析の開始

このレッスンでは、R-ArcGIS Bridge をインストールしてデータセットの解析を開始します。

R および Rstudio のダウンロード

まず、R および RStudio (R のための無料の統合開発環境) をダウンロードしてセットアップします。RStudio は、CRAN (Comprehensive R Archive Network) にアクセスできるコーディング プラットフォームを提供することによって、R での作業を支援します。CRAN には、多数の R ライブラリ、チャートとグラフ用の組み込みビューアー、およびその他の役立つ機能が含まれています (すでに R および Rstudio をインストール済みの方は、次のセクションに進んでください)。

  1. 必要に応じて、R 3.2.2 以降をダウンロードします。インストール ウィザードでは、すべてのデフォルトをそのまま使用します。

  2. 必要に応じて、RStudio Desktop をダウンロードします。インストール ウィザードでは、すべてのデフォルトをそのまま使用します。

ArcGIS プロジェクトの作成

ここで、データを ArcGIS プロジェクトに追加して、サンフランシスコ市の犯罪マップを作成します。

  1. San-Francisco.zip ファイルをダウンロードします。
  2. コンピューター上でダウンロードされたファイルを見つけ、その内容を San-Francisco という名前のフォルダーに展開します。
  3. San-Francisco フォルダーを開きます。

    このフォルダーは、マップに追加する犯罪データが格納された SF_Crime ジオデータベースを含んでいます。

  4. ArcGIS Pro を起動します。サイン インを求められたら、ライセンスが割り当てられた ArcGIS アカウントを使用してサイン インします。
    注意:

    ArcGIS Pro または ArcGIS アカウントがない場合、ArcGIS の無料トライアルにサイン アップできます。

  5. [新規][空のテンプレート][マップ] をクリックします。
  6. [新しいプロジェクトの作成] ウィンドウで「Crime Analysis」という名前を入力して [San-Francisco] フォルダーに保存します。[このプロジェクトのための新しいフォルダーを作成] チェックボックスをオフにします。
  7. [カタログ] ウィンドウの [プロジェクト] タブで、[フォルダー] を展開し、[San-Francisco] フォルダーを展開します。
  8. [SF_Crime] ジオデータベースを展開し、[San_Francisco_Crimes] フィーチャクラスを右クリックして [現在のマップに追加] を選択します。

    生データを表示しているマップ

    マップには、2014 年 1 月から 2014 年 12 月までにサンフランシスコ市内で発生した犯罪の位置が表示されています。

R-ArcGIS Bridge のインストール

R-ArcGIS Bridge をインストールすると、ArcGIS および R との間でデータの読み書きを開始できます。R スクリプトを参照するスクリプト ツールも実行開始できます。

  1. リボンの [プロジェクト] タブをクリックします。

    リボンの [プロジェクト] タブ

  2. [オプション] をクリックします。[オプション] ウィンドウの [アプリケーション] リストで [ジオプロセシング] をクリックします。

    [オプション] ウィンドウ

  3. [R-ArcGIS サポート] セクションで、目的の R ホーム ディレクトリを選択します。
    注意:

    コンピューターにインストールされているすべてのバージョンの R がリストに表示されます。R 3.2.2 以降のバージョンを選択します。

    R-ArcGIS Bridge をインストールしていない場合は、R を ArcGIS に接続するには arcgisbinding R パッケージをインストールする必要があることを示す警告が表示されます。arcgisbinding パッケージは自動的にダウンロードしてインストールするか、個別にダウンロードするか、ファイルからインストールすることができます。R-ArcGIS Bridge を以前にインストールしたことがある場合は、お手元の arcgisbinding パッケージのバージョンを示すインストール済みメッセージが表示されます。アップデートの有無を確認する、最新バージョンをダウンロードする、またはファイルから更新するというオプションが提示されます。

  4. 該当する場合には、警告の横のアイコンをクリックして、arcgisbinding パッケージを自動的にダウンロードしてインストールするオプションを選択します。そうでない場合は、アップデートの有無を確認して、最新バージョンのパッケージを持っていることを確認します。
  5. [オプション] ウィンドウで [OK] をクリックします。
  6. [戻る] ボタンをクリックして、空間解析および統計解析を実行するデータを含んでいる開かれたマップに戻ります。

定義された位置内でカウントすることによってポイント データを集約します。

一見して、マップ上のデータが多いため、データが何を表しているかを理解するのが難しいかもしれません。解析を開始する前に、空間および時間で犯罪数を集約する必要があります。集約によって、以前は見えなかったデータ内の空間的および時間的関係を明らかにします。集約することで、時空間ビン内の犯罪ポイントを集計し、発生した犯罪を、選択した空間および時間の増分ごとにまとめてカウントすることができます。

  1. 必要に応じて、[ジオプロセシング] ウィンドウを開きます。([解析] タブの [ジオプロセシング] グループで、[ツール] をクリックします。)
  2. 検索ボックスに、「Create Space Time Cube」と入力して Enter キーを押します。
  3. 結果で [ポイントの集約による時空間キューブの作成 (Create Space Time Cube By Aggregating Points)] をクリックしてツールを開きます。次のパラメーターを入力します。
    • [入力フィーチャ][San_Francisco_Crimes] を選択します。
    • [出力時空間キューブ] で [San-Francisco] フォルダーを参照し、出力に「San_Francisco_Crimes_Space_Time_Cube.nc」という名前を付けます。
    • [時間フィールド] で、[日付] を選択します。
    • [時間ステップの間隔] で「1」と入力し、[月] を選択します。
    • [時間ステップの配列] では、デフォルトのそのまま使用します。
    • [集約形状タイプ][六角形グリッド] を選択します。
    • [距離間隔] で「300」と入力し、[メートル] を選択します。

    ポイントの集約による時空間キューブの作成 (Create Space Time Cube By Aggregating Points)

    これらのパラメーター値は、作成する時空間ビンのサイズおよび形状を指定します。使用するデータが 2014 年のものであるため、月別に犯罪を解析するのが自然な分け方になります。さらに、あなたの部署は、局所的レベルで犯罪を解析する必要があるため、小さい距離間隔の値を選択します。六角形ビンは、接続性および移動経路の側面を含んでいる解析で望ましいため、選択されます。

  4. [実行] をクリックします。

    [ポイントの集約による時空間キューブの作成 (Create Space Time Cube By Aggregating Points)] ツールは、時間の経過とともに空間のパターンおよび傾向を表示できる netCDF ファイルを作成します。このツールは、San_Francisco_Crimes レイヤー内の 74,760 個のポイントを 3,510 個の六角形 (ポリゴン ビン) に集約しました。各六角形は、約 78,000 平方メートルのエリアを表しています。[距離間隔] パラメーターおよび [時間ステップの間隔] パラメーターは、生成されるビンの数および各ビンのサイズに影響を与えます。これらの値は、解析エリアに関する予備知識に基づいて選択できます。またはツールが、データの空間分布に基づいて値を自動的に計算します。[ポイントの集約による時空間キューブの作成 (Create Space Time Cube By Aggregating Points)] ツールがファイルを正常に作成したことは、[メッセージ] ウィンドウをチェックして確認することができます。

犯罪ホット スポットの解析

次に、市全体で犯罪の統計的に有意なクラスターが現れている場所、および減少している場所を解析します。この解析は、部署が問題を予測し、犯罪予防策に対するリソース割り当ての有効性を評価するのに役立ちます。

  1. [ジオプロセシング] ウィンドウで、[時空間ホット スポット分析 (Emerging Hot Spot Analysis)] ツールを検索して開きます。
  2. 次のパラメーターを入力します。
    • [入力時空間キューブ] で、新規作成された時空間キューブを保存した場所を参照して選択します。
    • [分析変数][COUNT] を選択します。
    • [出力フィーチャ] で [San-Francisco] フォルダーを参照し、出力に「San_Francisco_Crimes_Hot_Spots」という名前を付けます。
    • 残りのパラメーターでは、デフォルト値をそのまま使用します。

    [時空間ホット スポット分析 (Emerging Hot Spot Analysis)] ツール

    [近傍距離] でデフォルト値を使用することで、データの空間分布に基づいて、ツールに距離バンドを計算させます。[近傍時間のステップ] の値は、デフォルトでは 1 つの時間ステップ間隔 (この場合は 1 か月) に設定されます。これらの設定は探索的解析には理想的ですが、解析に最適な距離バンドと時間ステップ間隔がわかっている場合は、それらを設定できます。

  3. [実行] をクリックします。

    ツールが実行され、その結果がマップに追加されます (ツールが [近隣距離] パラメーターに使用した値を知らせる警告メッセージが表示されます)。

  4. [San_Francisco_Crimes] レイヤーをオフにして、結果をさらに明瞭に表示します。

    時空間ホット スポット分析結果のマップ

    統計的に有意なホット スポットおよびコールド スポットの傾向がマップ上に表示されます。赤いエリアは、時間とともに犯罪数の多いクラスタリングが生じていることを示し、青いエリアは、時間とともに犯罪数の少ないクラスタリングが生じていることを示しています。各位置は、時間の経過に伴うクラスタリングの傾向に基づいて分類されます。

    濃い赤色の六角形ビンは、持続的なホット スポットです。これらは、すべてのタイム スライスのうちの 90% で統計的に有意なホット スポットだった位置です。ただし、これらの位置には、犯罪数のクラスタリングの強度において、時間の経過に伴う識別できる増加または減少がありません。

    対照的に、アウトラインがベージュ色の六角形ビンに示された薄い赤色では、ホットスポットが強まりつつあります。これらは、すべてのタイム スライスのうちの 90% で統計的に有意なホット スポットだった位置です。さらに、これらは、犯罪数のクラスタリングの強度が時間とともに増加している位置であり、その増加は統計的に有意です。

    反対に、濃い青色のビンは、持続的なコールド スポットです。これらは、犯罪が、統計的かつ持続的にあまりまん延していないエリアです。アウトラインが薄い青色のビンは、コールド スポットが強まりつつありますが、ホット スポットの反対のことを意味しています。これらのセル内の犯罪数の少ないクラスターは、時間とともに強度が高まっています。言い換えると、コールド スポットはさらにコールドになりつつあります。

    部署は、犯罪が持続的であるか、増加しているエリアに特に関心を持つ必要があります。部署は、犯罪のコールド スポットが発生している場所からそれらのエリアへ、リソースを移動することができます。

  5. プロジェクトを保存します。

このレッスンでは、R-ArcGIS Bridge をインストールし、統計解析のためにデータを準備し、一部の使用可能なツールの使用を開始しました。次のレッスンでは、さらに属性をデータセットに追加して、犯罪の発生に影響を与える可能性のある要因に関して、解析から結論を引き出すことができるようにします。