Skip To Content

追加属性によるデータの拡張

前回のレッスンでは、R-ArcGIS Bridge をインストールして、統計解析用のデータをダウンロードしました。その後、ArcGIS で、対象のエリアおよび時間に基づいてデータを集約し、データセット内の時間的傾向の調査を開始しました。犯罪のまん延に影響を与える要因を部署がよく理解するために、さらに情報を追加します。

データセットへの属性の追加

犯罪のホット スポットが現れる場所がわかったので、次に、それらが現れる理由を決定することを試みます。特に、エリアの犯罪とその人口の間の関係を調べます。統計解析は、特定のエリア内で発生する犯罪の数が人口による影響を受けるかどうかを決定できます。さらに、あなたの部署は、要因の中で、特定の種類のビジネスの存在、公園の普及、特定のエリア (六角形ビン) 内の公共の土地の量、世帯収入の中央値、および住宅価格を解析することに関心があります。

現在、時空間キューブ レイヤー内の六角形ビンには、この種類の解析に適した属性情報が含まれていません。別のジオプロセシング ツールを実行して、関連する属性情報をレイヤーに付加します。

注意:

ArcGIS Pro のバージョンが 1.4 よりも前である場合、[情報付加] ツールが 1,000 行を超えるデータセットに対して正常に実行されない可能性があるため、データを 2 つのさらに小さい部分に分割する必要があります。

  1. [解析] タブの [ジオプロセシング] グループで [環境] をクリックします。
  2. [環境] ウィンドウで、[フィールド] パラメーター設定を検索します。[完全に記述したフィールド名を保持] チェックボックスをオフにします。
    注意:

    これで、フィールドの取得元となったソースのテーブル名が出力フィールド名に含まれなくなります。この設定は、1 つ以上のソースから結合されたフィールドで構成されている情報付加済みデータを使用する場合に適用されます。

    [フィールド] 環境設定の更新
  3. 以下のパラメーターを指定して [情報付加 (解析ツール)] ツールを実行します。
    注意:

    このステップには、約 50 サービス クレジットが必要です。十分なクレジットが ArcGIS 組織アカウントに割り当てられていない場合 (または、不明な場合)、StepResult フォルダー内で提供されている結果ファイルを使用できます。その場合、ツールを実行する代わりに、[San_Francisco_Crimes_Enrich.shp] をマップに追加して、次のステップをスキップします。

    • [入力フィーチャ][San_Francisco_Crimes_Hot_Spots] を選択します。
    • [出力フィーチャクラス] で、[Crime Analysis.gdb] という名前のデフォルトのプロジェクト ジオデータベースを参照して選択し、出力フィーチャクラスの名前を [San_Francisco_Crimes_Enrich] に設定します。
    • [変数] でプラスをクリックします。[変数の追加] ウィンドウで、検索バーを使用して、[2010 Total Population][2018 Median Home Value, 2018 Median Household Income][2018 Renter Occupied HUs][Food & Beverage Stores Bus][Food Service/Drinking Estab Bus] を特定して選択します。
      注意:

      人口統計データは定期的に更新されるため、使用可能な変数と値は、このレッスンで指定されているものと異なる場合があります。必要に応じて、最新のデータを使用してください。

    データ変数を含む [レイヤーへの情報付加]

    注意:

    変数の追加方法は、変数名に影響を与える可能性があるため、重要です。変数名が表示と異なる場合は、R スクリプトを貼り付けるときに編集する必要があります。そうしないとラインが実行されません。

    犯罪率に関連する可能性のある変数の網羅的リストではありませんが、このリストから解析を開始するのが適切です。次に、結果を調べてみましょう。

  4. [コンテンツ] ウィンドウで、[San_Francisco_Crimes_Enrich] レイヤーを右クリックして [属性テーブル] を選択します。
  5. 必要に応じて、最後の 8 つの列を表示できるまで、属性テーブル内を右にスクロールします。

    新しく追加した情報付加フィールドが元のフィールド名よりも説明的なエイリアス名でテーブルに表示されます。エイリアス名のリストを次に示します。エイリアス名の後に元のフィールド名が括弧内に示されています。

    テーブル内の新しい属性

    [レイヤーへの情報付加] ツールの結果には、次のフィールドと値が含まれています。

    • [HasData] - [レイヤーへの情報付加] ツールが特定の六角形ビンのデータを検出したかどうかを示します。0 は、六角形に、選択したすべての属性に関して使用できるデータがないことを意味し、1 は、六角形ビンに、選択した属性のうちの少なくとも 1 つのデータがあることを意味します。このフィールドを使用してデータをフィルター処理して、関連する属性情報を持つフィーチャのみをマップに表示することができます。
    • [2010 Total Population (populationtotals_totpop10 - 2010)] - 六角形ビンごとの人口が示されます。一部の六角形の人口が 0 であることに注意してください。工業地域内または公園内にあるために、六角形ビンの人口が 0 になることがあります。あなたの部署で最も優先順位が高いのは、人口密度の高いエリア内の犯罪を減らすことです。そのため、人口密度の高い位置のみに注目します。
    • [2018 Median Home Value (wealth_medval_cy)] - 六角形ビンごとの住宅価格の中央値が示されます。
    • [2018 Median Household Income (wealth_medhinc_cy)] - 六角形ビンごとの世帯収入の中央値が示されます。
    • [2018 Renter Occupied HUs (ownerrenter_renter_cy)] - 六角形ビンごとの借家人の世帯数が示されます。
    • [Food & Beverage Stores Bus (NAICS) (businesses_n13_bus)] - 各六角形ビン内にある食品飲料店の数が示されます。
    • [Food Service/Drinking Estab Bus (NAICS) (businesses_n37_bus)] - 各六角形ビン内にある食品、飲料、またはその両方を提供する企業の数が示されます。

解析の実行に必要な情報を含むフィーチャクラスを作成しましたが、現段階で、解析の目標に関連しないデータが一部含まれています。対象属性に関する情報がない六角形ビンは、質問に答えるのに役立つ値や新しい情報を何も追加しません。さらに、住民のいないエリアは、今回、あなたの部署にとって優先度が高くありません。そのため、最も役立つ情報のみを含むように、情報が付加されたデータセットを縮小する必要があります。

追加解析のためのデータセットの準備

次に、解析に関連するデータを選択し、その情報のみを含むサブセットを作成します。このようにして、追加の解析で必要な場合には、情報が付加されたすべてのデータに引き続きアクセスすることができますが、必要なデータのみを使用して現在の解析を続行することができます。

  1. [ジオプロセシング] ウィンドウで、[属性検索 (Select Layer By Attribute)] ツールを検索して開きます。
  2. [入力行][San_Francisco_Crimes_Enrich] を選択します。
  3. [選択タイプ] で、[新規選択] が選択されていることを確認します。
  4. 条件式を追加するには、[項目の追加] ボックスをクリックします。
  5. [フィールド] ボックスで [HasData] を選択します。
  6. 条件式の演算子として [と等しい] を選択し、値パラメーター ボックスに値 0 を入力します。Enter キーをクリックして、条件式を完成させます。

    次に、2 番目の条件式を追加します。

  7. [項目の追加] をクリックして、条件式 [または 2010 Total Population が 0 に等しい] を追加します。
  8. Enter キーをクリックして、2 番目の条件式を完成させます。緑色のチェックをクリックして、両方の条件式の構文が有効であることを確認します。
    注意:

    SQL 式の記述の詳細については、「ArcGIS で使用されるクエリ式への SQL リファレンス」をご参照ください。

    属性検索 (Select Layer By Attribute) ツール

  9. [実行] をクリックします。

    このツールが実行され、情報が付加されたデータが含まれていないフィーチャまたは人口が 0 人のフィーチャが選択されます。これらのフィーチャは、工業用地や公園の可能性があります。

  10. 必要に応じて、[San_Francisco_Crimes_Enrich] レイヤーの属性テーブルを開きます

    1996 行のうちの 231 行が選択されていること、つまり、それらの行の HasData フィールドまたは TOTPOP10 フィールドに 0 の値が存在していることを確認します。これらの選択されたフィーチャを含まない新しいデータセットを作成して、解析に関連するデータを含んでいるフィーチャに焦点を合わせることができるようにします。

  11. 属性テーブルで、[切り替え] ボタンをクリックします。

    属性切り替えボタン

    このボタンは、データまたは人口を含んでいない 231 行の選択セットを、それ以外のすべての行と交換します。1996 行のうちの 1765 行が選択されているはずです。これで、情報が付加され、かつ人口を含んでいるデータを独自のレイヤーにコピーすることができます。

  12. [ジオプロセシング] ウィンドウで、[フィーチャのコピー (Copy Features)] ツールを検索して開きます。
  13. [入力フィーチャ][San_Francisco_Crimes_Enrich] を選択します。

    特定の行が選択されている場合、[フィーチャのコピー (Copy Features)] ツールはそれらの行のみを新しいフィーチャクラスの結果にコピーします。

  14. [出力フィーチャクラス] で、[Crime Analysis.gdb] という名前のデフォルトのプロジェクト ジオデータベースを参照して選択し、出力フィーチャクラスの名前を [San_Francisco_Crimes_Enrich_Subset] に設定します。
  15. [実行] をクリックします。

    現在、San_Francisco_Crimes_Enrich および San_Francisco_Crimes_Enrich_Subset という 2 つのレイヤーが存在しています。前者は完全なデータセットを含んでおり、後者は、情報が付加された属性を含むエリア、または住民が住んでいるエリアのデータのみを含んでいます。

  16. プロジェクトを保存します。

次のレッスンでは、R でそれらの属性を解析する方法、およびそれらの属性がエリアで犯罪が発生する可能性にどのように影響を与えるかについて学習します。