データの空間解析

チェックイン データを調べて解析し、空間的傾向を特定します。

プロジェクトを開く

まず、チェックイン データのマップを含む ArcGIS Pro プロジェクト パッケージをダウンロードして開きます。 その後、データの属性をよく理解します。

  1. Bay Area Popular Places」プロジェクト パッケージをダウンロードします。
  2. コンピューター上でダウンロードした [Bay_Area_Popular_Places] プロジェクト パッケージを見つけ、ダブルクリックして ArcGIS Pro で開きます。 サイン インするように求められた場合は、ライセンスが割り当てられた ArcGIS アカウントまたは ArcGIS Enterprise アカウントを使用してサイン インします。
    注意:

    ArcGIS Pro へのアクセス権限または組織アカウントがない場合は、ソフトウェア アクセスのオプションをご参照ください

    デフォルトのマップとデータ

    このプロジェクトには、サンフランシスコ ベイ エリアのポイント データを持つマップが含まれています。 データは、2007 年~ 2012 年に機能していた Gowalla ソーシャル メディア プラットフォーム経由で収集されました。 Gowalla を使用することで、ユーザーは訪問先の場所でチェックインできるようになりました。 各ポイントは、Gowalla のユーザーがチェックインした場所を表します。

    マップに基づいて、次の質問に回答します。

    • 特定の場所に他の場所よりも多いチェックインが含まれていますか?
    • これらのチェックインを使用して、人気のあるエリアをどのようにして定義できますか?
    • データが密集しています。 マップを見るだけで、どれだけの洞察を得ることができますか?

    次に、データの属性を調べます。

  3. [コンテンツ] ウィンドウで、[Bay Area Gowalla Check-ins] レイヤーを右クリックして [属性テーブル] を選択します。

    [Bay Area Gowalla Check-ins] レイヤーの [属性テーブル] オプション

    テーブルが表示されます。

    [Bay Area Gowalla Check-ins] レイヤーの属性テーブル

    [User ID] および [Location ID] フィールドには、ユーザーおよび位置の特有の ID が含まれています。 これらの ID のキーにはアクセスできないため、これらのフィールドは人気の判別には役立ちません。 [Check-in Latitude] および [Check-in Longitude] フィールドではデータの空間情報が提供され、[Check-in Time] フィールドではその時間情報が提供されています。

  4. テーブルを閉じます。

座標系の変更

フィーチャ間の空間リレーションシップを解析する場合、データに適した座標系を使用することが重要となります。 投影座標系は、3 次元の世界を 2 次元のマップに変換する数学的なプロセスです。 この変換を行う完璧な方法は存在しないため、すべての投影座標系に何らかの形の歪みが含まれます。 この歪みは、マップの外観に影響を及ぼすだけでなく、空間解析の結果を変える可能性もあります。

歪みを減らし、最高精度の結果を得るため、サンフランシスコ エリア周辺に焦点を当てた投影座標系にデータを投影します。 この座標系はサンフランシスコ付近の歪みを最小限にしますが、その代償として他のエリアの歪みが大きくなります。 サンフランシスコ以外のエリアには焦点を当てないため、この座標系はこのマップとデータに適しています。

  1. リボンの [解析] タブをクリックします。 [ジオプロセシング] グループで、[ツール] をクリックします。

    解析タブのツール ボタン

    [ジオプロセシング] ウィンドウが表示されます。

  2. [ジオプロセシング] ウィンドウの検索バーに「投影変換」と入力します。 結果リストで [投影変換 (Project)] ツールをクリックして開きます。

    [ジオプロセシング] ウィンドウの投影変換ツール

  3. [投影変換 (Project)] ツール ウィンドウの [入力データセット、またはフィーチャクラス][Bay Area Gowalla Check-ins] を選択します。 [出力データセット、またはフィーチャクラス] に「Check_ins_Projected」と入力します。
  4. [出力座標系] で、[座標系の選択] ボタンをクリックします。

    座標系の選択ボタン

  5. [座標系] ウィンドウの検索ボックスに「San Francisco」と入力して、Enter キーを押します。
  6. [投影座標系][米国郡座標系] を展開します。 [NAD 1983 (2011) San Francisco CS13 (US Feet)] をクリックします。

    新しい座標系が選択された [座標系] ウィンドウ

  7. [OK] をクリックします。 [ジオプロセシング] ウィンドウで [実行] をクリックします。

    [Bay Area Gowalla Check-ins] という出力レイヤーがマップに追加されます。

  8. [コンテンツ] ウィンドウで、2 番目の [Bay Area Gowalla Check-ins] レイヤー (元のレイヤー) を右クリックして [削除] を選択します。

    元のチェックイン レイヤーの [削除] オプション

    レイヤーが削除されます。 レイヤーを投影変換しましたが、マップの外観は変わっていません。 マップは依然として元の投影座標系を使用しており、米国全体に焦点を当てています (つまり、米国の端にあるカリフォルニアが多少歪んでいます)。 マップの投影法を更新します。

  9. [コンテンツ] ウィンドウで、[マップ] をダブルクリックします。

    [マップ プロパティ] ウィンドウが表示されます。

  10. [マップ プロパティ] ウィンドウで、[座標系] をクリックします。 「San Francisco」を検索します。 [米国郡座標系] を展開し、[NAD 1983 (2011) San Francisco CS13 (US Feet)] 座標系を選択します。
  11. [OK] をクリックします。

    マップが変更され、選択した座標系を使用するようになります。

    異なる座標系で更新されたマップ

チェックインの集約

サンフランシスコ ベイ エリアのほとんどすべての居住域がチェックイン ポイントで覆われているため、マップを見て人気のあるエリアを特定することは困難です。 より有意義な洞察を得るため、各エリアのチェックインの数を数えます。 サンフランシスコ ベイ エリアをカバーする六角形ビンのグリッドを作成し、そのグリッドを使用してチェックインを集約します。 その後、結果のレイヤーをシンボル表示して、チェックインが最も多いエリアを特定します。

  1. [ジオプロセシング] ウィンドウの [戻る] ボタンをクリックします。

    戻るボタン

  2. [テッセレーションの生成] ツールを検索し、開きます。

    このツールは、指定された範囲をカバーする正多角形ポリゴン フィーチャ (六角形、四角形、三角形など) のグリッドを作成します。

  3. [出力フィーチャクラス] に「Hexagon_Tessellation」と入力します。 [範囲] で、[Bay Area Gowalla Check-ins] を選択します。

    [テッセレーションの生成 (Generate Tessellation)] ツールの [範囲] パラメーター

  4. [サイズ] で「12」と入力して、[平方法定マイル] を選択します。 [空間参照] で、[NAD_1983_2011_San_Francisco_CS13_ftUS] が選択されていることを確認します。

    テッセレーションの生成ツールのパラメーター

  5. [実行] をクリックします。

    ツールが実行され、六角形グリッドがマップに追加されます (そのデフォルトのシンボルはランダムであるため、画像例とは異なる場合があります)。

    マップ上の六角形のテッセレーション

    次に、各六角形ビン内のチェックインの数を数えます。 チェックインが行われなかったエリアや、データが収集されなかったエリアには関心がないため、まず、少なくとも 1 つのチェックインと交差するビンを選択します。

    アクティブな選択を含むレイヤー (この六角形グリッドなど) に対してジオプロセシング ツールを実行すると、選択したフィーチャだけが解析に使用されます。 選択していないフィーチャは、解析で使用されません。

  6. リボンの [マップ] タブをクリックします。 [選択] グループで、[空間条件で選択] をクリックします。

    [空間条件で選択] ボタン

    [空間条件で選択] ウィンドウが表示されます。

  7. [空間検索] ウィンドウで次のパラメーターを入力します。
    • [入力フィーチャ][Hexagon_Tessellation] が選択されていることを確認します。
    • [リレーションシップ][交差する] が選択されていることを確認します。
    • [選択フィーチャ][Bay Area Gowalla Check-ins] を選択します。

    空間検索ツールのパラメーター

  8. [OK] をクリックします。 [コンテンツ] ウィンドウで、[Bay Area Gowalla Check-ins] をオフにします。

    マップ上で、少なくとも 1 つのチェックインと交差する六角形ビンが選択されています。

    選択されている六角形ビンを示すマップ

    次に、選択されている六角形にチェックイン フィーチャを結合します。 この結合では、各六角形内のチェックイン数を含む属性フィールドが、六角形グリッドに追加されます。

  9. [ジオプロセシング] ウィンドウの [戻る] ボタンをクリックします。 [空間結合 (Spatial Join)] ツールを検索し、開きます。
  10. [空間結合 (Spatial Join)] ツールで次のパラメーターを入力します。
    • [ターゲット フィーチャ] で、[Hexagon_Tessellation] を選択します。
    • [結合フィーチャ] で、[Bay Area Gowalla Check-ins] を選択します。
    • [出力フィーチャクラス] に「Check_in_Counts」と入力します。

    空間結合ツールのパラメーター

  11. [実行] をクリックします。

    ツールが実行され、選択されている六角形ビンのみを含む新しいレイヤーがマップに追加されます。 レイヤーの属性フィールドに、各ビンのチェックイン数が含まれています。 この数をマップ上で視覚化するため、レイヤーのシンボルを変更します。

  12. [コンテンツ] ウィンドウで、[Hexagon_Tessellation] を右クリックして [削除] を選択します。 [Bay Area Gowalla Check-ins] レイヤーをオフにします。
  13. [Check_in_Counts] を右クリックして [シンボル] をクリックします。

    [シンボル] ウィンドウが表示されます。

  14. [シンボル] ウィンドウの [プライマリ シンボル] で、[等級色] を選択します。
  15. [クラス] で、[10] を選択します。 [配色] で、[シアンから紫] を選択します。

    [シンボル] ウィンドウのパラメーター

    シンボル表示がマップに適用されます。

    シンボル表示された六角形ビンを含むマップ

    マップ上で、ピンクの六角形ビンには多数のチェックインが含まれ、青いビンには少数のチェックインが含まれています。 多くのチェックインを含むビンが、エリア内の最大の都市であるサンフランシスコとサン ノゼの周辺に集まっている傾向があります。

  16. [シンボル] ウィンドウを閉じます。 [クイック アクセス ツールバー][保存] ボタンをクリックします。

    クイック アクセス ツールバーの保存ボタン

    注意:

    現在の ArcGIS Pro のバージョンでこのプロジェクト ファイルを保存すると、これより前のバージョンでファイルを再び開けなくなることを警告するメッセージが表示される場合があります。 このメッセージが表示されたら、[はい] をクリックして続行します。

集約の有意性の定量化

集約されたチェックインは、いくつかのパターンを示しています。 しかし、これらのパターンは、統計的に有意でしょうか。あるいは、確率差異やサンプリング エラーによって生じた可能性があるでしょうか? それを確認するため、集約されたチェックインの統計的有意性を定量化します。 Global Moran's I 統計を使用して、結果のパターンがクラスター化しているか、分散しているか、ランダムであるかをテストします。

Global Moran's I は、属性の空間パターンを定量化します。 元のチェックイン データには、チェックインの密度の特定に使用できる属性がないため、統計を実行する前に、チェックインを集約する必要がありました。 六角形ビンには [Join_Count] フィールドがあり、Global Moran's I ではこのフィールドを定量化できます。

注意:

Global Moran's I の背後にある数学の詳細については、「空間的自己相関分析 (Spatial Autocorrelation (Morans I)) の詳細」をご参照ください。

  1. [ジオプロセシング] ウィンドウの [戻る] ボタンをクリックします。 [空間的自己相関分析 (Spatial Autocorrelation (Global Moran's I))] ツールを検索して開きます。
  2. [空間的自己相関分析 (Spatial Autocorrelation (Global Moran's I))] ツールの [入力フィーチャクラス][Check_in_Counts] を選択し、[入力フィールド][Join_Count] を選択します。
  3. [レポートの生成] をオンにします。

    空間的自己相関分析ツールのパラメーター

  4. [実行] をクリックします。

    ツールが実行されますが、マップにレイヤーが追加されません。 その代わり、レポート ファイルが作成されました。 ツールに関する情報を表示することで、このレポート ファイルへのパスを検出できます。

  5. [ジオプロセシング] ウィンドウの下部で、[詳細の表示] をクリックします。

    詳細の表示

    [空間的自己相関分析 (Spatial Autocorrelation (Global Moran's I))] ウィンドウが表示されます。 このウィンドウには、ツールの実行時間、ツールの実行に使用したパラメーター、および警告メッセージが一覧表示されています。

  6. [空間的自己相関分析 (Spatial Autocorrelation (Global Moran's I))] ウィンドウで [パラメーター] タブをクリックします。 [レポート ファイル] でレポート ファイルへのパスをクリックします。

    [パラメーター] タブの [レポート ファイル] のパス リンク

    レポート ファイルが新しいブラウザー タブに表示されます。

    レポート ファイル

    レポートには、Moran インデックス、Z スコア、および p 値が含まれています。 統計的有意性を特定するために、Z スコアはこれらの値の中で最も重要です。

    Z スコアは、値が平均値から離れている標準偏差の数を示します。 正の Z スコアは平均より上の値で、負の Z スコアは平均より下の値です。 この場合、計測されている値は、データセット内のフィーチャ間に存在する空間的自己相関の量です。

    ここでは、データの Z スコアが 7 を超えています。つまり、ランダムに分布しているデータの仮想的な集合と比較すると、このデータにはかなり多くの空間的自己相関が含まれています。 レポートには、釣鐘曲線の右端に Z スコアをプロットするチャートも含まれています。 このチャートは、データの分布に対する統計的有意性が存在すること、およびデータがクラスター化されていること (つまり、データ内の類似する値が近接していること) を示しています。

  7. レポートを閉じます。 ArcGIS Pro で、[空間的自己相関分析 (Spatial Autocorrelation (Global Moran's I))] ウィンドウを閉じます。

空間クラスターの検出

データを集約し、その統計的有意性を特定することで、チェックインはランダムに分布していないものの、クラスター化されていることが明らかにわかります。 次に、空間クラスター解析を実行して、人気の高いエリアを検出します。

  1. [ジオプロセシング] ウィンドウの [戻る] ボタンをクリックします。 [密度ベースのクラスター分析 (Density-based Clustering)] ツールを検索して開きます。

    このツールは、空間クラスタリングの 3 つの手法を提供します。各手法では、何が密集と見なされ、何が密集でないと見なされるかについての別々の定義が必要となります。 ツールを 3 回 (それぞれの手法について 1 回) 実行し、それぞれの利点と欠点を考察します。

    まず、指定距離手法 (DBSCAN とも呼ばれる) を使用します。これは、最も簡単な密度ベースのクラスター分析手法です。 この手法では、指定した距離内に指定した数のポイントを持つことで、密集が定義されます。 各ポイントで、そのポイントが、設定した検索距離内のフィーチャの最小数を満たすかどうかが確認されます。 ポイントがこの基準を満たす場合、そのポイントはクラスター化されたポイントとしてマークされます。 ツールを実行するには、フィーチャの最小数を定義する必要があります。 検索距離を定義することもできますが、検索距離を定義しない場合は、最適化された値が使用されます。

    クラスターごとのフィーチャの最小数は、データ、および解析したい問題によって異なります。 ベイ エリア内の人気のある場所を識別したいと思います。 場所を人気とする正確なチェックインの数はわかりませんが、ビジネスの状況に基づいて数を定義できます。 たとえば、ベイ エリアにナイト クラブを開きたいと思い、利益を挙げるために 1 日に少なくとも 500 人の顧客を必要とするチャージ料金を計画するとします。 この例では、クラスターごとのフィーチャの最小数を 500 に定義できます。 検索距離を約 0.1 マイル (街区のおおよそのサイズ) に設定できます。

  2. [密度ベースのクラスター分析 (Density-based Clustering)] ツールで次のパラメーターを入力します。
    • [入力ポイント フィーチャ] で、[Bay Area Gowalla Check-ins] を選択します。
    • [出力フィーチャ] に「DBSCAN_500」と入力します。
    • [クラスター分析方法] で、[指定距離 (DBSCAN)] を選択します。
    • [クラスターあたりの最小フィーチャ数] に「500」と入力します。
    • [検索距離] で「0.1」と入力して、[US Survey マイル] を選択します。

    DBSCAN 手法を使用した密度ベースのクラスター分析ツールのパラメーター

  3. [実行] をクリックします。

    ツールが実行され、結果レイヤーがマップに追加されます。

  4. [コンテンツ] ウィンドウで [Check_in_Counts] レイヤーをオフにします。

    DBSCAN の結果のレイヤーを表示するマップ

    マップ上で、色の付いたポイントはチェックイン ポイントの高密度のクラスターを表します。 グレーのポイントはノイズ、つまり密集の定義に合致しなかった場所を表します。

    凡例は、シンボルを理解する上での手掛かりになります。

    DBSCAN レイヤーの凡例

    密度ベースのクラスター分析では、データセット内の何百ものクラスターを検出できます。 各クラスターを別の色でシンボル表示するのではなく、8 つの個別の色が使用されます。 類似する色のクラスターが近接しないように結果が表示されるため、マップ上でクラスター間の区別が明確になります。 色はデータの属性に対応していません。

    マップ上で、クラスターは主にサンフランシスコとサウス ベイにあり、他の場所には数個のクラスターがあります。 ベースマップを変更して表示を拡大し、詳細を調べます。

  5. リボン上の [マップ] タブの [レイヤー] グループで、[ベースマップ] をクリックして [衛星画像ハイブリッド] を選択します。

    衛星画像ハイブリッド ベースマップ

  6. サンフランシスコを拡大します。

    サンフランシスコのクラスター

    サンフランシスコにはいくつかのクラスターが含まれ、その中でも北東には特に大きな青いクラスターがあります。 このクラスターは、サンフランシスコの中心街です。

  7. バークレーが見えるまで、湾を横切って北東に画面移動します。

    バークレーのクラスター

    バークレーには 1 つのクラスターが含まれており、それは市の中心部にあります。

  8. パロ アルトが見えるまで、湾の南に画面移動します。

    パロ アルトのクラスター

    パロ アルトとその周辺エリアには、いくつかのクラスターが含まれています。 スタンフォード ショッピング センター (オレンジ) とパロ アルトの中心街 (ピンク) が、クラスターとして検出されています。

  9. サン ノゼが見えるまで、南東に画面移動します。

    サン ノゼのクラスター

    サン ノゼはベイ エリアで最も人口の多い都市で、サンフランシスコよりも多くの人口を持ちます。 ただし、サンフランシスコよりも少ないクラスターを含んでいます。

  10. [コンテンツ] ウィンドウで、[Bay Area Gowalla Check-ins] を右クリックして [レイヤーにズーム] を選択します。

    マップ範囲が戻り、Bay Area 全体が表示されます。

    全体的に見て、サンフランシスコの外部にはごく少数のクラスターしかありません。 DBSCAN クラスター分析手法の制限の 1 つは、密集の特定に固定距離を使用することです (ツールを実行したとき、この距離を 0.1 マイルに設定しました)。選択した距離は、結果に大きく影響する可能性があります。 短い距離は、店舗や他の対象ポイントが近接しているサンフランシスコ中心街などのエリアに適しており、店舗が分散している郊外や農村地区には適していないことがあります。

    分析範囲には都市、郊外、農村地区が含まれるため、1 つの固定距離を使用すると最適な結果が提供されない可能性があります。 次に、自己調整手法 (HDBSCAN とも呼ばれる) を使用して、密度ベースのクラスター分析を実行します。

    HDBSCAN は、複数の検索距離でクラスターを検出し、DBSCAN を複数回実行した場合に似ています。 各検索距離で、さまざまな場所のさまざまなクラスターを検出します。 その後、DBSCAN では、これらのクラスターをマージして、すべてのクラスターが類似するポイント密度を持つ、より大きなクラスターを作成を試みます。 作成されるクラスターは、1 つの検索距離で定義されません。

  11. [密度ベースのクラスター分析 (Density-based Clustering)] ツール ウィンドウの [出力フィーチャ] で、「HDBSCAN_500」と入力します。 [クラスター分析方法] で、[自己調整 (HDBSCAN)] を選択します。

    HDBSCAN 手法を使用する密度ベースのクラスター分析ツールのパラメーター

    このツールでは、検索距離を必要としません。

  12. [実行] をクリックします。 ツールの実行が終了したら (10 分位かかることがあります)、[DBSCAN_500] レイヤーをオフにします。

    HDBSCAN の結果のレイヤーを表示するマップ

    DBSCAN 手法と比較すると、HDBSCAN 手法はより多くのクラスターを検出します。 クラスターがベイ エリアの至るところ (農村地区を含む) に表示され、これらのクラスターの一部は都市全体をカバーするのに十分な大きさです (サンタ ローザやヴァレーホのクラスターなど)。 これらの結果は、ベイ エリア内の人気のある場所をより多く示していますが、新しいビジネスを開始するための最適な場所を正確に示すのに十分ではない可能性があります。

    次に、3 つ目の空間クラスター分析手法であるマルチスケール (OPTICS とも呼ばれる) を使用します。

    OPTICS 手法は、データセット内の最初のフィーチャ (Order ID 0) と、それに最も近いフィーチャとの間の距離を記録します。 この距離は、到達可能性距離と呼ばれます。 その後、この手法では、最も近いフィーチャと、それに最も近いフィーチャとの間の到達可能性距離を記録します。 このプロセスは、データセット全体がカバーされるまで継続的に繰り返されます。 最も近いフィーチャは繰り返されません。つまり、あるフィーチャの最も近いフィーチャが以前のフィーチャの最も近いフィーチャでもあった場合は、代わりに次に近いフィーチャが使用されます。

    その後、OPTICS 手法では、すべての到達可能性距離をチャート化して、チャート内のピークと谷を検索します。 谷、つまり比較的短い到達可能性距離を持つフィーチャのグループは、近接しているポイントのクラスターです。 クラスター内のすべてのポイントがチャート化された後、次のポイント (クラスターに含まれない) は、比較的長い到達可能性距離を持ち、この距離はチャートのピークに対応しています。

    次の図は、到達可能性チャートの例と、対応するポイント クラスターを示しています。

    OPTICS クラスター分析手法を示す図

    この例では、青いポイントがすべて近接しているため、それらの間には短い到達可能性距離が存在します (赤いラインは、ポイントからポイントへの到達可能性距離を表します)。チャートでは、これらのポイントが青い谷に対応しています。 その後、最後の青いポイントとその次の最も近い一意のポイントの間に比較的長い距離があり、その距離はチャート上の到達可能性距離の急増に対応しています。

    緑の谷では、谷の両側の 2 つの大きなピークに比べて比較的小さなピークがあります。 OPTICS アルゴリズムのクラスター感度に応じて、この小さなピークが谷を 2 つに分割したり、谷の一部であると見なされたりします。

  13. [ジオプロセシング] ウィンドウの [出力フィーチャ] で、「OPTICS_500」と入力します。 [クラスター分析方法] で、[マルチスケール (OPTICS)] を選択します。

    HDBSCAN 手法を使用する密度ベースのクラスター分析ツールのパラメーター

    この手法では、検索距離が必要です。 デフォルトでは、検索距離は、以前に使用した距離である 0.1 マイルに設定されています。 この手法には、オプションのパラメーター [クラスター感度] もあります。 このパラメーターについては、後で詳細に説明します。 ここでは、空白のままにします。

  14. [実行] をクリックします。 ツールの実行が終了したら、[HDBSCAN_500] レイヤーをオフにします。
    ヒント:

    これで、マップにいくつかのレイヤーを追加しました。使用していないレイヤーの凡例を折りたたんで、追加したレイヤーを [コンテンツ] ウィンドウで見つけやすくすると便利かもしれません。 凡例を折りたたむには、レイヤー名の横にある矢印をクリックします。

    OPTICS の結果のレイヤーを表示するマップ

    このクラスター分析手法の結果は、DBSCAN 手法の結果に似ています。 OPTICS 手法は DBSCAN 手法に似ていますが、OPTICS 手法は、絶対的な距離ではなく、相対的なピークと谷に依存することで、さまざまな密度のクラスターを表します。

    この手法が何をピークおよび谷と見なすかは、そのクラスター感度に依存します。 クラスター感度を設定しなかったため、ツールはデータの統計的な広がりに基づいて、感度の値を使用しています。 ツールの詳細を表示して、使用された感度を確認します。

  15. [ジオプロセシング] ウィンドウの下部で、[詳細の表示] をクリックします。

    [密度ベースのクラスター分析 (Density-based Clustering)] ウィンドウが開き、使用したクラスター感度値に関する情報が表示されます。

    密度ベースのクラスター分析ツールのパラメーター

    ツールは、クラスター感度 28 を使用しました (感度の値は常に 0 ~ 100 の整数です)。別のクラスター感度でツールを再度実行し、結果がどのように変わるかを確認します。

  16. [密度ベースのクラスター分析 (Density-based Clustering)] ウィンドウを閉じます。 [密度ベースのクラスター分析 (Density-based Clustering)] ツール ウィンドウで、[出力フィーチャ] を「OPTICS_500_Sensitivity_0」に変更し、[クラスター感度] で「0」と入力します。

    [クラスター感度] が「0」に更新された [密度ベースのクラスター分析] ウィンドウ

  17. [実行] をクリックします。 ツールの実行が終了した後、[OPTICS_500] をオフにして、サンフランシスコにズームします。
    ヒント:

    生成されるクラスターを見やすくするために、[コンテンツ] ウィンドウで [Hybrid Reference Layer] をオフにします。

    感度 0 による OPTICS の結果

    この感度では、クラスターが比較的大きくなります。

  18. [密度ベースのクラスター分析 (Density-based Clustering)] ツール ウィンドウで、[出力フィーチャ] を「OPTICS_500_Sensitivity_100」に変更し、[クラスター感度] を「100」に変更します。 [実行] をクリックします。
  19. ツールの終了後、[OPTICS_500_Sensitivity_0] レイヤーをオフにします。

    感度が高い [OPTICS_500_Sensitivity_0] レイヤーはクラスターが小さくコンパクトになります。

    感度 100 による OPTICS の結果

    この課題では、高い感度を使用して、ビジネスを開始できる人気の場所を特定するほうが有用に思われます。 感度を低くすると、より広範な人気エリアの定義に役立つ可能性がありますが、感度を高くすると、多数のチェックインが発生している (言い換えると、人々が実際に訪れている) 場所が示されます。

  20. [OPTICS_500_Sensitivity_100] レイヤーをオフにして、[Bay Area Gowalla Check-ins] レイヤーをオンにし、データの全範囲にズームします。 ベースマップをもう一度 [地形図] に変更します。
  21. プロジェクトを保存します。

データを空間的に解析しました。 集約と空間クラスタリングを通じて、チェックインの密度が特に高い場所を特定し、具体的な目的に応じて解析結果を調整するいくつかの方法を学びました。

データにはまだ確認していない別のコンポーネント、時間があります。 次に、データを時間的に解析して、ベイ エリア内で人気の場所を特定します。


データの時間解析

データには、空間的と時間的の両方のコンポーネントがあります。 空間的傾向の解析は有用ですが、全体像を把握することはできません。 結局のところ、人気のある場所というのは、新しい店舗が頻繁に開店したり閉店したりする過密な都会の中心街では特に、時間経過に伴って変わることがあります。 人気を失っている場所ではなく、人気を得ている場所でビジネスを開始するほうがはるかによいでしょう。

時間フィールドの変換

[Check-in Time] フィールドには、チェックインが作成された日時が含まれています。 ただし、このフィールドには、ArcGIS Pro が自動的にタイム スタンプとして認識しない、連結されたテキスト文字列が含まれています。 このフィールドを時間解析に使用するために、認識されるデータ フィールド形式に変換します。

  1. 必要に応じて、ArcGIS Pro[Bay Area Popular Places] プロジェクトを開きます。
  2. [ジオプロセシング] ウィンドウで、[時間フィールドの変換 (Convert Time Field)] ツールを検索し、開きます。

    このツールは、日時の値をテキスト文字列から日付フィールドに変換します。

  3. [時間フィールドの変換 (Convert Time Field)] ツール ウィンドウの [入力テーブル][Bay Area Gowalla Check-ins] を選択します。 [入力時間フィールド] で、[Check-in Time] を選択します。

    次に、入力時間形式 (このフィールドが現在使用している形式) を設定します。 この形式は、さまざまな時間単位を表す文字 (年には y、時間には H など) を使用して記述されます。 このテーブルで使用されている形式は yyyy-MM-ddTHH:mm:ssZ で、T および Z は時間単位を反映しない定数です。

  4. [入力時間形式] で「yyyy-MM-ddTHH:mm:ssZ」と入力します。
    ヒント:

    このパラメーターを設定するには、この形式を入力するか、[形式の設定] ボタンをクリックして、形式のリストから選択します。 [Check-in Time] フィールドで使用されている形式がリストに表示されないため、今回は形式を入力する必要があります。

    時間フィールドの変換ツールのパラメーター

    その他のパラメーターはそのままにしておきます。

  5. [実行] をクリックします。

    ツールが実行されます。

  6. [コンテンツ] ウィンドウで、[Bay Area Gowalla Check-ins] を右クリックして [属性テーブル] をクリックします。

    テーブルの端に [Check_in_Time_Converted] フィールドが追加され、変換されたチェックイン時間が示されています。

    変換されたチェックイン時間のフィールド

  7. テーブルを閉じます。

時間データのチャート化

フィーチャクラスには、ArcGIS Pro が処理および解析できる時間データが含まれています。 次に、データ クロックを作成します。 データ クロックは、時間データを集約するタイプのチャートです。 このチャートを使用して、人々がチェックインした時間のパターンを検出します。

  1. [コンテンツ] ウィンドウで、[Bay Area Gowalla Check-ins] を右クリックして [チャートの作成] をポイントし、[データ クロック] を選択します。

    チャートのリスト内の [データ クロック] チャート タイプ

    [Bay Area Gowalla Check-ins - データ クロック 1] ビューと [チャート プロパティ] ウィンドウが表示されます。 チャートを作成するために、このウィンドウでパラメーターを変更します。 チェックインの総数を年および月ごとに視覚化するチャートを作成します。

  2. [チャート プロパティ] ウィンドウの [日付] で、[Check_in_Time_Converted] を選択します。 [リング][年][扇型][月][集約][個数] に設定されていること確認します。

    [チャート プロパティ] ウィンドウの [日付] 変数

    データ クロックが作成されます。

    デフォルトのデータ クロック チャート

    このデータ クロックでは、各同心円 (リング) が年を表し、各円セグメント (扇型) が月を表します。 各扇型の色は、その月に行われたチェックインの総数を表し、青色が濃いほどチェックインが多いことを意味します。 グレーの扇形にはデータが存在しません。

    データ クロックには、2009 と 2010 という 2 つのリングがあります。 チェックイン データが最初に収集されたのは 2009 年 3 月で、最後に収集されたのは 2010 年 10 月です。 2009 年下旬までは、Gowalla サービスがユーザーを獲得中だったため、少数のチェックインしかありませんでした。 チェックインが最も多い月は、2010 年 3 月、4 月、8 月、9 月です。

  3. [チャート プロパティ] ウィンドウの [リング] で、[週] を選択します。 [扇型] で、[曜日] を選択します。

    データ クロックが更新されます。

    週と曜日を示すデータ クロック チャート

    このデータ クロックにはかなり多くのリングが含まれていますが、各リングには 7 つの扇型 (曜日ごとに 1 つ) しかありません。 このデータ クロックによると、週末 (土曜日と日曜日) にチェックインの数が最も多くなっています。 このパターンは理にかなっています。ほとんどの人は週末に働く必要がないため、余暇の時間が多くなって各地を訪問します。

    開始予定のビジネスのタイプによっては、チェックインが行われた時刻も興味深いデータになるでしょう。 1 年分の毎時のデータを視覚化するのは難しいため、データのサブセットのみを含むフィーチャクラスを作成し、そのチャートを作成します。

  4. [チャート プロパティ] ウィンドウで、[リング][年][扇型][月] に変更します。 データ クロックで、Ctrl キーを押しながら 2010 年 8 月と 2010 年 9 月の扇型をクリックして選択します。

    2010 年 8 月と 9 月の扇型が選択されたデータ クロック

    ヒント:

    複数の扇型を選択するもう 1 つの方法は、それらの扇型の周りにボックスを描画することです。

    選択した日付に行われたすべてのチェックインが、マップでも選択されます。

    マップ上の選択済みチェックイン

    ArcGIS Pro では、データセットに対して実行するジオプロセシング ツールはどれも、選択したフィーチャに対してのみ実行されます。 次に、選択したフィーチャを新しいデータセットにコピーします。

  5. [ジオプロセシング] ウィンドウを開き、[戻る] ボタンをクリックします。 [フィーチャのコピー] ツールを検索し、開きます。
  6. [フィーチャのコピー (Copy Features)] ツール ウィンドウの [入力フィーチャ][Bay Area Gowalla Check-ins] を選択します。 [出力フィーチャクラス] に「Check_ins_Aug_Sep_2010」と入力します。

    [フィーチャのコピー (Copy Features)] ツールのパラメーター

  7. [実行] をクリックします。

    コピーしたフィーチャクラスがマップに追加されます。

  8. [コンテンツ] ウィンドウで、[Check_ins_Aug_Sep_2010] を右クリックして [チャートの作成] をポイントし、[データ クロック] を選択します。

    新しいデータ クロックが作成されます。

  9. [チャート プロパティ] ウィンドウの [日付] で、[Check_in_Time_Converted] を選択します。 [リング][日] を選択し、[扇型][時間] を選択します。

    データ クロックが自動的に更新され、24 個の扇型 (1 日の時刻ごとに 1 つ) が表示されます。

    日と時間を示すデータ クロック チャート

    ビジネス アワー中の早い時間帯にチェックインした人はごくわずかで、午前 6 時~午後 2 時には特に少なくなっています。 午後 7 時~午後 9 時と午前 1 時~午前 2 時に最も多くのチェックインが行われていました。これらの傾向は、夜間にレストランに、または深夜にナイト クラブに顧客が多く流入していることを示している可能性があります。

  10. [Counts of Check_in_Time_Converted by Hours over Days] データ クロックを閉じます。 [コンテンツ] ウィンドウで、[Check_ins_Aug_Sep_2010] を右クリックして [削除] を選択します。

    これより後の解析では、2009 年 12 月~2010 年 9 月 (チェックインが最も多かった 10 か月) のチェックイン データのみを使用します。 今後の解析でデータのこのようなサブセットを使用すると、このソーシャル メディア アプリがまだユーザーを獲得中であったときのレコードが削除されます。 このアプリがあまり使用されていなかったこのような期間によって、結果に狂いが生じる可能性があります。

  11. [Counts of Check_in_Time_Converted by Months over Years] データ クロックで、Ctrl キーを押しながら 2009 年 12 月から 2010 年 9 月までの月を選択します。

    2009 年 12 月から 2010 年 9 月までの月が選択されたデータ クロック

  12. データ クロックを閉じます。 プロジェクトを保存します。

時空間キューブによる傾向の解析

作成したチャートは、データセット全体にわたるチェックイン数の傾向を理解するために役立ちました。 しかし、時間的傾向と空間的傾向の両方を解析したい場合は、どうすればいいでしょうか? どの近隣地域に最も多くのチェックインがありますか? 時間経過に伴って、特定の近隣地域に人気が出てきたり、人気が衰えたりしていますか? 新しいビジネスを開始する場所を決定する際、これらの質問に回答することが極めて重要になることがあります。

データの空間エレメントと時間エレメントをまとめて解析するには、時空間データ構造 (空間と時間の両方に対応するデータ構造) を作成する必要があります。 このデータ構造では、固定のエリアと固定の時間増分によってチェックイン ポイントを集約します。

[時空間キューブの作成 (Create Space Time Cube)] ツールを使用して、データの時空間データ構造を定義します。 結果のデータセットは、キューブと考えることができます。これは、そのデータセットが 3 次元を持つためです (エリアに対して 2 つ (x と y)、時間に対してもう 1 つ (t))。

  1. [ジオプロセシング] ウィンドウの [戻る] ボタンをクリックします。 「時空間キューブの作成」を検索します。

    この検索によって、「時空間キューブの作成」に対する 3 つの結果が返されます。

    「時空間キューブの作成」の検索結果

    選択するツールは、データによって異なります。 チェックイン データは空間全体にわたるさまざまなポイント位置から取得されているため、ポイントを集約したいと思います。 データが固定されたジオグラフィ (交通カメラや料金所など) を持つ駅や他の場所に依存している場合は、定義された場所から時空間キューブを作成します。 データが多次元ラスター レイヤーから取得された場合は、それに該当するツールを選択します。

  2. [ポイントの集約による時空間キューブの作成 (Create Space Time Cube By Aggregating Points)] をクリックします。
  3. [入力フィーチャ] で、[Bay Area Gowalla Check-ins] を選択します。 [出力時空間キューブ] に「Check_ins_STC」と入力します。

    出力名を入力すると、.nc 拡張子が末尾に自動的に追加されます。 この拡張子は netCDF を表します。これは、時空間キューブに使用されるファイル タイプです。

  4. [時間フィールド] で、[Check_in_Time_Converted] を選択します。

    [時空間キューブの作成 (Create Space Time Cube)] ツールの入力パラメーターと出力パラメーター

    次に、ポイントを集約する時間間隔、つまり時間ビンを選択します。 時間ビンの間隔は、解析に関連する時間スケールに適合している必要があります。 近隣地域の人気に長期的な傾向があるかどうかを知りたいため、1 時間ごとのビンも 1 日ごとのビンも役に立ちません。 その代わりに、1 か月間隔を使用します (1 日の特定の時間帯に活動が高まるビジネス (コーヒー ショップなど) を開始する計画を立てた場合は、その時間帯に人気が高まる場所を確認するために、1 時間ごとのビンのほうに関心があるかもしれません)。

  5. [時間ステップの間隔] で「1」と入力して、[月] を選択します。

    空間集約のエリアの形状も選択します。 六角形の集約エリアを使用します。これは、利用可能な形状のうち、六角形が最も多くの空間近傍 (6) を持っているためです。 さらに、六角形グリッドでは、すべての近傍六角形が一定の距離だけ離れています。 後で、距離によって時空間近傍を定義するため、六角形はフィッシュネット (四角形) グリッドよりもメリットがあります。フィッシュネット (四角形) グリッドでは、一部の近傍が他の近傍よりも離れてしまいます。

    四角形グリッドと六角形グリッドの近傍を示す図

    これらの六角形を 1 マイルの幅になるように設定します。

  6. [集約形状タイプ][六角形グリッド] を選択します。 [距離間隔] に「1」と入力して、[US Survey マイル] を選択します。

    [時空間キューブの作成 (Create Space Time Cube)] ツールの時間間隔と距離間隔のパラメーター

  7. [実行] をクリックします。

    ツールが実行され、時空間キューブ ファイルが作成されます。 出力はマップに追加されません。 時空間キューブを視覚化するために、別のツールを実行します。

  8. [戻る] ボタンをクリックします。 [時空間キューブを 2D で視覚化 (Visualize Space Time Cube in 2D)] ツールを検索し、開きます。

    このツールは、.nc ファイルに基づいて 2D レイヤーを作成します。

  9. [時空間キューブを 2D で視覚化 (Visualize Space Time Cube in 2D)] ツールの [入力時空間キューブ][参照] ボタンをクリックします。

    参照ボタン

  10. [入力時空間キューブ] ウィンドウで、[p20] フォルダーを開きます。 [Check_ins_STC.nc] をダブルクリックします。
  11. 次のパラメーターを変更します。
    • [キューブの変数][COUNT] を選択します。
    • [表示テーマ][傾向] を選択します。
    • [時系列ポップアップの有効化] をオンにします。
    • [出力フィーチャ] に「Check_ins_STC_2D」と入力します。

    [時空間キューブを 2D で視覚化 (Visualize Space Time Cube in 2D)] ツールのパラメーター

    これらのパラメーターは、1 か月ごとのチェックイン数の傾向をマッピングします。 時系列ポップアップを有効にすることで、時間経過に伴う数を示す各ビンの時系列を表示できます。

  12. [実行] をクリックします。

    ツールが実行され、レイヤーがマップに追加されます。

  13. [コンテンツ] ウィンドウで [Bay Area Gowalla Check-ins] レイヤーをオフにします。 マップでサンフランシスコにズームし、紫の六角形ビンをクリックします。

    時系列ポップアップ

    ポップアップには、その場所での時間経過に伴うチェックイン数を示す時系列チャートが含まれています。 時間経過に伴っていくらか減少があることもありますが、通常、紫のビンには強い増加傾向があります。

    時系列チャートの縦軸上の数値は、チェックインの数を示します。 画像例の六角形は、月ごとに約 160 のチェックインから約 360 になっています。

  14. 緑の六角形をクリックします。

    下降傾向の六角形の時系列チャート

    緑の六角形は、下降傾向が検出されたものです。 これらの六角形の多くは、全体的に少ないチェックイン数を持ちます。 画像例では、このエリアのチェックイン数が、最大値 900 超から、最小値 600 未満にまで減少しています。 減少傾向にありますが、このエリアの最小値でさえ、増加傾向にあったエリアの最大値よりも大きな数値です。

    白い六角形は、上昇傾向も下降傾向も検出されなかったエリアです。 これらの六角形では、毎月のチェックイン数が安定しているか、ひどく不安定かのいずれかです。

  15. ポップアップを閉じ、データの全範囲に戻ります。

    データを空間的に解析したときに、サンフランシスコの中心街が最も人気のあるエリアであることがわかりました。 しかし、サンフランシスコの中心街の多くの部分は、人気において上昇傾向も下降傾向も示していません。 これに対し、サン ノゼやイースト ベイのエリアは人気が上昇しています。 これらのエリアは、ビジネスを開始する場所として検討する価値があるかもしれません。

    次に、時空間キューブを 3D で視覚化します。これにより、マップ上で時間の変化を確認しやすくなります。 (時間は、時空間キューブにおける 3 つ目の次元です)。まず、新しいシーンを挿入します。

  16. リボンの [挿入] タブの [プロジェクト] グループで、[新しいマップ] ドロップダウン矢印をクリックし、[新しいローカル シーン] を選択します。

    新しいローカル シーン オプション

    シーン ビューがプロジェクトに追加されます。

  17. [ジオプロセシング] ウィンドウの [戻る] ボタンをクリックします。 [時空間キューブを 3D で視覚化] ツールを検索し、開きます。
  18. [時空間キューブを 3D で視覚化 (Visualize Space Time Cube in 3D)] ツールで、次のパラメーターを変更します。
    • [入力時空間キューブ][Check_ins_STC.nc] ファイルを参照します。
    • [キューブの変数][COUNT] を選択します。
    • [表示テーマ][値] を選択します。
    • [出力フィーチャ] に「Check_ins_STC_3D」と入力します。

    時空間キューブを 3D で視覚化ツールのパラメーター

  19. [実行] をクリックします。

    ツールが実行され、結果のレイヤーがシーンに追加されます。

  20. シーンの画面移動、ズーム、傾けを行って、結果を確認します。
    ヒント:

    傾けるには、V キーを押しながらマップをドラッグします。 画面移動するには、C キーを押しながらマップをドラッグします。

    時空間キューブの 3D での視覚化

    この視覚化では、各六角形ビンが、セグメントで構成される高さを持ち、各セグメントが別の月に対応しています。 各セグメントの色は、その月におけるそのエリアのチェックイン数を示します。

    2D の視覚化とは異なり、各セグメントは、増加傾向や減少傾向によってではなく、チェックインの総数によってシンボル表示されています。 空間解析で確認したように、サンフランシスコの中心街は、人気を得ているエリアではないとしても、最も多くのチェックイン数を持っています。 他の場所のほとんどのビンは、チェックインがごくわずかで、白でシンボル表示されています。

  21. プロジェクトを保存します。

時間クラスターの検出

次に、時空間キューブでチェックインの時間クラスターを検出します。 時間クラスタリングは、フィーチャが密に集まっている場所を識別するという点で、空間クラスタリングに似ています。 唯一の相違点は、時間クラスタリングは、空間的な近接性ではなく、時間的な近接性によってクラスターをグループ化することです。

  1. シーンの上で、[マップ] タブをクリックします。

    [マップ] ビューのタブ

    [マップ] ビューに戻ります。

  2. [ジオプロセシング] ウィンドウの [戻る] ボタンをクリックします。 [時系列クラスタリング (Time Series Clustering)] ツールを検索し、開きます。
  3. [時系列クラスター分析 (Time Series Clustering)] ツールの [入力時空間キューブ] で、[Check_ins_STC.nc] を参照して選択します。 [分析変数][COUNT] を選択し、[出力フィーチャ] に「Check_ins_Monthly_Time_Clusters」と入力します。

    また、3 つの対象特性のいずれかで、データをクラスター化できます。 他の特性については、後で説明します。ここでは、時間経過に伴う類似する値がある場所が一緒にクラスター化されるようにします。

  4. [対象特性] で、[値] を選択します。

    ツールによって作成されるクラスターの数を設定することもできます。 変更しないと、ツールは、データに基づいて最適な数を使用します。 高い人気、中程度の人気、低い人気のグループに対応する 3 つのクラスターを作成します。

  5. [クラスター数] に「3」と入力します。 [時系列ポップアップの有効化] をオンにします。

    結果をチャート化できるように、出力テーブルも作成します。

  6. [出力チャート テーブル] に「Clustering_Tables」と入力します。

    [時系列クラスタリング (Time Series Clustering)] ツールのパラメーター

  7. [実行] をクリックします。 ツールの終了後、[Check_ins_STC_2D] レイヤーをオフにします。

    クラスター レイヤーがマップに表示されます。

    時間クラスターを示すマップ

    六角形ビンは、青、赤、緑の 3 つのグループに分かれています。 これらのクラスターが何を意味するかを理解するために、ツールで作成したチャートを開きます。

  8. [コンテンツ] ウィンドウの [スタンドアロン テーブル] の下で、[クラスターあたりの平均時系列] をダブルクリックします (これを表示するには、スクロールする必要がある場合があります)。

    [クラスターあたりの平均時系列] チャート オプション

    チャートが開きます。

    クラスターあたりの平均時系列を示すチャート

    注意:

    各ビンに割り当てられる色はランダムに割り当てられ、サンプル画像と実際の画面で色が異なる場合があります。 色に関係なく、数は同じでデータが伝える情報も同じです。

    上の [Average Time Series per Cluster] チャートの青い六角形は、これまでにごくわずかのチェックインしかない場所です (これらすべての六角形には少なくとも 1 つのチェックインがあり、チェックインがないものは含まれていません)。緑の六角形はチェックインが多い場所です。ただし、チェックイン数は多いものの、月ごとにチェックイン数が大きく変動しています。 マップ上で、緑の六角形が 1 つだけ識別されました (サンフランシスコの中心街)。 これらの変動は、観光旅行の季節的変動が原因である可能性があります。 赤のクラスターには中心街が含まれており、これらの場所には地元の人がよく訪れることがあるため、年間を通じて人気が比較的安定しています。

  9. マップでサンフランシスコの中心街をズームし、緑の六角形をクリックします。
    注意:

    画面上で六角形の色が異なる場合があります。 周囲と色が異なる六角形をクリックします。

    サンフランシスコの緑の六角形

    ポップアップに、その場所の時系列チャートが表示されます。 緑の点線は、緑のクラスター内の六角形の平均チェックイン数を示しています。

  10. ポップアップとチャートを閉じます。

    時間経過に伴う類似するチェックイン数がある場所のクラスターを識別しました。 時間的傾向が類似するエリアのクラスターを識別することもできます。 たとえば、観光旅行の季節的変動が原因で、2 つのエリアの時間経過に伴うチェックイン数の増減が類似しているとします。 ただし、これらのエリアの 1 つは、もう 1 つのエリアよりもチェックインの総数がかなり多くなっています。 値に基づいてクラスター化すると、これらのエリアは一緒にクラスター化されません。 ただし、プロファイルに基づいてクラスター化すると、一緒にクラスター化されます。

    プロファイルによる場所のクラスター化は、特定の季節的な人出をターゲットにしようとするビジネスに役立ちます。 プロファイル クラスタリングは、2 つの手法のいずれかで実行できます。 フーリエ ファミリーに基づく時系列のクラスター分析手法を使用します。 フーリエ手法は、年間を通じて人気がさまざまに変動するエリアを識別します。

  11. [時系列クラスタリング (Time Series Clustering)] ツールで、[出力フィーチャ] に「Check_ins_Monthly_Time_Clusters_Fourier」と入力します。 [対象特性] で、[プロファイル (フーリエ)] を選択します。

    ツールを実行する際、時系列の特定の特性を無視できます。 [範囲] 特性 (この場合は、チェックインの数) を無視します。 このようにして、チェックインの絶対数に関係なく、人気の傾向が類似する場所を識別します。 作成するクラスターの最適な数がツールによって決定されるようにすることもできます。

  12. [無視する時系列特性] で、[範囲] をオンにします。 [クラスター数] に「3」と入力します。
  13. [時系列ポップアップの有効化] をオンにします。
  14. [出力チャート テーブル] に「Clustering_Tables_Fourier」と入力します。

    フーリエ手法を使用する [時系列クラスタリング (Time Series Clustering)] ツールのパラメーター

  15. [実行] をクリックします。 ツールの実行が終了したら、[Check_ins_Monthly_Time_Clusters] レイヤーをオフにします。

    クラスター レイヤーがマップに表示されます。

    フーリエ手法の結果を示すマップ

    プロファイル (フーリエ) を使用する際は各色のさらに多くの六角形があります。

  16. [コンテンツ] ウィンドウの [Clustering_Tables_Fourier] の下で、[クラスターあたりの平均時系列] をダブルクリックします。

    フーリエ手法の結果を示すチャート

    このチャートでは、特に春に比較的多くのチェックインがある六角形に赤が対応します。 青は 1 年を通じて比較的チェックインの少ない六角形に対応し、緑はチェックインが増えている六角形に対応します。 各クラスター タイプがベイ エリアの至るところで検出でき、通常多くのチェックインがあるエリア (サンフランシスコの中心街など) とは関連していません。

  17. チャートを閉じてプロジェクトを保存します。

データの時間的傾向を解析し、時間経過に伴って人気が高まっている場所、および人気の季節的な周期を持つ場所を検出しました。 データを完全に理解し、新しいビジネスを開始する場所についての十分な情報に基づく意思決定を可能にすることに向けて、一歩前進しました。


解析の完了

このチュートリアルの中で、データを空間的および時間的に解析しました。 どの統計手法を選択してデータ内のクラスターを検出するかに応じて、結果が大きく変わる可能性があります。 次に、結果を結合して、ビジネスを開始する場所を決定します。

空間的かつ時間的なホット スポットの検出

最後の解析では、データを空間的かつ時間的に調べます。 [時空間ホット スポット分析 (EHSA)] ツールを使用して、時空間キューブのパターンを 17 のカテゴリのいずれかに分類します。

時系列クラスタリングとは異なり、EHSA は、時空間キューブのビンの近傍にグローバル平均よりもかなり多い (ホット スポット) またはかなり少ない (コールド スポット) チェックイン数が含まれているかどうかを確認します。 時空間キューブ内の各場所がホット スポット、コールド スポット、またはどちらでもないと指定された後、EHSA は、時間経過に伴う各場所の Z スコアの変動を調べ、その場所が連続性のある、増大している、減衰している、または散発性のあるホット スポットあるいはコールド スポットであるかどうかを確認します。

最終結果では、データの空間的かつ時間的な変動が考慮されます。

  1. 必要に応じて、ArcGIS Pro[Bay Area Popular Places] マップを開きます。
  2. [ジオプロセシング] ウィンドウで、[時空間ホット スポット分析 (Emerging Hot Spot Analysis)] ツールを検索して開きます。 次のパラメーターを入力します。
    • [入力時空間キューブ] で、[Check_ins_STC.nc] を参照して選択します。
    • [分析変数][COUNT] を選択します。
    • [出力フィーチャ] に「Check_ins_Emerging_Hot_Spots」と入力します。
    • [近傍距離] で「1」と入力し、[マイル] を選択します。

    時空間ホット スポット分析ツールのパラメーター

    EHSA は、各場所で 1 マイル以内のあらゆる近傍を調べて、その解析を実行します。 以前に六角形グリッドで時空間キューブを作成しました。各六角形が等距離であるため、これは近傍解析に最適です。

  3. [実行] をクリックします。 ツールが終了したら、[Check_ins_Monthly_Time_Clusters_Fourier] レイヤーをオフにします。

    マップ上の時空間ホット スポット

    ホット スポットは、サンフランシスコの中心街と、湾の南のいくつかの小さな都市 (パロ アルト、マウンテン ビュー、サン ノゼなど) にあります。 サンフランシスコの中心街のほとんどのホット スポットは、持続性のあるホット スポットです。つまり、時間が経過しても一貫してホット スポットであり続けています。 その他のエリアは、ほとんどが新規のホット スポット (時系列の終わりのみホット スポット) または散発性のあるホット スポット (ホット スポットであったり、なかったりしているエリア) です。

    時系列クラスタリングで人気が高いクラスターおよび中程度のクラスターであると特徴付けられたエリアが、連続性のあるホット スポットとして表示されていることに注意してください。 これは、これらのエリアの付近が、ほとんどの時間ステップで、ベイ エリアの平均チェックイン数を上回っていることを意味します。 言い換えると、これらのエリアは、時空間キューブのほとんどの時間ステップで、ベイ エリアの残りの部分よりも人気があったことになります。 サンフランシスコとは異なり、これらのエリアは時間経過に伴って人気が高まっているようです。

    結果を 3D で視覚化することもできます。

  4. [コンテンツ] ウィンドウで、[Check_ins_Emerging_Hot_Spots] レイヤーを右クリックして [コピー] を選択します。 マップの上で、[シーン] タブをクリックしてシーンに戻ります。
  5. [コンテンツ] ウィンドウで、[シーン] を右クリックして [貼り付け] を選択します。

    ホット スポット レイヤーがシーンに表示されます。

    シーンの新たなホット スポット結果

    時空間キューブに対して EHSA を実行したので、解析結果に基づいて視覚化できます。

  6. [ジオプロセシング] ウィンドウの [戻る] ボタンをクリックします。 [時空間キューブを 3D で視覚化 (Visualize Space Time Cube in 3D)] ツールを検索して開き、次のパラメーターを入力します。
    • [入力時空間キューブ] で、[Check_ins_STC.nc] を参照して選択します。
    • [キューブの変数][COUNT] を選択します。
    • [表示テーマ][ホット/コールド スポットの結果] を選択します。
    • [出力フィーチャ] に「Check_ins_STC_Hot_Spots」と入力します。
  7. [実行] をクリックします。
  8. [Check_ins_STC_3D] レイヤーをオフにします。 シーンを確認します。

    シーン上の時空間ホット スポット

    新規のホット スポットと見なされているエリアでは、最新の月 (カラムの一番上の六角形ビン) のみがホット スポットと見なされています。 散発性のあるホット スポットは、ホット スポットであったり、なかったりを繰り返しています。 サンフランシスコの中心街のエリアは、毎月ホット スポットであるため、持続性のあるホット スポットになっています。

  9. [マップ] タブをクリックして [マップ] ビューに戻ります。

    EHSA を実行したとき、近傍距離として 1 マイルを選択しました。 近傍距離を変更すると、結果も変わります。

  10. [ジオプロセシング] ウィンドウの [戻る] ボタンをクリックします。 [時空間ホット スポット分析 (Emerging Hot Spot Analysis)] ツールを検索して開き、次のパラメーターを入力します。
    • [入力時空間キューブ] で、[Check_ins_STC.nc] を参照して選択します。
    • [分析変数][COUNT] を選択します。
    • [出力フィーチャ] に「Check_ins_Emerging_Hot_Spots_5mi」と入力します。
    • [近傍距離] で「5」と入力して、[US Survey マイル] を選択します。
  11. [実行] をクリックします。 ツールの実行が終了したら、[Check_ins_Emerging_Hot_Spots] レイヤーをオフにします。

    5 マイルの近傍によるホット スポットを示すマップ

    大きな近傍サイズを使用すると、ホット スポットと見なされるエリアも大きくなります。

ビジネスを開始する場所の決定

次に、新しいビジネスを開始するための最適な場所を決定します。 これを行うために、空間クラスター、時間クラスター、および時空間ホット スポットをオーバーレイします。 これらのレイヤーの結合方法の基準は、何をビジネスの最適な条件と見なすかによって異なります。

まず、チェックインの密度が高い空間クラスターを持つエリアを選択します。 これらのエリアは人出が多いため、新しいビジネスに適しています。 3 つの異なる手法 DBSCAN、HDBSCAN、OPTICS を使用して、空間クラスター解析を実行しました。 3 つの手法のうち、HDBSCAN が分析範囲に最も適していました。これは、この手法では、ベイ エリアの都市部、郊外、農村部の間の人口の違いが考慮されたためです。

  1. リボン上の [マップ] タブの [選択] グループで [属性条件で選択] をクリックします。

    クラスター解析を実行した際、結果のレイヤーには [Cluster ID] 属性フィールドが含まれていました。 このフィールドでは、-1 という値を持つフィーチャは、クラスターではありませんでした。 クラスターであったすべてのエリアを選択します。

  2. [属性条件で選択] ウィンドウの [入力テーブル][HDBSCAN_500] を選択します。 [式] で、式 [Cluster ID が -1 と等しくない] を作成します。

    項目パラメーター

  3. [適用] をクリックします。 [Check_ins_Emerging_Hot_Spots_5mi] レイヤーをオフにして、[HDBSCAN_500] レイヤーをオンにします。

    クラスターとして示されたすべてのエリアが選択されています。

    選択したクラスター

    次に、実行した項目を削除し、新規の、連続性のある、または持続性のあるホット スポットの場所を選択します。

  4. [属性検索 (Select Layer By Attribute)] ツールで [項目の削除] をクリックします。

    [項目の削除] ボタン

  5. [入力テーブル][Check_ins_Emerging_Hot_Spots] を選択します。
  6. [Where 句 Pattern Type COUNT は値 Consecutive Hot Spot、New Hot Spot、Persistent Hot Spot を含む] を作成します。

    EHSA レイヤー内のホット スポットを選択するためのパラメーター

  7. [適用] をクリックします。 [HDBSCAN_500] レイヤーをオフにして、[Check_ins_Emerging_Hot_Spots] レイヤーをオンにします。

    ホット スポットが選択されています。

    マップ上の選択されたホット スポット

    次に、特定の季節に人出の増加が見られる月次の時間クラスターを選択します。 開始予定のビジネスの種類に応じて、どの季節に人出が増加するエリアが最適であるかが異なる場合があります。 この演習では、夏に人出が増加するエリアを選択します。

  8. [属性検索 (Select Layer By Attribute)] ツールで、式を削除します。 [入力テーブル] で、[Check_ins_Monthly_Time_Clusters_Fourier] を選択します。

    このレイヤーでは、夏の間の高い交通量パターンに対応する時間クラスターは緑のクラスターで、3 という ID を持っています。

  9. [Time-Series Cluster ID が 3 と等しい] を作成します。

    夏に人気が高まるエリアを選択するためのパラメーター

  10. [OK] をクリックします。 [Check_ins_Emerging_Hot_Spots] レイヤーをオフにして、[Check_ins_Monthly_Time_Clusters_Fourier] レイヤーをオンにします。

    選択したクラスター

    3 つの条件に基づいて、エリアを選択しました。 次に、3 つすべてのレイヤーで選択されている (つまり、3 つすべての条件を満たす) 六角形ビンのみを含むレイヤーを作成します。ビジネスの特定のニーズに応じて、条件を調整したり、追加したり、削除したりできます。 この演習では、3 つの条件で十分です。

  11. [ジオプロセシング] ウィンドウの [戻る] ボタンをクリックします。 [インターセクト (Intersect)] ツールを検索して開きます。
    注意:

    ArcGIS Pro のバージョンによっては、強化された機能を利用するために [ペアワイズ インターセクト (Pairwise Intersect)] ツールを使用するよう促すメッセージが表示される場合があります。 この場合、ツールは最大で 2 つの入力を取りますが、実際には 3 つの入力があるため、このツールを使用できません。

  12. [入力フィーチャ] で、[HDBSCAN_500] を選択します。 次の行で [Check_ins_Emerging_Hot_Spots] を選択し、その次の行で [Check_ins_Monthly_Time_Clusters_Fourier] を選択します。
    注意:

    3 つ以上の入力フィーチャを選択するには、ArcGIS Pro の Advanced ライセンスを持っている必要があります。

    各入力フィーチャの下にメッセージが表示されます。これは、これらのレイヤーにアクティブな選択があることを説明しています。

  13. [出力フィーチャクラス] に「Ideal_Locations」と入力します。 [結合する属性] で、[フィーチャ ID のみ] を選択します。

    インターセクト ツールのパラメーター

  14. [実行] をクリックします。 ツールの実行が終了したら、[Check_ins_Monthly_Time_Clusters_Fourier] レイヤーをオフにします。

    マップ上での最適な場所

    最適な場所は、サンフランシスコ、マウンテン ビュー、サンノゼにあります。

  15. マップでさまざまなポイントを拡大表示します。

    解析で、ビジネスを開始するために最適な場所である、サンフランシスコのいくつかのエリアを識別しました。

    マウンテン ビューの多くのポイントが識別されていますが、これらのポイントはすべて 1 つのエリア、つまりマウンテン ビューの中心街の周辺に集まっています。 サンフランシスコの代替案が必要になった場合は (おそらくコストが高すぎるため)、このエリアが最適でしょう。

  16. データの全体表示に戻ります。 プロジェクトを保存します。

このチュートリアルでは、時空間データ サイエンスを実行し、時空間にわたってベイ エリア内の人気のある場所を識別しました。 その結果に基づいて、ビジネスを開始するために最適な場所をいくつか特定し、空間的および時間的な集約のさまざまな手法のメリットと制限事項を確認しました。

他のチュートリアルについては、チュートリアル ギャラリーをご覧ください。