ArcGIS Pro 新型コロナウイルス感染リスクの解析
データの確認
はじめに、ArcGIS Pro プロジェクト パッケージをダウンロードしてデータを調べます。
- COVID-19 Risk Data パッケージをダウンロードします。
- ダウンロードした [COVID19RiskData.ppkx] ファイルをダブルクリックし、ArcGIS Pro でプロジェクトを開きます。
注意:
ArcGIS Pro へのアクセス権限または組織アカウントがない場合は、ソフトウェア アクセスのオプションをご参照ください。
- [コンテンツ] ウィンドウで、[HKG Constituency Data] レイヤーを右クリックして、[属性テーブル] を選択します。
テーブルには、香港の 431 の区画 (選挙区) のデータが含まれています。 データには、感染症伝染のリスク、新型コロナウイルスの感受性、医療資源不足の評価に使用できる人口統計情報および空間情報が含まれています。
プロジェクトには複数のレイヤーがあります。
- [情報付加 (Enrich)] ツールを使用して、[Total Population 2018]、[Pop Density per SqKM 2018]、[Seniors (60+) per 1000 people]、[2018 Tobacco: Index]、および [2018 Purchasing Power: Index] フィールドが追加されています。
- [2018 Tobacco: Index] および [2018 Purchasing Power: Index] フィールドで、値が 100 未満の場合は香港の平均を下回っており、100 以上の場合は平均を上回っています。 タバコ指数 (tobacco index) は新型コロナウイルス感染症が呼吸器系の病気であることから、リスクの特定に役立ち、購買力指数 (purchasing power index) は所得レベルや貧困レベルの判断に役立ちます。
- [Healthcare Resource Index] フィールドは、病院のベッド数を反映し、新型コロナウイルス感染症への対応および治療に関する選挙区の能力を表しています。
- [Spatial Interaction Index] フィールドは、道路網の接続性に基づいて計算されています。
- [Relative Case Distance] フィールドは、選挙区の中心点から、新型コロナウイルス感染症の発生がシミュレートされた場所に最も近い上位 10% までの距離 (メートル単位) を示しています。
- テーブルを閉じます。
-
[コンテンツ] ウィンドウで [Target Risk] レイヤーを選択してオンにします。
- [Target Risk] レイヤーを右クリックし、[属性テーブル] を選択します。
[Target Risk] レイヤーの属性は [HKG Constituency Data] レイヤーの属性と似ています。 ただし、[Target] レイヤーの値は、香港全体でのワースト ケースの値です。 人口密度の最高値、1,000 人あたりの高齢者の最大数、タバコ指数の最高値、購買力指数の最低値などです。 これらのワースト ケースの値は、他のすべての選挙区をランク付けしてリスクを判断する際のターゲットとして使用されます。
- テーブルを閉じます。 [Target Risk] レイヤーをオフにします。
- [コンテンツ] ウィンドウで、[Cases (Simulated)] レイヤーをオンにします。
2020 年 1 月 22 日から 2020 年 2 月 23 日の間に香港で判明した新型コロナウイルス感染症の症例は 71 件でした。 この演習では、各症例に関連する場所と日付は架空のものになっています。
伝染リスクのマッピング
感染症が最も伝染しやすいのは、人口が密集し、空間的相互作用が多い場所です。 [類似検索 (Similarity Search)] ツールを使用して、人口密度変数と空間的相互作用指数を使用した伝染リスク マップを作成します。
- リボンの [解析] タブをクリックします。 [ジオプロセシング] グループの [ツール] ボタンをクリックします。
[ジオプロセシング] ウィンドウが表示されます。
- [ジオプロセシング] ウィンドウの検索バーに「Similarity Search」と入力し、Enter キーを押します。 結果リストで [類似検索 (Similarity Search)] ツールをクリックします。
このツールは、属性値に基づいて、入力フィーチャに最も類似している候補フィーチャと、入力フィーチャと最も類似していない候補フィーチャを判断します。 ワースト ケースの [Target Risk] フィーチャに最も類似している選挙区を決定するために使用します。
- [類似検索 (Similarity Search)] ツール ウィンドウで、[照合する入力フィーチャ] の [Target Risk] レイヤーを選択します。 [候補フィーチャ] で [HGK Constituency Data] レイヤーを選択します。
- [出力フィーチャ] に「Transmission_Risk」と入力します。 [結果の数] に「0」と入力します。
注意:
[出力からポイントを作成] パラメーターは、[照合する入力フィーチャ] と [候補フィーチャ] パラメーター値の両方がラインまたはポリゴンである場合に、[出力フィーチャ] パラメーターのジオメトリでポイントを作成するか、入力フィーチャの元のジオメトリ (ラインまたはポリゴン) に一致させるかを指定します。 [出力からポイントを作成] パラメーターは、ArcGIS Pro Advanced でのみ使用できます。 類似検索パラメーター ツールの詳細をご参照ください。
結果の数を 0 に設定した場合、ツールはすべての候補フィーチャをランク付けします。 次に、対象属性を選択します。 伝染リスクに関しては、人口密度および空間的相互作用の指数を示すフィールドを選択します。
- [対象属性] で、[Pop Density per SqKM 2018] および [Spatial Interaction Index] をオンにします。
ID フィールドを出力にも付加します。
- [その他のオプション] を展開し、[ID] をオンにします。
- [実行] をクリックします。
ツールが実行され、新しいレイヤーがマップに追加されます。 各選挙区は、1 (ワーストケース フィーチャに最も近い) から 431 (ワーストケース フィーチャから最も離れている) までにランク付けされます。 色が暗いフィーチャは、人口密度および空間的相互作用の値が [Target Risk] レイヤーに最も類似しています。 最もリスクの高い地域を、新型コロナウイルス感染症の発生がシミュレートされた場所と比較することができます。
マップで最も暗い色の地域に関連する場所では、伝染を最小限に抑えるための取り組み (マスク着用の促進、手指消毒ステーションの増設、大規模な集団イベントの中止、伝染を減らすためのベスト プラクティスに関する情報の発信など) が非常に重要となります。
伝染リスクが最も高い地域では、その他にどのような対策が効果的でしょうか? 地域に固有の対策または政策はありますか?
感受性リスクのマッピング
多くの人は新型コロナウイルスに感染しても症状は軽く、ほとんどの人は完全に回復します。 子供や大人のほとんどは順調に回復していますが、高齢者や基礎疾患がある人、または喫煙などその他の健康要因を持つ人々の死亡率は高くなります。 人口密度の高い地域に感受性の高い人が多く住んでいるとリスクは高まります。 [類似検索 (Similarity Search)] ツールを使用して、死亡率が最も高くなる可能性のある場所を示すリスク マップを作成します。 前のステップですでにツールを使用しているため、パラメーターの一部を調整するだけで済みます。
- [類似検索 (Similarity Search)] ツールの [出力フィーチャ] に、「Susceptibility_Risk」と入力します。
- [対象属性] で、[Seniors (60+) per 1000 people]、[2018 Tobacco: Index]、および [2018 Purchasing Power: Index] をオンにします。 [Pop Density per SqKM 2018] をオン、[Spatial Interaction Index] をオフにします。
入力フィーチャ、候補フィーチャ、結果の数などの残りのフィールドは、以前にツールを実行したときに正しく設定されているはずです。
- [実行] をクリックします。
ツールが実行され、新しいレイヤーがマップに追加されます。 伝染リスク レイヤーと同様に、感受性リスク レイヤーは、各対象属性のワースト ケース値との類似性によって各選挙区をランク付けします。 マップ上で色が暗い選挙区は、人口 1,000 人あたりの高齢者数が多く、タバコへの支出額が多く、購買力が低い可能性が高くなります。
マップで最も暗い色の地域に関連する場所では、最も感受性が高い人々への影響を最小限に抑えるための取り組み (老人ホームへの訪問の制限、検疫センターの設置、旅行の制限、および在宅勤務) が非常に重要となります。
最も感受性が高い人々のリスクを軽減するには、その他にどのような取り組み、政策、および介入が考えられますか?
医療資源不足リスクのマッピング
新型コロナウイルスの流行に関する別の懸念として、医療資源が逼迫し、流行の悪影響を増大させる可能性があります。 [類似検索 (Similarity Search)] ツールを再度実行し、医療資源不足のリスクが最も高い地域を決定します。 今回は、対象属性として [Healthcare Resource Index] フィールドを使用します。 新型コロナウイルスに感染した場合に最も深刻な影響を受ける (医療資源に大きな影響を及ぼす) 人々を表すパラメーターとして、[Seniors (60+) per 1000 people] フィールドを使用します。
- [類似検索 (Similarity Search)] ツールの [出力フィーチャ] に、「Insufficient_Resource_Risk」と入力します。
- [対象属性] で [Healthcare Resource Index] をオンにします。 [Pop Density per SqKM 2018]、[2018 Tobacco: Index]、および [2018 Purchasing Power: Index] をオフにします。
[Seniors (60+) per 1000 people] および [Healthcare Resources Index] 属性のみがオンになっています。
- [実行] をクリックします。
ツールが実行され、新しいレイヤーがマップに追加されます。 色が最も暗い地域は、最も感受性が高い人々の間で大量に発生した新型コロナウイルス感染症に対処する準備が最もできていない場所を示しています。
新型コロナウイルス感染症が急速に流行し始めた場合、医療資源がすぐに枯渇する可能性があります。 医療資源 (検疫所の候補、検査キット、人工呼吸器、防護服、マスクなど) を増強する計画を立てておくことが不可欠です。
新型コロナウイルスが大流行した場合、医療資源が不足している場所では、その他にどのような取り組み、政策、戦略が重要になりますか? 潜在的な大流行への準備として事前にできることは具体的に何ですか?
曝露リスクのマッピング
次に、新型コロナウイルス感染症の曝露リスクが高い地域を示すマップを作成します。 [Relative Case Distance] フィールドは、各選挙区の重心から、すべての新型コロナウイルス感染症の発生場所に最も近い上位 10% までの合計距離を示しています。 既知の症例が大量に存在している場所に近い選挙区は、距離が離れている選挙区よりも曝露のリスクが高くなります。
- [類似検索 (Similarity Search)] ツールの [出力フィーチャ] に、「Exposure_Risk」と入力します。
- [対象属性] で [Relative Case Distance] をオンにします。 [Seniors (60+) per 1000 people] と [Healthcare Resources Index] をオフにします。
オンになっているのは [Relative Case Distance] だけです。
- [実行] をクリックします。
ツールが実行され、レイヤーがマップに追加されます。
これで、新型コロナウイルス感染症の危険因子をランク付けする 4 つのレイヤーが作成されました。
リスク プロファイルのマッピング
次に、分析したすべての危険因子を組み合わせたリスク プロファイルのマップを作成します。 最終的なマップには、新型コロナウイルス感染症に関して同様の課題に直面している地域が表示され、対象を絞った介入を展開できます。 まず、4 つのレイヤーすべてのランキングを [HKG Constituency Data] レイヤーに追加します。 そのようにするには、4 つの各ランキングのフィールドを属性テーブルに追加します。
- [ジオプロセシング] ウィンドウの [戻る] ボタンをクリックします。
- [フィールドの追加 (複数)] ツールを検索して開きます。
注意:
[フィールドの追加 (複数) (Add Fields (multiple))] ツールをご参照ください。
- [フィールドの追加 (Add Fields (multiple))] ツールの [入力テーブル] で [HKG Constituency Data] を選択します。 [フィールド名] に「Transmission_Risk」と入力し、[フィールド タイプ] で [Long (32 ビット整数)] を選択します。
- [他を追加] ボタンをクリックします。
6 つの新しいパラメーターが表示されます。
- [フィールド名] に「Susceptibility_Risk」と入力します。 [フィールド タイプ] で [Long (32 ビット整数)] を選択します。
- さらに、[フィールド名] に「Insufficient_Resource_Risk」、[フィールド タイプ] に [Long (32 ビット整数)] が設定されたフィールドと、[フィールド名] に「Exposure_Risk」、[フィールド タイプ] に [Long (32 ビット整数)] が設定されたフィールドの 2 つを追加します。
[フィールドの追加 (複数) (Add Fields (multiple))] ツールに、テーブルに追加される 4 つの新しいフィールドが含まれるようになりました。
- [実行] をクリックします。
ツールが実行され、4 つのフィールドが [HKG Constituency Data] レイヤーの属性テーブルに追加されます。
- [HKG Constituency Data] レイヤーの属性テーブルを開き、テーブルの最後にフィールドが追加されたことを確認します。
デフォルトではフィールドは空で、値は含まれていません。 作成したレイヤーのランキングを [HKG Constituency Data] レイヤーに結合します。 [類似検索 (Similarity Search)] ツールを実行した際、結果に ID フィールドが付与されることを確認しました。 その ID フィールドを使用して結合を実行します。
- [ジオプロセシング] ウィンドウの [戻る] ボタンをクリックします。 [テーブルの結合 (Add Join)] ツールを検索し、開きます。
- [テーブルの結合 (Add Join)] ツール ウィンドウで、次のパラメーターを入力します。
- [入力テーブル] で [HKG Constituency Data] を選択します。
- [入力結合フィールド] で [ID] を選択します。
- [結合テーブル] で [Transmission_Risk] を選択します。
- [結合 テーブル フィールド] で [ID] を選択します。
[入力結合フィールド] パラメーターの警告が表示されます。 この警告は、選択したフィールドのインデックスが構築されておらず、ツールの実行速度が低下する可能性があることを示しています。 いずれにしてもツールは高速に実行されるため、警告は無視します。
- [実行] をクリックします。
ツールが実行され、テーブルが結合されます。 [HKG Constituency Data] テーブルをまだ開いていれば、ランキングを含むフィールドだけでなく、複数の新しいフィールドが追加されているのがわかります。
次に、追加した [Transmission_Risk] フィールドを適切なランキング値で計算してから、結合を解除します。
- [ジオプロセシング] ウィンドウの [戻る] ボタンをクリックします。 [フィールド演算 (Calculate Field) (データ管理ツール)] ツールを検索し、開きます。
すべてのランキングは 1 から 431 までで、1 が最も高いリスクです。 ランキングを逆にして、数字が大きいほどリスクが高くなるようにします。
- [フィールド演算] ツールで、以下のパラメーターを設定します。
- [入力テーブル] で [HKG Constituency Data] を選択します。
- [フィールド名 (既存または新規)] で [Transmission_Risk] を選択します。
- [式] で、「432 - !Transmission_Risk.SIMRANK!」という式を作成します。
この式では、ランキングを 432 から引くことで、最も高いリスク ランキングが 431、最も低いランキングが 1 になります。
- [実行] をクリックします。
フィールドが計算されます。 次に、結合を解除します。
- [ジオプロセシング] ウィンドウの [戻る] ボタンをクリックします。 [テーブルの結合を解除 (Remove Join)] ツールを検索し、開きます。
- [テーブルの結合を解除 (Remove Join)] ツール ウィンドウの [レイヤー名、またはテーブル ビュー] で [HKG Constituency Data] を選択します。 [結合] で [Transmission_Risk] を選択します。
- [実行] をクリックします。
結合が解除されます。 次に、他の 3 つのリスク レイヤーに対しても同じプロセスを繰り返します。
- 前と同じパラメーターを使用し、[テーブルの結合 (Add Join)] ツール、[フィールド演算 (Calculate Field)] ツール、[テーブルの結合を解除 (Remove Join)] ツールを実行しますが、次のように置換します。
- [テーブルの結合 (Add Join)] ツールの [結合テーブル] で [Susceptibility_Risk] を選択します。
- [フィールド演算] ツールのフィールド名を [Susceptibility_Risk] にし、式には「432 - !Susceptibility_Risk.SIMRANK!」と入力します。
- テーブルの結合を解除ツールの結合で [Susceptibility_Risk] を選択します。
- [Insufficient_Resource_Risk] および [Exposure_Risk] レイヤーに対して、このプロセスを繰り返します。
追加した 4 つのフィールドがすべて計算されました。
- テーブルを閉じます。
次に、[多変量クラスター分析 (空間統計) (Multivariate Clustering (Spatial Statistics))] ツールを使用し、次の 4 つのフィールドに基づいて、類似する特長を持つ選挙区をクラスタリングします。
多変量クラスター分析ツールの使用
[多変量クラスター分析 (Multivariate Clustering)] ツールは、各グループ内の値はできる限り類似していて、グループ間はできる限り異質になるようなグループを作成します。
注意:
[多変量クラスター分析 (Multivariate Clustering) (空間統計)] ツールの詳細をご参照ください。
- 必要に応じ、[解析] タブの [ジオプロセシング] グループで [ツール] をクリックします。
- [ジオプロセシング] ウィンドウで、[多変量クラスター分析 (Multivariate Clustering)] ツールを検索し、開きます。
- [多変量クラスター分析] ツール ウィンドウで、次のパラメーターを設定します。
- [入力フィーチャ] で [HKG Constituency Data] を選択します。
- [出力フィーチャ] に「Risk_Profiles」と入力します。
- [分析フィールド] で、[Transmission_Risk]、[Susceptibility_Risk]、[Insufficient_Resource_Risk]、および [Exposure_Risk] をオンにします。
- [クラスター分析方法] で [K-means] を選択します。
- [初期化方法] で [ユーザー定義されたシード ロケーション] を選択します。
- [初期化フィールド] で [SEEDS] を選択します。
[SEED] フィールドは、伝染リスク、感受性リスク、曝露リスクが最も高い選挙区を (値 1 で) マークします [多変量クラスター分析 (Multivariate Clustering)] ツールはヒューリスティックであり、最適な結果を追求するものの、最高の結果を保証するものではありません。 シード値を設定することで、このツールはリスクの極値を含む最適な結果の探索を開始します。 これには、効率性の面で利点があるだけでなく、ツールを実行するたびに正確に同じ結果を得ることができます。 シード値を使用しない場合、同じ結果が得られる可能性はありますが、各グループに関連付けられた色が異なる (入れ替わる) 可能性があります。
シードが 3 つ存在するため、ツールは 3 つのクラスターを検索します。 これは、高リスク、中リスク、および低リスクのグループを識別するのに適しています。 3 つのクラスターを使用して、高リスク グループのクラスター、中リスク グループのクラスター、低リスク グループのクラスターを 1 つずつ作成します。
- [実行] をクリックします。
ツールが実行され、新しいレイヤーがマップに追加されます。
このツールでは、各プロファイルの特徴を含む箱ひげ図も作成されました。
- [コンテンツ] ウィンドウで、[多変量クラスター分析の箱ひげ図] チャートをダブルクリックして開きます。
チャートには、マップ上のクラスターに対応する 3 本のラインが含まれています。 ライン上のノードは、各カテゴリのリスクが相対的に高いか低いかを示しています。
ランキングを逆にしているため (432 - ランキング)、最大値 (チャートの上部) が最も高いリスクを表しています。 このチュートリアルの例では、赤色で示された選挙区は資源不足になるリスクが 2 番目に高く、曝露、感受性リスク、伝染リスクはワースト 1 になります。 これらの場所では、子供の通学の禁止、高齢者施設や病院への訪問の制限、イベントの中止、在宅勤務の推奨など、直接的な交流を最小限にすることを最優先にする必要があります。
青色のグループも、医療資源不足のリスクが最も高く、感受性リスクと伝染リスクが 2 番目に高いため、懸念されます。 これらの選挙区では、ソーシャル ディスタンシングに加えて、検疫センターや医療訓練の計画を立てることが効果的です。
- チャートを閉じます。 プロジェクトを保存します。
このチュートリアルでは、新型コロナウイルス感染症の流行下における伝染、感受性、医療資源不足、および曝露のリスクを分析しました。 また、類似したリスク グループのプロファイルを作成したことで、職員はターゲットを絞った介入プログラムを計画することができます。
注意:
このチュートリアルのリスク分析に関する入力情報の作成については、「新型コロナウイルス感染症リスクのマッピング」をご参照ください。
他のチュートリアルについては、チュートリアル ギャラリーをご覧ください。