浏览 SafeGraph 社交距离数据
万物都在随时间变化。 城市不断发展;税收评估不断增加;犯罪趋势不断升高和降低。 总有一种可以研究和理解的无常之处。
我们的日常选择和活动也在发生变化,COVID-19 大流行完全改变了我们的集体空间行为。 整个国家/地区的人民行为随着时间的推移以不同方式和不同速率发生了变化。 ArcGIS Pro 提供各种工具来了解这些变化,在本教程中,您将使用其中一些工具来可视化和了解大流行对加利福尼亚州的出行模式的一些影响。
浏览社交距离数据集
首先,您将下载并浏览数据。
- 转至 Visualize SafeGraph 以下载数据。
工程文件为 1.1 GB,因此可能需要花费一些时间来下载。
- 下载完成后,双击 VisualizeSafeGraphSocialDistancing.ppkx 工程包。
可能需要花费一分钟时间加载该工程,因为数据量庞大(加利福尼亚 45 天的区块组面)。 如果出现提示,请登录 ArcGIS 帐户。
注:
如果您没有 ArcGIS Pro 的访问权限或者 ArcGIS 组织帐户,请参阅软件访问权限选项。
该工程包含两个地图和一个局部场景。 加利福尼亚地图处于活动状态。
此地图显示了 SafeGraph 社交距离数据,使用具有居家行为的设备百分比字段符号化。 较浅的蓝色区域表示具有描述为居家行为模式的采样设备百分比较低,即这些设备未离开住宅 200 米半径范围内。
该数据包含从 2020 年 5 月 1 日到 2020 年 5 月 14 日的时间片。
接下来,您将创建时间图表来可视化在此时间段内的趋势。
创建数据时钟图
可通过时态图表来发现包含某一时间值的数据趋势,例如此 SafeGraph 数据。 数据时钟是一个圆形图表,可将较大的时间单位划分为多个环,并以较小的时间单位将其细分为楔形,从而创建一组时间条柱。 您将使用数据时钟图了解基于星期的多个变量趋势。
- 在内容窗格中,右键单击 SG 社交距离面图层,单击创建图表,然后单击数据时钟。
- 在图表属性窗格的数据选项卡中,设置以下变量:
- 对于日期,选择日期。
- 对于环,选择周。
- 对于楔形,选择星期。
- 对于聚合,选择平均值。
- 对于数值,选择具有居家行为的设备百分比。
- 对于空值,选择无颜色。
在此数据时钟中,每个同心圆(环)表示一周,而每个圆弧段(楔形)表示一周中的一天。 日期范围(从 2020 年 5 月 1 日到 2020 年 6 月 15 日)以中心为起点并向外扩展。 每个楔形的颜色表示变量值。 所创建的数据时钟表示所有区块组中具有居家行为的设备百分比的平均值。
该图表显示了对于具有居家行为的设备,普遍的居家日趋向于星期日,尽管该趋势逐渐下降。
SafeGraph 数据包含其他一些字段,表示具有其他行为模式的设备的百分比。 该工程包含其他三个数据时钟,用于显示其他行为模式的相同时间框。
- 在内容窗格中,双击具有送货司机行为的设备百分比平均值基于星期的变化图表。
该图表显示了对于具有送货司机行为的设备,在星期五的活动增加。 可能是因为普遍在这一天订购外卖和杂货送货。
- 在内容窗格中,双击具有全职员工行为的设备百分比平均值基于星期的变化图表。
该图表显示了对于具有全职员工行为的设备,星期一到星期五是峰值活动日。 百分比值介于 3% 到 5.5% 之间,相对较低。 在美国阵亡将士纪念日(2020 年 5 月 25 日,星期一)这一天,上班数量明显降低。
- 在内容窗格中,双击具有兼职员工行为的设备百分比平均值基于星期的变化图表。
该图表显示了对于具有兼职员工行为的设备,工作日对应的值较高,但是值得注意的是,星期六对应的值逐渐增加。 百分比值介于 5% 到 7.7% 之间,相对较低,但是高于全职员工。
- 关闭这四个数据时钟图。
建议使用数据时钟图显示周期性或季节性数据。 接下来,您将使用折线图以不同方式查看时态趋势。
创建折线图
折线图经常用于可视化数据。 现在,您将使用折线图浏览具有居家行为的设备百分比变量在整个日期范围内的变化。 这将显示从 2020 年 5 月 1 日到 2020 年 6 月 14 日变量平均值的时态趋势。
- 在内容窗格中,右键单击 SG 社交距离面图层,单击创建图表,然后单击折线图。
- 在图表属性窗格的数据选项卡中,设置以下变量:
- 对于日期或数值,选择日期。
- 对于聚合,选择平均值。
- 对于数值字段,选择具有居家行为的设备百分比,然后单击应用。
- 在时间图格选项部分中,单击间隔大小按钮,然后将间隔大小设置为 1 并将单位设置为天。
生成的折线图显示具有居家行为的设备百分比变量在整个日期范围内以及周期性周模式下呈明显下降趋势。
与数据时钟呈现的一样,居家行为的这些周期性峰值通常为星期日。 这表明随着时间的推移人们的居家行为逐渐减少,即使该模式随星期有所变化。
- 关闭折线图和图表属性窗格。
使用时间滑块显示变化
要对具有时间分量的符号化数据集执行定性视觉评估,时间滑块非常有用。 时间滑块将过滤要素以显示在滑块上设置的日期范围。 这可帮助您查看随时间的趋势。
- 在功能区上,单击地图选项卡导航部分中的书签按钮。 在加利福尼亚书签部分中,单击旧金山。
地图将缩放至旧金山。
- 在内容窗格中,双击 SG Social Distancing polygon 图层以打开图层属性。
- 单击时间选项卡,对于使用时间过滤,选择根据属性值过滤图层内容。
图层时间参数默认设置为每个要素具有单个时间字段,并且时间字段默认设置为日期。 这些是正确的值。
地图中随即显示一个时间按钮。
- 单击确定。
- 单击时间按钮。
- 在时间滑块上,单击播放按钮。
地图将播放显示每天数据的动画。 可单击暂停按钮暂停动画,然后单击位于其任一侧的快进和后退按钮以在间隔之间进行步进。
查看时间步间隔时,可查看地图上随时间的变化。 这是一个定性视觉评估方法,有助于您了解随时间的趋势变化。 对于某些数据集来说,该方法更加有用。 可基于其他变量符号化图层对其进行视觉浏览。
缺少某些时间间隔中的一些面,因为区块组中记录的设备数较低。
对于此数据集,难以对随时间变化的模式进行视觉量化,但是有一个脉冲。 要帮助理解什么是周期性模式,需要间隔的时间参考(例如星期),本教程中先前介绍的数据时钟和折线图可帮助您理解在此动画中看见的内容。
- 在快速访问工具栏上,单击保存按钮以保存工程。
注:
可能会出现一条消息,警告您使用 ArcGIS Pro 当前版本保存此工程文件将使您无法在较早版本中再次将其打开。 如果您看到此消息,单击是以继续。
您学习了一些方法来评估 SafeGraph 社交距离数据的时间趋势。 数据时钟可视化帮助您确定了周期性模式。 您得到以下结论:个人居家百分比最高的是星期日,个人全职工作出行百分比最高的是星期一到星期五。 折线图显示了个人居家百分比呈下降趋势。 最后,时间滑块帮助您可视化具有居家行为的设备的百分比随空间和时间的变化。
要开始理解您的数据,第一步就是执行此类数据浏览。 尽管数据浏览非常有价值,但它同时很主观。 接下来,您将使用时空立方体和新兴热点分析地理处理工具以统计方式确定随时间的显著趋势。
识别随时间和空间变化的热点趋势
现在,您需要将数据转换为支持高级统计数据分析和可视化的格式。
通过聚合点创建时空立方体
要执行新兴时空热点分析并将数据可视化为体素,需要基于 SafeGraph 社交距离数据创建时空立方体。
- 如有必要,请打开工程。
- 单击模式分析视图来激活地图。
此地图中的点图层派生自您之前使用的区块组图层,属性与区块组质心相关。
- 在功能区中,单击分析选项卡,然后在地理处理组中,单击工具。
将出现地理处理窗格。
- 在地理处理窗格中,搜索通过聚合点创建时空立方体,单击将其打开。
通过聚合点创建时空立方体工具位于时空模式挖掘工具箱中。
- 在通过聚合点创建时空立方体工具窗格中,设置以下参数:
- 对于输入要素,选择 SG 社交距离点。
- 对于输出时空立方体,浏览至要在其中保存 NetCDF 输出文件的文件夹(例如 C:\SocialDistancing),然后指定名称,例如 SG_Social_Distancing。
- 对于时间字段,选择 date_range_start_Converted。
- 对于时间步长间隔,选择 1 天。
- 对于距离间隔,选择 5 英里。
- 在汇总字段部分中,单击添加多个按钮添加字段。
- 选中以下字段,然后单击添加。
- mean_distance_traveled_from_home
- pctHome
- pctfulltime
- pctpttime
- pctdelivery
这些字段即会添加到汇总字段部分中。 该部分中的警告指示符表示您必须提供每个字段的详细信息。
- 对于每个字段,将统计数据值更新为平均值,并将用以下内容填充空立方图格值更新为空间邻域。
- 单击运行。
该工具将运行并创建一个时空立方体,并将其存储在您指定文件夹下的 NetCDF 文件中。 不会将此工具的输出添加到您的地图中。 NetCDF 文件可将汇总数据组织成一种格式,以供您用于显示趋势、执行新兴时空热点分析以及创建可视化。
接下来,您将使用该工具的输出执行新兴时空热点分析。
执行新兴时空热点分析
新兴时空热点分析工具将识别您刚刚创建的时空立方体的值的趋势。 该工具会将数据分类成空间立方图格,以帮助您了解和描述随时间发生的变化。 您需要运行该工具两次,才能将居家设备的百分比和具有全职员工行为的设备的百分比中存在的时空模式进行比较。
- 在地理处理窗格中,单击返回按钮,然后在搜索框中输入 Emerging Hot Spot Analysis。
- 单击新兴热点分析打开该工具。
- 在新兴热点分析工具窗格中,设置以下参数:
- 对于输入时空立方体,选择先前步骤中的输出立方体,例如 SG_Social_Distancing.nc
- 对于分析变量,选择 PCTHOME_MEAN_SPATIAL_NEIGHBORS。
- 对于输出要素,键入 PctHome_EmergingHotSpotAnalysis。
- 单击运行。
- 关闭 SG 社交距离点图层以查看新兴热点分析结果。
- 放大到南加州的洛杉矶区域。
蓝色方形像元表示新的冷点模式。 这些在最终时间步长中为具有统计显著性的冷点,这些冷点之前一直不是具有统计显著性的冷点。 洛杉矶中具有统计显著性的设备数最近减少了其居家百分比。
- 平移地图以查看南加州的旧金山区域。
与洛杉矶不同,旧金山区域的递减热点模式占主导。 这些像元对于 90% 的时间步长间隔(包括最终时间步长)始终是具有统计显著性的热点。 此外,每个时间步长中的聚类强度在总体上有所减少,并且该减少具有统计显著性。
可在文档中阅读有关新兴热点分析工作原理的详细信息。
这表明洛杉矶人的外出通常多于旧金山人,此模式稍后将在数据的日期范围中呈现。 随着时间的推移,旧金山人逐渐减少其居家行为。
现在,您将再次运行该工具,以分析“全职工作”变量中的模式。
- 在内容窗格中,取消选中 PctHome_EmergingHotSpotAnalysis 图层。
- 在功能区分析选项卡的地理处理组中,单击历史记录。
历史记录窗格列出了您之前运行的工具。
- 在历史记录窗格中,双击新兴热点分析。
该工具将打开并显示您之前使用的设置。 如果需要在进行细微更改的情况下多次运行某个工具,这非常有用。 在此情况下,您需要更改分析变量和输出名称。
- 在新兴热点分析工具窗格中,设置以下参数:
- 对于分析变量,选择 PCTFULLTIME_MEAN_SPATIAL_NEIGHBORS。
- 对于输出要素,键入 PctFulltime_EmergingHotSpotAnalysis。
- 运行该工具。
结果呈现了一些令人感兴趣的模式。
红色区域表示持续的热点,这意味着对于全职工作行为,这些区域在整个时间段内一直是具有统计显著性的热点。
难以了解导致这种情况的原因,但是根据 Esri Tapestry Segmentation 系统,这些区域高度呈现了 The Great Outdoors tapestry 细分。 此 tapestry 细分的特征表示人口大部分处于退休状态并热爱户外娱乐(这可以表现为工作出行行为)。
旧金山北部区域和卡森城西北部显示该区域的全职工作出行趋势相对较高,并且该趋势在整个分析时间段内保持一致。
在洛杉矶区域,该模式则不同。
洛杉矶东部区域显示为振荡冷点和分散冷点。 洛杉矶东部的振荡冷点具有对于最后时间步长间隔的统计显著性冷点,并且其在之前的间隔中为热点。 该区域东部的分散冷点表示在任何时间段其都不具有统计显著性热点,并且不到 90% 的时间步长间隔具有统计显著性冷点。
洛杉矶东部区域呈现的全职工作出行的个人百分比趋势不太一致。 分类为振荡冷点的区域最近的全职工作出行减少更多(但是在某些时间步长中其曾为热点)。 洛杉矶再往东分类为分散冷点的区域在分析的时间段内,从未变为全职工作出行活动的热点。
您已将要素数据转换为以 NetCDF 数据格式存储的时空立方体,并使用新兴热点分析工具提取两个行为变量具有的随时间变化的统计显著性模式。 在下一部分中,您将学习如何将时空立方体数据显示为体素图层。
将社交距离数据可视化为体元图层
现在,您将在 3D 场景视图中将数据可视化为体素。
将数据可视化为多维体素图层
正如您之前所学,通过聚合点创建时空立方体工具将创建立方图格并将要素数据聚合到以 NetCDF 数据格式存储的时空立方体中。 此规则的格网数据可以显示为多维体素图层。 体素图层使用 NetCDF 文件格式的结构以新的方式显示 3D 数据。 在本部分中,您将探索显示为体素图层的时空立方体。
- 单击 SafeGraph 体素图层视图以激活该场景。
- 单击功能区上的地图选项卡。 在图层组中,单击添加数据下拉菜单,然后单击多维体素图层。
- 浏览到在上一部分中保存 NetCDF 文件的文件夹,单击之前创建的 SG_Social_Distancing.nc 文件,然后单击确定。
- 在选择变量部分中,滚动到列表底部,针对 PCTHOME_MEAN_SPATIAL_NEIGHBORS 单击默认变量按钮以将其设置为默认变量,然后单击确定。
可通过此列表选择要包含在体素图层中的变量。
- 在内容窗格中,单击 SG_Social_Distancing 图层的配色方案图面。
当前的彩虹配色方案无法轻松区分具有高值和低值的区域。
- 在符号系统窗格中,单击配色方案下拉列表。 选中显示名称选项。 向下滚动并选择红蓝(连续)配色方案。
- 选中透明度功能复选框。
在透明度功能控件窗格中,设置为“无透明度”。 可在整个颜色梯度添加控制点以指定颜色的透明度。
- 双击梯度红色部分中间附近,大约距底部一半的位置。
即会在您双击的位置添加一个控制点。
透明度功能控件的背景将变为灰白相间的方格图案,连接三个控点的黑线表示颜色梯度在任何给定颜色下的透明度。 该线越靠近顶部,颜色越不透明。 该线越靠近底部,颜色越透明。
- 双击梯度蓝色部分中间附近,大约距底部一半的位置。
添加这些控制点的作用是将红色和蓝色的中间段阴影设置为半透明,同时提高梯度任一端的更多极值的不透明度。 这可使更多极值在场景视图中突显。
- 在功能区地图选项卡的导航部分中,单击书签按钮,然后在 SafeGraph 体素图层书签部分中,单击加利福尼亚北部。
视图即会缩放到加利福尼亚北部。
某些区域看起来具有白色的多云填充。 这是因为配色方案的中间段值仅为半透明。
在此体积可视化中,较早的时间立方图格位于底部,最近的时间立方图格位于顶部。 居家百分比较高的区域以蓝色表示,较高的值更加不透明且蓝色越深。 居家百分比较低的区域以红色表示,较低的值更加不透明且红色越深。 这有助于可视化较高和较低的居家值。
每列中的体素与每个位置的时间片对应。 由于靠下的体素时间较早,因此您可以向上读取列以查看行为在给定位置的变化情况。 例如,如果列开头为深蓝色并逐渐转变为浅绿色、粉色和深红色,则可以假设在该位置,出现过居家行为减少的趋势。 回想一下数据时钟和折线图,每周都存在居家行为增加或减少的周期,总的来说,存在居家行为减少的趋势。
- 使用鼠标可平移、放大和旋转显示。
有关 3D 导航的详细信息,请参阅在 3D 环境中导航帮助主题。
- 在符号系统窗格的透明度功能控件中,单击之前添加的两个控点并将其一直拖动到底部。
您可以看见位于透明度功能控件上方的数据值直方图中的透明部分。
- 返回加利福尼亚北部书签。
- 在符号系统窗格的透明度功能控件中,单击位于配色方案红色部分末端的控点并将其一直拖动到底部。
这将强调居家行为最高的体素。
- 调整控制点以使中间段值半透明。
您可以看见在较低的红色符号化值最为透明的环境中,较高的居家值一目了然。
现在,您需要切换重点以显示居家值最低的区域。
- 调整控制点以使蓝色值完全透明,红色值变为不透明。
这将强调居家行为最低的体素。
您已将数据可视化为体素图层并使用颜色和透明度控件强调数据中的不同值。 现在,您需要通过体素图层创建剖切以查看数据的横截面。
创建体素图层的剖切
体素图层用于显示数据的 3D 体积视图。 对于边附近的体素,您可以看见数据的整个时间范围。 体积内部周围的数据值容易被其周围的值隐藏。 您可以创建穿过体素图层的剖切来查看其内部情况。
- 在内容窗格的 SG_Social_Distancing 图层部分中,右键单击剖切,然后单击创建剖切。
用于使用剖切的剖切和剖面工具栏随即添加到场景视图底部,并且指针变为十字光标。
- 单击体素图层西边的红色像元,将指针向东移动,然后再次单击。
该剖切将显示在您单击的位置之间。
可创建穿过体素图层的剖切来查看其内部情况。
- 在剖切和剖面工具栏上,单击推拉按钮,单击剖切,然后垂直于剖切平面拖动。
可通过推拉剖切穿过体素图层以交互的方式查看穿过数据不同位置的剖切,并且可更改剖切的位置。
- 在体素探索窗格中,将剖切命名为 SF West-East。
- 单击并拖动体素探索窗格中的位置滑块来移动剖切。
- 创建另一个剖切,但是这次在第一个剖切附近单击,将指针朝北向远离第一个剖切的方向移动,再次单击。
现在将沿南北轴方向剖切数据。
- 在剖切和剖面工具栏上,单击翻转按钮可显示剖切另一侧的数据。
- 在体素探索窗格中,将剖切命名为 SF North-South。
体素探索窗格用于控制在内容窗格中选择的剖切。
- 在内容窗格的 SG_Social_Distancing 图层中,取消选中剖切部分中的 SF West-East 剖切。
现在仅穿过数据的南北剖切可见。
您学习了如何通过创建和管理剖切探索体素图层内部的值。
在体素图层中显示其他变量
体素图层是可视化多维时空立方体的一种方式。 您一直在探索居家行为变量,但是原始数据具有其他行为模式的变量,包括送货司机、全职工作和兼职工作。 现在您将切换到另一个变量。
- 在功能区体素图层选项卡的变量部分中,单击变量下拉箭头,然后单击 PCTDELIVERY_MEAN_SPATIAL_NEIGHBORS。
新变量将使用新的配色方案显示在体素图层中。
- 将图层的符号系统更改为红蓝(连续)配色方案。
- 更改透明度以显示更多极值并提高中间值的透明度。
- 通过平移和缩放探索数据。
- 使用穿过体素图层的剖切查看内部值。
- 保存工程。
也可以探索其他变量、创建不同角度的剖切以及创建穿过数据的水平剖切。
您了解了几种方法来探索 SafeGraph 共享的社交距离数据,这些方法可以应用于许多其他领域和类型的数据,包括犯罪分析、人口统计分析以及具有日期值的任何其他点数据集。 数据时钟可提供周期性模式的视图,折线图可建立随时间变化的整体趋势。 可通过时间滑块直观地解释数据。 新兴热点分析工具可用于量化具有统计显著性的趋势并基于这些趋势对区域进行分类。
在 3D 模式下可视化随时间的趋势是一种以空间方式查看整个图片的绝佳方式,许多人发现通过该方式可直观地了解时空趋势。 您使用了新体素图层在多维时空立方体中可视化变量。 您使用了透明度强调数据中的某些值,并使用穿过体素图层的剖切查看数据体积内部的值。
这些方法可帮助您探索并了解复杂数据集中的时空趋势,例如 SafeGraph 社交距离指标。 将这些方法应用于您自己的时空数据,以通过定性和定量分析深入了解趋势。