导入人口普查区域和连接表
您将为纽约市准备一个指标图层。 您将把多个现有数据源的属性合并到一个空间图层中。 通过在人口普查区域图层中包含所有属性,您可以使用附加属性来绘制和分析这些区域。 您将使用美国社区调查 (ACS) 中的现有空间和表格数据、栅格数据来测量树冠,并使用邻近分析来测量对特定女性资源的访问,从而构建指标图层。
下载数据并准备工程
首先,您将下载将在教程中使用的数据。
- 下载将在教程中使用的数据。
- 在 Microsoft File Explorer 中,在 C:\ 盘上创建一个名为 IndicatorData 的文件夹。
- 将下载的 .zip 文件的内容提取到 IndicatorData 文件夹中。
- 启动 ArcGIS Pro。 如果收到系统提示,请使用您获得许可的 ArcGIS 组织账户登录。
注:
如果您没有 ArcGIS Pro 的访问权限或者 ArcGIS 组织帐户,请参阅软件访问权限选项。
打开 ArcGIS Pro 后,您可以选择创建新工程或打开已存在的工程。 如果您之前创建了一个工程,您将看到一个最近工程列表。
- 在新建工程下,单击地图。
- 在新建工程窗口中,对于名称,键入 Indicators;对于位置,接受默认文件夹,然后单击确定。
现在您已经有了一个工程,您将添加一个文件夹连接,这样您就可以轻松地访问您的数据。
- 查看目录窗格。 如果看不到,请从视图菜单的窗口组中选择目录窗格。
- 在目录窗格中,右键单击文件夹,然后选择添加文件夹连接。
- 在添加文件夹连接窗口中,浏览并选择 IndicatorData 文件夹,选择它,然后单击确定。
- 展开 IndicatorData 文件夹以查看其内容。
在文件夹中,有几个存储属性信息的 .csv 和 .xlsx 文件。 还有一个名为 nyct2020 的 shapefile 将被导入到地理数据库中。 将 shapefile 作为要素类导入地理数据库后,它将作为剩余指标信息的基础。 将表格信息连接到空间数据允许您分析和可视化所有信息。
将 shapefile 导入地理数据库
您已经下载了数据,创建了一个工程,并连接到一个文件夹来访问数据。 现在,您将 shapefile 导入到地理数据库中。
- 在目录窗格中,展开数据库。
ArcGIS Pro 中的每个工程都有一个默认地理数据库,其名称与工程相同。 工程地理数据库名为 Indicators.gdb。
- 右键单击 Indicators.gdb,指向导入,然后选择要素类。
要素类至地理数据库工具随即打开。
- 对于输入要素,单击浏览按钮,浏览至 IndicatorData 文件夹,单击 nyct2020,然后单击确定。
由于您右键单击了地理数据库并选择将数据导入其中,因此输出地理数据库参数已设置为工程地理数据库。
- 单击运行。
- 在目录窗格中,展开 Indicators 地理数据库。
shapefile 被转换为地理数据库并存储为包含面的要素类。 要素类是相同类型、点、线或面的数据集合。
- 在 Indicators 地理数据库中,单击 nyct2020 图层并将其拖动到地图上进行添加。
人口普查区域出现在地图上,并使用默认颜色显示。
注:
您的人口普查区域显示的颜色可能与图像中显示的颜色不同。
- 在内容窗格中,单击 nyct2020 图层以将其选中,然后再次单击以使其名称可编辑。
- 输入 NY Census Tracts,然后按 Enter 键。
您已将 shapefile 导入到地理数据库要素类中,将其添加到地图中,并重命名了图层。 现在数据库中已经有了基础空间数据集,您将通过表连接向其添加信息。
浏览表格数据
接下来,您将把 ACS 数据连接到人口普查区域。 整个纽约州的 ACS 数据目前保存在一个 .csv 文件中,或者是非空间格式的。 您将基于一个公共属性连接这两个数据集,以将 ACS 数据合并到人口普查区域中。
- 在目录窗格中,展开文件夹,然后展开 IndicatorData 文件夹。
Data4Join.csv 文件包含要连接到 NY Census Tracts 图层的整个州的 ACS 数据。
- 将 Data4Join.csv 文件拖动到地图上。
.csv 文件显示在内容窗格的独立表下。
.csv 文件之类的表没有空间组件,因此它们列在内容窗格的独立表部分。 虽然默认情况下,表格数据不会显示在地图上,但您可以通过连接数据来使用它增强要素图层,或者如果表有坐标,您可以基于坐标显示数据。
接下来,您将检查表格。
- 右键单击 Data4Join.csv 表,然后选择打开。
该表包含许多可用于映射的属性。 目前,该表已是 .csv 格式,并且没有 OBJECTID 字段,这意味着您无法将其与另一个图层连接。 此外,您将在连接中用作匹配字段的 GEO_ID 字段与人口普查区域图层中的相同字段类型不同。 要连接表,必须有具有相同数据类型的公共字段。
- 在表中,单击选项按钮并选择字段视图。
- 找到 GEO_ID 字段,注意它的数据类型值是大整数。
- 在内容窗格中,右键单击 NY Census Tracts 并选择属性表。
- 正如您在 .csv 表中做的那样,单击选项按钮并选择字段视图。
人口普查区域图层中的 GEOID 字段与表中的 GEO_ID 字段包含相同的信息,但其为文本格式。
字段类型必须匹配,连接才能正常工作。 为了确保可以在连接中使用该表,需要将其导入到地理数据库中,并添加和计算一个文本字段来存储信息。
- 关闭所有表格和字段视图。
为连接准备数据
现在,您已经确定了将 .csv 表导入地理数据库并添加和计算用于连接的字段的需求,您将执行这些操作来适当地准备数据。
- 在目录窗格中,右键单击 Indicators 地理数据库,指向导入,然后选择表。
- 对于输入表,单击下拉菜单并选择 Data4Join.csv。
- 单击运行。
- 在目录窗格的 Indicators 地理数据库中,右键单击 Data4Join.csv 并选择重命名。 输入 ACS_Data,然后按 Enter 键。
- 向地图添加 ACS_Data 表。
- 在内容窗格中,右键单击 Data4Join.csv 并选择移除。
在连接表之前,必须添加一个文本字段并对其进行计算。
- 右键单击 ACS_Data table,指向数据设计,然后选择字段。
- 在字段列表的底部,单击单击此处添加新字段。
- 对于字段名称,输入 GEOID,对于数据类型,选择文本。
- 在功能区字段选项卡的管理编辑内容组中,单击保存。
- 关闭字段视图。
- 打开 ACS_Data 表。
- 滚动至末尾并查找 GEOID 字段。 右键单击并选择计算字段。
- 在表达式部分中,对于字段,双击 GEO_ID 将其添加到表达式中。
您正在使用 GEO_ID 字段来填充您添加的 GEOID 字段。
- 单击确定。
该字段现在是正确的类型,并且填充了正确的信息。
- 关闭表。
您现在可以执行连接。 在这种情况下,您需要将 ACS_Data 表连接到 NY Census Tracts 图层,以补充您的空间数据。
把 ACS 数据连接到人口普查区域图层
接下来,您将把 ACS 数据连接到人口普查区域。 您将基于一个公共属性连接这两个数据集,以将 ACS 数据合并到人口普查区域中。
- 在内容窗格中,右键单击 NY Census Tracts 图层,指向连接和关联,然后选择添加连接。
添加连接窗口随即显示。 在这里,您可以输入连接的参数,比如涉及的表和匹配的字段。
- 在添加连接工具中,输入或确认以下参数:
- 对于输入表,请确认已选择 NY Census Tracts。
- 对于输入字段,确认已选择 GEOID。
- 对于连接表,确认已选择 ACS_Data。
- 对于连接字段,确认已选择 GEOID。
- 取消选中保留所有输入记录。
- 对于连接操作,选择一对第一连接。
您已经输入了连接的所有参数。 接下来,在运行该工具之前,您将验证该连接以确保其正常工作。
- 单击验证连接按钮。
消息窗口随即显示。
该连接有 2,325 条匹配记录。 这与要素图层中的人口普查区域数量相同。 即使 ACS 表包含整个纽约州的数据,它也只会根据公共字段连接与区域匹配的信息。
- 在消息窗口中,单击关闭,然后在添加连接窗口中,单击确定。
连接已完成,但在地图上看不到任何变化。 您将在图层的属性表中看到差异。
- 打开 NY Census Tracts 属性表。
- 向右滚动,注意 ACS_Data 字段。
现在,ACS_Data 表中的所有字段都基于公共字段连接到人口普查区域。
- 关闭表。
- 在快速访问工具栏上,单击保存以保存工程。
您已将 ACS 属性连接到人口普查区域图层。 现在您可以将这些字段用于符号系统、标注和分析。
导出连接的图层
该连接在层中是虚拟的,但不作为其自己的数据源单独存储。 您将把人口普查区域图层导出为要素类,以存储包含人口普查区域要素的连接字段。
- 在内容窗格中,右键单击 NY Census Tracts,指向数据,然后选择导出要素。
将弹出导出要素窗口。 输入要素参数已正确设置,因为您右键单击了要导出的图层。
- 对于输出要素类,将默认名称替换为 NY_ACS_Tracts并单击确认。
- 单击确定。
- 从地图中移除 NY Census Tracts 图层。
- 在内容窗格中,将 NY_ACS_Tracts 重命名为 NYC Census Tracts。
现在,地图中的人口普查区域图层包含了 ACS 表中的所有属性,并且是它自己的数据源。 如果您以任何形式共享该数据源,所有属性都将存在。
- 保存工程。
添加并计算字段
接下来,您将添加并计算两个字段,这两个字段都是百分比字段,用于说明教育水平和生育年龄。
- 在内容窗格中,右键单击 NYC Census Tracts,指向数据设计,然后选择字段。
- 滚动至底部,然后两次单击单击此处以添加新字段。
随即显示两排。 接下来,您将编辑字段属性。
- 对于第一行,输入以下属性:
- 对于字段名称,输入或复制并粘贴 Bachelors_degree_higher_women。
- 对于别名来说,输入或复制并粘贴女性可以获得学士学位或更高的学位吗?
- 对于数据类型,选择双精度。
- 对于第二个字段,输入以下属性:
- 对于字段名称,输入或复制并粘贴 Percent_reproductive_age。
- 对于别名来说,输入或复制并粘贴百分之多少的女性处于生育年龄?
- 对于数据类型,选择双精度。
注:
字段旁边的绿框表示有未保存的更改。
- 在功能区字段选项卡的管理编辑内容组中,单击保存。
- 关闭字段视图。
要测量教育和生殖健康的指标,您需要计算字段的百分比。
- 打开 NYC Census Tracts 的属性表,滚动到表的末尾以查看刚刚添加的两个字段。
- 右键单击女性可以获得学士学位或更高的学位吗?并选择计算字段。
- 在表达式部分,对于 EducationForWomen =,复制并粘贴以下表达式:(!Women_getting_a_Bachelor_s_Degree_or_higher! / !Total_Female_Population_for_Education!) * 100.
- 单击绿色复选标记来验证表达式并单击应用。
由于并非所有记录都有值,因此会出现一个消息窗口并显示一条警告。 这很好,您可以继续。
- 关闭警告窗口,然后单击确定。
您已经计算了拥有学士学位或更高学位的女性的百分比。 接下来,您将以类似的方式计算另一个字段。
- 在属性表中,右键单击百分之多少的女性处于生育年龄?并选择计算字段。
- 在表达式部分中,对于 WomenAtReproductiveAge =,清除现有表达式。
- 复制并粘贴以下表达式:(!Women_at_reproductive_age_15_to_44! / !Total_Female_Population_for__reproductive_health!) * 100.
- 单击应用。
出现类似的警告,这是正常的,也是意料之中的。
- 关闭警告窗口,然后单击确定。
在美国,众所周知,高等教育会带来更高的收入。 当您看到这张表时,您可能会想生活在这些地区的女性是否有成功的好榜样。 这种成功的模型是通过收入中位数、教育程度和相对于男性的收入来衡量的。 育龄妇女的百分比可以用来衡量州法律变化的影响,如堕胎禁令。 您可以利用这一措施来扩大针对不同性别的健康服务的覆盖面。
- 关闭表并保存工程。
您添加并计算了两个字段来说明分析中的关键指标:处于特定教育水平和生育年龄的妇女的百分比。
您已经从现有数据源创建了指标图层,包括 shapefile 和 CSV 文件。 您已将数据导入地理数据库、已添加字段、已连接数据、已导出数据并已计算字段。 接下来,您将使用栅格数据创建一个环境指标。
使用栅格数据创建树冠层
在本部分中,您将准备一个指标来测量树冠。 树冠通常是一种用于环境指标的测量方法,可以与温度等其他环境指标结合使用,以提供该地区更全面的情况。 树冠的另一个方面是,从历史上看,美国许多城市的树木分布往往不均衡。 在诸如纽约这样的城市空间中,树冠是一种奢侈。 您将使用树冠作为环境指标来了解树木分布以及哪些女性可以获得树荫。
探索一个土地覆被图像
您将首先添加根据纽约市的激光雷达数据创建的土地覆被数据。 该图像已将土地覆被类型分类为 8 种。
- 返回到 ArcGIS Pro 中的工程。
- 转到 IndicatorData 文件夹连接并展开 Land_Cover 文件夹。
此图像是纽约市的 6 英寸分辨率土地覆盖栅格数据集。
- 将图像添加至地图。
- 在内容窗格中,关闭 NYC Census Tracts 图层。
这个图像层被分成八类。 接下来,您将通过浏览其属性表来查看影像数据。
- 打开 NYC_2017_LiDAR_LandCover.img 图层的属性表。
请注意表格中的八种土地覆盖分类。 栅格中有 7,446,483,259 个被分类为树冠的像元。
在想到像纽约这样的地方或其他城市空间时,您可能会想到所有的建筑、人行道和繁忙的街道。 这个事实让草木成了奢侈品。
- 关闭表。
重分类土地覆盖图像
在图像中的 8 种土地覆被分类中,您仅对树冠分类感兴趣。 接下来,您将使用地理处理工具对图像进行重分类,并仅隔离分类为树冠的像元。
- 在功能区上,单击分析选项卡。 在地理处理组中,单击工具。
将出现地理处理窗格。 在这里,您可以按名称或存储工具的工具箱来搜索工具。
- 在地理处理窗格中,查找工具栏中,输入 reclass。 单击重分类(Spatial Analyst 工具)工具。
- 在重分类中,设置以下参数:
- 对于输入栅格,单击下拉菜单并选择 NYC_2017_LiDAR_LandCover.img。
- 确保重分类字段设置为 Class。
- 在重分类表中,对于树冠行,将新列中的值保留为 1。 将除 NODATA 之外的所有其他类的新列中的值更改为 0。
- 对于输出栅格,单击浏览按钮并浏览至 IndicatorData 文件夹。 对于名称,输入 TreeCanopyNYC.tif 并单击保存。
注:
根据您的系统,重分类工具可能耗时最多 20 分钟。
或者,您可以下载结果数据以使用 TreeCanopyNYC.tif 图像文件。 要使用此数据,请下载 .zip 文件并将其提取到您的计算机,然后将其添加至您的工程中以替换 TreeCanopyNYC.tif。
- 单击运行。
图像处理完毕后,它会出现在地图上。
- 在内容窗格中,移除 NYC_2017_LiDAR_LandCover.img 图层。
TreeCanopyNYC.tif 图层有两个类:一个类是树冠,另一个类是所有其他土地覆盖分类。 您可以使用此栅格来计算将作为环境指标测量值的树冠变量的存在。
- 保存工程。
接下来,您将使用以表格显示分区统计工具来汇总每个人口普查区域中的树冠数量。
汇总每个人口普查区域内的树冠
对于指标,您对树木的存在感兴趣,该值越高,表示树木越多或环境因素越积极。 为了确定每个人口普查区域中的树木覆盖率,您将根据人口普查区域面汇总树冠像元。
- 在地理处理窗格中,单击后退按钮。 搜索并打开以表格显示分区统计(Spatial Analyst 工具)工具。
此工具将汇总每个人口普查面内的树冠像元数,并提供每个区域(面)内的像元总数。 这将允许您计算树木覆盖的面像元的百分比。
- 在以表格显示分区统计工具中,输入以下参数:
- 对于输入栅格或要素区域数据,选择 NYC Census Tracts。
- 对于区域字段,选择 GEOID [GEOID]。
- 对于输入值栅格,选择 TreeCanopyNYC.tif。
- 对于输出表,键入 TreePixels。
- 对于统计类型,选择总和。
- 单击运行。
该工具完成后,TreePixels 表将显示在内容窗格的独立表下。
- 打开 TreePixels 表。
该表包含两个感兴趣的列:COUNT,表示每个人口普查区域内的总像素数;SUM,表示树冠像素总和。
您将使用以下公式来计算每个人口普查面的树冠百分比:PctTreeCanopy = (Sum / Count) * 100。
- 在属性表中,单击计算。
随即显示计算字段工具。 之前,您在打开计算字段工具之前创建了字段。 这一次,您将创建字段并同时计算它。
- 在计算字段工具中,对于字段名称(现有或新),输入 PctTreeCanopy。
- 对于字段类型,选择双精度型(64 位浮点型)。
- 在表达式下,对于 PctTreeCanopy =,构建表达式 (!SUM! / !COUNT!)*100。
- 单击确定。
PctTreeCanopy 字段显示在属性表的末尾,并进行计算。
PctTreeCanopy 值表示树木覆盖的人口普查区域的百分比,是对环境指标的测量。
- 关闭 TreePixels 表,关闭 TreeCanopyNYC.tif,然后保存工程。
您已对土地覆盖图像进行了重新分类,以隔离要包含在指标中的像元:树木覆盖,并按人口普查区域汇总了树木覆盖范围。 现在您知道了纽约市每个人口普查区域的树木覆盖范围。 TreePixels 表已准备好连接 NYC Census Tracts 图层。
添加基于邻域的指标
您创建的下一个指标将衡量对特定事物的访问。 通常,组织试图确定事物的位置,例如,基于性别的资源。 确定位置后,下一步是确定这些位置的访问权限。 通常,对某物的访问是在该位置附近测量的。 您将创建表示女性设施位置的点图层。 然后,将设施点缓冲半英里,以确定与这些设施点的距离。 此外,您将对驱逐地点采取同样的措施,因为研究表明,黑人和棕色人种妇女通常会受到强制驱逐的负面影响。 您想知道在纽约市的哪些地区,女性正被强行逐出她们的家或租房。
基于表创建点
在本教程中,您已经使用了表格数据,但是到目前为止,所有这些数据都是非空间的,或者没有某种类型的空间组件,例如坐标。 接下来,您将从包含位置坐标的表中映射驱逐。
- 在目录窗格中,将 IndicatorData 文件夹中的 Evictions.csv 添加到地图中。
- 打开 Evictions.csv 表并向右滚动,直到看到纬度和经度字段。
纬度和经度字段存储每次驱逐的坐标。 您将使用这些字段将驱逐映射为地图上的点。
- 关闭表。
- 在功能区地图选项卡的图层部分中,单击 XY 表转点。
将在地理处理窗格中显示 XY 表转点工具。
- 在 XY 表转点工具中,设置或验证以下参数:
- 对于输入表,选择 Evictions.csv。
- 对于输出要素类,将默认名称替换为 Evictions。
- 对于 X 字段,确认已选择经度。
- 对于 Y 字段,确认已选择纬度。
- 对于坐标系,请确认已选择 GCS_WGS_1984。
XY 表转点工具根据字段名称选择智能参数默认值。
- 单击运行。
注:
您将得到一个关于空值的警告,可以忽略它。
接下来,您将添加一个包含女性设施点的表,并使用相同的工具绘制这些位置的地图。
- 在目录窗格中,将 Womens _ Facilities.csv 添加到地图中。
- 在地图选项卡中,单击 XY 表转点。
- 在 XY 表转点工具中,设置以下参数:
- 对于输入表,选择 Womens_Facilities.csv。
- 对于输出要素类,将输出名称更改为 WomensResources。
- 对于 X 字段,选择 Location 2。
- 对于 Y 字段,选择 Location 1。
- 对于坐标系,请确认已选择 GCS_WGS_1984。
- 单击运行。
- 在内容窗格中,关闭驱逐以查看 WomensResources 点。
注:
为了更好地看到这些点,您可以更改颜色。
您已经从非空间表中创建了两个要素图层来映射指标的重要标准。
过滤数据以仅显示特定类型的要素
现在,您已经拥有了地图上的所有点,您将缩小分析的范围,仅包括特定类型的驱逐。 对于驱逐,您只对驱逐感兴趣,因此您将过滤出您需要的内容。 分析的很大一部分是缩小数据的范围,使其只包括特定内容,例如树冠覆盖和弹出物。
- 打开驱逐的属性表。
- 滚动并找到弹出字段。
您将使用该字段进行属性选择。
- 在该表中,单击按属性选择。
- 对于位置,单击下拉菜单并选择弹出。
- 对于第二个下拉菜单,保持等于,对于最后一个下拉菜单,选择弹出。
- 单击确定。
- 在表的左下角,单击显示所选记录。
现在只显示选中的记录。 应该有 67 条记录被选中。 您将切换选择以选择不想使用的要素并删除它们。
- 在表中,单击切换选择按钮。
现在,您不需要的 89,835 条记录被选中。
- 单击删除选择。
- 单击是以确认删除。
- 单击显示所有记录。
- 关闭表并保存工程。
现在,驱逐表只包含您想要包含的 67 条记录。
创建步行时间缓冲区
接下来,您将在分析中纳入与驱逐和女性设施的邻近程度。 您将在要素周围创建半英里缓冲区来表示步行距离。
- 在地理处理窗格中,搜索并打开成对缓冲工具。
- 在成对缓冲工具中,设置以下参数:
- 对于输入要素,选择 WomensResources。
- 对于输出要素类,将默认值替换为 ResourcesBuffer。
- 对于距离,键入 0.5。
- 在线性单位下,选择美国测量英里。
- 对于方法,选择测地线(形状不变)。
- 对于融合类型,请选择将全部输出要素融合为一个要素。
- 单击运行。
- 在内容窗格中,确保除底图外,唯一可见的图层是 WomensResources 和 ResourcesBuffer。
您已经为资源点创建了缓冲区。 接下来,您将为驱逐要素创建缓冲区。
- 在仍然处于打开状态的成对缓冲工具中,更新以下参数:
- 对于输入要素,选择 Evictions。
- 对于输出要素类,将默认值替换为 EvictionsBuffer。
- 单击运行。
- 在内容窗格中,关闭 WomensResources 和 ResourcesBuffer,并打开 Evictions 和 EvictionsBuffer。
您已经创建了表示驱逐点和妇女资源点周围半英里缓冲区的图层。 有了这些缓冲区,您就可以将接近度纳入指标制备中。
创建指标表
现在,您已经准备好创建指标表了。
- 在地理处理窗格中,单击后退箭头。 搜索并打开制表交叉点工具。
- 在制表交叉点工具中,设置以下参数:
- 对于输入区域要素,选择 NYC Census Tracts。
- 对于区域字段,选择 GEOID [GEOID]。
- 对于输入类要素,选择 EvictionsBuffer。
- 对于输出表,输入 EvictionsIndicator。
- 对于汇总字段,选择 SHAPE_Area。
- 单击运行。
在内容窗格中,EvictionsIndicator 表显示在独立表下。
接下来,您将创建女性资源的指标表。
- 在制表交叉点工具中,仅更改以下参数:
- 对于输入类要素,选择 ResourcesBuffer。
- 对于输出表,将名称更改为 ResourcesIndicator。
- 单击运行。
在内容窗格中,ResourcessIndicator 表显示在独立表下。
- 打开两个指标表。
- 单击其中一个表格的选项卡并拖动,直到看到停靠选项。 将其停靠在另一个表格的右侧。
每个表都包含一个 PERCENTAGE 字段,用于衡量对两种不同事物的访问。
更高的驱逐百分比值是不好的,因为它们代表了对人们的强制驱逐。 另一方面,获得妇女资源是一个很好的措施。 因此,更高的百分比意味着增加获得针对不同性别的服务的机会。
- 在表下,关闭两个表并保存该工程。
接下来,您将把驱逐和资源指标表连接到人口普查区域,以便获得每个区域的百分比。
组织内容窗格
现在,您已经获得了指标所需的所有数据,您可以在连接数据之前快速组织内容窗格。 您将创建一个图层组来帮助组织图层。
- 在内容窗格中,按下 Ctrl 并单击除了 NYC Census Tracts 之外的所有图层以同时将其选中。
- 右键单击一个选定图层,然后选择分组。
这会将所有选定的图层分组到一个称为新图层组的组中。
- 单击名称新图层组一次将其选中,然后再次单击使其可编辑。
- 对于名称,键入 Working Data。
接下来,您将连接指标数据。
将指标表连接到人口普查区域
在独立表中存在 3 个指标:TreePixels、EvictionsIndicator 和ResourcesIndicator。 要将此信息添加至人口普查区域,您需要执行三次连接操作,将指标表中的字段追加到人口普查区域中。
- 在内容窗格中,右键单击 NYC Census Tracts,指向连接和关联,然后选择添加连接。
- 在添加连接工具中,输入以下参数:
- 对于输入表,选择 NYC Census Tracts。
- 对于输入字段,选择 GEOID [GEOID]。
- 对于连接表,选择 TreePixels。
- 对于连接字段,选择 GEOID。
- 使保留所有输入记录复选框处于选中状态。
- 对于连接操作,选择一对第一连接。
- 单击确定。
地图上不会发生任何变化,但属性会被追加到 NYC Census Tracts 表中。 您将完成另外两个连接,然后浏览该表。
接下来,您将为 EvictionsIndicator 和 ResourcesIndicator 表重复连接。
- 打开 NYC Census Tracts 图层的添加连接工具,并输入以下参数:
- 对于输入表,选择 NYC Census Tracts。
- 对于输入字段,选择 GEOID(由于连接,现在有许多输入字段,但任何输入字段都可以使用)。
- 对于连接表,选择 EvictionsIndicator。
- 对于连接字段,选择 GEOID。
- 对于连接操作,选择一对第一连接。
- 使保留所有输入记录复选框处于选中状态。
- 单击运行。
最后,您将把 WomensResources 表连接到人口普查区域。
- 打开 NYC Census Tracts 图层的添加连接工具,并输入以下参数:
- 对于输入表,选择 NYC Census Tracts。
- 对于输入字段,选择 GEOID(由于连接,现在有许多输入字段,但任何输入字段都可以使用)。
- 对于连接表,选择 WomensResources。
- 对于连接字段,选择 GEOID。
- 对于连接操作,选择一对第一连接。
- 使保留所有输入记录复选框处于选中状态。
您已经将所需的所有表连接到 NYC Census Tracts 图层。 接下来,您将把连接的图层导出到其自己的要素类,并在此过程中清理字段。
导出人口普查区域
NYC Census Tracts 图层现在有四个表与之关联。 正如您之前对连接所做的那样,您将把图层导出到它自己的数据源。
- 在内容窗格中,右键单击 NYC Census Tracts,指向数据,然后选择导出要素。
- 在导出要素工具中,将输出要素类参数更改为指标。
当您连接数据时,会将许多字段追加到一个表中,您可能希望删除或重命名一些字段别名以使数据更加清晰。 接下来,您将在导出数据之前清理字段。
- 展开字段,选中使用字段别名作为名称,然后单击编辑。
将出现字段属性窗口。 您将只保留用于探索性分析的字段,并重命名指标字段。
- 如有必要,指向字段部分旁边的垂直分隔线并调整其大小,以便您可以看到完整的字段别名。
- 在字段部分,单击女性的收入中位数是多少?。 在属性部分中,为别名键入中等收入女性。
- 使用相同的工作流,按照说明更改以下每个字段的别名:
- 将女性比男性挣得多吗?改为薪资公平。
- 更改有堕胎禁令吗? 有或无堕胎禁令。
- 更改童婚合法吗? 有或无童婚
- 将白人女性的百分比改为白人女性。
- 将黑人女性的百分比改为黑人女性。
- 将美国印第安人或阿拉斯加土著妇女的百分比改为 AIAN 妇女。
- 将亚洲女性的百分比改为亚洲女性。
- 将夏威夷土著或其他太平洋岛民妇女的百分比改为 NHOPI 妇女。
- 将混血女性的百分比改为混血女性。
- 将西班牙裔或拉美裔女性的百分比更改为西班牙裔或拉美裔女性。
- 将 EducationForWomen 转变为 Education。
- 将 WomenAtReproductiveAge 改为女性生育年龄。
- 将 PctTreeCanopy 更改为树冠。
- 将 PERCENTAGE (EvictionsIndicator.PERCENTAGE) 更改为 Evictions。
- 将 PERCENTAGE (ResourcesIndicator.PERCENTAGE) 更改为 Gender Based Resources。
接下来,您将删除一些不需要的字段。
- 在字段列表中,单击女性教育人口总数,然后单击移除按钮。
- 以同样的方式移除以下字段:
- 获得学士学位或更高学位的女性。
- 生殖健康方面的女性人口总数。
- 15 至 44 岁育龄妇女。
- 单击确定关闭字段属性窗口,然后再次单击确定运行导出。
指标图层出现在地图和内容窗格中。
- 打开指标图层的属性表并向右滚动,直到看到用作字段标题的更新别名。
在导出过程中修改别名是使表更容易解释的好方法。 现在,区域图层中的所有指标都可用了。 您可以将这些指标字段用于符号系统、标注、查询和分析。
您已经根据表中的坐标创建了点图层来绘制驱逐和妇女资源的地图。 您将驱逐和妇女资源点缓冲了半英里,并使用缓冲区为每个变量创建了指标。 您还执行了多次连接,将所有指标放入人口普查区域图层,并将其导出到自己的要素类中。 您创建的两个指标表测量接近度,但原因非常不同。 较高的驱逐比例是不好的,因为它代表着强迫驱逐,但重要的是要强调这个问题所涉及的领域。 另一方面,获得妇女资源是一项积极措施,因为妇女在这些领域得到更多支持。 接下来,您将把驱逐和妇女资源表连接到人口普查区域,并使用探索性数据分析更深入地挖掘数据关系。
使用图表和符号系统浏览数据
既然所有指标都在一个图层中,您将探索散点图矩阵中的变量,以更好地了解它们的关系。 进行任何分析的一个重要部分是在计算完成后评估结果数据。 由此将帮助您确定数据集是否包含偏斜数据分布,这可能会影响您的分析并告知是否需要实施附加调整或方法以获得最精确的分析结果。
探索指标数据
您将创建一个散点图矩阵以比较各个指标之间的关系。 这是一种确定正相关、负相关以及相关程度或量级的有效方法。
- 在内容窗格中,右键单击指标图层,指向创建图表并选择散点图矩阵。
随即显示图表属性窗格和一个空白图表窗口。 当您在图表属性窗格中设置属性时,图表将在图表窗口中自动显示和更新。
- 在变量部分,单击选择。
将显示指标图层中的属性列表。 对于散点图矩阵,必须至少选择三个变量。 您想要探究的变量之一是收入中位数,但它没有显示在列表中。
- 打开 Indicators 图层的字段视图。
- 找到 Median Income Women 字段并查看其数据类型。
Median Income Women 字段具有文本类型。 您不能在散点图矩阵中绘制文本字段,因此您必须添加一个数值字段并对其进行计算以存储收入值。
- 使用您在本教程中学习的技能,添加一个名为 WomensMedianIncome 的字段,其别名为 Womens Median Income,数据类型为 Double。
- 基于 Median Income Women 字段计算 WomensMedianIncome。
您可以在计算中忽略任何警告。
- 在图表属性窗格中,单击选择。
- 在“变量”列表中,选中薪资公平、教育和女性收入中位数复选框。
所选变量均已列出。
显示在散点图矩阵的变量。
- 在趋势下,单击显示趋势线。
每个变量都会出现趋势线,以指示该变量的趋势。
- 在矩阵布局部分中,对于左下方,确认已选择散点图,对于右上方,单击下拉菜单并选择 Pearson's r。
散点图矩阵允许您在单个图表中探索许多关系。 它可视化了所选变量之间的关系。 接下来,您将探索白人、黑人和拉丁裔女性的经济结果之间的关系。
- 在图表属性窗格中,对于变量,单击选择并选中 White Women、Black Women 以及 Hispanic or Latino Women 的复选框。
这些迷你图显示了带有发散颜色的 r 值,这些颜色与关系的强度和方向相对应。
接下来,您将对迷你点图进行排序。
- 在图表属性窗格的排序部分,单击排序依据下拉菜单,然后选择 Pearson's r。 对于目标字段,选择女性收入中位数,对于排序方向,选择降序。
通常,这些值介于 +1 和 -1 之间。 散点图矩阵中有三种关系:
- 正相关,值更接近 +1。
- 无相关性,值接近 0。
- 负相关,值更接近 +1。
三幅点图显示了很强的正相关,值分别为 0.8、0.55 和 0.6。 接下来,您将探索每种关系的变量。
- 在图表中,单击 Pearson 相关系数值为 0.8 的框。
散点图矩阵中概括了 Education 和 Womens Median Income 对应的散点图。
值为 0.8 的点图表示教育和女性收入中位数变量之间的关系。 预计随着教育程度的提高,收入也会增加。
- 单击 r 值为 0.55 的框。
显示了 White Women 变量的散点图。 白人女性和收入中位数之间有很强的正相关关系,所以随着白人女性比例的增加,收入中位数也会增加。
- 单击 r 值为 0.6 的框。
散点图显示了 White Women 和Education 变量之间的关系。 根据图表,随着白人女性比例的增加,拥有学士学位或更高学位的女性比例也在增加。 接下来,您将探索黑人女性是否也有类似的关系。
- 在图表中,单击 r 值为 -0.26 和 -0.32 的框。
将高亮显示 Black Women 的散点图,其中显示了黑人女性、收入和教育之间的关系显示出负相关;因此,随着这两个群体的百分比增加,收入和教育都在下降。
- 要研究西班牙裔或拉丁裔女性、收入和教育之间的关系,请单击 r 值- 0.43 和 -0.47。
西班牙裔或拉丁裔妇女、收入和教育之间的关系显示出负相关;因此,随着这两个群体的百分比增加,收入和教育都在下降。
- 选择 r 值为 -0.63 的框。
所选的点图表示黑人女性和白人女性百分比之间的关系,这意味着随着一个群体的百分比增加,另一个群体的百分比减少。 因此,很可能这两个群体经常不住在同一个地区。
- 关闭除地图之外所有打开的窗口。 关闭图表属性窗格,然后保存工程。
您刚刚使用带有 Pearson r 值的散点图矩阵研究了数据。 如果您要在索引中使用这些指标,您需要考虑它们对结果是否重要和/或指标是否是索引的焦点。 例如,您不会将种族和/或民族包括在索引值计算中;但是,您可以使用这些因素来分解索引。 接下来,你将考虑另一个例子:薪资公平。 薪酬公平是女性和男性之间收入的衍生变量。 薪资公平为如何通过收入衡量性别平等提供了很好的见解,但对于具有当前指标集的索引,您可能希望将其排除在外。 你已经有了收入中位数作为变量。 此外,如果您要扩展这些主题领域,并考虑拥有像收入中位数、薪酬平等和其他一些数据点的经济学这样的子索引,效果会更好。
映射一个指标
现在,您已经使用散点图矩阵浏览了指标数据,并对变量有了一定的了解,您将使用双变量符号系统显示指标图层。 您将创建教育和收入的关系图。 关系图显示了两个变量的可视化表示。 这将帮助您在多个维度上看到指标的相互作用,这通常被称为超多样性或交叉性。
- 在内容窗格中,右键单击指标图层,然后单击符号系统。
随即显示符号系统窗格。
- 对于主符号系统,单击下拉菜单并选择二元色彩。
- 对于字段 1,选择教育。
- 对于字段 2,选择女性收入中位数。
- 对于方法,确认选择了分位数。
- 对于格网大小,确认已选择 3 x 3,并保留粉红色-蓝色-紫色配色方案。
接下来,您将更改轮廓颜色。
- 对于模板,单击现有颜色。
- 单击属性选项卡。 对于轮廓颜色,单击现有颜色并选择灰色 30%。
- 对于轮廓宽度,将当前值更改为 0.2 pt。
- 单击应用。
这将从低到高表示教育和收入中位数的关系。 在女性受教育程度和收入中位数都很高的地方,这些区域会被染成紫色。 这个地区主要在曼哈顿和布鲁克林的部分地区。
- 将图层名称更改为女性的教育水平 x 收入中位数。
- 保存工程。
您刚刚完成了探索性数据分析的两种方法:图表和映射。 使用图表,您可以调查关系强度并确定要从索引中排除的指标。 通常,这些是高度相关的指标,可能会扭曲索引值。 可视化地图可以让您看到多个指标的模式,这是理解社会过程的关键。
在本教程中,您介绍了种族平等和社会公正的地理方法,并将其应用于指标开发。 您使用美国社区调查数据准备了指标图层,以获取教育、薪酬和收入数据。 您还学习了如何对影像进行重分类,以及如何根据面区域中的像素计算树冠。 然后,您开发了一个基于接近度的指标来查看基于性别的资源的获取情况。 最后一步是执行探索性数据分析,您可以用它来识别高度相关的指标,这些指标可能会扭曲一个索引。
您可以将这种指标的开发方法应用到世界上其他感兴趣的领域,并且可以包含特定于您所在社区的数据。 当准备自己的指标时,请使用数据处理和针对您的长期目标、结果和人群的指标。 您可以在这篇博文中找到更多关于探索性数据分析的内容。
您可以在教程库中找到更多教程。