设计公平指数
创建指数的方法并不复杂,但在整个工作流中详细了解每个决策通常是最复杂的部分。
设计阶段是明确定义指数的预期目的、考虑和记录每个指标和权重选择及目的的重要步骤。
注:
有关在 ArcGIS 中创建复合指数的最佳做法的更详细指南,请参阅使用 ArcGIS 创建复合指数的最佳做法 (PDF) 技术论文。
确定指数设计组件
在开发复合指数的设计阶段,您将定义指数将回答的问题,选择和分配组成指数的变量,并确定指数的研究范围。
在确定用于指数的变量或指标之前,与广泛的利益相关者(包括受影响地区的居民)合作定义指数的目的和指数将寻求回答的分析问题非常重要。
- 确定您将纳入设计指数决策过程的利益相关者。
由于您将创建一个与环境正义相关的公平指数,以下是您可以考虑纳入的利益相关者:
- 已在环境正义社区建立信任的社区组织
- 从事环境问题或健康工作的社区联盟
- 卫生服务提供者
- 学术界人士和咨询师等领域专家
- 交通部门
- 公共卫生部门
- 规划和环境监管部门
最重要的利益相关者是受影响社区的成员。 在进行涉及弱势人口的权益分析时,将正在经历不公平待遇的人们纳入决策过程中非常重要。
注:
有关使用 GIS 推进种族公平、社会正义和包容性发展的合作伙伴关系示例,请阅读 Esri 博客文章中的公平和社会正义部分。
- 确定指数的目的和指数将回答的分析问题。
以下是一些问题,可以帮助您缩小指数的目的和分析问题:
- 将如何使用指数图? 它是否能帮助您确定资源分配? 它是否能帮助您识别面临不成比例的社会或环境负担问题的地区?
- 此指数图面向哪些人员? 它是否主要供地方社区成员查看和了解他们的社区? 还是供决策者制定基于数据的政策决策? 还是两者兼有?
- 您需要了解工程区域各个地区的不平等差异,还是最关注负担较重的地区?
在本教程中,指数的目的是创建一个环境正义筛选工具,以确定俄亥俄州与该州的其他地区相比,哪些地区正在经历最严重的环境和社会负担。 您希望回答的分析问题是:整个州的社区承受了哪些累积的环境和社会负担?
现在,您已经定义了分析问题,将与利益相关者合作确定需要包括在指数中的优先事项和维度。
- 确定要包括在指数中的优先事项和维度。
由于您的目标是确定社区所面临的累积环境和社会负担,您的利益相关者认为考虑环境危害暴露和对环境危害的脆弱性将非常重要。
环境危害需考虑潜在的空气污染物和有毒化学物质暴露,以及缓解因素,如与绿地的距离。 对环境危害的脆弱性维度考虑可能会阻止人们具备应对环境危害暴露的资源的社会因素,例如年幼或年长人群、低收入人群以及具有对环境污染更为敏感的现有健康问题的人。
- 选择变量。
建议您寻求熟悉您维度因素的专业知识的专家的建议。 考虑咨询以下类型的资源:
- 领域专业文献,如经过同行评审的学术期刊文章和研究、专业书籍和会议记录
- 领域专家,如社区和倡导从业人员、学术研究人员和教授以及顾问
- 代表其利益的社区成员和团体,特别是生活在历史上受环境正义问题影响的区域的人群
注:
请参阅使用 ArcGIS 创建复合指数的最佳做法 (PDF) 技术论文第 11 页上的“变量选择特别注意事项”部分。
另请参阅经济合作与发展组织 (OECD) 的构建复合指标手册:方法论和用户指南(在线 PDF),该国际组织旨在为公共政策的最佳做法开发数据和进行研究。
在本教程中,您将使用以下变量:
- Asthma prevalence
- Percent unemployed
- Percent with income below 200 percent poverty level in the past year
- Percent over 25 years old with education less than high school
- Percent under severe housing burden (over 50 percent income spent on rent or mortgage)
- Child lead risk (percent children below the poverty level and housing built 1949 or earlier)
- Distance to nearest park
- Average PM 2.5 from 2014 to 2016
- Traffic counts at major intersections
- Amount of toxic chemicals released within one mile
该指标列表并非旨在为环境正义指数提供详尽和全面的内容。 本教程将使用这 10 个指标作为学习资源,展示如何设计和创建复合指数。 在创建环境正义指数时,请确保遵循与您自己司法经验、需求和优先事项相关的步骤。
注:
本教程所选的指标是从 CalEnviroScreen 4.0 中提取的指标样本。 要了解有关这些指标及其所用的 CalEnviroScreen 方法,请参阅 CalEnviroScreen 4.0 (PDF)。
- 设置变量权重。
变量权重表示影响指数的每个变量的相对重要性。 无论您选择保持等权重还是增加权重,决策都应有充分的理由支持。
在本教程中,您不会添加任何权重。 您对这些变量的累积负担感兴趣,因此在这种情况下不需要添加权重。
注:
在本教程的后续部分,由于社会脆弱性变量之间的相关性,您将重新考虑权重。 在教程的该部分将进一步讨论给予子指数加权的理由。
- 选择研究区域和空间单元。
空间单元对应指数中的每个位置,而研究区域则是研究区域内所有空间单元所覆盖的区域。 通常建议您使用尽可能小的区域(或最高分辨率)以确保每个地理单元内的变化很小。 这样可以尽可能确保变量值反映该单元中居民的生活体验。
在本教程中,您对俄亥俄州的研究区域感兴趣。 您将使用人口普查区域作为空间单元。
在本部分中,您已经完成了复合指数工作流的设计步骤。 您确定了利益相关者列表,定义了指数分析问题,选择了无权重变量,并确定了研究区域和空间单元。
创建复合指数
在前面的部分中,您已经学习了设计复合指数的步骤。 工作流的下一步是在创建指数之前创建和准备变量。 为了简洁起见,变量已准备就绪,可供您在 ArcGIS Pro 包中使用。
探索指标
首先,您将下载 ArcGIS Pro 包并使用 ArcGIS Pro 中的工具来探索每个指标,并在创建复合指数之前进行预处理。
- 下载并打开本教程的 ArcGIS Pro 包。
首先,您将探索在 ArcGIS Pro 包中准备好的指标。
- 在内容窗格中,右键单击 OhioEJIndicators 图层,然后选择属性表。
随即出现 OhioEJIndicators 图层的属性表。
- 在属性表中,向右滚动以查看指标。
虽然您可以在要素图层中查看有关数据的更多详细信息,但很难完全了解每个字段的信息范围。 您将使用“数据工程”视图来生成并调查每个指标字段的统计数据。
- 关闭表。
- 在内容窗格中,右键单击 OhioEJIndicators 图层,然后选择数据工程。
数据工程视图随即出现。
- 将 Current asthma crude prevalence (%) 字段拖动到统计面板中。
Current asthma crude prevalence (%) 字段随即添加到统计面板中。 接下来,您将把剩下的九个指标添加到统计面板中。
- 将以下九个指标拖动到统计面板中:
- Percent Unemployed
- Percent income in past year below 2x poverty level
- Percent 25+ Education Less Than High School
- PerSevHousingBurden
- ChildLeadRisk - Mean
- Distance to nearest park (miles)
- Avg PM2.5 2014--2016
- Sum Traffic
- Toxic Release Chemicals (lb/km2) within 1 mile
提示:
要选择多个字段,您可以单击要添加的第一个字段,按住 Shift 键,然后单击要添加的最后一个字段。它们之间的所有字段将被选中。
- 在“数据工程”视图的顶部,单击计算。
随即显示每个字段的统计数据。 在探索数据之前,您将锁定别名列,以便其在滚动统计面板时始终可见。
- 右键单击别名列,然后单击冻结/取消冻结。
别名列现在锁定在统计面板的第一列。
图表预览列显示了每个指标值的直方图。 当观察数据分布并考虑最适合用于您的复合指数的方法时,这将非常有用。
- 滚动到异常值列。
在异常值列中,您可以查看异常值的数据数量。 您还可以使用“数据工程”视图在地图上突出显示它们,以便可以可视化它们的位置。
- 对于 Percent income in past year below 2x poverty level 行,右键单击异常值,然后选择选择异常值。
Percent income in past year below 2x poverty level 指标具有异常值的人口普查区域随即在地图上突出显示。
- 在功能区中,单击地图选项卡,然后在选择组中,单击清除选择以清除选择。
您还可以使用“数据工程”视图根据每个指标的四分位数选择值。
- 在“数据工程”视图的统计面板中向下滚动到 Q3 列。
- 对于 Percent Unemployed 行,右键单击 Q3 值,指向选择,然后单击上四分位数。
第三四分位数以上的值代表该字段所有值的前 25% 部分。 地图随即选择失业率最高的 25% 人口普查区域。
数据工程视图还会识别所有空值。
- 在“数据工程”视图的统计面板中向下滚动到空值列。 对于 Percent 25+ Education Less Than High School 行,右键单击空值,然后单击选择空值。
Percent 25+ Education Less Than High School 指标具有空值的人口普查区域随即在地图上突出显示。 这些区域代表没有任何人口的地区,因此它们具有空值。 计算复合指数工具将自动忽略这些记录并在指数计算中将其排除。
- 继续探索指标。 完成后,清除任何选择并关闭“数据工程”视图。
在本部分中,您使用“数据工程”视图探索了 10 个指标,这些指标将用于创建一个环境正义复合指数。 接下来,您将使用计算复合指数工具来预处理、创建和后处理复合指数。
使用计算复合指数工具
您将使用计算复合指数工具来创建综合指数。 您将探索每个工具参数,以便对指标进行预处理、合并和后处理。
- 在功能区上,单击分析选项卡。 在地理处理组中,单击工具。
- 在地理处理窗格的搜索栏中,键入 calculate composite index。
- 在结果列表中,单击计算复合指数工具。
- 在计算复合指数工具窗格中,对于输入表,选择 OhioEJIndicators。 对于计算复合指数,键入 Ohio_EJIndex。
- 在输入变量旁边,单击添加多个按钮。
- 在添加多个菜单中,选中 10 个指标字段,然后单击添加。
接下来,您将选择预处理和合并指标的参数。 您可以使用缩放和组合变量的预设方法参数,选择常用的缩放和合并指标的方法。 您也可以手动选择缩放输入变量的方法选项和合并缩放后变量的方法选项。
现在,您将保留默认选择,即使用最小值到最大值的缩放方法,通过缩放后的值的平均值来合并值。
- 确保缩放和组合变量的预设方法设为合并值(缩放后值的平均值)。
接下来,您将审查变量权重设置。
- 展开变量权重部分。
此时,您希望每个指标都具有相同的权重,因为您关注它们如何结合和反映社区所面临的累积负担。 您不会改变权重。
最后,您将配置输出设置选项和后处理参数。
- 展开输出设置部分。
- 对于输出指数名称,键入 Ohio_EJIndex。 对于最小值,键入 0,对于最大值,键入 100。
将输出指数的最小和最大值设置为 0 到 100 之间的值可以使生成的指数得分更快速地被理解。
您已完成在计算复合指数工具中设置预处理、合并和后处理参数。
- 单击运行。
随即显示生成的复合指数地图。
注:
请注意,任何指标中存在空值的人口普查区域已从复合指数中排除。
在内容窗格中,Ohio_EJIndex Layers 图层组包含了所有计算复合指数工具的输出。
随即创建两个地图。 Ohio_EJIndex - Mean 以 0 到 100 之间的原始指数值进行样式设置。 它还包含一些图表,用于更详细地研究指数输出。 Ohio_EJIndex - Percentile 通过百分位数值对指数均值进行样式设置。
在继续操作之前,您需要保存工程。
- 在快速访问工具栏上,单击保存。
在下一部分中,您将探索由计算复合指数工具创建的图表,并评估指数结果。
检查缩放后变量的关系
计算复合指数工具将生成复合指数的地图,以及用于评估和估计指数结果的图表。 您将关注矩阵关系图表。
- 在内容窗格中,双击 Relationship of Scaled Variables and Index Variables。
矩阵图表随即出现。 需要特别关注的是底部行,它显示了指数得分与每个指标之间的相关性。
绿色单元格表示高相关性。 换句话说,一个变量的增加会导致另一个变量的增加。 例如,Percent Unemployed and Percent below 2x the poverty level 指标相关性为 55%。
粉色单元格表示负相关性。 换句话说,一个变量的增加会导致另一个变量的减少。 例如,与 Distance to toxic releases 指标呈负相关的是 Percent severe housing burden 指标。 这可能是因为住房负担更与市区相关,而有害物质排放可能与农村地区相关性更高。
在此矩阵图表中还有一个显著的发现,即某些指标的值非常高,例如收入的相关性为 0.85,这意味着最终指数与该指标几乎有 90% 的相关性。 同时还有一些非常低的值,例如与有害物质排放距离的相关性为 0.03。 虽然您对每个输入变量给予了相同的权重,但它们之间的相关性是不同的。 这可能是由于变量的范围或变量之间的相关性所致。
与环境因素邻近性相关的许多指标与指数得分之间的相关性要低得多。 这是可以预期的,因为许多社会脆弱性指标很可能与人口密集地区强相关,因此它们之间也会强相关,从而增加了相关性效应。
通过将指标分组为子指数,可以增强对指标及其之间的相关性的控制。 您决定创建两个子指数,并在指数的下一次迭代中再次将它们组合起来。
- 找到 Toxic Release Chemicals 指标的列。
Toxic Release Chemicals 指标值的分布特别有趣,因为大多数值都非常低,仅少数值非常高。 这意味着在处理这个指标时,最小值-最大值预处理方法可能不是最佳选择,因为该指标存在严重的偏斜。 您决定在下一次迭代中使用百分比数预处理方法来改善此情况。
- 将图表关闭。
您已使用“数据工程”视图来探索指数的指标。 您使用计算复合指数工具对指数进行了预处理、合并和后处理。 该工具创建了指数地图和图表供您研究,并且您确定需要创建子指数来生成更准确的环境正义指数地图。
创建最终指数的子指数
您已经通过组合 10 个指标创建了一个环境公平指数,并使用最小值-最大值预处理方法对其进行了预处理。 在检查生成的复合指数后,您确定最好使用百分位数预处理方法,并为指数的每个维度创建子指数。
创建子指数
您将准备两个子指数 - 一个用于社会脆弱性指标,一个用于环境指标。 您将使用计算复合指数工具创建每个子指数。
- 如果需要,打开地理处理窗格,搜索并打开计算复合指数工具窗格。
- 在计算复合指数工具窗格中输入以下内容:
- 对于输入表,选择 OhioEJIndicators。
- 选中将字段追加到输入表的复选框。
由于您最终将合并子指数得分,建议将工具的输出追加到输入表而不是开始一个新的要素图层和表。
接下来,您将添加与社会脆弱性和结果相关的指标。
- 对于输入变量,单击添加多个按钮。 选中以下字段的复选框:
- Current asthma crude prevalence (%)
- Percent Unemployed
- Percent 25+ Education Less Than High School
- PerSevHousingBurden
- Percent income in past year below 2x poverty level
- 单击添加。
与社会脆弱性相关的五个指标已添加到计算复合指数工具窗格中。
- 对于缩放和组合变量的预设方法,选择组合等级(百分位数平均值)。
- 展开输出设置,输入以下内容:
- 对于输出指数名称,键入 SV subindex。
- 在输出指数的最小值和最大值下,对于最小值,键入 0。
- 对于最大值,键入 100。
- 单击运行。
已在 OhioEJIndicators 图层的属性表中创建并添加了 SV subindex 字段。
- 在内容窗格中,右键单击 OhioEJIndicators 图层,然后单击属性表。 在表中,滚动直到看到 SV subindex 字段。
添加的字段包括五个社会脆弱性指标的预处理值和子指数均值。
接下来,您将使用计算复合指数工具创建环境子指数。
- 在计算复合指数工具窗格中,在输入变量下,指向每个字段,然后单击移除按钮。
- 在输入变量旁边,单击添加多个按钮,然后选中与环境指标相关的字段:
- ChildLeadRisk Score
- Distance to nearest park
- Avg PM2.5 2014-2016
- Sum Traffic
- Toxic Release Chemicals
- 单击添加。
- 确认缩放和组合变量的预设方法已设置为组合等级(百分位数平均值)。
- 在输出设置中,对于输出指数名称,键入 ENV subindex。
- 单击运行。
已将 ENV subindex 的字段添加到 OhioEJIndicators 属性表中。
- 保存工程。
提示:
您可以按 Ctrl+S 保存工程。
您已经创建了两个子指数值,并将它们追加到了 OhioEJIndicators 属性表中。
合并子指数并检查结果
在本部分中,您将使用计算复合指数工具组合这两个子指数,并为环境子指数添加权重。
您不再需要将输出追加到 OhioEJIndicators 属性表中,因此您将取消选中将字段追加到输入表选项。
- 在计算复合指数工具窗格中,更新以下参数:
- 在输入表下,取消选中将字段追加到输入表复选框。
- 对于输出要素或表,键入 Ohio_EJIndex_Final。
- 在输入变量下,移除现有字段,然后添加 SV subindex - Mean 和 ENV subindex - Mean。
在教程的前面部分,您观察到社会脆弱性指标之间存在高度相关性。 它们之间的强相关性影响了总体指数得分,并导致与环境相关的指标对最终指数分数的贡献不大。
通过创建子指数,您对此进行了修正。 除了使用子指数外,负责此环境正义筛查工具开发的专家小组还建议将环境因素的权重增加 50%。
- 展开变量权重部分。 对于 ENV subindex - Mean 字段,键入 1.5。
- 在输出设置中,对于输出指数名称,键入 Ohio_EJIndex_Final。 在附加已分类输出下,选中等间隔、分位数和标准差复选框。
- 单击运行。
Ohio_EJIndex_Final 图层随即显示在地图上。
接下来,您将查看矩阵图,以更好地了解最终指数中两个子指数之间的相关性。
- 在内容窗格中的 Ohio_EJIndex_Final 图层下,双击缩放变量和指数之间的关系图表。
随即显示该图表。
在教程的前面部分,您创建的第一个指数的矩阵图显示了每个变量与其他变量和指数得分之间的相关性。 在此图表中,您可以看到每个子指数的相关性。
与社会脆弱性子指数相比,环境子指数与最终指数的相关性更高。 这是复合预期,因为您为环境子指数添加了权重。
蓝色条柱是每个子指数和最终指数得分的直方图。 对于子指数,分布形成了一条平直线。 这是使用百分位数(而非最小值-最大值)预处理方法的效果。 使用百分位数方法不会保留原始分布。
- 将图表关闭。
接下来,您将比较此结果指数与您创建的初始指数,该初始指数未使用子字数并通过最小值-最大值方法对指标进行了预处理。
- 在内容窗格中,展开 Ohio_EJIndex Layer 图层组。 右键单击 Ohio_EJIndex,然后单击复制。
您还将关闭地图中的所有图层,最终指数图层除外。
- 在内容窗格中,取消选中 Ohio_EJIndex Layers 图层组和 OhioEJIndicators 图层,使之不再可见。
- 在功能区上,单击插入选项卡。 在工程组中,单击新建地图。
- 如果需要,可单击 Map1 视图选项卡。 在内容窗格中,右键单击 Map1,然后单击粘贴。
接下来,您将更新新地图上的底图,使其与原始地图匹配。
- 单击功能区上的地图选项卡。 在图层组中,单击底图,然后选择浅灰色画布。
接下来,您会将 Map1 停靠在第一张地图的旁边,以便可以同时并排查看它们。
- 将 Map1 选项卡拖动并放置在地图选项卡的右侧停靠区域。
您现在可以并排查看这两张地图。 接下来,您还将链接这两张地图的视图,以便在导航其中一张地图时,它们的范围互相匹配。
- 单击功能区上的视图选项卡。 在链接组中,单击链接视图按钮的下半部分,选择中心和比例。
现在,当您缩放或平移其中一张地图时,两张地图的范围将相匹配。
接下来,您将探索俄亥俄州的特定区域,以比较两个指数结果。
- 在任一张地图上,缩放到俄亥俄州东北边缘的克利夫兰市。
通过并排查看这两张地图,您可以看到第一个指数结果与合并子指数的第二次迭代结果的差异。
克利夫兰市是俄亥俄州最大的城市之一。 右边显示的初始指数结果强调了社会脆弱性。 它们与人口密集地区相关性较高,但似乎对潜在的环境危害和风险的影响较低。
第二个指数对环境和社会维度的控制性更高,似乎在第一张地图中对环境暴露的影响更高。 湖边附近有许多有毒排放设施。 还值得注意的是,修订后的指数并不仅仅强调环境危害;它仍然优先考虑具有较高社会脆弱性指标值的地区。
- 缩放到人口较少的俄亥俄州利马市。
利马市包含了整个州排放最多化学物质的有毒排放设施。 在第二张图片中显示的初始指数结果主要强调了社会脆弱性区域。 第一张图像中生成的结果指数中使用的子指数不仅强调了单个设施点对该区域可能产生的巨大环境影响,而且仍然保留了深紫色区域的社会脆弱性区域。
- 保存工程。
在本部分中,您使用计算复合指数工具将两个子指数合并为最终的环境正义指数地图。 您检查了最终指数值中两个子指数的相关性,并将未使用子指数的指数结果与最终指数进行了比较。
进一步探索指数。
指数创建过程的最后一步涉及评估、咨询利益相关者和完善。 虽然在本教程中您不会完成这些步骤,但请考虑自行通过以下步骤进一步探索指数:
- 确保受指数影响的人员参与审查指数。
您可以将地图共享至 ArcGIS Online,并创建一个应用程序,以鼓励利益相关者参与并理解指数分析过程。
您还可以使用 ArcGIS Survey123 创建调查,并在其中加入最终指数地图,以便利益相关者可以针对地图提供具体反馈意见。
注:
要了解关于使用 ArcGIS Instant Apps 创建应用程序的详细信息,请参阅 ArcGIS 教程绘制食品获取情况地图并对其进行分析。 要了解关于使用 ArcGIS Survey123 的详细信息,请参阅 ArcGIS 教程 ArcGIS Survey123 入门。
- 预期将进行迭代并创建更多版本的指数。
指数创建过程通常是一个循环,您在创建指数的过程中会学到新的内容,从而需要添加或移除变量、调整权重或更改组合方法。
- 使用 ArcGIS Pro 中的其他工具进一步分析指数结果。
考虑使用以下工具进行空间聚类和回归分析:
- 热点分析
- 聚类和异常值分析
- 多元聚类
- 广义线性回归
这些工具可以帮助您识别具有高低指数值显著聚类的地区,揭示在研究区域中驱动指数结果的常见模式,并帮助验证所创建指数的设计和有效性。
- 以透明方式传达您的指数创建方法。
在指数创建方法中包含清晰的文档非常重要,包括使用的方法、任何假设、预期用途和指数的局限性。
请参阅以下指数方法文档的示例:
- 联合国开发计划署的人类发展指数 (HDI)
- 美国疾病控制中心的社会脆弱性指数
- 欧盟委员会的欧洲创新评分板
通过使用两个子指数来更好地控制指数的维度和相关性,您已经创建了最终环境正义指数。 您检查了结果,并将更新后的指数与未使用子指数的原始指数进行了比较。
创建一个公平指数实质上是尝试量化一个没有直接变量来定义的现象,比如环境正义。 设计指数的过程、提出正确的问题、选择变量和权重可能既像艺术又像科学。 建议您确保广泛包含利益相关者来支持该过程,在设计中制定每个决策时都要有意识,并准备与利益相关者一起进行迭代和评估结果。
重要的是要理解,创建指数的过程不仅仅是一个按按钮的过程,而是需要有意识地制定决策和协作的过程。 指数地图也不是为了提供您希望理解的抽象现象的答案,而应该被视为帮助解决特定研究区域中特定需求的众多工具之一。
计算复合指数工具是整个指数设计工作流的一部分,它通过在 ArcGIS Pro 中预处理、合并、后处理和评估指数来简化分析步骤。 在本教程中,您使用了各种预处理方法创建指数,并比较了使用和不使用子指数创建指数的结果。
注:
要了解有关计算复合指数工具的详细信息,请参阅使用 ArcGIS Pro 创建复合指数资源页面。
需要注意的是,本教程仅涵盖了“种族平等和社会正义”工作流中的“绘制不公平性地图并对其进行分析”步骤。 工作流中还包含两个重要步骤:实施积极做法(包括确定和应用干预措施来解决不公正性问题);以及管理实现公平目标的进展(包括监测干预措施解决不公正性问题的过程)。
注:
要了解有关实施积极做法的详细信息,请参阅实施环境公平计划教程。 要查看监测公平目标的示例,请参阅地图有助于确保费城抑制衰落之旅的公平性文章。
您可以在教程库中找到更多教程。