背景描述判断再犯风险时,种族歧视问题常常被过分扩大导致不公平。为了探讨一种更为公平的评定方式呢,佛罗里达州所有被告的人口统计和重新犯罪数据是可用的
想象这样一个情景:一位调查记者正在撰写一篇关于一名非裔美国被告的文章,该被告在等待审判期间被拘留。一个名为“矫正罪犯管理评估替代制裁”(COMPAS)的工具认为他有重新犯罪的风险。重新犯罪是指某人重新陷入犯罪行为。评分让法官相信,必须拘留被告,而不考虑任何其他论据或证词。他被关了许多个月,在审判中被判无罪。自审判以来已经过去了五年多,他没有被指控犯有任何罪行。你可以说,重新犯罪的预测是一个假阳性。
尽管种族不是这些问题中的一个,但许多这些问题可能与种族相关联。更不用说,在某些情况下,它们可能更多是主观意见而非事实的问题,因此容易受到偏见的影响。
因为几乎所有犯罪数据不是公开可用的。然而,幸运的是,佛罗里达州同一个县的所有被告的人口统计和重新犯罪数据是可用的。
数据说明• age:连续变量;被告的年龄(在18到96之间)。• juv_fel_count:序数变量;青少年重罪数量(在0到2之间)。• juv_misd_count:序数变量;青少年轻罪数量(在0到1之间)。• juv_other_count:序数变量;既不是重罪也不是轻罪的青少年定罪数量(在0到1之间)。• priors_count:序数变量;之前犯罪的数量(在0到13之间)。• is_recid:二元变量;被告在2年内是否重新犯罪(1表示是,0表示否)。• sex:分类变量;被告的性别。• race:分类变量;被告的种族。• c_charge_degree:分类变量;被告目前被指控的罪行等级。美国将刑事罪行分类为重罪、轻罪和违规行为,按照最严重到最不严重排序。这些进一步细分为不同的等级,从第1级(最严重的罪行)到第3级或第5级(最不严重)。然而,尽管这是联邦罪行的标准,它是根据州法律定制的。对于重罪,佛罗里达州有一个级别系统来确定犯罪的严重性,不管其等级如何,这个系统从10级(最严重)到1级(最轻)。这个特征的类别以F开头表示重罪,以M开头表示轻罪。它们后面跟着的数字对于重罪是一个级别,对于轻罪是一个等级。• compas_score:二元变量;COMPAS将被告评分为“低风险”、“中风险”或“高风险”。实际上,“中风险”经常被决策者视为“高风险”,因此这个特征被转换为二元变量以反映这种行为:1表示高/中风险,0表示低风险。数据来源https://www.propublica.org/datastore/dataset/compas-recidivism-risk-score-data-and-analysis
信息
cox-violent-parsed_filt.zip
(683.15 KB, 需要: RMB 8 元)
本附件包括:- cox-violent-parsed_filt.csv