|
这意味着,一个对个人7%的数据有外部了解的窥探第三方可以重新识别她,并获得剩下的93%。相反,我们观察到,对于粒度最小的数据集DM24,重新识别平均需要32个数据点,或个人数据的51%c(DM24)=32,r(DM24)=51%. 因此,如果DM24被公布,第三方平均需要对个人数据的51%进行外部了解,才能重新识别她并获得剩余的49%。3.2效用结果图2显示了专家对每个粒度级别的数据效用的评估。我们观察到,随着数据在空间和时间上的泛化,数据有用性会下降,对于粒度最大和最小的数据集(DZ1和DM24),其值从9.3到4.0不等。实用程序图2:实用程序结果。每个概括文件中移动电话元数据的有用性。灰色条表示自举95%置信区间。空间粒度级别为Z=邮政编码,D=地区,M=直辖市。3.3隐私实用程序权衡图3显示了隐私实用程序权衡的结果。每一点代表一个通用数据集,评估有用性和再识别风险,其中最佳位置对应右上角的高有用性和硬再识别。我们观察到有用性和隐私之间的尖锐权衡。最细粒度的数据集dz1最有价值,有用性得分为9.3;然而,它也是最容易重新识别的数据集,平均而言,只有7%个人数据的外部知识的第三方可以重新识别个人,并获得其余93%的个人信息。
|