数据挖掘中的信息安全问题
数据挖掘中的信息安全问题是业内外人士共同关系的问题,在全民线上生活的时代,用户在网上的每一次行动,哪怕是在我们开来毫无意义的一次搜索、一次浏览、一次点评,也会被记录作为数据挖掘的资料数据,被称为用户生成内容(User Generated Content,UGC)。用户在享受精准营销、个性化推荐带来的便捷的同时,也在深深担心个人隐私安全问题;个人处于特定目的对他人网络信息进行数据挖掘的行为被称为人肉搜索,互联网公司掌握如此众多的信息,客户自然而然要担心。数据挖掘本身不存在伦理问题,而且大多数用户的信息只是作为被整合到统一特征范畴的整体当中的一个样本进入到数据挖掘系统中,真正的一对一个性化推荐还远没有普及。对个人隐私的威胁的产生主要来自于当数据一旦被编译成用户的好友圈、爱好、个人消费偏好等个人特征,导致数据挖掘方或者任何可以接近数据集的人,能够辨别特定的个体,便存在利益侵犯的可能性。
2012年1月,谷歌宣布整合包括YouTube、 Gmail、Google 等旗下服务中搜集的用户个人信息,用户将因此从根本上失去在无远弗届的谷歌世界里同时管理和拥有多个不同身份的能力。谷歌的这 一行为已经引起了ZF的注意,代表欧盟监管机构的法国计算机服务与公民自由国家委员会很快给谷歌写信,称初步调查显示新的政策不符合欧盟的数据保护指令。而谷歌等一些互联网公司认为,这些适度的隐私出让可以让用户受益,并带来社会效率的提升。如果没有得到用户足够多的数据并进行分析,Google的搜索结果的满意程度会下降很多。某种程度上来说,正是这些用户数据的数据挖掘,才让互联网提供的各种服务更贴心,只是有的时候它出乎意料的贴心令人不安。