楼主: 时光永痕
898 0

[数据挖掘新闻] 因此,有97%的国家/地区拥有开放数据-但这就是全部吗? [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)八级

4%

威望
0
论坛币
26 个
通用积分
57.2238
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34180 点
帖子
2732
精华
0
在线时间
321 小时
注册时间
2020-7-21
最后登录
2024-8-1

楼主
时光永痕 学生认证  发表于 2020-10-22 18:52:29 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
因此,有97%的国家/地区拥有开放数据-但这就是全部吗?
今天,我们的世界比以往任何时候都更受信息的推动。社交媒体,技术,整个互联网–所有这些都为一个好奇的社会做出了贡献,这个社会不会容忍知识鸿沟,尤其是在企业和政府方面。在线数据量惊人,并且如果被释放,则可以促进更高效,响应迅速和有效的社会,刺激经济增长并释放无限潜力。
开放数据集的全局图
在超过115个国家/地区的研究中,有97%的人可以使用某种形式的公开数据。但是,此统计信息可能比实际情况描绘的更乐观。只有74%的数据集是最新的,并且只有24%的数据集无需许可证即可访问和下载。可用数据的一半以上可以通过可重用的方式访问,从而使47%的数据无法用于进一步的研究或可比性。在下面,您可以看到在全球范围内访问开放数据的一些常见障碍,以及它们在类别之间的比较方式。
让我们再来看一下美国境内开放数据的统计数据。从所有国家的地图来看,其主要数据集的全面性表明知识库不均衡。虽然某些州(例如,科罗拉多州)在公司类别(该州内所有公司的登记册)中得分为A +,但其他州(例如加利福尼亚州)的得分为F。该得分的下降是由于与全球数据类似的因素,例如不完整,无法验证,无法比较且具有许可限制。  
同样重要的是要认识到各个城市可能更倾向于共享开放数据,制定法律和计划以推动关键数据集的透明性和全面性。例如,华盛顿特区有证据表明,他们打算从2006年开始在哥伦比亚特区开始发布城市运营指标的开放数据集,而康涅狄格州则在2014年启用了全州范围的开放数据门户。在这个地方,可用的开放数据可能会偏向少数地区。
了解开放数据的可比性
使用中的许多数据集的本质是,可比性始终是很难破解的。例如,在犯罪或医疗保健等问题上,国家之间存在太多变量,无法可靠地比较数据并得出明智的结论。但是,相反,某些数据将易于在各个州之间进行比较,例如检查或许可证的公开数据,各地的说法普遍相似,要求市政检查员遵守有关合规性,健康与安全的国家法律。
在一个类别中,没有关于如何组织和发现开放数据的既定标准,这在使用关键数据集的全面来源时会引起一些混乱。例如,在密苏里州堪萨斯城,有关建筑许可的公开数据按年份和地理位置细分。这将迫使研究人员梳理几个不同的数据集,以对整个主题有一个很好的了解。总体而言,我们的研究人员发现,美国范围内公开数据的质量和数量之间几乎没有关联,某些州(如波士顿)的数据集数量有限,但仍然涵盖了广泛的主题。其他人可能拥有大量数据,但是由于数据杂乱无章或不完整–这些数据的价值值得怀疑。
Apertio:消除噪音
Apert.io是第一个开放数据的全球数据库和搜索引擎,始于美国,并不断扩大其范围。它具有全球最大的覆盖范围,其中包括2000多个开放数据站点,这些站点合计拥有数万亿条记录。从单一访问点开始,就可以发现,获取和轻松访问历史上群众无法访问的数据。
通过数据内搜索,Apert.io在竞争中处于领先地位,发现数据中的洞察力,而不是依赖发布者的分类-其中许多分类不完整或不准确。这样,我们的数据既全面又可比较,使用户可以找到真正满足其需求的数据。数据分析师可以快速而准确地找到他们想要的信息,而数据发布者可以从数量和质量上获得同行数据发布的真实基准。
1
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:加利福尼亚州 科罗拉多州 数据分析师 我们的世界 加利福尼亚

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-23 10:54