在网络上,几乎有您感兴趣的任何主题都有数百万个数据集。如果您想购买一只小狗,则可以找到汇编小狗买家投诉或小狗认知研究的数据集。或者,如果您喜欢滑雪,则可以找到有关滑雪胜地收入或伤害率和参与人数的数据。数据集搜索已为这些数据集中的近2500万建立了索引,使您可以在一个地方搜索数据集并找到数据所在的链接。在过去的一年中,人们已经对其进行了尝试并提供了反馈,现在Dataset Search正式退出测试版。
数据集搜索-滑雪
查询“滑雪”的一些搜索结果包括从最快的滑雪者的速度到滑雪胜地的收入的数据集。
数据集搜索有什么新功能?
根据我们从数据集搜索的早期采用者中学到的知识,我们添加了新功能。现在,您可以根据所需的数据集类型(例如,表格,图像,文本)或是否可以从提供商处免费获取数据集来过滤结果。如果数据集是关于某个地理区域的,则可以查看地图。另外,该产品现在可以在移动设备上使用,我们已经大大提高了数据集描述的质量。但是,一件事情没有改变:任何发布数据的人都可以使用开放标准(schema.org)在自己的网页上描述其数据集的属性,从而使数据集在“数据集搜索”中可被发现。
我们还了解了有多少不同类型的人在寻找数据。有一些学术研究人员正在寻找可以发展其假设的数据(例如,尝试催产素),学生以表格形式寻找涵盖其高级论文主题的免费数据(例如,尝试使用相应过滤器的监禁率),业务分析师和数据科学家在移动应用程序或快餐店等上寻找信息。所有这些都有数据!我们的用户问什么?最常见的查询包括“教育”,“天气”,“癌症”,“犯罪”,“足球”以及“狗”。
数据集搜索-快餐店
查询“快餐店”的一些搜索结果。
您可以在“数据集搜索”中找到哪些数据集?
数据集搜索还为我们提供了Web上的数据快照。这里有一些重点。数据集涵盖的最大主题是地球科学,生物学和农业。世界上大多数国家的政府都会发布其数据,并使用schema.org对其进行描述。美国在可用的开放政府数据集数量上领先,超过200万。以及最受欢迎的数据格式?表格-您可以在数据集搜索中找到超过600万张表格。
您可以在“数据集搜索”中找到的数据集数量继续增加。如果您的站点上有一个数据集,并使用开放标准schema.org对其进行了描述,则其他人可以在“数据集搜索”中找到它。如果您知道一个数据集存在,但是在数据集搜索中找不到它,请要求提供者添加schema.org描述,其他人也将能够了解他们的数据集。
下一步是什么?
数据集搜索已超出测试版,但无论产品旁边是否有“测试版”,我们都会继续对其进行改进。如果您还没有,请试一下“数据集搜索”,然后告诉我们您的想法。
关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!