楼主: Destiny灬
1150 4

[经管数据集] [超7000w量级]最新2022年全国POI数据、地图兴趣点数据 [推广有奖]

  • 0关注
  • 8粉丝

硕士生

34%

还不是VIP/贵宾

-

威望
0
论坛币
90 个
通用积分
2.1300
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
375 点
帖子
24
精华
0
在线时间
276 小时
注册时间
2020-6-17
最后登录
2024-7-6

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
[超7000w量级],2022年全国POI数据、地图兴趣点数据

时间区间:2022年,按年度更新。

样本量:全国超7000w。

数据格式:csv格式。

字段:名称,大类,中类,地址,经度,纬度,省份,城市,区域

样例字段:
名称,大类,中类,地址,经度,纬度,省份,城市,区域
房山瓦窑(公交站),交通设施,公交车站,F16路;F16路平峪村区间,115.552934,39.636267,北京市,北京市,房山区
北石门村(公交站),交通设施,公交车站,F16路;F16路平峪村区间;通勤东湖港,115.550820,39.642187,北京市,北京市,房山区
西石门村(公交站),交通设施,公交车站,F16路;F16路平峪村区间;通勤东湖港,115.550673,39.638611,北京市,北京市,房山区

西石门越野卡丁,运动健身,其他,十渡镇西石门村,115.539058,39.634405,北京市,北京市,房山区
北京十渡年底儿采摘园,休闲娱乐,农家乐,十渡镇西石门村,115.537577,39.631749,北京市,北京市,房山区
潇潇家圆,购物消费,其他,十大路与石门路交叉口西150米,115.546633,39.638340,北京市,北京市,房山区
石门路与西太路交叉口,交通设施,道路,房山区,115.548293,39.638143,北京市,北京市,房山区
北京十渡野竹林休闲院,酒店住宿,其他,十渡镇北石门村野竹林休闲院,115.550619,39.642472,北京市,北京市,房山区
北京十渡野竹林休闲院,休闲娱乐,其他,十渡镇北石门村野竹林休闲院,115.550619,39.642472,北京市,北京市,房山区



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:交通设施 休闲娱乐 酒店住宿 数据格式 北京市

回帖推荐

lyhsatan 发表于2楼  查看完整内容

数据我具体看了一下,有一些缺陷,大家慎拍。 1、数据整理不系统,有的是按城市,有的是按省份,广东省就是整个一个700M的csv,没有分城市,一共660万条数据,整理难度较大,仅仅把广州市的数据用SQL筛选,我的X1 carbon需要6分钟。 2、坐标没有转换。作者仅仅把数据从高德爬取下来了,但是没有从高德坐标转为WGS 1984,还需要坐标转换。 3、部分数据有重复爬取,没有进行去重工作。 整体来说,数据很全、量足,但是只能算是直 ...
沙发
lyhsatan 发表于 2022-8-3 21:58:26 |只看作者 |坛友微信交流群
数据我具体看了一下,有一些缺陷,大家慎拍。
1、数据整理不系统,有的是按城市,有的是按省份,广东省就是整个一个700M的csv,没有分城市,一共660万条数据,整理难度较大,仅仅把广州市的数据用SQL筛选,我的X1 carbon需要6分钟。
2、坐标没有转换。作者仅仅把数据从高德爬取下来了,但是没有从高德坐标转为WGS 1984,还需要坐标转换。
3、部分数据有重复爬取,没有进行去重工作。
整体来说,数据很全、量足,但是只能算是直接爬取下来的粗数据,如果要使用进行空间分析,需要进行数据整理、清洗。
已有 1 人评分论坛币 收起 理由
日新少年 + 20 精彩帖子

总评分: 论坛币 + 20   查看全部评分

使用道具

藤椅
lyhsatan 发表于 2022-8-3 21:58:41 |只看作者 |坛友微信交流群
数据我具体看了一下,有一些缺陷,大家慎拍。
1、数据整理不系统,有的是按城市,有的是按省份,广东省就是整个一个700M的csv,没有分城市,一共660万条数据,整理难度较大,仅仅把广州市的数据用SQL筛选,我的X1 carbon需要6分钟。
2、坐标没有转换。作者仅仅把数据从高德爬取下来了,但是没有从高德坐标转为WGS 1984,还需要坐标转换。
3、部分数据有重复爬取,没有进行去重工作。
整体来说,数据很全、量足,但是只能算是直接爬取下来的粗数据,如果要使用进行空间分析,需要进行数据整理、清洗。

使用道具

板凳
Destiny灬 在职认证  发表于 2022-8-3 22:51:09 |只看作者 |坛友微信交流群
lyhsatan 发表于 2022-8-3 21:58
数据我具体看了一下,有一些缺陷,大家慎拍。
1、数据整理不系统,有的是按城市,有的是按省份,广东省就 ...
是的哈,这些都是原始数据,数据量非常全面,你可以用python把所有数据整合成一张大表,然后用到哪个城市就筛选哪个城市的数据
已有 1 人评分论坛币 收起 理由
日新少年 + 20 精彩帖子

总评分: 论坛币 + 20   查看全部评分

使用道具

报纸
lyhsatan 发表于 2022-8-4 11:39:28 |只看作者 |坛友微信交流群
Destiny灬 发表于 2022-8-3 22:51
是的哈,这些都是原始数据,数据量非常全面,你可以用python把所有数据整合成一张大表,然后用到哪个城市 ...
整合一个大表其实也不方便,数据太大,如果要从这个大表里面筛选,更慢,现在不是都分好区域了嘛

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-7-8 18:53