搜索
人大经济论坛 附件下载

附件下载

所在主题:
文件名:  示例数据(免费)
资料下载链接地址: https://bbs.pinggu.org/a-3422201.html
附件大小:
76 Bytes   举报本内容
更新!(推荐)之前给大家分享了土地交易的数据 275万土地交易数据(2000-2021) 和详细的爬虫代码,今天给大家带来它的姊妹篇,2000-2021土地转让数据。
数据名称:2000-2021土地转让数据
爬虫软件:Stata 16
来源:中国土地市场网
网址:https://www.landchina.com/
截止日期:2021年3月1日
观测值:81万+
变量个数:32(详见后文)
数据特色:添加了经纬度(根据百度地图API)、添加了所在省份、所在城市和所在区县
爬了20来天,终于搞定了!这个数据虽然比不上上次土地交易数据的275万多,但81万也是非常多的。我不得不再一次强调Stata的爬虫能力,curl 还是非常好用的,特别是对付 post 请求。这里爬取的过程中也会有很多难点,比如:网站只提供前 200 页,如何爬取完整的数据呢?单一的 cookie 爬取太多页以后会触动反爬,又要如何应对呢?大量数据的爬取可能由于网络等原因,导致个别数据有问题,检查和补充完整则非常重要,我看到很多人处理的数据很不够精细,包括一些数据库,所以会了方法以后,还要有一颗细致的心和艺术的情怀。艺术的情怀?对,很多代码是需要想象力和创造力的。不太熟悉 curl 的小伙伴建议先百度找一下相关内容简单学习一下。在代码中,我也是加了非常多的注释便于大家理解。当然,并不是所有小伙伴都对爬虫代码感兴趣,如果向直接获取数据也是可以的!为了让大家更好地了解数据,在附件中提供了示例数据(根据总观测值抽样不到3%,大概又2万+观测值),大家可以免费下载查阅。

具体文件说明如下(完整的附件包含如下内容,如果只需要数据,则只包含2):
数据:2000-2021中国土地转让数据
来源:中国土地市场网
网址:https://www.landchina.com/
截止日期:2021年3月1日
观测值:81万+
文件说明:
1.Chinaland2_2021文件夹中的子文件夹均为爬取过程生成的文件夹
2.最终数据:2000-2021土地转让最终数据(含经纬度).dta
3.爬虫代码
(1)土地转让(链接爬取).do——爬取第一层数据代码(主要为了获取每条信息的网址链接)
(2)土地转让(明细爬取).do——爬取第二层数据代码(明细数据)

各年观测值数量(2021年的数据截止到3月1日):
年份观测值
2000193
2001293
200210,616
200315,573
200429,335
200538,178
200635,276
200755,291
200845,422
2009136,378
2010108,488
2011102,177
201257,965
201358,541
201439,433
201534,046
201624,585
201712,221
20187,064
20192,326
20201,809
2021154

包含变量说明:
序号变量名称
1年份
2链接
3宗地标识
4宗地编号
5宗地座落
6所在省份(经纬度解析)
7所在城市(经纬度解析)
8所在区县(经纬度解析)
9地址
10经度(BD-90坐标系)
11纬度(BD-90坐标系)
12行政区名称
13行政区名称(处理后)
14行政区编码
15原土地使用权人
16现土地使用权人
17土地面积(公顷)
18土地用途
19土地使用权类型
20土地使用年限
21土地利用状况
22土地级别
23转让方式
24转让价格(万元)
25成交时间
26转让单价(万元/平方米)
27省年度转让单价均值(万元/平方米)
28市年度转让单价均值(万元/平方米)
29县年度转让单价均值(万元/平方米)
30省年度转让单价中值(万元/平方米)
31市年度转让单价中值(万元/平方米)
32县年度转让单价中值(万元/平方米)









    熟悉论坛请点击新手指南
下载说明
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。
2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。
3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。
(如有侵权,欢迎举报)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

GMT+8, 2026-1-5 12:38