数据来源:2015年9月以前的高铁开通数据来自国家铁路局,2015年9月以后的数据系根据百度百科、知乎回答、豆瓣等自己整理。
特别说明:
(1)2007年4月18日零时实施了第六次铁路大提速,京沪、京广、京哈等既有铁路干线均提速至时速200公里,部分有条件区段列车运行速度达到250公里。因此,可以参考孙广召、黄凯南(2019)的做法,将秦沈客运专线经过地级市的高铁开通时间定义为2007年。
(2)数据中还有一些设计时速200公里的线路,预留速度是多少并不知道,大家不放心的可以将设计时速200公里的线路删去。
第二份数据是2003-2019年城市开通高铁数据
数据包含了两个部分:
1.城市开通高铁数据。根据经过火车站名称利用高德API爬取经纬度,再利用经纬度爬取具体位置X,从X中获得经纬度所在的省份与城市数据。进而可以获得各年高铁开通线路所经过的城市,稍加处理即可获得城市首次开通高铁的数据。
2.上市公司与高铁站距离数据。根据经过火车站名称利用高德API爬取经纬度,结合CSMAR中上市企业注册地经纬度,来计算企业与各年各个高铁站的距离Y。将Y小于5KM、10KM、15KM、20KM视为开通高铁,稍加处理可以获得企业所在城市首次开通高铁数据。
压缩包包含六个文件,其中1类文件有两个,分为(根据年份、省份、城市)去重版和未去重版(未去重版可以根据自己需要计算城市开通高铁线路总和等数据);2类文件有四个,为企业5KM、10KM、15KM、20KM内出现高铁站的最早年份,可视为企业在5KM、10KM、15KM、20KM范围内第一次出现高铁站的年份。
第三份数据为2001-2019年325个城市高铁开通数据


雷达卡






京公网安备 11010802022788号







