步骤一:数据爬取。爬虫用到python的requests、demjson和pandas三个模块,通过更改参数分年度下载,其中:
1.requests模块是向服务器发起请求
2.demjson适用于解析非标准json字符串
3.pandas用于数据整理和输出结果
步骤二:数据整理。用stata的xls2dta命令批量导入并合并多个excel文件。
以下为过程文件展示截图:
|
楼主: 水上浮萍1996
|
4373
12
[学习资料] 【爬虫】和讯网企业社会责任2010-2019年数据整理及详细代码(python+stata) |
|
已卖:198份资源 讲师 26%
-
|
| ||
|
|
| ||
扫码京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


