5609 6

[Python] 爬虫系列(2)如何用报纸构建指数-- 基于《光明日报》、《人民日报》、《经济日报》 [推广有奖]

已卖:281份资源

博士生

25%

还不是VIP/贵宾

-

威望
0
论坛币
2038 个
通用积分
41.2181
学术水平
3 点
热心指数
7 点
信用等级
3 点
经验
2932 点
帖子
205
精华
0
在线时间
269 小时
注册时间
2020-6-24
最后登录
2025-6-22

楼主
计量模型研究院 发表于 2020-9-17 14:22:04 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

一、报纸文本分析

报纸文本分析是指基于某份报纸统计关键词出现频率及出现时间,并以此为依据构造宏观经济变量,如Baker基于《南华早报》构建经济政策不确定性指数。

二、报纸文本分析的应用

基于报纸的文本分析常用于构建指数,如Baker2016基于《南华早报》中的“中国、经济和不确定性”词频,构建了中国经济政策不确定性指数。朱军(2017)基于中国编辑、出版发行的《经济日报》、《人民日报》和《光明日报》对中国的财政政策不确定性问题构建指数,并分析了指数的波动特征和趋势变化特征。林建浩等()

二、关键词爬取

平台:Python

方法:JavaScript网页分析+ bs4

数据内容:日期,网页链接,标题,内容

爬取结果如图所示:

图片1.png

三、中国财政政策不确定性指数构建

(一)数据处理

指数编制参考Bloom, Baker and Davis(2016)的方法,参照朱军(2017)的关键词,对于每一份报纸,记录包含以下内容条件的文章频次:“财政支出”、“转移支付”、“地方债务”、“财政体制”、“养老金”、“财税改革”、“政策试点”、“增值税”、“消费税”、“企业所得税”、“个人所得税”、“房产税”、“税收政策”。具体而言,以任意一个关键词的文章数量为基准,度量了同时包含上述词频中任意一个关键词的文章的数量,再用样本期间的数据的标准差对时间序列进行标准化。每份报纸的简单平均数为最终指数。最后把这个平均值进行标准化,使其在样本区间的均值为100,公式如下:

图片2.png

(二)基本结果

1. 周度数据结果

注:左为综合指数,右为各分项指数

图片3.png

2. 月度数据结果

注:左为综合指数(也即财政政策不确定性指数),右为各分项指数

图片4.png

四、参考文献

朱军.中国财政政策不确定性的指数构建、特征与诱因[J].财贸经济,2017,38(10):22-36.

BakerS.RBloom,N,& Davis,S.J.Measuring Economic Policy Uncertainty [J].Quarterly Journal of EconomicsVol.131No.42016pp.15931636


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:光明日报 人民日报 经济日报 如何用 uncertainty

已有 1 人评分论坛币 收起 理由
happy_287422301 + 100 精彩帖子

总评分: 论坛币 + 100   查看全部评分

沙发
计量模型研究院 发表于 2020-10-16 08:51:21
【模型代码及实现案例(汇总)】计量模型研究院出品
https://bbs.pinggu.org/thread-8702796-1-1.html
已有 1 人评分经验 论坛币 收起 理由
happy_287422301 + 100 + 20 热心帮助其他会员

总评分: 经验 + 100  论坛币 + 20   查看全部评分

藤椅
happy_287422301 在职认证  发表于 2021-11-15 11:38:21
感谢分享!

板凳
zjune724 学生认证  发表于 2023-7-16 15:59:51
亲,有代码吗

报纸
Rockyhee22 发表于 2023-9-27 09:49:31
麻烦发一下邮箱,349558491@qq.com

地板
yufan1983 发表于 2023-10-8 19:21:13

麻烦发一下邮箱,99675360@qq.com

7
Melissarr 发表于 2024-3-6 23:04:09
求代码,2627113819@qq.com

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-5 16:46