楼主: cennavi_lc
526 0

[经管数据集] 【工具变量】地方ZF数字化建设指数(2007-2025年) [推广有奖]

  • 0关注
  • 14粉丝

已卖:1958份资源

教授

27%

还不是VIP/贵宾

-

威望
0
论坛币
90 个
通用积分
47.1439
学术水平
4 点
热心指数
7 点
信用等级
4 点
经验
16383 点
帖子
500
精华
0
在线时间
670 小时
注册时间
2022-7-23
最后登录
2025-12-19

楼主
cennavi_lc 在职认证  发表于 2025-5-27 13:43:41 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据简介:自2000年时任福建省省长的习近平提出建设“数字福建”以来,中国各省市级政府便接连开始了建设数字化政府的探索和实践。根据中国信通院发布的《数字时代治理现代化研究报告 -- 数字政府的实践与创新》,中国的数字化政府建设在经历了“电子政务”阶段和“互联网+政务服务”阶段后,已经成为数字治理新格局下的国家顶层设计。

鉴于政府部门的数字化建设是其拥抱“数字化浪潮”的关键行为轨迹,无法通过传统的观察数据进行衡量,因此从非结构化的文本大数据中提取有效信息,将定性语义转化为定量指标是现阶段可供操作的测算方法。我们首先利用Python语言批量搜集和整理了2007~2025年中国各城市的《政府工作报告》,并基于Java PDFbox组件进行识别和文本转换,转为txt文件并整理保存为csv文件;第二,对“数字化政府”关键词典中的所有词汇进行词频统计。为减少文本分析中的噪声干扰,本文剔除了《政府工作报告》中的前置停用词、否定词和标点符号等;第三,计算在TF-IDF中引入包含时间维度的逆文本频率,具体公式为:

图3.png 其中,ln[tfct(θ)+1]表示城市c在第t年公布的《政府工作报告》中包含的关键词θ的统计词频(Term Frequency,TF); 图4.png 为对应关键词θ的逆文本频率(Inverse Document Frequency,IDF),CGt和cgt(θ)分别代表在第t年样本中的《政府工作报告》文本总量以及包含关键词θ的文本总量;最后参考杨海生等(2020),计算每年各地方政府财政支出与全国财政支出比率,进行加权调整,最终得到本文计量模型中使用的数字化政府建设指数。
数据来源:地方官网时间跨度:2007年-2025年数据范围:地级市数据格式:excel包含指标

年份

省份

城市

地级市财政支出

国家财政支出

比率

TF-IDF

数字化政府建设指数


样例数据 图1.png 图2.png
参考文献:[1]刘文革,耿景珠,杜明威.数“政”强贸:数字化政府建设与中国出口产品质量升级[J].数量经济技术经济研究,2024,41(06):67-87.

[2]杨海生,柳建华中山大学岭南学院,连玉君中山大学岭南学院,等.企业投资决策中的同行效应研究:模仿与学习[J].经济学(季刊),2020,19(04):1375-1400.

下载链接 【工具变量】地方政府数字化建设指数(2007-2025年) (76 Bytes, 需要: RMB 15 元)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:工具变量 地方ZF 数字化 数量经济技术经济研究 Frequency

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-20 06:51