48 0

[经管数据集] 【数据】各省融资问题重视度与行动力python-do数据2002-2024年 [推广有奖]

  • 0关注
  • 0粉丝

已卖:144份资源

讲师

76%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
36.2050
学术水平
25 点
热心指数
27 点
信用等级
25 点
经验
6735 点
帖子
264
精华
0
在线时间
256 小时
注册时间
2024-9-24
最后登录
2026-1-9

20周年荣誉勋章

楼主
学软件我快乐 发表于 昨天 17:33 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
一、数据概述
数据名称:省级融资问题重视度与行动力数据
数据范围:2002-2024年
数据层级:省级面板数据(省份 × 年份)
数据来源:各省份政府工作报告文本词频分析
构建方法:TF-IDF(词频-逆文档频率)加权方法
参考文献:官员企业经历能降低公司债务融资成本吗?


4.jpg


二、核心指标说明
本数据集包含两个核心指标,均基于省级政府工作报告的文本分析构建:


1. 融资问题重视度(Emph_D)
   - 变量名:融资问题重视度Emph_D
   - 含  义:衡量省级政府在工作报告中对融资问题的关注和重视程度
   - 词汇范围:从"缓解企业融资"到"融资额"的一系列融资相关词汇
   - 值域特征:连续型非负数值,值越大表示重视程度越高


2. 融资问题行动力(Action_D)
   - 变量名:融资问题行动力Action_D
   - 含  义:衡量省级政府在工作报告中就融资问题提出的具体行动措施力度
   - 词汇范围:从"引导金融机构"到"金融科技"的一系列政策行动词汇
   - 值域特征:连续型非负数值,值越大表示行动力度越强


3.jpg




三、TF-IDF加权计算方法
单词j的TF-IDF加权值 = [(1 + ln(tf_j)) / (1 + ln(a))] × ln(N / df_j)


其中:
  tf_j  = 词汇j在该份政府工作报告中出现的原始频次
  a     = 该份政府工作报告的总字数
  N     = 语料库中政府工作报告的总篇数(即数据集的观测总数)
  df_j  = 至少包含词汇j一次的政府工作报告篇数


最终指标计算:
  Emph_D   = 重视度维度所有词汇TF-IDF加权值之和
  Action_D = 行动力维度所有词汇TF-IDF加权值之和


2.jpg




四、数据变量列表
计算结果数据(计算结果省级版本.dta / .xlsx)包含以下变量:


  变量名                     类型      说明
  ─────────────────────────────────────────────────────────────────
  省份                       字符串    省份全称(如"北京市""广东省"等)
  省份编码                   数值型    省份行政区划编码(如11=北京、44=广东)
  年份                       数值型    数据年份(2002-2024)
  融资问题重视度Emph_D       数值型    融资问题重视度指标(TF-IDF加权)
  融资问题行动力Action_D     数值型    融资问题行动力指标(TF-IDF加权)


1.jpg


五、文件清单
本数据包包含以下文件:


(一)原始数据文件
  1. 政府工作报告文本词频数据.dta     —— Stata格式原始词频数据
  2. 政府工作报告文本词频数据.xlsx    —— Excel格式原始词频数据
  3. 省份编码信息数据.dta             —— 省份名称与行政区划编码映射表


(二)计算结果文件
  4. 计算结果省级版本.dta             —— Stata格式计算结果(主数据)
  5. 计算结果省级版本.xlsx            —— Excel格式计算结果


(三)计算代码
  6. 省级融资问题重视度与行动力数据计算代码.do   —— Stata版计算代码
  7. 省级融资问题重视度与行动力数据计算代码.py   —— Python版计算代码


(四)评估代码
  8. 省级融资问题重视度与行动力数据评估代码.do   —— Stata版数据质量评估代码
  9. 省级融资问题重视度与行动力数据评估代码.py   —— Python版数据质量评估代码


(五)参考文献
  10. 官员企业经历能降低公司债务融资成本吗_.pdf —— 方法论参考文献


(六)评估报告
  11. 数据质量评估报告_YYYYMMDD/                —— 评估输出文件夹(运行评估代码后生成)
      ├── 评估日志_YYYYMMDD.log
      ├── 数据分布分析/     (描述性统计表:全样本、分年度、分省份)
      ├── 分布图/           (直方图、核密度图、箱线图、散点图矩阵、时间趋势图等)
      ├── 异常值检验/       (IQR法、Z-score法异常值明细)
      ├── 逻辑合理性验证/   (时间连续性、省份编码一致性、年度变化率)
      └── 稳健性测试/       (分期对比、缩尾处理、排除特殊年份等)




六、使用说明
1. 直接使用计算结果
   - 打开"计算结果省级版本.xlsx"或加载"计算结果省级版本.dta"即可使用
   - 可通过"省份编码"和"年份"变量与其他省级面板数据进行合并


2. 重新计算数据
   - Stata用户:运行"省级融资问题重视度与行动力数据计算代码.do"
     (需要Stata 15+版本)
   - Python用户:运行"省级融资问题重视度与行动力数据计算代码.py"
     (需要pandas、numpy库)
   - 运行前请确认工作路径指向本数据包所在文件夹


3. 运行数据质量评估
   - Stata用户:运行"省级融资问题重视度与行动力数据评估代码.do"
   - Python用户:运行"省级融资问题重视度与行动力数据评估代码.py"
     (需要pandas、numpy、matplotlib、seaborn、scipy库)
   - 评估结果将自动保存到以日期命名的输出文件夹中


4. 数据合并示例
   - Stata:  merge 1:1 省份编码 年份 using 计算结果省级版本.dta
   - Python: df.merge(result, on=["省份编码", "年份"], how="left")


省级融资问题重视度与行动力数据2002-2024年.zip (7.5 MB, 需要: RMB 32 元)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python Matplotlib Excel格式 z-score matplot

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-11 01:31