126 0

[经管数据集] 【数据】各省数据要素发展水平数据+dofile(2011-2023年) [推广有奖]

  • 0关注
  • 0粉丝

已卖:19份资源

硕士生

50%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0.0028
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1570 点
帖子
71
精华
0
在线时间
71 小时
注册时间
2025-1-31
最后登录
2026-2-2

楼主
学习学习实证 发表于 2025-12-18 11:02:47 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
一、数据简介
本数据集包含中国各省级行政区数据要素发展水平相关指标数据,时间跨度为20112023年。
数据要素是数字经济时代的关键生产要素,本数据采用熵值法对30个指标进行综合评价,
构建各省数据要素发展水平指数。


二、理论背景
数据要素是指在数字经济活动中,能够参与生产、分配、交换、消费等环节,并能够
创造价值的数据资源。数据要素发展水平反映了各地区在数据基础设施、数据应用、
数据治理等方面的综合发展状况。


2.jpg




三、核心指标说明
指标名称                  计算方法                          含义


数据要素发展水平指数      熵值法综合评价                    各省数据要素发展综合水平




【详细计算方法】


1. 数据标准化(极差标准化)
   计算公式:s_i = (x_i  min) / (max  min)
   说明:将原始数据映射到[0,1]区间
   Stata代码:
   egen min_x1 = min(x1)
   egen max_x1 = max(x1)
   gen sx1 = (x1  min_x1) / (max_x1  min_x1)
   replace sx1 = 0.0001 if sx1 == 0  /* 避免ln(0)计算错误 */


2. 计算指标比重(p)
   计算公式:p_ij = x_ij / Σx_ij
   说明:计算各省份在每个指标上的比重
   Stata代码:
   egen sums_1 = sum(sx1)
   gen p1 = sx1 / sums_1


3. 计算熵值(e)和信息效用值(g)
   熵值公式:e_j = Σ(p_ij × ln(p_ij)) / ln(n)
   信息效用值公式:g_j = 1  e_j
   说明:熵值反映指标的信息量,信息效用值越大区分能力越强
   Stata代码:
   egen l1 = sum(p1 * ln(p1))
   gen e1 = l1 / ln(403)  /* 403为样本总数 */
   gen g1 = 1  e1


4. 计算指标权重(w)
   计算公式:w_j = g_j / Σg_j
   说明:权重反映各指标在综合评价中的重要程度
   Stata代码:
   egen f1 = rowtotal(g*)
   gen w1 = g1 / f1


5. 计算综合评价指数
   计算公式:Score = Σ(w_j × s_j)
   说明:综合评价指数为所有单项指标评价指数之和
   Stata代码:
   gen score1 = w1 * sx1
   egen 数据要素发展水平指数 = rowtotal(score*)


评价体系包含30个基础指标(x1x30),采用熵值法确定各指标权重,
最终计算得到综合评价指数。


4.jpg




四、数据文件说明
【原始数据文件】
各省数据要素原始数据.xlsx
包含30个基础指标的原始数据
数据格式为面板数据(省份×年份)


【计算结果文件】
计算结果各省数据要素发展水平.dta/.xlsx
包含各省各年度的数据要素发展水平指数
同时包含各指标权重和单项得分


【代码文件】
1. 各省数据要素发展水平数据计算代码.do  Stata版本计算代码
2. 各省数据要素发展水平数据计算代码.py  Python版本计算代码


【参考资料】
1. 指标权重.xlsx  各指标权重说明
2. 数据要素发展水平指标体系.pdf  指标体系构建说明


五、变量说明
变量名称              类型        说明


id                    数值        省份标识
year                  数值        年份
province              字符串      省份名称
数据要素发展水平指数  数值        各省综合评价指数
x1x30                数值        30个基础指标原始值
w1w30                数值        各指标权重
score1score30        数值        各指标单项得分


3.jpg




六、计算方法说明
1. 数据标准化:采用极差标准化方法,将数据映射到[0,1]区间
2. 熵值计算:计算各指标的信息熵
3. 权重确定:根据信息效用值确定各指标权重
4. 综合评价:加权求和得到综合评价指数


各省数据要素发展水平数据+dofile(2011-2023年).zip (1.02 MB, 需要: RMB 28 元)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:dofile file province replace 指标体系构建

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-24 15:51