楼主: 小王爱吃羊
295 0

[经管数据集] 【更新至2024】企业数字赋能2024-2000上市公司数据逆文本频率TF-IDF计算含stata [推广有奖]

  • 1关注
  • 6粉丝

已卖:896份资源

教授

1%

还不是VIP/贵宾

-

威望
0
论坛币
517 个
通用积分
27.3143
学术水平
424 点
热心指数
426 点
信用等级
424 点
经验
28018 点
帖子
496
精华
0
在线时间
657 小时
注册时间
2024-9-24
最后登录
2025-12-31

20周年荣誉勋章 初级热心勋章 中级热心勋章

楼主
小王爱吃羊 学生认证  发表于 2025-6-7 14:21:03 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据介绍:
  • 年份:2000-2024
  • 围:A股上市公司
  • 三个版本:企业数字赋能(未剔除未缩尾)、企业数字赋能(已剔除金融STPT未缩尾)、企业数字赋能(已剔除金融STPT已缩尾)
  • 文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
  • 注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可
  • 行业参照证监会2012年行业分类标准,制造业用二级行业分类,其他用一级分类来计算并对连续型变量进行了1%和99%分位数的缩尾处理
  • 代码格式:do文件(Stata 14/15/16/17/18)


4.png



计算说明:
      【企业数字赋能】参考文献使用数字化词频-逆文本频率(TF-IDF)来刻画企业数字赋能情况。具体地,计算方法如下:首先计算逆文本频率TF-IDF中的TF项,词语w的TF=In(词语  的词频/企业当
年年报总词数+1)。之后,在所有年报中统计包含词语w的年报的数量。 然后 计算逆文本频率TF-IDF中的IDF项,词语w的IDF=In[年报总数/(包含词语w的的年报数+1),本资科剔除B股数据后年报总数为62113个,因此年报总数为62113。在计算了词集中所有词的作项和IDF项之后,即可计算整个词集的逆文本频率TF-IDF=Zw(TFw×IDFw),即每个词的F项与IDF项相乘后加总。



注:词频数据为使用Python对上市公司年报进行文本分析后获得(jieba分词,停用词表使用哈工大停用词表),后续使用Stata进行整理,最终形成面板数据形式。具体关键词参考吴非等(2021)的数字化转型词集(数字化转型词集参考义献:吴非,胡慧芷,林慧妍,等.企业数字化转型与资本市场表现——来自股票流动性的经验证据J]管理世界,2021,37(07):130-144+10.)。




参考文献:

  • 耿景珠,杜明威,刘文革企业数字赋能与全球价值链嵌入[J].当代财经,2023.(08):122-133.







代码:





数据量:

2.png




描述性统计:

1.png




结果数据

3.png


企业数字赋能Stata计算代码2000-2024年.zip (26.55 MB, 需要: RMB 35 元)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:上市公司数据 Stata 上市公司 tata 上市公

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-19 12:00