楼主: cky.cc
381 0

[经管数据集] 【更新至2023】企业数字赋能2023-2000上市公司数据逆文本频率TF-IDF计算含stata [推广有奖]

  • 1关注
  • 8粉丝

已卖:811份资源

教授

2%

还不是VIP/贵宾

-

威望
0
论坛币
1025 个
通用积分
40.9552
学术水平
502 点
热心指数
501 点
信用等级
499 点
经验
24179 点
帖子
476
精华
0
在线时间
729 小时
注册时间
2024-9-24
最后登录
2026-1-20

20周年荣誉勋章 初级热心勋章 中级热心勋章

楼主
cky.cc 学生认证  发表于 2025-1-2 10:28:24 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据介绍:
  • 年份:2000-2023
  • 围:A股上市公司
  • 三个版本:企业数字赋能(未剔除未缩尾)、企业数字赋能(已剔除金融STPT未缩尾)、企业数字赋能(已剔除金融STPT已缩尾)
  • 文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
  • 注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可
  • 行业参照证监会2012年行业分类标准,制造业用二级行业分类,其他用一级分类来计算并对连续型变量进行了1%和99%分位数的缩尾处理
  • 代码格式:do文件(Stata 14/15/16/17/18)


文件.png



计算说明:
      【企业数字赋能】参考文献使用数字化词频-逆文本频率(TF-IDF)来刻画企业数字赋能情况。具体地,计算方法如下:首先计算逆文本频率TF-IDF中的TF项,词语w的TF=In(词语  的词频/企业当
年年报总词数+1)。之后,在所有年报中统计包含词语w的年报的数量。 然后 计算逆文本频率TF-IDF中的IDF项,词语w的IDF=In[年报总数/(包含词语w的的年报数+1),本资科剔除B股数据后年报总数为62113个,因此年报总数为62113。在计算了词集中所有词的作项和IDF项之后,即可计算整个词集的逆文本频率TF-IDF=Zw(TFw×IDFw),即每个词的F项与IDF项相乘后加总。



注:词频数据为使用Python对上市公司年报进行文本分析后获得(jieba分词,停用词表使用哈工大停用词表),后续使用Stata进行整理,最终形成面板数据形式。具体关键词参考吴非等(2021)的数字化转型词集(数字化转型词集参考义献:吴非,胡慧芷,林慧妍,等.企业数字化转型与资本市场表现——来自股票流动性的经验证据J]管理世界,2021,37(07):130-144+10.)。




参考文献:

  • 耿景珠,杜明威,刘文革企业数字赋能与全球价值链嵌入[J].当代财经,2023.(08):122-133.


参考1.png 参考2.png




代码:

代码.png




数据量:

数据量.png



描述性统计:

描述性统计.png



结果数据

结果数据.png


【更新至2023】企业数字赋能2023-2000上市公司数据逆文本频率TF-IDF计算含stata (85 Bytes, 需要: RMB 38 元)


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:上市公司数据 Stata 上市公司 tata 上市公

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-28 10:18