楼主: cky.cc
462 0

[经管数据集] 【更新至2024】上市公司数字化转型2024-2000吴非版数据年报关键词词频Stata表格 [推广有奖]

  • 1关注
  • 8粉丝

已卖:797份资源

教授

2%

还不是VIP/贵宾

-

威望
0
论坛币
1025 个
通用积分
40.9552
学术水平
502 点
热心指数
501 点
信用等级
499 点
经验
24179 点
帖子
476
精华
0
在线时间
718 小时
注册时间
2024-9-24
最后登录
2025-12-28

20周年荣誉勋章 初级热心勋章 中级热心勋章

楼主
cky.cc 学生认证  发表于 2025-6-9 12:38:03 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据介绍:
  • 年份:2000-2024
  • 围:A股上市公司
  • 三个版本:数字化转型无形资产(未剔除未缩尾)、数字化转型无形资产(已剔除金融STPT未缩尾)、数字化转型无形资产(已剔除金融STPT已缩尾)
  • 文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
  • 注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可
  • 行业参照证监会2012年行业分类标准,制造业用二级行业分类,其他用一级分类来计算并对连续型变量进行了1%和99%分位数的缩尾处理
  • 代码格式:do文件(Stata 14/15/16/17/18)

1.png



计算说明:

指标说明:参考文献并按如下步骤构建刻画企业数字化转型指标:


第一步,整理上市公司年报,并通过Python的Java PDFbox库提取所有文本内容,以此作为后续特征词筛选的数据基础。


第二步,搜集文本数据后,使用Python中的jieba分词对年报文本进行分词处理。


第三步,参考文献制定出年报中有关“数字化转型”的词典,在分词后的文件中提取企业数字化关键词出现的频率,按参考做法要求进行清洗剔除。


第四步,整理各子维度词频:人工智能技术词频括号里这些词频加总(人工智能
商业智能、图像理解、投资决策辅助系统、智能数据分析、智能机器人、机器学习、深度学习、语义搜索、生物识别技术、人脸识别、语音识别、身份验证、自动驾驶、自然语言处理);大数据技术词频=括号里这些词频加总(大数据、数据挖掘、文本挖掘、数据可视化、异构数据、征信、增强现实、混合现实、虚拟现实);云计算技术词频=括号里这些词频加总(云计算、流计算、图计算、内存计算、多方安全计算、类脑计算、绿色计算、认知计算、融合架构、亿级并发、EB级存储、物联网、信息物理系统);区块链技术词频=括号里这些词频加总(区块链、数字货币、分布式计算、差分隐私技术、智能金融合约);数字技术运用词频=括号里这些词频加总(移动互联网、王业互联网、移动互联、互联网医疗、电子商务、移动支付、第三方支付、NFC支付、智能能源、B2B、B2C、C2B、C2C、02O、网联、智能穿戴、智慧农业、智能交通、智能医疗、智能客服、智能家居、智能投顾、智能文旅、智能环保、智能电网、智能营销、数字营销、无人零售、互联网金融、数字金融、Fintech、金融科技、量化金融、开放银行)。


第五步,计算数字化词频总计=括号里这些词频加总(人工智能技术词频、大数据技术词频、云计算技术词频、区块链技术词频、数字技术运用词频)。企业数字化转型DCG为年报中涉数字化关键词的词数加1取自然对数,即数字化转型DCG=in(数字化词频总计+1);人工智能技术AI为年报中涉及人工智能技术关键词的词数加1取自然对数,即人工智能技术AI=ln(1+人工智能技术词频);区块链技术BD为年报中涉及区块链技术关键词的词数加1取自然对数,即区块链技术BD=ln(1+区块链技术词频);云计算技术CC为年报中涉及云计算技术关键词的词数加1取自然对数,即云计算技术CC=ln(1+云计算技术词频);大数据技术DT为年报中涉及大数据技术关键词的词数加1取自然对数,即大数据技术DT=ln(1+大数据技术词频);数字技术应用ADT为年报中涉及数字技术应用关键词的词数加1取自然对数,即数字技术应用ADT=ln(1+数字技术运用词频)。


处理说明:本资料所使用的词频原始数据为使用Python对上市公司年报进行文本分析后获得(jieba分词,停用词表使用哈工大停用词表),后续使用Stata进行整理,最终形成面板数据形



参考文献

  • 吴非,胡慧芷,林慧妍,等.企业数字化转型与资本市场表现—来自股票流动性的经验证据[J].管理世界,2021,37(07):130-144+10.


2.png





代码:


3.png


数据量:

6.png





描述性统计:

5.png




结果数据

4.png



上市公司数字化转型(吴非版)Stata计算代码2000-2024年.zip (28.23 MB, 需要: RMB 32 元)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata 数字化转型 tata 上市公司 数字化

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 18:50