楼主: 山西棱
220 0

[实证分析] 2000-2024年上市公司大数据应用报关键词词频提取包含Stata、Excel [推广有奖]

  • 0关注
  • 17粉丝

已卖:336份资源

副教授

48%

还不是VIP/贵宾

-

威望
0
论坛币
30 个
通用积分
6.7565
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
5373 点
帖子
176
精华
0
在线时间
1297 小时
注册时间
2021-8-27
最后登录
2025-8-15

楼主
山西棱 在职认证  发表于 2025-8-25 07:58:23 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据名称:上市公司大数据应用报关键词词频提取年份:2000-2024
范围:A股上市公司
三个版本:大数据应用指数(未缩尾未剔除)、大数据应用指数(已缩尾未剔除)、大数据应用指数(已缩尾已剔除金融STPT)
文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可
行业参照证监会2012年行业分类标准,制造业用二级行业分类,其他用一级分类来计算并对连续型变量进行了1%和99%分位数的缩尾处理
代码格式:do文件(Stata 14/15/16/17/18)


计算说明:
参考中将最核心的大数据应用的衡量指标(InBigdata)具体定义为:公司年报中提及大数据相关关键词的次数加一后取对数。由于大数据应用情况随年份增长趋势明显,将InBigdata按照“公司—年份”的观测值确定每年缩尾(winsorize)上下极值各1%。





大数据相关关键词如下:大数据、海量数据、数据中心、信息资产、数据化、算力
大数据应用指数=In(大数据相关关键词词频+1)

处理软件原始数据为使用Python对上市公司年报进行文本分析后获得(jieba分词,停用词表使用哈工大停用词表),后续使用Stata进行整理,最终形成面板数据形式



参考文献:张叶青,陆瑶,李乐芸.大数据应用对中国企业市场价值的影响——来自中国上市公司年报文本分析的证据[J].经济研究,2021,56(12):42-59.
1.png
2.png
3.png


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata EXCEL 大数据应用 上市公司 xcel
相关提问:stata数据 Excel数据

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-22 16:49