楼主: 小王爱吃羊
467 0

[经管数据集] 【更新至2023】上市公司人工智能2023-2000数据年报词频全文及MD&A结果jieba分词 [推广有奖]

  • 1关注
  • 6粉丝

已卖:874份资源

教授

0%

还不是VIP/贵宾

-

威望
0
论坛币
517 个
通用积分
27.3143
学术水平
424 点
热心指数
426 点
信用等级
424 点
经验
28008 点
帖子
495
精华
0
在线时间
657 小时
注册时间
2024-9-24
最后登录
2025-12-31

20周年荣誉勋章 初级热心勋章 中级热心勋章

楼主
小王爱吃羊 学生认证  发表于 2025-1-26 13:36:08 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据介绍:
  • 年份:2000-2023
  • 围:A股上市公司
  • 三个版本:人工智能词频(未缩尾未剔除)、人工智能词频(已缩尾未剔除)、人工智能词频(已缩尾已剔除金融STPT)
  • 文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
  • 注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可
  • 行业参照证监会2012年行业分类标准,制造业用二级行业分类,其他用一级分类来计算并对连续型变量进行了1%和99%分位数的缩尾处理
  • 代码格式:do文件(Stata 14/15/16/17/18)

文件.png



计算说明:

      由于中文文字之间没有空格切分,而且词语才是能够独立运用的最小语言单位,因此需要对年报文本进行专门的分词处理。我们使用广泛运用的Python开源“jieba”中文分词模块对上市公司年报文本进行分词处理。中文文本分析存在3个难点,即切分颗粒度、歧义词识别以及新词的识别(姚加权等,2020)。阅如,机器学习”是人工智能的核心术语之一,但“jieba”分词模块会将其切分为“机器”和“学习”两个词语。为解决该问题,我们将生成的人工智能词典作为预设专有名词词典加入到“jieba”的分词模块并统计上市公司年报中人工智能词语的数量。采用上市公司年报中人工智能关键词数量加1的自然对数(Lnwords)作为企业人工智能指标。此外,我们还基于上市公司年报“管理层讨论与分析”(MD&A)部分构建企业人工智能的替代指标。

      处理软件:原始数据为使用Python对上市公司年报进行文本分析后获得(jieba分词,停用词表使用哈工大停用词表),后续使用Stata进行整理,最终形成面板数据形式



参考文献

  • 姚加权,张锟澎,郭李鹏,等.人工智能如何提升企业生产效率?——基(于劳动力技能结构调整的视角[J].管理世界,2024,40(02):101-116+133+117-122

3.png 1.png 2.png

    




代码:


代码.png


数据量
数据量.png

描述性统计:

描述性统计.png




结果数据

结果数据.png


【更新至2023】上市公司人工智能2023-2000数据年报词频全文及MD&A结果jieba分词 (76 Bytes, 需要: RMB 36 元)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:人工智能 上市公司 JIE 上市公 stata打开
相关内容:上市公司年报数据

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 03:43