楼主: 西岭好景
305 0

[经管数据集] 上市公司MDA文本相似度2008-2023管理层讨论与分析增量信息模板化披露风险 [推广有奖]

  • 0关注
  • 1粉丝

已卖:523份资源

学术权威

96%

还不是VIP/贵宾

-

威望
0
论坛币
10 个
通用积分
162.0635
学术水平
0 点
热心指数
2 点
信用等级
0 点
经验
80535 点
帖子
4214
精华
0
在线时间
1176 小时
注册时间
2025-1-20
最后登录
2025-12-8

楼主
西岭好景 在职认证  发表于 2025-6-6 14:39:10 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
上市公司MDA文本相似度2008-2023管理层讨论与分析增量信息模板化披露风险

关键字:MD&A文本相似度(2008-2023)

数据来源由上市公司公告数据人工整理,全部内容真实有效
时间跨度2008-2023年
区域跨度上市公司管理层讨论(MD&A)数据库
数据格式数据格式为Excel形式


数据简介

管理层讨论与分析(Management's Discussion and Analysis,MD&A)是上市公司年报中由管理层撰写的核心内容,其通过分析公司财务状况、经营成果、风险因素和未来战略,向投资者传递关键决策信息。研究MD&文本相似度具有多重理论与实践意义。MD&文本相似度分析可有效识别“模板化披露”现象。若多家公司或同一公司不同年份的MD&内容高度趋同,可能暗示管理层存在敷衍披露、避重就轻的风险。MD&A文本相似度研究不仅是技术工具的创新,更是完善信息披露制度、优化资源配置效率的重要突破口。其价值在于构建“文本特征-管理层动机-市场反应”的逻辑闭环,为提升资本市场信息透明度提供量化支撑。本团队参考宋昕倍、陈莹、逯东、程杰(2024)的文章,按照如下步骤得出MD&A文本相似度:

首先遍历所有文件,找到所有年份的股票代码集合的交集,即所有年份都存在的上市公司数据;

然后对文本进行分词处理,分词过程中去掉阿拉伯数字和标点符号,使用潜在语义索引(Latent Semantic Indexing,LSI)余弦相似度计算法,计算得出当期MD&A文本与上一期MD&A文本的相似度;




数据指标

股票代码

股票简称

年份

年度相似度




数据展示


参考文献

宋昕倍,陈莹,逯东,程杰. 信息环境、上市公司增量信息披露与资本市场定价效率——基于MD&A文本相似度的研究[J]. 南开管理评论, 2024, 27(5): 30-39.


上市公司MDA文本相似度2008-2023管理层讨论与分析增量信息模板化披露风险.zip (414.51 KB, 需要: RMB 29 元)

1246e7d7c030768796781b587340c29.png








二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:上市公司 相似度 管理层 上市公 Discussion

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-9 03:35