楼主: 张淼儿
43 0

[经管数据集] 2024-2001年上市公司企业MD&A叙述性信息披露数据、MD&A文本相似度数据 [推广有奖]

已卖:7226份资源

泰斗

90%

还不是VIP/贵宾

-

威望
1
论坛币
804 个
通用积分
248.2235
学术水平
38 点
热心指数
37 点
信用等级
31 点
经验
650571 点
帖子
33662
精华
0
在线时间
18053 小时
注册时间
2018-2-7
最后登录
2026-3-18

楼主
张淼儿 学生认证  发表于 5 小时前 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
1、资料名称:2024-2001年上市公司企业MD&A叙述性信息披露数据、MD&A文本相似度数据
2、测算方式:参考顶刊《南开管理评论》于李胜老师的做法, V S M 模 型与 T F-IDF 算法相结合,把上市公司 M D&A 文本与同一年度其他 上市公司分别进行比较,并计 算出文本之间的向量夹角余弦值,即文本相似度。具体步骤如下 :① 利用 VS M 模型将每份文本向量化,即转换为欧氏空间 n 维向量,其中 n 是所有文本中非重复词的数量。每 个向量 元 素是文 本 j 中特定词 i 出现的频率, 同时用文本 j 的总词数 进行加权以防止其偏向长文本, 得到词频 T F i , j = n i , j /( ∑ k n k , j ),其中分 子为特定词 i 在文本 j 中出现的次数,分 母为文本 j 中所有词 {k} 出现的次数之和。② 通 过特定词的逆 文 档 频率赋 予不同的权 重, 即I DFi =log D/({ j;t i ∈ dj}+1),其中,D 为样本中文本数量,{ j;ti ∈ dj} 为包含特定词 i 的文本数。采用公司与同一年度其他公司的文本相似度的均值来衡量,具体做法及公式如下方图片所示
3、资料范围:6.5万个样本,5600多家企业,包括原始数据、计算代码及最终结果,大家可以验证一下确保准确性!
4、参考文献
于李胜,王泽豪,王艳艳,等.创新对企业MD&A叙述性信息披露策略的影响[J].南开管理评论,2024,27(03):150-162.
8a9b9148036e7339dde3d4690261b438.jpg d059c452882346dd1e395344966db001.jpg c1e9defe1665ccee9e0b8e8d5696a2d1.jpg
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-3-18 18:23