楼主: louisxuu
672 0

[经管数据集] 2010-2020上市公司【管理层讨论与分析】文本,已整理成csv,可直接用于语调分析等 [推广有奖]

  • 0关注
  • 4粉丝

已卖:93份资源

博士生

64%

还不是VIP/贵宾

-

威望
0
论坛币
1 个
通用积分
0.0000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
205 点
帖子
16
精华
0
在线时间
668 小时
注册时间
2018-8-5
最后登录
2026-1-21

楼主
louisxuu 学生认证  发表于 2022-6-27 00:29:47 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
1. 2010-2020上市公司【管理层讨论与分析】文本,已将txt文件整理成csv,可以直接读取调用,适合做语义分析、语调分析等文本挖掘工作;2. csv文件1个多G,包含33236条数据,格式如图所示,附了股票代码和年份,方便直接Merge(本人处理用的是python),也便于后续进行分词处理。文件压缩后300多M,由于附件上传限制100M,只能通过网盘分享;
3. 参考过往文献中的处理方式,MD&A文本主要截取自年报中的《管理册讨论与分析》、《经营情况讨论与分析》等部分内容。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:上市公司 上市公 python Merge 文件压缩 管理层讨论与分析 文本挖掘

截屏2022-06-27 上午12.20.22.png (96.92 KB)

压缩后300多M,csv1G出头

压缩后300多M,csv1G出头

截屏2022-06-27 上午12.13.16.png (1.41 MB)

部分内容

部分内容

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-27 14:54