楼主: 水亦清明
603 1

[经管数据集] 更新!2022-2001年上市公司企业年报文本数据、年报文本分析数据(计算代码+最终数据) [推广有奖]

  • 9关注
  • 62粉丝

学科带头人

36%

还不是VIP/贵宾

-

威望
0
论坛币
904 个
通用积分
34.0317
学术水平
2 点
热心指数
2 点
信用等级
3 点
经验
25964 点
帖子
535
精华
0
在线时间
2564 小时
注册时间
2017-10-20
最后登录
2024-4-27

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
1.资料名称:2022-2001年上市公司企业年报文本数据
2.计算方式:使用python将巨潮网上市公司年报进行爬取,下载的pdf文件已经转化为txt格式+Excel格式,方便后续文本分析处理;pdf批量下载过程中存在年报更新的情况,已经对年报进行了筛选,剔除了非年报文件并保留了最新更新或更正的年报;原始地址的文件名称并不统一,本人已经将年报文件名称进行了统一,统一格式为“股票代码_年度_发布日期_****年年度报告.txt”,例如,“999_2001定.txt”)
3.数据来源:巨潮网
4.资料范围:5.3万个年报,近5个G的数据量,数据格式为.txt 格式(记事本),计量软件可以直接导入,提供详细的Python爬虫代码
更新!2022-2000年上市公司企业年报文本数据、年报文本分析数据(计算代码+最终数据) (76 Bytes, 需要: RMB 68 元)

公司文本1.jpg



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:企业年报 上市公司 文本数据 上市公 python爬虫

文本分析1.png (34 KB)

文本分析1.png

沙发
xc.\ 发表于 2024-4-23 15:54:35 |只看作者 |坛友微信交流群
此帖仅作者可见

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 01:09