并在文件中附录了做词频统计所需的代码,见txt文本,主要参照这位大神代码https://blog.csdn.net/weixin_47172744/article/details/114765696。
python版本为3.10,年报文本到2021年。
因为爬取和转换pdf时间较长,有需要的小伙伴可以省事了,直接做词频统计了。
上市公司年报文本数据并附词频统计代码
(76 Bytes, 需要: RMB 58 元)
|
楼主: 张恩廷
|
950
10
[经管数据集] 词频统计上市公司年报文本数据txt格式巨潮网爬取并只需根据自己需要构建关键词统 |
|
已卖:38份资源 硕士生 80%
-
|
| ||
|
|
jg-xs1京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


