完全小白代码,不需要python的基础知识,自己只需知道修改的地方即可。
用于数字化转型 企业战略等非常常见 关键词分析 企业 数据 财务
文本分析现在已经是实证中常用的分析方式,这里给大家提供了提取关键词的代码等相关的文件
赠送给大家所有公司2007-2020 年报的字数 句子 词汇统计!
本附件包含如下内容
①2007-2020 所有上市公司年报txt
②两种爬取关键词的代码(1、jieba 可以制定停用词 2、 快速爬取版本 )
③批量PDF转为txt的代码
④使用说明
所有代码已经经过了测试 注意的地方已经在使用说明里详细说了,可以直接运行没有任何问题
需要修改的地方也已经进行了标识
同时提供管理层讨论与分析部分的总字数、词频数、句子数
补充内容 (2023-6-7 12:01):
该数据均已更新,请查看最新帖子!