非平衡面板数据,共26137条数据,通过Python爬虫下载pdf文件并转换为txt格式;由于手工去重(眼睛看花了,或者有什么高明做法请在评论区传授于我,感谢),因此可能存在一些重复的条目。
本数据可用于进行文本分析,统计词频等等。
本人很菜,本数据来源详实,但质量可能也许大概不算很高;
购买者需要后期再进行进一步的清洗处理,应付应付毕业绰绰有余。
本人在某一篇年报中添加了一些防伪标识,购买者在购买后正常对数据进行处理就可以处理掉(去除英文字符)。
祝文章顺利,职称顺利,毕业顺利,身体健康(最重要)。
最近手机摔碎了,想换个华为,遥遥领先,遥遥领先,遥遥领先......
交流邮箱:2826581764@qq.com (不是我的qq)
本人很菜,轻喷,轻喷,轻喷,轻喷,轻喷,轻喷,轻喷,轻喷。