在年报中存在大量的类似于——“单位:元”、“
管理层和治理层对财务报表的责任”
等年报间
例行的重复文本、标题、以及大量的数据表格,想请论坛里有经验的大佬们指引一下,最终的语料库是否应该对这些部分进行剔除呀~当然,也非常希望能够得到部分可参考的资料~万分感谢!
|
楼主: 咕咕咕影
|
1190
1
[统计软件] 关于对企业年报做文本清洗的一点问题 |
|
本科生 40%
-
|
| ||
|
|
jg-xs1京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


