【数据来源】wingo数据库
similarity_wingo_1(WinGo文本相似性1):利用WinGo方法计算报告文本当期与同一行业其他所有公司报告当期的相似性的中位数大小。
similarity_wingo_2(WinGo文本相似性2):利用WinGo方法计算报告文本当期与同一行业其他所有公司报告当期的相似性的均值大小。
similarity_wingo_3(WinGo文本相似性3):利用WinGo方法计算报告文本当期与上一期之间的相似性大小。
similarity_tf_idf_1(TF-IDF文本相似性1):利用TF-IDF方法计算报告文本当期与同一行业其他所有公司报告当期的相似性的中位数大小。
similarity_tf_idf_2(TF-IDF文本相似性2):利用TF-IDF方法计算报告文本当期与同一行业其他所有公司报告当期的相似性的均值大小。
similarity_tf_idf_3(TF-IDF文本相似性3):利用TF-IDF方法计算报告文本当期与上一期报告之间的相似性大小。
similarity_lda_1(LDA文本相似性1):利用LDA方法计算报告文本当期与同一行业其他所有公司报告当期的相似性的中位数大小。
similarity_lda_2(LDA文本相似性2):利用LDA方法计算报告文本当期与同一行业其他所有公司报告当期的相似性的均值大小。
similarity_lda_3(LDA文本相似性3):利用LDA方法计算报告文本当期与上一期报告之间的相似性大小。
文本相似性.xlsx
(5.03 MB, 需要: RMB 29 元)


雷达卡




京公网安备 11010802022788号







