数据保证真实可靠权威,数据来源文件里会有说明。来源和样式为论文样式,论文可直接使用。
所售数据均有承诺售后服务,私信会进行回复。
字段如下:
InstitutionID [公司ID] - null
Symbol [证券代码] - null
ShortName [证券简称] - null
EndDate [统计截止日期] - null
TextContentCC [核心竞争力文本内容] - 上市公司年报中披露核心竞争力的文本内容
CategoryNumCC [核心竞争力类别个数] - 技术创新、品牌文化、人才、管理、市场、营销、行业地位、服务、数据等类别的个数。CSMAR参考戚聿东,孙昌玲,王化成.企业核心竞争力能够降低权益资本成本吗——基于文本分析的经验证据[会计研究],2021年的文章研究,经过自己的归纳总结给出17个核心竞争力类别。
CategoryCC [核心竞争力类别] - null
SentencesNumCC [句子数量-核心竞争力] - 核心竞争力文本内容中的句子数量。句子的判断包括:句号、问号、感叹号以及标题行(段落标题单独作为一句话)。
TotalWordsNumCC [文本大小-核心竞争力] - 核心竞争力文本内容中的字数。去除标点符号、数字(包含阿拉伯数字及标题序号)、英文。
TextContentTI [技术创新文本内容] - 上市公司年报中核心竞争力节点下披露技术创新类别的文本内容(句子组合)
SentencesNumTI [句子数量-技术创新] - 核心竞争力节点下披露技术创新类别的文本内容中的句子数量。句子的判断包括:句号、问号、感叹号以及标题行(段落标题单独作为一句话)。
TotalWordsNumTI [文本大小-技术创新] - 核心竞争力节点下披露技术创新类别的文本内容中的字数。去除标点符号、数字(包含阿拉伯数字及标题序号)、英文。
IsQuantitativeDescribe [是否进行定量描述] - 报告在披露技术创新相关内容时,是否有具体的定量(数据分析)描述,不包括对年月日中的数字
TextualSimilarityCC [与前一年相比文本相似度-核心竞争力] - 统计截止日期为XXXX-12-31对比的是前一年的12-31的年报。关于中文文本相似度计算,首先使用结巴分词对文本进行处理,分词过程中去掉阿拉伯数字、标点符号。接下来使用潜在语义索引(Latent Semantic Indexing, LSI)余弦相似度计算法,分别计算得出文本相似度。
TextualSimilarityTI [与前一年相比文本相似度-技术创新] - 统计截止日期为XXXX-12-31对比的是前一年的12-31的年报。关于中文文本相似度计算,首先使用结巴分词对文本进行处理,分词过程中去掉阿拉伯数字、标点符号。接下来使用潜在语义索引(Latent Semantic Indexing, LSI)余弦相似度计算法,分别计算得出文本相似度。
点击下方购买
TIRD_CrCmpTxtAnl.xlsx
(47.14 MB, 需要: RMB 20 元)


雷达卡




京公网安备 11010802022788号







