- 年份:2001-2024
- 范围:A股上市公司
- 三个版本:数据资产信息披露水平(未缩尾未剔除金融STPT)、数据资产信息披露水平(未缩尾已剔除金融STPT),数据资产信息披露水平(已缩尾已剔除金融STPT)
- 文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
- 注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可
- 行业参照证监会2012年行业分类标准,制造业用二级行业分类,其他用一级分类来计算并对连续型变量进行了1%和99%分位数的缩尾处理
- 代码格式:do文件,含生成代码和分析评估代码
- 分析结果及论文图表均在帖子末尾的压缩包,可直接下载查看情况
计算说明:
目前数据资产还未被纳入到资产负债表中列示,其信息披露尚属于自愿性信息披露。因此,需要对上市公司年度财务报告中的数据资产信息进行挖掘从而评估其数据资产信息披露水平。采用文本挖掘测度企业的数据资产信息披露水平,具体步骤如下:第一,将“数据资产”作为种子词汇;第二,借鉴中国信通院2019年发布的“数据资产是能够带来经济利益的数据资源”的观点,将“数据资源”也作为种子词汇;第三,依据“数据资产”和“数据资源”这两个种子词汇,使用 “种子词集 + 相似词扩充”方法构建数据资产的文本词典,且仅保留相似度大于0.5 的词汇,以体现词典的相关性和准确度。第四,挖掘年度报告中种子词汇与相似词词汇在年度财务报告中出现的词频,并且计算数据资产信息披露水平,计算公式如下
其中,data为数据资产信息披露水平;dictionary words为词典中第n个种子或者相似词词汇在个股i第t年的年度财务报告中的精确词频;total words为个股i在第t年的年度报告的总词频(排除英文和数字)。由于数据资产信息披露水平变量是右偏态分布,因此对该指标进行了对数化处理。另外,还进行了归一化处理,最终得到度量企业数据资产信息披露水平的指标。
参考文献
- 数据资产信息披露与审计师定价策略
计算代码及评估代码:
结果数据
上市公司数据资产信息披露水平数据2000-2024年含do代码和excel-dta格式数据.zip
(15.92 MB, 需要: RMB 39 元)
评估结果.zip
(1015.36 KB)


雷达卡




京公网安备 11010802022788号







