上市公司数字赋能指数、数字技术应用程度、面板数据2001-2021、exce+stata
上市公司数字赋能指数是一个用于衡量上市公司在数字化转型方面的表现和成效的指数。该指数由多个指标组成,包括上市公司的数字技术应用程度、数字化创新能力、数字化转型效果等。通过对这些指标的评估和计算,可以得出一个综合指数,用于衡量上市公司在数字化转型方面的整体表现。
上市公司数字赋能指数可以帮助投资者更好地了解上市公司在数字化转型方面的情况,从而做出更明智的投资决策。同时,该指数也可以促进上市公司在数字化转型方面的投入和实践,推动数字化经济的发展。
需要注意的是,上市公司数字赋能指数是一个相对的概念,不同行业、不同地区的上市公司在该指数上的表现可能存在差异。因此,在使用该指数时,需要结合具体的行业和地区情况进行参考和分析。
此外,上市公司数字赋能指数的计算方法可能因评估机构和评估方法的不同而有所差异。因此,在使用该指数时,需要了解具体的计算方法和数据来源,以确保评估结果的准确性和可靠性。
我们收集整理了一种测度方法,并进行了测算,具体如下:
第一、从巨潮资讯网利用Python文本挖掘技术爬取上市公司年报中有关数字技术应用的相关信息
第二、对这些信息进行了拆分和提取,以获得与数字技术应用相关的关键词。
具体关键词包括:AI技术/人工智能/计算机技术/信息技术/智能化/自动化/神经网络/虚拟现实/数据科学/数据挖掘/数字化/信息化战略/信息化/生物识别/机器学习/人脸识别/深度学习/自然语言处理/图像识别/语音识别/云计算/云平台/云安全/物联网/大数据
最后,采用逆文档概率词频(TF-IDF)方法测度企业在特定年份的数字赋能程度
TF 表示术语频率或者说词频,IDF 表示逆文档频率指数。
TF-IDF的主要思想是:如果某个词或短语(term)在一篇文章中出现的频率高(TF高),并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。例如一篇文档的总术语数是100,而词汇“母牛”出现了3次,那么“母牛”一词在该文档中的词频就是3/100=0.03。计算文件频率(IDF)的方法是文件集里包含的文件总数除以测定有多少份文件出现过“母牛”一词。所以,如果“母牛”一词在1000份文档出现过,而文件总数是10000000份的话,其逆向文件频率就是m(10000000/1000)=4。最后的tf-idf的分数为0.03×4=0.12。
具体方法可参见 Chen & Srinivasan (2023) 和包群2023年发表在经济研究第6期上的文章
附件1 原始数据
时间跨度:2001-2021年
数据来源:巨潮资讯网
具体指标包括:
关键词名称
频数
附件2 上市公司数字赋能指数
时间跨度:2001-2021年
具体指标包括:
证券代码
年份
类别
证券简称
上市企业数字赋能指数
共41,094条观测值
附件三:数据合集
包括附件1和2