数据简介
CNPaperData
数据风险暴露变量是衡量企业数据安全管理能力的重要量化指标,也是评估上市公司在数字化转型过程中数据治理水平与风险应对能力的关键依据。近年来,《中华人民共和国数据安全法》《个人信息保护法》等一系列法规相继出台,使得数据风险逐渐成为影响企业可持续发展的重要因素。该变量通过文本挖掘技术,将年报中关于数据风险的定性描述转化为可量化的数值,有效填补了“风险识别—程度度量—治理评估”这一分析链条中的数据空缺,为监管机构优化政策制定、学术界开展数据治理研究以及投资者判断企业运营稳定性提供了权威的数据支持。
本数据集主要基于2010年至2024年中国A股上市公司年度报告中的“管理层讨论与分析(MD&A)”部分进行构建。整个处理流程遵循“关键词界定—语义扩展—精准匹配—清洗校验”的标准化步骤:首先,参考《工业和信息化领域数据安全风险信息报送与共享工作指引(2021)》(试行)及国家互联网信息办公室发布的《国家网络安全事件应急预案(2017)》,结合企业在不同数字技术应用情境下的潜在风险,确立了数据泄露、数据篡改、数据滥用、违规传输四大类基础关键词;随后,利用Word2vec模型对初始关键词进行语义拓展,形成包含原始词与近义词在内的完整词典;接着,在MD&A文本中提取相关表述并统计其出现频率,最终以词频作为数据风险暴露的核心度量指标,全面反映各上市公司在2010–2024年间的风险关注动态。
数据信息
CNPaperData
数据格式:Excel
数据字段:
- 股票代码
- 年份
- kw_sum(关键词总频次)
- 总词数
注:其余“数据风险暴露”相关的关键词已整合至txt文档中,具体如下图所示:
数据展示
CNPaperData
选题方向
CNPaperData
选题1:数据风险暴露的时序演化与行业差异研究(2010–2024)
依托数据集中“年份—企业—行业—风险词频”四个维度的信息,构建涵盖“风险趋势演变+行业特征分化+政策驱动作用”的三维分析体系。采用时间序列分解方法(如HP滤波)、核密度估计以及技术图谱工具(CiteSpace),系统描绘2010至2024年间我国上市公司数据风险暴露的整体变化轨迹,揭示重大政策节点(如《数据安全法》实施前后)对企业风险关注度的影响,并比较金融、互联网等数据密集型行业与传统制造业之间的风险水平差异。进一步结合面板回归模型,实证检验数据风险暴露对企业价值(托宾Q值)、融资成本及经营绩效的作用机制,识别不同行业中从风险暴露到实际损失的传导路径差异,为企业实现精细化风险管理提供实证支撑。
选题2:数据治理政策对企业风险暴露的抑制效应研究
以《数据安全法》(2021年施行)和《个人信息保护法》(2021年施行)的颁布作为准自然实验场景,融合本数据集与企业层面的数据治理投入信息(如信息安全支出、合规团队规模),建立“政策冲击—治理投入—风险暴露”的因果分析框架。运用PSM-DID(倾向得分匹配-双重差分)方法,评估上述法规对上市公司数据风险披露强度的实际抑制效果。通过异质性分析,对比政策在国有企业与非国有企业、大型企业与中小型企业之间的差异化影响,并借助中介效应模型验证“合规意识增强”“技术资源投入增加”“管理流程优化”三条可能的作用路径,为完善数据治理制度设计和提升政策执行效率提供实证依据。
选题3:数字经济背景下数据风险暴露与企业创新的平衡机制研究
将本数据集与企业研发投入、专利产出数据(特别是数字技术类专利)相匹配,构建“数据风险暴露—创新投入—创新产出”的联动分析框架。采用门槛回归模型,探究数据风险对企业创新行为的双重影响:适度的风险暴露可能激发企业在数据安全领域的技术创新动力,而过度暴露则可能抑制整体创新能力。通过识别风险水平的“最优区间”,揭示风险与创新之间的非线性关系。同时,结合LDA主题模型对年报中创新相关内容进行语义挖掘,实证检验数据安全技术创新在调节“风险防控”与“创新发展”之间平衡关系中的关键作用,助力企业在保障数据安全的前提下实现创新突破。
选题4:数据风险暴露对投资者决策的影响路径研究
立足资本市场视角,将本数据集与股票收益率、换手率、分析师关注度等市场指标相结合,构建“数据风险暴露—信息披露质量—投资者反应”的分析模型。运用事件研究法,选取企业发布数据安全相关公告的时间点作为事件窗口,考察高风险暴露企业在短期内是否面临显著的股价波动或超额收益下降。同时,借助多元回归分析,检验数据风险如何通过加剧信息不对称、提高风险溢价等方式影响投资者交易行为和预期判断。研究成果可为投资者优化风险定价机制、监管部门加强信息披露规范提供有力支持。
参考文献
cNPaperData
[1]陆瑶,施函青,周欣怡.中国企业数字技术风险暴露对企业价值的影响——来自大语言模型的文本分析证据[J].经济研究,2025,60(02):73-89.


雷达卡


京公网安备 11010802022788号







