对企业供应链风险感知指标的测算步骤具体如下:
第一步,年报文本信息整理。编写Python程序从巨潮资讯网下载沪深A股上市公司1999 ~ 2023年的年度报告,并将PDF格式文档转换为可供文本分析的TXT文档。剔除年报中图片、空格、数字、乱码等非中文字符,去除“的、地、得、和”等停用词和标点符号,使用Jieba中文分词模块将年报文本的句子分割为有间隔的若干词。
第二步,风险词典与供应链词典构建。首先,参考中英文文献(克拉维特、穆什卢,2013; 卡尔达拉等, 2020; 何捷、陆正飞,2020; 本古里亚等,2022; 陈等,2023) 分别确定与风险和供应链有关的种子词,例如风险、不确定、未知、供应商、客户、采购商等关键词。其次,使用Word2Vec词嵌入技术根据年报上下文计算每个种子词的余弦相似性(米科洛夫等,2013) ,以此识别种子词的近义词。
最后,通过计算词库词汇在年报文本中出现的频次和人工阅读检查其适用性,确定风险词典与供应链词典。
第三步,测算企业供应链风险感知指标。借鉴哈桑等(2019) 和本古里亚等(2022), 本文以供应链词汇与风险词汇出现在文本相近位置的频次体现供应链风险信息。本文认为在较短的文本中同时出现供应链词汇与风险词汇,则该部分内容很有可能表述的是企业面临的供应链风险。本文测算供应链词汇与风险词汇出现在上下文15词内的频次作为主要的核心解释变量,在稳健性中,以上下文5词、10词、20词进行检验。为了使回归结果更加直观,本文将供应链风险感知指标数值乘100。对于量纲的处理不影响回归结果显著性。
注意:
1.本数据并未匹配供应链数据,计算到了企业供应链风险感知指标!!!!!
2.词频统计内仅列示部分关键词
参考文献
- 陈雯,范茵子.企业供应链风险感知与合作关系稳定性[J].管理世界,2024,40(11):209-228.
上市公司供应链风险感知、企业风险感知数据(1999-2023年).zip
(15.69 MB, 需要: RMB 35 元)


雷达卡






京公网安备 11010802022788号







