楼主: a1010967149
4618 29

[经管数据集] 【重磅 2021最新】数字化转型数据集 可能是最全的数字化转型数据 [推广有奖]

  • 1关注
  • 87粉丝

学术权威

37%

还不是VIP/贵宾

-

威望
0
论坛币
617 个
通用积分
5.5301
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
109351 点
帖子
4609
精华
0
在线时间
8386 小时
注册时间
2020-3-25
最后登录
2024-4-25

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

数字化转型数据合集

整理了基本上最常见的数字化转型的度量方式,全部都是目前为止最为常用的顶刊数据用法,具体数据说明如下

一、词频

(一)吴非版本(2007-2021)
参考文献:
[1]吴非,胡慧芷,林慧妍,任晓怡.企业数字化转型与资本市场表现——来自股票流动性的经验证据[J].管理世界,2021,37(07):130-144+10.DOI:10.19744/j.cnki.11-1235/f.2021.0097.

将文章整理的相关词汇分别分类为人工智能技术、区块链技术、云计算技术、大数据技术、数字技术应用,通过加总词汇得到数字化转型指标,在处理时,已剔除关键词前存在“没”“无”“不”等否定词语的表述

吴非词频.PNG
(二)袁淳版本(2007-2020)


1、数据说明: 完全依据袁淳(2021)文章进行构建

     本文借助数字经济相关的国家政策语义表述,建立一个相对完备的数字化词典,并利用基于机器学习的文本分析法,构建一个较为全面反映中国上市企业数字化程度的指标。具体步骤如下:


    第一步,构建企业数字化术语词典。由于缺乏专门的数字经济领域的术语词典,本文以国家政策语义体系为基础构建企业数字化术语词典。借鉴何帆和刘红霞(2019)等的研究,通过对中央人民政府、工业和信息化部网站进行检索,人工筛选得到2012—2020年期间发布的30份重要的国家层面数字经济相关政策文件以用于提取企业数字化相关的关键词。经Python分词处理及人工识别,最终筛选得到197个频率大于等于5次的企业数字化相关词汇,这些词汇构成了本文的企业数字化术语词典。


    第二步,对年报相关语段进行文本分析。本文把上述数字化术语词典中的197个词汇扩充到Python软件包的“jieba”中文分词库,然后基于机器学习的方法对上市公司年报“管理层讨论与分析”(MD&A)部分进行文本分析,统计得到197个与企业数字化相关词汇在年报中出现的频率。


    第三步,企业数字化程度指标的构建。考虑到年报MD&A部分文本长度的差异,在提取得到每家上市公司每年年报中各个关键词的出现频率后,本文采用企业数字化相关词汇频数总和除以年报MD&A语段长度衡量微观企业数字化程度(Digital)。为了表述方便,本文将该指标乘以100。Digital指标数值越大,表示企业数字化程度越高

2、文件内容


  • python程序 包含怎么使用停用词 如何进行爬取
  • 输出的词频数量文件 30份重要的国家层面数字经济相关政策文
  • MDA的基本信息  总词数 总句数 总字数
  • 最终结果 可以直接通过STATA 匹配使用的结果

3、参考文献
[1]袁淳,肖土盛,耿春晓,盛誉.数字化转型与企业分工:专业化还是纵向一体化[J].中国工业经济,2021(09):137-155.DOI:10.19581/j.cnki.ciejournal.2021.09.007.
捕获2.PNG

捕获2.PNG




(三)详细词频版本(2007-2021)
1、具体词频包括
数字化 数字营销 数字科技 数字技术 数字货币 数字运营 数字终端 数字经济 数字贸易 数字体系 数字供应链 数据集成 数据融合 数据信息 数据管理 数据资产 网络 物联网 信息时代 信息化 信息技术 信息集成 信息通信 自动化 5G 边缘计算 云计算 云服务 云端 大数据 区块链 智慧时代 智慧建设 智慧业务 智能 互联网 电子商务 跨境电商 电商平台 3D打印 3D技术 3D工具 AI 电子技术 电子科技 线上 线上线下 机器人 机器学习 计算机技术 O2O B2B C2C P2P C2B B2C


2、相关研究:
[1]张泽平. 数字经济背景下的国际税收管辖权划分原则[J]. 学术月刊, 2015(2):84-92.
[2]逄健, 朱欣民. 国外数字经济发展趋势与数字经济国家发展战略[J]. 科技进步与对策, 2013, 30(008):124-128.
[3]钟春平, 刘诚, 李勇坚,等. 中美比较视角下我国数字经济发展的对策建议[J]. 经济纵横, 2017, 04(v.36;No.351):41-4





详细词频.PNG
二、无形资产测度(2007-2021)
1、数据说明
以上市公司财务报告附注披露的年末无形资产明细项中与数字经济相关部分占无形资产总额的比例
以及每年的变化程度作为代理变量。 具体地,当无形资产明细项包含“软件”“网络”“客户端”“管理系统”“智能平台”等与数字经济技术相关的关键词以及与此相关的专利时,标记该明细项目为“数字经济技术无形资产”,再对同一公司同一年度多项数字经济技术无形资产加总


2、参考文献:
[1]张永珅,李小波,邢铭强.企业数字化转型与审计定价[J].审计研究,2021(03):62-71.

无形资产PNG.PNG 无形资产PNG.PNG




数字化-词频(吴非版本).zip (4.6 MB, 需要: RMB 10 元) 本附件包括:
  • 企业数字化转型与资本市场表...—来自股票流动性的经验证据_吴非.pdf

数字化-词频比例(袁淳版本).zip (7.53 MB, 需要: RMB 40 元) 本附件包括:
  • 数字化转型.zip

企业数字化(词频分析 最全!!!!!!!!!).zip (3.69 MB, 需要: RMB 15 元) 本附件包括:
  • 数字化转型数据.dta
  • 数字化转型数据.xlsx

数字化转型-无形资产-2021.zip (54.94 MB, 需要: RMB 20 元) 本附件包括:
  • 2021数字化转型.dta
  • 2021无形资产净额.dta
  • 2021无形资产明细.dta
  • 处理代码.do
  • 数字经济化程度.dta
  • 数字经济对公司治理的影响.pdf
  • 无形资产明细.dta
  • 无形资产明细.xlsx
  • 行业代码.dta
  • 资产负债表.dta
  • 资产负债表.xlsx

总合集:
数字化指标大合集.zip (72.66 MB, 需要: RMB 70 元) 本附件包括:
  • 企业数字化(词频细分).zip
  • 数字化-词频比例(袁淳版本).zip
  • 数字化-词频(吴非版本).zip
  • 数字化转型(无形资产).zip









补充内容 (2022-11-12 10:45):
最新最全版本可以看下其他帖子!

补充内容 (2022-11-12 10:46):
https://bbs.pinggu.org/thread-11210630-1-1.html
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数字化转型 数字化 数据集 digital 科技进步与对策

详细词频.PNG (94.48 KB)

详细词频.PNG

捕获2.PNG (32.68 KB)

捕获2.PNG

数字化指标大合集.zip

34.87 MB

需要: RMB 999 元  [购买]

本附件包括:

  • 企业数字化(词频分析 最全!!!!!!!!!).zip
  • 数字化-无形资产.zip
  • 数字化-词频比例(袁淳版本).zip
  • 数字化-词频(吴非版本).zip

数字化-无形资产.zip

19.06 MB

需要: RMB 999 元  [购买]

本附件包括:

  • 数字化转-无形资产比例文件.rar
  • 数字经济对公司治理的影响.pdf

数字化指标大合集.zip

69.99 MB

需要: RMB 999 元  [购买]

本附件包括:

  • 企业数字化(词频分析 最全!!!!!!!!!).zip
  • 数字化-词频比例(袁淳版本).zip
  • 数字化-词频(吴非版本).zip
  • 数字化转型-无形资产-2021.zip

沙发
ichne 发表于 2022-8-1 12:49:17 |只看作者 |坛友微信交流群
请问里面有爬取的代码吗?

使用道具

藤椅
a1010967149 学生认证  发表于 2022-8-1 15:09:06 |只看作者 |坛友微信交流群
ichne 发表于 2022-8-1 12:49
请问里面有爬取的代码吗?
https://bbs.pinggu.org/thread-11160321-1-1.html

使用道具

板凳
wf243251 发表于 2022-10-25 19:44:54 |只看作者 |坛友微信交流群
吴非版本上市公司转型指标(excel)里五个维度的总关键词为何只有71个?他论文里是76个

使用道具

报纸
a1010967149 学生认证  发表于 2022-10-25 20:41:49 |只看作者 |坛友微信交流群
wf243251 发表于 2022-10-25 19:44
吴非版本上市公司转型指标(excel)里五个维度的总关键词为何只有71个?他论文里是76个
吴非版本的原始数据是来源于国泰安数据库,原始数据都是取自国泰进行的处理

使用道具

地板
wf243251 发表于 2022-10-26 11:28:51 |只看作者 |坛友微信交流群
a1010967149 发表于 2022-10-25 20:41
吴非版本的原始数据是来源于国泰安数据库,原始数据都是取自国泰进行的处理
那这种做法跟作者的是有差异吧?国泰安数据库对于五个维度的指标统计只有71个吗?楼主能否利用年报数据做个与吴非方式一样的结果,爬取76个关键词统计下?

使用道具

7
a1010967149 学生认证  发表于 2022-10-26 13:46:33 |只看作者 |坛友微信交流群
wf243251 发表于 2022-10-26 11:28
那这种做法跟作者的是有差异吧?国泰安数据库对于五个维度的指标统计只有71个吗?楼主能否利用年报数据做 ...
爬取不了,目前参考吴非的文献基本上都是在国泰安取得数据,并且国泰安相关数据也是参考吴非词频,相比于自行爬取,国泰安操作流程以及年报数据更规范

使用道具

8
wf243251 发表于 2022-10-26 20:10:52 |只看作者 |坛友微信交流群
a1010967149 发表于 2022-10-26 13:46
爬取不了,目前参考吴非的文献基本上都是在国泰安取得数据,并且国泰安相关数据也是参考吴非词频,相比于 ...
那参考吴非的文献就没有意义了,直接数据来源于国泰安不就行了,而且指标都不对应如何称得上吴非的方法?吴非本人做法总不是来源于国泰安的吧,我看你应该是会爬虫,摘取年报关键词,而且袁的文章你也复刻了,难道吴非同思路的文章你做不出复刻方法吗?

使用道具

9
a1010967149 学生认证  发表于 2022-10-26 20:49:12 来自手机 |只看作者 |坛友微信交流群
wf243251 发表于 2022-10-26 20:10
那参考吴非的文献就没有意义了,直接数据来源于国泰安不就行了,而且指标都不对应如何称得上吴非的方法? ...
国泰安数据说明里都写的参考吴非数据是一样的,图片展示词汇都是吴非文章所示,怎么对应不上了?这里吴非原始数据处理流程10块钱,您不需要我直接退你

使用道具

10
a1010967149 学生认证  发表于 2022-10-26 20:56:26 |只看作者 |坛友微信交流群
wf243251 发表于 2022-10-26 20:10
那参考吴非的文献就没有意义了,直接数据来源于国泰安不就行了,而且指标都不对应如何称得上吴非的方法? ...
而且您有仔细看数据吗,您只是把词汇数统计了一下,有看到某个词频是0的吗?原始数据中词频为0的数据都没有统计在指标中,最低为1,您说少一些词汇,您觉得国泰安会不知道吗?

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 17:19