楼主: 雎尘_
3272 13

[经管数据集] 两方法:10-20年公司数字化:一基于袁淳(200+关键词),wingo分析;二为数字无形资产 [推广有奖]

  • 0关注
  • 1粉丝

已卖:44份资源

本科生

66%

还不是VIP/贵宾

-

威望
0
论坛币
23 个
通用积分
1.3958
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
979 点
帖子
32
精华
0
在线时间
163 小时
注册时间
2021-2-2
最后登录
2024-6-20

楼主
雎尘_ 学生认证  发表于 2022-5-3 15:00:39 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

数据一:2010-2020年上市公司数字化程度指标(基于袁淳等,2021),stata可直接使用的最终数据。

此份数据是比较严格的依据袁淳教授的《数字化转型与企业分工:专业化还是纵向一体化》而作,首先以Python对政策文件进行分析,在加上吴非等的数字化词汇后,得到238个全中文词语的数字化词典(目前数字化数据里,最大的词典量)。

最后通过wingo、Python等工具进行词频统计,确保质量可靠。如需从头到尾自行处理,也可购买完整版获得python代码(虽然我觉得只需要代码的可能没几个人,但如果确实有需要也可下方留言,会编辑单售这一部分)。

1.首先基于python对30余份国家政策进行分析,得到国家政策中出现的、高频数字化相关词语;同时为确保完整性,增加吴非等的数字化词汇(选取中文词汇),构成数字化词典(共238个词语。足够大的词汇量保证全面性)

2.为了最大限度减少误差,避免因python提取不全可能的误差,选择使用wingo进行分析,对数字化词典进行词频统计。wingo数据集提供精确词频、扩展词频、精确句频和扩展句频的分析(扩展就是在检索时,包含词频联想词);同时提供精确的文本总字数、总词数,其准确性要高于采取python爬虫爬取的结果,因为数据库的算法、复核更严谨,可以保证质量可信。

文件内容见最下方。


数据二:

基于祁怀锦教授《数字经济对公司治理的影响——基于信息不对称和管理者非理性行为视角》,根据数字化相关词频手工识别企业数字化相关无形资产占比。数据范围:2007-2020.

文件内容包括:计算方法、最终stata数据



数据在此出售,包含

一、结果版 数据一、二。

数据一:1.包含id、时间、词频、总词数、总词数不含字数、词频/总词数的dta数据,2010-2020年上市公司数据;2.一份238个关键词的数字化词典

数据二:计算代码及最终数据

二、过程版 数据一、二。

数据一:结果版全部,以及3.wingo数据库的全部基础数据,其中包括每个具体词汇的词频,有需要的可以按需求对部分词语进行加总,进行稳健性检验等 4.将基础数据转换为dta数据的程序文件do  5.依据4进行处理的词频数据7份

数据二:计算代码及最终数据

三、完整版 数据一、二。

数据一:过程版全部,以及6.原版关键词词典  7.Python识别政策文件程序、停用词程序、统计文本长度程序 8.三十份近十年数字经济政策  9.停用词和分词,可以完全实现从头的定制化操作(注:建议有编程相关经验的同学购买!虽然实际计算是我做的。但我个人是不懂python的,关键词分析这一部分的代码和结果是购买得到的,难以提供这方面帮助,抱歉)

数据二:计算代码及最终数据

欢迎购买,如有问题请在此询问,如果我懂的话会尽力解答。

结果版 数据一、二.rar (3.13 MB, 需要: RMB 22 元)
过程版 数据一、二.zip (11.57 MB, 需要: RMB 45 元)
完整版 数据一、二.rar (12.73 MB, 需要: RMB 72 元)
数据二.rar (2.68 MB, 需要: RMB 4 元)

以下为结果版、过程版、完整版的一览图:
结果版 过程版 过程版 完整版 完整版
注:最下方附件栏里的文件是不全的,已经设置高价,请勿购买。购买请在上方选择进行。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Wing 数字化 关键词 ING NGO

完整版.rar
下载链接: https://bbs.pinggu.org/a-3670858.html

10.06 MB

需要: RMB 55555 元  [购买]

过程版.zip

8.8 MB

需要: RMB 55555 元  [购买]

结果版.rar

467.63 KB

需要: RMB 55555 元  [购买]

沙发
ptyh(真实交易用户) 学生认证  发表于 2022-5-18 16:40:52
没事啦

藤椅
雎尘_(未真实交易用户) 学生认证  发表于 2022-5-18 23:28:51
ptyh 发表于 2022-5-18 16:40
请问这个结果是不是存在重复值呀,我看有两个东方明珠,但是每年的东方明珠的数据又是不一样的
你好,请问能再详细描述一下吗?我自己查了一下东方明珠,发现就只有01-20年数据啊,没有什么重复……

板凳
tyhag1(真实交易用户) 学生认证  发表于 2022-5-27 15:33:58
你好,请问还会继续更新2021年的数据吗

报纸
雎尘_(未真实交易用户) 学生认证  发表于 2022-5-27 16:54:54
tyhag1 发表于 2022-5-27 15:33
你好,请问还会继续更新2021年的数据吗
你好。因为是基于wingo数据库做的,而不是python处理,所以我自己也没有太好办法再做(因为我当时是购买的wingo服务,那时候21年报表还没出全)。如果你有需要可以在购买后,用那份数字词典,自己在wingo数据库进行(闲鱼就有,3-5元的样子)。抱歉了

地板
tyhag1(真实交易用户) 学生认证  发表于 2022-5-27 20:01:42
雎尘_ 发表于 2022-5-27 16:54
你好。因为是基于wingo数据库做的,而不是python处理,所以我自己也没有太好办法再做(因为我当时是购买的 ...
意思是说,wingo会有2021年年报的库吗?只需要拿着词典里的词语去wingo里操作就行吗,不需要再用python了?

7
雎尘_(未真实交易用户) 学生认证  发表于 2022-5-27 22:30:54
tyhag1 发表于 2022-5-27 20:01
意思是说,wingo会有2021年年报的库吗?只需要拿着词典里的词语去wingo里操作就行吗,不需要再用python了 ...
是这样的。

8
满船清梦压清河(未真实交易用户) 发表于 2022-6-28 09:36:52
您好,请问政策停用词是怎么筛选的呀?

9
热爱学术的小倩(未真实交易用户) 学生认证  发表于 2022-7-2 18:17:51
请问完整版是结果版+过程版吗

10
雎尘_(未真实交易用户) 学生认证  发表于 2022-7-4 10:26:08 来自手机
热爱学术的小倩 发表于 2022-7-2 18:17
请问完整版是结果版+过程版吗
你好。是这样的。价格高的内必定包含价格低的文件的全部内容

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 10:01