楼主: Betoecmist
88216 327

[经管数据集] 【重磅】非国有股东治理/非国有股东委派董事及董监高占比数据2008-2019,含详细说明!   [推广有奖]

211
翟冬雪(真实交易用户) 发表于 2021-10-13 22:21:25
Betoecmist 发表于 2020-12-30 21:20
现在正在更新2020年数据,等更新好后免费为已经下载的同学更新的,到时联系即可~
2020年的数据什么时候更新?和股权治理的数据怎么合并购买?

212
雪中的奇大大(真实交易用户) 发表于 2021-10-17 18:15:16
想催催楼主,更新2020年数据

213
Betoecmist(未真实交易用户) 学生认证  发表于 2021-10-26 16:22:26
静静佳羿 发表于 2021-10-9 14:14
怎么还不更新阿?
最近正在更新,更新后的数据会发到https://bbs.pinggu.org/home.php?mod=space&uid=10611422,敬请关注,已经下载的同学可以免费领取~

214
Betoecmist(未真实交易用户) 学生认证  发表于 2021-10-26 16:22:42
雪中的奇大大 发表于 2021-10-10 17:20
楼主,期待这个数据的2020年的数据哦
最近正在更新,更新后的数据会发到https://bbs.pinggu.org/home.php?mod=space&uid=10611422,敬请关注,已经下载的同学可以免费领取~

215
Betoecmist(未真实交易用户) 学生认证  发表于 2021-10-26 16:23:25
翟冬雪 发表于 2021-10-13 22:21
2020年的数据什么时候更新?和股权治理的数据怎么合并购买?
最近正在更新,更新后的数据会发到https://bbs.pinggu.org/home.php?mod=space&uid=10611422,敬请关注,已经下载的同学可以免费领取~
关于非国有股东股权治理的数据 请参考以下链接 https://bbs.pinggu.org/thread-10689084-1-1.html

216
Reiddy(真实交易用户) 发表于 2021-11-8 22:07:34
谢谢分享,数据处理过程很详细,这个数据收集起来确实很花时间的,很有用

217
Betoecmist(未真实交易用户) 学生认证  发表于 2021-11-9 08:38:57
感谢大家支持,后续我们团队会发布更多高质量数据,敬请关注该链接空间https://bbs.pinggu.org/home.php?mod=space&uid=10611422

218
仄声爱学习(真实交易用户) 发表于 2021-12-2 09:49:48
之前购买了他们的数据,想核对下数据准确性,发现没有原始数据。跟他们沟通了,相关聊天内容附在后面,大家自己看吧。 在此提醒大家,一定要看清数据的内容,只有收集过程描述,以及最终结果,没有原始数据!!!                                                
        2021/12/1 21:08:18
您好,我想问一下数据收集过程中的问题。您那边是怎么确定非国有股东向上市公司委派了董监高呢?或者换个问法,您是怎么确定某个董监高归属于某个非国有股东呢?

         2021/12/1 21:09:38
进一步的,您那边是否还有非国有股东派驻董监高的具体名单,就是董监高个人数据里,哪些是非国有股东外派的?

            2021/12/1 21:10:13
这个董监高和他们对应的非国有股东,之间对应的名单,有吗?

        2021/12/1 21:10:28
有的话,是否方便提供一下?

         2021/12/1 21:20:27
您好,如果有最原始数据的话,我可以买。

         2021/12/1 21:21:55
还希望学长慷慨帮助我一下,谢谢学长啦!

Dat-Consulting 2021/12/2 8:29:35
昨天睡了,我看下,稍等

Dat-Consulting 2021/12/2 8:30:59

这个问题其实在附件中是有解释的,也就是说,通过判断年报的董事监事高管是否在非国有股东单位任职

Dat-Consulting 2021/12/2 8:32:56
这个过程是手工收集的过程,没有也不可能能留下文字版的,你想下,我们主要是收集非国有股东委派数量,只要计算人数就可以了



        9:10:43
如果只有数量的话,我怎么确定数据的准确性呢?

Dat-Consulting  9:12:00
学弟,不只是国泰安,还有年报,新浪简历等,就这样收集我们还用了快一年的时间

       9:12:23
如果您那边有最原始的数据的话,就是每个公司-年度所有董监高挨个核对后,对属于非国有股东公司派驻的,后面标为1,的那个数据,我愿意加钱购买

Dat-Consulting  9:12:54
学弟,这个肯定没有啊,如果有这么详细的话,那这个收集数据过程之前三年

Dat-Consulting  9:13:03
不是钱的问题

Dat-Consulting  9:13:20
你看我的帖子说明,已经很明确写出有什么,没有什么

       9:14:00
可是你们的确是通过这样方法比对出来的呀,总不能只有个最后数量吧?只有数量的话,您们怎么核对?

Dat-Consulting  9:14:41
我们收集的就是数量,每个公司一般委派就几个

       9:15:06
收集数量的过程,需要比对,对吧?比对的时候没有留痕?

       9:15:22
那这数据准确性怎么保证?后面都没法核查啊

Dat-Consulting  9:16:12
任何数据的准确性都是从新做下核对的

        9:16:25
比如某个公司由2个非国有股东委派的董事,我都不知道是哪两个,也不知道是对应的哪个公司……这怎么核对数据准确性?

Dat-Consulting  9:16:44
按照过程,从头开始看

Dat-Consulting  9:16:47
都是这样

        9:17:23
你们做核对,肯定还是这个过程,我相信你们在收集过程中不可能没有留痕,这不符合逻辑。要是这么做,你们的数据要么准确性无法保证,要么效率不能保证。这不可能呀学长

       9:17:48
学长,我是诚心求购,价钱好商量

Dat-Consulting  9:18:06
学弟,你这样,我给你说你还处于不理解状态,你试试收集几个就知道,不会写中间那一步
       9:18:38
学长,我就是自己尝试过收集,发现工作量太大,才直接找您购买的

        9:18:50
我之前也是收集过很多数据的

        9:19:11
所以,收集数据的步骤,我还是了解的

Dat-Consulting  9:19:33
任何类似的数据都不可能有中间那一步,那一步是判断的过程

        9:20:20
对,判断的过程,就是对每个属于非国有股东派驻的董监高,都会在后面标1,对吧?

Dat-Consulting  9:20:56
不是标1,是计算数量

         9:21:44
一个公司董监高平均数接近20个,你们不得标1,然后最后加总吗?

         9:22:00
计算数量,就是这个过程呀

Dat-Consulting  9:22:12
不不不

Dat-Consulting  9:22:18
董监高,一个个计算

        9:22:45
董监高一个个算,3类平均数也不少呀

Dat-Consulting  9:23:05
对的

        9:23:11
没有对应的原始数据,后面怎么核对?

Dat-Consulting  9:23:18
统计个数有这么难吗

        9:23:42
不是难,是为了有据可查

Dat-Consulting  9:23:52
我们团队都是研究生,博士,这个统计可以做的

Dat-Consulting  9:24:55
注意,我们帖子里有什么都会提前告知,至于没有什么,那就是没有

Dat-Consulting  9:25:14
我们团队挖掘数据是为了自己发论文

Dat-Consulting  9:26:28

有据可查,当然可以,从do文档及附件收集,你可以看下这个过程

       9:26:28
要不这么庞大的数据,你们收集了一年,不可能对数据质量没有一点把控,肯定是有校对过程的吧,校对的时候总不能再来一遍吧。有留痕的原始数据,是大多数团队收集数据的要求……如果没有这个,那要么数据质量没保证,要么效率没保证,你们团队不可能没这点认识吧?

Dat-Consulting  9:26:47
校对就是再来一遍

Dat-Consulting  9:27:33
我们有质量审核,审核都是再来一遍,不然怎么保证不是从第一步就错

          9:30:52
学长,你们再来一遍的时候,有没有改正的数据?有的话,你怎么知道两次判断的标准是一致的?不会漏过去?比如第一次是发现张三和李四两个人属于非国有股东A公司派驻的,第二次发现张三和王五两个是非国有股东A公司派驻的,然后数量都是2……

        9:31:20
但张三、李四、王五其实应该是3个人

         9:31:57
不是说数据必须全部准确,而是说至少有据可查,对吧

         9:32:20
这是必然逻辑,这么多硕博收集数据,不可能没有留痕的

         9:32:45
如果有,我愿意加钱购买,价钱好商量

        9:32:47
可以吗?

Dat-Consulting  9:32:49
学弟啊,关于收集数据的过程,每个团队有每个团队的原则,我们出现不一致的会有组长去审核,判断好后,会让有错误的同学进行再次审核改正

         9:34:20
也就是说,你们是两组人收集同一个数据,或者同一组数据收集两遍?只对出现不一致的数据进行进一步核对订正,是吗?

Dat-Consulting  9:34:26
类似的数据,不会有你说的那个,我们最新绿色治理的数据也在收集中,已经一年了,不会有你说的这种,以后也不会,你自己收集一次大规模数据就知道了

         9:35:22
那么就像我刚才说的那种情况,张三、李四数量是2 ,张三、王五数量也是2,就不会被发现有错误

        9:35:41
但其实应该是张三、李四、王五3个才对

        9:36:04
我自己收集过很多大规模的数据

        9:36:19
所以我是知道个中辛苦的

Dat-Consulting  9:36:30
关于收集数据的过程,每个团队有每个团队的原则

Dat-Consulting  9:37:06

同一个数据不止两组人

Dat-Consulting  9:37:19
我们还有分组组长,总组长等

       9:37:24
但是依旧可能出现这个问题,对吧?

Dat-Consulting  9:37:43
不对

        9:38:03
……

Dat-Consulting  9:38:43
就是统计个数量,三四个研究生有什么统计不对的

          9:38:51
多几个组长,跟数据有据可查,是两码事,组长可以保证数据准确性?

Dat-Consulting  9:39:09
对的

          9:39:22
好吧,既然你这么说,那我就没话可说了

Dat-Consulting  9:39:43
我们这些统计已经高于国泰安的方式了
Dat-Consulting  9:40:53
如果收集的好,我们可以付工资,如果收集没之前好,你去付工资,这样,OK吗

Dat-Consulting  9:44:05
我们团队很欢迎有能更提高效率和效果的办法,在一定时间内产生更好的高质量数据


219
Betoecmist(未真实交易用户) 学生认证  发表于 2021-12-2 10:41:17
仄声爱学习 发表于 2021-12-2 09:49
之前购买了他们的数据,想核对下数据准确性,发现没有原始数据。跟他们沟通了,相关聊天内容附在后面,大家 ...
学弟,具体的我已经说的很详细,我们展示的附件里有什么就是什么,你的披露也很重要,让大家也能看到,我们在尽可能地追求高质量数据,但这一过程需要严格的效率和效果的平衡,我想,我们现在做的过程已经非常严谨了,现就你提到的问题做出以下回应:
(1)我们附件里是有原始数据、数据构造过程、最终数据、数据来源及数据构造过程参考文献;其中原始数据是,是委派董事、监事及高管数量的统计,可以从我们帖子里展示的原始数据示例看到。
(2)你说的需要有留痕,即比如某个公司某年委派两个董事,那这两个董事是谁,分别是从哪几个非国有股东单位派驻的。这一过程,是我们团队在对年报、巨潮资讯网、新浪简历等数据库判断的过程,这个是无法留痕的,你可以按照我们的过程做一遍,我们通过计量软件STATA构造数据收集表,然后开始判断原始数据,而你说的,增加股东性质、董事委派来源,这个太理想化了,不说其他,光这个过程的处理我们花的时间都要远远大于我们收集数据本身,因此,在大规模数据收集过程中,第一是为了高质量数据,第二是为了效率,不可能我们收集5年,为了填补这一情况,这样的效率我想,没有人会愿意等吧?
(3)以上是我的理解,我们团队致力于挖掘高质量数据,且数据本身就是我们自己论文用的,这也就是我们空间其实最新的数据更新慢的原因,我们愿意分享自己的数据,这其实都是一个艰难的过程。以上是我的回复,有问题都可以继续交流~

220
Betoecmist(未真实交易用户) 学生认证  发表于 2021-12-2 10:44:25
大家有任何的问题都可以留言交流,如果提的意见真的能帮助数据更高质量,我们团队一定会虚心采纳,学术本身就是一个需要争论、交流的,大家畅所欲言,有问题我们多探讨~我们也是在追求高质量数据的挖掘,希望大家都能为此做出自己的贡献~

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-1 17:04