仄声爱学习 发表于 2021-12-2 09:49 
之前购买了他们的数据,想核对下数据准确性,发现没有原始数据。跟他们沟通了,相关聊天内容附在后面,大家 ...
学弟,具体的我已经说的很详细,我们展示的附件里有什么就是什么,你的披露也很重要,让大家也能看到,我们在尽可能地追求高质量数据,但这一过程需要严格的效率和效果的平衡,我想,我们现在做的过程已经非常严谨了,现就你提到的问题做出以下回应:
(1)我们附件里是有原始数据、数据构造过程、最终数据、数据来源及数据构造过程参考文献;其中原始数据是,是委派董事、监事及高管数量的统计,可以从我们帖子里展示的原始数据示例看到。
(2)你说的需要有留痕,即比如某个公司某年委派两个董事,那这两个董事是谁,分别是从哪几个非国有股东单位派驻的。这一过程,是我们团队在对年报、巨潮资讯网、新浪简历等数据库判断的过程,这个是无法留痕的,你可以按照我们的过程做一遍,我们通过计量软件STATA构造数据收集表,然后开始判断原始数据,而你说的,增加股东性质、董事委派来源,这个太理想化了,不说其他,光这个过程的处理我们花的时间都要远远大于我们收集数据本身,因此,在大规模数据收集过程中,第一是为了高质量数据,第二是为了效率,不可能我们收集5年,为了填补这一情况,这样的效率我想,没有人会愿意等吧?
(3)以上是我的理解,我们团队致力于挖掘高质量数据,且数据本身就是我们自己论文用的,这也就是我们空间其实最新的数据更新慢的原因,我们愿意分享自己的数据,这其实都是一个艰难的过程。以上是我的回复,有问题都可以继续交流~