楼主: lihaim
4166 29

[论文写作规范] 实证满天飞的时代,你敢公布你的数据吗? [推广有奖]

匿名网友
11
匿名网友  发表于 2011-6-4 08:04:55
2007年第9期《经济研究》上曾有一篇文章,因为存在重大数据乱搞现象,被天则研究所的张曙光教授揭露出来
事后《经济研究》宣布撤稿,在学术界轰动一时。
其来龙去脉,请见 http://www.acriticism.com/article.asp?Newsid=11377&type=1000

12
wrwr19881988 发表于 2011-6-4 10:09:05
其实小弟看过的文章里面,核心的严谨一些,一般期刊上的模型和数据大多都有问题,甚至指鹿为马、颠倒黑白的都有,上文自己说了根本就不满足条件,下面自己把方程列出来了,还编造了统计量来说明自己的方程很可靠,差点吐了......我觉得要是水平有限,用错了倒是情有可原;明知道错了为了凑篇文章出来就说瞎话实在是.........
能力=一般成功
背景=超越一般的成功
能力+背景+机遇=超越常人的成功

13
夸克之一 发表于 2011-6-4 10:16:40
shando 发表于 2011-6-4 05:31
其实,这完全是中国人的固有性格使然。
一、对于非保密的、可得的经济数据而言,任何人都是可获取的,并非只有某人才能获取。
二、数据仅仅只是研究论文的材料,而绝非作者的idea,可以用不同的idea对相同的数据进行研究,进而提高学术界的整体研究水平。也就是说,公布非保密数据对于社会有利,对于自己也有利。
三、对于一个不愿公布数据的研究者来说,将无法看到他人对这一数据新的研究思路,也就无法提高自身的研究能力,其结果是可悲的。



需要强调的是上述数据的性质仅指经济数据,而非工程和工艺数据,因为绝大部分工程和工艺数据都是保密的。楼上所说的可能就是这种情况。
微观数据很多是保密的。。。人口普查数据也是如此。虽然我也希望他人公开,帮助我们开展研究。但是,如果作者与数据所有者之间有保密协议,是不得泄露的。

这个问题,我咨询过相关作者,他们虽然与数据所有者私交甚好,但每次也要签协议。如果擅自提供给别人,包括审稿人,这都是违法契约的行为。

14
davidbeckham23 发表于 2011-6-4 10:52:55
夸克之一 发表于 2011-6-4 10:16
shando 发表于 2011-6-4 05:31
其实,这完全是中国人的固有性格使然。
一、对于非保密的、可得的经济数据而言,任何人都是可获取的,并非只有某人才能获取。
二、数据仅仅只是研究论文的材料,而绝非作者的idea,可以用不同的idea对相同的数据进行研究,进而提高学术界的整体研究水平。也就是说,公布非保密数据对于社会有利,对于自己也有利。
三、对于一个不愿公布数据的研究者来说,将无法看到他人对这一数据新的研究思路,也就无法提高自身的研究能力,其结果是可悲的。



需要强调的是上述数据的性质仅指经济数据,而非工程和工艺数据,因为绝大部分工程和工艺数据都是保密的。楼上所说的可能就是这种情况。
微观数据很多是保密的。。。人口普查数据也是如此。虽然我也希望他人公开,帮助我们开展研究。但是,如果作者与数据所有者之间有保密协议,是不得泄露的。

这个问题,我咨询过相关作者,他们虽然与数据所有者私交甚好,但每次也要签协议。如果擅自提供给别人,包括审稿人,这都是违法契约的行为。
嗯,数据的保密协议相当严格的,在这个圈子混,不能也不敢违反这些规定。

取得数据使用权才敢拿来发表文章的,基本上大家都很小心。

15
burtonzzx 在职认证  发表于 2011-6-4 14:47:53
说白了就是为自己瞎编找理由
不公布数据,,如何检验结果的真实性?

16
weifeng717719 发表于 2011-6-4 16:44:02
这是个困境!
力挽狂澜

17
xiongmao33 发表于 2011-6-4 18:36:28
今天还跟老师讨论过这个问题。有些文章的数据不用重复算也知道是有问题的。SPSS结果出来本身也是可以看出破绽的。

18
gujun1225 发表于 2011-6-5 03:40:31
10# shando

比如财务数据,我是做会计的,的确是公开的。但是问题是,这种免费的Access只限于你自己去手工搜索;
而如果你要使用现成数据,如果我在国内曾用过的Wind,CSMAR,现在我所使用的CRSP和COMPUSTAT,BANKSCOPE等,都是收费的,也是有版权的。
这种数据是否公开,完全取决于作者的态度和相关条款。所以一般你能看到的都是作者提供的sample data。当然,由于条款并不严格,也有人愿意提供;
而至于处理方法,这个东西则更难拿到。因为程序,脚本都是自己花时间去写的。一般我们这里风格是,除了导师外,我们不会给任何人提供源代码。如果你真的要,那我会给你个binary。
更重要的原因是,其实我们现在跑数据都是远程进行,不会类似于国内那样把数据放到本地电脑上执行了。一般本地只有回传结果,哈哈

19
夸克之一 发表于 2011-6-5 03:54:18
burtonzzx 发表于 2011-6-4 14:47
说白了就是为自己瞎编找理由
不公布数据,,如何检验结果的真实性?
所谓的检验也是防君子不防小人的。

20
静水深流 在职认证  发表于 2011-11-19 17:34:38
大环境下,公布数据有被人利用的风险。不得不考虑

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注ddjd
拉您入交流群
GMT+8, 2025-12-31 15:39