楼主: fumingxu
621 2

[休闲其它] 【独家发布】【朝花夕拾-好文共赏】-文献大数据时代,你准备好了吗? [推广有奖]

泰斗

51%

还不是VIP/贵宾

-

TA的文库  其他...

经管朝花夕拾万花筒

行为决策+行为经济学+行为金融

威望
6
论坛币
198557 个
通用积分
38560.2928
学术水平
2511 点
热心指数
2986 点
信用等级
2477 点
经验
42750 点
帖子
20947
精华
11
在线时间
6224 小时
注册时间
2012-3-26
最后登录
2024-4-30

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
文献大数据时代,你准备好了吗?  

随着时间的推移和现代科研工具的更新,科技数据和科技文献量近些年成爆发性增长,让无论是科研老手还是青椒都显得有些跟不上、老鼠盘西瓜-无从下手的感觉。在海量文献面前,特别是这些文献又不尽一致时,如何选一个新颖,至少不是完全跟风的研究题目,能在前人的研究基础上更深入一步地研究和探索(跟进研究),就成为一个棘手的问题。Meta分析, 这个“闻起来臭”“吃起来香”的“臭豆腐”分析工具,也许可以帮你解决这个问题。

meta分析,中文有译成“荟萃分析”的。它是对具备在特定条件的同类所有相关研究结果(文献)进行分析的一种统计学方法。通过客观分析和概括,得出量化的平均效果。归纳和总结已发表研究成果:如所有相关研究的共性结果是什么,某些处理是否有效果。分析和解释已发表研究结果之间的异质性和生物学的意义。在这些研究中,有哪些问题已形成共性结论,那些问题尚未解决,这就为下一步研究提供了新的研究课题。这些新课题是基于数据事实得出的,不带主观偏见。


根据维基百科,meta分析最早源于1920年Fisher提出的“合并P值”的概念。1976年由Glass进一步发展为“合并统计量”,称之为Meta分析。1979年英国Archie Cochrane将这种方法称为对文献的系统评价(Systematic Review)。虽然meta分析从1980开始应用,到1980代中期已广泛应用于医学,后来扩展到其他领域。但我一直没有关注过它。直到约3年前,我的同事,Robert Auge 教授从我们系的系主任位置上退下来,开始做学术休假。我问他在做什么,他说,在学meta分析方法。后来还专门开了一门课。因为我们都是做植物科学的,对这个广泛应用于医学领域的分析方法,不太关注。我让他给我做了半小时的科普和他在做的题目。我就隐隐约约觉得它对我们生物技术领域很有用途。


不太了解meta分析的人会简单认为“不就是一个系统文献综述嘛”。所以通常这样的文章是以综述形式的文章发表的,不是原创性论文。最近被国外期刊撤销的国内论文中相当一部分都是和meta分析相关。因为meta分析不需要做wet lab的实验,只要分析文献,容易代写。其实,那些被撤销的meta分析论文,并不是因为用了meta分析方法,而是其他学术不断行为,但却玷污了meta的名声。所以meta给人的感觉是个“闻起来臭”的“南京臭豆腐”。就好像是在青楼喝的酒也是被“piao”过的。用好meta分析,还是可以发好的原创性文章的,最关键的是可以为下一步的研究提供非偏见的、以数据为基础的思路。最典型的一个例子就是2014年6月发在Nature上的二氧化碳的飙升威胁人类营养和2015年1月15号发表在Nature上的关于农作物免耕和非免耕的meta分析文章。关键是会不会“煎”,煎得好,这个“闻起来臭”的“臭豆腐”也是“吃起来香”的。所以我给她取个名叫“么她”(直接打字就出现的第一个选择)。最近我们第一次“么”了“她”一下,一篇论文,以原创性论文形式被PlantBiotechnology Journal(IF6.09,俗气吧?!)杂志接受。


分子生物学进展到今天,各种基因被克隆,被转化到动植物中,但具有应用价值的转基因植物还是极少数的。为什么在做功能验证时,很多都觉得很有价值的基因(功能-如抗旱-很明显),但就是形不成产品?不同的人用不同的基因来源,转到不同物种的受体,实验的处理和指标评价又有很大差别。对这么大的文献数据,多的有几百篇文献,除非用统计的方法,否则几乎不可能得出非偏见的客观结论。而没有这个结论,又怎么能设计不带偏见的,不跟风的研究题目?用meta分析,应该可以解决这个问题。从海量的文献数据中,可以找到潜藏的,有价值的信息。这也是大数据文献时代应该采用的科研方法。我觉得应该归为大数据分析的一种。


我实验室的一个研究课题就是如何培育超耐盐的园艺植物,可以在江苏省东部沿海滩涂上生长。但那儿围垦的滩涂含盐量会在0.3-2.0%,而正常的土壤的含盐量在0.1-0.25%。我们想用研究最详细的、最重要的“抗盐”基因,cation/proton antiporter 1(CAP1)基因家族,但文献很多,结果很不一致,所以到底有没有抗盐功能不好定论。所以我们以CPA1基因的过量表达效果为题,系统分析了已发表的文献,试图弄清为什么这么多年来,有那么多过量表达的转基因文章,但至今没有成功的抗盐植物的产品。那么到底转这些基因有没有效果?“大效果”没有,“小效果”有没有?效果在哪儿?造成这些结果的系统原因是什么?下一步应该怎样设计实验?我们得出一些有意思的发现,为我们设计下一步研究提供了很好的思路。


做好一篇好的meta分析文章,其实也是不容易的。也是要从头学起的。我2014年秋天派了我的博士生马媛春去田纳西大学跟着Robert Auge教授上课并学习meta分析,同时在她的研究方向内做一个实例分析。也是要经过选题、提出假设,做实验、分析数据、写文章、投稿、修改,到最终发表的艰苦过程。做“实验”,花了三个多月时间。但写这种文章其实也很不好写,特别是要发一篇有一定影响的好文章,而写手又是新手时。其后我们折腾了一年半(中间有半年没管它),十易其稿,投稿两次,第一次被拒稿。重投后大修一次,小修两次。最近才最终被接受,在线发表。


做完这篇文章后,我们对meta类文章进行了历史统计分析,见下图。绝大多数文章是在医学领域,而且还在迅猛扩大。国内是这5、6年才开始的,但势头如山洪暴发。在医学界恐怕有些“泛滥成灾”了,成了“过街老鼠”了—是说文章数已经很多了。但从全世界的角度看,meta分析在农业领域还是刚刚开始,国内四所主要农业大学(中国农大、南京农大、华中农大和西北农林大)至2016年6月底总共才发了26篇使用meta分析的文章。在生物技术领域此类文章也极少。我们细查了一下,我们的这篇文章似乎还是植物生物技术方面的第一篇meta分析文章。虽然不是撼动地球(earth-shaking)的文章,我们还是很开心的。最主要的是通过非主观分析,以数据为依据,为我们下一步的研究提供了新的思路。


相信“么她”分析会在未来文献大数据时代有更多的应用。特别是研究生开题前都应该用这个方法做文献系统分析,然后再做开题报告和实验设计。这样的研究和文章都会在“巨人”的肩膀上攀上一步。属于“跟进”,而不是“跟风”(金拓语)。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:你准备好了吗 大数据时代 朝花夕拾 大数据 Systematic 朝花夕拾 下一步 臭豆腐 统计学 生物学

本帖被以下文库推荐

沙发
smartlife 在职认证  发表于 2016-9-22 19:45:27 |只看作者 |坛友微信交流群
不出成果怪谁?

使用道具

藤椅
Kamize 学生认证  发表于 2016-9-22 19:46:27 来自手机 |只看作者 |坛友微信交流群
fumingxu 发表于 2016-9-22 17:15
文献大数据时代,你准备好了吗?  
随着时间的推移和现代科研工具的更新,科技数据和科技文献量近些年成爆 ...
享受大数据时代的有益

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 03:41