基因测序行业方兴未艾:一方面,基因测序拥有巨大的应用前景,包括产前筛查、遗传性、肿瘤、药物研发等;另一方面,基因测序成本的进一步降低、基因组解读、临床大数据积累、非编码序列分析等有待突破。我们认为基因测序行业市场处在成长阶段,在技术进步、政策培育等因素推动下,未来会给人类健康预防与疾病治疗带来革命性的变化。当下,我们需要多一些时间和耐心。在这里,我们试图与投资者共同探讨基因测序行业的一些热点问题。
讨论一:海量基因组数据存储和解析成为巨大挑战
测序仪产生的海量数据给解析带来了巨大困难。研究人员需要掌握生物信息学技术,对数据进行分类储存整理,建立标准化的测序信息分析流程,并通过大量的样本积累,才有可能挖掘出测序结果与疾病的相关程度以及对药物开发和临床用药的精确指导意义。目前有效测序信息太少,分析能力有限,测序仪生产商提供的测序结果分析软件价值有限,建立标准化的测序信息分析软件是当务之急。
图表1:二代测序仪每个循环数据产出量大
形成标准化的测序信息分析软件是未来发展趋势。DeciBio的研究者们通过对2012年至2015年间1000多篇论文和30篇专家采访进行了综合分析,结果表明:如何提高意义不明突变的分析和报告质量以及提供相应生物信息学解决方案备受关注。Ebiotrade调查结果显示大部分使用者选择用现有软件自行分析,仅有25%的受访者选择外包给专业的生物信息公司。我们认为测序数据量越来越庞大,采用标准化的测序信息分析软件将会成为行业共识。
图表2:生物信息学解决方案备受关注
图表3:仅25%受访者外包专业生物信息公司
云计算平台可大大提高存储和分析效率。目前大型基因数据库中的信息都是以PB(1PB=1024x1024GB)计算,国际癌症基因组联盟ICGC的数据库五年内就积累了超过2PB数据,如此庞大的数量储存费用就需要100万美元,如果把这些数据转移到内部网络需要花超过15个月的时间。通过云计算,科研人员可以在虚拟机上分享数据和计算方法,大大提高存储和分析效率。同时,云平台通过加密和防火墙或密保卡等方式来控制数据的使用权可以保证数据的安全性。NIH在2015年取消不准将dbGap数据库中的基因组信息上传到云端的规定加速了云计算用于基因组分析的进程。
华大基因领跑国内基因组数据存储和解析。凭借二代测序数据分析经验,华大基因开发了基于“云”的解决方案。2015年4月20日,华大基因在全球发布一款强大且具高安全性的基因组数据分析云计算平台服务产品--BGIOnline。BGIOnline平台用户可以基于华大基因的开源软件开发工具,创建自己的分析工具。同时,用户的分析工具可以与BGIOnline平台的公共分析工具、生物信息分析工具和其他资源相融合,建立起一整套更符合用户自身研究需求的分析流程。
BGIOnline国内beta版本上线,药明康德携手华为布局云平台。2016年2月23日,华大基因宣布其在阿里云计算平台部署的服务产品BGIOnline国内beta版本正式上线,堪称基因行业的“APPStore”。阿里云为华大基因提供了全线的云服务产品,并且针对BGIOnline平台特点在项目改造迁移中提供了强有力的技术支持和运维保障。华大基因拟携手阿里云进一步开发和完善BGIOnline产品,为全球研究者和用户提供更便捷、更安全的服务。2016年3月16日,药明康德与华为签署精准医疗云战略合作协议,共同推进医疗大数据的集中和应用。