局部相似分析的统计研究及其在生物时间序列中的应用
宏基因组表示自然环境中全部微生物遗传物质的总和,是生物信息学最热门的研究领域之一。宏基因组学无需对微生物进行培养,直接提取环境中存在的所有微生物的遗传信息,进而研究环境中微生物之间的相互作用,分析微生物群落的物种多样性。
随着分子生物学技术的快速发展,特别是下一代测序技术的出现,大量的宏基因组测序数据不断产生。面对海量的测序数据,如何利用它们对微生物组进行研究分析是生物信息学面临的一大挑战。
近十年来,受益于测序成本的大幅降低,分子生物学研究产生了大量的微生物群落时间序列数据。在时间序列相关的统计方法中,局部相似分析(local similarity analysis,LSA)已被广泛用于研究不同环境中微生物群落的时空演变,寻找微生物物种之间潜在的局部和时间延迟关系。
这些关系无法通过传统的相关性分析方法获得。通常利用置换检验对局部相似分析的统计显著性进行评估。
最近,研究人员提出了一个理论方法分析局部相似得分的统计显著性。然而,这个方法和置换检验都需要假设原始时间序列是独立同分布的,但在很多实际问题中这个假设可能是不成立的。
本文提出 ...


雷达卡


京公网安备 11010802022788号







