|
在这里,我们将遵循一种务实的方法,做一些简单的事情——数据中有太多噪音,否则做根本不起作用。因此,我们将简单地采用ris=ln(1+Gis)(26)这将处理Gis=0的情况;地理信息系统 1.我们有Ris≈ ln(地理信息系统),根据需要。现在,我们可以使用“最小化”和基于eRank的方法(有或没有基于Kb的变异)来构建癌症特征的统计因子模型,以确定癌症特征的数量K。事实上,为了实现复杂性和比较性的目的,下面我们将构建这样的因子模型,如Mumingboth(26)和Ris=Gis。令人高兴的是,结果在质量上是相似的。6实证结果6。1数据摘要在下面的实证分析中,我们仅使用已发表样本的基因组数据。表2中总结了这些数据,我们给出了总计数、样本数量和数据来源,如下所示:A1=[Alexandrov等人,2013b],A2=[Love等人,2012],B1=[Tirode等人,2014],C1=[Zhang等人,2013],D1=[NikZainal等人,2012],E1=[Puente等人,2011],E2=[Puente等人,2015],F1=[Chenget等人,2016],G1=[Wang等人,2014],H1=[Sung等人,2012],H2=[Fujimoto等人,2016],I1=[Imielinksi等人,2012],J1=[Jones等人,2012],K1=[Patch等人,2015],L1=[Waddell等人,2015],M1=[Gundem等人,2015],N1=[Scelo等人,2014]。附录A.6.2基因组数据结果在我们的基因组数据集中,我们有14种癌症类型。使用定义(26),我们采用“最小化”和基于eRank的方法(有无KBase)。以下讨论的重点是Gisand,除非另有说明,否则也适用于[G(α)]is。变异)用于确定癌症特征的数量。
|