楼主: yijiaobani
3225 0

[休闲其它] 双标图GGE biplot的应用 [推广有奖]

  • 4关注
  • 5粉丝

博士生

26%

还不是VIP/贵宾

-

威望
0
论坛币
186 个
通用积分
10.4911
学术水平
2 点
热心指数
8 点
信用等级
0 点
经验
5127 点
帖子
147
精华
0
在线时间
236 小时
注册时间
2015-5-18
最后登录
2020-10-28

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

怎么用GenStat实现GGE双标图。

如果想试用GenStat软件,可以加入QQ群: GenStat 交流群 203276907


双标图应用领域:

l  品种——环境两向表

l  做基因表达数据

l  QTL效应——环境两向表

l  品种——性状两向表

l  双列杂交两向表

l  寄主——病原物两向表

l  基因型——遗传标记数据

l  环境条件——作物性状两向表

l  试验地点——气候土壤因素两向表

数据:论文中的原始数据,来源于1993年安大略冬小麦区试试验的数据,18个小麦品种在9个环境中的产量表现。第一列是18个小麦品种,第一行是9个不同的环境。

图:01

01

文章中有四个双标图,下面讲解怎么通过GenStat来达到相同的效果

1Which-Won-Where View,哪个品种哪个环境中是最好的

2Environmental VectorView,环境之间的关系

3DiscriminatingAbility VS Representativeness View,区分力和代表性

4Mean vs StabilityView,高产性和稳产性

它可以解决品种生态区划分、品种评价和试验点评价这三大问题。

GenStat具体实现如下:

首先对数据进行整理,数据分为三列内容:品种名、环境和产量三部分内容。

02

02.png

Ø  Which-Won-Where View,就是哪个品种哪个环境中是最好的

对应GenStat模型:

图03

05.png

结果:

图04

04.png

结果解读:

这张图主要是按照品种与环境的互作来说明各地点产量最高的品种。

1、  把各个方向上距离最远的点用直线连接起来,比如G8~G18~G7~G12~G13构成了一个五边形,通过中心对五条边做五条垂线,将双标图分为五个扇区,品种在五个扇区都有分布,品种分为两个扇区,E5和E7为一组,其它为一组。

2、  这张图可以得出:位于五边形顶角的品种是扇区内个环境下产量最高的品种,比如G18在环境E5和E7产量最高,品种G8在另外7个试验点产量最高。

Ø  Environmental Vector View,环境之间的关系

对应GenStat模型如下:将产量(value)导入到Y-variate框中,将品种(cul)导入到Genotype框里面,将环境(env)导入到Environments框里面,在Options里面勾选Connect environment scores with origin。

图05

作图如下:

图06

06.png

结果解读:

1、  本图主要是分析各试验点之间在品种评价上的相似性。从中心到各个环境做一条线段,线段间的夹角和线段本身的长度都有一定的代表意义。

2、  两环境线段之间的夹角的余弦值是它们的相关系数,夹角小于90度表示正相关,说明两环境对品种排序相似,大于90度表示负相关,表示两环境对品种排序相反,等于90度说明两环境不相关。夹角较小说明试验点是重复设置的,去掉一个不影响对品种的评价。

3、  环境线段的长度是试验点对品种的区分能力,线段越长,区分能力越强。

4、  本图可以知道环境E1、E2、E3和E4存在正相关。E5和E7比其它点有较强的品种区分能力。

Ø  Discriminating Ability VS Representativeness View,区分力和代表性

理想的试验点应该具备两个条件:一是对参试品种有较强的区分能力(线段长),二是对目标生态区有较强的代表性。

GenStat模型如下:

图07

07.png

图形如下:

图08

08.png

本图一个显著的特征是它增加了两条直线,其中带箭头的直线为平均环境轴(Average Environment Axis),通过平均环境(箭头前面的圆圈)和中心点的连线。

结果解读:

1、  试验点线段和平均环境轴的角度是其对目标环境的代表性的度量,角度越小,代表性越强。如果一个试验点和平均环境轴夹角为钝角,则它不适合作为试验点。

2、  平均环境轴上箭头所指的方向是对试验点区分力和代表性两方面的评价。

3、  就区分力来说,E5和E7(线段最长)最好,就代表性而言,E1、E2、E3、E4最好(与平均轴夹角最小)。

4、  没有区分能力的试验点是无用的。

5、  有区分力但没有代表性的试验点可以淘汰不稳定的品种,但不能用于优良品种的选择。

6、  只有既有区分力又有代表性的试验点才能最好的选择高产稳产的品种。因此这张图是对试验点的一个综合评价。

Ø  Mean vs Stability View,即高产性和稳产性

GenStat模型如下:

图09

09.png

作图如下:

图10

10.png

结果解读:

1、  高产稳产功能图也需要环境平均轴(带箭头的直线),和平均环境值(直线上圆圈表示)。还有一条通过中心与环境平均轴垂直的直线。将品种点和平均环境轴做一条垂线。

2、  环境平均轴所指的方向是品种在所有环境下的近似平均产量的走向。可知G8平均产量株高,后面依次是G4、G10、G18,产量最低的是G12,后面依次是G14、G7、G13。品种G17的平均产量接近试验总平均。

3、  通过中心(原点)与平均轴垂直的线代表各品种与各环境相互作用的倾向性。品种与平均环境轴之间的垂线越长,表示品种越不稳定。可知G13(线段最长)最不稳定,其次是G8、G17、G7。比较稳产的是G12、G15、G16、G6、G4(与平均环境轴的垂线较短)。

4、  综合品种产量和稳定的指标,可以看出G4是一个比较高产稳产的品种,G8也高产,但是不稳产。虽然G12很稳产(它几乎就在平均环境轴上面),但是产量最低。

GGE双标图存在的问题:

双标图GGE是基于传统的固定效应模型,它有一些假定和局限性:

1、  它要求数据平衡,即不能存在缺失值。

2、  它要求各试验点各区组内条件完全一致。在区组较大时(如大于10个区组),假定很难实现。

3、  固定效应模型假定各试验环境的误差同质

解决方法:

1、  用混合线性模型或析因设计(FA),将品种当成随机效应,可以解决以上问题。

2、  先用随机效应模型估计出各品种在各环境下的无偏估计值(BLUP),将BLUP值代替各环境品种的平均值作为基本数据进行GGE分析。

GenStat软件中GGE的优势

1、  GenStat基于REML的混合线性模型可以将品种当成随机效应。

2、  GenStat可以计算品种的BLUP值和BLUE值。

GenStat其它类型的GGE图:

图11

12.png

图12

11.png

参考文献:

严威凯. 双标图分析在农作物品种多点试验中的应用[J]. 作物学报, 2011, 36(11):1805-1819.

Chapman S, Schenk P, Kazan K, et al. Usingbiplots to interpret gene expression patterns in plants.[J]. Bioinformatics,2002, 18(1):202-204(3).

Yan W, Frégeaureid J. Breeding Line SelectionBased on Multiple Traits[J]. Cropence, 2008, 48(2):417-423.


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:biplot plot GGE 双标图 Environments 农业部 加拿大 冬小麦 安大略 基因型

03.png (39.61 KB)

03.png

<img src="stati ...
您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 01:32