楼主: xiao_zhe
915 1

[学习分享] 新手向/保姆级教程#基因家族分析之物种共线性分析_R语言RIdeogram [推广有奖]

  • 0关注
  • 0粉丝

初中生

0%

还不是VIP/贵宾

-

威望
0
论坛币
55 个
通用积分
95.7520
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1233 点
帖子
5
精华
0
在线时间
8 小时
注册时间
2023-8-18
最后登录
2024-4-7

楼主
xiao_zhe 学生认证  发表于 2023-9-13 11:17:47 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

图片绘制使用R语言中的RIdeogram包进行,数据分析使用TBtools完成。

1、首先在NCBI或者其他网站下载需要分析的物种基因组文件,包括全基因组序列,gff文件,cds序列文件。


2、使用TBtools中Sequence Toolkit菜单下Fasta Tools类目中的Fasta Stats 对染色体长度进行统计。将染色体长度信息,按照R包要求的数据格式进行整理:(第一列染色体名称,第二列 起始位置,第三列 结束位置,第四列 染色体填充颜色,第五列 物种名称,第六列 物种名字体大小,第七列 物种名颜色),将文件保存为chr_info.csv。

图1 染色体信息.png


3、使用TBtools中Comparative Genomics类目中OneStepMCScanX-SuperFast工具对两物种间的共线性关系进行分析(需要先在Plugin Store中进行该插件安装),将分析得到的共线性关系(geneLinkedRegion),按照R包要求的数据格式进行整理:(第一列物种1的染色体名称,第二列 物种1起始位置,第三列 物种1结束位置,第四列 物种2染色体名称 ,第五列 物种2起始位置,第六列 物种2结束位置,第七列 关系对的连线颜色,第八列 指定共线性物种)。将文件保存为gene_link.csv。第七列fill可更改颜色代码以突出某些共线性关系,由于线条是按先后顺序进行绘制的,因此要将这些需要突出的关系对至于表格中的最后面,以免被遮挡覆盖。第八列type的参数为1、2、3,根据步骤2中染色体信息表中物种的先后顺序进行排列,1代表第1个物种与第2个物种之间的关系,2代表第1个物种与第3个物种之间的关系,3代表第2个物种与第3个物种之间的关系。如果只是进行两物种之间的共线性分析,则无需type列。

共线性关系.png

4、在共线性关系文件(geneLinkedRegion)中,找到所需分析基因家族成员的关系对放置到第3步的文件的最后,并设置连线颜色代码。

5、使用R语言进行绘制

install.packages("RIdeogram") #安装R包RIdeogram

library("RIdeogram") #加载R包

A <- read.table("chr_info.csv", sep= ",", header = T) #读取染色体信息文件

B <- read.table("gene_link.csv", sep= ",", header = T) #读取共线性关系文件

ideogram(karyotype = A, synteny = B,output ="file name. svg") #绘制共线性图

convertSVG("name.svg ", device ="png",file = "file name",dpi = 600) #将svg文件转换为png

convertSVG("name.svg ", device="pdf",file = "file name") #将svg文件转换为pdf文件

D2X][]1EJA~]6U4NIB8[QMQ.png


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:gram DEO 共线性 R语言 IDE

沙发
512661101 发表于 2023-9-13 11:36:56
谢谢分享!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-8 21:57