发帖

楼主: xiaobo1994

597 0

[数据] pandas基因结构分析 [推广有奖]

0关注
0粉丝

学前班

60%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 0 个
通用积分: 0
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 100 点
帖子: 1
精华: 0
在线时间: 2 小时
注册时间: 2022-12-9
最后登录: 2023-6-6

楼主

xiaobo1994 发表于 2022-12-9 19:14:34 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

def get_structure(notes, mRNA_start):
aa_start = 1
mRNA_notes = [0]
for note in notes:
      mRNA_start += (note-aa_start)*3
      aa_start = note
      mRNA_notes.append(mRNA_start)
mRNA_notes.append(df['length_mRNA'].sum())

structure = []
for i in range(len(mRNA_notes)-1):
      structure.append([mRNA_notes[i], mRNA_notes[i+1]])
return structure

def get_init_term_codon(df_structure, nm_info):
import json
with open('../SiCreen/ncbi_hg38_mRNA.json') as f:
      homo_json = json.load(f)
seq = homo_json[nm_info]
initiation_codon = seq[df_structure.loc[0, 'end']-1:df_structure.loc[0, 'end']-1+3]
termination_codon = seq[df_structure.loc[df_structure.shape[0]-2, 'end']-1-3:df_structure.loc[df_structure.shape[0]-2, 'end']-1]
len_3utr = df_structure.loc[df_structure.shape[0]-1, 'end'] - df_structure.loc[df_structure.shape[0]-1, 'start'] + 1
return initiation_codon, termination_codon, len_3utr

notes = [1, 31, 153, 453, 694]
mRNA_start = 291
structure = get_structure(notes, mRNA_start)
features = ["5'UTR", 'SP', 'Pro', 'Catalytic domain', 'C-terminal', "3'UTR"]
df_structure = pd.DataFrame(structure, columns=['start', 'end'])
df_structure['feature'] = features
df_structure['strand'] = '+'
df_structure = df_structure[['feature', 'strand', 'start', 'end']]

pcsk9_info = 'NM_174936.4 Homo sapiens proprotein convertase subtilisin/kexin type 9 (PCSK9), transcript variant 1, mRNA'
initiation_codon, termination_codon, len_3utr = get_init_term_codon(df_structure, pcsk9_info)

df_structure.to_csv('../SiCreen/PCSK9_structure_mRNA_features.txt', sep='\t', index=None)
print(f'initiation_codon: {initiation_codon}')
print(f'termination_codon: {termination_codon}')
print(f'len_3utr: {len_3utr}')
df_structure

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：pandas panda 结构分析 Das INITIATION

[数据] pandas基因结构分析 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

[数据] pandas基因结构分析 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群