楼主: xiaobo1994
576 0

[数据] pandas基因结构分析 [推广有奖]

  • 0关注
  • 0粉丝

学前班

60%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
100 点
帖子
1
精华
0
在线时间
2 小时
注册时间
2022-12-9
最后登录
2023-6-6

楼主
xiaobo1994 发表于 2022-12-9 19:14:34 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
def get_structure(notes, mRNA_start):
    aa_start = 1
    mRNA_notes = [0]
    for note in notes:
        mRNA_start += (note-aa_start)*3
        aa_start = note
        mRNA_notes.append(mRNA_start)
    mRNA_notes.append(df['length_mRNA'].sum())

    structure = []
    for i in range(len(mRNA_notes)-1):
        structure.append([mRNA_notes[i], mRNA_notes[i+1]])
    return structure

def get_init_term_codon(df_structure, nm_info):
    import json
    with open('../SiCreen/ncbi_hg38_mRNA.json') as f:
        homo_json = json.load(f)
    seq = homo_json[nm_info]
    initiation_codon = seq[df_structure.loc[0, 'end']-1:df_structure.loc[0, 'end']-1+3]
    termination_codon = seq[df_structure.loc[df_structure.shape[0]-2, 'end']-1-3:df_structure.loc[df_structure.shape[0]-2, 'end']-1]
    len_3utr = df_structure.loc[df_structure.shape[0]-1, 'end'] - df_structure.loc[df_structure.shape[0]-1, 'start'] + 1
    return initiation_codon, termination_codon, len_3utr

notes = [1, 31, 153, 453, 694]
mRNA_start = 291
structure = get_structure(notes, mRNA_start)
features = ["5'UTR", 'SP', 'Pro', 'Catalytic domain', 'C-terminal', "3'UTR"]
df_structure = pd.DataFrame(structure, columns=['start', 'end'])
df_structure['feature'] = features
df_structure['strand'] = '+'
df_structure = df_structure[['feature', 'strand', 'start', 'end']]

pcsk9_info = 'NM_174936.4 Homo sapiens proprotein convertase subtilisin/kexin type 9 (PCSK9), transcript variant 1, mRNA'
initiation_codon, termination_codon, len_3utr = get_init_term_codon(df_structure, pcsk9_info)

df_structure.to_csv('../SiCreen/PCSK9_structure_mRNA_features.txt', sep='\t', index=None)
print(f'initiation_codon: {initiation_codon}')
print(f'termination_codon: {termination_codon}')
print(f'len_3utr: {len_3utr}')
df_structure

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:pandas panda 结构分析 Das INITIATION

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-10 18:21