TandemMod 迁移学习模型研究数据集 GEO/NCBI/ENA 数据库编号汇总
TandemMod 迁移学习模型研究专用数据集,适配《Transfer learning enables identification of multiple types of RNA modifications using nanopore direct RNA sequencing》研究,涵盖 RNA 修饰识别、纳米孔直接 RNA 测序相关研究所需多类公开数据集,精准整理各数据集对应数据库编号、获取途径及适用研究场景,为相关经管、生物信息学研究提供高效的数据检索与使用参考。
一、数据集覆盖范围
本数据集聚焦 TandemMod 迁移学习模型在 RNA 修饰识别领域的研究应用,整合DRS 测序数据、水稻 m6A-seq 数据、人类细胞系测序数据、表观转录组数据集等多类研究数据,覆盖人类 HEK293T、K562 等细胞系,以及水稻物种的相关测序研究,同时包含体外表观转录组(IVET)、体外转录(IVT)、ONT 直接 RNA 测序等多种实验技术生成的数据集,全面适配 RNA 修饰识别相关的迁移学习模型研究。
二、各数据集对应编号及获取途径
本研究相关数据集均来自GEO(基因表达综合数据库)、NCBI(美国国家生物技术信息中心)、ENA(欧洲核苷酸档案馆) 三大权威公开数据库,各数据集具体编号及获取途径如下:
已发表 DRS 数据集(NCBI):Novoa 实验室工作 ——GSE124309、PRJNA563591;Intawat Nookaew 工作 ——SRP166020(本数据集暂未提供)
人类细胞系 DRS 数据(ENA):新加坡纳米孔表达项目 ——PRJEB44348(本数据集暂未提供)
水稻 m6A-seq 数据(GEO):GSE135549
人类 HEK293T 细胞系数据(GEO):m6ACE-Seq——GSE124509;miCLIP——GSE63753
人类 K562 细胞系 MeRIP-seq 数据(GEO):GSE205709
多类型水稻 / 体外研究数据集(GEO):4 个 IVET、2 个 IVT、2 个 ONT 直接 RNA 测序水稻数据集 ——GSE227087
三、数据集可用途径
直接适配 TandemMod 迁移学习模型的训练、验证与优化,助力 RNA 修饰识别的算法研究;
为纳米孔直接 RNA 测序技术在 RNA 修饰研究中的应用提供数据支撑;
可用于人类细胞系、水稻物种的 RNA 修饰相关表观遗传学研究;
为迁移学习在生物信息学、RNA 组学领域的跨物种、跨技术应用研究提供数据参考。
TandemMod 迁移学习模型研究使用的数据集.zip
(34.75 KB, 需要: RMB 10 元)


雷达卡


京公网安备 11010802022788号







