楼主: 问???
1399 4

[问答] 能在R中进行如下操作吗? [推广有奖]

  • 3关注
  • 0粉丝

大专生

33%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
576 点
帖子
36
精华
0
在线时间
15 小时
注册时间
2015-4-30
最后登录
2017-5-18

楼主
问??? 发表于 2015-5-2 11:11:26 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位大神,能不能在R中输入一些字符串,比如说:AGCTTTTCATTCTGACTGCAACGGGCAATATGTCTCTGTGTGGATTAAAA;然后从第一位开始,每次截取4个字母,第一次截取为AGCT,第二次从第二位开始,截取GCTT,以此类推得到一系列长度为4个字母的短串。然后我要检索某个短串的位置,比如说我要检索AGCT的位置,可以得到这样的结果,AGCT[1,5,8,9],这几个数分别代表第一,五,八 ,九个字符串是AGCT,能得到这样的结果吗?求指点

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:GATT GCT CAA CTT 字符串 字符串 字母

沙发
centan 学生认证  发表于 2015-5-2 19:01:08
楼生在研究生物化学吗,我在这里求助的医学统计问题,也没人回答,感觉这个网站比较高端,对一些低级的问题不屑一顾

藤椅
问??? 发表于 2015-5-2 20:15:24
centan 发表于 2015-5-2 19:01
楼生在研究生物化学吗,我在这里求助的医学统计问题,也没人回答,感觉这个网站比较高端,对一些低级的问题 ...
这题不低级吧,你的问题是啥?

板凳
hugebear 发表于 2015-5-2 22:41:22
可以的,主要用到三个字符串处理函数: nchar, substring和grep。 具体含义见帮助文件,代码如下:
  1. mydat <- "AGCTTTTCATTCTGACTGCAACGGGCAATATGTCTCTGTGTGGATTAAAA"
  2. n <- nchar(mydat) # 计算这个字符串所含字符的个数。
  3. result <- vector(length = n - 3, mode = "character")
  4. for (i in 1:(n - 3)) result[i] <- substring(mydat, i, i + 3) # substring提取mydat的子集字符串

  5. # 用grep函数找感兴趣的四字符串在mydat中的位置。
  6. grep("AGCT", result)
  7. grep("TGTG", result)
复制代码
已有 1 人评分论坛币 收起 理由
admin_kefu + 30 热心帮助其他会员

总评分: 论坛币 + 30   查看全部评分

报纸
问??? 发表于 2015-5-3 10:27:57
如果我数据特别大呢,有1000000条DNA序列,每条长度为100,能运行吗?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-9 08:55