楼主: chenxi52125
8497 13

[问答] R语言如何提取含有关键词的样本? [推广有奖]

  • 0关注
  • 1粉丝

等待验证会员

小学生

57%

还不是VIP/贵宾

-

威望
0
论坛币
10 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
54 点
帖子
9
精华
0
在线时间
6 小时
注册时间
2019-2-21
最后登录
2019-11-26

楼主
chenxi52125 发表于 2019-2-21 14:21:09 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
R语言小白一枚!
文件中包含100W个样本,我想从中提取title含有“金融”,“理财”,“投资”字样的样本,生成一个新的data frame,该如何操作?谢谢大神指点! 微信截图_20190221141827.png test.xlsx (19.88 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:如何提取 关键词 R语言 Title Frame

Rproblem.png (62.21 KB)

Rproblem.png

沙发
诗人都在海底 在职认证  发表于 2019-2-21 18:15:14
R函数语法忘记得差不多了,我写个Python的,你自己查得对应一下
df[df['title'].str.contains("金融|理财|投资")]

藤椅
swufeyumeng 在职认证  发表于 2019-2-21 19:09:10
可以用stringr包中的str_detect函数,如果title中含有金融、理财、投资则返回TRUE。

  1. library(stringr)
  2. df[str_detect(df$title,'金融|理财|投资'),]
复制代码
已有 1 人评分论坛币 收起 理由
jiangbeilu + 5 精彩帖子

总评分: 论坛币 + 5   查看全部评分

板凳
chenxi52125 发表于 2019-2-22 09:24:49
诗人都在海底 发表于 2019-2-21 18:15
R函数语法忘记得差不多了,我写个Python的,你自己查得对应一下
好的,我试试,谢谢大神!

报纸
chenxi52125 发表于 2019-2-22 09:37:56
swufeyumeng 发表于 2019-2-21 19:09
可以用stringr包中的str_detect函数,如果title中含有金融、理财、投资则返回TRUE。
谢谢回复,我试了您的code,出现错误
Error in df[str_detect(data$title, "金融|理财|投资"), ] :
  object of type 'closure' is not subsettable

是数据集不符合调用函数的标准吗?

地板
chenxi52125 发表于 2019-2-22 09:46:58
swufeyumeng 发表于 2019-2-21 19:09
可以用stringr包中的str_detect函数,如果title中含有金融、理财、投资则返回TRUE。
我新上传了一张图片是运行的问题,test文件是测试文件,还希望大神指点~谢谢

7
swufeyumeng 在职认证  发表于 2019-2-24 02:02:01
chenxi52125 发表于 2019-2-22 09:46
我新上传了一张图片是运行的问题,test文件是测试文件,还希望大神指点~谢谢
我把数据赋值给了df,你不能照抄啊,你是把数据文件读入赋值给了data!把df改称data,在我这运行是没问题的。
  1. library(stringr)
  2. data<-read.csv('test.csv',sep=',',header=T)
  3. data[str_detect(data$title,'金融|理财|投资|银行'),]
复制代码



已有 2 人评分论坛币 收起 理由
cheetahfly + 10 热心帮助其他会员
jiangbeilu + 5 精彩帖子

总评分: 论坛币 + 15   查看全部评分

8
chenxi52125 发表于 2019-2-25 15:26:39
swufeyumeng 发表于 2019-2-24 02:02
我把数据赋值给了df,你不能照抄啊,你是把数据文件读入赋值给了data!把df改称data,在我这运行是没问题 ...
实在抱歉,我忘记改了,不好意思啊,谢谢大神了!太感谢了

9
chenxi52125 发表于 2019-2-25 15:26:43
swufeyumeng 发表于 2019-2-24 02:02
我把数据赋值给了df,你不能照抄啊,你是把数据文件读入赋值给了data!把df改称data,在我这运行是没问题 ...
实在抱歉,我忘记改了,不好意思啊,谢谢大神了!太感谢了

10
chenxi52125 发表于 2019-2-25 15:26:43
swufeyumeng 发表于 2019-2-24 02:02
我把数据赋值给了df,你不能照抄啊,你是把数据文件读入赋值给了data!把df改称data,在我这运行是没问题 ...
实在抱歉,我忘记改了,不好意思啊,谢谢大神了!太感谢了

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-31 14:18