楼主: zhandsome0611
1558 4

[问答] 关于文本的处理 [推广有奖]

  • 0关注
  • 0粉丝

高中生

22%

还不是VIP/贵宾

-

威望
0
论坛币
9 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
162 点
帖子
5
精华
0
在线时间
43 小时
注册时间
2008-6-16
最后登录
2019-12-16

楼主
zhandsome0611 发表于 2015-12-16 09:56:40 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
有列数据(关键词),我对关键词提取,然后新填变量,如果包含某些词,就是1,不包含是0  请问这怎么做呢?
数据:

关键词
求职
银行招聘2015年招聘
薪资计算器
佛山英语翻译
招聘网站酒店
烟台 人才招聘


想达到的预期效果:

关键词                              招聘      银行    网站
求职                                   0         0        0
银行招聘2015年招聘             1          1        0
薪资计算器                          0         0          0
佛山英语翻译                       0         0          0
招聘网站酒店                       1         0          1
烟台 人才招聘                      1         0          0

新的变量(招聘,银行,网站)我已经弄好,就是里面的包含为1,不包含为0,不会做~~求教
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:英语翻译 银行招聘 招聘网站 人才招聘 关键词 英语翻译 计算器 人才招聘 招聘网站 银行招聘

沙发
万人往LVR 在职认证  发表于 2015-12-16 11:35:53
  1. text <- c('求职','银行招聘2015年招聘','薪资计算器','佛山英语翻译','招聘网站酒店','烟台人才招聘')
  2. keywords <- c('招聘','银行','网站')
  3. mat <- data.frame(matrix(0,ncol=length(keywords),nrow=length(text)),col.names=text)
  4. getkey <- function(word){return(as.integer(regexpr(word,text)>0))}
  5. mat <- sapply(keywords,getkey)
  6. rownames(mat) <- text
  7. mat
复制代码

藤椅
李会超 发表于 2015-12-16 12:24:14
就是中文分词了,论坛有相应教程

板凳
藉風說雨 学生认证  发表于 2015-12-16 13:08:52
就是判断是不是子串就行了吧,你这都是很简单的关键词

报纸
万人往LVR 在职认证  发表于 2015-12-16 13:16:46
管理员请删此楼

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-1 01:29