楼主: 兜兜爱人大
4724 6

[问答] jiebaR中文分词词典匹配统计问题 [推广有奖]

  • 0关注
  • 0粉丝

初中生

47%

还不是VIP/贵宾

-

威望
0
论坛币
1 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
874 点
帖子
12
精华
0
在线时间
13 小时
注册时间
2012-6-3
最后登录
2019-3-18

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我用jiebaR做了分词,并按照list方式排列
然后想匹配词典,统计个数,呈向量显示。

例如:女主好白皮肤好棒 我侧重的问一下唇膏色号

分词结果:"女主好" "白"     "皮肤"   "好棒"   "我"     "侧重"   "的"     "问"     "一下"   "唇膏"   "色号"  

此句中 “好棒”是正向情感词,出现一次,在后面增加一个参数 1

请问可以实现吗?如何操作?


感激
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:jiebaR 中文分词 统计问题 EBaR bar 中文 词典 统计

沙发
jiangbeilu 学生认证  发表于 2015-11-8 08:55:40 |只看作者 |坛友微信交流群
增加一个参数1,是什么意思呢?

使用道具

藤椅
兜兜爱人大 发表于 2015-11-8 14:08:53 |只看作者 |坛友微信交流群
jiangbeilu 发表于 2015-11-8 08:55
增加一个参数1,是什么意思呢?
就是统计词频,但是是统计我指定的一些词

使用道具

板凳
jiangbeilu 学生认证  发表于 2015-11-8 15:38:15 |只看作者 |坛友微信交流群
这个可以在你分词之后用再筛选你统计的词吧,因为你肯定是要拆分所有句子才能完成分词,然后再远出你需要的词的词频就OK了。我的那篇数据交流中心的分析帖子就是这样子做的

使用道具

报纸
兜兜爱人大 发表于 2015-11-8 20:23:53 |只看作者 |坛友微信交流群
jiangbeilu 发表于 2015-11-8 15:38
这个可以在你分词之后用再筛选你统计的词吧,因为你肯定是要拆分所有句子才能完成分词,然后再远出你需要的 ...
就是这一步遇到了困难,我怎么筛选出需要词?

使用道具

地板
jiangbeilu 学生认证  发表于 2015-11-8 22:09:22 |只看作者 |坛友微信交流群
你用table()函数,可以根据名称来提取的

使用道具

7
jiangbeilu 学生认证  发表于 2015-11-8 22:36:23 |只看作者 |坛友微信交流群
你要熟悉table函数,知道table函数返回的是一个向量,然后知道怎么从向量中取值。
  1. x=c("我","的","的","的","的","们","的")
  2. table(x)["我"]
复制代码

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-6 00:45