4192 2

[统计软件] R的中文分词处理包Rwordseg的安装说明(吐血推荐,十分详尽) [推广有奖]

  • 2关注
  • 5粉丝

已卖:31份资源

本科生

50%

还不是VIP/贵宾

-

威望
0
论坛币
297 个
通用积分
1.0115
学术水平
8 点
热心指数
11 点
信用等级
5 点
经验
2128 点
帖子
74
精华
0
在线时间
78 小时
注册时间
2016-9-28
最后登录
2024-12-23

楼主
伪数据分析师 发表于 2016-11-8 22:17:03 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

       最近在学习文本挖掘,需要R中的中文分词包Rwordseg,苦恼于这个JB包十分的难安装啊,搞了大半个星期终于装好了,现分享如下,一方面记下自己的学习成果,以免以后忘记,另一方面给需要Rwordseg包的学习者交流经验,避免走弯路。(别再凑字数了,直接上正题
1、Rwordseg包依赖rJava包,rJava需要本机中有Java环境,因而我们首先需要安装Java。
   1)java&jdk安装-去java官网下载安装即可
(1)java-http://www.java.com/zh_CN/

(2)jdk-http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

注意:

(1)看电脑系统配置选择Windows x86/...跟R一致
QQ截图20161108213129.png

(2)java&jdk安装到同一个文件夹下面,跟R同一个目录,比如 R的工作目录是"D:/Program Files/RStudio";java&jdk的工作目录是“D:\Program Files\Java\JRE”和“D:\Program Files\Java\JDK”

   2)JDK的安装和环境变量配置
  (1)安装JDK过程中会出现两次 安装提示 。第一次是安装 jdk ,第二次是安装 jre 。建议两个都安装在同一个java文件夹中的不同文件夹中。(不能都安装在java文件夹的根目录下,jdk和jre安装在同一文件夹会出错)
QQ截图20161108213733.png
   (2)1:安装jdk 随意选择目录 只需把默认安装目录 \java 之前的目录修改即可(如:“D:\Program Files\Java\JDK”)
           2:安装jre→更改→ \java 之前目录和安装 jdk 目录相同即可(如:“D:\Program Files\Java\JRE”)
QQ截图20161108213748.png
    (3)安装完JDK后配置环境变量:计算机→属性→高级系统设置→高级→环境变量
QQ截图20161108214529.png
     (4)系统变量→新建 JAVA_HOME 变量 。变量值填写jdk的安装目录(本人是 D:\R install\Java\JDK)
QQ截图20161108214744.png
      (5)系统变量→寻找 Path 变量→编辑      
       在变量值最后输入      %JAVA_HOME%\bin;%JAVA_HOME%\jre\bin;
(注意原来Path的变量值末尾有没有分号(;),如果没有,先输入分号(;)再输入上面的代码)
QQ截图20161108213811.png
      (6)系统变量→新建 CLASSPATH 变量
       变量值填写   .;%JAVA_HOME%\lib;%JAVA_HOME%\lib\tools.jar(注意最前面有一点)
系统变量配置完毕 QQ截图20161108213819.png
       (7)检验是否配置成功:在开始菜单中运行cmd 输入 java -version (java 和 -version 之间有空格)
若如图所示 显示版本信息 则说明安装和配置成功。 QQ截图20161108215519.png QQ截图20161108213832.png
2、rJava包安装及加载

    1) install.packages("rJava")
    2)library((rJava)
3、Rwordseg包安装及加载
     直接让R或者Rstudio安装Rwordseg不可行(MD,老子来来回回大概弄了100遍,也不行)。但是把Rwordseg软件包下载到本地后,从本地安装,可以。将Rwordseg软件包解压放在你的R下面的library,然后在控制台加载程序包library(“Rwordseg”)
下载地址:http://R-Forge.R-project.org/bin/windows/contrib/3.0/Rwordseg_0.2-1.zip
举个栗子:
  1. > segmentCN("王宝强的妻子出轨了")
  2. [1] "王"   "宝"   "强"   "的"   "妻子" "出轨" "了"
复制代码


大写的注:我安装的R和Rstudio都是32位的,64位的没有试过,不知道能不能行的通。






二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:words 中文分词 吐血推荐 word RDS 中文

QQ截图20161108213758.png (100.01 KB)

QQ截图20161108213758.png

已有 1 人评分学术水平 热心指数 收起 理由
chenyi112982 + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1   查看全部评分

沙发
2683882319 发表于 2017-8-17 00:43:55
楼主给你100个赞

藤椅
女皇 发表于 2018-4-6 14:53:44
感谢楼主!!很有用!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-31 18:49