楼主: xunxunyulove
4364 2

[问答] 结巴分词对csv文件分词问题 [推广有奖]

  • 2关注
  • 1粉丝

已卖:7份资源

硕士生

9%

还不是VIP/贵宾

-

威望
0
论坛币
1488 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1719 点
帖子
109
精华
0
在线时间
151 小时
注册时间
2009-8-20
最后登录
2019-5-11

楼主
xunxunyulove 发表于 2018-9-27 16:32:24 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
fenci = read.csv('/Users/vigossdawn/Desktop/分词.csv',encoding = 'UTF-8')
engin4 = worker(bylines = TRUE,encoding = 'UTF-8')
jieguo = segment(fenci,engin4)


以上部分是代码,读取csv文件,csv中每个单元格存储文本预料,通过设置引擎按行分词
结果显示Error in segment(fenci, engin4) : Argument 'code' must be an string.


我的工作内容是想将csv文件按行进行分解,并且导出数据包含原始预料,以及分词结果

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:文件分词 argument segment Desktop Coding

沙发
啊啊啊啊啊吖 发表于 2018-9-28 09:18:34
以二进制或文本模式打开文件是有区别的要添加bflag,变成二进制

藤椅
xunxunyulove 发表于 2018-9-28 09:39:06
啊啊啊啊啊吖 发表于 2018-9-28 09:18
以二进制或文本模式打开文件是有区别的要添加bflag,变成二进制
您好吗、,能具体一些么

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-25 12:34