楼主: chai_prime
2411 5

[问答] sas 无词典分词 能实现否? [推广有奖]

  • 0关注
  • 1粉丝

硕士生

67%

还不是VIP/贵宾

-

威望
0
论坛币
186 个
通用积分
195.0452
学术水平
10 点
热心指数
9 点
信用等级
8 点
经验
1480 点
帖子
154
精华
0
在线时间
187 小时
注册时间
2011-8-1
最后登录
2021-1-6

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币



网上找到一篇无词典的分词算法介绍,展示的结果还算不错:

http://www.matrix67.com/blog/archives/5044


想请教,用sas可以实现该算法么?

求指点主要函数、过程......








二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:matrix67 Archive matrix Hives Blog 词典

已有 2 人评分学术水平 热心指数 信用等级 收起 理由
ziyenano + 5 + 5 + 5 奖励积极上传好的资料
zw612003 + 1 精彩帖子, 学习

总评分: 学术水平 + 6  热心指数 + 5  信用等级 + 5   查看全部评分

沙发
zw612003 发表于 2014-2-13 11:29:00 |只看作者 |坛友微信交流群
找一天仔细看看

使用道具

藤椅
爱萌 发表于 2014-2-18 12:51:04 |只看作者 |坛友微信交流群
非常好的东西,这个方向值得搞,但是否真的新的,值得验证
最恨对我说谎或欺骗我的人

使用道具

板凳
ziyenano 发表于 2014-2-18 18:06:25 |只看作者 |坛友微信交流群
好东西,对于非结构的数据,文本的分词基础而又至关重要

使用道具

报纸
chai_prime 发表于 2014-2-22 23:17:51 |只看作者 |坛友微信交流群
爱萌 发表于 2014-2-18 12:51
非常好的东西,这个方向值得搞,但是否真的新的,值得验证
应该不会算很新。

基于统计的语义识别应该有很多成果了……

这个方法好在门槛不高。编程经验稍多点应该可以用其它语言搞定,能找到python版本的。
------
我只会用sas粗爆的把 一起出现频率高的词提取出来,不会用文章介绍的 一些指标剔除无义词~~~相信有高手可以用sas实现这一过程。

使用道具

地板
yukai08008 在职认证  发表于 2015-7-10 00:16:31 |只看作者 |坛友微信交流群
顶一下,正好有个项目作业要搞,我试试

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 21:22