楼主: chai_prime
2667 5

[问答] sas 无词典分词 能实现否? [推广有奖]

  • 0关注
  • 1粉丝

硕士生

67%

还不是VIP/贵宾

-

威望
0
论坛币
184 个
通用积分
197.8952
学术水平
10 点
热心指数
9 点
信用等级
8 点
经验
1477 点
帖子
153
精华
0
在线时间
188 小时
注册时间
2011-8-1
最后登录
2025-3-1

楼主
chai_prime 发表于 2014-2-12 23:54:32 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币



网上找到一篇无词典的分词算法介绍,展示的结果还算不错:

http://www.matrix67.com/blog/archives/5044


想请教,用sas可以实现该算法么?

求指点主要函数、过程......








二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:matrix67 Archive matrix Hives Blog 词典

已有 2 人评分学术水平 热心指数 信用等级 收起 理由
ziyenano + 5 + 5 + 5 奖励积极上传好的资料
zw612003 + 1 精彩帖子, 学习

总评分: 学术水平 + 6  热心指数 + 5  信用等级 + 5   查看全部评分

沙发
zw612003 发表于 2014-2-13 11:29:00
找一天仔细看看

藤椅
爱萌 发表于 2014-2-18 12:51:04
非常好的东西,这个方向值得搞,但是否真的新的,值得验证
最恨对我说谎或欺骗我的人

板凳
ziyenano 发表于 2014-2-18 18:06:25
好东西,对于非结构的数据,文本的分词基础而又至关重要

报纸
chai_prime 发表于 2014-2-22 23:17:51
爱萌 发表于 2014-2-18 12:51
非常好的东西,这个方向值得搞,但是否真的新的,值得验证
应该不会算很新。

基于统计的语义识别应该有很多成果了……

这个方法好在门槛不高。编程经验稍多点应该可以用其它语言搞定,能找到python版本的。
------
我只会用sas粗爆的把 一起出现频率高的词提取出来,不会用文章介绍的 一些指标剔除无义词~~~相信有高手可以用sas实现这一过程。

地板
yukai08008 在职认证  发表于 2015-7-10 00:16:31
顶一下,正好有个项目作业要搞,我试试

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 04:56