楼主: Imasasor
9944 34

[学习分享] 教你如何统计长篇小说的全部单词和全部字母(通过实战学习sas) [推广有奖]

21
fannyhuang(真实交易用户) 发表于 2012-12-17 12:48:20
好吧,我买了
菜鸟一只,希望可以看得懂

22
zhangg(真实交易用户) 发表于 2013-1-3 02:03:09
版主相当地无私!!!我辈学习中!

23
ghosthead101(真实交易用户) 发表于 2013-1-3 10:19:03
學習中

24
kittyforever(未真实交易用户) 发表于 2013-1-3 12:39:48
有意思哟

25
lily83322(真实交易用户) 发表于 2013-1-8 17:19:41
买来看看!

26
zxroliver(真实交易用户) 发表于 2013-1-9 08:09:09
学习学习

27
freetiger666(未真实交易用户) 发表于 2013-1-10 18:29:03
mark

28
retake486(未真实交易用户) 发表于 2013-4-13 10:18:32
也想看看统计中文的

29
郭向明(未真实交易用户) 发表于 2013-4-17 16:47:26
支持!!!

30
ariman911(未真实交易用户) 发表于 2013-4-18 13:30:17
英文的單字是由空白來分隔
中文的字都連在一起
所以需要一個中文字詞索引檔(資料庫)來協助斷字或斷詞
目前只知道有用C語言寫的程式斷詞(我10年前有用過)
以前讀碩士做過中文斷詞的php網頁(背景作業是用C語言,php是做網頁介面)
後來還有出Java的斷詞程式
還有沒有其他,我就不知道了
台灣的中文斷詞都是下面為主
http://ckipsvr.iis.sinica.edu.tw/

結論:中文要斷字斷詞要搭配好的中文資料庫
已有 1 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
Imasasor + 100 + 100 + 5 + 5 + 5 精彩帖子

总评分: 经验 + 100  论坛币 + 100  学术水平 + 5  热心指数 + 5  信用等级 + 5   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-9 14:39