楼主: zgp480
3448 7

[程序分享] Matlab新书:Text Mining with Matlab [推广有奖]

  • 0关注
  • 3粉丝

讲师

16%

还不是VIP/贵宾

-

威望
0
论坛币
3518 个
通用积分
0.8666
学术水平
5 点
热心指数
10 点
信用等级
4 点
经验
37468 点
帖子
300
精华
0
在线时间
453 小时
注册时间
2009-2-20
最后登录
2020-10-3

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

Text Mining with MATLAB provides a comprehensive introduction to text mining using MATLAB. It’s designed to help text mining practitioners, as well as those with little-to-no experience with text mining in general, familiarize themselves with MATLAB and its complex applications.

The first part provides an introduction to basic procedures Text Mining with Matlab.pdf (36.79 MB, 需要: 15 个论坛币)





for handling and operating with text strings. Then, it reviews major mathematical modeling approaches. Statistical and geometrical models are also described along with main dimensionality reduction methods. Finally, it presents some specific applications such as document clustering, classification, search and terminology extraction.

All descriptions presented are supported with practical examples that are fully reproducible. Further reading, as well as additional exercises and projects, are proposed at the end of each chapter for those readers interested in conducting further experimentation.


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Text Mining MATLAB atlab matla With experience procedures themselves designed provides

本帖被以下文库推荐

沙发
zhuiya 发表于 2014-5-15 00:00:01 |只看作者 |坛友微信交流群
好像不错啊,有下载过看过的吗,给个评论啊

使用道具

藤椅
tmdxyz 发表于 2014-5-15 06:57:31 |只看作者 |坛友微信交流群
Text Mining with MATLAB_RafaelE.Banchs 2013

使用道具

板凳
zgp480 发表于 2014-5-26 04:42:26 |只看作者 |坛友微信交流群
1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1 About Text Mining and MATLAB . . . . . . . . . . . . . . . . . . . 2
1.2 About this Book . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 A (Very) Brief Introduction to MATLAB . . . . . . . . . . . . . . 6
1.4 Further Reading . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Part I Fundamentals
2 Handling Textual Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.1 Characters and Character Arrays . . . . . . . . . . . . . . . . . . . . . 15
2.2 Handling Text with Cell Arrays . . . . . . . . . . . . . . . . . . . . . . 18
2.3 Handling Text with Structures . . . . . . . . . . . . . . . . . . . . . . . 21
2.4 Some Useful Functions . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.5 Further Reading . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.6 Proposed Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3 Regular Expressions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.1 Basic Operators for Matching Characters. . . . . . . . . . . . . . . . 33
3.2 Matching Sequences of Characters . . . . . . . . . . . . . . . . . . . . 36
3.3 Conditional Matching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.4 Working with Tokens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.5 Further Reading . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.6 Proposed Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4 Basic Operations with Strings . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.1 Searching and Comparing . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.2 Replacement and Insertion. . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.3 Segmentation and Concatenation . . . . . . . . . . . . . . . . . . . . . 60
4.4 Set Operations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.5 Further Reading . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.6 Proposed Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5 Reading and Writing Files . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.1 Basic File Formats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.2 Other Useful Formats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
5.3 Handling Files and Directories . . . . . . . . . . . . . . . . . . . . . . . 101
5.4 Further Reading . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
5.5 Proposed Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
Part II Mathematical Models
6 Basic Corpus Statistics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6.1 Fundamental Properties . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6.2 Word Co-Occurrences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
6.3 Accounting for Order . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
6.4 Further Reading . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
6.5 Proposed Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
6.6 Short Projects. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
7 Statistical Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
7.1 Basic n-Gram Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
7.2 Discounting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
7.3 Model Interpolation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
7.4 Statistical Bag-of-Words . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
7.5 Further Reading . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
7.6 Proposed Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
7.7 Short Projects. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
8 Geometrical Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
8.1 The Term-Document Matrix . . . . . . . . . . . . . . . . . . . . . . . . 175
8.2 The Vector Space Model. . . . . . . . . . . . . . . . . . . . . . . . . . . 183
8.3 Association Scores and Distances . . . . . . . . . . . . . . . . . . . . . 192
8.4 Further Reading . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
8.5 Proposed Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
8.6 Short Projects. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
9 Dimensionality Reduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
9.1 Vocabulary Pruning and Merging . . . . . . . . . . . . . . . . . . . . . 205
9.2 The Linear Transformation Approach . . . . . . . . . . . . . . . . . . 211
9.3 Non-linear Projection Methods. . . . . . . . . . . . . . . . . . . . . . . 222
9.4 Further Reading . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
9.5 Proposed Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
9.6 Short Projects. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
Part III Methods and Applications
10 Document Categorization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
10.1 Data Collection Preparation . . . . . . . . . . . . . . . . . . . . . . . . . 237
10.2 Unsupervised Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
10.3 Supervised Classification in Vector Space . . . . . . . . . . . . . . . 252
10.4 Supervised Classification in Probability Space . . . . . . . . . . . . 260
10.5 Further Reading . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269
10.6 Proposed Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
10.7 Short Projects. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276
11 Document Search . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
11.1 Binary Search . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
11.2 Vector-Based Search. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
11.3 Cross-Language Search . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296
11.4 Further Reading . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307
11.5 Proposed Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308
11.6 Short Projects. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311
12 Content Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313
12.1 Dimensions of Analysis. . . . . . . . . . . . . . . . . . . . . . . . . . . . 313
12.2 Polarity Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319
12.3 Property Extraction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329
12.4 Further Reading . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341
12.5 Proposed Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342
12.6 Short Projects. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 347
Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353

使用道具

报纸
mike68097 发表于 2014-5-27 03:31:11 |只看作者 |坛友微信交流群
推.....Thanks for sharing!

使用道具

地板
mike68097 发表于 2014-5-27 03:40:39 |只看作者 |坛友微信交流群
https://bbs.pinggu.org/thread-2183585-1-1.html

使用道具

7
wh7064rg 发表于 2015-1-4 13:29:58 |只看作者 |坛友微信交流群
mike68097 发表于 2014-5-27 03:40
https://bbs.pinggu.org/thread-2183585-1-1.html
谢谢!

使用道具

8
dumeng201066 发表于 2017-5-17 13:38:15 |只看作者 |坛友微信交流群
买不起啊   

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-2 08:35