楼主: hitd
24771 51

[数据挖掘书籍] 文本挖掘经典教材 清晰PDF [推广有奖]

  • 0关注
  • 1粉丝

初中生

90%

还不是VIP/贵宾

-

威望
0
论坛币
4387 个
通用积分
0.3600
学术水平
2 点
热心指数
4 点
信用等级
3 点
经验
128 点
帖子
13
精华
0
在线时间
9 小时
注册时间
2009-11-21
最后登录
2010-4-14

楼主
hitd 发表于 2009-11-21 23:45:02 |只看作者 |坛友微信交流群|倒序 |AI写论文
相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
文本挖掘是数绝挖掘比较新的方向,在计算机快速发展的今天,文本挖掘的意义尤为重要
该书是文本挖掘的奠基之作
如果大家对文本挖掘感兴趣,看懂这一本书足够
建议大家先看看书的各章目录,这样对全书有一个全面的认识
不一定要从第一章开始看
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:经典教材 文本挖掘 PDF 第一章 看看书 经典 教材 PDF 挖掘 文本

The Text Mining Handbook.pdf

7.93 MB

需要: 5 个论坛币  [购买]

已有 1 人评分经验 收起 理由
飞天玄舞6 + 30 精彩帖子

总评分: 经验 + 30   查看全部评分

本帖被以下文库推荐

沙发
hitd 发表于 2009-11-21 23:46:52 |只看作者 |坛友微信交流群
Contents
Preface page x
I. Introduction to Text Mining 1
I.1 Defining Text Mining 1
I.2 General Architecture of Text Mining Systems 13
II. Core Text Mining Operations 19
II.1 Core Text Mining Operations 19
II.2 Using Background Knowledge for Text Mining 41
II.3 Text Mining Query Languages 51
III. Text Mining Preprocessing Techniques 57
III.1 Task-Oriented Approaches 58
III.2 Further Reading 62
IV. Categorization 64
IV.1 Applications of Text Categorization 65
IV.2 Definition of the Problem 66
IV.3 Document Representation 68
IV.4 Knowledge Engineering Approach to TC 70
IV.5 Machine Learning Approach to TC 70
IV.6 Using Unlabeled Data to Improve Classification 78
IV.7 Evaluation of Text Classifiers 79
IV.8 Citations and Notes 80
V. Clustering 82
V.1 Clustering Tasks in Text Analysis 82
V.2 The General Clustering Problem 84
V.3 Clustering Algorithms 85
V.4 Clustering of Textual Data 88
V.5 Citations and Notes 92
VI. Information Extraction 94
VI.1 Introduction to Information Extraction 94
VI.2 Historical Evolution of IE: The Message Understanding
Conferences and Tipster 96
VI.3 IE Examples 101
VI.4 Architecture of IE Systems 104
VI.5 Anaphora Resolution 109
VI.6 Inductive Algorithms for IE 119
VI.7 Structural IE 122
VI.8 Further Reading 129
VII. Probabilistic Models for Information Extraction 131
VII.1 Hidden Markov Models 131
VII.2 Stochastic Context-Free Grammars 137
VII.3 Maximal Entropy Modeling 138
VII.4 Maximal Entropy Markov Models 140
VII.5 Conditional Random Fields 142
VII.6 Further Reading 145
VIII. Preprocessing Applications Using Probabilistic
and Hybrid Approaches 146
VIII.1 Applications of HMM to Textual Analysis 146
VIII.2 Using MEMM for Information Extraction 152
VIII.3 Applications of CRFs to Textual Analysis 153
VIII.4 TEG: Using SCFG Rules for Hybrid
Statistical–Knowledge-Based IE 155
VIII.5 Bootstrapping 166
VIII.6 Further Reading 175
IX. Presentation-Layer Considerations for Browsing
and Query Refinement 177
IX.1 Browsing 177
IX.2 Accessing Constraints and Simple Specification Filters
at the Presentation Layer 185
IX.3 Accessing the Underlying Query Language 186
IX.4 Citations and Notes 187
X. Visualization Approaches 189
X.1 Introduction 189
X.2 Architectural Considerations 192
X.3 Common Visualization Approaches for Text Mining 194
X.4 Visualization Techniques in Link Analysis 225
X.5 Real-World Example: The Document Explorer System 235
XI. Link Analysis 244
XI.1 Preliminaries 244
XI.2 Automatic Layout of Networks 246
XI.3 Paths and Cycles in Graphs 250
XI.4 Centrality 251
XI.5 Partitioning of Networks 259
XI.6 Pattern Matching in Networks 272
XI.7 Software Packages for Link Analysis 273
XI.8 Citations and Notes 274
XII. Text Mining Applications 275
XII.1 General Considerations 276
XII.2 Corporate Finance: Mining Industry Literature for
Business Intelligence 281
XII.3 A “Horizontal” Text Mining Application: Patent Analysis
Solution Leveraging a Commercial Text Analytics
Platform 297
XII.4 Life Sciences Research: Mining Biological Pathway
Information with GeneWays 309
Appendix A: DIAL: A Dedicated Information Extraction Language for
Text Mining 317
A.1 What Is the DIAL Language? 317
A.2 Information Extraction in the DIAL Environment 318
A.3 Text Tokenization 320
A.4 Concept and Rule Structure 320
A.5 Pattern Matching 322
A.6 Pattern Elements 323
A.7 Rule Constraints 327
A.8 Concept Guards 328
A.9 Complete DIAL Examples 329
Bibliography 337
Index 391

使用道具

藤椅
hitd 发表于 2009-11-21 23:47:22 |只看作者 |坛友微信交流群
全书423页
非常清晰

使用道具

板凳
fyb_acc 发表于 2009-11-22 01:03:31 |只看作者 |坛友微信交流群
谢谢啦,!!!

使用道具

报纸
ycl0536 发表于 2009-11-23 08:56:24 |只看作者 |坛友微信交流群
这本是不错的,记得前年的时候,导师专门到国家图书馆去复印的
BI的时代还未到来,还是安心做好SAP吧

使用道具

地板
xiao198821 发表于 2009-11-24 16:12:20 |只看作者 |坛友微信交流群
搂主有没有关于文本聚类分析的比较系统的资料?

使用道具

7
anniegirl 发表于 2009-12-2 15:51:26 |只看作者 |坛友微信交流群
thanks for sharing!

使用道具

8
woshilshzu 发表于 2009-12-7 15:55:21 |只看作者 |坛友微信交流群
谢谢,支持楼主

使用道具

9
qiudw 发表于 2009-12-9 17:54:37 |只看作者 |坛友微信交流群
价格不菲呀。
过眼滔滔云共雾,算人间知己吾与汝!

使用道具

10
飘洒 发表于 2009-12-13 21:52:03 |只看作者 |坛友微信交流群
谢谢楼主分享!
It is not entirely satisfying but the alternatives are worse!
统计人

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 15:04