楼主: 牛尾巴
14708 174

[问答] 【独家发布】【kindle】Applied Text Analysis with Python(2017)   [推广有奖]

泰斗

38%

还不是VIP/贵宾

-

TA的文库  其他...

最新e书

2018新书

2017新书

威望
8
论坛币
628865 个
通用积分
56891.4763
学术水平
12683 点
热心指数
12959 点
信用等级
12448 点
经验
568600 点
帖子
9173
精华
66
在线时间
13138 小时
注册时间
2008-2-13
最后登录
2024-4-19

特级学术勋章 特级热心勋章 特级信用勋章 高级学术勋章 高级热心勋章 高级信用勋章

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如果喜欢该文档,欢迎点击头像下方的“+加关注订阅【kindle电子书】文库,https://bbs.pinggu.org/forum.php?mod=collection&action=view&ctid=3186


Applied Text Analysis with Python

本帖隐藏的内容

Applied Text Analysis with Python_ Enabling Language Aware Data Products with Ma.rar (4.38 MB) 本附件包括:
  • Applied Text Analysis with Python_ Enabling Language Aware Data Products with Machine Learning.mobi




Benjamin Bengfort, Tony Ojeda, Rebecca Bilbro

O’Reilly Media


The programming landscape of natural language processing has changed dramatically in the past few years. Machine learning approaches now require mature tools like Python’s scikit-learn to apply models to text at scale. This practical guide shows programmers and data scientists who have an intermediate-level understanding of Python and a basic understanding of machine learning and natural language processing how to become more proficient in these two exciting areas of data science.

This book presents a concise, focused, and applied approach to text analysis with Python, and covers topics including text ingestion and wrangling, basic machine learning on text, classification for text analysis, entity resolution, and text visualization. Applied Text Analysis with Python will enable you to design and develop language-aware data products.

You’ll learn how and why machine learning algorithms make decisions about language to analyze text; how to ingest, wrangle, and preprocess language data; and how the three primary text analysis libraries in Python work in concert. Ultimately, this book will enable you to design and develop language-aware data products.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Analysis Applied Analysi python alysis action practical learning natural require

已有 9 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
dixiahe + 5 补偿
guo.bailing + 100 精彩帖子
aclyang + 40 精彩帖子
oliyiyi + 100 精彩帖子
william9225 + 40 精彩帖子
kongqingbao280 + 40 精彩帖子
arthistory4 + 100 精彩帖子
zl89 + 80 精彩帖子
Nicolle + 100 + 100 + 1 + 1 + 1 精彩帖子

总评分: 经验 + 520  论坛币 + 180  学术水平 + 6  热心指数 + 1  信用等级 + 1   查看全部评分

本帖被以下文库推荐

沙发
HappyAndy_Lo 发表于 2017-5-2 19:08:09 |只看作者 |坛友微信交流群
https://github.com/foxbook/atap/tree/master/snippets/ch03
  1. from nltk import pos_tag, sent_tokenize, wordpunct_tokenize

  2. def sents(paragraph):
  3.     for sentence in sent_tokenize(paragraph):
  4.         yield sentence

  5. def tokenize(paragraph):
  6.     for sentence in sents(paragraph):
  7.         yield pos_tag(wordpunct_tokenize(sentence))

  8. sample_text = "The old building is scheduled for demolition. The contractors will begin building a new structure next month."
  9. print(list(tokenize(sample_text)))
复制代码


使用道具

藤椅
ryuuzt 发表于 2017-5-2 19:09:00 |只看作者 |坛友微信交流群
  1. from nltk import sent_tokenize

  2. def sents(paragraph):
  3.     for sentence in sent_tokenize(paragraph):
  4.         yield sentence

  5. def parse(textfile):
  6.     with open(textfile, 'r') as f:
  7.         text = f.read()
  8.         return list(sents(text))

  9. print(parse("zen.txt"))
  10. print(parse("rhyme.txt"))
复制代码

使用道具

板凳
ebook58 发表于 2017-5-2 21:54:16 |只看作者 |坛友微信交流群
谢谢分享

使用道具

报纸
军旗飞扬 发表于 2017-5-2 21:59:48 |只看作者 |坛友微信交流群
谢谢楼主分享!

使用道具

地板
hcc_cq 发表于 2017-5-2 22:14:56 |只看作者 |坛友微信交流群
谢谢分享!

使用道具

7
ddinghzau 发表于 2017-5-2 22:35:33 |只看作者 |坛友微信交流群

使用道具

8
ekscheng 发表于 2017-5-2 23:07:01 |只看作者 |坛友微信交流群

使用道具

9
pynbj1001 发表于 2017-5-3 00:51:50 |只看作者 |坛友微信交流群
非常感谢!

使用道具

10
kkkm_db 发表于 2017-5-3 02:26:13 |只看作者 |坛友微信交流群
谢谢分享

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-19 23:01