PYTHON
自然语言处理中文翻译
½者:Steven
Bird, Ewan Klein & Edward Loper
英文版出版社:O'REILLY
翻译:陈涛(weibo.com/chentao1999)
译者的话
½为一个自然语言处理的初学者,看书看到“训练模型”
,这模型那模型的,一直不知
道模型究竟是什么东西。
看了这本书,
从预处理数据到提取特征集,
训练模型,
测试修改等,
一步一步实际操½了之后,才对模型一词有了直观的认识(算法的中间结果,存储在计算机
中的一个个
pkl
文件,测试的时候直接用,前面计算过的就省了)
。以后听人谈“模型”的
时候也有了底气。½然,模型还有很多其他含义。还有动词的“配价”
、各种搭配、客观逻
辑对根据文法生成的句子的约束如½实现?不上机动手做做,很难真正领悟。
自然语言处理理论书籍很多,讲实际操½的不多,½讲的这么系统的更少。从这个角度
讲,
本书是目前世界上最½的自然语言处理实践教程。
初学者若在看过理论之后½精读本书,
必定会有获益。这也是翻译本书的目的之一。
本书是译者课½英文翻译练习,抛砖引玉。书中存在很多问题,尤其是第
10
章½题逻
辑和一阶逻辑推理在自然语言处理中的应用。希望大家多多指教。可以在微博上找到我(w
eibo.com/chentao1999)
。½然读中文翻译速度更快,½直接读原文更½了解½者的本意。
原书½者在书的最后列出了迫切需要帮助改进的条目,
对翻译本书建议½用目标语言的
例子,目前本书还只½照搬英文的例子,希望有志愿者½加入本书的中文化进程中,为中文
自然语言处理做出贡献。
将本书½学习和研究之用,欢迎传播、复制、修改。山寨产品请留下译者姓名和微博。
用于商业目的,请与原书版权所有者联系,译者不承担由此产生的责任。
译者
2012
年
4
月
7
日
2
PYTHON
自然语言处理
从输入法联想提示(pre
dictive text) email
过滤到自
、
动文本摘要、机器翻译,大
量的语言相关的技术½离不
开自然语言处理的支持,
而这本书提供了自
然语言处理非常方便的入门指南。通过它,
½将学到如½写½处理大量非结构化文本
的
Python
程序。½将获得有丰富标注的涵
盖语言学各种数据结构的数据集,
而且½将
学到分析书面文档内容和结构的主要算法。
通过大量的例子和联系,
《PYTHON 自
然语言处理》将会帮助½:
½
从非结构化文本中提取信息,
无论是猜
测主题还是识别“½名实½”
。
½
分析文本的语言学结构,
包括文法和语
义分析
½
访问流行的语言学数据集,包括
Word
Net
和
treebanks
½
整合从语言学到人工智½的多个领域
的技术
通过½用
Python
程序设计语言和自然
语言工具包(NTLK)的开源½数库,本书
将帮助½获得自然语言处理的实际经验。
如
果½对开发
Web
应用、分析多种语言的新
闻来源或者收集濒危语言感兴趣,
或者仅仅
对以程序员的视角看人类语言如½运½½
奇,½将发现《PYTHON 自然语言处理》
不仅迷人而且极其有用。
“少有的一本书,
用如此清晰的方法如
此 优美 整洁 的代 码处 理如 此复 杂 的问
题……这是一本从中可以学习自然语言处
理的书。
”
——Ken
Getz,
MCW Technologies
高级顾问
Steven Bird
是墨尔本大学计算机科学
和½件工程系副教授,
宾夕法尼亚大学语言
学数据联盟高级研究助理。
Ewan Klein
是爱丁堡大学信息学院语
言技术教授。
Edward Lope r
是宾夕法尼亚大学基于
Loper
机器学习的自然语言处理方向的刚毕业的
博士,现在是波士顿的
BBN Technologie s
的研究员。
3
PYTHON
自然语言处理
Steven Bird, Ewan Klein & Edward Loper
北京
•
剑桥
•
法纳姆
•
科隆
•
塞瓦斯托波尔
•
台北
•
东京
4
Python
自然语言处理
by Steven Bird, Ewan Klein, and Edward Loper
Copyright © 2009 Steven Bird, Ewan Klein, and Edward Loper. All rights reserved.
Printed in the United States of America.
O’Reilly Media, Inc.出版, 1005 Gravenstein Highway North, Sebastopol, CA 95472.
可以购买
O’Reilly
出版的书用于教育、商业或者销售推广½用。大多数图书½有½络
版(http://my.safaribooksonline.com)
。更多的信息请联系我们的企业/机构销售部门:(800)
998-9938 or
corporate@oreilly.com.。
编辑:Julie
Steele
制½编辑:Loranah
Dimant
拷贝编辑:Genevieve
d’Entremont
校对:Loranah
Dimant
索引编者:Ellen
Troutman Zaig
封面设计:Karen
Montgomery
内页设计:David
Futato
插画:Robert
Romano
版本说明:
2009
年六月:第一版
Nutshell Handbook, the Nutshell Handbook
标志, 以及
O’Reilly
标志是
O’Reilly Me
dia, Inc.的注册商标。
《PYTHON 自然语言处理》
,露脊鲸图案以及相关的商品外观是
O’Re
illy Media, Inc.的商标。
制造商和经销商为了区分他们的产品而声明一些名称为商标。这些名称也出现在本书
中,O’Reilly
Media, Inc.知道这是商标,½用盖½或者小的盖½来印刷。
在本书编写过程中已经采取一切可½的预防措½,
所以出版商和½者对书中的错误和遗
漏以及½用此书包含的信息所造成的损害不承担责任。
ISBN: 978-0-596-51649-9
[M]
1244726609
5
评论