译者的话

作为一个自然语言处理的初学者,看书看到“训练模型”,这模型那模型的,一直不知 道模型究竟是什么东西。看了这本书,从预处理数据到提取特征集,训练模型,测试修改等,一步一步实际操作了之后,才对模型一词有了直观的认识(算法的中间结果,存储在计算机中的一个个pkl 文件,测试的时候直接用,前面计算过的就省了)。以后听人谈“模型”的 时候也有了底气。当然,模型还有很多其他含义。还有动词的“配价”、各种搭配、客观逻辑对根据文法生成的句子的约束如何实现?不上机动手做做,很难真正领悟。

自然语言处理理论书籍很多,讲实际操作的不多,能讲的这么系统的更少。从这个角度讲,本书是目前世界上最好的自然语言处理实践教程。初学者若在看过理论之后能精读本书,必定会有获益。这也是翻译本书的目的之一。

本书是译者课余英文翻译练习,抛砖引玉。书中存在很多问题,尤其是第10 章命题逻辑和一阶逻辑推理在自然语言处理中的应用。希望大家多多指教。可以在微博上找到我(weibo.com/chentao1999)。虽然读中文翻译速度更快,但直接读原文更能了解作者的本意。

原书作者在书的最后列出了迫切需要帮助改进的条目,对翻译本书建议使用目标语言的例子,目前本书还只能照搬英文的例子,希望有志愿者能加入本书的中文化进程中,为中文自然语言处理做出贡献。

将本书作学习和研究之用,欢迎传播、复制、修改。山寨产品请留下译者姓名和微博。用于商业目的,请与原书版权所有者联系,译者不承担由此产生的责任。

译者:陈涛(weibo.com/chentao1999)

2012 年4 月7 日