对代码、编程感兴趣的可以关注「老K玩代码」公众号和我交流!分享代码、经验、项目和资讯
简介:
本书是一本研究汉语自然语言处理方面的基础性、综合性书籍,涉及NLP的语言理论、算法和工程实践的方方面面,内容繁杂。 本书包括NLP的语言理论部分、算法部分、案例部分,涉及汉语的发展历史、传统的句法理论、认知语言学理论。需要指出的是,本书是迄今为止第一本系统介绍认知语言学和算法设计相结合的中文NLP书籍,并从认知语言学的视角重新认识和分析了NLP的句法和语义相结合的数据结构。这也是本书的创新之处。 本书适用于所有想学习NLP的技术人员,包括各大人工智能实验室、软件学院等专业机构。
书评:
蓝色连衣裙: 这应该是一篇论文或文章吧,本来是英文的,翻译成了中文。原文是用英语写的,用英文来介绍中文,所以翻译成中文之后,有些地方读起来怪怪的。作为一篇导论,很多算法没有具体讲,要想弄懂还是要去看其他的书吧。 孤竹孙: 我看完了这本厚书,.写的很好的,.全篇下来深深感觉到前后的行文逻辑的完整性.整本书应该是作者一人完成..每章的开头和结尾,.是作者思维的发光点,.告诉你起承转合,让我懂得了知识结构是怎样耦合的. Herr.Tschüss: 第二章讲汉语语言学历史???...整本书没什么干货.就当科普了.浪费钱.不推荐
简介:
自然语言理解是人工智能的一个重要分支,主要研究如何利用计算机来理解和生成自然语言。本书重点介绍了自然语言理解所涉及的各个方面,包括语法分析、语义分析、概念分析、语料库语言学、词汇语义驱动、中间语言、WordNet、词汇树邻接文法、链接文法、基于语段的机器翻译方法、内识别与文本过滤、机器翻译的评测等,既有对基础知识的介绍,又有对新研究进展的综述,同时还结合了作者(JamesPustejovsky,生成词库理论的创始人)多年的研究成果。本书内容全面、详略得当,结合实例讲解,使读者更易理解。
书评:
rollingcat: 简直是AI生成的书,仿佛说了很多,却一点用都没有。附录的数据集还可以。 everfight: 了解了一些标注的方法和数据集,算是开阔眼界的书籍。 dkyang: 数据标注实际上是在定义问题,这才是难点,挺有意思
简介:
本书的主要目的是对自然语言理解领
书评:
Hasegawa: 翻译的简直是……还是照本英文的对照着看比较省事。当然也是有好处的,就是那些比较离题的废话还是中文看起来快些…… 江霰: 这本书对基于规则的自然语言理解讲得一般,欠缺重要细节。关键是没有更好的书了,只能给两星。 ppip: 我擦我还读过这么牛逼的书?
简介:
本书结合作者多年学习和从事自然语言处理相关工作的经验,力图用生动形象的方式深入浅出地介绍自然语言处理的理论、方法和技术。本书抛弃掉繁琐的证明,提取出算法的核心,帮助读者尽快地掌握自然语言处理所必备的知识和技能。本书主要分两大部分。第一部分是理论篇,包含前3章内容,主要介绍一些基础的数学知识、优化理论知识和一些机器学习的相关知识。第二部分是应用篇,包含第4章到第8章,分别针对计算性能、文本处理的术语、相似度计算、搜索引擎、推荐系统、自然语言处理和对话系统等主题展开介绍和讨论。本书适合从事自然语言处理相关研究和工作的读者参考,尤其适合想要了解和掌握机器学习或者自然语言处理技术的读者阅读。
书评:
此间的少年: 3.5星,前几章不行,后面渐入佳境,看得出来作者是有搜索和推荐领域实际经验又没有放松对业界论文学习的 子莒: 同行衬托,阿里的几个工程师也出了一套书,至少文风上,腾讯的nlp系列略胜一筹。 ColinMacmillan: 200页拿在手里略为单薄,似乎对不起69元的定价,
简介:
自然语言处理(natural language processing,nlp)是计算机科学领域与人工智能领域中的一个重要方向。它研究能够实现人与计算机之间用自然语言进行有效通信的各种理论和方法,涉及所有用计算机对自然语言进行的操作。 《python自然语言处理》是自然语言处理领域的一本实用入门指南,旨在帮助读者学习如何编写程序来分析书面语言。本书基于python编程语言以及一个名为nltk的自然语言工具包的开源库;但并不要求读者有python编程的经验。全书共11章,按照难易程度顺序编排。第1章到3章介绍了语言处理的基础,讲述如何使用小的python程序分析感兴趣的文本信息。第4章讨论结构化程序设计,以巩固前面几章中介绍的编程要点。第5章到第7章介绍语言处理的基本原理,包括标注、分类和信息提取等。第8章到第10章介绍了句子解析、句法结构识别和句意表达方法。第11章介绍了如何有效管理语言数据。后记部分简要讨论了nlp领域的过去和未来。 《python自然语言处理》的实践性很强,包括上百个实际可用的例子和分级练习。本书可供读者用于自学,也可以作为自然语言处理或计算语言学课程的教科书,或是人工智能、文本挖掘、语料库语言学等课程的补充读物。
书评:
mizuho: 迷之翻译,不过自己买的书含着泪也要看完.暂时算看完了吧,不过其实都没用上。。基本用的是jieba 初阳: 可以啊,讲的挺清楚的,适合我这种对理论推导没兴趣的人。 penny@@@: 这本主要讲NLTK,不用NLTK的我用不太上。
简介:
本书旨在回答三个问题:第一个,什么是自然语言处理;第二个,为什么大多数人会使用Python来开发自然语言处理应用程序;最后一个也很重要的问题,在学习自然语言处理的时候,有哪些Python相关资源可用。读完本书,读者便会对此了然于胸。
书评:
RUIM: ★★★★☆.比Nitin那本NLTK来得更加详细/全面适合入门,基础详细。介绍部分数学知识到NLP流程,NLP/NLU/NLG等,规则系统应用场合/机器学习/深度学习等各优缺点内容翔实附带入门代码.04/27.读第二遍,雅兰很聪明,毕业到工作时间写出这本书,全书脉络清晰/重点把握. .体系理论:★★★★☆.:.从机器学习到深度学习差异;各个算法差异优缺点分析;从词袋到word2vec等详细分....★★★★☆.比Nitin那本NLTK来得更加详细/全面适合入门,基础详细。介绍部分数学知识到NLP流程,NLP/NLU/NLG等,规则系统应用场合/机器学习/深度学习等各优缺点内容翔实附带入门代码.04/27.读第二遍,雅兰很聪明,毕业到工作时间写出这本书,全书脉络清晰/重点把握..体系理论:★★★★☆.:.从机器学习到深度学习差异;各个算法差异优缺点分析;从词袋到word2vec等详细分析;从规则系统到机器学习,可惜没有提及CBR等. .组织脉络:★★★★☆.清晰,把握侧重点,部分关键概念提及(one-hot编码等等)..实践指导:★★★★☆:提供了详细的各种代码,第11章.提供了详细的备忘录及指导.可惜越到后面,部分代码比较随意.(展开) 良吉吉: 2019.2.21.NO..11.我当是Jalal那本了。作为通识还可以,理解了一些概念和整体的分析形成。作者还分享了好多资源链接。。。但深度不够,可读性也不足。总给人一种考经感。 ICM: 我觉着挺不错的,可能是对比的不多,深度不是很够,不过入门NLP挺不错
简介:
内容简介 本书全面介绍了统计自然语言处理的基本概念、理论方法和最新研究进展,内容包括形式语言与自动机及其在自然语言处理中的应用、语言模型、隐马尔可夫模型、语料库技术、汉语自动分词与词性标注、句法分析、词义消歧、统计机器翻译、语音翻译、文本分类、信息检索与问答系统、自动文摘和信息抽取、口语信息处理与人机对话系统等,既有对基础知识和理论模型的介绍,也有对相关问题的研究背景、实现方法和技术现状的详细阐述。 本书可作为高等院校计算机、信息技术等相关专业的高年级本科生或研究生的教材或参考书,也可供从事自然语言处理、数据挖掘和人工智能等研究的相关人员参考。 ------- 目录 第1章 绪论 1.1 基本概念 1.1.1 语言学与语音学 1.1.2 自然语言处理 1.1.3 关于“理解”的标准 1.2 自然语言处理研究的内容和面临的困难 1.2.1 自然语言处理研究的内容 1.2.2 自然语言处理涉及的几个层次 1.2.3 自然语言处理面临的困难 1.3 自然语言处理的基本方法及其发展 1.3.1 自然语言处理的基本方法 1.3.2 自然语言处理的发展 1.4 自然语言处理的研究现状 第2章 预备知识 2.1 概率论基本概念 2.1.1 概率 2.1.2 最大似然估计 2.1.3 条件概率 2.1.4 贝叶斯法则 2.1.5 随机变量 2.1.6 二项式分布 2.1.7 联合概率分布和条件概率分布 2.1.8 贝叶斯决策理论 2.1.9 期望和方差 2.2 信息论基本概念 2.2.1 熵 2.2.2 联合熵和条件熵192.2.3 互信息 2.2.4 相对熵 2.2.5 交叉熵 2.2.6 困惑度 2.2.7 噪声信道模型 2.3 支持向量机 2.3.1 线性分类 2.3.2 线性不可分 2.3.3 构造核函数 第3章 形式语言与自动机 第4章 语料库与词汇知识库 第5章 语言模型 第6章 隐马尔可夫模型 第7章 汉语自动分词与词性标注 第8章 句法分析 第9章 语义消歧 第10章 统计机器翻译 第11章 语音翻译 第12章 文本分类 第13章 信息检索与问答系统 第14章 自动文摘与信息抽取 第15章 口语信息处理与人机对话系统 附录 项目作业 名词术语索引 参考文献
书评:
谢寻星: 深入浅出,还可以复习旧知识,不错 妈妈救救小熊: 论述很严谨,参考文献很丰富。 sea2603: 没读过,先标个5星顶一下~
简介:
《Python自然语言处理(影印版)》提供了非常易学的自然语言处理入门介绍,该领域涵盖从文本和电子邮件预测过滤,到自动总结和翻译等多种语言处理技术。在《Python自然语言处理(影印版)》中,你将学会编写Python程序处理大量非结构化文本。你还将通过使用综合语言数据结构访问含有丰富注释的数据集,理解用于分析书面通信内容和结构的主要算法。 《Python自然语言处理》准备了充足的示例和练习,可以帮助你: 从非结构化文本中抽取信息,甚至猜测主题或识别“命名实体”; 分析文本语言结构,包括解析和语义分析; 访问流行的语言学数据库,包括WordNet和树库(treebank); 从多种语言学和人工智能领域中提取的整合技巧。 《Python自然语言处理(影印版)》将帮助你学习运用Python编程语言和自然语言工具包(NLTK)获得实用的自然语言处理技能。如果对于开发Web应用、分析多语言新闻源或记录濒危语言感兴趣——即便只是想从程序员视角观察人类语言如何运作,你将发现《Python自然语言处理》是一本令人着迷且极为有用的好书。
书评:
static: nltk是个好工具。可以自己训练模型,书中介绍得简略了,需要好好研究文档。P.S.以前做过中文分词的小工具,unigram+大量语料训练,准确率挺高的了。机器逻辑有其局限性,我觉得有的问题在于对中文本身的探究不够深。 谢寻星: http://www. cnblogs.com/yuxc/catego ry/307122.html 有一个网友的读书笔记! 小土刀: 绝佳入门书!尤其适合我这种数学渣。NLTK大法好,Zen.Bot.的聊天能力也是醉。Free.Love!
简介:
这是一本务实的入门书,助你零起点上手自然语言处理。 HanLP 作者何晗汇集多年经验,从基本概念出发,逐步介绍中文分词、词性标注、命名实体识别、信 息抽取、文本聚类、文本分类、句法分析这几个热门问题的算法原理与工程实现。书中通过对多种算法的讲解,比较了它们的优缺点和适用场景,同时详细演示生产级成熟代码,助你真正将自然语言处理应用在生产环境中。 随着本书的学习,你将从普通程序员晋级为机器学习工程师,最后进化到自然语言处理工程师。
书评:
英子: 利益相关:本书的执行编辑英子。认识我的人可能还是有的,我就不匿了。不匿的另外一个原因是,我想为自己执行的书,也是为自己认可的内容和作者站台。这本书的定位是想成为——“从来不了解.NLP,但是想了解这个领域,或者想入门这个领域的读者”.的靠谱首选参考书——也就是这本书封面书背上的.Slogan,你一定能读懂的.NLP.图书。不论是作者的内容,还是图书的排版装帧设计,还是图书周边服务的提供,我们都竭尽....利益相关:本书的执行编辑英子。认识我的人可能还是有的,我就不匿了。不匿的另外一个原因是,我想为自己执行的书,也是为自己认可的内容和作者站台。这本书的定位是想成为——“从来不了解.NLP,但是想了解这个领域,或者想入门这个领域的读者”.的靠谱首选参考书——也就是这本书封面书背上的.Slogan,你一定能读懂的.NLP.图书。不论是作者的内容,还是图书的排版装帧设计,还是图书周边服务的提供,我们都竭尽可能地做到了最好。如果有任何问题,欢迎随时找我。图灵社区. https://www. ituring.com.cn/book/270 6 .这个页面可以联系我。.(展开) 路易大叔: 图灵原创图书,码农场博主,同时也是本书用到的HanLP作者何晗,从算法工程师、机器学习工程师、自然语言处理工程师三个层次逐级讲解,由浅入深,讲解自然语言处理(NLP)的启蒙图书。.智能时代,我们往往只关注外在的产品升级换代到哪种程度,而看不到机器智能的基础NLP是怎样演进发展的。作者结合自己开发HanLP的经验,也把这个演进过程介绍给读者,同时有丰富的工具和代码、资源,不仅能练习,还能直接用于生产....图灵原创图书,码农场博主,同时也是本书用到的HanLP作者何晗,从算法工程师、机器学习工程师、自然语言处理工程师三个层次逐级讲解,由浅入深,讲解自然语言处理(NLP)的启蒙图书。.智能时代,我们往往只关注外在的产品升级换代到哪种程度,而看不到机器智能的基础NLP是怎样演进发展的。作者结合自己开发HanLP的经验,也把这个演进过程介绍给读者,同时有丰富的工具和代码、资源,不仅能练习,还能直接用于生产环境,真是“物美价廉”的一本书。.(展开) crayfish: 挺好的入门读物,讲的挺清晰,例程可以帮助大家加深理解。.Java和Python代码放到一本书里值得商榷,个人感觉不太好,影响阅读体验。建议出两本,分别是Java和Python版,放在一起不大舒服。
简介:
从本书第一版出版以来,一直好评如潮,被国外许多大学选作自然语言处理或计算语言学的教材,被认为该领域教材的“黄金标准”。 本书第一版综合了自然语言处理、计算语言学和语音识别的内容,全面论述计算机自然语言处理,深入探讨计算机处理自然语言的词汇、句法、语义、语用等各个方面的问题,介绍了自然语言处理的各种现代技术。该版对于第一版做了全面的改写,增加了大量反映自然语言处理最新成就的内容,特别是增加了语音处理和统计技术方面的内容,全书面貌为之一新。本书四大特色: 覆盖全面 强调实用 注重评测 语料为本内容简介本书全面论述了自然语言处理技术。 本书在第一版的基础上增加了自然语言处理的最新成就,特别是增加了语音处理和统计技术方面的内容,全书面貌为之一新。本书共分五个部分。第一部分“词汇的计算机处理”,讲述单词的计算机处理,包括单词切分、单词的形态学、最小编辑距离、词类,以及单词计算机处理的各种算法,包括正则表达式、有限状态自动机、有限状态转录机、N元语法模型、隐马尔可夫模型、最大熵模型等。第二部分“语音的计算机处理”,介绍语音学、语音合成、语音自动识别以及计算音系学。第三部分“句法的计算机处理”,介绍英语的形式语法,讲述句法剖析的主要算法,包括CKY剖析算法、Earley剖析算法、统计剖析,并介绍合一与类型特征结构、Chomsky层级分类、抽吸引理等分析工具。第四部分“语义和语用的计算机处理”,介绍语义的各种表示方法、计算语义学、词汇语义学、计算词汇语义学,并介绍同指、连贯等计算机话语分析问题。第五部分“应用”,讲述信息抽取、问答系统、自动文摘、对话和会话智能代理、机器翻译等自然语言处理的应用技术。本书写作风格深入浅出,实例丰富,引人入胜。本书可作为高等学校自然语言处理或计算语言学的本科生和研究生的教材,也可以作为从事人工智能、自然语言处理等领域的研究人员和技术人员的必备参考。
书评:
zYx.Tom: 大块头,内容多,覆盖广,需要坚持读下去,读完后再结合宗老师的《统计自然语言处理》学习会有相辅相成的感觉。 山古: 部分词的翻译与现在较为常用的有一点点出入,概念量大于算法量,更适合文科生辅修,亮点是含语音学的一些应用。 刘生生: 好吧感觉有的章节还没有完全理解,有空对照第三版英文的再读第二遍。