python 文本分析库_自然语言处理实战(利用Python理解分析和生成文本):(美)霍布森·莱恩//科尔·霍华德//汉纳斯·马克斯·哈普克|责编:杨海玲|译者:史亮//鲁骁//唐可欣//王斌 : ...

导语

laba_close.png

内容提要

laba_close.png

本书是介绍自然语言处理(NLP)和深度学习的实战书。NLP已成为深度学习的核心应用领域,而深度学习是NLP研究和应用中的必要工具。本书分为3部分:第一部分介绍NLP基础,包括分词、TF-IDF向量化以及从词频向量到语义向量的转换;第二部分讲述深度学习,包含神经网络、词向量、卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆(LSTM)网络、序列到序列建模和注意力机制等基本的深度学习模型和方法;第三部分介绍实战方面的内容,包括信息提取、问答系统、人机对话等真实世界系统的模型构建、性能挑战以及应对方法。

本书面向中高级Python开发人员,兼具基础理论与编程实战,是现代NLP领域从业者的实用参考书。

目录

第一部分 处理文本的机器

第1章 NLP概述

1.1 自然语言与编程语言

1.2 神奇的魔法

1.2.1 会交谈的机器

1.2.2 NLP中的数学

1.3 实际应用

1.4 计算机“眼”中的语言

1.4.1 锁的语言(正则表达式)

1.4.2 正则表达式

1.4.3 一个简单的聊天机器人

1.4.4 另一种方法

1.5 超空间简述

1.6 词序和语法

1.7 聊天机器人的自然语言流水线

1.8 深度处理

1.9 自然语言智商

1.10 小结

第2章 构建自己的词汇表——分词

2.1 挑战(词干还原预览)

2.2 利用分词器构建词汇表

2.2.1 点积

2.2.2 度量词袋之间的重合度

2.2.3 标点符号的处理

2.2.4 将词汇表扩展到n-gram

2.2.5 词汇表归一化

2.3 情感

2.3.1 VADER:一个基于规则的情感分析器

2.3.2 朴素贝叶斯

2.4 小结

第3章 词中的数学

3.1 词袋

3.2 向量化

3.3 齐普夫定律

3.4 主题建模

3.4.1 回到齐普夫定律

3.4.2 相关度排序

3.4.3 工具

3.4.4 其他工具

3.4.5 Okapi BM

3.4.6 未来展望

3.5 小结

第4章 词频背后的语义

4.1 从词频到主题得分

4.1.1 TF-IDF向量及词形归并

4.1.2 主题向量

……

第二部分 深度学习(神经网络)

第三部分 进入现实世界(现实中的NLP挑战)

附录A 本书配套的NLP工具

附录B 有趣的Python和正则表达式

附录C 向量和矩阵(线性代数基础)

附录D 机器学习常见工具与技术

附录E 设置亚马逊云服务(AWS)上的GPU

附录F 局部敏感哈希

资源

词汇表

你可能感兴趣的:(python,文本分析库)