新书推荐
《Python深度学习实战:基于TensorFlow和Keras的聊天机器人以及人脸、物体和语音识别》
讲述行业标准化的深度学习实践,详细解释人脸识别、人脸检测及物体检测算法,并附有代码,对比分析了Watson、Azure、Amazon等主流平台的开源API。
内容简介
本书讨论使用TensorFlow和Keras等框架构建深度学习应用,如计算机视觉、语音识别以及聊天机器人。
第1章主要介绍TensorFlow基础,包括张量、计算图与会话等内容;
第2章介绍理解并运用Keras,涵盖了深度学习模型构建的主要步骤;
第3章、第4章、第5章介绍多层感知机,并分别介绍了TensorFlow及Keras中回归与多层感知机的实现;
第6章、第7章、第8章介绍卷积神经网络,并分别介绍了TensorFlow及Keras中卷积神经网络的实现;
第9章进入序列相关的处理,介绍了RNN和LSTM;
第10章介绍语音和文本的处理;
第11章讲述结合前面所学知识,创建聊天机器人;
作者简介
纳温•库马尔•马纳西(Navin Kumar Manaswi) 多年来一直使用人工智能相关的尖端技术开发AI解决方案。曾在位于马来西亚、新加坡的咨询公司以及迪拜智慧城市项目任职。他拥有自己的公司,曾开发出一种多方法混合的技术,用于端到端的人工智能解决方案的分发, 包括视频智能、文本智能以及类人聊天机器人。目前,他致力于解决医疗保健、企业应用、工业IoT方向的B2B问题,并作为一名深度学习AI架构师在SymphonyAI Incubator兼职。在本书中,他希望面向开发者、数据科学家、软件工程师、数据库工程师、数据分析师以及C级管理者介绍认知计算与服务。
目录
序
第1章 TensorFlow基础 1
1.1 张量 2
1.2 计算图与会话 2
1.3 常量、占位符与变量 4
1.4 占位符 6
1.5 创建张量 8
1.5.1 固定张量 9
1.5.2 序列张量 11
1.5.3 随机张量 11
1.6 矩阵操作 12
1.7 激活函数 13
1.7.1 双曲正切函数与Sigmoid函数 13
1.7.2 ReLU与ELU 15
1.7.3 ReLU6 15
1.8 损失函数 17
1.8.1 损失函数实例 18
1.8.2 常用的损失函数 18
1.9 优化器 19
1.9.1 优化器实例 20
1.9.2 常用的优化器 21
1.10 度量 21
1.10.1 度量实例 22
1.10.2 常用的度量 22
第2章 理解并运用Keras 25
2.1 深度学习模型构建的主要步骤 25
2.1.1 载入数据 26
2.1.2 预处理数据 27
2.1.3 定义模型 27
2.1.4 编译模型 29
2.1.5 拟合模型 29
2.1.6 评估模型 30
2.1.7 预测 30
2.1.8 保存与重载模型 31
2.1.9 可选:总结模型 31
2.2 改进Keras模型的附加步骤 32
2.3 Keras联合TensorFlow 33
第3章 多层感知机 35
3.1 人工神经网络 35
3.2 单层感知机 37
3.3 多层感知机 37
3.4 逻辑斯谛回归模型 38
第4章 TensorFlow中的回归到MLP 45
4.1 TensorFlow搭建模型的步骤 45
4.2 TensorFlow中的线性回归 46
4.3 逻辑斯谛回归模型 49
4.4 TensorFlow中的多层感知机 52
第5章 Keras中的回归到MLP 55
5.1 对数-线性模型 55
5.2 线性回归的Keras神经网络 56
5.3 逻辑斯谛回归 58
5.3.1 scikit-learn逻辑斯谛回归 58
5.3.2 逻辑斯谛回归的Keras神经网络 59
5.3.3 流行的MNIST数据:Keras中的逻辑斯谛回归 60
5.4 基于Iris数据的MLP 62
5.4.1 编写代码 62
5.4.2 构建一个序列Keras模型 63
5.5 基于MNIST数据的MLP数字分类 66
5.6 基于随机生成数据的MLP 68
第6章 卷积神经网络 71
6.1 CNN中的各种层 71
6.2 CNN结构 74
第7章 TensorFlow中的CNN 77
7.1 为什么用TensorFlow搭建CNN模型 77
7.2 基于MNIST数据集搭建图片分类器的TensorFlow代码 78
7.3 使用高级API搭建CNN模型 82
第8章 Keras中的CNN 83
8.1 在Keras中使用MNIST数据集搭建图片分类器 83
8.1.1 定义网络结构 85
8.1.2 定义模型架构 85
8.2 使用CIFAR-10数据集搭建图片分类器 86
8.2.1 定义网络结构 87
8.2.2 定义模型架构 88
8.3 预训练模型 89
第9章 RNN与LSTM 91
9.1 循环神经网络的概念 91
9.2 长短时记忆网络的概念 93
9.3 LSTM常见模式 93
9.4 序列预测 94
9.4.1 数字序列预测 94
9.4.2 序列分类 95
9.4.3 序列生成 95
9.4.4 序列到序列预测 95
9.5 利用LSTM模型处理时间序列预测问题 96
第10章 语音-文本转换及其逆过程 101
10.1 语音-文本转换 101
10.2 语音数据 102
10.3 语音特征:将语音映射为矩阵 103
10.4 声谱图:将语音映射为图像 104
10.5 利用MFCC特征构建语音识别分类器 104
10.6 利用声谱图构建语音识别分类器 105
10.7 开源方法 106
10.8 使用API的例子 107
10.8.1 使用PocketSphinx 107
10.8.2 使用Google Speech API 108
10.8.3 使用Google Cloud Speech API 108
10.8.4 使用Wit.ai API 108
10.8.5 使用Houndify API 109
10.8.6 使用IBM Speech to Text API 109
10.8.7 使用Bing Voice Recognition API 110
10.9 文本-语音转换 110
10.9.1 使用pyttsx 110
10.9.2 使用SAPI 111
10.9.3 使用SpeechLib 111
10.10 音频剪辑代码 111
10.11 认知服务提供商 112
10.11.1 Microsoft Azure 113
10.11.2 Amazon Cognitive Services 113
10.11.3 IBM Watson Services 113
10.12 语音分析的未来 113
第11章 创建聊天机器人 115
11.1 为什么是聊天机器人 116
11.2 聊天机器人的设计和功能 116
11.3 构建聊天机器人的步骤 116
11.3.1 预处理文本和消息 117
11.3.2 用API构建聊天机器人 130
11.4 聊天机器人开发的最佳实践 133
11.4.1 了解潜在用户 133
11.4.2 读入用户情感使得机器人情感更丰富 133
第12章 人脸检测与识别 135
12.1 人脸检测、人脸识别与人脸分析 135
12.2 OpenCV 136
12.2.1 特征脸 137
12.2.2 LBPH 137
12.2.3 费歇脸 138
12.3 检测人脸 139
12.4 跟踪人脸 141
12.5 人脸识别 144
12.6 基于深度学习的人脸识别 147
12.7 迁移学习 149
12.7.1 为什么要用迁移学习 150
12.7.2 迁移学习实例 150
12.7.3 计算迁移值 152
12.8 API 158
附录1 图像处理的Keras函数 161
附录2 可用的优质图像数据集 165
附录3 医学成像:DICOM文件格式 167
你与世界
只差一个
公众号