寒小阳

深度学习与自然语言处理(6)_斯坦福cs224d 一起来学Tensorflow part1

内容翻译：@穆文(微信公众号数据挖掘机养成记) && 寒小阳
校正调整：寒小阳 && 龙心尘
时间：2016年7月
出处：http://blog.csdn.net/han_xiaoyang/article/details/51871068

说明：本文为斯坦福大学CS224d课程的中文版内容笔记整理，已得到斯坦福大学课程@Richard Socher教授的授权翻译

0.前言

之前的课程里介绍了自然语言处理当中的一些问题，以及设计出来的一些相应的算法。research的东西还是落地到工程应用上比较有价值，之前也手撸过一些toy project，不过这些实现要用在工程中，总是有那么些虚的，毕竟稳定性和效率未必能够保证。所幸的是，深度学习热度持续升温的大环境下，各种大神和各家大厂也陆续造福民众，开源了一些深度学习框架，在这些开源框架的基础上去搭建和实现自己想要的深度学习网络结构就简单和稳定得多了。

有时候选择多了也是麻烦，对框架感兴趣的同学可以查看深度学习框架对比维基百科中对12个开源的package比对。这里简单提几个最常见和可能会用到的深度学习开源框架的特点。

caffe提供了很便捷的神经网络搭建和命令行工具，加之model zoo里面大量预训练好的模型(主要是图像相关的)可以做fine-tuning，因此使用在图像相关的研究和应用上非常方便。
Theano以及搭建于其之上的Keras和Lasagne似乎颇受research派系同学的偏爱，自动求导是它的优势之一。
MXnet对显存的利用率高，并且支持C++, Python, Julia, Matlab, JavaScript, Go, R, Scala这么多种语言，编写起来也比较简易。
Torch是facebook用的深度学习package，定义新网络层比较简单，不过Lua倒不算大家熟知的编程语言。
Tensorflow是Google提供资金研发的，比较全，支持分布式，同时有Google这样的亲爹在，我猜资源倾斜也是迟早的事情。

今天的重点自然是Tensorflow，其他的框架也都很好，大家可以自行尝试。

1.Tensorflow

首先提提Tensorflow和theano，它俩都是python封装的深度学习库，非常容易上手，说起来Tensorflow还是受Theano启发，借鉴了一部分它的思想。不同之处在于，Tensorflow 对分布式系统支持更好，同时还是Google提供资金研发的，而Theano 是一个学术性质的项目。

Tensorflow 可以对定义在张量(tensors,你可以先简单理解成标量、向量或者矩阵，一会儿会提到)上的函数自动求导，因此神经网络中BP算法可以很轻松地实现。

在开始Tensorflow之前，需要先让大家对Tensorflow的过程有个直观的理解。

在Tensorflow里：

使用张量(tensor)表示数据.
使用图(graph)来表示计算任务.
在被称之为会话(Session)的上下文 (context)中执行图.
通过变量 (Variable)维护状态.
使用feed和fetch可以为任意的操作(arbitrary operation)赋值或者从其中获取数据.

严格意义上来说TensorFlow算是一个编程系统，它使用图来表示计算任务，图中的节点被称之为operation(可以缩写成op)，一个节点获得0个或者多个张量(tensor，下文会介绍到)，执行计算，产生0个或多个张量。TensorFlow的一个图描述了一个计算过程，为了进行计算，图必须在会话(Session)里被启动，会话(Session)将图的op分发到CPU或GPU之类的设备上，同时提供执行op的方法，这些方法执行后，将产生的张量(tensor)返回。返回的张量因语言不同而有不同，在python里是numpy ndarry对象；在C/C++语言中，是tensorflow::Tensor实例。

下面咱们来详细说说上面提到的概念。

1.1 什么是张量

既然Tensorflow里面的定义和运算都是基于张量这个概念，我们就先来看看，什么是张量。

张量的正式定义：从向量空间到实数域的多重现性映射(multilinear maps)（ V 是向量空间， V∗ 是对偶空间）
- $f : V * \times \dots V *              p c o p i e s \times V \times \dots V            q c o p i e s \to R$
- 标量是张量( f:R→R,f(e1)=c )（译者注: 标量是用实数表示零维空间的点）
- 向量是张量( f:Rn→R,f(ei)=vi )（译者注: 向量是用实数表示一维空间的点，也即向量中的某个元素）
- 矩阵是张量( f:Rn×Rm→R,f(ei,ej)=Aij )（译者注: 矩阵是用实数表示二维空间的点，也即矩阵的某个元素）
- 通常来说，张量可以用多维数组来表示

1.2 Tensorflow 与 Numpy

看似差别甚远的2个package，说起来可能也很少有人把这两者作对比，但他们“长得”确实很相似（都是提供N维数组的库）
Numpy 有 Ndarray(N维数组) 支持，但不提供创建张量函数和自动求导的方法，也不提供GPU支持

1.3 Numpy 与 Tensorflow 定义与操作对比

# numpy定义与操作
In [23]: import numpy as np
In [24]: a = np.zeros((2,2)); b = np.ones((2,2))
In [25]: np.sum(b, axis=1)
Out[25]: array([ 2.,  2.])
In [26]: a.shape
Out[26]: (2, 2)
In [27]: np.reshape(a, (1,4))
Out[27]: array([[ 0.,  0.,  0.,  0.]])

# 对应的Tensorflow定义与操作
In [31]: import tensorflow as tf
In [32]: tf.InteractiveSession()
In [33]: a = tf.zeros((2,2)); b = tf.ones((2,2))
In [34]: tf.reduce_sum(b, reduction_indices=1).eval()
Out[34]: array([ 2.,  2.], dtype=float32)
In [35]: a.get_shape()
Out[35]: TensorShape([Dimension(2), Dimension(2)])
In [36]: tf.reshape(a, (1, 4)).eval()
Out[36]: array([[ 0.,  0.,  0.,  0.]], dtype=float32)

以上代码中提到的 session和.eval()将在下文细述，而关于TensorShape，大家可以简单理解成类似Python中tuple的类型。

为了方便记忆，我们把numpy和Tensorflow中的部分定义和操作做成了一张一一对应的表格，方便大家查看。

Numpy	Tensorflow
a = np.zeros((2,2)); b = np.ones((2,2))	a = tf.zeros((2,2)), b = tf.ones((2,2))
np.sum(b, axis=1)	tf.reduce_sum(a,reduction_indices=[1])
a.shape	a.get_shape()
np.reshape(a, (1,4))	tf.reshape(a, (1,4))
b*5+1	b*5+1
np.dot(a,b)	tf.matmul(a, b)
a[0,0], a[:,0], a[0,:]	a[0,0], a[:,0], a[0,:]

Tensorflow的输出要稍微注意一下，我们需要显式地输出(evaluation，也就是说借助eval()函数)！

In [37]: a = np.zeros((2,2))
In [38]: ta = tf.zeros((2,2))
In [39]: print(a)
[[ 0.  0.]
 [ 0.  0.]]
In [40]: print(ta)
Tensor("zeros_1:0", shape=(2, 2), dtype=float32)
In [41]: print(ta.eval())
[[ 0.  0.]
[ 0. 0.]]

上面是一个示例的代码，大家可以理解Tensorflow是通过计算图（computation graph）定义一个计算过程的，这个过程不产生数值结果，那想看到具体内容怎么办呢？我们要借助.eval()函数输出。

1.4 Tensorflow 的计算图

用Tensorflow编写的程序一般由两部分构成，一是构造部分，包含了计算流图，二是执行部分，通过session 来执行图中的计算，具体可以参考Tensorflow文档

我们先来看看怎么构建图。构件图的第一步是创建源节点(source op)。源节点不需要任何输入，它的输出传递给其它节点(op)做运算。python库中，节点构造器的返回值即当前节点的输出，这些返回值可以传递给其它节点(op)作为输入。

TensorFlow Python库中有一个默认图(default graph)，在默认图的基础上，节点构造器(op 构造器)可以为其增加节点。这个默认图对许多程序来说已经足够用了，更多管理视图的细节可以阅读官方Graph类文档。

我们来看一个简单的构建图例子：

import tensorflow as tf
# 创建一个常量节点， 产生一个1x2矩阵，这个op被作为一个节点
# 加到默认视图中
# 构造器的返回值代表该常量节点的返回值
matrix1 = tr.constant([[3., 3.]])

# 创建另一个常量节点, 产生一个2x1的矩阵
matrix2 = tr.constant([[2.], [2.]])

# 创建一个矩阵乘法matmul节点，把matrix1和matrix2作为输入：
product = tf.matmul(matrix1, matrix2)

上面代码里的默认图现在有三个节点，两个constant()节点和matmul() 节点。不过这仅仅是构建图，为了真正进行矩阵的乘法，你必须在会话(Session，马上提到)里启动这个图。

1.5 Tensorflow与Session对象

上面我们知道了Tensorflow需要先构造一个图用于计算，但是图怎么启动呢？启动图的第一步需要创建一个Session对象。比如：

# 创建session，启动默认图
sess = tf.Session()

# 调用sess的'run()' 方法来执行矩阵乘法节点操作，传入'product'作为该方法的参数。'product'代表了矩阵乘法节点的输出，传入它是告诉方法我们希望取回矩阵乘法节点的输出。

#整个执行过程是自动化的，会话负责传递节点所需的全部输入。节点通常是并发执行的。

# 函数调用'run(product)'会触发图中三个节点（上面例子里提到的两个常量节点和一个矩阵乘法节点）的执行。

# 返回值'result'是一个numpy 'ndarray'对象。

result = sess.run(product)
print result
# 结果为[[12.]]

# 完成任务，记得关闭会话
sess.close()

Session对象在使用完成后，记得关闭以释放资源，当然，除了显式调用close关闭外，也可以使用with代码来自动完成关闭动作：

# 用with代码来自动完成session里的图运算并关闭
with tf.Session() as sess:
  result = sess.run([product])
  print result

为了便于使用像IPython这样的python交互环境，可以使用InteractiveSession代替Session类，使用Tensor.eval()和Operation.run()方法代替Session.run()。这样做的好处是可以在ipython中保持默认session处于打开状态：

# 进入一个交互式Tensorflow会话
import tensorflow as tf
sess = tf.InteractiveSession()

x = tf.Variable([1.0, 2.0])
a = tf.constant([3.0, 3.0]);

# 使用初始化器的run()方法初始化x
x.initializer.run()

# 增加一个减法节点，从x减去a。运行减法op，输出结果
sud = tf.sub(x, a)
print sub.eval()
# 结果为[-2. -1.]

1.6 关于session和多GPU运算

我们一直在说，Tensorflow是支持分布式的深度学习框架/包，这是因为它能将图定义转换成分布式执行的操作，以充分利用可以利用的计算资源（如CPU或GPU）。不过一般情况下，你不需要显式指定使用CPU还是GPU，Tensorflow能自动检测。如果检测到GPU，Tensorflow会优先使用找到的第一个GPU来执行操作。

如果机器上有超过一个可用的GPU，默认状况下除了第一个外的其他GPU是不参与计算的。为了让Tensorflow使用这些GPU，你必须将节点运算明确地指派给它们执行。其中with…Device语句用来指派特定的CPU或GPU操作：

# 手动指定给某个gpu执行
with tf.Session() as sess:
  with tf.device("/gpu:1"):
    matrix1 = tf.constant([[3., 3.]])
    matrix2 = tf.constant([[2.], [2.]])
    product = tf.matmul(matrix1, matrix2)

指定设备的书写格式如下：

/cpu:0:机器的CPU
/gpu:0:机器的第一个GPU，如果有的话
/gpu:1:机器的的第二个GPU，其他GPU以此类推

1.7 Tensorflow的变量(Variables)

我们训练一个模型的时候，会用到Tensorflow中的变量(Variables)，我们需要它来保持和更新参数值，和张量一样，变量也保存在内存缓冲区当中。

有很多同学会问，前面不是提到了一个概念叫做张量，为什么还需要这个新的变量呢？需要说明一下的是，如果大家仔细看之前的代码，会发现我们所用到的张量都是常值张量(constant tensors)，而非变量，而参数值是需要动态调整的内容。

比如下面的代码里我们设定了一组权重为变量：

In [32]: W1 = tf.ones((2,2))
In [33]: W2 = tf.Variable(tf.zeros((2,2)), name="weights")
In [34]: with tf.Session() as sess:
           print(sess.run(W1))
           sess.run(tf.initialize_all_variables())
           print(sess.run(W2))
   ....:
[[ 1.  1.]
 [ 1.  1.]]
[[ 0.  0.]
[ 0. 0.]]

说一个小细节，注意到上面第34步tf.initialize_all_variables，我们要预先对变量初始化(initialization)
Tensorflow 的变量必须先初始化然后才有值！而常值张量是不需要的

再具体一点，比如下面的代码，其实38和39步，我们初始化定义初值是可以通过常数或者随机数等任何一种方式初始化的，但是直到第40步才真正通过Tensorflow的initialize_all_variables对这些变量赋初值。

In [38]: W = tf.Variable(tf.zeros((2,2)), name="weights")
In [39]: R = tf.Variable(tf.random_normal((2,2)), name="random_weights")
In [40]: with tf.Session() as sess:
   ....:     sess.run(tf.initialize_all_variables())
   ....:     print(sess.run(W))
   ....:     print(sess.run(R))
   ....:

比如我们来看一个计算图中变量的状态更新过程，代码如下：

In [63]: state = tf.Variable(0, name="counter")
In [64]: new_value = tf.add(state, tf.constant(1))
In [65]: update = tf.assign(state, new_value)
In [66]: with tf.Session() as sess:
    sess.run(tf.initialize_all_variables())
    print(sess.run(state))
    for _ in range(3):
        sess.run(update)
        print(sess.run(state))
0
1
2
3

上面的代码定义了一个如下的计算图，同时其中变量的状态是循环变化的：*

Created with Raphaël 2.1.0 开始 sess.run(tf.initialize_all_variables()) (e.g. state=0) sess.run(update) (e.g. state = new_value = state+1) 循环结束？结束 yes no

1.8 Tensorflow的Fetch(获取)操作

如果想取回定义的计算图中的节点运算输出结果，可以在使用Session对象的run()调用执行图时，传入一些张量，这些张量可以帮助你取回结果。而且不仅仅是单个节点的状态或者结果，可以输出多个节点的结果，比如下面这个简单例子：

input1 = tf.constant(3.0)
input2 = tf.constant(4.0)
input3 = tf.constant(5.0)
intermed = tf.add(input2, input3)
mul = tf.mul(input1, intermed)

with tf.Session() as sess:
  result = sess.run([mul, intermed])
  print result

# print
# 输出最后的乘法结果，和之前的加法结果[27.0, 9.0]

1.9 Tensorflow与Feed(传入)操作

1.8里我们提到了在计算图中引入张量，以获取节点状态或者输出结果。Tensorflow还提供了feed机制，该机制可以临时替代图中的任意操作中的张量，也就是说，可以对图中任何操作提交补丁，直接插入一个新的张量。

feed可以使用一个张量值临时替换某个操作的输出结果，你只需要提供feed数据作为run()调用的参数。需要说明的是，feed只在调用它的方法内有效，方法结束则feed就会消失。最常见的用例是将某些特殊的操作指定为feed操作，标记的方法是使用tf.placeholder()为这些操作创建占位符(可以先想成一个容器，这个在之后的内容里会提到，不要着急)。

input1 = tf.placeholder(tf.types.float32)
input2 = tf.placeholder(tf.types.float32)
output = tf.mul(input1, input2)

# 手动提供feed数据作为run的参数
with tf.Session() as see:
  print sess.run([output], feed_dict={input:[7.]， input2:[2.]})

# print
# 结果是[array([ 14.], dtype=float32)]

2.结语

这个部分呢，就先简单给大家介绍Tensorflow的一些常用对象，基本操作和设计思想。之后会针对常见的问题(回归，图像分类/CNN，自然语言处理/RNN)逐个进行讲解。欢迎大家继续关注。

TorchText宝典：解锁PyTorch下的NLP炼金术 2401_85702623 pytorch 自然语言处理人工智能
标题：TorchText宝典：解锁PyTorch下的NLP炼金术在深度学习与自然语言处理(NLP)的交叉领域中，PyTorch已经成为了一个强大的工具。而torchtext，作为PyTorch的扩展库，专注于简化文本数据的预处理流程，为NLP任务提供了极大的便利。本文将深入探讨torchtext的多种用途，并通过代码示例展示如何使用这一库来增强你的NLP项目。1.torchtext简介torcht
揭秘Sora：深度学习与自然语言处理驱动的智能视频生成与互动疾风终究没有归途深度学习自然语言处理人工智能
Sora-探索AI视频模型的无限可能随着人工智能技术的飞速发展，AI视频模型已成为科技领域的新热点。而在这个浪潮中，OpenAI推出的首个AI视频模型Sora，以其卓越的性能和前瞻性的技术，引领着AI视频领域的创新发展。让我们将一起探讨Sora的技术特点、应用场景以及对未来创作方式的深远影响。方向一：技术解析技术架构：Sora的技术架构主要包括视频处理模块和智能生成模块。视频处理模块负责视频内容的
深度学习与自然语言处理(8)_斯坦福cs224d RNN，MV-RNN与RNTN 龙心尘 DL+NLP 自然语言处理深度学习 RNN 斯坦福大学
原文作者：RichardSocher翻译：@胥可&&@熊杰&&@杨帆&&@陈沛&&@Molly校对调整：寒小阳&&龙心尘时间：2016年7月出处：http://blog.csdn.net/han_xiaoyang/article/details/52075160http://blog.csdn.net/longxinchen_ml/article/details/52075519说明：本文为斯坦福
计算机电子书 2017 BiliDrive 备份布客飞龙
下载方式根据你的操作系统下载不同的BiliDrive二进制。执行：bilidrivedownload链接文档链接斯坦福cs224d深度学习与自然语言处理讲义.epub(2.87MB)bdrive://2771ca27aa5f0eb73bcf9591ee127c2d51270617Matplotlib用户指南.epub(4.67MB)bdrive://0376e03bdbf46d1670cd8d95
深度学习与自然语言处理技术轻雨科技
近年来，深度学习在人工智能的多个子领域都取得一定程度的进展，在自然处理领域，深度学习也受到了越来越多的关注。自然语言处理的基础研究主要包括词法分析、句法分析、语义分析、词用语境与篇章分析等的研究。词向量的方法，可以将映射转换到一个独立的向量空间。自然语言处理技术中采用深度学习知识的原因主要有：（1）自然语言处理任务中首先要解决的问题是处理对象的表示形式，为了表示对象，通常必须抽取一些特征，如文本的
python搭建一个自然语言处理_基于 Python 的简单自然语言处理实践 weixin_39814088
本文是对于基于Python进行简单自然语言处理任务的介绍，本文的所有代码放置在这里。建议前置阅读Python语法速览与机器学习开发环境搭建，更多机器学习资料参考机器学习、深度学习与自然语言处理领域推荐的书籍列表以及面向程序猿的数据科学与机器学习知识体系及资料合集。TwentyNewsGroup语料集处理20Newsgroup数据集包含了约20000篇来自于不同的新闻组的文档，最早由KenLang搜
快速理解机器学习、深度学习与自然语言处理 _Lilly 机器学习深度学习自然语言处理
这篇文章对机器学习、深度学习、自然语言处理进行了简单的介绍，适合快速学习NLP与AI、ML和DL的关系。机器学习、深度学习、自然语言处理的关系机器学习、深度学习、自然语言处理的关系如图所示1机器学习（MachineLearning）机器学习是在没有明确指令的情况下，学习如何在示例（又叫做“trainingdata”，即训练集）上执行任务。这是通过创建训练数据的数字表示(即feature，特征值)并
深度学习与自然语言处理骑猪流浪江湖 NLP入门笔记 python 深度学习人工智能自然语言处理
写在前面本文是笔者学习《自然语言处理入门》（何晗著）的最后一篇学习笔记。在学习本书的过程中，我初步走进了NLP的世界，也尝试了不同的学习、笔记方法。最开始是采用手写笔记的形式，后来决定使用博客的方式做笔记。因此博客上的内容只涉及该书的后面几章。本文是该书读书笔记的最后一篇。一、传统方法的局限通过前面的学习，我学习到了隐马尔可夫模型、感知机、条件随机场、朴素贝叶斯模型、支持向量机模型等传统机器学习模
【学习记录】深度学习与自然语言处理入门 Baxkiller有只猫 ML\NLP 深度学习自然语言处理
前置知识自然语言处理《自然语言处理入门》（何晗著）这本书的知识可能最主要关注的就是与NLP的底层实现有关的内容，书中用了很大的篇幅来写底层实现，以及作者创建的HanLP的代码包的使用和实现（JAVA代码啥的真心没劲)。每一章倒是开头的几个小节都会有一些对介绍自然语言处理理论和算法的介绍，比如隐马尔可夫链啊啥的。总结来说，如果真想通过这本书来入门，那我觉得还差点意思。《基于深度学习的自然语言处理》（
深度学习与自然语言处理Lecture-1笔记 Jacky_QinXm 算法深度学习 NLP DL
最近开始学习斯坦福的课程“CS224d:DeepLearningforNatureLanguageProcessing”,课程老师是PhDRichardSocher。这里是边看边做一些简单的记录，以供后续的查阅。相关材料最开始是从网站“我爱自然语言处理”上得到的，课程材料的下载地址：http://cs224d.stanford.edu/syllabus.html。NLP简介NLP：NatureLa
深度学习与自然语言处理教程(7) - 问答系统（NLP通关指南·完结） ShowMeAI #深度学习与自然语言处理教程 ◉斯坦福CS224n最全笔记自然语言处理 cs224n 问答系统动态机器网络 QA
作者：韩信子@ShowMeAI教程地址：https://www.showmeai.tech/tutorials/36本文地址：https://www.showmeai.tech/article-detail/245声明：版权所有，转载请联系平台与作者并注明出处收藏ShowMeAI查看更多精彩内容本系列为斯坦福CS224n《自然语言处理与深度学习(NaturalLanguageProcessingw
深度学习与自然语言处理教程(8) - NLP中的卷积神经网络（NLP通关指南·完结） ShowMeAI #深度学习与自然语言处理教程 ◉斯坦福CS224n最全笔记自然语言处理 cnn cs224n 卷积神经网络神经网络
作者：韩信子@ShowMeAI教程地址：https://www.showmeai.tech/tutorials/36本文地址：https://www.showmeai.tech/article-detail/247声明：版权所有，转载请联系平台与作者并注明出处收藏ShowMeAI查看更多精彩内容本系列为斯坦福CS224n《自然语言处理与深度学习(NaturalLanguageProcessingw
深度学习与自然语言处理教程(2) - GloVe及词向量的训练与评估（NLP通关指南·完结） ShowMeAI #深度学习与自然语言处理教程 ◉斯坦福CS224n最全笔记自然语言处理 nlp 反向传播梯度下降 word2vec
作者：韩信子@ShowMeAI教程地址：https://www.showmeai.tech/tutorials/36本文地址：https://www.showmeai.tech/article-detail/232声明：版权所有，转载请联系平台与作者并注明出处收藏ShowMeAI查看更多精彩内容本系列为斯坦福CS224n《自然语言处理与深度学习(NaturalLanguageProcessingw
斯坦福大学深度学习与自然语言处理第二讲：词向量 Janvn NLP
斯坦福大学在三月份开设了一门“深度学习与自然语言处理”的课程：CS224d:DeepLearningforNaturalLanguageProcessing，授课老师是青年才俊RichardSocher，以下为相关的课程笔记。第二讲：简单的词向量表示：word2vec,Glove(SimpleWordVectorrepresentations:word2vec,GloVe)推荐阅读材料：Paper
文本情感分类（二）：深度学习模型 XB_please 情感分类情感分类深度学习模型
本文转载自：https://spaces.ac.cn/archives/3414目录1.深度学习与自然语言处理2.语言的表达3.Word2Vec：高维来了4.表达句子：句向量5.搭建LSTM模型6.总结7.搭建LSTM做文本情感分类在《文本情感分类（一）：传统模型》一文中，笔者简单介绍了进行文本情感分类的传统思路。传统的思路简单易懂，而且稳定性也比较强，然而存在着两个难以克服的局限性：一、精度问题
深度学习与自然语言处理教程(3) - 神经网络与反向传播（NLP通关指南·完结） ShowMeAI 自然语言处理教程自然语言处理神经网络深度学习反向传播计算图
作者：韩信子@ShowMeAI教程地址：http://www.showmeai.tech/tutorials/36本文地址：http://www.showmeai.tech/article-detail/234声明：版权所有，转载请联系平台与作者并注明出处收藏ShowMeAI查看更多精彩内容本系列为斯坦福CS224n《自然语言处理与深度学习(NaturalLanguageProcessingwit
深度学习与自然语言处理教程(6) - 神经机器翻译、seq2seq与注意力机制（NLP通关指南·完结） ShowMeAI 自然语言处理教程自然语言处理机器翻译 cs224n seq2seq 注意力机制
作者：韩信子@ShowMeAI教程地址：http://www.showmeai.tech/tutorials/36本文地址：http://www.showmeai.tech/article-detail/242声明：版权所有，转载请联系平台与作者并注明出处收藏ShowMeAI查看更多精彩内容本系列为斯坦福CS224n《自然语言处理与深度学习(NaturalLanguageProcessingwit
深度学习与自然语言处理第五次作业——段落分析模型荦荦大端荤荤深度学习自然语言处理人工智能
深度学习与自然语言处理第五次作业——段落分析模型基于Seq2seq模型来实现文本生成的模型，输入可以为一段已知的金庸小说段落，来生成新的段落并做分析。文章目录深度学习与自然语言处理第五次作业——段落分析模型一、实验原理1、Seq2seq模型简介2、LTSM模型介绍二、解题流程1、读取训练语料2、训练模型3、读取测试语料4、结果输出三、实验结果与分析1、实验结果2、实验总结代码1、语料预处理2、主函
深度学习与自然语言处理教程(5) - 语言模型、RNN、GRU与LSTM（NLP通关指南·完结） ShowMeAI 自然语言处理教程自然语言处理 cs224n rnn lstm gru
作者：韩信子@ShowMeAI教程地址：http://www.showmeai.tech/tutorials/36本文地址：http://www.showmeai.tech/article-detail/239声明：版权所有，转载请联系平台与作者并注明出处收藏ShowMeAI查看更多精彩内容本系列为斯坦福CS224n《自然语言处理与深度学习(NaturalLanguageProcessingwit
深度学习与自然语言处理 | 斯坦福CS224n · 课程带学与全套笔记解读（NLP通关指南·完结） ShowMeAI 自然语言处理教程自然语言处理 word2vec bert 注意力机制 seq2seq
作者：韩信子@ShowMeAI教程地址：http://www.showmeai.tech/tutorials/36本文地址：http://www.showmeai.tech/article-detail/230声明：版权所有，转载请联系平台与作者并注明出处收藏ShowMeAI查看更多精彩内容引言本系列ShowMeAI组织的斯坦福CS224n《深度学习与自然语言处理》学习笔记与内容再整理。CS224
斯坦福大学CS224N-深度学习与自然语言处理：课程1-笔记 Alex_996 #自然语言处理自然语言处理深度学习人工智能
课程1-笔记大纲：讨论课程语言和语意Word2Vec介绍Word2Vec目标函数梯度优化函数Word2Vec的作用关键：词义的结果可以用一个很大的实数向量很好地表示。课程学习目标：将深度学习应用于自然语言处理的基础并有效的方法；基础知识NLP中的关键方法：词向量、前向传播神经网络、递归神经网络、注意力机制、编码器-解码器模型、transformers等深入理解人类语言的复杂以及如何通过计算机处理理
【深度学习实战】【nlp-beginner】基于深度学习的文本分类喵木木 NLP 深度学习自然语言处理深度学习 pytorch 神经网络
任务说明：NLP-Beginner：自然语言处理入门练习任务二数据下载：SentimentAnalysisonMovieReviews参考资料：ConvolutionalNeuralNetworksforSentenceClassificatioPyTorch官方文档关于深度学习与自然语言处理的一些基础知识：【深度学习实战】从零开始深度学习（四）：RNN与自然语言处理TorchText文本数据集读
NLP随笔(四)
nlp技术包括基础技术和应用技术70年代以后随着互联网的高速发展，语料库越来越丰富以及硬件更新完善，自然语言处理思潮由理性主义向经验主义过渡，基于统计的方法逐渐代替了基于规则的方法。从2008年到现在，由于深度学习在图像识别、语音识别等领域不断取得突破，人们也逐渐开始引入深度学习来做自然语言处理研究，由最初的词向量到2013年word2vec，将深度学习与自然语言处理的结合推向了高潮，并且在机器翻
CS224d-深度学习与自然语言处理－Day 1: 梓翔 cs224d
原文地址：http://www.jianshu.com/p/6993edef96e4CS224d－Day1:要开始系统地学习NLP课程cs224d，今天先来一个课程概览。课程一共有16节，先对每一节中提到的模型，算法，工具有个总体的认识，知道都有什么，以及它们可以做些什么事情。简介：1.IntrotoNLPandDeepLearningNLP：NaturalLanguageProcessing(自
深度学习与自然语言处理：发刊词 tyler_download 算法机器学习人工智能编程语言深度学习
我时常会浏览大厂的招聘信息，其中会反应出当前技术的发展趋势以及市场对相应人才的需求量。通过了解大厂想要什么人，这类人待遇怎样，我们能推断出未来技术的发展方向，特别是市场需求，于是我们能快速调整自身方位以便在价值高地及时卡位，如此个人努力奋斗就有了明确的方向。无论是创业也好，找工作也好，我们都能提高获得良好回报的概率。我在Boss直聘上查看当前大厂的招人需求，我输入“算法”，选择月薪“50k”以上，
机器学习、深度学习与自然语言处理领域推荐的书籍列表爱学技术的小仙女酱
机器学习、深度学习与自然语言处理领域推荐的书籍列表是笔者AwesomeReference系列的一部分；对于其他的资料、文章、视频教程、工具实践请参考面向程序猿的数据科学与机器学习知识体系及资料合集。本文算是抛砖引玉，笔者最近有空就会在Pad上面随手翻阅这些书籍，希望能够了解其他优秀的书籍。数学基础2010-AllofStatistics:AConciseCourseinStatisticalInf
2019斯坦福CS224n深度学习自然语言处理笔记（2）——词向量与Glove 刘炫320 自然语言处理 #自然语言处理（计算语言学）概论 #
文章目录1.为什么不直接使用词共现矩阵获得词向量？1.1词共现矩阵方法（窗口统计和全局统计）1.2解决上述问题方法——SVD1.3基于统计和直接预测方法比较2.Glove3.词向量评估4.一词多义视频课程链接：《深度学习与自然语言处理（2）》继续上一节的内容。还是沿着之前的思路，首先想到为什么不直接使用词共现矩阵，然后提出SVD的解决方法。在比较了基于统计和直接预测两种方法后，提出Glove模型。
基于Python的中文分词词性标注词频统计的实现小亮 Play NLP NLP python 小项目
基于Python的中文分词词性标注词频统计的实现今天是2018年10月22号，小亮继续着自己深度学习与自然语言处理的打怪升级之路。今天给大家介绍一下最近接的小项目，基于Python的中文分词词性标注词频统计的实现，在这里与大家交流一下！笔者信息：Next_LegendQQ:1219154092机器学习自然语言处理计算机视觉深度学习小亮的博客：https://legendtianjin.github
【项目实战全解】基于深度学习与自然语言处理的AI文本生成（自动写作）周小夏(cv调包侠) 实战项目 NLP从入门到实战机器学习深度学习自然语言处理 pytorch 神经网络机器学习
文章目录一、项目演示：1：诗歌创作2：律诗与绝句3：小说篇4：自己的经济新闻篇二、原理解读Gpt-2简述何为语言模型与BERT的区别三、代码详解与训练教程训练数据半精度模型使用预训练步骤：四、生成文本文件结构注意五：实际落地项目与我的应用落地应用散文剧本演示：六:GPT-3简述与福利传送门你在网上看到的”水文“，近乎一半都是“机器人”编辑的！还在为写不出报告而苦恼吗？技术改变生活，从高中就听闻自动
我爱自然语言处理网文章汇总 wowdd1 nlp
斯坦福大学深度学习与自然语言处理第三讲：高级的词向量表示斯坦福大学深度学习与自然语言处理第二讲：词向量斯坦福大学深度学习与自然语言处理第一讲：引言用MeCab打造一套实用的中文分词系统(三)：MeCab-Chinese用MeCab打造一套实用的中文分词系统(二)中英文维基百科语料上的Word2Vec实验HMM相关文章索引PRML读书会第十四章CombiningModelsPRML读书会第十三章Se
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &