动态神经网络工具包DyNet：比Theano和TensorFlow更快

近日，来自卡内基梅隆大学、日本奈良先端科学技术大学、Google DeepMind、以色列巴伊兰大学、艾伦人工智能研究所、IBM T.J. Watson 研究中心、澳大利亚墨尔本大学、约翰·霍普金斯大学、谷歌、华盛顿大学、微软和英国爱丁堡大学的研究者共同发表了一篇重磅论文《DyNet: The Dynamic Neural Network Toolkit》，正式介绍了动态神经网络工具包 DyNet；该工具包也已在 GitHub 上开源：http://github.com/clab/dynet。

摘要：在本论文中，我们将介绍 DyNet——一个基于网络结构的动态声明（dynamic declaration of network structure）的用于实现神经网络模型的工具包。在 Theano、CNTK 和 TensorFlow 等工具包中所用的静态声明策略（static declaration strategy）中，用户需要首先定义计算图（computation graph，即计算过程的符号表示），然后样本会被传递给执行该计算的引擎并计算其导数。而在 DyNet 的动态声明策略中，计算图的构建（construction）基本上是透明的，通过执行用于计算网络输出的程序代码来隐式地构造；对于任意一个输入，用户都可以自由得使用不同的网络结构。因此，动态声明有助于实现更复杂的网络架构；特别的，DyNet 允许用户使用他们喜爱的编程语言（C ++ 或 Python）以一种他们惯用的方式来实现他们的模型。在动态声明中，有一件充满挑战的事情：由于对于每个训练样本都要重新定义符号计算图，所以其构建的开销必须要低。为了实现这一点，DyNet 使用了一个经过优化的 C ++ 后端和轻量级的图表示（graph representation）。实验表明，DyNet 的速度与静态声明工具包相当甚至比其更快，并且明显快于另一个动态声明工具包 Chainer。DyNet 根据 Apache 2.0 许可证进行了开源，可以在这里访问：http://github.com/clab/dynet

1. 引言

深度神经网络现在是机器学习开发者的工具箱中不可或缺的工具，它在图像理解 [39]、语音的识别与合成 [29,65]、游戏 [45,54]、语言建模和分析 [6, 14 ] 等领域中拥有重要的地位。首先，深度学习将应用特定的特征工程（加上理解良好的模型，这是经典的「浅度」学习的范式）替换成了应用特定的模型工程（model engineering，通常结合了输入的不太复杂的特征）。因此，深度学习范式在不断发展新的模型变体。要开发有效的模型不仅仅需要洞察力和进行分析，还需要实现一些新模型并评估其在实际任务上的表现。因此，快速的原型设计、高效轻松的维护和正确的模型代码在深度学习中至关重要。

深度学习模型以两种模式操作：在给定输入的情况下计算预测值（或者是预测上的分布），或者在监督学习训练的时候计算相关模型参数的预测误差「损失」的导数，用于使用梯度下降方法的某些变体来最小化和类似输入之间后续的误差。因为实现模型需要同时实现模型预测的代码和进行梯度计算和学习的代码，所以模型开发是一个非常困难的工程挑战。通过使用简化神经网络计算的工具，可以减少这种挑战的难度。这些工具包括 Theano [7]、TensorFlow [1]、Torch [13]、CNTK [64]、MxNet [10] 和 Chainer [62]，它们提供了神经网络功能原语（例如线性代数运算、非线性变换等）、参数初始化和程序优化以及表达特定任务预测和误差的复合能力——这些预测和误差然后会被自动微分（autodiff）以获取驱动学习算法所需的梯度。最后的自动微分（autodiff）组件可以说是它们最重要的节省劳动的功能，因为如果要改变计算训练输入损失值的函数，那么其导数的计算过程也要做出相应的改变。如果工程师独立地维护这些代码路径，则它们很容易导致它们不能同步。此外，由于对复合表达式的微分的算法相对简单 [63,31]，所以使用 autodiff 算法代替手写代码计算导数是个不错的选择。

简言之，由于这些工具有效地解决了一些关键的软件工程问题，它们让深度学习取得了成功。不过仍然存在一些问题：因为工程（engineering）是深度学习实践的关键组成部分，什么工程问题是现有工具无法解决的呢？它们能让程序员比较自然地实现自己的想法吗？它们是否便于调试？它们是否方便大型项目的维护？

在本论文中，我们将推荐一个基于几个流行工具包的编程模型——即将网络架构的声明和执行（我们称为静态声明）进行分离，在这其中必然会存在一些严重的软件工程风险，特别是在处理动态结构化网络架构（例如，可变长度的序列和树形结构的递归神经网络）的时候。作为一种替代方案，我们提出了一个替代的编程模型，它可在 autodiff 库中进行统一声明和执行。

作为我们推荐的编程模型的概念证明，我们通过论文《DyNet: The Dynamic Neural Network Toolkit》进行了描述。DyNet 是一个基于统一声明和执行编程模型的工具包，我们称之为动态声明（dynamic declaration）。

在单台机器环境（single-machine environment）中的一系列案例研究中，我们表明 DyNet 的执行效率与标准模型架构的静态声明工具包相当。和使用动态架构（例如，其中每个训练实例具有不同的模型架构）的模型相比，DyNet 的实现得到了显著的简化。

2. 静态声明 vs. 动态声明

在本节中，我们更具体地描述了静态声明（§2.1）和动态声明（§2.2）的两种范式。

3.范式编码

3.1 编码范式概述

从用户的角度来看，使用 DyNet 编写程序的目的是创建对应于需要被执行的计算的表达式（Expression）。这首先从基本的表达式开始，基本表达式通常是常量输入值或模型参数（Parameters）。然后，通过进行运算（Operation）从其他表达式进一步构建复合表达式，并且运算链（chain of operations）隐含地为所需的计算定义一个计算图（ComputationGraph）。该计算图表示了符号计算，并且计算的结果是被动的：仅当用户显式地请求它时（在该点触发「前向（forward）」计算）才执行计算。评估标量（即损失值）的表达式也可以用于触发「后向」计算，其以参数为依据来计算计算的梯度。参数和梯度被保存在模型（Model）对象中，训练器（Trainer）用于根据梯度和更新规则来更新参数。

我们下面将简要地介绍这些每种组件：

Parameter 和 LookupParameter：Parameter 是表示诸如权重矩阵和偏置向量之类的实数向量、矩阵或张量。LookupParameters 是我们想要查找的参数向量集，例如词嵌入（word embeddings）。换句话说，如果我们有一个词汇集 V，我们想要查找其嵌入（embeddings），那么就有一个 LookupParameters 对象定义一个 | V | ×d 矩阵，其作为一个嵌入矩阵与 0，...，| V | -1 到 d 维向量的项形成映射。Parameters 和 LookupParameters 被存储在模型中，并可以跨越训练样本（即跨不同的 ComputationGraph 样本）进行保存。

模型（Model）：模型是 Parameters 和 LookupParameters 的集合。用户通过从模型中请求 Parameters 来获取它们。然后模型会跟踪这些参数（及其梯度）。模型可以保存到磁盘中也可以通过磁盘加载，也可以被下面要讲到的 Trainer 对象使用。

训练器（Trainer）：训练器实现在线更新规则，比如简单随机梯度下降、AdaGrad [16] 或 Adam [34]。Trainer 有指向 Model 对象的指针，所以同时也有其中的参数，并且还可以根据更新规则的需要保存关于参数的其他信息。

表达式（Expression）：在 DyNet 项目中，表达式是主要的可以被操作的数据类型。单个表达式代表了一个计算图中的一个子计算。举个例子，一个表示矩阵或者向量的参数对象可以被加进计算图里，这就产生了一个表达式 W 或者 b。同样，一个 LookupParameters 对象 E 可以通过查找操作来查询一个专门的嵌入向量（它也是被加在计算图里的），这就产生了一个表达式 E[i]。这些表达式可以被组合成更大的表达式，例如 concatenate(E[3], E[4]) 或者 softmax(tanh(W ∗ concatenate(E[3], E[4]) +b))。这里的 softmax、tanh、∗、+、concatenate 都是运算，下面详细介绍。

运算（Operations）：运算不是对象，而是在表达式以及返回表达式上运行的函数，它用来在后台构建计算图。DyNet 为很多基本的算术原语（加、乘、点积、softmax、...）和常用的损失函数、激活函数等等都定义了相应的运算。当情况适宜时，运算可以通过运算符重载来定义，这使得图的构建能尽可能地直观和自然。

构造器类（Builder Classes）：Builder Classes 定义了创建各种「标准化」的网络组件（比如循环神经网络、树结构网络和大词汇量 softmax）的接口。这些都工作在表达式和运算之上，并且提供了各种易用的库。Builder Classes 为各种标准算法提供了高效便捷的实现。不过，从代码层次的意义上来说，它并不是「核心」DyNet 库的一部分，因为 Builder Classes 是更高层次的，它实现在 DyNet 最核心的自动微分功能之上。Builder Classes 将会在后续的§5 中深入讨论。

计算图（ComputationGraph）：表达式相当于一种隐含的计算图对象的一部分，该计算图定义了需要进行的计算是什么。DyNet 目前假定在任意一个时刻只有一个计算图存在。尽管计算图是 DyNet 内部工作的核心，但从使用者的角度来看，唯一需要负责做的是为每个训练样本创建一个新的计算图。

用 DyNet 中实现并训练一个模型的整体流程可描述如下：

创建一个模型；
向模型里增加必要的参数（Parameters）和查找表参数（LookupParameters）；
创建一个训练器（Trainer）对象，并使之与模型（Model）相关联；
对每个样本（example）：

(a) 创建一个新的计算图（ComputationGraph），并且建立一个表达式（Expression）来填充该计算图，该表达式用来表示针对这个样本想要进行的计算。

(b) 通过调用最终表达式的 value() 或者 npvalue() 函数，计算整个图前向计算的结果。

(d) 使用训练器对模型的参数进行更新。

与像 Theano 和 TensorFlow 这样的静态声明库对比可以发现，创建一个图的步骤落在每一个样本的循环里。这有利于使用户为每个实例（instance）灵活地创建新的图结构，并使用他们掌握的编程语言中的流控句法（flow control syntax，比如迭代（iteration））来做这些。当然，它也增加了对图结构速度的要求，即它要足够快，不能变成负担，我们会在§4 中进一步阐述。

3.2 高层面的示例

为了在更高层次说明 DyNet 的编码范式，我们用 Python 演示了一个 DyNet 程序的例子，如图 1 所示。这个程序显示了为一个简单分类器进行最大似然训练的过程，这个分类器为每个需要它预测的类计算一个向量分数，然后返回这个得分最高的类 ID 以及这个最高分。我们假定每个训练样本是一个（输入和输出）对，其中输入是一个二词索引的元组，输出是一个指示正确类的数。

图 1：一个使用 DyNet 的 Python API 进行训练和测试的例子。

在头两行，我们导入（import）适当的库。在第 3 行，我们初始化 DyNet 模型，并为相关参数分配内存空间，但是不初始化它们。在第 4—6 行，我们向模型里添加我们的参数，这个过程会因为使用的模型不同而不一样。这里我们增加一个 20 × 100 的权重矩阵、一个 20 维的偏置向量和一个查找表（嵌入表）——该查找表的词汇量大小为 20000 项映射到 50 维向量。在第 7 行，我们初始化了一个训练器（在这个例子中是一个简单的随机梯度降（SGD）训练器），这个训练器被用来更新模型参数。在第 8 行中，我们对数据进行多次训练和测试。

从第 9 行开始，我们对训练数据进行迭代。第 10 行，清除当前计算图的内容，开始一个空的计算图，为后续的计算做准备。第 11-13 行，我们创建一个图，这个图会为每个训练实例计算一个分数向量（这个过程会因为模型的不同而不同）。这里我们首先访问模型中的权重矩阵和偏置向量参数（W_p 和 b_p），并把它们加到图中，也就是这个代码例子中用到的表达式中（W 和 b_p）。然后我们根据输入的 id 来查找两个向量，拼接它们，然后做一个线性变换和 softmax，这样就创建了和计算相对应的表达式。接下来，我们在第 14 行创建一个与损失有关的表达式——对正确记分结果做一次 softmax 后的负对数似然估计。在第 15 行，我们计算前向图的结果，在第 16 行，我们计算后向的，并累计模型变量中参数的梯度。在第 17 行，我们根据 SGD 的更新规则更新这些参数，并清掉之前的累计梯度。

接下来，从第 18 和 19 行开始，我们遍历测试数据并测量准确度。在第 20-23 行，我们又一次清除计算图以及定义计算测试数据分数的表达式，方式和我们在训练数据中做的一样。在第 24 行，我们开始计算并把结果数据放到一个 NumPy 的数组里。在第 25 和 26 行，我们检查是否正确的数据是最高分的那个，如果是的话就把它算作是一个正确的结果。最后第 27 行，我们把本次迭代的测试准确度 print 出来。

3.3 动态图构建（Dynamic Graph Construction）的两个示例

图 2：树结构递归神经网络（tree-structured recursive neural network）的一个例子

图 3：动态流控制的一个示例。

4 后台工作

如上一节所述，将 DyNet 与其它神经网络工具包相区别的一个主要特性是，它能够为每个训练样本或 minibatch 有效地创建新的计算图（Computation Graphs）。为了保持计算效率，DyNet 使用了细致的内存管理策略来存储前向传播和反向传播的计算过程中的值（§4.2），因此大部分时间都会用在实际的计算上（§4.3）

4.1 计算图（Computation Graphs）

图 4：公式 g(x, j) = tanh(W1∗x+b)+tanh(W2∗ej+b) 的计算图的例子，以及相应的代码。

4.2 高效的图构建

4.3 执行计算

5 更高级的抽象结构

如第 3 节所述，DyNet 实现了在张量（tensors）上表示基本（子）可微函数的运算。这和 Theano 和 TensorFlow 库中提供的运算是相似的。除了这些基本运算外，使用可被视为由基本运算组成的更复杂的结构也是很常见的。常见的例子有循环神经网络（RNN）、树结构神经网络（tree-structured networks）和更复杂的计算 softmax 概率分布的方法。在其它库中，这些更高级别的结构或是通过本地提供，亦或是通过第三方库（如 Keras）提供。在 DyNet 中，循环神经网络的本地支持、树结构神经网络和更复杂的 softmax 函数都是通过 Builder 提供的；具体细节会在接下来的章节描述，图 5 中也有所总结。

图 5：DyNet Builders 实现的更高级结构的示例，以及它们的规范使用

5.1 循环神经网络的 Builders

5.2 树结构神经网络的 Builders

5.3 Large-Vocabulary Softmax Builders

图 6：各种 RNN 接口

6 效率工具

DyNet 包含许多可以提高计算效率的功能，包括稀疏更新（sparse updates）、minibatching 和跨 CPU 的多处理（multi-processing across CPUs）。

7 实证比较

在本节中，我们将使用 C++ 接口和 Python 接口将 DyNet 和其他三个流行库（Theano [7]、TensorFlow [1] 和 Chainer [62]）进行对比。我们选择这些库是因为 Theano 和 TensorFlow 可以说是目前最受欢迎的深度学习库，而 Chainer 的 define-by-run 哲学和 DyNet 相似。

表 1：各个任务的数据和默认设置。

表 2：每个工具箱在 CPU 上的处理速度。速度是以 RNNLM 与 Tagger 处理的词/秒和 TreeLSTM 处理的句/秒进行衡量的。带 +sparse 的行表示 LookupParameters 的稀疏更新（sparse updates），这是 DyNet 中的默认行为，但与其他工具包的执行密集更新（dense updates）的实现不可对比。

表 3：每个工具箱在 GPU 上的处理速度。速度是以 RNNLM 与 Tagger 处理的词/秒和 TreeLSTM 处理的句/秒进行衡量的。

表 4：从程序启动到为每个工具包处理第一个实例的时间（秒）。

表 5：密集或稀疏更新（dense or sparse updates）10 分钟后的处理速度和准确度。

表 6：每个工具包的实现的非注释字符数。

8 使用案例

DyNet 已经投入使用，并已被用于各种各样的项目，主要涉及自然语言处理。DyNet 本身包含一些从最小到中等复杂度的示例（在 examples/ 目录下）。我们还列出了一些全面的研究项目，可以让有兴趣的读者找到匹配他们感兴趣的应用程序的参考样例。

句法分析（Syntactic Parsing）：分析是目前使用 DyNet 的最突出的场景，DyNet 是许多方法的开发背后的库，例如 stack LSTMs [17]（https://github.com/clab/lstm-parser）、用于依赖性解析的双向 LSTM 特征提取器（https://github.com/elikip/bist-parser）、循环神经网络语法 [18]（https://github.com/clab/rnng），和 LSTM 层次树 [35]（https://github.com/elikip/htparser）。

机器翻译（Machine Translation）：DyNet 帮助创造了包括注意偏差（biases in attention）[12]（https://github.com/trevorcohn/mantis）和基于字符的 27 种翻译方法 [42] 等方法。它还为许多机器翻译工具包提供支持，如 Lamtram（https://github.com/neubig/lamtram）和 nmtkit（https:// github.com/odashi/nmtkit）。

语言建模（Language Modeling）：DyNet 已被用于混合神经/n 元语言模型（hybrid neural/n-gram language models）的开发 [47]（https://github.com/neubig/modlm）和生成语法语言模型 [18]（https://github.com/clab/rnng）。

标注（Tagging）：DyNet 用于命名实体识别方法的开发 [47]（https://github.com/clab/stack-lstm-ner）、POS 标注、语义角色标签 [60]（https://github.com/clab/joint-lstm-parser）、标点符号预测 [5]（https://github.com/miguelballesteros/LSTM-punctuation）和序列处理的多任务学习 [37,56] 以及创建新的架构，如段循环神经网络（segmental recurrent neural networks）[38]（https://github.com/clab/dynet/tree/ master/examples/cpp/segrnn-sup）。

形态（Morphology）：DyNet 已被用于形态变化生成 [21, 2]（https://github.com/mfaruqui/morph-trans https://github.com/roeeaharoni/morphological-reinflection）。

杂项：DyNet 已被用于开发专门的用于检测协调结构的神经网络 [22]；半监督的介词意义消歧 [23]; 和用于识别词汇语义关系 [53,52]（https://github.com/vered1986/HypeNET）。

总结、致谢和参考文献（略）

你可能感兴趣的:(tuicool)

jvm的内存分配机制四条腿 java虚拟机 jvm 内存分配内存
在学习jvm的内存分配的时候，看到的这篇博客，该博客对jvm的内存分配总结的很好，同时也利用jvm的内存模型解释了java程序中有关参数传递的问题。博客出处：http://www.cnblogs.com/hellocsl/p/3969768.html?utm_source=tuicool&utm_medium=referral看了此博客后，发现应该去深入学习下jvm的内存模型，就是去认真学习下《深
VMware安装Centos7超详细过程（图文） MasterQu
原文：https://www.jianshu.com/p/ce08cdbc4ddb?utm_source=tuicool&utm_medium=referral本篇文章主要介绍了VMware安装Centos7超详细过程（图文），具有一定的参考价值，感兴趣的小伙伴们可以参考一下1.软硬件准备软件：推荐使用VMwear，我用的是VMwear12镜像：CentOS7,如果没有镜像可以在官网下载：http
Babel下的ES6兼容性与规范天幕下悠悠
Babel下的ES6兼容性与规范https://www.tuicool.com/articles/nEJRries5-shim也无法完全支持，如果想用react就要抛弃ie8至于es6有一些是es5根本没有的，即使babel了也无法支持，还是看浏览器这有一个babel编译后的兼容性，可参考：babel后es6兼容
为Java程序员而准备的Go入门教程指南 ArthurKingYs c++go java 程序员入门教程
https://zhuanlan.zhihu.com/p/24785820?utm_source=tuicool&utm_medium=referral作者：Dreawer链接：https://zhuanlan.zhihu.com/p/24785820来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。这篇文章是为了帮助Java程序员们迅速的掌握Go语言。本篇将先用Jav
运维相关收藏 purewater2014
一些小团队的自动化运维实践经验https://showme.codes/2018-06-07/devops-in-action/?utm_source=tuicool&utm_medium=referral
activemq性能优化掌少开发
转自：http://www.tuicool.com/articles/MfMNzyActiveMq运行是比较稳定的，数据的吞吐速度也很高，如果出现入队列或者出队列慢的问题，先检查一下自己的代码，是不是本身取到数据后处理过慢。本文的关于性能优化，其实是列举出一些需要注意的点，请确保你的项目没有一下问题：1.使用spring的JmsTemplateJmsTemplate的send和convertAnd
iOS核心动画高级技巧路漫漫其修远兮Wzt
1.IOS事件处理与图像渲染http://www.cocoachina.com/ios/20151203/14549.html?utm_source=tuicool&utm_medium=referral2.IOS核心动画高级技巧https://zsisme.gitbooks.io/ios-/content/index.htmlGitHub地址:https://github.com/ZsIsMe/
当下最新Java开发面试题汇总符文杰9527
原文地址：https://www.jianshu.com/p/faaa4c2a48fe?utm_source=tuicool&utm_medium=referral前言为了方便之后的面试复习，我把各类面试题给汇总了一下，每道题都是经过自己筛选后觉得需要掌握的，此次整理包括Java、数据结构与算法、计算机网络、操作系统、数据库等。文末我会把这些完整的答案放送给大家。Java篇(1).Java基础知识
R语言实现MapReduce的协同过滤算法张小琦数据挖掘
原文地址：http://www.tuicool.com/articles/63EjqiAuthor：张丹(Conan)Date:2013-04-07Weibo:@Conan_ZEmail:bsspirit@gmail.comBlog:http://www.fens.me/blogAPPs:@晒粉丝http://www.fens.me@每日中国天气http://apps.weibo.com/chin
聊下并发和Tomcat线程数--转载 huchangan2005678 tomcat 性能配置
原文地址：http://www.tuicool.com/articles/2qe2Ije本文前半部分结论存在严重错误，请看最后2015-1-20更新部分。最近一直在解决线上一个问题，表现是：Tomcat每到凌晨会有一个高峰，峰值的并发达到了3000以上，最后的结果是Tomcat线程池满了，日志看很多请求超过了1s。服务器性能很好，Tomcat版本是7.0.54，配置如下：事后threaddump看
gitlab图形化使用教程（mtm推荐） weixin_30847939 git 运维 markdown
原文：http://www.restran.net/2016/02/23/git-and-gitlab-guide/?utm_source=tuicool&utm_medium=referral去年小组在从SVN和TFS迁移到Git的过程中整理了这份文档，面向的用户是对Git和SVN可能都不是很了解的人。看到自己写了这么多，于是就拿出来分享下，有些东西可能写得比较浅，有错误还请指正。1.关于Git
gitlab图形化使用教程（测试过） gb4215287 svn/git
原文：http://www.restran.net/2016/02/23/git-and-gitlab-guide/?utm_source=tuicool&utm_medium=referral去年小组在从SVN和TFS迁移到Git的过程中整理了这份文档，面向的用户是对Git和SVN可能都不是很了解的人。看到自己写了这么多，于是就拿出来分享下，有些东西可能写得比较浅，有错误还请指正。1.关于Git
iOS YYText富文本开源库 _KnowingNow iOS iOS
在infoQ上看到对YYText作者的采访：http://www.infoq.com/cn/news/2015/11/ibireme-interview?utm_source=tuicool&utm_medium=referral很强大的开源库想了解更多，可以打开git地址git资源：https://github.com/ibireme/YYText本地资源：http://download.csd
React Router 最新指南与异步加载实践 barnett_y 】
本文从属于笔者的React入门与最佳实践系列http://www.tuicool.com/articles/emayQ3IntroductionReactRouter是基于React的同时支持服务端路由与客户端路由的强大易用的路由框架，可以允许开发者方便地添加新页面到应用中，保证页面内容与页面路由的一致性以及在页面之间进行方便地参数传递。之前ReactRouter作者没有积极地开发与审核PullR
Grpc初体验安装测试 weixin_33929309 golang 数据库 python
2019独角兽企业重金招聘Python工程师标准>>>grpc初体验安装测试安装Protobuf-3.0.0下载链接：http://pan.baidu.com/s/1jGILD4q安装参考：http://www.tuicool.com/articles/nYZrmiGit安装参考：http://www.oschina.net/code/snippet_4873_1376Maven安装参考：http
零客户端开发经验 React Native 热更新 CodePush 打包集成指北 barnett_y 】
本文永久地址：github.com/rccoder/blog/issues/27，其他平台可能不是最新文章。文章评论等也希望去原文进行。https://juejin.im/post/5911dca544d904007bfdf8ab?utm_source=tuicool&utm_medium=referral一、背景我的毕业设计是用ReactNative写一款校园APP，服务端采用egg+Mongo
动态追踪技术-简介 weixin_33811961 操作系统 python 数据库
个人认为此文对动态追踪的东西介绍比较宽泛，但可用于指导学习动态追踪技术知识。特此转载。原文地址:http://openresty.org/posts/dynamic-tracing/#rd?utm_source=tuicool&utm_medium=referral动态追踪技术漫谈关于作者大家好，我是章亦春，网名agentzh。很多朋友可能是通过我做的一些开源项目了解到我的，比如我创立的OpenR
fastlane iOS android 集成打包夙愿_618f
Fastlane入门:初级使用篇http://www.jianshu.com/p/9f66b7a106ea使用fastlanegym/xctool编写ipa打包脚本http://www.jianshu.com/p/54ab07f2e63b/深入浅出Fastlanehttp://www.tuicool.com/articles/6ziMJfa
vmvare centos 7.0 root密码忘记后重置及总结 weixin_33991727
今天遇到了一个比较尴尬的事情，我centos7.0的虚拟机密码忘了.....里面还有我配置好的环境呢。于是我就上网上搜索各种方法，最后经我验证下面这个方法比较靠谱：使用光盘修复Centos：http://www.tuicool.com/articles/MJr2UzN下面这个方法在重启之后发生了错误，可能我开启了syslinux，可以参考一下：centOs7忘记root密码：http://blog
Docker背后的内核知识——Namespace资源隔离 liukuan73 docker docker namespace 内核
http://www.infoq.com/cn/articles/docker-kernel-knowledge-namespace-resource-isolation?utm_source=tuicoolDocker这么火，喜欢技术的朋友可能也会想，如果要自己实现一个资源隔离的容器，应该从哪些方面下手呢？也许你第一反应可能就是chroot命令，这条命令给用户最直观的感觉就是使用后根目录/的挂载
xcode 所遇到的坑 App Store 图片问题导致的随机崩溃成熟的
https://www.tuicool.com/articles/meiMZze9.1崩溃可能是图片引起的查看网址检查1.打一个ipa包，解压你的应用的ipa包，进入到你应用的Playload文件夹。进入到xx.app目录下.find.-name'Assets.car'2.xcrun--sdkiphoneosassetutil--info./Assets.car>/tmp/Assets.json生
CocoaPods - podfile 全面认知 YYLittleCat
https://www.tuicool.com/articles/6ZBvQbYhttps://blog.csdn.net/prettyfei1123/article/details/68060154
微信开发聊天机器人设计方案 java语言程序和数据库代码 wyx100 微信开发 java语言聊天机器人设计方案和代码微信开发聊天机器人设计方案和代码 java语言
转自：http://www.tuicool.com/articles/RBJfqyM使用Liferay和Lucene实现企业门户智能帮助机器人时间2015-04-3012:00:00IBMdeveloperWorks中国原文http://www.ibm.com/developerworks/cn/java/j-lo-LiferayLucene/index.html?ca=drs-企业门户智能帮助需
2020-04-28 移动端响应式解决方案小福子_1257
http://www.ruanyifeng.com/blog/2015/07/flex-grammar.html?utm_source=tuicoolFlex布局教程：语法篇HTML5----响应式（自适应）网页设计https://www.jianshu.com/p/073f58001538Flex.js讲解flex:http://caibaojian.com/flexible-js.htmlht
Docker学习笔记4: Docker-Compose—简化复杂容器应用的利器秋风小凉鱼 Docker学习笔记 docker集群管理 python-pip docker-compose
本文转载自http://www.tuicool.com/articles/AnIVJn.因Python语言，个人也没学过，不是太熟悉，这篇文章的代码格式排版不准确爆了很多错，让我走了好多坑，不过还是要感谢原文作者。在CentOS7系统上安装了docker-compose之后，我们以一个小例子来熟悉一下这个工具的使用.Docker-Compose使用使用Compose只需要简单的三个步骤：(1)首先
B版树莓派使用学习手札 bj123nimab vb2005xu自己动手系列 vb2005xu新技术灌水 vb2005xu软件学习树莓派 raspberry pi
配置:写道树莓派个人实测Q&A（最新修改使用windows连接远程桌面)http://www.eeboard.com/bbs/thread-5191-1-1.html树莓派的默认账号是pi,默认密码是raspberry,使用sudosu切换至根用户默认就有gcc树莓派相关的一些帖子:http://www.tuicool.com/articles/mINnmm链接远程桌面http://blog.16
每个系统管理员都要知道的 30 个 Linux 系统监控工具 ArthurKingYs linux linux 运维监控工具系统管理员
https://www.tuicool.com/articles/IzYNjyI您需要监控Linux服务器的性能吗？试试用这些内置命令和附加工具吧！大多数Linux发行版都附带了大量的监控工具。这些工具提供了获取系统活动的相关指标。您可以使用这些工具来查找性能问题的可能原因。本文提到的是一些基本的命令，用于系统分析和服务器调试等，例如：找出系统瓶颈磁盘（存储）瓶颈CPU和内存瓶颈网络瓶颈1.top
常见编码和加密 fmalz
ASCII编码ASCII码对应表Base64/32/16编码·16，32，64表示用多少个字符来编码·特征：大部分base64后面有1-2个等号·原理：https://www.tuicool.com/articles/2E3INnmURL编码·特征：含有%莫尔斯电码·特征：由点（.）、划（-）、每个字符间短的停顿（）、每个词之间中等的停顿（/）、句子之间长的停顿组成栅栏密码·特征：还是原来的字符，
swfit搭web端优优切克闹
【链接】[iOS]使用Vapor构建你的第一个SwiftWeb应用http://www.tuicool.com/articles/Bn2Y7nvapor的文档https://vapor.github.io/documentation/1.vapornewprojectName（最好建在桌面）
Angular vs React：谁更适合前端开发 yifanict angular 前端开发 react
翻译原文地址：http://www.tuicool.com/articles/Jb6bmuz原文地址：http://https://juejin.im/post/59ab51746fb9a024865d202bAngularvsReact：谁更适合前端开发大家总在写文章争论，Angular与React哪一个才是前端开发的更好选择（译者：在中国还要加上vue:P）。我们还需要另一个吗？我之所以写这篇
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR