VariableX

长短期记忆(LSTM)相关知识

文章目录

LSTM结构
- 遗忘门
- 输入门
- - 决定给细胞状态C添加哪些新的信息
  - 更新旧的细胞信息
- 输出门
LSTM小结
- 如何实现长期依赖？
- 如何避免梯度消失/爆炸？
双向LSTM(Bi-LSTM)
GRU

上一篇文章中，提到RNN难以学习到长期依赖关系，后来有人提出了RNN的改进版本LSTM很大程度上改善了长期依赖问题。

长期依赖在序列数据中是很常见的，考虑到下面这句话“I grew up in France… I speak fluent French.”，现在需要语言模型通过现有以前的文字信息预测该句话的最后一个词，模型结构的可能如下图所示：

需要通过以前文字语境来预测出最后一个词是French，则需要依赖于开头部分语境中的单词France。LSTM可以很容易的学习到这种长期依赖，这得益于其内部三个特殊的门结构。

LSTM结构

RNN结构如下图所示：

LSTM基于RNN，做出了些调整，修改后的结构如图所示：

很明显可以看到两个区别，一方面是细胞单元内部的结构变复杂了，另一方面相邻细胞单元之间的依赖关系从一个变为了两个。

具体来说，LSTM使用上图中三个黄色σ方框（σ代表Sigmoid运算）代表的遗忘门、输入门和输出门来控制细胞状态。

遗忘门

遗忘门控制前一步记忆单元中的信息以多大程度被遗忘掉，主要决定决定细胞状态 C 需要丢弃哪些信息。遗忘门在细胞单元中的位置，如下图黄色方框所示：

其中遗忘门的输出结果 $f$ 的计算公式为：
$f_t=\sigma(W_f\cdot[h_{t-1},\;x_t]+b_f)$
式子中： $W_f$ 是遗忘门的权重矩阵， $h_{t-1},\;x_t]$ 表示把两个向量连接成一个更长的向量， $b_f$ 是遗忘门的偏置项， $\sigma$ 表示Sigmoid函数，最终得到一个介于0与1之间的输出值。

其中 $W_f\cdot[h_{t-1},\;x_t]+b_f$ 可以理解为：
$\begin{aligned} \begin{bmatrix}W_f\end{bmatrix}\begin{bmatrix}\mathbf{}h_{t-1}\\ \mathbf{}x_t\end{bmatrix}&= \begin{bmatrix}W_{fh}&W_{fx}\end{bmatrix}\begin{bmatrix}\mathbf{}h_{t-1}\\ \mathbf{}x_t\end{bmatrix}\\ &=W_{fh}\mathbf{}h_{t-1}+W_{fx}\mathbf{}x_t \end{aligned}$
也就是遗忘门通过查看 $h_{(t-1)}$ 和 $x_t$ 的信息计算得到一个介于0与1之间的向量，该向量中的数值决定从上一个单元输入到此单元的状态 $C_{t-1}$ 中有多少信息需要保留或丢弃，0表示不保留，1表示都保留。至于这个细胞状态 $C_{t-1}$ 代表什么，后面会有相关的解释说明。

输入门

决定给细胞状态C添加哪些新的信息

接下来是决定给细胞状态C添加哪些新的信息。这一步又分为两个步骤：

1，首先，利用 $h_{t-1}$ 和 $x_t$ 通过输入门的运算来决定更新哪些信息，输入门的位置如下图中的黄色σ方框所示：

输入门的运算如下：
$\mathbf{}i_t=\sigma(W_i\cdot[\mathbf{}h_{t-1},\mathbf{x}_t]+\mathbf{}b_i)$
2，然后，利用 $h_{t-1}$ 和 $x_t$ 通过一个tanh层得到新的候选细胞信息 $\tilde{C}_t$ ，这些信息可能会被更新到细胞信息中，涉及的运算如下：
$\tilde{C}_t=\tanh(W_c\cdot[\mathbf{}h_{t-1},\mathbf{}x_t]+\mathbf{}b_c)$

更新旧的细胞信息

通过上面的两个步骤，得到了新的信息，接下来就是更新旧的细胞信息，变为新的细胞信息。更新的规则就是通过遗忘门的选择来忘记旧细胞信息的一部分，通过输入门的选择来添加候选细胞信息 $\tilde{C}_t$ 的一部分得到新的细胞信息。如下图所示：

相关的计算如下：
$\mathbf{}C_t=f_t*{\mathbf{}C_{t-1}}+i_t*{\mathbf{}\tilde{C}_t}$
通过这样的方式，我们就把LSTM关于当前的记忆 $\tilde{C}_t$ 和长期的记忆 $C_{t-1}$ 组合在一起，形成了新的单元状态。由于遗忘门的控制，它可以保存很久很久之前的信息，由于输入门的控制，它又可以避免当前无关紧要的内容加入记忆。

输出门

更新完细胞状态后需要根据输入的 $h_{t-1}$ 和 $x_t$ 来决定输出细胞状态C的哪些特征，这里需要将输入经过一个称为输出门的Sigmoid函数，其位置如下图黄色方框所示：

经过Sigmoid表示的门之后，还需要经过一个tanh函数来得到取值范围在 -1~1 之间的向量，该向量与输出门得到的输出结果相乘就得到了最终该RNN单元的输出 $h_t$ 。涉及的计算如下：
$\mathbf{}o_t=\sigma(W_o\cdot[\mathbf{}h_{t-1},\mathbf{}x_t]+\mathbf{}b_o) \\ \mathbf{}h_t=\mathbf{}o_t* \tanh(\mathbf{}c_t)$

LSTM小结

如何实现长期依赖？

当输入序列没有重要信息时，LSTM遗忘门的值接近为1，输入门接近0，此时过去的记忆会被保存，从而实现了长期记忆；

当输入的序列中出现了重要信息时，LSTM会将其存入记忆中，此时输入门的值会接近于1；

当输入序列出现重要信息，且该信息意味着之前的记忆不再重要的时候，输入门接近1，遗忘门接近0，这样旧的记忆被遗忘，新的重要信息被记忆。

经过这样的设计，整个网络更容易学习到序列之间的长期依赖。

如何避免梯度消失/爆炸？

在LSTM中，状态 C 是通过累加的方式来计算的，不像RNN中的累乘的形式，这样的话，它的的导数也不是乘积的形式，这样就不会发生梯度消失的情况了。

双向LSTM(Bi-LSTM)

上面介绍的是单向的LSTM，只能根据先前的序列推导未来的信息，但是有时候在给定时间 t 之后的未来的信息，可以帮助推断时刻 t 的信息。例如在语言识别中，当前识别到的字可能取决于未来的几个字的发音。因此，在某些任务中，双向的 LSTM 要比单向的 LSTM 的表现要好。

双向LSTM(Bi-LSTM)的隐藏层要保存两个值， A 参与正向计算， A’ 参与反向计算。最终的输出值 y 取决于 A 和 A’，网络结构如下图所示：

以 $t = 2$ 为例，输入 $x_2$ ， $A_2$ 是正向计算的结果， $A’_2$ 是反向计算的结果，输出 $y_2$ 同时取决于 $A_2,A’_2$ 。

GRU

GRU（Gated Recurrent Unit）作为LSTM的一种变体，与LSTM有两个不同点：

（1）GRU将LSTM中的两个信息流简化成一个信息流，输入只有一个 $\boldsymbol h_t$ 。

（2）GRU将遗忘门和输入门合成了一个单一的更新门，还引入了一个重置门。

如下图所示：

主要运算过程如下：
$\begin{aligned} &r_t = \sigma(W_r\cdot[h_{t-1},x_t]) \\ &z_t = \sigma(W_z\cdot[h_{t-1},x_t]) \\ &\tilde h_t = \tanh(W \cdot[r_t * h_{t-1},x_t]) \\ & h_t = (1-z_t)*h_{t-1} + z_t*\tilde h_t \end{aligned}$
相当于简化了LSTM，运算速度提高了很多，并且应用效果也没有差很多。

参考文章：

LSTM原理详解
理解LSTM（通俗易懂版）
NLP面试题目汇总1-5

你可能感兴趣的:(深度学习相关,lstm,深度学习,算法)

go语言：实现hexagonal numbers六边形数算法(附完整源码) 源代码大师 go算法实战教程 golang 算法开发语言
go语言：实现hexagonalnumbers六边形数算法代码说明：如何运行代码：六边形数是指可以用六边形排列的点数，公式为H=n(2n−1)，其中n是正整数。下面是用Go语言实现六边形数算法的完整源码：packagemainimport("fmt")//HexagonalNumber计算第n个六边形数funcHexagonalNumber(nint)int{
算法练习|Leetcode49字母异位词分词，Leetcode128最长连续序列，Leetcode3无重复字符的最长子串，sql总结 ambitious_Rgr 算法 sql 哈希哈希算法数据结构 leetcode python
目录一、Leetcode49字母异位词分词题目描述解题思路方法:哈希总结二、Leetcode128最长连续序列题目描述解题思路方法:总结三、Leetcode3无重复字符的最长子串题目描述解题思路方法:双指针法总结sql总结一、Leetcode49字母异位词分词题目描述给你一个字符串数组，请你将字母异位词组合在一起。可以按任意顺序返回结果列表。字母异位词是由重新排列源单词的所有字母得到的一个新单词。
无线网络加密方式对比 Hacker_Oldv 网络 web安全安全 php
加密技术全称加密算法协议背景划分特点WEPWiredEquivalentPrivacy（有线对等保密）rsa数据安全性公司开发的rc4prng算法IEEE802.11b无WEP加密方法很脆弱。网络上每个客户或者计算机都使用了相同的保密字，这种方法使网络偷听者能刺探你的密钥，偷走数据并且在网络上造成混乱WPAWi-FiProtectedAccess（WiFi安全存取）还是WEP中使用的Rc4算法IE
Go算法之奇偶排序思远久安 Go数据结构与算法小白入门算法 golang 数据结构后端排序算法
一、什么是奇偶排序（以下排序步骤来自文心一言加上本人的一些理解，我觉得ai讲的比较透彻）奇偶排序步骤：初始化：给定一个待排序的数组。奇数轮次遍历：从索引1（即第二个元素，因为索引从0开始）开始，以步长为2（i+2）遍历数组。比较当前元素与其后一个元素（即索引为i和i+2的元素）。如果当前元素大于后一个元素，则交换它们的位置。偶数轮次遍历：从索引0开始，同样以步长为2遍历数组。执行与奇数轮次相同的比
KlearMax 2.0：一键AI换脸、图像变清晰、老照片修复、黑白照片上色！ 6v6博客人工智能
KlearMax2.0是一款功能强大的AI图像处理软件，最新版本带来了多项新功能，包括AI换脸、图像清晰度增强、老照片修复和上色等。利用先进的智能算法，KlearMax2.0能够一键处理模糊图像、修复老照片并平衡颜色，锐化细节，让图像焕发新生。体验了一下，功能非常的多，且使用简单，所以特意测试了一下。应用简介应用名称：KlearMax应用版本：2024软件大小：190M适用平台：Windows功能
Acwing-基础算法课笔记之搜索与图论（spfa算法）不会敲代码的狗 Acwing基础算法课笔记图论算法笔记
Acwing-基础算法课笔记之搜索与图论（spfa算法）一、spfa算法1、概述2、模拟过程3、spfa算法模板（队列优化的Bellman-Ford算法）4、spfa算法模板（判断图中是否存在负环）一、spfa算法1、概述单源最短路径算法，处理负权边的spfa算法，一般时间复杂度为O(m)O(m)O(m)，最坏为O(nm)O(nm)O(nm)。1、建立一个队列，初始化队列里只有起始点（源点）；2、
【一看就会】路径规划算法【二】——RRT，RRT* 不断学习加努力算法自动驾驶
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、RRT的原理二、RRT*的原理总结前言这是路径搜索算法的第二篇，上一篇讲了广度优先，深度优先，Dijkstra、A*、D*，本篇讲述另外两种常见路径搜索算法：RRT，RRT*。本篇尽量用简单的文字描述，帮助大家理解RRT和RRT*的原理。一、RRT的原理Dijkstra、A*、D*可以说都是广度优先搜索算法的变种。A*
DeepSeek推荐未来好就业的十大专业东锋1.3 人工智能 deepseek推荐就业
一、人工智能与数据科学专业聚焦人工智能、大数据技术、计算机科学与技术、机器学习、数据科学与大数据技术等专业，构成了这一前沿领域的核心。这些专业旨在培养学生掌握从数据收集、处理到模型构建、算法优化的全流程能力。就业前景洞察人工智能已广泛渗透到医疗、金融、制造、交通等众多领域。在医疗领域，AI辅助诊断系统帮助医生更精准地识别疾病；金融行业里，智能风控模型有效防范风险。未来，算法工程师负责开发和优化各种
算法学习笔记之数学基础 threesevens 算法与数据结构算法
例1（最小公倍数与最大公约数）计算最小公倍数公式：LCM(A,B)=A*B/GCD(A,B)A与B的最小公倍数等于A*B除以A与B的最大公约数计算最大公约数：辗转相除法原理：设A与B的最大公约数为x，则A是x的倍数，B也是x的倍数，令A=ax，B=bx，A/B取整为c，则A-cB=(a-bc)x。即A与B的余数也是x的倍数 intgcd(inta,intb) { inttemp; whil
计数排序c++详解（看这一篇就够了） Lucas55555555 c++算法数据结构
计数排序（CountingSort）是一种非比较型的整数排序算法，适用于整数范围不大的数据排序。其基本思想是统计待排序数组中每个元素出现的次数，然后通过累加计数信息，将元素放回排序数组中。由于它是基于元素的出现频率来排序的，因此时间复杂度通常可以达到O(n)，但它对元素的范围（即最大值）有要求。定义：计数排序通过统计每个元素出现的次数来实现排序，然后根据这些统计结果重建排序后的数组。它是一种稳定的
算法学习笔记之贪心算法 threesevens 算法与数据结构算法笔记贪心算法
导引（硕鼠的交易）硕鼠准备了M磅猫粮与看守仓库的猫交易奶酪。仓库有N个房间，第i个房间有J[i]磅奶酪并需要F[i]磅猫粮交换，硕鼠可以按比例来交换，不必交换所有的奶酪计算硕鼠最多能得到多少磅奶酪。输入M和N表示猫粮数量和房间数量，随后输入N个房间，每个房间包括奶酪数和猫粮数Input 53 72 43 52 -1-1Output 13.333解法：计算每个房间的奶酪与猫粮之比，比值越大硕鼠收益越
Python利用伪代码制作一个简单的登录系统千帆过尽皆不是 python 开发语言
一.代码所需知识1.1伪代码伪代码（Pseudocode）是一种非正式的，用于描述模块结构图的语言。人们在实现一个算法时，尤其是对于那些熟练于不同编程语言的程序员要理解一个算法功能时可能很难，因为程序语言的形式限制了程序员对程序关键部分的理解。所以伪代码就应运而生了，伪代码提供了更多的设计信息。1.2for...else...循环在for...else...的循环中，很多人以为进入了for的循环后
MD5加密计蒙不吃鱼 Android开发相关 MD5 MD5加密
简介：MD5的全称是Message-DigestAlgorithm5（信息-摘要算法），它是一种单向加密算法，可以将输入的信息加密转换为128位固定长度的散列值，用于检验数据传输过程中的完整性。在90年代初由MITLaboratoryforComputerScience和RSADataSecurityInc的RonaldL.Rivest开发出来，经MD2、MD3和MD4发展而来。出现的两种观点：1
无人机上需要哪些程序？以及如何进行无人机编程？改天想法无人机
基于WICED的WIFI四轴飞行器，手机APP控制（硬件、核心代码、算法等）-飞行器-电路城https://www.cirmall.com/circuit/4820/#/details本设计中四轴飞行器无线控制使用WiFi方案，具有更加通用易用性。可以实现飞行器姿态数据、控制参数、状态信息等数据的更新和控制。传送门恭喜你找到组织“电路城”https://www.cirmall.com/bbs/th
无人机编程实战第1讲——无人机简介 ouyanghuangxun 无人机编程实战无人机单片机嵌入式硬件 c语言
目录前言一、飞控是什么？二、扫盲行动！！！1.微控制器2.传感器3.处理？4.无人机飞行姿态总结前言随着开源无人机飞行控制器的不断发展，越来越多优秀的代码与算法不断涌现，无人机领域的技术不断趋于成熟，也使得无人机领域的门槛一再降低，现在国内工科高校中，普遍都设有无人机实验室。对于无人机入门，网络上有太多的资料，只是这些资料重原理却轻代码，很多时候我们知道无人机的结构与飞行原理，却不知道怎么写代码让
代码随想录算法营Day38 ｜ 62. 不同路径，63. 不同路径 II，343. 整数拆分，96. 不同的二叉搜索树寂枫zero 算法 python leetcode
62.不同路径这题的限制是机器人在mxn的网格的左上角，每次只能向下走一格或者向右走一格。问到右下角有多少条不同路径。这个动态规划的初始状态是第一行和第一列的格子的值都是1，因为机器人只能向右走一格或者向下走一格，所以第一行和第一列的格子的不同路径数只能是1.而其他格子的路径数取决于每个格子的正上方和左边两个格子的路径数之和，即状态转移公式为dp[i][j]=dp[i-1][j]+dp[i][j-
华为OD机试 - 特殊的加密算法 - 深度优先搜索DFS（Java 2024 D卷 200分）哪吒华为od 深度优先 java
华为OD机试2024D卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试（JAVA）真题（D卷+C卷+A卷+B卷）》。刷的越多，抽中的概率越大，每一题都有详细的答题思路、详细的代码注释、样例测试，发现新题目，随时更新，全天CSDN在线答疑。一、题目描述有一种特殊的加密算法，明文为一段数字串，经过密码本查找转换，生成另一段密文数字串。规则如下明文为一段数字串由0-9
微信视频号中的“多位朋友看过”是真的有朋友看过，还是系统分析过大数据后推荐的？ cda2024 微信大数据
不知道你有没有注意到，在微信视频号里，经常会出现“多位朋友看过”的提示。这一行小字往往能勾起人们的好奇心，让人不由自主地想要点击观看。那么，这究竟是不是真的意味着我们的朋友确确实实地浏览过这些视频呢？今天，我们就来聊聊这个话题。一、社交网络背后的算法在探讨这个问题之前，我们首先得了解一下社交网络平台背后的算法原理。社交网络平台的推荐机制主要依赖于大数据分析技术，通过用户的行为习惯、兴趣偏好等多维度
牛客网面试必刷TOP101-010贪心算法BM96 主持人调度（二） bingw0114 贪心算法算法
描述有n个活动即将举办，每个活动都有开始时间与活动的结束时间，第i个活动的开始时间是starti,第i个活动的结束时间是endi,举办某个活动就需要为该活动准备一个活动主持人。一位活动主持人在同一时间只能参与一个活动。并且活动主持人需要全程参与活动，换句话说，一个主持人参与了第i个活动，那么该主持人在(starti,endi)这个时间段不能参与其他任何活动。求为了成功举办这n个活动，最少需要多少名
【DBO三维路径规划】基于matlab改进的蜣螂算法FADBO复杂山地危险模型无人机路径规划【含Matlab源码 9740期】 Matlab仿真科研站 matlab
欢迎来到Matlab仿真科研站博客之家✅博主简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，Matlab项目合作可私信。个人主页：Matlab仿真科研站博客之家代码获取方式：扫描文章底部QQ二维码⛳️座右铭：行百里者，半于九十；路漫漫其修远兮，吾将上下而求索。⛄更多Matlab路径规划（仿真科研站版）仿真内容点击Matlab路径规划（仿真科研站版）⛄一、改进的蜣螂算法FADBO复杂山地
E卷-特殊的加密算法-(200分) 春秋招笔试突围华为OD刷题笔记E卷华为OD刷题笔记E+D卷深度优先算法
专栏订阅特殊的加密算法问题描述有一种特殊的加密算法，明文为一段数字串，经过密码本查找转换，生成另一段密文数字串。规则如下：明文为一段由0-9组成的数字串。密码本为由数字0-9组成的二维数组。需要按明文串的数字顺序在密码本里找到同样的数字串，密码本里的数字串是由相邻的单元格数字组成，上下和左右是相邻的，注意：对角线不相邻，同一个单元格的数字不能重复使用。每一位明文对应密文即为密码本中找到的单元格所在
matlab调用cst计算扫频,CST MWS I算法求解单站RCS是否可以进行扫频设置林为珮 matlab调用cst计算扫频
如题，利用I算法的FastRCSSweep求解单站RCS是否可以添加扫频设置？如果有如何添加？因为需要，必须计算一个介质目标的单站RCS，所以A算法用不了了。而I算法里面的快速RCS里又没找到扫频的设置，我知道有双站远场监视器的宏，但是单站RCS就不知道怎么办了，请各位大大帮忙解答网友回复:看看在这里设置一下fromto能不能解决扫频问题。网友回复:提供一个新思路，如果是介质的话可以用涂覆操作，这
数据结构与算法面试专题——堆排序黄雪超技术基础算法数据结构排序算法
完全二叉树完全二叉树中如果每棵子树的最大值都在顶部就是大根堆完全二叉树中如果每棵子树的最小值都在顶部就是小根堆设计目标：完全二叉树的设计目标是高效地利用存储空间，同时便于进行层次遍历和数组存储。它的结构使得每个节点的子节点都可以通过简单的计算得到，从而实现快速的节点访问。实现原理：完全二叉树是一棵满二叉树，除了最后一层外，每一层都被完全填充。最后一层的节点都集中在左边。这种结构可以用数组来存储，其
GitHub每日最火火火项目（2.16） FutureUniant github日推 github 计算机视觉音视频人工智能 ai
FujiwaraChoki/MoneyPrinterV2用途：MoneyPrinterV2旨在实现线上赚钱流程的自动化。虽然项目名称带有一定的趣味性，但从功能角度来看，它可能是通过自动化脚本、算法等手段，对线上一些能够产生收益的活动，如网络营销、广告投放收益、电商运营等环节进行自动化操作，以提高赚钱的效率和收益。其核心在于减少人工干预，通过程序自动执行相关任务，例如自动发布推广内容、自动处理订单、
C语言专题 Mapleay c++
字节对齐字节对齐的算法原理字节对齐的算法主要通过位运算来实现，将给定的地址或大小调整到指定的字节对齐边界上。这种对齐操作确保数据存储在内存中符合处理器的对齐要求，从而提高数据访问效率。字节对齐的算法基于以下原理：字节对齐算法的基本思路字节对齐的算法是将一个内存地址或数据大小size向上调整到对齐边界alignment的最接近的倍数。其核心思路是：将数据大小size增加一个偏移值，使其超过当前的对齐
使用 pip 和 conda 的安装深度学习环境 ZhengXinTang #深度学习环境 pip conda python
在决定使用pip和conda安装包时，了解这两个包管理器之间的主要区别非常重要。以下是细分：1.在使用conda安装的过程中，可以先参考另外一台机器中对应虚拟环境配置成功的，所设置的镜像源，使用condacofig--show,进行查看，2.设置，将网络下载时，连接时间加长condaconfig--setremote_connect_timeout_secs60condaconfig--setre
农业土壤传感器可根据作物周期调整采集频率百态老人人工智能大数据算法
农业土壤传感器确实可以根据作物生长周期动态调整数据采集频率，这一功能主要通过先进的智能算法与传感器技术的深度融合实现。根据的描述，DeepSeek技术能够根据实际需求动态调整传感器的工作模式。例如，在农业物联网场景中，土壤传感器可以结合作物不同生长阶段的需求，灵活调节数据采集频率。这种动态调整不仅能保证监测数据的时效性，还能有效降低传感器能耗，延长电池寿命。具体来说，作物从萌芽期到成熟期对土壤参数
产品经理学习——AI产品 Li灿灿产品经理学习人工智能
本篇文章，主要是针对目前不同类型AI公司的产品经理职责和AI产品经理的模型进行介绍。AI产品分类AI产品分为软件型和软硬件结合型，软件型的AI产品主要是具备理解、推理和决策能力的AI，如NLP（自然语言处理）系统或者创造类，创作型内容如音乐、艺术和写作等。软硬结合型AI产品一般和传统领域相关，如医疗AI、教育AI和零售AI等。有些公司是纯粹的AI公司，对应的特点是专注于做底层的算法，做芯片技术，纯
字节跳动实习生和校招生内推飞300 python javascript php 业界资讯算法
机器学习算法实习生-平台治理1、2026届硕士及以上学位在读，计算机等相关专业优先；2、有扎实的代码能力，熟悉深度学习/图神经网络/机器学习框架，如Pytorch、Tensorflow、DGL、Pyg、Sklearn等；3、熟悉机器学习/图学习/序列学习算法中的一项或者多项，如图建模、时序信号建模、节点/子图分类、社区挖掘、表征学习、自监督/半监督学习等，有一定深度和广度；4、熟悉相关算法在数据挖
etcd入门指南：分布式事务、分布式锁及核心API详解 zhangj1125 Go etcd 分布式数据库
etcd是一个高可用、分布式的键值存储系统。主要用作分布式系统中的独立协调服务。旨在保存可完全放入内存中的少量数据。Raftetcd基于Raft共识算法，保证了分布式环境下的数据一致性。Raft是一种分布式一致性算法，用于在多个节点之间达成共识，确保分布式系统中的数据在不同节点间一致。LeaderElection（领导者选举）在Raft中，系统的节点分为三种状态：领导者（Leader）、跟随者（F
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他