白白白白白8

Sequence to Sequence – Video to Text 论文翻译

序列到序列–视频到文本

摘要

现实世界的视频往往具有复杂的动态性；生成开放域视频描述的方法应该对时间结构敏感，并且允许可变长度的输入（帧序列）和输出（字序列）。为了解决这个问题，我们提出了一种新的端到端序列对序列模型来生成视频字幕。为此，我们开发了递归神经网络，特别是LSTM，它在图像字幕生成方面显示了最先进的性能。我们的LSTM模型基于视频句子对进行训练，并学习将视频帧序列与单词序列相关联，以便在视频片段中生成事件描述。我们的模型自然能够学习框架序列的时间结构以及生成句子的序列模型，即。E语言模型。我们评估了我们模型的几个变体，这些变体在一组标准的YouTube视频和两个电影描述数据集（M-VAD和MPII-MD）上利用了不同的视觉特征。

1. 介绍

用自然语言文本描述视觉内容最近受到越来越多的关注，尤其是用一句话描述图像[8,5,16,18,20,23,29,40]。尽管视频描述在人机交互、视频索引和为盲人描述电影等方面有着重要的应用，但到目前为止，人们对它的关注较少。当图像描述处理可变长度的单词输出序列时，视频描述还必须处理可变长度的帧输入序列。视频描述的相关方法已通过整体视频表示[29,28,11]、帧集合[39]或固定数量输入帧的子采样[43]解决了可变长度输入问题。相比之下，本文提出了一种端到端训练的序列到序列模型，该模型能够学习输入序列中的任意时间结构。我们的模型是顺序到顺序的，从某种意义上说，它是按顺序读取帧并按顺序输出单词。在开放域视频中生成描述的问题很困难，这不仅是因为对象、场景、动作及其属性的多样性，还因为很难确定突出的内容并在上下文中适当地描述事件。为了了解什么是值得描述的，我们的模型从视频剪辑和用自然语言描述所描述事件的成对句子中学习。我们使用长短时记忆（LSTM）网络[12]，这是一种递归神经网络（RNN），在语音识别[10]和机器翻译[34]等类似的序列到序列任务中取得了巨大成功。由于视频和语言固有的顺序性，LSTM非常适合生成视频中事件的描述。

这项工作的主要贡献是提出了一个新的模型，S2VT，它学习直接将一个帧序列映射到一个单词序列。图1描述了我们的模型。堆叠LSTM首先对帧逐个编码，将应用于每个输入帧的强度值的卷积神经网络（CNN）的输出作为输入。一旦所有帧都被读取，模型就会逐字生成一个句子。帧的编码、解码和单词表示是从并行语料库中联合学习的。为了对视频中通常显示的活动的时间方面进行建模，我们还计算了连续帧对之间的光流[2]。流量图像也通过CNN传递，并作为输入提供给LSTM。流CNN模型已被证明有利于活动识别[31,8]。

图1。我们的S2VT方法使用序列到序列模型执行视频描述。它包含一个堆叠的LSTM，该LSTM首先读取帧序列，然后生成一个单词序列。模型的输入视觉序列由RGB和/或光流CNN输出组成。

据我们所知，这是第一种使用一般序列到序列模型的视频描述方法。这使得我们的模型能够（a）处理可变数量的输入帧，（b）学习并使用视频的时间结构，（c）学习语言模型以生成自然的语法句子。我们的模型是联合学习和端到端学习的，结合了强度和视觉流输入，不需要明确的注意模型。我们证明了S2VT在三个不同的数据集上实现了最先进的性能，一个标准的Y ouTube语料库（MSVD）[3]和M-V AD[37]和MPII电影描述[28]数据集。我们的实现（基于Caffe[15]深度学习框架）可在github上获得。https://github. com/vsubhashini/caffe/tree/recurrent/examples/s2vt。

2. 相关工作

关于视频字幕的早期工作考虑使用元数据[1]标记视频，并将字幕和视频聚类[14,25,42]用于检索任务。以前的几种生成句子描述的方法[11,19,36]使用了两个阶段的管道，首先识别语义内容（主语、动词、宾语），然后基于模板生成句子。这通常涉及训练单个分类器来识别候选对象、动作和场景。然后，他们使用概率图形模型将视觉自信与语言模型相结合，以估计视频中最可能的内容（主语、动词、宾语、场景），然后使用这些内容生成句子。虽然这通过分离内容生成和表面实现简化了问题，但它需要选择一组相关的对象和动作来识别。此外，基于模板的句子生成方法不足以模拟人类描述中使用的丰富语言。使用哪些属性以及如何有效地组合它们以生成良好的描述。相反，我们的方法通过学习直接将视频映射到完整的人类提供的句子，同时学习以视觉特征为条件的语言模型，避免了内容识别和句子生成的分离。

我们的模型借鉴了[8,40]中的图像字幕生成模型。他们的第一步是通过从CNN中提取特征来生成图像的固定长度矢量表示。下一步学习将该向量解码为组成图像描述的单词序列。虽然原则上可以使用任何RNN来解码序列，但由此产生的长期依赖性可能会导致性能低下。为了缓解这个问题，LSTM模型被用作序列解码器，因为它们更适合于学习远程依赖关系。此外，由于我们使用可变长度视频作为输入，我们使用LSTM作为序列到序列转换器，遵循[34]的语言翻译模型。

在[39]中，LSTM用于通过汇集单个帧的表示来生成视频描述。他们的技术为视频中的帧提取CNN特征，然后平均汇集结果，得到代表整个视频的单一特征向量。然后，他们使用LSTM作为序列解码器，根据该向量生成描述。这种方法的一个主要缺点是，这种表示完全忽略了视频帧的顺序，并且无法利用任何时间信息。[8]中的方法还使用LSTM生成视频描述；然而，他们采用了一种两步方法，即使用CRF获得活动、对象、工具和位置的语义元组，然后使用LSTM将该元组翻译成句子。此外，[8]中的模型适用于烹饪视频的有限领域，而我们的模型旨在生成“野外”视频的描述。

与我们的工作同时，[43]中的方法也从两个方面解决了[39]的局限性。首先，他们采用了一个包含时空运动特征的三维convnet模型。为了获得这些特征，他们假设视频具有固定的音量（宽度、高度、时间）。它们在非重叠长方体上提取密集轨迹特征（HoG、HoF、MBH）[41]，并将这些特征连接起来形成输入。3D convnet在视频数据集上进行预训练，用于动作识别。其次，它们包括一种注意机制，该机制学习根据先前的单词输入对框架特征进行非均匀加权，而不是像[39]中那样对所有框架的特征进行均匀加权。3D convnet单独提供有限的性能改进，但结合注意力模型，它显著提高了性能。我们提出了一种更简单的使用时间信息的方法，即使用LSTM将视频帧序列编码为足以生成句子描述的分布式向量表示。因此，我们的直接序列到序列模型不需要明确的注意机制。

最近的另一个项目[33]使用LSTM从先前帧的编码预测未来帧序列。他们的模型更类似于[34]中的语言翻译模型，该模型使用一个LSTM将输入文本编码为固定表示，另一个LSTM将其解码为不同的语言。相反，我们使用一个单一的LSTM，它根据提供的输入学习编码和解码。这允许LSTM在编码和解码之间共享权重。

其他相关工作包括[24,8]，它使用LSTM进行活动分类，预测每个图像/流帧表示的活动类别。相反，我们的模型在编码光流图像的完整序列后生成字幕。具体来说，我们的最终模型是基于原始图像和光流图像训练的序列到序列模型的集合。

3. 方法

我们提出了一种用于视频描述的序列到序列模型，其中输入是视频帧序列（x1，…，xn），输出是字序列（y1，…，ym）。当然，输入和输出都是可变的，可能不同的长度。在我们的例子中，通常有比单词多得多的框架。在我们的模型中，我们估计给定输入序列（x1，…，xn）i的输出序列（y1，…，ym）的条件概率。Ep（y1，…，ym | x1，…，xn）（1）这个问题类似于自然语言之间的机器翻译，其中输入语言中的一系列单词被翻译成输出语言中的一系列单词。最近，[6,34]展示了如何使用LSTM递归神经网络（RNN）有效地解决这个序列到序列的问题。我们将这种模式扩展到由视频帧序列组成的输入，大大简化了先前基于RNN的视频描述方法。下面，我们将详细描述我们的模型和体系结构，以及视频和句子的输入和输出表示。

3.1.用于序列建模的LSTMs

处理可变长度输入和输出的主要思想是首先对帧的输入序列进行编码，一次一个，使用潜在向量表示来表示视频，然后从该表示解码为句子，一次一个单词。

让我们首先回顾一下长-短期记忆RNN（LSTM），最初在[12]中提出。根据[44]中提出的LSTM单元，对于时间步长t处的InputXt，LSTM计算隐藏/控制状态hT和存储单元状态cT，这是单元在时间t之前观察到的所有内容的编码：

其中σ是S形非线性，φ是双曲正切非线性， $\Phi$ 表示元素与门值的乘积，用Wijand Biasesbj表示的权重矩阵是经过训练的参数。

因此，在编码阶段，给定输入序列X（x1，…，xn），LSTM计算隐藏状态序列（h1，…，hn）。在解码过程中，如果输入序列xasp（Y | X）是p（y1，…，ym | x1，…，xn）=m，它定义了输出序列Y（y1，…，ym）上的分布

（3）其中p（yt | hn t）的分布由asoftmax给出，分布在词汇表中的所有单词上（见等式5）。请注意，HN是从HN t获得的−1，yt−1基于方程式2中的递归。

3.2.序列到序列视频到文本

我们的方法S2VT如图2所示。虽然[6,34]首先使用一个LSTM将输入序列编码为固定长度向量，然后使用另一个LSTM将向量映射为输出序列，但我们在编码和解码阶段都依赖于单个LSTM。这允许在编码和解码阶段之间共享参数。

图2。我们提出了一个由两个LSTM组成的堆栈，用于学习帧序列的表示，以便将其解码为描述视频中事件的句子。顶部的LSTM层（红色）为视觉特征输入建模。第二个LSTM层（绿色）为给定文本输入和视频序列的隐藏表示的语言建模。我们使用表示句子的开头，使用表示句子的结尾标记。在时间步长没有输入时，作为零。

我们的模型使用两个LSTM的堆栈，每个LSTM有1000个隐藏单元。图2显示了随时间展开的LSTM堆栈。当两个LSTM堆叠在一起时，如在我们的示例中，第一个LSTM层（红色）的隐藏表示（ht）作为第二个LSTM（绿色）的输入（xt）提供。在我们的体系结构中，顶层LSTM用于对可视帧序列进行建模，下一层用于对输出字序列进行建模。

训练和推理 在前几个时间步骤中，顶部LSTM层（图2中红色）接收一系列帧并对其进行编码，而第二个LSTM层接收隐藏表示（ht）并将其与空填充输入字（零）连接，然后进行编码。当LSTM编码时，此阶段没有丢失。在视频剪辑中的所有帧都用尽后，第二个LSTM层将收到entence（）标记的开头，这将提示它开始将当前隐藏的表示解码为一系列单词。当在解码阶段进行训练时，该模型在给定可视帧序列的隐藏表示和它所看到的先前单词的情况下，最大化预测输出句子的对数似然。对于参数为θ且输出序列为（y1，…，ym）的模型，其公式为：

使用随机梯度下降在整个训练数据集上优化对数似然。仅当 LSTM 正在学习解码时才计算损失。由于这种损失会及时传播，LSTM 学习生成输入序列的适当隐藏状态表示 (hn)。第二个 LSTM 层的输出 (zt) 用于获取发出的单词 (y)。我们应用一个 softmax 函数来得到 words y'
在词汇表V中：

我们注意到，在解码阶段，第一个LSTM层的可视帧表示只是一个零向量，用作填充输入。我们需要一个明确的句子结束标记（）来结束每个句子，因为这使模型能够定义不同长度序列的分布。在测试时，在每个解码步骤中，我们选择softmax之后具有最大概率的字YT（来自等式5），直到它发出令牌。

3.3.视频和文本表示

RGB帧。与之前基于LSTM的图像字幕工作[8,40]和视频到文本方法[39,43]类似，我们应用卷积神经网络（CNN）输入图像，并将顶层的输出作为输入提供给LSTM单元。在这项工作中，我们报告了在Caffe参考网（AlexNet的变体）和16层VGG模型上使用fc7层输出（应用ReLU非线性后）的结果[32]。我们使用在1上预训练的CNN。ImageNet数据集[30]的2M图像ILSVRC-2012对象分类子集，并通过Caffe ModelZoo公开提供。1将每个输入视频帧缩放为256x256，并将其裁剪为随机227x227区域。然后由CNN处理。我们移除了原始的最后一个完全连通的分类层，并学习了一个新的线性嵌入特征到500维空间。低维特征构成第一个LSTM层的输入（xt）。嵌入的权重在训练期间与LSTM层一起学习。

光流。除了来自原始图像（RGB）帧的CNN输出外，我们还将光流测量作为输入序列加入到我们的体系结构中。其他文献[24,8]表明，将光流信息纳入LSTM可以改进活动分类。由于我们的许多描述都是以活动为中心的，因此我们也将探讨视频描述的这个选项。我们遵循[8,9]中的方法，首先提取经典的变分光流特征[2]。然后，我们以类似于[9]的方式创建流图像（如图1所示），方法是将XandyFlow值集中在128左右，然后乘以标量，使流值介于0和255之间。我们还计算了流量大小，并将其作为第三个通道添加到流量图像中。然后，我们使用在UCF101视频数据集上训练的权重初始化CNN[9]，将光流图像分类为101个活动类。CNN的fc6层激活嵌入在一个较低的500维空间中，然后作为LSTM的输入。对于流输入，LSTM体系结构的其余部分保持不变。

在我们的组合模型中，我们使用浅层融合技术来集成流和RGB特征。在解码阶段的每个时间步，该模型提出一组候选词。然后，我们使用flow和RGB网络的分数加权和重新计算这些假设，其中我们只需要重新计算每个新单词p（yt=y'）的分数，如下所示：

在验证集上调整超参数α。

表1。语料库统计。所有数据集中的标记数量是可比较的，但是MSVD对每个视频有多个描述，而电影语料库（MPII-MD、MV-AD）有大量的剪辑，每个剪辑有一个描述。因此，所有3个数据集中的视频句子对的数量是可比的。

文本输入。单词的目标输出序列使用一个热向量编码（N中的1编码，其中N是词汇表的大小）表示。与帧特征处理类似，我们通过对输入数据应用线性变换并通过反向传播学习其参数，将单词嵌入到较低的500维空间。嵌入的字向量与第一个LSTM层的输出（ht）相连，形成第二个LSTM层的输入（图2中标记为绿色）。当考虑LSTM的输出时，我们在完整词汇表上应用softmax，如等式5所示。

4.实验设置

本节描述了对我们方法的评估。我们首先描述使用的数据集，然后是评估协议，然后是我们模型的细节。

4.1.视频描述数据集

我们报告了三个视频描述语料库的结果，即Microsoft视频描述语料库（MSVD）[3]、MPII电影描述语料库（MPII-MD）[28]和蒙特利尔视频注释数据集（M-V AD）[37]。它们共同构成了最大的平行语料库，具有开放域视频和自然语言描述。虽然MSVD是基于带有简短人类注释句子的网络剪辑，但MPII-MD和M-V广告包含好莱坞电影片段，其描述来源于脚本数据和音频描述。每个语料库的统计数据如表1所示。

4.1.1个Microsoft视频描述语料库（MSVD）

Microsoft视频描述语料库[3]是在Mechanical Turk上收集的Y outube剪辑的集合，要求工人挑选描述单个活动的短剪辑。然后，这些视频被用来从注释者那里引出单句描述。原始语料库有多种语言的描述，在这项工作中，我们只使用英语描述。我们通过将所有文本转换成小写、标记句子和删除标点符号，对文本进行最小程度的预处理。我们使用[39]提供的数据拆分。此外，在每个视频中，我们按照[39]所做的每十帧采样一次。

412 MPII电影描述数据集（MPII-MD）

MPII-MD[28]包含从94部好莱坞电影中提取的约68000个视频剪辑。每个剪辑都附带一个句子描述，该描述来源于电影脚本和音频描述（AD）数据。广告或描述性视频服务（DVS）是添加到电影中的附加音频曲目，用于为视力受损者描述电影中明确的视觉元素。尽管电影片段是手动与描述对齐的，但由于视觉和文本内容的高度多样性，以及大多数片段只有一个引用语句，因此数据非常具有挑战性。我们使用作者提供的训练/验证/测试分割，每五帧提取一次（视频比MSVD短，平均94帧）。

4.1.3蒙特利尔视频注释数据集（M-V AD）

M-V AD电影描述语料库[37]是另一个最近收集的92部电影中约49000个短片的集合。它类似于MPII-MD，但只包含自动对齐的AD数据。我们使用与MPIIMD相同的设置。

4.2.评估指标

使用METEOR[7]指标对模型进行定量评估，该指标最初用于评估机器翻译结果。流星分数是基于给定假设句和一组候选参考句之间的对齐来计算的。METEOR使用WordNet同义词比较精确的标记匹配、词干标记、释义匹配以及语义相似的匹配。METEOR的这一语义特征使其区别于BLEU[26]、ROUGE-L[21]或苹果酒[38]等其他类型。苹果酒的作者[38]评估了这四种图像描述方法。他们表明METEOR总是比BLEU和ROUGE更好，并且在参考文献数量较少时优于苹果酒（当参考文献数量较多时，苹果酒与METEOR相当）。由于MPII-MD和M-V AD只有一个参考，我们决定在所有评估中使用METEOR。我们使用METEOR版本1。52使用Microsoft COCO评估服务器发布的代码3[4]。

4.3.我们模型的实验细节

我们所有的模型都以直接送入CNN的原始RGB帧或预处理的光流图像（如第3.3节所述）作为输入。在我们所有的模型中，我们在训练期间将LSTM展开到固定的80个时间步。我们发现这是内存消耗和向LSTM提供多帧（视频）能力之间的一个很好的折衷。此设置允许我们在一个小批量中安装多个视频（AlexNet最多8个，flow模型最多3个）。我们注意到94%的Y ouTube训练视频满足这一限制（帧采样率为1/10）。对于少于80个时间步（单词和帧）的视频，我们用零填充剩余的输入。对于较长的视频，我们会截断帧数，以确保帧数和字数之和在此限制范围内。在测试时，我们不限制视频的长度，我们的模型视图显示所有采样帧。我们使用预先培训过的AlexNet和VGG CNN。对于VGG，我们修复fc7下的所有层，以减少内存消耗并允许更快的训练。

我们将序列到序列LSTM架构与从AlexNet和16层VGG网络中提取的RGB图像特征进行比较。为了将VGG网络的特征与以前的模型进行比较，我们使用16层VGG的fc7层输出作为基线，包括[39]中提出的平均池模型的性能（第3行，表2）。S2VT下的表2中引用了我们的所有序列到序列模型。我们的第一个变体RGB（AlexNet）是在RGB帧上使用AlexNet的端到端模型。流量（AlexNet）是指通过对光流图像进行训练而获得的模型。RGB（VGG）是指在RGB图像帧上具有16层VGG模型的模型。我们还对随机重新排序的输入帧（第10行）进行了实验，以验证S2VT学习时间序列信息。我们的最终模型是RGB（VGG）和Flow（AlexNet）的集合，其中每个时间步的预测是单个模型预测的加权平均值。

4.4.相关方法

我们将我们的序列对序列模型与[36]中的因子图模型（FGM）、[39]中的平均池模型和[43]中的软注意模型进行比较。[36]中提出的FGM采用两步方法，首先获取主语、动词、宾语和场景（S、V、O、P）元素的置信度，并使用因子图将其与语言模型中的置信度相结合，以推断视频中最可能的（S、V、O、P）元组。然后根据模板生成一个句子。

[39]中提出的Mean Poolmodel将AlexNet fc7激活集中在所有帧上，以创建视频的固定长度矢量表示。然后，它使用LSTM将向量解码为一个单词序列。此外，模型ia在Flickr30k[13]和MSCOCO[22]图像字幕数据集上进行了预训练，并在MSVD上进行了微调，以显著提高性能。我们将我们的模型与他们的基本平均池模型以及通过微调Flickr30k和COCO数据集获得的最佳模型进行比较。我们还与[43]中报告的平均池模型的GoogleNet[35]变体进行了比较。[43]中的时间注意力模型是一组固定视频帧上的加权注意力与来自谷歌网的输入特征以及一个基于活动分类模型中的HoG、HoF和MBH特征训练的3D convnet的组合。

5.结果与讨论

本节讨论了表2、4和5所示的评估结果。

5.1.MSVD数据集

表2显示MSVD数据集上的结果。第1行到第7行显示了相关的方法，其余的是S2VT方法的变体。我们的基本S2VT AlexNet RGB视频帧模型（表2中的第9行）达到27。与[39]中的基本平均池模型（第2行，26.9%）以及VGG平均池模型（第3行，27.7%）相比，METEOR和改进率为9%；表明S2VT是一种更有效的方法。当使用随机排序的帧（表2中的第10行）对模型进行训练时，分数要低得多，这清楚地表明模型受益于利用时间结构。

表2。MSVD数据集（流星百分比越高越好）。

我们的S2VT模型使用流图像（第8行）仅达到24。3%METEOR，但改进了我们VGG模型的性能，从29。2%（第11行）至29行。8%（第12行），合并时。流模型性能低下的一个原因可能是，即使对于相同的活动，光流特征也会随环境e而显著变化。 “熊猫吃”与“人吃”。

此外，该模型只接收到与Y ouTube视频中描述的活动类型相关的非常微弱的信号。一些常用的动词如“play”是多义词，可以指演奏乐器（“弹吉他”）或运动（“打高尔夫球”）。但是，将RGB与Flow集成可以提高描述的质量。

我们使用RGB和Flow的集合的性能略优于[43]中提出的最佳模型，即GoogleNet 3D-CNN的时间注意（第7行）。改进的适度规模可能是由于更强大的3D-CNN功能（与GoogleNet单独的差异（第6行）表明）。因此，时间注意模型[43]和S2VT之间最接近的比较可以说是带有VGG的S2VT（第12行）和它们的仅谷歌网模型（第6行）。

图3显示了我们的模型在MSVD的Y outube样本剪辑上生成的描述。为了比较生成中的原创性，我们计算了预测语句与训练集中预测语句的Levenshtein距离。来自表3的MSVD语料库，42。9%的预测与某个训练句子相同，另外38%的预测与某个训练句子相同。通过在训练语料库中插入、删除或替换某个句子中的一个单词，可以获得3%。我们注意到，生成的许多描述都是相关的。

5.2.电影描述数据集

对于更具挑战性的MPII-MD和M-V AD数据集，我们使用单一的最佳模型，即在RGB帧和VGG上训练的S2VT。为了避免对电影语料库的过度拟合，我们采用了drop-out，这在这些数据集上被证明是有益的[27]。我们发现最好在两个LSTM层的输入和输出端使用dropout。此外，我们使用ADAM[17]进行优化，第一动量系数为0。9和第二个动量系数0。999对于表4中报告的MPII-MD，我们将SMT方法从[28]改进为[5]。6%对7%。1%的流星和超过平均水平的池[39]为0。4%. 我们的性能类似于视觉标签[27]，这是一种基于LSTM的同期方法，它不使用时间编码，而是使用更多样化的视觉特征，即对象检测器以及活动和场景分类器。

在 M-V AD 上，我们实现了 6.7% 的 METEOR，这显着优于时间注意力模型 [43] (4.3%)4 和平均池化 (6.1%)。在这个数据集上，我们的表现也优于 Visual-Labels [27] (6.3%)。

我们报告了结合了M-V AD和MPII-MD的TheLSMDChallenge5的结果。S2VT达到7。使用评估服务器的公共测试集上有0%METEOR
在图4中，我们展示了模型在M-V AD数据集中的一些样本剪辑上生成的描述。作者的网页上提供了更多示例视频剪辑、生成的句子和数据6。

表4。MPII-MD数据集（流星百分比越高越好）

表5。M-V AD数据集（流星百分比越高越好）。

6.结论

本文提出了一种新的视频描述方法。与相关工作相反，我们使用序列到序列模型构造描述，其中帧首先按顺序读取，然后按顺序生成单词。这使我们能够处理可变长度的输入和输出，同时对时间结构进行建模。我们的模型在MSVD数据集上实现了最先进的性能，并且在两个大型且具有挑战性的电影描述数据集上优于相关工作。尽管其概念简单，但我们的模型显著受益于额外的数据，这表明它具有较高的模型容量，并且能够在具有挑战性的电影描述数据集的输入和输出序列中学习复杂的时间结构。

你可能感兴趣的:(深度学习,video,caption,深度学习,ieee论文)

推荐系统的未来发展方向：大模型的主流化 AI天才研究院计算大数据AI人工智能 AI大模型企业级应用开发实战 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
《推荐系统的未来发展方向：大模型的主流化》关键词：推荐系统，大模型，深度学习，人工智能，未来趋势摘要：本文深入探讨了推荐系统的发展历程及其在当前人工智能时代的重要性。重点分析了深度学习在大模型中的应用，探讨了大模型的主流化趋势及其面临的挑战。通过案例研究，展示了大模型在实际推荐系统中的应用效果，并对未来的发展方向进行了展望。目录大纲推荐系统的概述1.1推荐系统的发展历程1.2推荐系统的基本架构深度
自动驾驶中的虚实迁移学习:降低对真实世界数据的依赖 AI架构设计之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
自动驾驶,迁移学习,虚实环境,数据效率,深度学习,强化学习1.背景介绍自动驾驶技术作为人工智能领域的重要应用之一，其发展离不开海量真实世界驾驶数据。然而，收集和标注真实世界驾驶数据成本高昂，且存在安全隐患。因此，如何降低对真实世界数据的依赖，提高自动驾驶系统的训练效率和安全性，成为一个亟待解决的关键问题。虚实迁移学习(Virtual-to-RealTransferLearning)作为一种新兴的机
详细介绍 NVIDIA GeForce RTX 系列，各显卡配置参数（长期更新 - 2024.12） JiaWen技术圈人工智能深度学习机器学习 gpu算力 AIGC 人工智能图形渲染
NVIDIAGeForceRTX系列是NVIDIA面向消费级市场的高性能GPU产品线，注重提供高性能的图形处理能力和游戏特性。主要面向游戏玩家和普通用户，同时也被广泛用于深度学习推理和训练等计算密集型任务。主要GPU产品有：50Series、40Series、30Series、20Series、10Series。其主要参数如下：NVIDIAGeForceRTX50Series规格架构：Blackw
自动检测和机器审核系统实现 ╰つ゛木槿 java easyui javascript python java 自然语言处理
目录一、自动检测和机器审核实现步骤1.文本预处理步骤细节：2.关键词检测步骤细节：3.情感分析与情境理解步骤细节：4.机器学习模型训练步骤细节：5.深度学习模型步骤细节：6.多模态审查步骤细节：7.用户行为分析与违规预测步骤细节：总结二、常用的分词工具1.jieba2.THULAC3.HanLP4.SnowNLP5.LAC（LexicalAnalysisofChinese）6.PyLDAvis（结
VideoFileClip 获取视频报错、 Tomorrow'sThinker 音视频 moviepy
报错内容：OSError:MoviePyerror:failedtoreadthedurationoffile/mnt/data/test/monitor/videos/new_video/1652063723941.mkv.Herearethefileinfosreturnedbyffmpeg:ffmpegversion4.2.2-statichttps://johnvansickle.com/
Python 如何使用 Bert 进行中文情感分析程序员徐师兄 Python 入门专栏 python bert 开发语言情感分析
前言在自然语言处理（NLP）领域，情感分析是一个非常常见且重要的应用。情感分析通常用于识别文本中的情感，例如判断一条微博或评论是正面、负面还是中性。在过去的几年中，随着深度学习的发展，BERT（BidirectionalEncoderRepresentationsfromTransformers）模型迅速成为了处理自然语言的强大工具。BERT是一种基于Transformer架构的预训练模型，它能够
PyTorch深度学习实战（43）——手写文本识别盼小辉丶深度学习 pytorch 人工智能
PyTorch深度学习实战（43）——手写文本识别0.前言1.手写文本识别1.1基本概念1.2输入和输出格式1.3CTC损失值2.模型与数据集分析2.1数据集分析2.2模型分析3.实现手写文本识别模型小结系列链接0.前言手写文本识别，也称为手写文本的光学字符识别(OpticalCharacterRecognition,OCR)，是计算机视觉和自然语言处理中的一项具有挑战性的任务。与印刷文本不同，手
算法中的时间复杂度和空间复杂度 CM莫问人工智能算法常见概念算法人工智能 python 时间复杂度空间复杂度
一、背景随着人工智能的纵深发展，我们会发现现在做算法很多时候都是通过掉包来解决问题了。Torch或者Tensorflow之类的深度学习库大大减少了算法工程师的工作量，而且在张量运算、反向传播等环节，这些深度学习库的模块设计也尽最大可能地降低了计算的时间和空间复杂度，从而不需要我们额外进行过多的干预。如果不是科班读计算机相关专业的，相信不少朋友第一次听说时间复杂度和空间复杂度的概念是在找工作刷lee
freebsd12 安装gnome3图形界面 sayang_shao FreeBSD FreeBSD12 gnome3 freebsd12
1、准备工作注：由于我是在实体机上做的所以没有提供截图。也可以访问官方文档进行安装：https://www.freebsd.org/doc/en_US.ISO8859-1/books/handbook/x11-wm.html已经安装完Freebsd12系统可以联网2、开始安装pkg更新#pkgupdate安装显卡驱动（本机为intel）#pkginstallxf86-video-intel开启li
ARM Cortex-M3与Cortex-M4权威指南胡妃意
ARMCortex-M3与Cortex-M4权威指南【下载地址】ARMCortex-M3与Cortex-M4权威指南ARMCortex-M3与Cortex-M4权威指南欢迎阅读《ARMCortex-M3与Cortex-M4权威指南（第3版）》，这是一本针对嵌入式系统开发者量身打造的深度学习手册项目地址:https://gitcode.com/Open-source-documentation-tu
【数据挖掘实战】房价预测机器学习司猫白数据挖掘人工智能 python 机器学习
本次对kaggle中的入门级数据集，房价回归数据集进行数据挖掘，预测房屋价格。本人主页：机器学习司猫白机器学习专栏：机器学习实战PyTorch入门专栏：PyTorch入门深度学习实战：深度学习ok，话不多说，我们进入正题吧概述本次竞赛有79个解释变量（几乎）描述了爱荷华州艾姆斯住宅的各个方面，需要预测每套住宅的最终价格。数据集描述本次数据集已经上传，大家可以自行下载尝试文件说明train.csv-
GPT-4对话模型在客服中的应用与前景：开启智能客服新时代 Echo_Wish 前沿技术人工智能 python 人工智能 gpt
GPT-4对话模型在客服中的应用与前景：开启智能客服新时代随着人工智能技术的迅猛发展，基于深度学习的对话模型在各个领域中得到了广泛应用。其中，GPT-4对话模型在客服系统中的应用尤为引人注目。本文将探讨GPT-4在客服中的应用与未来发展前景，并结合具体代码示例进行说明。一、GPT-4对话模型概述GPT-4（GenerativePre-trainedTransformer4）是OpenAI开发的一种
模型压缩与优化技术——神经架构搜索（Neural Architecture Search, NAS） DuHz 轻量化模型机器学习计算机视觉人工智能神经网络深度学习数据挖掘语音识别
模型压缩与优化技术中的神经架构搜索（NeuralArchitectureSearch,NAS）技术1.引言在深度学习领域，神经网络的架构设计对模型的性能至关重要。传统的手动设计网络架构的过程费时费力，且通常依赖于经验和直觉。为了提升效率与效果，神经架构搜索（NeuralArchitectureSearch,NAS）作为一种自动化的方法，能够通过算法寻找和优化最佳的神经网络架构。NAS可以在图像识别
python把列表插入列表 Zoert
python相关学习资料：https://edu.51cto.com/video/4102.htmlhttps://edu.51cto.com/video/1158.htmlhttps://edu.51cto.com/video/4645.htmlPython中列表的嵌套与操作在Python编程中，列表（List）是一种非常重要的数据结构，它不仅可以存储数据，还可以进行各种操作，如插入、删除、排序
QAT与PTQ模型量化方法的区别 old_power 计算机视觉模型量化深度学习计算机视觉
QAT（QuantizationAwareTraining）和PTQ（PostTrainingQuantization）是两种常见的模型量化方法，用于减少深度学习模型的计算和存储开销，同时尽量保持模型的性能。1.QAT（QuantizationAwareTraining）定义：QAT是在模型训练过程中引入量化操作，使模型在训练时就能感知到量化带来的影响，从而更好地适应量化后的精度损失。流程：在训练
毕设分享深度学习街道行人流量计数系统 fawubio_A 毕业设计 python 毕设
文章目录0前言1项目运行效果2设计概要2原理介绍2.1目标检测概况什么是目标检测？发展阶段2.2行人检测行人检测简介行人检测技术难点行人检测实现效果4最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要
Keras、TensorFlow、PyTorch框架对比及服务器配置揭秘小深ai硬件分享人工智能深度学习服务器
深度学习框架：开启智能大门的钥匙在数字化浪潮中，深度学习如明星照亮众多领域。从智能安防的人脸识别，到医疗图像分析、电商商品推荐、智能语音助手等，其身影无处不在，改变着生活与工作方式。在深度学习领域，Keras、TensorFlow和PyTorch是主流框架，能助开发者构建强大智能模型。但这些框架要充分发挥作用，离不开合适的服务器配置，就像魔法师需要魔法棒和魔力，下面我们就来看看这些具体的框架吧:框
深度学习｜表示学习｜卷积神经网络｜局部链接是什么？｜06 漂亮_大男孩表示学习深度学习学习 cnn
如是我闻：局部连接（LocalConnectivity），是卷积神经网络（CNN）中的一个关键特性。什么是局部连接（LocalConnectivity）？局部连接指的是：在卷积操作中，每个神经元（或输出单元）只与输入数据的一个局部区域相关联，而不是与整个输入数据相连。换句话说：全连接网络（FullyConnectedLayer）中，每个神经元会与上一层所有的神经元相连。卷积网络（Convoluti
帮助应用打造场景化语音服务 harmonyos
课程简介本课程是【HarmonyOS主题课：HarmonyOSSDK开放能力】的第18课。本课程专注于助力应用构建场景化语音服务。深入介绍SpeechKit及其重要组件，如朗读控件可将文本转化为自然流畅的语音输出，为用户提供有声阅读体验；AI字幕控件（AICaption）能精准识别语音并生成实时字幕，在视频播放、直播等场景大显身手。详细阐述其广泛的适用场景，包括教育学习辅助、无障碍信息传播等领域。
深度学习中交叉熵函数的导数:(极简) 洪小帅深度学习人工智能神经网络 python
文章目录前言一.交叉熵函数的导数二.Z,y为有n条数据的矩阵前言另一个博主有更详细的推导https://blog.csdn.net/chaipp0607/article/details/101946040一.交叉熵函数的导数softmax:令一条数据最后的输出为[z1,z2,z3,z4,…,z10],这里令输出层的神经元数量为10pi=ezi∑j=110ezjpi=\frac{e^{z_i}}{\
【Python】已完美解决：ERROR: Could not find a version that satisfies the requirement re 屿小夏 python 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
下载马斯克Grok-1模型的实战代码 herosunly 大模型 grok-1 下载模型实战代码
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了下载马斯克Grok-1模型的实战代码，希望能对学习大模型的同学们有所帮助
吴恩达深度学习笔记（七）——机器学习策略子非鱼icon 深度学习自学笔记深度学习机器学习人工智能神经网络吴恩达
一、正交化通俗的理解就是：要能够诊断出系统性能瓶颈在哪里，以有策略刚好解决这个问题。一个“按钮”只负责解决一件事情。二、单一数字评估指标准确率（precision）：在分类器中标记为猫的例子中，有多少是真的猫召回率（recall）：对于所有的真猫图片，你的分类器正确识别了多少。但如果有两个评估指标，就很难去选择一个更好的分类器，如下图所示。所以有一个结合这两个指标的标准方法，也即F1分数，定义如下
深度学习中的通道(Channel)概念详解小·恐·龙大模型深度学习人工智能
1.通道的基本概念通道(Channel)是深度学习中的一个重要概念，它在不同场景下有不同的具体含义。理解通道概念对于理解深度学习模型的结构和工作原理至关重要。2.大语言模型中的通道2.1全连接层的通道概念2.1.1基本结构输入：[batch_size,input_features]权重：[input_features,output_features]输出：[batch_size,output_fe
大语言模型原理与工程实践：网页数据 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理与工程实践：网页数据1.背景介绍在当今信息爆炸的时代，网页数据成为了大数据的重要来源之一。网页数据不仅包含了丰富的文本信息，还包括了图像、视频、音频等多媒体内容。大语言模型（LargeLanguageModels,LLMs）作为自然语言处理（NLP）领域的前沿技术，能够从海量的网页数据中提取有价值的信息，进行文本生成、情感分析、问答系统等多种任务。大语言模型的成功离不开深度学习技术的
大语言模型原理与工程实践：案例介绍 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理与工程实践：案例介绍作者：禅与计算机程序设计艺术近年来，随着深度学习技术的快速发展，大语言模型（LargeLanguageModel，LLM）在自然语言处理领域取得了突破性进展，展现出强大的文本生成、理解和推理能力。从智能对话到机器翻译，从代码生成到诗歌创作，LLM正在深刻地改变着我们与信息交互的方式，并为人工智能应用开拓了更广阔的空间。1.背景介绍1.1大语言模型的兴起大语言模型的
AI驱动电商搜索导购：技术创新与应用 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
文章标题《AI驱动电商搜索导购：技术创新与应用》关键词：人工智能，电商搜索导购，机器学习，深度学习，推荐系统，自然语言处理，个性化搜索，图像识别，应用案例，未来展望。摘要：本文旨在探讨人工智能（AI）在电商搜索导购领域的应用，分析其技术创新和实际应用案例，探讨AI驱动电商搜索导购的未来发展趋势。文章首先介绍了AI在电商搜索导购中的角色和优势，然后深入探讨了AI基础理论和搜索导购技术原理。接着，文章
机器学习笔记 - 机器学习/深度学习实战案例合集坐望云起深度学习从入门到精通机器学习深度学习人工智能案例应用神经网络
一、简述如何学习机器学习/深度学习，理论和实践都很重要，理论上的内容需要看课程、读教材。但是实践需要自己动手，实践之后自然会对理论有更深入的理解。怎么实践？借用欧阳修《卖油翁》的话”无他，但手熟尔“。就是多看多写多跑。下面创建这个github的目的是为了存放一些图像处理/计算机视觉/机器学习/深度学习的示例代码集合，不定期会添加新的示例，可供参考。GitHub-bashendixie/ml_too
vue项目中导入视频涔溪 vue vue
vue项目中引入视频插件一、安装插件vue-video-playernpminstallvue-video-player-s二、在main.js里倒入并使用importVideoPlayerfrom'vue-video-player'import'vue-video-player/src/custom-theme.css'import'video.js/dist/video-js.css'Vue.
Transformer架构原理详解：多头注意力（MultiHead Attention） AI大模型应用之禅 AI大模型与大数据 java python javascript kotlin golang 架构人工智能
Transformer,多头注意力,Multi-HeadAttention,机器翻译,自然语言处理,深度学习1.背景介绍近年来，深度学习在自然语言处理（NLP）领域取得了显著进展。传统的循环神经网络（RNN）在处理长序列数据时存在效率低下和梯度消失等问题。为了解决这些问题，谷歌于2017年提出了Transformer架构，并将其应用于机器翻译任务，取得了突破性的成果。Transformer的核心创
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默