一杯敬朝阳一杯敬月光

Deep Interest Evolution Network for Click-Through Rate Prediction 阅读笔记

摘要

引言

笔记

动机

在此之前基于神经网络的CTR模型更多的关注特征之间的交叉。在此之前的工作通常将用户行为直接看作用户的兴趣，但是显示的行为很难表征潜在的兴趣、且兴趣还会发生变化。

摘要

点击率（Click-through rate，CTR）预测是广告系统的核心任务之一，其目标是估计用户点击的概率。对于CTR预测模型，需要捕获用户行为数据背后潜在的用户兴趣。此外，考虑到外部环境和内部认知的变化，用户兴趣会随着时间的推移而动态变化。对兴趣建模的CTR预测方法有多种，但大多是将行为的表示直接视为兴趣，缺乏对具体行为背后潜在兴趣的专门建模。此外，很少有研究考虑到兴趣的变化趋势。在本文中，我们提出了一个新的模型，称为深兴趣演化网络（DIEN），用于CTR预测。具体地说，我们设计了兴趣提取层来从历史行为序列中获取目前的兴趣。在这一层，我们引入了一个辅助损失来监督每一步的兴趣提取。由于用户兴趣的多样性，特别是在电商系统中，我们提出了兴趣演化层来捕捉与目标相关的兴趣演化过程。在兴趣演化层，注意机制被用到到序列结构中，在兴趣演化过程中，相关的兴趣的作用得到加强。在公共和工业数据集的实验中，DIEN的表现明显优于最先进的解决方案。值得注意的是，DIEN已经被部署在淘宝的展示广告系统中，CTR提升了20.7%。

引言

点击计费是广告系统中最常见的计费方式之一，广告主需要为用户的每次点击付费。在CPC广告系统中，点击率预测的好坏不仅影响整个系统的最终收益，而且影响用户体验和满意度。CTR预测模型越来越受到学术界和工业界的重视。

在大多数非搜索性的电商场景中，用户不会明确的表达他们的意图。设计模型来捕捉用户的兴趣及其动态变化是提高CTR预测性能的关键。最近，许多CTR模型从传统方法论（Friedman 2001；Rendle 2010）转变为深度CTR模型（Guo et al.2017；Qu et al.2016；Lian et al.2018）。大多数深层CTR模型侧重于捕捉不同fields特征之间的交互，而较少关注用户兴趣的表示。深度兴趣网络（Deep Interest Network，DIN）（Zhou et al.2018c）强调用户兴趣的多样性，它采用基于attentio的模型来捕捉与target item相关的兴趣，来获得自适应兴趣表示。然而，包括DIN在内的大多数兴趣模型都将行为直接视为兴趣。众所周知，潜在兴趣很难通过显性行为得到充分体现。以往的方法忽视了挖掘用户行为背后的真正兴趣。此外，用户兴趣是不断变化的，关注兴趣的动态变化对于兴趣表达是非常重要的。

在此基础上，我们提出了深度兴趣进化网络（DIEN）来提高CTR预测的性能。DIEN有两个关键模块，一个是从显式用户行为中提取潜在的当前兴趣，另一个是对兴趣演化过程进行建模。良好的兴趣表示是兴趣演化模型的基石。在兴趣提取层，DIEN选择GRU（Chung et al.2014）来建模行为之间的依赖关系。在遵循兴趣直接导致后续行为的原则下，提出了一个辅助损失利用下一行为来监督对当前隐藏状态的学习（Following the principle that interest leads to the consecutive behavior directly, we propose auxiliary loss which uses the next behavior to supervise the learning of current hidden state） 。我们把这些有额外监督的隐藏状态称为兴趣状态（We call these hidden states with extra supervision as interest states）。这些额外的监督信息有助于获取更多的语义来表示兴趣，并推动GRU的隐藏状态有效地表示兴趣。此外，用户兴趣的多样性导致了兴趣漂移现象：用户的意图在相邻的访问中可能会有很大的不同，用户的一种行为可能依赖于很久以前的行为。每种兴趣都有自己的发展轨迹。同时，一个用户对不同目标的点击行为受兴趣的不同部分影响。在兴趣演化层，我们建立了相对于目标的兴趣演化轨迹模型。基于兴趣提取层得到的兴趣序列，设计了具有注意更新门（AUGRU）的GRU。AUGRU利用兴趣状态和target item计算关联度，增强了相关兴趣对兴趣演化的影响，削弱了由兴趣漂移引起的不相关兴趣的影响。在更新门引入注意力机制，AUGRU可以引导不同target item的特定兴趣演化过程。DIEN的主要贡献如下：

•我们聚焦电商系统中的兴趣演化现象，提出了一种新的网络结构来模拟兴趣演化过程。兴趣演化模型使得兴趣的表达更具表现力，对CTR的预测更为精确。

•与直接以行为做为兴趣不同，我们专门设计了兴趣抽取层。针对GRU的隐藏状态无法充分的表达兴趣，我们提出了一种辅助损失函数。辅助损失函数使用后续的行为来监督每一步隐藏状态的学习。这使得隐藏状态具有足够的表现力来表示潜在的兴趣。

•我们创造性地设计了兴趣演化层，其中带有注意更新门（AUGRU）增强了相关兴趣对目标的影响，克服了兴趣漂移的影响。兴趣演化层对与目标相关的兴趣演化过程进行了有效建模。

在公共和工业数据集的实验中，DIEN的表现明显优于最先进的解决方案。值得注意的是，DIEN已经应用于商业展示广告系统中，并在各种指标下取得了显著的改进。

深度兴趣演化网络(Deep Interest Evolution Network)

在本节中，我们将详细介绍深度兴趣演化网络（DIEN）。首先，我们回顾作为BaseModel的传统的Deep-CTR模型。然后我们展示DIEN的整体结构。接下来，我们将介绍用于捕获兴趣和建模兴趣演化过程的技术。

BaseModel回顾

分别从特征表示、模型结构和损失函数三个方面介绍了BaseModel。

Feature Representation (特征表示)

在我们的在线展示系统中，我们使用了四类特征：用户画像、用户行为、广告和上下文。值得注意的是，广告也是一个item。本文将广告称为target item。每个类别的特征都有几个特征域（felds），用户画像的字段是性别、年龄等；用户行为的特征域是用户访问的商品id的列表；广告的特征域是广告id、店铺id等；上下文的特征域是设备id、时间等。每个特征域中的特征值可以被编码成一个one-hot vector，例如，用户画像中的女性特征被编码为[0，1]。用户画像、用户行为、广告和上下文的这四类特征的不同特征域的one-hot向量分别进行concat表示成 $\mathbf{x}_p,\mathbf{x}_b,\mathbf{x}_a,\mathbf{x}_c$ 。在CTR的序列模型中，值得注意的是，每个特征域都包含一个行为序(each field contains a list of behaviors)，每个行为对应一个one-hot vector，可以用如下表达方式表示:

$\textbf{x}_b = [\textbf{b}_1;\mathbf{b}_2;...;\mathbf{b}_T] \in \mathbb{R}^{k \times T}, \textbf{b}_t \in \{0, 1\}^K, \ \ \ \ \ \ (1)$

其中， $\mathbf{b}_t$ 被编码成one-hot向量(K维)，代表第t个行为，T代表用户历史性为序的个数，K代表用户可点击的商品的数目。

BaseModel的结构

大多数的深度学习的CTR模型是embedding & MLR结构的，这个结构包括以下几个部分。

Embedding：Embedding是将大规模稀疏特征转化为低维稠密特征的常用操作。在embedding层中，特征的每个字段（field）对应一个嵌入矩阵（embedding matrix），例如访问商品的嵌入矩阵可以用 $E_{goods}=[\mathbf{m}_1;\mathbf{m}_2;\cdots ;\mathbf{m}_K] \in \mathbb{R}^{n_E\times K}$ ，其中 $\mathbf{m}_j \in \mathbb{R}^{n_E}$ 表示维数为的embedding向量。对于行为特征 $\mathbf{b}_t$ ，如果 $\mathbf{b}_t[j_t]=1$ ，则其对应的embedding向量为 $\mathbf{m}_{j_t}$ ，一个用户行为的有序embedding向量列表可以用 $\mathbf{e}_b=[\mathbf{m}_{j_1};\mathbf{m}_{j_2};\cdots ;\mathbf{m}_{j_T}]$ 表示。类似地， $\mathbf{e}_a$ 表示AD类别中特征的embedding向量的concate。

Multilayer Perceptron (MLP)首先将一个类别的embedding向量送入池化层。然后将来自不同类别的所有池化层输出的向量concat起来。最后，将concat后的向量送入后续MLP进行最终预测。

Loss Function

deep-CTR模型中广泛使用的损失函数是负对数似然函数（negative log-likelihood function），它利用target item的标签来监督整体预测

$L_{target} = -\frac{1}{N} \sum_{(\mathbf{x}, y) \in D}^N (ylogp(\mathbf{x}) + (1-y)log(1-p(\mathbf{x}))), \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ (2)$

其中 $\mathbf{x}=[\mathbf{x}_p,\mathbf{x}_a,\mathbf{x}_c,\mathbf{x}_b] \in D$ ，D是规模为N的训练集。 $y \in \{0,1\}$ 表示用户是否点击target item。 $p(\mathbf{x})$ 是网络输出，是用户点击target item的预测概率。

深度兴趣演化网络

与赞助搜索不同的是，在许多电子商务平台上，如在线展示广告中，用户不会明确地表达自己的意图，因此捕捉用户的兴趣及其动态变化对于预测用户点击率具有重要意义。DIEN致力于捕捉用户兴趣，并对兴趣演化过程进行建模。

如图1所示，DIEN由几个部分组成：

首先，通过嵌入层对各类特征进行变换。

接下来，DIEN采取两个步骤来捕获兴趣演化：

兴趣提取层根据行为序列提取兴趣序列；

兴趣演化层模拟与target item相关的兴趣演化过程。

最后将兴趣表达和ad, user profile, context 的embedding向量concat。将级联后的向量送入MLP进行最终预测。

在本节的剩余部分，我们将详细介绍DIEN的两个核心模块。

兴趣抽取层(Interest Extractor Layer)

在电商系统中，用户行为是潜在兴趣的载体，用户采取一种行为后兴趣会发生变化。在兴趣提取层，我们从用户行为序列中提取一系列的兴趣状态。（At the interest extractor layer, we extract a series of interest states from sequential user behaviors）

电商系统中的用户行为是丰富的，即使在很短的时间内（如两周），历史行为序列的长度也是很长的。为了在效率和性能之间取得平衡，我们采用GRU来建模行为之间的依赖关系。GRU的输入是按行为发生时间排序的行为序（the input of GRU is ordered behaviors by their occur time）。GRU克服了RNN的消失梯度问题，且比LSTM（Hochreiter and Schmidhuber 1997）速度快，适用于电商系统。GRU的公式如下：

$\begin{aligned} \mathbf{u}_t &= \sigma(W^{u}\mathbf{i}_t + U^u \mathbf{h}_{t-1} + \mathbf{b}^u), \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ (3)\\ \mathbf{r}_t &= \sigma(W^r \mathbf{i}_t + U^r \mathbf{h}_{t-1} + \mathbf{b}^r), \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ (4)\\ \hat{\mathbf{h}}_t &= tanh(W^h \mathbf{i}_t + \mathbf{r}_t \circ U^h \mathbf{h}_{t-1} + \mathbf{b}^h), \ \ \ \ \ \ \ \ \ (5)\\ \mathbf{h}_t &= (1-\mathbf{u}_t) \circ \mathbf{h}_{t-1} + \mathbf{u}_t \circ \hat{\mathbf{h}}_t, \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ (6)\\ \end{aligned}$

其中 $\sigma$ 是sigmoid激活函数， $\circ$ 是按元素乘法， $W^u, W^r, W^h \in \mathbb{R}^{n_H \times n_I}, U^z, U^r, U^h \in n_H \times n_H$ ，是隐藏层单元数，是输入层单元数， $\mathbf{i}_t$ 是GRU的输入， $\mathbf{i}_t = \mathbf{e}_b[t]$ 代表用户的第t个行为， $\mathbf{h}_t$ 是隐层第t个隐层状态。

然而，隐藏状态 $\mathbf{h}_t$ 只能捕捉行为之间的依赖关系，不能有效地表示兴趣。由于对target item的点击行为是由最后兴趣触发的，因此 $L_{target}$ 中使用的标签只能监督最后的兴趣预测，而不能正确的监督历史状态 $\mathbf{h}_t(t<T)$ 。众所周知，每一步的兴趣状态直接导致后续的行为。因此，我们提出了辅助损失，即利用 $\mathbf{b}_{t + 1}$ 行为来监督兴趣状态 $\mathbf{h}_t$ 的学习。使用真实的下一步行为作为正例，从非点击的item中抽样得到负例。有N对行为序的embedding： $\{\mathbf{e}_b^i, \hat{\mathbf{e}}_b^i \} \in D_B, i \in 1,2, \cdots , N,$ 其中 $\mathbf{e}_b^i \in \mathbb{R}^{T \times n_E}$ 代表点击行为序， $\mathbf{\hat{e}}_b^i \in \mathbb{R}^{T \times n_E}$ 代表负的样本。T是行为序列的数目，是embedding的维度， $\mathbf{e}_b^i[t] \in G$ 表示用户i第t次点击的item的embedding。是整个item的集合， $\hat{\mathbf{e}}_b^i[t] \in G - \mathbf{e}_b^i[t]$ 是从item集合中除去用户i第t次点击的item中采样的。辅助损失的公式如下：

$L_{aux} = -\frac{1}{N}(\sum_{i=1}^N \sum_t log \sigma (\mathbf{h}_t, \mathbf{e}_b^i[t+1]) + log(1-\sigma(\mathbf{h}_t, \mathbf{\hat{e}}_b^i[t+1]))) \ \ \ \ \ \ \ (7)$

其中， $\sigma(\mathbf{x}_1, \mathbf{x}_2) = \frac{1}{1+exp(-[\mathbf{x}_1, \mathbf{x}_2])}$ 是sigmoid激活函数， $\mathbf{h}_t$ 代表GRU的第t个隐藏层状态，CTR模型的全局损失函数为：

$L = L_{target} + \alpha \ast L_{aux} \ \ \ \ \ \ \ \ \ \ \ \ \ (8)$

其中 $\alpha$ 是超参，用来平衡CTR预测和兴趣表达。

在辅助损失的帮助下，每一个隐藏层状态 $\mathbf{h}_t$ 都能够充分的表达用户第t次行为 $\mathbf{i}_t$ 之后的兴趣。将T个兴趣点concat起来组成兴趣序 $[\mathbf{h}_1, \mathbf{h}_2, \cdots, \mathbf{h}_T]$ ，这个序列可以被用作兴趣演化层对兴趣演化过程的建模。

总之，辅助损失的引入有许多优势，1.从兴趣学习的角度，辅助损失帮助GRU的隐层状态更好的学习兴趣的表达；2.从GRU的优化来说，当GRU对长的历史行为序列建模时，辅助损失能够很好的降低梯度传播的难度尤其是面对长序列（应该是指梯度消失）；3.辅助损失为embedding层的学习提供了更多的语义信息，这会帮助我们得到更好的embedding矩阵。

兴趣演化层（Interest Evolving Layer）

由于外部环境和内部认知的共同影响，用户的各种兴趣随时间发生变化。以对于衣服的兴趣为例，随着流行趋势和用户穿衣品味的变化，用户对于衣服的偏好也会变化，用户对于衣服兴趣的变化，直接决定了对候选衣服的点击率预估。兴趣演化的优点如下：

兴趣演化模块可以为最后的兴趣的表示提供更多的相关的历史行为信息；
根据兴趣演化趋势预测target item的点击率是一种较好的方法。

值得注意的是，兴趣在演化过程中表现出两个特征：

兴趣具有多样性，兴趣可以漂移。兴趣漂移对行为的影响是，用户可能在一段时间内对各种书籍产生兴趣，而在另一段时间内则对衣服有兴趣。
尽管兴趣能互相影响，但是每个兴趣都有自己的演化过程，例如衣服和书籍的演化过程几乎是独立的，我们可以只考虑和target item相关的演化过程。

在第一个阶段，在辅助损失的帮助下，我们得到了兴趣序列的表达。考虑到兴趣演化的特点，我们利用了注意力机制的局部激活能力，以及GRU对序列模型的建模能力。在GRU模型引入注意力机制，注意力机制的局部激活使我们对相关兴趣更加敏感，并且削弱兴趣漂移带来的影响。这帮助了我们建模与target item相关的兴趣的演化。

与公式(3-6)类似，我们用 $\mathbf{i}_t^{'}$ 和 $\mathbf{h}_t^{'}$ 表示兴趣演化层的GRU部分的输入和隐藏状态。其中，第二个GRU的输入是兴趣提取层的相应兴趣状态： $\mathbf{i}_t^{'} = \mathbf{h}_t$ 。隐藏状态 $\mathbf{h}_T^{'}$ 代表最后的兴趣状态。

在兴趣演化模型中用到的attention function公式如下：

$a_t = \frac{exp(\mathbf{h}_t W \mathbf{e}_a)}{\sum_{j=1}^T exp(\mathbf{h}_j W \mathbf{e}_a)} \ \ \ \ \ \ \ \ \ \ \ (9)$

其中 $\mathbf{e}_a$ 是ad类别下的特征的embedding向量的concat， $W \in \mathbb{R}^{n_H \times n_A}$ ，是隐藏状态的维度，是广告embedding向量的维度。Attention score能反应广告 $\mathbf{e}_a$ 与输入 $\mathbf{h}_t$ 的关系，越相关则attention score的值越大。

下面我们介绍几种可以将注意力机制和GRU结合起来建模兴趣演化过程的。

attention 作用于 input的GRU（AIGRU）。为了在兴趣演化过程中激活相关兴趣，我们提出带attention input的GRU方法。AIGRU使用attention score来影响兴趣演化层的输入。公式如下：

$\mathbf{i}_t^{'} = \mathbf{h}_t \ast a_t \ \ \ \ \ \ \ \ \ (10)$

其中， $\mathbf{h}_t$ 是兴趣演化层GRU部分的第t个隐藏状态， $\mathbf{i}_t^{'}$ 是兴趣演化层GRU的输入（ $\mathbf{i}_t^{'}$ is the input of the second GRU which is for interest evolving）， $\ast$ 是向量的点积。在AIGRU中，attention score能够降低不相关的兴趣的幅值。理想状态下，不相关的兴趣的幅值可以被降到0，这样我们就可以将与target item相关的兴趣演化趋势建模。然而，AIGRU表现并不好。因为即使输入为0也可以改变隐藏状态，所以就算非常不相关的兴趣也会影响兴趣演化的建模。

Attention based GRU(AGRU)。attention based GRU第一次提出是在问答领域(Xiong, Merity, and Socher 2016)，用注意力机制的embedding信息来修改GRU架构，AGRU能从复杂的qury中有效的提取关键信息。受QA领域用AGRU提取query的关键信息的启发，我们利用AGRU提取兴趣演化过程的相关兴趣。在实现上，AGRU使用attention score替换GRU的update gate，并直接改变隐藏状态。公式如下：

$\mathbf{h}_t^{'} = (1 - a_t) \ast \mathbf{h}_{t-1}^{'} + a_t \ast \mathbf{\hat{h}}_t^{'} \ \ \ \ \ \ \ \ \ (11)$

其中， $\mathbf{h}_t^{'},\mathbf{h}_t^{'}$ 以及 $\hat{\mathbf{h}}_t^{'}$ 是AGRU的隐藏状态。

在兴趣演化的场景下，AGRU用attention score来直接控制隐藏状态的更新。AGRU在兴趣演化的过程中削弱了不相关的兴趣的影响，并且克服了AIGRU的缺陷（The embedding of attention into GRU improves the influence of attention mechanism, and help AGRU overcome the defects of AIGRU）。

GRU with attentional update gate (AUGRU)。尽管AGRU用attention score来直接控制隐藏状态的更新，但是他用标量（attention score）来替代向量（the update gate ），忽略了不同维度的重要性不同。我们提出了带有attentional update gate(AUGRU)的GRU，来将注意力机制与GRU结合：

$\begin{aligned} \mathbf{\hat{u}}_t^{'} &= a_t \ast \mathbf{u}_t^{'} \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ (12) \\ \mathbf{h}_t^{'} &= (1-\mathbf{\hat{u}}_t^{'} ) \circ \mathbf{h}_{t - 1}^{'} + \mathbf{\hat{u}}_t^{'} \circ \mathbf{\hat{h}}_{t }^{'} \ \ \ (13) \end{aligned}$

其中， $\mathbf{u_t}^{'}$ 是AUGRU初始的更新门， $\mathbf{\hat{u}_t}^{'}$ 是为AUGRU设计的attentional update gate， $\mathbf{h}_t^{'}, \mathbf{h}_{t-1}^{'},$ 以及 $\mathbf{\hat{h}}_t$ 是AUGRU的隐藏状态。

在AUGRU中，我们保留了更新门的原始维度信息，它决定了每个维度的重要性（向量上各维度对应的元素）。在区分信息的基础上，利用注意得分对更新门的各个维度进行度量，使得相关性越低的兴趣对隐藏状态的影响越小。AUGRU更有效地避免了兴趣漂移的干扰，推动了相关兴趣的平稳演化。

实验

在本节中，我们将DIEN与公共和工业数据集的最新技术进行比较。此外，我们设计实验分别验证辅助损耗和AUGRU的影响。为了观察兴趣演化的过程，我们展示了兴趣隐藏状态的可视化结果。最后，我们分享了我们用于在线服务的结果和技术。

数据集

我们用公开数据集和工业数据集来验证DIEN的作用，表1给出了相关数据集的统计数据。

公开数据集：Amazon数据集（McAuley et al.2015）由来自Amazon的产品评论和元数据组成。我们使用亚马逊数据集的两个子集：Books和Electronics来验证DIEN的效果。在这些数据集中，我们将评论视为行为，并按时间对一个用户的评论进行排序。假设用户有个行为，我们的目的是使用行为来预测用户是否会写T-th评论中显示的评论（Assuming there are T behaviors of user u, our purpose is to use the T 1 behaviors to predict whether user u will write reviews that shown in T-th review.）。

工业数据集：是由在线展示广告系统的曝光和点击日志构成的。对于训练集，我们以最近49天点击的广告为target item。

每个target item及其相应的行为构成一个实例。以一个target item a为例，我们将a被点击的时间设置为最后一天，该用户在前14天的行为作为历史行为。同样，测试集中的target item是从接下来的1天中选择的，并且行为的构建与训练数据相同。

方法比较

将DIEN与主流的CTR预测方法进行比较。

BaseModel： BaseModel采用与DIEN相同的embedding和MLR网络结构，并使用sum pooling操作来整合行为的embedding。

Wide & Deep: wide & Deep由两个部分组成:deep部分和Base Model相同，wide部分是配有手动设计的特征交叉的线性模型（用特征交叉来增强特征交互）。

PNN: 基于Base Model，PNN使用product layer来捕获域间类别之间（interfield categories）的交互模式。

DIN：DIN使用注意力机制来激活用户的相关的兴趣，并且依据不同的ads来自适应的调整用户兴趣表达向量（adaptive representation vector）。

Two layer GRU Attention：类似于（Parsana et al.2018），我们使用两层GRU来对行为序列建模，并用一个attention layer来激活相关行为。

公开数据集的结果

图1展示了DIEN的结构，包括了GRU、AUGRU以及辅助损失和其他的一些常规模块。每个实验都进行了5次，表2给出了实验上的平均AUC。

从表2中可以看出，wide & deep 很大程度上依赖于手工设计的特征的质量，并且表现不是很好，而特征之间的自动交互（PNN）可以提高BaseModel的性能。同时，以捕获兴趣为目标的模型能显著提高AUC：DIN激活了与ad相关的兴趣，两层GRU注意进一步激活了兴趣序列中的相关兴趣，这些探索都获得了正向收益。DIEN不仅能更有效地捕捉到兴趣序列，而且还能对与target item相关的兴趣演化过程进行建模。兴趣演化模型有助于DIEN获得更好的兴趣表示，准确捕捉兴趣动态，极大地提高了性能。

工业数据集的结果

我们进一步在真实的展示广告的环境下做实验。工业数据集的样本规模是公开数据集的千倍，并且行为也更加丰富。如表3所示，Wide & Deep和PNN获得了优于base model的表现。与Amazon数据集单一的品类不同的是，工业数据集包括了各类商品，基于这些特点。，基于注意力的方法能够极大的提高性能，例如DIN。DIEN能捕获与target item相关的兴趣演化进程，并获得很好的表现。

Application Study

本小节，我们分别展示AUGRU和辅助损失的作用。

Effect of GRU with attentional update gate (AUGRU)：表4展示了不同方法在兴趣演化的表现。相对于Base Model，two layer GRU有不错的表现，但是缺乏对兴趣演化的建模极大的限制了其性能。AIGRU的基本思想是对演化过程进行建模，虽然它相对于前两种在性能上取得了优势，但在兴趣演化过程将注意力机制和演化分割开来，造成了演化过程中信息的丢失。AGRU进一步尝试融合注意力和演化，正如我们之前提出的，它在GRU中的注意力不能充分利用更新门的资源（维度问题，标量代替向量）。通过分析AIGRU和AGRU，AUGRU的性能优势是显而易见的。它将注意机制和序列学习有机地融合在一起，有效地捕捉了相关兴趣的演化过程。

Effect of auxiliary loss ：在AUGRU模型的基础上，下面进一步探讨辅助损耗的影响。在公共数据集中，辅助损失中使用的负例是从没有响应评论的item集合中随机采样的。对于工业数据集，我们将曝光未点击的作为负例。

如图2所示，全局损失和辅助损失 $L_{aux}$ 保持相同的下降趋势，这意味着CTR预测的全局损失和兴趣表达的辅助损失都起到了作用。

在表4中，我们发现辅助损失对两个公共数据集都有很大的改善，辅助损失在公共数据集中的好的表现反映了监督信息对兴趣序列学习的重要性。此外，对GRU的每一步的监督也有助于模型获得更具表达能力的embedding表示。对于表3所示的在线数据集的结果，带有辅助损失的模型进一步提高了性能。但是，我们可以看到，这种改进并不像公共数据集中那样明显。这种差异来自几个方面。首先，对于工业数据集，它有大量的实例来学习embedding layer，这使得它从辅助损失中获得的收益较少。第二，不同于amazon数据集中所有item均来自一个类别，工业数据集中的行为是来自我们平台中所有场景和类别的点击商品。我们的目标是在一个场景中预测广告的点击率。辅助损失的监管信息可能与target item不一致，因此，相比于公共数据集，辅助损失对工业数据集的影响可能较小，而AUGRU的影响则被放大。

Visualization of Interest Evolution：AUGRU中隐藏态的动态变化可以反映出兴趣的演化过程。在本节中，我们将这些隐藏状态可视化，以探讨不同target item对兴趣演化的影响。选择的历史行为依次来自Computer Speakers, Headphones, Vehicle GPS, SD & SDHC Cards, Micro SD Cards, External Hard Drives, Headphones, Cases等类别。利用主成分分析（PCA）将AUGRU中的隐态投影到二维空间（Wold、Esbensen和Geladi 1987）。投影的隐藏状态按顺序链接。由不同target item激活的隐藏状态的移动路径如图3（a）所示。None标记的黄色曲线表示等式（12）中使用的注意力得分，这些注意力得分相同，即兴趣的演变不受target item的影响。蓝色曲线显示隐层状态由来自类别屏幕保护器的一个商品激活，这与所有历史行为的相关性都较小，因此蓝色曲线与黄色曲线的路径类似。红色曲线显示隐藏状态由 Cases类别中的一个商品激活，target item与最后一个行为有很强的相关性，这移动了一个较长的步骤（图中幅值较大），如图3（a）所示。

Online Serving & A/B testing

2018-06-07至2018-07-12在淘宝展示广告系统进行在线A/B测试。如表5所示，与Base model相比，DIEN将CTR提高了20.7%，eCPM提高了17.1%。此外，DIEN的PPC下降了3.0%。现在，DIEN已经部署在网上，并服务于主要流量，这为业务收入的大幅增长做出了贡献。

值得注意的是，DIEN的在线服务对商业系统来说是一个巨大的挑战。在线系统在我们的展示广告系统中拥有极高的流量，在流量峰值时，该系统每秒服务超过100万用户。为了保持低延迟和高吞吐量，我们部署了几种重要的技术来提高服务性能：

i）元素并行GRU和内核融合(element parallel GRU & kernel fusion)（Wang、Lin和yi2010），我们融合尽可能多的独立内核。此外，GRU隐态的每个元素都可以并行计算。

ii）批处理(Batching)：为了利用GPU的优势，来自不同用户的相邻请求被合并到一个批处理中。

iii）火箭发射模型压缩（Model compressing with Rocket Launching）（Zhou et al.2018b）：我们使用（Zhou et al.2018b）中提出的方法来训练一个轻网络(light network)，该轻网络尺寸较小，但性能接近更深更复杂的网络。例如，通过火箭发射，GRU隐态维数可以从108压缩到32。在这些技术的帮助下，DIEN服务的延迟可以从38.2ms减少到6.6ms，并且每个worker的QPS（每秒查询）容量可以提高到360。

结论

本文提出了一种新的deep network结构，即深度兴趣演化网络（DIEN）来模拟兴趣演化过程。DIEN极大地提高了在线广告系统中CTR预测的性能。具体来说，我们设计了兴趣提取层来捕获兴趣序列，利用辅助损失对兴趣状态进行更多的监控。在此基础上，我们提出兴趣演化层，其中DIEN使用AUGRU、来模拟与target item相关的兴趣演化过程。在AUGRU的帮助下，DIEN克服了兴趣漂移带来的困扰。兴趣演化模型有助于我们有效地捕捉兴趣，进一步提高CTR预测的性能。在未来的研究中，我们将尝试建立一个更具个性化的兴趣预测模型。

你可能感兴趣的:(深度学习,推荐系统,paper,推荐系统,paper,深度学习,读书笔记)

清华大学《DeepSeek赋能家庭教育》深度解析：AI如何重塑现代家庭教育模式硅基打工人 AI 人工智能经验分享大数据开源语言模型
引言：家庭教育的困境与AI的破局在数字化与智能化浪潮下，家庭教育面临多重挑战：家长教育能力不足、教育资源分配不均、亲子沟通效率低下、个性化需求难以满足等。清华大学发布的《DeepSeek赋能家庭教育》系列报告（共56页）提出了一种基于人工智能的解决方案，通过深度学习平台DeepSeek，为家庭教育注入科技动能。本文将从技术原理、核心功能、应用场景、伦理安全及未来展望等多维度展开分析。一、DeepS
Spring深度学习 — 关于 Spring 搬运Gong Spring spring
前言作为一名Java程序猿，相信对Spring都不陌生，那么我们经常使用的Spring的发展史大家都了解过吗？它是如何来的？又是如何一步一步成长到了现在这种不可替代的重要地位？下面将对Spring进行一个整体认知和学习，对后面的深度学习起到铺垫作用。本文意在对知识点的温顾，如文中有写的不对的地方，还望不吝指教。一、Spring的发展史相信经历过不使用框架开发Web项目的70后、80后都会高如此感触
【解锁机器学习：探寻数学基石】游戏乐趣机器学习人工智能
机器学习中的数学基础探秘在当今数字化时代，机器学习无疑是最具影响力和发展潜力的技术领域之一。从图像识别到自然语言处理，从智能推荐系统到自动驾驶，机器学习的应用无处不在，深刻地改变着我们的生活和工作方式。然而，在这看似神奇的机器学习背后，数学作为其坚实的理论基础，起着不可或缺的关键作用。毫不夸张地说，数学是打开机器学习大门的钥匙，是理解和掌握机器学习算法与模型的核心所在。想象一下，机器学习就像是一座
Python--读取mat文件一头大学牲程序--编程记录 python 开发语言深度学习机器学习
最近在进行学习深度学习过程中，遇到了以MATLAB的.mat格式存储的数据，需要用python读取出来处理，于是就找到了以下比较方便的三种python读取mat文件的方法：使用hdf5库来读取mat文件1.使用scipy.io来读取1.5知识小插曲2.使用hdf5来读取3.使用mat73来读取1.使用scipy.io来读取-如果你的matlab的版本比较旧，保存的.mat格式为‘-v7.3’以前的
AI笔记——语音识别 Yuki-^_^ 人工智能 AI 人工智能笔记语音识别
摘要：语音识别（AutomaticSpeechRecognition,ASR）是人工智能领域的一项重要技术，它将人类的语音信号转换成文字。随着科技的发展，语音识别已经成为现代生活和工作中不可或缺的一部分。本文旨在介绍语音识别的基本原理、关键技术、应用场景以及未来发展趋势。一、历史与发展语音识别技术的历史可以追溯到20世纪50年代，那时的技术基于规则和模板。随着计算能力的提升和深度学习方法的出现，语
Manus（一种AI代理或自动化工具）与DeepSeek（一种强大的语言模型或AI能力）结合使用任务自动化和智能决策 zzlyx99 人工智能自动化语言模型
一、Manus与DeepSeek差异十分好奇DeepSeek和Manus究竟谁更厉害些，DeepSeek是知识型大脑，Manus则是全能型执行者。即DeepSeek专注于语言处理、知识整合与专业文本生成。其核心优势在于海量参数支持的深度学习和知识推理能力，例如撰写论文、润色法律合同、解答专业问题等。Manus则更强调从规划到交付的闭环能力。它通过工具链调用（如浏览器、代码编辑器）自主执行复杂任务，
深度学习处理时间序列（2） yyc_audio 深度学习笔记深度学习人工智能
在数据中寻找周期性在多个时间尺度上的周期性，是时间序列数据非常重要且常见的属性。无论是天气、商场停车位使用率、网站流量、杂货店销售额，还是健身追踪器记录的步数，你都会看到每日周期性和年度周期性（人类生成的数据通常还有每周的周期性）。探索数据时，一定要注意寻找这些模式。（让人想到波，想到傅里叶变换）对于这个数据集，如果你想根据前几个月的数据来预测下个月的平均温度，那么问题很简单，因为数据具有可靠的年
机器视觉|手势识别：基于YOLOv5的手部检测与MediaPipe的关键点估计 RockLiu@805 机器视觉 YOLO
手势识别：基于YOLOv5的手部检测与MediaPipe的关键点估计在实时计算机视觉应用中，手部检测与关键点估计是实现手势识别的重要基础。本文将介绍一种基于深度学习的手势识别技术方案，通过结合YOLOv5物体检测网络和MediaPipe关键点检测框架，实现实时的手部定位与关键点提取。技术背景gesturerecognition作为计算机视觉领域的重要研究方向，在HCI（人机交互）、遥控行为分析、虚
基于深度学习的个性化新闻推荐系统设计与实现计算机毕设 sj52abcd 深度学习课程设计人工智能毕业设计
博主介绍：✌专注于VUE,小程序，安卓，Java,python,物联网专业，有17年开发经验，长年从事毕业指导，项目实战✌选取一个适合的毕业设计题目很重要。✌关注✌私信我✌具体的问题，我会尽力帮助你。研究的背景:随着互联网技术的发展和普及,人们越来越依赖互联网获取信息。然而,随着信息量的不断增加,用户在查找新闻时面临着信息过载的问题。为了解决这个问题,个性化新闻推荐系统被广泛应用。个性化新闻推荐系
Python 在人工智能领域的实际6大案例 Solomon_肖哥弹架构人工智能机器学习 python
Python作为一种功能强大且易于学习的编程语言，在人工智能（AI）领域得到了广泛的应用。从机器学习到深度学习，从自然语言处理到计算机视觉，Python提供了丰富的库和框架，使得开发者能够快速实现各种AI应用。本文将通过多个实际案例，展示Python在人工智能领域的强大功能和应用前景。二、案例一：手写数字识别（MNIST）1.背景介绍手写数字识别是机器学习领域的经典入门项目，MNIST数据集包含了
深入探究YOLO系列的骨干网路编码实践 YOLO 深度学习计算机视觉
深入探究YOLO系列的骨干网路YOLO系列是目标检测领域中非常知名的算法。其通过将整个图像作为输入，并且直接在图像上通过一个单独的神经网络输出每个检测框的类别预测和边界框信息。为了更好地理解YOLO系列，我们需要先了解它所使用的骨干网路。骨干网络是深度学习模型中的核心部分，负责提取图像的特征。如今常用的骨干网络有VGG、ResNet和MobileNet等。YOLO系列算法采用的是Darknet骨干
《Python深度学习》第四讲：计算机视觉中的深度学习 earthzhang2021 2025讲书课专栏 python 深度学习计算机视觉 1024程序员节 numpy 算法人工智能
计算机视觉是深度学习中最酷的应用之一，它让计算机能够像人类一样“看”和理解图像。想象一下，计算机可以自动识别照片中的物体、人脸，甚至可以读懂交通标志。这一切听起来是不是很神奇？其实，这一切都离不开深度学习中的卷积神经网络（CNN）。今天，我们就来深入了解一下CNN是如何工作的。5.1卷积神经网络简介先来看下卷积神经网络（CNN）是什么。CNN是一种专门用于处理图像数据的神经网络。它的灵感来源于人类
基于人工智能的智能视频内容分析系统小彭律师 python
基于人工智能的智能视频内容分析系统系统功能1.视频数据预处理降噪与滤波：去除视频画面中的噪点和干扰画质增强：调整亮度、对比度和色彩平衡关键帧提取：减少数据量，提取关键信息2.目标识别检测基于深度学习模型（YOLO、FasterR-CNN等）识别多种目标类型（人、车辆、物品等）适应不同光照、角度和遮挡情况输出目标位置、类别和置信度3.行为分析研判基于时序模型（LSTM、3D-CNN等）分析目标动作规
FastDVDnet：基于深度学习的视频去噪框架陆可鹃Joey
FastDVDnet：基于深度学习的视频去噪框架项目地址:https://gitcode.com/gh_mirrors/fa/fastdvdnet项目介绍FastDVDnet是一个高效、开源的深度学习模型，专注于视频去噪。该项目由MatteoTassano开发并维护，旨在提供一种快速且有效的解决方案，以消除视频中的噪声，同时保持图像细节和自然纹理。它利用了时间域的连续性和深层神经网络的力量，确保在
手撕multi-head self attention 代码心若成风、自然语言处理语言模型 transformer
在深度学习和自然语言处理领域，多头自注意力（Multi-HeadSelf-Attention）机制是Transformer模型中的核心组件之一。它允许模型在处理序列数据时，能够同时关注序列中的不同位置，从而捕获到丰富的上下文信息。下面，我们将详细解析多头自注意力机制的实现代码。一、概述多头自注意力机制的核心思想是将输入序列进行多次线性变换，然后分别计算自注意力得分，最后将所有头的输出进行拼接，并通
深度学习 Deep Learning 第2章线性代数 odoo中国 AI编程人工智能深度学习线性代数人工智能
深度学习第2章线性代数线性代数是深度学习的语言。张量操作是神经网络计算的基石，矩阵乘法是前向传播的核心，范数约束模型复杂度，而生成空间理论揭示模型表达能力的本质。本章介绍线性代数的基本内容，为进一步学习深度学习做准备。主要内容2.1标量、向量、矩阵和张量标量：单个数字，用斜体表示，通常赋予小写字母变量名。向量：数字数组，按顺序排列，用粗体小写字母表示，元素通过下标访问。矩阵：二维数字数组，用粗体大
MATLAB算法实战应用案例精讲-【深度学习】归一化林聪木 matlab 算法深度学习
目录为什么要做特征归一化/标准化？常用featurescaling方法计算方式上对比分析featurescaling需要还是不需要什么时候需要featurescaling？什么时候不需要FeatureScaling？归一化基础知识点1.什么是归一化2.为什么要归一化3.为什么归一化能提高求解最优解的速度4.归一化有哪些类型5.不同归一化的使用条件6.归一化和标准化的联系与区别层归一化综述提出背景概
必看！一文读懂知识蒸馏技术小天才学习机打游戏人工智能知识图谱神经网络 langchain windows
导读最近，DeepSeek的爆火让大家对人工智能领域的技术发展又有了新的关注。而知识蒸馏作为深度学习中一项重要的技术，也在背后默默地发挥着作用，今天就来给大家详细介绍一下知识蒸馏及其相关原理。1.知识蒸馏是什么在深度学习领域，大型模型（如DeepSeek）通常具有强大的性能，但它们的计算量和参数量都非常庞大，这使得它们难以在资源受限的设备（如移动设备或嵌入式设备）上部署。例如，GPT-3在570G
从零开始大模型开发与微调：PyTorch 2.0深度学习环境搭建 AI智能涌现深度研究 DeepSeek R1 &大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
从零开始大模型开发与微调：PyTorch2.0深度学习环境搭建作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习在各个领域的广泛应用，大模型开发与微调成为了当前研究的热点。大模型能够学习到丰富的知识，并在各个下游任务上取得优异的性能。然而，大模型开发与微调需要强大的计算资源和专业的知识背景，这对于许多初学者和研究
AI大模型学习路线及相关资源推荐 python游乐园学习资源学习 Python AI AI编程人工智能
哈喽，大家好！本文为大家带来AI大模型学习路线及相关资源推荐，这对于学习掌握AI大模型很有帮助呦，希望大家多多点赞收藏～感谢～～1AI大模型的基础信息1.1什么是AI大模型AI大模型，即人工智能大型模型，是一种基于深度学习技术，具有海量参数、强大算力支持、能够处理和生成复杂数据的人工智能模型。1.2AI大模型的主要特点规模庞大：AI大模型通常包含海量的参数。例如，谷歌的BERT模型在最初发布时就有
【深度学习与大模型基础】第3章-张量 lynn-66 深度学习与大模型基础深度学习人工智能
大家好！今天我们来聊聊张量（Tensor）。别被这个词吓到，其实它没那么复杂。什么是张量？简单来说，张量就是一个多维数组。你可以把它看作是一个装数据的容器，数据的维度可以是一维、二维，甚至更高。标量（0维张量）：就是一个单独的数字，比如3。向量（1维张量）：一串数字，比如[1,2,3]。矩阵（2维张量）：一个表格，比如[[1,2],[3,4]]。更高维张量：比如[[[1,2],[3,4]],[[5
OpenCV 深度学习模块 cv2.dnn 与其他深度学习框架的优缺点对比及适用场景白.夜深度学习 opencv
OpenCV提供了一个深度学习模块cv2.dnn，让开发者能够在计算机视觉项目中轻松加载和推理深度学习模型。相比于TensorFlow、PyTorch等其他深度学习框架，cv2.dnn有其独特的优点与缺点，适用于不同的应用场景。在这篇文章中，我们将详细分析cv2.dnn的优缺点，并讨论它的适用场景。一、cv2.dnn的优点1.简单易用cv2.dnn提供了一个相对简单且易于使用的接口，适合已经在使用
深度学习中的 blob 格式：与普通 image 的区别及转换原因白.夜深度学习人工智能
在深度学习模型推理过程中，我们经常会用到cv2.dnn.blobFromImage函数将普通图像转换为blob格式。那么，blob格式到底是什么？它和普通image有什么区别？为什么在模型推理中需要这种转换？本文将用通俗的语言为你解答这些问题。1.什么是blob格式？blob是OpenCV中用于深度学习模型输入的一种特殊数据格式，全称为BinaryLargeObject。它本质上是一个多维数组（通
小狐狸AI数字人源码独立SAAS部署全开源+搭建环境教程 kaui52066 kaui52066精品源码人工智能 uni-app 前端小程序 php 小狐狸AI数字人数字人源码
一.系统介绍小狐狸AI数字人分身系统源码独立部署支持PC端、小程序端、H5端，一键克隆真人形象+声音核心功能亮点：1:1真人级克隆技术声音克隆：上传3分钟音频，AI深度学习声纹特征，复刻语气、情感、方言形象克隆：通过照片/视频建模，生成动态3D数字人，表情自然，动作流畅智能口型同步引擎AI算法精准匹配唇形与语音，实现口型同步0门槛SAAS化操作无需专业设备，网页端一键生成数字人视频海量模板库：电商
【PyTorch】PyTorch 中改变张量形状的几种方法 shengchao0920 pytorch 人工智能 python
PyTorch中改变张量形状的几种方法在深度学习领域，PyTorch是一个广泛使用的框架，它提供了丰富的API来处理张量（tensor）。在模型开发过程中，我们经常需要改变张量的形状以满足特定的需求。本文将介绍在PyTorch中改变张量形状的几种方法，并给出推荐的使用场景。比如：我们想合并一个张量的最后两个维度。一、方法1.使用reshape方法reshape方法可以改变张量的形状而不改变其数据。
OpenAI 团队组织架构和研发技术栈 AI天才研究院 ChatGPT 人工智能
OpenAI是一家致力于推动人工智能技术发展的公司，成立于2015年。其目标是确保人工智能技术造福全人类。为了实现这一目标，OpenAI采用了多种先进的技术和组织架构来推动其研发工作。目录OpenAI组织架构和研发技术栈概述1OpenAI团队的世界顶尖科学家IlyaSutskever：Ilya是OpenAI的联合创始人之一，也是深度学习领域的先驱。他在神经网络和深度学习方面的研究具有重要影响，曾与
深度学习-服务器训练SparseDrive过程记录 weixin_40826634 深度学习服务器人工智能
1、cuda安装1.1卸载安装失败的cuda参考：https://blog.csdn.net/weixin_40826634/article/details/127493809注意：因为/usr/local/cuda-xx.x/bin/下没有卸载脚本，很可能是apt安装的，所以通过执行下面的命令删除：apt-get--purgeremove"cuda*"apt-getautoremove然后执行f
算法在各领域的广泛应用：100 个实例全解析软件职业规划 AI&模型算法
一、互联网与信息技术领域搜索引擎算法：如谷歌的PageRank算法，用于根据网页的重要性和相关性对搜索结果进行排序，帮助用户快速找到所需信息。推荐系统算法：例如亚马逊和Netflix使用的协同过滤算法。根据用户的历史行为（购买、观看记录等）和其他相似用户的偏好，为用户推荐可能感兴趣的产品或内容。社交网络分析算法：用于分析社交网络中的用户关系，如Facebook通过算法发现用户的好友推荐、社区划分等
模型量化 (Model Quantization) 算法 (Model Quantization Algorithms) （initial）大模型科普算法人工智能量化
1模型量化的必要性：降低模型大小、加速推理、减少资源消耗随着深度学习模型的日益复杂和庞大，其在资源受限的设备（如移动端、嵌入式设备）上的部署面临着巨大的挑战。即使在服务器端，部署大型模型也会带来高昂的计算成本和能源消耗。模型量化(ModelQuantization)作为一种关键的模型压缩和加速技术应运而生。其核心思想是将模型中的浮点数（通常是FP32或FP16）表示的权重和激活值转换为低精度整数（
《探秘人工智能与鸿蒙系统集成开发的硬件基石》程序猿阿伟人工智能 harmonyos 华为
在科技飞速发展的当下，人工智能与鸿蒙系统的集成开发开辟了创新的前沿领域。这一融合不仅代表着技术的演进，更预示着智能设备生态的全新变革。而在这场技术盛宴的背后，坚实的硬件配置是确保开发顺利进行的关键，它就像一座大厦的基石，决定了上层建筑的高度和稳定性。处理器：运算核心的澎湃动力处理器作为硬件系统的核心，在人工智能与鸿蒙系统集成开发中扮演着至关重要的角色。对于模型训练任务，尤其是深度学习模型，其复杂的
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s