learner_ctr

IntentGC：融合异构信息用于推荐的可伸缩图卷积框架

论文地址：https://arxiv.org/pdf/1907.12377.pdf

论文题目：IntentGC: a Scalable Graph Convolution Framework Fusing Heterogeneous Information for Recommendation

简介：这是阿里提出了一种利用多种辅助节点（brand品牌、shop商户、queryword搜索词）来生成多种邻域节点，从而训练user item的向量，达到推荐的目录，具体的重点描述可以参考：brand品牌、shop商户、queryword搜索词这些辅助信息如果利用图卷积来进行推荐

网络嵌入的显著进步已导致是推荐行业最先进的算法。但是，user-item交互数据的稀疏性（即明确的偏好）仍然是预测用户行为的一大挑战。虽然在利用一些辅助信息（例如，用户之间的社会关系）来解决该问题方面已经进行了研究，现有丰富的异构辅助关系仍然没有被充分利用。此外，以前的工作依赖于线性组合的正则化器，并且需要进行参数调整

在这项工作中，我们收集了丰富的用户行为和商品信息，并提出一个名为IntentGC（内容图网络）的新颖框架，以利用显式用户偏好和图卷积网络的异构关系。除了能够建模异质性之外，IntentGC还可以在一个非线性的感知网络上，自动了解不同关系的重要性。为了将IntentGC应用于Webscale应用程序，我们设计了一个更快的图卷积模型，可以避免不必要的特征之间的交互，并将其命名为IntentNet。在阿里巴巴上对两个大规模的真实数据集进行的实验和在线A / B测试证明了我们方法的优越性先进的算法。

1引言

随着在线信息的不断增长，推荐系统已成为各种网站（例如，亚马逊，Youtube，阿里巴巴）上有效的关键解决方案，可帮助用户发现有趣的产品或内容。由于近年来深度学习和网络嵌入的成功，这些推荐系统的功能通常基于以下想法：通过神经学习用户的喜好、item的语义低维表示，可以通过寻找Item的最相似的几个item来进行推荐。

在可以从网站上获得不同信息，用户与项目的交互（点击等）是用来表明用户喜好的最常见、最有效的数据。许多算法通过利用这些显式行为来预测用户的首选商品[12，21]。但是，主要的缺点是这些明确的偏好非常稀疏，这严重限制了推荐模型的能力。另一方面，那里通常是丰富的辅助关系，暗示用户的偏好和item的语义，可以帮助克服稀疏性问题。一些研究工作已经探索了这种辅助关系并证明了它们的有效性[6，7，20]。仅举几例，王等 [6]提出了一种保留user-user社交关系，user-item交互关系的跨域解决方案。 [20]中的作者，利用只用item的同构图，采用DeepWalk方法来保留项目共现（在同一会话中单击）。这些辅助关系广泛存在，可用于改善推荐执行

但是，我们发现所有以前的作品都一种信息，也就是同构图，而忽略了图中的许多其他异构关系。我们提供了一个说明性的例子，但是，我们发现所有以前的作品都只利用了一种用户辅助信息的类型，或者item的一种属性（参见图1），而忽略了图中的许多其他异构关系。我们提供说明在图2的电子商务网站上的示例。我们可以看到，用户除了在item上有明确的交互外，还有丰富的辅助信息，例如用户提交的查询词，访问过的商店，首选品牌和属性。这些辅助关系在捕获更多语义和相关性方面可能很有用。例如，查询词包含用户需求的内容信息，该信息有效地链接具有相似兴趣的用户以及查找内容相似的商品。同样，品牌意味着相似的时尚品味，将具有相似的时尚品味的用户链接起来，并为内容相似性提供补充信息。但是，系统中没有充分考虑这些异构的辅助关系。在这项工作中，我们关注的是研究统一捕获明确的偏好以及用户和项目的所有异构辅助关系的框架

explicit Preference 显式偏好

Auxiliary RelationsShip 辅助关系

为此，我们扩展了图卷积网络（GCN）实现目标。 GCN的核心思想是概括图结构数据上的卷积神经网络[11，13]，其中介绍了内容传播、高水平的表现力，并在结点分类任务上取得了巨大的成功。最近，Pinterest的研究人员发现项目图采用了GraphSage（最新的GCN模型）推荐相关项目[22]。但是，他们的问题和解决方案与我们的工作本质上有所不同，原因是：

1）他们的模型只考虑商品信息，而忽略了用户和辅助对象。

2）为了扩大规模，GraphSage需要收集到item的很多clustered minigraphs以重复使用嵌入向量。但是，很难找到这样的既包含user又包含item的clustered minigraphs上面提到的稀疏问题。 minigraph采样算法很可能以很大的子图结尾（或甚至整个图）。因此，GraphSage的想法在我们场景中不适合，我们场景中包括大型分布式 user-item 图。

3）他们的方法是针对同构网络提出的，而在这项工作中研究的用户项目图是异构的。

我们的工作。在这项工作中，我们为大规模推荐提出了一个新颖的基于GCN的框架，称为IntentGC，该框架通过图形卷积捕获了明确的用户偏好和辅助信息的异构关系。有IntentGC的三个创新点：

充分利用辅助信息：我们捕获了大量异构关系以提高推荐的效果。为了促进建模并提高鲁棒性，我们将一阶接近度的辅助关系转换为二阶接近度的更鲁棒的加权关系。例如，如果user1提交查询词“ Spiderman”，则我们认为user1和“ Spiderman”（一阶接近度）之间存在联系。如果user1和user2都提交查询词“ Spiderman”，“ Ironman”，“雷神”，我们认为user1之间存在更牢固的关系和user2（二阶接近度），因为他们可能都是漫威的影迷。使用不同类型的辅助对象，我们可以生成二阶接近度的异构关系。在训练中，IntentGC自动确定不同类型辅助信息的权重关系。我们发现这些异类关系在实践中是有用的并且彼此互补，并且可以大大提高性能。

考虑下时间的业务特征，我们通常都是以user、item、query这些为key，提取很多个特征，然后复杂的可能会做很多处理，不复杂的就直接concat放在第一层，这可能不太好，因为权重是直接把所有特征进行互相交叉到第二层

更快的图卷积：为消除在大型分布式图上需要用 clustered mini-graphs 的限制，我们提出了名为IntentNet的新型卷积网络比GraphSage更快、更有效。 IntentNet采用了更快的图卷积机制的关键思想是：IntentNet通过将图卷积的功能，分为两个组件来避免不必要的特征交互：一个带有vector-wise的卷积组件来聚合邻域信息、一个MLP组件来表达节点特征。受益于这种机制，我们部署了一个分布式架构，用于简单的mini-batch训练（采样节点）。
异构网络中的双重图卷积：为了保持用户和项目的异构性，我们设计了双重图网络表示学习的卷积模型。首先，我们利用两个独立的IntentNet，它们分别在用户节点和项目节点上运行。非线性投影后通过各自的IntentNet中的完全连接的网络，获得的用户和项目的嵌入可以视为已形成一个公共空间。然后，在明确偏好的指导下进行训练，可以评估用户与项目中的项目之间的相关性空间。

值得注意的是，与以前使用正则化器[6，7]在目标函数中捕获辅助关系的工作不同，前者是线性的并且在很大程度上取决于手工参数的调整，我们的方法可以通过以下方法通过一个非线性神经网络自动了解不同辅助特征的重要性。我们注意，辅助信息也可以设计为节点输入特征。但是，由于复杂神经网络的投影能力，node输入特征不在高阶embedding向量空间附近。通过将辅助信息进一步建模为转换后的图中的关系，IntentGC可以直接从节点关系中学习这些以提高性能。实验也证实了这一点。

这项工作的主要贡献总结如下：

1）我们提出了IntentGC，一种有效且高效的图卷积框架。据我们所知，这是第一项工作在一个模型中统一建立显式偏好、异构关系的模型的推荐框架。

2）我们设计了一种新颖的图卷积网络IntentNet，它具有更快的图卷积机制。它导致MRR增加22.1％，运行时间减少75.6％。

3）我们在两个大型规模上进行了广泛的离线实验数据集并部署具有生产A / B测试的在线系统在阿里巴巴。在离线评估中，我们将MRR提高了95.1％，并且在在线A / B测试中，与最佳基准相比，IntentGC显示点击率（CTR）提高了65.4％。

2相关工作

2.1网络嵌入

网络嵌入旨在用低维向量表达图节点，训练的网络结构和属性会保留下来，就像编码器一样。它可以使各种任务受益，包括推荐。已经提出了许多有效的网络嵌入算法[10、15、17、19、25]。我们简要回顾一下其中一些方法这里。读者可以参考[4，9]进行全面的调查。 DeepWalk [15]在节点上部署了截断的随机游走，以把随机游走经过的数据（eg:node）看做是这个节点的潜在表达。在这项开创性工作之后，node2vec [10]通过更复杂的随机游走和广度优先搜索扩展了DeepWalk。 SDNE [19]通过联合方法利用一阶接近度和二阶接近度来捕获局部和局部结构。 DVNE [25]学习Wasserstein空间中每个节点的高斯分布，以保留更多属性，例如传递性和不确定性。

尽管已经为同构网络中的表示学习进行了广泛的研究，但实际应用中的图形更可能是异构信息网络（HIN）。为了利用HIN中的丰富信息，还提出了一些算法来处理异构性[3，5，16，24]。 Metapath2vec ++根据人类的专业知识[5]，利用元路径来随机游走，以便最大化偏向转移概率。 HEER通过附加的边缘（节点相连关系）来表示嵌入HIN，以把节点之间的连接关系表达的更充分一点[16]。对于一般的HIN，尽管可以使用这些方法，但是在模型中的重要性，他们将每种关系同等对待，这不适用于增强推荐系统，因为用户与项目之间的关系是预测的主要目标。当前，很少关注利用异构信息来增强性能推荐。

2.2 Graph Convolutional Networks

近年来，更多地关注卷积的应用图结构数据的神经网络[2，11，13，18]。布鲁纳等人定义傅里叶域中的卷积运算，计算的时候会计算图拉普拉斯算子的特征分解[2]。为了降低卷积的复杂度，Kipf和Welling提出通过局部图过滤器上的一阶相似来简化以前的方法，名为GCN模型[13]。具体来说，他们把每个节点的卷积运算看做所有相邻特征向量的mean-aggregation，再通过MLP层和非线性激活函数进行变换。但是，在他们的模型中，中心节点和邻居节点聚合在一起而不进行训练。最近，汉密尔顿等。提议的GraphSage在归纳法中进一步扩展了GCN方法方式[11]。此技术对固定大小的邻域进行了采样，避免对整个图中的每个节点进行拉普拉斯运算。他们会concat(每个节点的表达向量,这个节点邻域的综合表达向量)，取得了显著进步，但先前的研究GCN中的工作主要集中在同构图(图里面只有一种类型的节点)上。在这在工作中，我们提出了一种新颖的算法，该算法将GCN扩展到异构信息网络，并显着提高了推荐的有效性和效率。

2.3 Recommendation

最近，基于深度学习的算法取得了显著成就推荐文献中的成功[23]。根据是否在模型中捕获用户信息，主要有两个方法类型：1）item-item推荐和2）user-item推荐。 item-item推荐的动机是查找与用户的历史交互项相似的item。在这类工作中，Wang and Huang等人 [20]采用了DeepWalk附带信息的方法以获得向量表示在项目图上的表达。 Ying等。 [22]提出了一种基于随机游走的方法GraphSage算法（名为PinSage）。

与上述工作不同，我们的方法属于用户项目推荐组[12、14、21]。这组方法旨在直接预测用户的首选商品，这通常与用户的满意度相关，并且由于稀疏性问题而更具挑战性。为了减轻稀疏性的问题，一些作品试图利用其他辅助关系。例如，Gao等人 [7]设计了一种有偏向的随机游走法，利用user-item二部图来推导user-user和item-item直接的关系。 Wang等人 [6]在跨域环境中纳入了社会关系。但是，现有方法仅考虑一种类型的user/item辅助关系，而忽略了图中丰富的异构辅助关系。而且，以前的方法通常会利用正则化器捕获辅助关系，这限制了模型的功能，并且在很大程度上还取决于手工参数调整。在这项工作中，我们提出了一个新颖的IntentGC框架来利用显式偏好和丰富的异构辅助关系。它可以通过图卷积自动确定各种辅助关系的重要性

3问题定义

我们在数学上提出了推荐问题。第一，让我们考虑一下电子商务网站上的典型场景：最后一周，杰克查询了一些有一些要求的关键字。从返回的项目列表中，他单击了一些有吸引力的项目以获取详细信息。在这一周中，他还参观了一些在线商店以检查新书。终于在星期六，他购买了几本畅销书以及他最喜欢的品牌的T恤。根据杰克的行为，平台已收集了丰富的信息（提交的查询词，点击的商品，逛过的商店，首选的属性和品牌），以个性化的方式向他推荐潜在的有趣物品方式。

这种推荐场景也可以在其他网站上观察到。通常，网站上的多种对象和历史用户行为会形成异构信息网络，如下所示：

HIN网络是一个无向图，g = (v,e)，v是一系列的节点（包括各种类型的节点，比如user节点，item节点，品牌节点等，具体可以看上面的图2），e属于v*v，是节点相连边。g和节点类型map-φ有关，这个map的key是v，value是这个v的节点类型T(v)，节点类型如果拿上面图2举例的话，那就是user节点，item节点，品牌节点… ；g也和边类型map-ψ 有关，这个map的key是e，value是这个e的边类型T(e)，边类型如果拿上面图2举例的话，那就是is has belong buys这种类型的节点，按理说类型不应该取模，但是论文中对他进行了取模，取模我们可以理解为，求节点类型或者边类型的总个数，T(v) 或者 T(e)大于1的话（大于1就说明是异构图，有多种节点），v就可以写成 v =v1 U v2 U…U vr U…U vR，其中vr是r节点类型的集合，R的取值是T(v)（节点类型总数量，要取unique）,v就代表是所有类型的节点的集合

User_Item推荐：在当前论文中，我们把v1看做user-noded，v2看做item-nodes，v3 … vR代表了其他object的节点（eg:query brand …），我们把e = e(label) U e(unlabel)，就是说边集合是由有label的边和无label的边组成的，e(label)属于v1*v2，代表了user和item直接的连接关系，e(unlabel) = e - e(label)。因为在现实生活中，一个典型的推荐算法是预测用户更喜欢哪个item，我们用g = (v,e) + 历史信息来构建一个图结构，g(p) = (v(p),e(p))来代表真实世界信息的图结构。然后我们把user-item推荐问题看成是一个图结构中的边连接预测问题

Input: 一个hin，基于历史数据g = (v,e)

Output: e(p)(label) 是在g(p)这个真实世界的图上预测出来一个有label关系的边集合，这个label关系，可以是0 1，也可以是浮点型

4 METHODOLOGY

在本节中，我们提出了一个关于HIN user-item 推荐的新颖框架。我们的方法具有三个关键特征：

i）网络翻译，它将原始图转换为一种特殊的HIN

ii）更快的卷积网络，基于 vector-wise 向量级卷积在最佳意义上放大和合成异构关系的优势；

iii）双重图卷积，可以在翻译后的异构图HIN上学习到user item的向量表示。最后，我们总结了解决方案的框架。

4.1 Network Translation

如图2所示中的异构节点和关系，为我们不仅提供丰富的信息，而且不相交的语义和更多挑战。尽管对每种类型中，使用特定类型的边缘来进行建模是一种可能的解决方案[16]，但是在计算多种类型的节点、边时，高复杂度和计算成本对于大数据是不可行的。幸运的是推荐系统中，我们只关心user、item的表达。因此，我们采用了一种类似于[7，24]的方法将原始辅助信息，转换为user-user关系或item-item关系。直观地，如果用户u1和u2是两者都通过Vr（r> 2）中的辅助节点连接，u1和u2之间肯定也有间接关系。在本文中，我们利用二阶接近度[9]来捕获两个用户（或项目）之间的相似性，由他们共享的相同类型的公共辅助邻居的数量来衡量。在这方式下，我们可以编码辅助节点带来的语义信息，成为user-user或者item-item的异构关系，并相应地翻译HIN。其他基于元路径的随机游走等生成方法也适用于网络翻译，但是我们的方法具有鲁棒性和简单的实现。

为了清楚和易于推导，我们首先考虑这样一种case, V = V1∪V2∪V3, 我们只有一种类型的辅助节点（V1 V2分别是user和item节点，V3就是辅助节点，比如是上面Figure2中的Brand这种辅助节点，用户可以购买某种Brand，item也可以属于某种Brand，这样Brand这种辅助节点就造成了user-user之间或者item-item之间可以有边相连）。通过向HIN G添加新的二阶关系并从中移除原始辅助关系和节点。we obtained a new and simplified HIN G = (U,V , EU , EV , Elabel)，其中U V是用户节点、item节点的集合，这个图关系中就只有user item两种节点，Elabel ⊆ U × V，就和网络翻译前的e(label)一样，因为是user和item直接的关系，自然这个连接边的所属最多就是 U*V。

******EU ⊆ U × U and EV ⊆ V × V 分别是user和item内部的相连关系。为了简单可见，我们假定在每类节点相互之间只有1种类型的edge，不过我们的框架是允许不同类型节点之间有多种连接关系。

******eu(i,j) ∈ EU 是用户节点的相连edge，edge还有一个相似度权重属性su(i,j)，代表了原始图中的二阶关系。ev(i,j) sv(i,j)和前面定义一样，相似度权重可以看做上面的由他们共享的相同类型的公共辅助邻居的数量来衡量这块来计算

******因此，我们可以使用SU=[su(i,j)] 和 SV=[sv(i,j)] 来代表EU 和 EV间的权重矩阵关系。

******我们还定义N(ui)是节点ui的邻域节点，长度是p，这p个邻域节点是根据SU SV这个矩阵得来的

有了上面的一些操作，我们可以考虑V = {V1, V2, . . . , VR }有R中类型节点的情况，对于每种辅助节点，我们按照上面的步骤生成 user-user / item-item各自内部的连接边。我们最后可以得到 2*(R-2)种异构关系，为什么是2*，以为上面说过了，我们把user-user item-item拆开来看，这样每种都是 R-2 种异构关系（每种类型的节点内部的连接edge属于1种异构关系），每种异构关系都可以写成EU(r)或者EV(r)，代表每类节点中的edge相连关系，并且每类都有一个相似度矩阵，SU(r) SV(r)，相应的每个user或者item的邻域节点也可以用N(ui)(r) N(vi)(r)来代表

我们把翻译好的图G叫做user-item HIN，然后整个问题就变成了给定 user-item的HIN G这个图，来预测里面的user和item的连接关系

4.2 Faster Convolutional Network: IntentNet

动机。 GCN的核心思想是通过本地过滤器迭代地聚合邻域中的特征信息。但是，它的主要缺点是计算的高度复杂性。对于例如，一个3层的GCN模型，每个节点会进行100多次卷积运算，对于通常有数亿个节点的大型网络应用来说，这是不可接受的。在以前的作品中，常见方法是使用 mini-subgraph 采样策略[22]。他们开发了生产者－消费者分布式训练方法。在每次迭代中，producer会采样一个聚集的子图M，并在M上执行前向传播，以通过consumer得到所有节点的表达。集群子图是在项目上以广度优先搜索方式生成的图形。这样，GCN在每个采样的子图上只会执行一次，在更新时node-embedding也会被复用（所有训练对都应包含在子图中）。然而，对于用user-item HIN G，很难生成此类聚类的子图用于embedding重用。这是因为user-item之间的edge关系非常稀疏。如果我们用这种办法的话，我们会得到一个非常大的子图，甚至整个图。因此，为了将我们的方法应用于大规模图，我们开发了一种更快的卷积运算，该运算允许普通节点采样。

Vector-wise convolution operation

为了简单起见，我们首先考虑一种类型的辅助关系，然后再扩展到多种辅助关系。我们仅仅使用用户节点来进行解释做法，因为user-node和item-node在G上是相同的结构。一层图卷积包括两个部分，1)聚合邻域节点，2)卷积函数。聚合是一个pooling层，会把邻域的特征信息聚合在一起，可以用下面的公式体现

其中ha(k-1)代表的是用户a在经过(k-1)词卷积后的向量（假设为128维，这个128维也是比较合适的，毕竟是我们最终求的user的向量），里面的AGGREGATE是一个取平均函数，hN(u)(k-1)代表了u节点的邻居汇总在一起的信息，a是N(u)中的每一个节点，前面已经在 4.1 Network Translation 第2段中说到了，求u的邻域节点是根据相似度矩阵 SU来进行求取，长度是p。

经过聚合,我们需要利用节点本身向量hu(k-1)、邻居信息hN(u)(k-1)（每一个邻居都是一个用户，邻居信息并不是用户和brand prop这些辅助节点的信息 – 即把每个用户有相交的brand prop求embedding向量的平均，然后再concat，并不是这样，而是很简单也是128维度的向量表达，第一次迭代时取正态分布，后面每次就依次迭代即可），所以就将这两个embedding向量聚合起来（128+128=256维度），再过一个MLP层，没有非线性激活函数（relu），以便能学到特征交互信息。我们把这种方法称为“bitwise”

--------------------上面都是在讲述“bitwise”方法，下面是讲述论文新提出来的vector-wise方法

然而，我们观察到用户节点的128维向量和128维辅助节点的向量在进行交互，然而没有必要学到所有的特征对交互。在表达学习期间，在卷积操作中主要有两个任务：第一个是学习node self和邻居信息的交互，这决定了每种邻居信息能怎么程度的来影响最终的结果；第二个是学习embedding空间中不同维度之间的交互，这会找到一些有用的特征组合。例如，用户的年龄和职业（同一节点中的特征交互）可能会建议一些首选类别。结合了用户的邻居信息到他的表示中，可能有助于推荐相关items。但是，结合用户的年龄和评分特征可能毫无意义。基于此观察结果，我们在以下方面设计了向量级卷积函数：

wu(k-1)(i,1)和wu(k-1)(i,2) 分别代表着node-self的权重、第i个局部滤波器的权重，也就是用户节点本身、和、一个辅助信息进行交互的各自权重，上面公式3中的每一个本地滤波器可以看做是节点本身和邻居信息的交互。在所有的局部滤波器（所有的辅助信息）都被学习后，我们利用公式4中的办法来把他们聚合到huk中，以便下一次卷积操作。

多个局部卷积层确保了信息直接可以有效的进行交互，这种思路是借鉴了cnn。这些权重是共享的。Bitwise和vector-wise的区别可以用图3表名，不管是Bitwise还是vector-wise，我可以看做是在 XK = R(N*M*C)上操作，N是节点数，M是邻居数，V是节点的表达维度。

可以这样理解：若只有一个节点，有M个邻居，自身是C维的表达，那么就是M*C的空间，有N个节点，那就是N*M*C的空间，对比bit-wise来说，因为把self-node和邻域信息concat在一起，所以就是一维CNN卷积，vector-wise可以看做是多个一维CNN卷积

IntentNet

通过提出的卷积运算，我们可以建立堆叠的卷积层以形成网络，这很高效且能够从中学习有用的邻域交互关系。但是，这只能完成一种维度下（低维、高维的区别）的卷积，因此我们通过三个附加的全连接层进一步提供最后一个卷积层的输出表示，以学习向量空间中不同维度下各层之间的特征交互。我们称这种方法作为IntentNet，其核心思想是将图卷积的工作分为两个部分：vector-wise用于学习邻域的作用，mlp层用于学习节点级别的特征组合。实际上，IntentGC不仅比传统的GCN更高效，而且更有效。一个可能的原因是IntentGC可以避免无用的要素交互，并且对过度拟合做了限制。更多细节将在5.3节中介绍。

Complexity

我们在每层的表达中，都使用m维，因为固定维度的向量在顺序上的大小有一定的相似性。首先，我们分析下卷积的复杂度。如果用户A有p个邻居，每一个卷积层首先需要聚合（pooling层，可以取平均），因为每个邻居有各自的p个邻居，所以每个邻居都要把各自的p个邻居的辅助信息（每个邻居就是128维向量）给聚合在一起，这样就会有p次聚合，每次聚合的维度是m，所以复杂度是O(p*m)；vector-wise中，共L次局部卷积（公式3），每次卷积都是在m维度上操作，所以复杂度是O(m*L)，所以总复杂度是O(m*(p+L))，因为p<

假设一次图卷积有q次迭代，第r次迭代需要这么多次卷积操作

(1+ρ+· · ·+ρ(q−r) ) =(ρ(q-r+1) – ρ) / (ρ -1)，这里要注意两点

1：数学公式，x0 + x1 + x2 + … + xn = x(1-xn) / (1-x) = x(xn-1) / (x-1)=(x(n+1) – x) / (x-1)

2：论文中说的第r次迭代，应该是说总共有r次迭代的话，会有多少次卷积，具体我会在笔记中画图说明，那么如果有q次迭代的话，论文中提到的算法 / GraphSage 都有 ρ+ρ 2+···+ρ q−ρ / (ρ-1) ≈ρ(q – 1)次图卷积操作。总的来说，IntentNet花费时间复杂度是 O(ρ q−1 ∗m+m2 )，其中m2是q词卷积后的多个mlp层，GraphSage就需要花费O(ρ q−1 ∗ m2 )，明显看到IntentNet就高效多了，具体的推导会在笔记中画图说明

Heterogeneous relationships

我们现在把 IntentNet扩展到多种异构信息，考虑到 EU = E (1) U ∪E (2) U ∪· · ·∪E (R−2)U，也就是有R-2中用户关系，在这种情况下，公式3可以被写成下面这样

前面没有对公式3进行解释，现在结合公式5一起说下：公式3中，hu(k-1)是128维度的用户向量，hNu(k-1)是这个用户的10个邻域节点取平均组成的128维度的向量，公式3中，i的取值是1~L，也就是说 wu(k-1)(i,1)也只有L个，这L次相乘中，每一次hu(k-1)、hNu(k-1)都是不变的变的只有两个权重向量 wu(k-1) (i,1)和wu(k-1)(i,2)，我暂时还没想明白，这样做是出于什么目的，前面论文有说明因为不想node-self和邻域信息一股脑的进行交互，想要把特征之间有区别的分开交互，使得每种特征之间有不同权重的交互，公式3中进行L次，每一次给node-self和邻域信息先乘以个权重，这个权重到底是什么样子？wu(k-1) (i,1)是一个浮点型数字、还是一个128维度的向量，在论文中公式3下面有说wu(k-1) (i,1)是第i个局部卷积核（过滤器），我想应该是128维度的向量

wu(k-1)(i,1)这个128维度的向量与 hu(k-1)这个128维度的向量相乘，我们将hu(k-1)这128个数字每个数字都看做是一个特征（从某种意义上可以这样看），每个数字都乘以一个数字后，相当于对每个特征的不同打压；wu(k-1)(i,2)和hNu(k-1)类似；然后再相加，是论文中Figure 3 前面那一段中说到的卷积的两个目的的之一：学习selfnode和邻居信息的交互，后面紧接着的公式4

是 selfnode和邻居信息的交互完毕后，θi(k-1)意在将前面L次学习的结果再次学习不同特征之间的交互，维度也是128维（具体可以参考Figure 3中的Vector-wise）

从公式3转到5，公式3中，因为只有一个邻域信息（因为只有一个辅助节点，一个辅助节点对应一个EU,一个EU对应一个SU，就只能求出来一种邻域节点），到了公式5，因为有了好几种邻域信息（brand shop queryword）等，所以辅助节点就对应了好几个EU，自然有好几个SU，也就好几种邻域节点，公式3中在对hNu(k-1)乘以权重向量到了公式5就变成了对（R-2）种hNu(k-1)分别乘以权重向量再sum，这个很好理解

前面所说的所有信息可以汇集成上面的Figure-4，先看layer1中的每一个小块，其中每一个小块就对应的是公式3，总共有（R-2）个小块，一起加起来就对应着公式5；再看layer2，前面部分就对应的是公式4，把公式5输出的每一个gu (i)(k-1)给混合在一起，但是公式4只体现了直接混在一起，并没说是几个MLP，Layer2中说明了是3个MLP层，最后输出用户的向量

4.3 HINDI中的双图卷积

为了处理用户和项目之间的异质性，我们提出双图卷积模型以同时学习user和item的嵌入。我们用xu和xv代表用户u和item的输入特征向量v。此外，我们还为每个正样本抽取了负样本以形成完整的训练集，例如（xu，xv，xneg），负样本会用作训练过程中的对照。

我们为用户使用了两个IntentNet，IntentNet(u)和IntentNet(v)。通过像等式（1），等式（5）和等式（4）还有后面的dense层迭代后，我们可以通过以下方式获得最终user和item表示形式zu，zv：IntentNetu和IntentNetv分别。尽管user空间和item空间之间存在语义鸿沟，但另外三个IntentNet的MLP层可以在投射user和item时，使得两者在同一嵌入空间。此外，我们还获得在IntentNet(v)的训练元组中对采样的负样本的zneg

Loss函数是

这种三重态损失被称为最大边距方法，其中δ表示边距超参数，并且使用内积来表示测量用户节点和项目节点之间的相似性得分。核心思想是用户与有链接关系的item之间的内积应该高于用户与负样本之间的内积。最小化公式（6）实际上可以使得用户与有链接关系的item之间的内积越来越高，与负样本越来越低，从而形成一个模型，如果有高分数代表用户和item可能有边相连。

此外，为了训练一个健壮的模型来区分正项目与相似的负项目，我们在采样负样本的时候，会采个和正样本同一属性的Item，来确保模型能够区分开user在很相似的Items之间的关系

4.4 IntentGC框架

我们总结一些上面提到的算法

整个框架可以分成三个步骤，1)网络翻译 2)训练 3)预测，我们下面会提供一些细节

网络翻译

我们算法的输入是一个异构信息网络G，它是由历史数据构建的。按照第4.1节中描述的方法，我们通过辅助节点生成二阶关系，并将原始的HIN G变换成用户项HIN G（第2行）

Training

给额定翻译好的图G，我们用下面4步训练模型，

1 初始化，我们初始化所有的参数，获得user和item的特征向量（4~5行），为了简单起见，IntentNet(u)网络中的权重用Ωu代替，Xu = [xu]代表了用户的特征矩阵

2采样，在一个batch中我们生成这样的元组，xu, xv 是从有关系的user-item边中采样得到的，xneg是从和xv有相同类型的item中采样得到的（7行）

3 前向传播，我们输入IntentNetu and IntentNetv的一个Batch后，并且获得了输出向量(line8 ~11)。每一个IntentNet都包含q个图卷积层（用于内容传播），和3个MLP层来计算特征交互

4 参数更新，我们使用梯度下降来最小话loss函数(line 12)

第2 到 4步是不断迭代的，知道遇到停止条件

Inference

经过训练，我们可以获得所有用户和item的Z维度的向量（line 14~15），并且找到每个user的K个最近邻来用于推荐

你可能感兴趣的:(图卷积神经网络,论文翻译,IntentGC)

论文阅读：2025 arxiv Qwen3 Technical Report
https://arxiv.org/pdf/2505.09388https://www.doubao.com/chat/9918384373236738文章目录论文翻译Qwen3技术报告摘要1引言论文翻译Qwen3技术报告Qwen团队摘要在这项工作中，我们介绍了Qwen模型家族的最新版本Qwen3。Qwen3包含一系列大型语言模型（LLM），旨在提升性能、效率和多语言能力。Qwen3系列包括密集型
CSPNet: 一种增强CNN学习能力的新型骨干网络简诚 cnn 学习人工智能
论文翻译与总结标题CSPNet:一种增强CNN学习能力的新型骨干网络摘要翻译神经网络在目标检测等计算机视觉任务中取得了显著成果，但其成功高度依赖昂贵的计算资源，限制了在廉价设备上的应用。本文提出跨阶段部分网络（CSPNet），从网络架构角度解决先前工作推理计算量大的问题。该问题源于网络优化中的梯度信息重复。CSPNet通过整合网络阶段起始和结束的特征图，保留梯度的多样性，在ImageNet数据集上
论文阅读：2018 arxiv CrowdHuman: A Benchmark for Detecting Human in a Crowd CSPhD-winston-杨帆论文阅读
https://www.doubao.com/chat/9226473480559618https://arxiv.org/pdf/1805.00123CrowdHuman:ABenchmarkforDetectingHumaninaCrowd文章目录论文翻译CrowdHuman：用于检测人群中人体的基准摘要1.引言2.相关工作2.1.人体检测数据集2.2.人体检测框架。论文翻译CrowdHuma
论文翻译：NeurIPS-2024.Zhehao Zhang.DARG: Dynamic Evaluation of Large Language Models via Adaptive CSPhD-winston-杨帆 LLMs-动态评估 LLMs-数据污染论文翻译语言模型人工智能自然语言处理
DARG:DynamicEvaluationofLargeLanguageModelsviaAdaptiveReasoningGraphhttps://openreview.net/pdf?id=5IFeCNA7zR文章目录DARG：通过自适应推理图动态评估大型语言模型摘要1引言2方法：DARG2.1推理图2.2推理图构建2.3推理图扰动2.4测试用例生成3实验3.1数学推理：GSM8K3.2社会
DexGarmentLab 论文翻译 AI算法网奇深度学习宝典人工智能
单个专家演示装扮15任务场景2500+服装手套棒球帽裤子围巾碗帽子上衣外套服装-手部交互捕捉摇篮夹紧平滑任务......投掷悬挂折叠...多样化位置...多样化变形...多样化服装形状类别级一般化类别级（有或没有变形）服装具有相同结构变形生成可推广的可用性点演示操作演示点服装可用性模型可用性①②结构感知扩散策略噪声动作跨越一般化......形状......服装环境配置............机器人
RT-2论文翻译: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control YYGe 机器人人工智能深度学习机器人预训练模型
RT-2:Vision-Language-ActionModelsTransferWebKnowledgetoRoboticControlRT-2:用互联网知识训练的视觉语言模型融入到机器人控制中RT1论文翻译：https://blog.csdn.net/weixin_43334869/article/details/135850410文章目录RT-2:Vision-Language-Action
SpeedFolding 论文翻译 AI算法网奇深度学习宝典人工智能深度学习
Abstract—折叠衣物可靠且高效一直是机器人操作中的一个长期挑战，因为衣物的复杂动态和高维配置空间。一个直观的方法是首先将衣物操作到一个标准的光滑配置，然后再进行折叠。在这项工作中，我们开发了SpeedFolding，一个可靠且高效的双手系统，该系统根据用户定义的折叠线，将最初皱巴巴的衣物操作到（1）一个光滑的和（2）一个折叠的配置。我们的主要贡献是一个新颖的神经网络架构，能够预测一对夹持器姿
【论文翻译】目标检测Fast R-CNN论文翻译 Ziko_AI 目标检测目标检测图像识别 Fast R-CNN 人工智能
FastR-CNN摘要本文提出了一种快速的，基于区域的卷积网络方法（FastR-CNN）用于目标检测.FastR-CNN建立在前人的工作上使用深层卷积网络。来有效分类候选目标。相比于之前的工作，FastR-CNN应用了几个创新点来提高了训练与测试速度，也增加了检测准确度。FastR-CNN在非常深的VGG16网络上比R-CNN快9倍，在测试阶段快213倍，并且在Pascal2012数据集上达到以更
Capturing forceful interaction with deformable objects using a deep learning- powered... 翻译 Doc2X 经典论文翻译深度学习人工智能机器人
该文档由Doc2X翻译提供解析与翻译,想看更多论文翻译欢迎来Doc2XThisdocumentisprovidedwithparsingandtranslationbyDoc2X.Formoretranslatedpapers,feelfreetovisitDoc2X.原文地址https://www.nature.com/articles/s41467-024-53654-y项目地址：https:
论文翻译：Automatic Lesson Plan Generation via Large Language Models with Self-critique Prompting CSPhD-winston-杨帆论文翻译智慧教育语言模型人工智能自然语言处理
AutomaticLessonPlanGenerationviaLargeLanguageModelswithSelf-critiquePromptinghttps://link.springer.com/chapter/10.1007/978-3-031-64315-6_13通过自我批评提示的大型语言模型自动生成课程计划摘要在本文中，我们利用大型语言模型（LLMs）的理解和生成能力来自动生成定制
论文翻译：ACL-2024.Yiming Huang.Competition-Level Problems are Effective LLM Evaluators CSPhD-winston-杨帆论文翻译 LLMs-数据污染人工智能
Competition-LevelProblemsareEffectiveLLMEvaluatorshttps://aclanthology.org/2024.findings-acl.803.pdf《竞赛级问题作为有效的LLM评估者》文章目录《竞赛级问题作为有效的LLM评估者》摘要1引言6结论局限性摘要大型语言模型（LLMs）展示了令人印象深刻的推理能力，然而，关于这些能力以及最近潜在的数据污染
相机标定论文翻译之“A precision analysis of camera distortion models” AndyCheng_hgcc 相机标定
Aprecisionanalysisofcameradistortionmodelshttps://hal-enpc.archives-ouvertes.fr/hal-01556898Submittedon5Jul2017Abstract—Thispaperaddressesthequestionofidentifyingtherightcameradirectorinversedistortio
论文翻译：OK-Robot: What Really Matters in Integrating Open-Knowledge Models for Robotics YYGe 机器人深度学习人工智能机器人预训练模型
OK-Robot:WhatReallyMattersinIntegratingOpen-KnowledgeModelsforRoboticsOK-Robot：整合开放知识模型在机器人学中的真正重要性文章目录OK-Robot:WhatReallyMattersinIntegratingOpen-KnowledgeModelsforRoboticsOK-Robot：整合开放知识模型在机器人学中的真正重
论文翻译：3D Gaussian Splatting for Real-Time Radiance Field Rendering 好脾气先生视觉重建论文翻译 3d
文章目录1介绍2.1传统场景重建与渲染2.2神经渲染与辐射场2.3基于点的渲染和亮度表示3概览4可微高斯抛雪球5带有自适应密度控制的3D高斯优化5.1优化5.2高斯的自适应控制6高斯的快速可微光栅化器7实现，结果和评估7.1实现7.2结果和评估7.3消融研究7.4局限8讨论和结论最近在做三维重建的相关工作，看了原版论文，做了机翻，自己又润色了一下，应该还算通顺，欢迎各位交流批评；（仅仅是重要部分翻
论文翻译：Universal and Transferable Adversarial Attacks on Aligned Language Models CSPhD-winston-杨帆 LLMs-安全论文翻译语言模型人工智能自然语言处理
UniversalandTransferableAdversarialAttacksonAlignedLanguageModelshttps://arxiv.org/pdf/2307.15043v2通用且可转移的对抗性攻击对齐语言模型文章目录通用且可转移的对抗性攻击对齐语言模型摘要1引言2一个针对LLMs的通用攻击2.1产生肯定回应2.2贪婪坐标==梯度==搜索2.3通用多提示和多模型攻击3实验结
论文翻译：Large Language Models for Education: A Survey CSPhD-winston-杨帆论文翻译智慧教育语言模型人工智能自然语言处理
目录大型语言模型在教育领域的应用：一项综述摘要1引言2.教育中的LLM特征2.1.LLMs的特征2.2教育的特征2.2.1教育发展过程低进入门槛。2.2.2.对教师的影响2.2.3教育挑战2.3LLMEdu的特征2.3.1"LLMs+教育"的具体体现2.3.2"LLMs+教育"的影响3如何逐步将LLMs整合到教育中3.1教育领域采用LLMs的原因3.2融合策略4LLMEdu的关键技术5LLMEdu
论文翻译：ICLR-2023.DYVAL: DYNAMIC EVALUATION OF LARGE LANGUAGE MODELS FOR REASONING TASKS CSPhD-winston-杨帆 LLMs-数据污染论文翻译语言模型人工智能自然语言处理
DYVAL:DYNAMICEVALUATIONOFLARGELANGUAGEMODELSFORREASONINGTASKShttps://openreview.net/forum?id=gjfOL9z5XrDynamicevaluationtomitigatepotentialtestdatacontamination:weintegratedthedynamicevaluationframewo
论文翻译：Large Language Models for Education: A Survey and Outlook CSPhD-winston-杨帆论文翻译智慧教育语言模型 outlook 人工智能
https://arxiv.org/abs/2403.18105目录教育领域的大型语言模型：一项调查和展望摘要1.引言2.教育应用中的LLM2.1概述2.2学习辅助2.2.1问题解决（QS）2.2.2错误纠正（EC）2.2.3困惑助手（CH）2.3教学辅助2.3.1问题生成（QG）2.3.2自动评分（AG）2.3.3教学材料创作（MC）2.4适应性学习2.4.1知识追踪（KT）2.4.2内容个性化
『大模型笔记』自用的“科技文章翻译 GPT”和它的 Prompt AI大模型前沿研究大模型笔记 gpt chatgpt GPT4
自用的“科技文章翻译GPT”和它的Prompt你是一位精通简体中文的专业翻译，尤其擅长将专业学术论文翻译成浅显易懂的科普文章。请你帮我将以下英文段落翻译成中文，风格与中文科普读物相似。规则：-翻译时要准确传达原文的事实和背景。-即使上意译也要保留原始段落格式，以及保留术语，例如FLAC，JPEG等。保留公司缩写，例如Microsoft,Amazon,OpenAI等。-人名不翻译-同时要保留引用的论
DeepSeek最新成果-NSA(Native Sparse Attention) X.Cristiano NSA DeepSeek-R1 深度学习
论文地址：NativeSparseAttention:Hardware-AlignedandNativelyTrainableSparseAttention论文翻译：原生稀疏注意力机制(NSA)：硬件对齐且可原生训练的稀疏注意力机制-论文阅读论文的背景与动机近年来，我们见证了长文本建模在AI领域的重要性日益凸显。无论是深度推理、代码库生成、还是多轮对话，都离不开模型对长序列信息的有效处理能力。像O
论文翻译：EMNLP-2023 CCF-B Multi-step Jailbreaking Privacy Attacks on ChatGPT CSPhD-winston-杨帆 LLMs-安全论文翻译 chatgpt
Multi-stepJailbreakingPrivacyAttacksonChatGPThttps://arxiv.org/pdf/2304.05197多步骤越狱隐私攻击对ChatGPT的影响https://openreview.net/forum?id=ls4Pfsl2jZ文章目录多步骤越狱隐私攻击对ChatGPT的影响摘要1引言2相关工作3对ChatGPT的数据提取攻击3.1数据收集3.2攻
论文翻译：EMNLP-2023.CCF-A.Alon Jacovi.Stop Uploading Test Data in Plain Text: Practical Strategies for CSPhD-winston-杨帆论文翻译 LLMs-数据污染人工智能
StopUploadingTestDatainPlainText:PracticalStrategiesforMitigatingDataContaminationbyEvaluationBenchmarkshttps://arxiv.org/pdf/2305.10160停止上传明文测试数据：实用的策略以减轻评估基准造成的数据污染文章目录停止上传明文测试数据：实用的策略以减轻评估基准造成的数据污染
论文翻译：ChatGPT: Bullshit spewer or the end of traditional assessments in higher education? CSPhD-winston-杨帆智慧教育论文翻译 chatgpt
ChatGPT:Bullshitspewerortheendoftraditionalassessmentsinhighereducation?https://journals.sfu.ca/jalt/index.php/jalt/article/download/689/539/3059文章目录ChatGPT：废话制造者还是传统高等教育评估的终结者？摘要引言ChatGPT的功能ChatGPT对教
论文阅读笔记1——DARTS：Differentiable Architecture Search可微分架构搜索（一）（论文翻译学习） fuhao7i 论文阅读笔记深度学习人工智能机器学习算法计算机视觉
DARTS：DifferentiableArchitectureSearch可微分架构搜索（一）DARTS：DifferentiableArchitectureSearch（一）ABSTRACT摘要1.INTRODUCTION介绍2.可微的结构搜索加油加油！如果你感觉你现在很累，那么恭喜你，你现在正在走上坡路！让我们一起加油！欢迎关注我的讲解视频，让我们一起学习：Bilibili主页：https:
DeepSeek R1 AI 论文翻译后端java
摘要原文地址：DeepSeekR1AI论文翻译我们介绍了我们的第一代推理模型，DeepSeek-R1-Zero和DeepSeek-R1。DeepSeek-R1-Zero是一个通过大规模强化学习（RL）训练的模型，且在此过程中未使用监督微调（SFT）作为预处理步骤，展现出了显著的推理能力。通过RL，DeepSeek-R1-Zero自然而然地展现了许多强大且引人注目的推理行为。然而，它也遇到了一些挑战
DeepSeek R1 AI 论文翻译老马啸西风 java
摘要原文地址：DeepSeekR1AI论文翻译我们介绍了我们的第一代推理模型，DeepSeek-R1-Zero和DeepSeek-R1。DeepSeek-R1-Zero是一个通过大规模强化学习（RL）训练的模型，且在此过程中未使用监督微调（SFT）作为预处理步骤，展现出了显著的推理能力。通过RL，DeepSeek-R1-Zero自然而然地展现了许多强大且引人注目的推理行为。然而，它也遇到了一些挑战
DeepSeek R1 AI 论文翻译后端java
摘要原文地址：DeepSeekR1AI论文翻译我们介绍了我们的第一代推理模型，DeepSeek-R1-Zero和DeepSeek-R1。DeepSeek-R1-Zero是一个通过大规模强化学习（RL）训练的模型，且在此过程中未使用监督微调（SFT）作为预处理步骤，展现出了显著的推理能力。通过RL，DeepSeek-R1-Zero自然而然地展现了许多强大且引人注目的推理行为。然而，它也遇到了一些挑战
【论文翻译】DeepSeek-Coder-V2: Breaking the Barrier of Closed-Source Models in Code Intelligence 行动π技术博客代码大模型 deepseek
本翻译来自大模型翻译，如有不对的地方，敬请谅解引言开源社区通过开发诸如StarCoder（Li等人，2023b；Lozhkov等人，2024）、CodeLlama（Roziere等人，2023）、DeepSeek-Coder（Guo等人，2024）和Codestral（MistralAI，2024）等开源代码模型，在推进代码智能方面取得了显著进展。这些模型的性能已稳步接近闭源同类产品，为代码智能的
论文翻译：ChatGPT for good? On opportunities and challenges of large language models for education Author CSPhD-winston-杨帆智慧教育论文翻译 chatgpt 语言模型人工智能
高引用论文：ChatGPTforgood?OnopportunitiesandchallengesoflargelanguagemodelsforeducationAuthorlinksopenoverlaypanelhttps://www.sciencedirect.com/science/article/pii/S1041608023000195ChatGPTforgood？大型语言模型在教育
【论文翻译】GOT-OCR论文翻译——General OCR Theory: Towards OCR-2.0 via a Unified End-to-end Model 机器白学论文翻译 ocr 论文阅读论文翻译
论文原文链接：https://arxiv.org/abs/2409.01704特别声明，本文不做任何商业用途，仅作为个人学习相关论文的翻译记录。本文对原文内容直译，一切以论文原文内容为准，对原文作者表示最大的敬意。如有任何侵权请联系我下架相关文章。目录通用OCR理论：通过统一的端到端模型迈向OCR-2.00摘要1引言2相关工作2.1传统OCR2.2基于LVLM的OCR3通用OCR理论3.1框架3.
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。