weixin_30752377

基于注意力机制的群组推荐算法

https://www.cnblogs.com/kyxfx/articles/9181778.html

https://www.cnblogs.com/kyxfx/articles/Attention-based_Group_Recommendation.html

TRAN DANG QUANG VINH, Nanyang Technological University, Singapore

TUAN-ANH NGUYEN PHAM, Nanyang Technological University, Singapore

GAO CONG, Nanyang Technological University, Singapore

XIAO-LI LI, Institute for Infocomm Research(I2R), A∗STAR, Singapore

译注：文中的群组、组、小组、群体等词均为英文group在不同语境下的汉化翻译。项目一词对应item。

推荐系统广泛应用于诸如谷歌、Twitter、LinkedIn和Netflix等大型信息公司。一个推荐系统通过使用用户偏好筛选重要信息片段来处理信息过载的问题。随着深度学习越来越成功，最近的研究证明了在各种推荐任务中使用深度学习的好处。然而，大多数提出的技术都只针对个体，这在群体推荐中是无法有效应用的。

在本文中，我们提出了一种深度学习架构来解决群体推荐问题。另一方面，人们注意到作为个体的用户和群组成员的行为是不同的。为了解决这些问题，我们建议使用注意机制来捕获群组中每个用户的影响。具体地说,我们的模型自动学习群组中的每个用户的影响权重并根据其成员的权重偏好为群组推荐项目。我们对四个数据集进行了广泛的实验。我们的模型显著地优于基线方法，并且在将深度学习应用于群体推荐问题上显示了很有希望的结果。

CCS概念: • 组推荐 • 协同过滤 • 注意力机制

ACM Reference Format:

Tran Dang Quang Vinh, Tuan-Anh Nguyen Pham, Gao Cong, and Xiao-Li Li. 2018. Attention-based Group Recommendation.

1, 1 (April 2018), 17 pages. https://doi.org/0000001.0000001

1 简介

推荐系统广泛应用于基于事件的社交网络服务(Meetup)、媒体(Netflix和Last.fm)、餐饮和餐饮服务(Yelp)等。虽然大多数推荐技术都关注于个人推荐[1,18,24,30]，但在很多情况下，推荐的产品或服务都被一群用户所消费。群体推荐的应用场景包括:与同事共进晚餐，与配偶一起看电影，与朋友一起去野餐。例如，图1显示了线下事件 AI周六2018年冬季周期启动! @微软的Meetup1组人工智能周六在新加坡，在那里用户聚集在微软办公室举行一个关于人工智能的小型研讨会。然而，针对个人的传统推荐方法不能有效地应用于群体推荐。因此，许多最近的研究集中于开发有效的推荐系统[3、5、6、13、20、27、37、39]。

图1所示。一个Meetup事件的例子

Facebook和Meetup等社交网络服务的快速增长，让人们越来越容易组织和参与群体活动。这些社交网络服务不仅针对个人，也针对用户群体。群组内用户之间的偏好差异需要一定的权衡，以平衡这种偏好，并向群组推荐最有利的项目。现有的群组推荐方法可以分为基于内存和基于模型的方法[18,32]。基于内存的方法可以进一步分为两个子类:偏好聚合[18,22]和评分聚合[5、11、21、25、28]。偏好聚合策略将所有用户首选项组合成一个群组概要，然后向群组提出建议，而评分聚合策略计算每个成员的推荐列表，然后将单个列表组合起来生成建议。每种策略都有局限性:偏好聚合可能推荐不需要的项，而分数聚合可能无法满足重要的偏好。与基于内存的方法不同，基于模型的方法检查群组成员之间的交互，并对群组的决策过程建模以推荐项目。然而，这些现有的解决方案都有局限性:它们在对群体复杂决策过程建模时不够充分，导致了这些模型的次优性能。

在这一工作中，我们从传统的内存和基于模型的方法中分离出来，我们通过采用深度学习技术来构建模型来解决群组推荐的基本挑战。这里的关键挑战是如何构建一个深度架构，以便在用户参与不同的群组时为其分配不同的权重。通过这种方式，我们可以动态地调整用户的权重，这取决于用户加入的群组，因为用户在不同的群组中行为不同，这取决于用户的相关专业知识。此外，尽管许多现有的前沿方法如PIT[20]和COM[39]为聚合群组中成员的偏好提供了不同的策略，这些方法只考虑群组-项目和用户-项目交互，而忽略了群组中的用户之间的交互。从直觉上讲，团队中的用户在实际做决定之前总是会互相讨论他们的意见和偏好，而不是单独做决定。因此，如何有效地建模团队中用户之间的交互是我们需要解决的另一个挑战。
AGR（Attentive Group Recommendation）采用注意力机制，假设群体中的成员倾向于听从最重要成员(领导/专家)的意见，而不是平等地考虑所有成员的偏好。与现有的最前沿的方法相比，AGR对用户之间的交互进行建模，探索每个用户对群组的影响，并捕获不同群组中一个用户的变化影响。本文的主要贡献是:

•所提出的注意力群体推荐模型采用了一种新颖的深度学习方法来解决群体推荐问题。虽然基于图和概率的模型已经得到了广泛的研究，但是AGR是第一个将注意力机制技术应用到群体推荐中的。

•我们开发了基于AGR的推荐方法。该模型速度快，参数效率高，理论上优于其他前沿的概率模型，如PIT或COM。

•我们对四个数据集进行了广泛的实验，结果表明，AGR始终比许多其他前沿的方法取得更好的结果。AGR说明深度学习是进一步研究群体推荐的一个有前途的方向。

论文的其余部分组织如下:第2节概述现有文献;第3节介绍了初步情况，包括注意机制和贝叶斯个性化排名(BPR);第4节提出注意力群组推荐模型;第5节展示了模型在四个数据集上的实验;和第六节总结。

2相关工作

2.1群组推荐

群组推荐是社交媒体[28]、旅游[23]、娱乐等社会活动和行业中的相关问题[11,25,38]。尽管针对个人的推荐技术得到了广泛的研究，但针对群体推荐的研究却很有限。CF方法可以分为基于内存的CF和基于模型的CF[18,32]，而基于内存的方法可以进一步分为偏好聚合方法和分数聚合方法[3]。偏好聚合方法基于组合了所有用户首选项的群组概要进行推荐[22,38]。另一种方法是，分数聚合方法为每个用户计算一个项目的推荐分数，然后将各个用户的分数进行汇总，从而得出该项目的群组推荐分数[5,11,21,25,28]。

在这两种方法中，分数聚合比偏好聚合更灵活，因此更受到研究社区的关注[3,17,25]。最常见的两种得分聚合策略是平均(AVG)和最小痛苦？(LM)策略。AVG策略将群体中个人的平均得分作为最终得分，从而最大化整体的群体满意度[22,38]。另外,LM策略通过选择所有个人评分中的项目最低分数为项目在群组中的最后得分而取悦每个人[5] 。这两种方法都有主要的缺点。AVG策略可能会返回对某些人有利的项目而对另一些人不利，而LM策略最终可能会推荐没有人喜欢也没有人讨厌的平庸物品。Baltrunas et al.[5]指出，两种策略的性能都取决于群组大小和组内相似度，因此这两种策略可能没有可比性。Yahia等人提出了关联与分歧的新概念。讨论了群体成员之间对每一项的偏好差异是不可避免的，作者通过实验证明，加入分歧，可以显著提高AVG和LM策略的推荐质量。

最近对更高级的群组推荐技术的需求导致了基于模型的新方法的开发[2,18,32,36]。例如,Seko等[31]模型在推荐中包含项目类别,认为项目类别影响群组决策，并且不同类别的项目严格来说并不具有可比性。塞科等方法,然而,只适用于预定义群组(也称为静态群组)如夫妻,而在实际中常常是临时的（ad-hoc）。更具体地说，预定义的群组是持久的群组，如家庭或班级中的学生，我们可以将这些群组作为伪用户，并应用单用户推荐技术。另一方面，临时群组通常是短暂的，它们只是为了一次性或少量的活动而形成的。因此，由于这些群组不是持久的，并且带来了一些挑战，所以在本文中我们实际上更关心临时组。在组推荐中应用博弈论,卡瓦略等[6]认为每一个组项目作为一个非合作博弈,或成员之间的竞争博弈,并建议推荐的目标应该是纳什均衡的。然而，由于纳什均衡可以是一组项目，博弈理论方法可能不能推荐一个特定的项目。

概率模型也被广泛应用于解决群体推荐问题。刘等[20]提出个人影响主题(PIC)模型组建议,假设最具影响力的用户组的代表,因此应该对组决策产生重大影响。然而,这种假设并不反映在现实中用户喜好的影响导致组决策最后的决定,如果她是一个领域的专家。例如，一位电影爱好者可能会决定，当和她的朋友一起去看电影时，该小组应该看哪部电影。但是她可能不是决定他们之后要去哪家餐馆吃饭的那个人。Yuan等人也提出了群体推荐的共识模型(consensus model, COM)。模型假定(1)用户决策影响取决于决策的主题,和(2)群体决策过程是同时到组偏好的主题和每个用户的个人喜好的影响。尽管有这样的假设，COM还是受到与PIT相似的限制:两个模型都为每个用户学习一个固定的特征参数。PIT理所当然地认为一个有影响力的用户在她所有的团队中都占据着主导地位，COM期望一个用户在不同的团队中拥有同样的影响力。另外，等[13]假设参与项目的分数不仅取决于其对群体中每个成员的相关性，还取决于其对整个群体的相关性。他们开发了一种基于信息匹配的群组推荐模型，但该模型存在时间复杂度高的问题。最近，Hu等人开发了一个名为DLGR的深层架构模型，该模型学习了群体偏好的高级综合特征，避免了数据的脆弱性。然而,由于这个模型只关注预定义的组而不是特别的组，所以我们不比较DLGR和我们在本文中提出的模型。

本文提出的AGR模型学习并灵活地提取了不同群体的每个用户的影响权重参数的不同值。我们还给出了AGR和最先进的模型之间的比较结果

2.2基于深度学习的推荐系统

推荐系统是一种信息过滤系统，目的是根据用户的喜好向用户推荐项目，从而使得对用户推荐的项目相对较新。随着深度学习的普及，深度学习技术由于其先进的性能和高质量的推荐而被广泛应用于推荐系统[7,8,10,14,26,33,34]。深度学习能够捕获用户与项目之间的非线性和复杂的关系，从而更好地理解用户需求和项目特征，以及它们之间的交互。将深度学习集成到推荐系统的巨大成功表明，在各种各样的推荐任务中，专注于构建神经推荐系统的工作正在涌现，在[40]中可以找到全面的回顾。其中，利用深度学习技术进行群组推荐的作品非常有限。

我们提出的AGR模型使用基于用户评级历史的深度学习技术给出推荐结果，因此可以归类为基于CF模型的方法。特别地，AGR利用注意力机制来调整群组的表示，稍后将在第3节和第4节介绍更多的细节。模型设计还允许在需要时使用辅助信息，如用户内容特性，尽管这种模型的开发超出了本文的范围，在未来的工作中仍有待探索。

3 PRELIMINARIES

让U = {u1,u2，…，um}， I = {i1, i2，…， in}为M个用户和N个项目的集合。我们表示历史日志{⟨g1、s1⟩⟨g2,s2⟩...⟨gn,sn⟩},表示一个临时小组,表示该小组选中的项目。

给定目标组，我们的目标是生成组成员可能感兴趣的项目的推荐列表。

3.1贝叶斯个性化排名(BPR-Bayesian Personalized Ranking)

基于矩阵分解方法，贝叶斯个性化排序方法(BPR)旨在解决隐式反馈推荐[29]的挑战。BPR为一个用户和两个项目建立了三元模型:正项目被观察到，负项目没有被观察到。BPR 三元模型假设，如果用户u已经查看了一个项目i(正项)，那么用户肯定更喜欢这个项目而不是所有其他未观察到的(负面的)。因此，该模型将正项比负项排序更高。

BPR优化目标是基于最大后验估计器进行最优个性化排序。具体来说，BPR模型可以描述为:

其中(u, i, j)为属于集合Ds的三元组，集合Ds包含每个用户的所有正项和负项对;Θ表示模型参数;ˆRui(Θ)是用户u对项i的预测评分;σ是logistic sigmoid函数，λ 是正则化参数。我们采用BPR作为学习模型的基础

3.2注意力机制

注意力机制是最近深度学习中最令人兴奋的进展之一[4,9,35]。注意力的概念已经在神经科学和计算神经科学中得到了探索[12,16]。直觉上，当动物视觉上访问一个对象时，它会关注(注意)对象的某些重要部分，而不是整个对象，以得到一个响应。这一原则对于计算神经科学是必不可少的，因为它允许基于最相关的信息而不是所有可用的信息进行分析。

神经科学中关于注意力的思想激发了深度学习中注意机制的发展。注意机制已成功应用于各种机器学习任务，如机器翻译[4]，图像和视频字幕[35]，语音识别[9]。本文采用软注意机制模型，通过对一组特性的学习和分配，使更重要的特征得到更大的权重。具体来说,我们使用注意力来衡量每个小组成员在小组最后决策中的影响。

图2 注意机制

图2展示了注意机制的一个示例。注意模型采用x1, x2，…xn和上下文c。然后它返回xi的参考了上下文相关信息的组合，即向量y。具体地说,给定一个上下文c模型返回每个xi的加权算术平均数,权重αi根据xi的相关性得出。

尽管注意机制有许多不同的变体，上面示例中所示的版本是最流行的版本之一。注意模型的一个有趣的特性是,权重αi可以很容易地提取并绘制,使我们能够可视化特征xi的重要性并根据这些图表进行分析。

注意力机制在计算机视觉、自然语言处理等各个学科中都表现出了灵活性和有效性。我们提出的AGR是第一个基于注意力的群体推荐模型，从而将注意力机制的使用扩展到群体推荐中。

4注意力群组推荐

本节介绍我们的群组推荐(AGR)模型。首先，我们展示了模型背后的直觉和动机。然后，我们描述了通用框架，并将设计框架与其他最先进的模型进行了比较，以展示AGR的优势。

4.1 模型设计

AGR模型的目的是模拟基于以下直觉的群体决策:

•直觉1:当用户选择一个项目作为团队成员或个人时，她会以不同的方式调整自己的行为。具体来说,在群组的决策过程中，一个用户倾向于调整她的喜好,以适应群组偏好,而不是只考虑自己的兴趣。

直觉2:组中的用户通常有不同的背景和经验，用户在不同组中的行为会因其相关的专业知识而不同。例如，一个对电影有扎实了解的用户可能会主导为一个群体选择电影的决策，但可能不会对选择露营地点的决策做出任何贡献。

直觉3:群体的偏好是由成员的偏好决定的[3,13]。此外,用户选择一个项目时总是考虑他们的个人喜好和群体偏好[39]。用户决策因此受到其他小组成员的影响。

总的来说,我们观察到成员之间的相互作用对群组决策的产生非常重要:在做群组决定前，用户总是互相讨论他们的意见和偏好。在现有的方法中还没有对成员交互的重要性进行检验。AGR的一个主要贡献是，该模型探索用户如何影响组决策中的其他用户，以及组决策如何相应地变化。

图3 注意力群组推荐

4.2总体框架

AGR使用一种基于注意力的神经网络对群组与候选项的偏好得分进行建模。具体来说，我们利用注意力网络来学习每个组员的偏好程度

直觉上，我们认为，在群体决策过程中，(i)每个用户i提名一定的用户作为群体的主要决策者，(ii)然后得票最多的用户为群体选择一个条目。这样一个投票方案意味着相关领域的专家用户群组偏好通常获得高票。投票方案还假定每个用户在投票时同时考虑她的个人偏好和群组偏好(直觉1)。模拟群体决策的步骤(i)中,我们可以考虑影力响权重参数αi,j,代表i对用户j的投票偏好。可以假设影响力权重参数αi,j 对用户对(i,j)在所有包含i、j的用户群组中是常量。然而，由于用户i在不同的群体中，对用户j的影响力可能有不同的感知(直觉2)，这样的假设在现实中可能不成立。例如，用户j在与她的专业相关的群体中应该比在她不熟悉的群体中有更大的影响力。因此，影响力权重αi j应该根据不断变化的动态群组偏好进行计算。

我们建议使用基于注意力的模型来估计跨组的影响权重的变化，该模型假定每个用户只考虑对群组决策中相关主题重要的少数用户。正式的，给定组成员{u1,u2，…un}在群组g,我们定义αi,j作为用户j在子群组i（包含除了用户i以外的其他用户）中的偏好程度,。AGR因此学习权重αi,j作为用户j对整个群组的重要性,而不是仅仅特定用户i的影响。换句话说,注意力模型学习权重αi,j 考虑整个团队在用户i上的影响,包括用户j。我们从包含n个用户的g组中创建n个子组，探究每个用户对其余成员的影响(直觉3)，每个子网络注意力支持一个子群组。

AGR通过两个因素向量对每个用户i进行建模:用户潜在向量ui和用户上下文向量ci。这两个向量同时被学习。注意模型使用上下文向量ci来估计其他用户对于用户i的影响({u1,u2，…,ui−1,ui+1,,,un})。群组g的表达式为

,同时。我们考虑，也就是说，投票方案对所有用户的投票平等的进行计算。

群组g的表示可以进一步改写为，这个方程说明了AGR在学习每个用户j在不同群组中的动态权重时的灵活性。

子网络注意力模型。每个子网络注意力模型学习用户的偏好以便学习群组的表达。我们评估每个群组成员i和组内其他成员的交互以学习出i 对群组决策产生的影响。给定一个用户上下文向量ci和一组用户潜在向量{u1,u2，…un}，我们使用一个两层网络来计算注意力得分ai,j :

其中矩阵wc、Wu和bias b为第一层参数，向量w和bias c为第二层参数。我们简单地使用一个线性ϕ(x)= x,但还可以使用ReLU函数ϕ(x)= max(0,x)。

我们利用Softmax函数对ai,j进行归一化，得到最终的注意权重:

因此，我们得到项的分数为，其中

目标函数。AGR利用BPR两两学习来优化正负项目对的两两排序:

其中U、C和I是用户潜在向量、用户上下文向量和项目向量的集合;(g, j, k)是属于集合Ds的三元组，它包含每个群组g的所有正项和负项对;αi,l是用户l在子群组i的权重。

图3展示了AGR的架构。对于给定的组，我们创建n个子网络注意模型。每个子网络的注意模型，我选取了上下文向量ci和成员用户潜在向量的集合{u1,u2，…,ui−1,ui+ 1...un},然后返回每个用户j(j!=i)的注意力权重αi,j。尽管AGR的工作流程分为n个子网络注意力模型,所有子网络注意力模型在学习过程中共享相同的权重。每个子网络注意力模型i的输出使用加权求和计算并给出上下文ci。然后将所有子网络注意力的结果相加，形成最终的群潜在向量。最后，我们将BPR应用于最终的群潜伏向量，推导出BPR两两学习目标函数。

4.3方法的改进

AGR结合了最先进的模型优势和新的、灵活的深度学习应用，克服了PIT的局限性，极大地改善了群体决策过程。在本节中，我们将AGR与PIT进行比较，而不是COM，因为COM不像PIT和AGR那样学习个人影响权重的数值。

为每个群组的每组用户学习自定义权重而不是像PIT算法那样为一个用户在所有群组中分配相同权重，因此AGR能够检测到用户在不同的群组决策中的的影响。AGR因此为群组推荐提供了一个动态框架。AGR的一个显著优势是，该模型不仅可以了解不同组中的每个用户的动态权重，而且还允许我们提取权重值以进行进一步的可视化和评估。我们下一节的实验将比较AGR和矩阵分解模型，该模型为所有用户分配相同的权重，以及其他前沿方法，以展示AGR的优越灵活性。

未完

原论文地址： https://arxiv.org/abs/1804.04327

Attention-based Group Recommendation

转载请注明出处 https://www.cnblogs.com/kyxfx/articles/9181778.html

https://www.cnblogs.com/kyxfx/articles/Attention-based_Group_Recommendation.html

转载于:https://www.cnblogs.com/kyxfx/p/Attention-based_Group_Recommendation.html

前端大文件直传华为云OBS实践与问题解决 neon1204 前端工作中记录前端华为云状态模式前端框架 javascript vue.js
问题背景在我们的项目中，原本采用的文件上传方案是将文件先上传到应用服务器，再由服务器转发至华为云OBS。这种架构在实际运行中暴露了两个关键问题：上传速度严重受限：服务器的带宽成为瓶颈（特别是100MB以上的大文件）服务器压力过大：频繁出现负载过载告警为解决这些痛点，我们决定改为前端直传OBS方案。技术流程如下：前端后端华为云OBS1.初始化上传(initUploadUrl)uploadId,obj
LintCode算法刷题记录（入门 + 简单部分）隔壁敲代码的小王算法刷题笔记算法 LintCode
由于是初学者，实现的方法都很简单，暂时不考虑效率，之后（可能）会更新1.A+B问题给出两个整数aa和bb,求他们的和。样例如果a=1并且b=2，返回3。挑战显然你可以直接returna+b，但是你是否可以挑战一下不这样做？（不使用++等算数运算符）说明a和b都是32位整数么？是的我可以使用位运算符么？当然可以注意事项你不需要从输入流读入数据，只需要根据aplusb的两个参数a和b，计算他们的和并返
分布式ID设计方案详解：从理论到实践
一、为什么需要分布式ID？在分布式系统中，唯一ID的生成面临两大核心挑战：全局唯一性：避免跨节点、跨数据中心的ID冲突。有序性：确保ID按时间或业务规则递增，提升数据库写入性能（如InnoDB的B+树索引）。传统单机自增ID（如MySQLAUTO_INCREMENT）无法满足分库分表、高并发等场景需求，因此需引入分布式ID方案。二、主流分布式ID方案对比方案优点缺点适用场景UUID简单、无中心化依
也谈一下 30+ 程序员的出路写编程的木木 langchain 产品经理 python 开发语言大模型
前言前两天和一个前端同学聊天，他说不准备再做前端了，准备去考公。不过难度也很大。从20152016年那会儿开始互联网行业爆发，到现在有7、8年了，当年20多岁的小伙子们，现在也都30+了大量的人面临这个问题：大龄程序员就业竞争力差，未来该如何安身立命？先说我个人的看法：除非你有其他更好的资源，否则没有更好的出路认真搞技术，保持技术能力，你大概率不会失业（至少外包还在招人，外包也不少挣…）考公之我见
介绍6款密码暴力破解工具网安导师小李程序员网络安全编程 web安全网络安全 tcp/ip php python java
暴力破解就是通过不断穷举可能的密码，直至密码验证成功，暴力破解分为密码爆破和密码喷洒，密码爆破就是不断的去尝试不同的密码，密码喷洒就是通过已知密码不断去尝试账号。下面介绍6款常见的暴力破解工具。01hydraHydra（九头蛇）是THC组织开发的，是一款非常流行的密码破解工具，可以对多种服务的账号和密码进行爆破，包括Web登录、数据库、SSH、FTP等服务，支持Linux、Windows、Mac平
下一代防火墙 999感冒灵. 网络安全
一.防火墙是什么1.防火墙的定义：防火墙是一个位于内部网络与外部网络之间的安全系统（网络中不同区域之间），是按照一定的安全策略建立起来的硬件或软件系统，用于流量控制的系统（隔离），保护内部网络资源免受威胁（保护）。防火墙的主要用于防止黑客对安全区域网络的攻击，保护内部网络的安全运行。2.防火墙基本性质：①安全区域和接口：一台防火墙具有多个接口每个接口属于一个安全区域，每个区域具有唯一的名称，所以防
发起请求并处理响应：`XHR` 与 `axios` 使用指南来啦[特殊字符]~
又又又要长脑子呐~了解到通过发起HTTP请求并在不刷新页面的情况下更新页面内容是一种常见的需求。学习使用XMLHttpRequest或axios来实现，现在进行对比两者，比较项目使用时候的优缺点，文末使用表格进行对比学习1.使用XHR实现下面是一个使用XMLHttpRequest发起GET请求并处理服务器响应的示例：html体验AI代码助手代码解读复制代码//创建一个新的XMLHttpReques
2024年最全kali无线渗透之用wps加密模式可破解wpa模式的密码12_kali wps，网络安全开发究竟该如何学习 2401_84558314 程序员 wps web安全学习
一、网安学习成长路线图网安所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。二、网安视频合集观看零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。三、精品网安学习书籍当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔
《密码爆破漏洞详解》——黑客必修的入门操作( 建议收藏 ) 2401_84573531 2024年程序员学习 python
隔壁老张:“狗剩啊,隔壁xx村的王姐家的女娃好漂亮,我想盗她qq啊,你帮我把”狗剩:“我不会呀”村里大妈:“那个狗剩啊,盗个qq号都不会,他妈妈还好意思说他是学网络安全当黑客的”密码爆破漏洞详解密码爆破介绍密码爆破使用场景密码爆破利用思路防范密码爆破密码的复杂性密码加密登录逻辑验证码登录次数限制密码爆破介绍密码爆破又叫暴力猜解,简单来说就是将密码逐个尝试,直到找出真正的密码为止,本质上是利用了穷举
Kali系统MSF模块暴力破解MySQL弱口令漏洞
一、实验环境1.攻击方：攻击环境使用KALI系统（使用虚拟机搭建）的Metasploit模块，msfconsole是metasploit中的一个工具，它集成了很多漏洞的利用的脚本，并且使用起来很简单的网络安全工具。这里要特别强调：被攻击的环境必须开启mysql远程登陆服务,通常MySQL开启的端口号是3306，故而一般情况下要求被攻击的服务器开启了3306端口号。2.被攻击MySQL环境：Wind
计算机网络（网页显示过程，TCP三次握手，HTTP1.0，1.1，2.0，3.0，JWT cookie）老虎0627 计算机网络计算机网络 tcp/ip 网络协议
前言最近一直在看后端开发的面经，里面涉及到了好多计算机网络的知识，在这里以问题的形式写一个学习笔记（其中参考了:JavaGuide和小林coding这两个很好的学习网站）1.当键入网址后，到网页显示，其间发生了什么？（1）首先浏览器会解析URL。（如确定协议像Http或Https）（2）然后通过DNS服务器把域名解析为IP地址。（找到服务器啦）（3）接着TCP协议三次握手和服务器建立连接。（客户端
在C#中，可以不实例化一个类而直接调用其静态字段就是有点傻 C#c#
这是因为静态成员（staticmembers）属于类本身，而不是类的实例。这是静态成员的核心特性1.静态成员属于类，而非实例当用static关键字修饰字段、方法或属性时，这些成员会绑定到类级别，而不是实例级别。它们在类加载时（通常是在程序启动或首次访问时）由CLR（公共语言运行时）分配内存并初始化，与是否创建实例无关。2.为什么不需要实例化？内存分配：静态字段的内存空间在程序运行期间只有一份，所有
MySQL分布式ID冲突详解：场景、原因与解决方案码不停蹄的玄黓 mysql 分布式数据库 ID冲突
引言在分布式系统开发中，你是否遇到过这样的崩溃时刻？——明明每个数据库实例的自增ID都从1开始，插入数据时却提示“Duplicateentry‘100’forkey‘PRIMARY’”；或者分库分表后，不同库里的订单ID竟然重复，业务合并时直接报错……这些问题的核心，都是分布式ID冲突。今天咱们就来扒一扒MySQL分布式ID冲突的常见场景、底层原因，以及对应的解决方案，帮你彻底避开这些坑！一、为什
2025.7.6总结天真小巫职场记录职场和发展
第天，Morningpower1.四四呼吸，做了10分钟。2.感恩环节:有两周没去新励成上课了，感谢今天早上去上了«当众讲话»，遇到了不少老朋友，聊的还蛮开心滴，满足了我的社交需求。其次，在台上做了个小面试，之前找工作都不知道面试多少轮了，今日还是有些小紧张，估计是太久没来上课了。最后是觉得各位大佬的阅历真丰富。也让我更明确自身的一个职业发展路线:技术->市场/管理->创业。将自己变为专才再变为复
MongoDB Rust驱动代码架构深度解析倪俪珍Phineas
MongoDBRust驱动代码架构深度解析mongo-rust-driverTheofficialMongoDBRustDriver项目地址:https://gitcode.com/gh_mirrors/mo/mongo-rust-driver前言本文将对MongoDB官方Rust驱动(mongo-rust-driver)的核心架构进行深入解析，帮助开发者理解其设计哲学和实现细节。我们将从客户端构
如何在YashanDB中管理数据模型变更数据库
在现代企业中，数据模型的变更管理扮演着关键角色。无论是扩展现有业务，还是应对新的需求，业务模型的改变往往需要相应的数据模型更新。如何有效地管理这些变更，确保数据的完整性、一致性及应用的高可用性，成为了数据架构师和开发者必须面对的重要问题。本文将详细探讨在YashanDB中管理数据模型变更的策略和方法，旨在提升对YashanDB数据库技术的理解及应用能力。数据模型变更管理的关键要素版本控制与变更日志
如何在YashanDB数据库中使用JSON数据类型？数据库
随着海量结构化与半结构化数据的快速增长，关系型数据库面临性能瓶颈和数据一致性的挑战。JSON作为一种灵活的半结构化数据格式，在多领域数据交换和存储中广泛应用。YashanDB作为支持多种存储结构和高性能事务处理的数据库产品，提供了对JSON数据类型的支持，以满足现代复杂业务对半结构化数据处理的需求。本文旨在基于YashanDB体系架构及存储引擎特性，深入解析JSON数据类型的技术原理与实现方式，为
如何在YashanDB数据库中实现数据查询优化数据库
在现代信息技术环境中，数据量的快速增长使得数据库的性能优化成为重要课题。如何提升查询速度，降低资源消耗，成为了数据库管理人员和开发者必须面对的挑战。有效的数据查询优化不仅能提高响应时间，还能显著提升用户体验与系统效率。在YashanDB数据库中，优化数据查询需从多个技术角度进行综合考量与实际应用。利用索引技术优化查询索引是提升数据库查询性能的常用手段。在YashanDB中，主要支持BTree索引、
如何在YashanDB数据库中实现数据模型的简化数据库
在现代数据库技术领域，数据模型的复杂性经常导致性能瓶颈和维护困惑。随着数据规模的增长和业务诉求的增加，复杂的数据结构、冗余的存储和不必要的关联关系都会影响整体数据库的性能和可维护性。特别是在面对动态变化的业务需求时，灵活性和扩展性成为关键因素。YashanDB提供了一系列功能强大的工具和机制，能够有效简化数据模型，提升数据库性能，并增强数据操作的灵活性。本文章旨在为数据库开发者和架构师提供技术洞见
如何在YashanDB数据库中实现复杂事务管理数据库
在现代数据库管理系统中，事务管理是一项关键功能。复杂的事务管理可以确保多条SQL操作的原子性、一致性、隔离性和持久性（ACID特性），减少数据的不一致和错误。尤其在高并发场景中，事务管理的机制与实现至关重要。因此，构建高效的事务管理系统，对于提升数据库的性能及应用程序的可靠性具有深远影响。YashanDB的事务特性YashanDB数据库支持全面的事务管理功能，通过多版本并发控制（MVCC）、事务隔
深入解析BEM架构：架构级全局样式管理方案 neon1204 前端方案分析和实践架构前端 css webpack
深入解析BEM架构：架构级全局样式管理方案在前端开发领域，CSS架构一直是影响项目可维护性和可扩展性的关键因素。随着SPA应用的普及，传统CSS管理方式的缺陷在开发中暴露出明显的问题：样式冲突、选择器权重失控、命名污染等，从代码质量和开发效率角度出发可以借鉴一些优秀的案例。各种组件库（element、antd、vant…）使用多了能发现它们的样式就是采取的BEM（Block,Element,Mod
如何在YashanDB数据库中管理用户权限数据库
在数据库管理系统中，用户权限的管理是保障数据安全和系统稳定运行的关键环节。合理的权限控制能有效防止未经授权的访问和误操作，同时满足业务需求的灵活性。对于YashanDB数据库，充分理解其权限体系与管理机制，有助于构建安全、稳定且高效的数据库应用环境。本文将深入解析YashanDB中用户权限管理的技术原理、实现功能和最佳实践。YashanDB的用户与角色机制YashanDB管理权限的核心实体为“用户
如何在YashanDB数据库中进行高效的JSON数据存储数据库
随着业务对非结构化和半结构化数据存储需求的增加，JSON数据类型逐渐成为数据库支持的关键特性。然而，JSON数据的高效存储与访问面临性能瓶颈、一致性保障及空间利用率等挑战。YashanDB作为现代企业级数据库，需提供有效的机制解决上述难题，从而满足实时查询、高并发访问及数据一致性的需求。本文针对YashanDB数据库的体系架构、存储引擎及索引机制，深入分析如何实现高效的JSON数据存储与访问，旨在
如何在YashanDB数据库中高效处理海量数据数据库
在现代数据库技术中，海量数据的管理和处理成为了一个普遍存在的挑战。随着数据规模的不断扩大，性能瓶颈、数据一致性问题以及易用性需求等问题日益凸显。这些挑战促使企业寻求更为高效的解决方案，以支撑海量数据的存储、分析与挖掘。YashanDB作为一款专为处理海量数据而设计的数据库，凭借其高可扩展性、高并发性能和高可用性，提供了一系列技术手段以应对这些挑战。本文旨在探讨如何在YashanDB中高效地管理和处
如何有效管理YashanDB的访问控制数据库
引言在当今数字化的业务环境中，数据安全性和访问控制是数据库管理的核心问题。随着数据规模的不断扩大，以及对数据隐私和合规性的要求日益增强，如何有效管理数据库的访问权限已成为企业面临的重大挑战。YashanDB作为一个高性能的数据库管理系统，具备丰富的访问控制功能，但同时也带来了复杂的管理需求。本篇文章将深入探讨YashanDB的访问控制机制，包括用户管理、角色权限、身份认证及其他相关策略，旨在为数据
如何在YashanDB数据库中保持数据一致性与完整性数据库
在现代数据库管理系统中，确保数据的一致性与完整性是面临的主要挑战之一。这一挑战在高并发、高要求的数据操作场景中尤为突出。YashanDB作为一种高性能的分布式数据库，采用了多种技术手段以保持数据的一致性与完整性。本文将深入探讨YashanDB中实现数据一致性与完整性的核心技术原理，适用于对高并发和复杂事务有一定理解的数据库管理员（DBA）和开发人员。事务管理与ACID特性事务是数据库操作的基本单元
如何实现YashanDB中的数据冗余处理数据库
数据冗余是数据库管理中的一个重要话题，直接影响到数据的可用性与可靠性。在高并发场景下，数据冗余能够有效防止数据丢失，并提升系统的容灾能力。YashanDB作为一款高性能的数据库产品，通过灵活的结构和多种部署方式，实现了数据冗余处理。本文将详细探讨YashanDB中实现数据冗余处理的技术细节，为数据库管理员和开发人员提供理论支持和实践指导。YashanDB的数据冗余机制单机部署中的数据冗余在单机部署
如何确保YashanDB数据库的性能稳定？数据库
在当今数据量激增的背景下，数据库的性能稳定性成为企业技术架构成功的关键因素之一。数据库面临的挑战包括性能瓶颈、数据一致性问题及并发访问的影响。为了应对这些问题，YashanDB作为一种新兴的数据库管理系统，提供了先进的架构和功能，旨在为高性能和高可用性提供保障。本文将详细探讨确保YashanDB数据库性能稳定性的方法，旨在为数据库管理员、系统架构师及IT技术负责人提供实用建议，实现企业数据处理的高
如何设计基于YashanDB数据库的高效查询数据库
在当今数据驱动的业务环境中，提高数据库查询性能已经成为各类企业面临的重大挑战。随着数据量的快速增长，许多机构遭遇了性能瓶颈、数据一致性问题和查询响应延迟等一系列问题。在这样的背景下，优化数据库架构、提高查询效率迫在眉睫。本文将集中在YashanDB数据库的查询设计上，提供技术分析和操作指导，以帮助开发人员设计高效的查询策略，实现优越的性能。YashanDB的体系架构YashanDB支持多种部署形态
如何实现YashanDB数据库的负载均衡数据库
在现代应用中，数据库的性能直接影响整个系统的效率和用户体验。因此，数据库的负载均衡成为了设计和部署中不可忽视的重要环节。YashanDB是一个新兴的数据库系统，其支持多种架构和配置，适合不同的业务场景。通过合理实现YashanDB的负载均衡，可以有效提升系统的并发处理能力、降低响应时间及提高可用性。YashanDB的架构概述YashanDB支持多种部署模式，包括单机（主备）部署、分布式集群部署以及
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟

基于注意力机制的群组推荐算法

你可能感兴趣的:(基于注意力机制的群组推荐算法)