追赶早晨

知识图谱论文阅读（十七）【WWW2021】DGCN: Diversified Recommendation with Graph Convolutional Networks

本论文是很明显是基于KGCN的！如果不懂KGCN，可以看我上一篇博文

论文题目： DGCN: Diversified Recommendation with Graph Convolutional
Networks
论文链接：
论文代码： https://github.com/tsinghua-fib-lab/DGCN

想法

similar but negative items：指的是同一类别的items，但是是用户不喜欢的，所以称为是消极的

创新

（1）和（2）没有改变生成阶段的顺序，而（3）则是存在实际问题。那么我们就是添加上游任务中，生成一个排序结果，而不仅仅是候选items + 多样性排序
Rebalanced Neighbor Discovering（邻居取样器，提高劣势类别样本的提取率，降低优势类别样本的提取率；）
提高同一类别的消极样本，从而迫使系统能够更加细化user的对同一类别的items，从而使得结果更多样性（Category-Boosted Negative Sampling）
对抗学习

摘要

动机：
多样性是衡量推荐items的一个关键因素，但是却很少受到审查！多样性通常会在生成候选项之后考虑，然而这种多样性和生成候选项的分步骤设计使得整个系统表现的不好。

我们：
因此本论文中我们的目标就是将多样性添加到候选items生成阶段！利用GCN！但是GCN在CF上有很大的提高，但是本身是没有多样性的！我们提出在GCN上进行重平衡的邻居发现、类别增强负抽样和对抗学习。

1 INTRODUCTION

我们方法的必要性：
除了相关性，新鲜感、多样性和可解释性等也会影响用户对推荐内容的感知。

生成阶段顺序
为了保证用户的满意度，提出了后处理、行列式点过程(determinanting point Process, DPP)和学习排序(Learning to Rank, LTR)三个方向的方法来提高推荐结果[60]的多样性。
（1）在早期，一般都是在生成候选items后再增加一个re-rank或者是post-processing module，最后推荐的item由相关性和多样性之间平衡来定。许多解决方法被提出，但是都是将重排序当作独立于候选items生成的模块，从优化推荐模型中解耦，这使得多样性信号没有反应到上游相关匹配模型中。
（2）最近，另一个研究方向利用DPP来取代post-processing based methods，但是该过程仍然在生成阶段之后。
（3）再之后，需要based on LTR方法被提出，它直接生成排序的items，而不是候选items，然而需要收集可行的数据集，存在实际问题。

综上，（1）和（2）没有改变生成阶段的顺序，而（3）则是存在实际问题。

要有特定于多样性的设计，使的弱势类别更加容易获得
user-item双部分图，一个用户的高阶邻居往往覆盖多种items，因此很适合在图上进行多样性训练。然而，如果没有针对多样性的特定设计，这些高阶连接可能无法自动用于寻找彼此不相似的item。比如，推荐系统可以很容易的学会提供交互最频繁的类别项，因为，它们占了大部分边，虽然GCN这样提高了准确性，但是却忽略了多样性。

我们的方法：
很明显，本工作中将会更加专注于多样化的邻居的发现，所以会更改相关算法，从而使得弱势类别更加容易获得。我们对负抽样过程进行调整，以提高抽样similar but negative。此外，我们利用对抗性学习来提取学习后的嵌入空间中的隐含类别偏好。 end-to-end model called DGCN。

PRELIMINARIES

2.1 多样性

推荐的多样性可以是用户内部级别的，也可以是用户间级别的。 intra-user是单个用户的推荐内容的不相似性； inter-user则是集中于为不同用户提供内容。本论文中，我们目标是提高intra-user的多样性。

推荐给每个用户的类别中第一种便是按照他购买物品类别的比例来推荐，比如买的东西是电子设备：衣服：饮品。那么在推荐的时候也要按照个比例来推荐；其二便是给用户提供他本身没有意识到的物品，比如他可能也喜欢读书，但是书本本来平时搜的少！

本论文中，我们关注的是多种类别！因此有不同的评判标准：

Converage：这个指标衡量推荐类别的数量。覆盖范围反映了推荐系统的整体性和全面性。
entropy: 这关注的是不同类别的分布。用前面的例子，4个电子设备，3件衣服，3杯饮料的熵值比推荐7个电子设备，3杯饮料的熵值高。
gini index:该指标在经济学中被广泛采用，用于衡量财富或收入不平等，[2]对该指标进行了进一步调整，并将其引入推荐。属于某一特定类别的项目的数量可以解释为该类别的财富。

需要注意的是，在覆盖度和熵值方面，值越大，多样性越强，而基尼系数则相反(越低越好)。

2.2 推荐pipeline

推荐系统典型流程包含三个阶段：（1）匹配（2）评分（3）重排名；匹配阶段的时候，就是海选的时候，得到一大部分items；评分阶段需要深度学习模型来得到分数，从而几十项items会被选择；重排名中，选择的items会被重新排序来满足额外的约束。

现有的方法往往将多样性约束放到重排序中，这样使得与上游匹配和评分模型无关，系统则效果不好；其次，匹配模型不知道多样性的信号使得信息本来就是冗余的。

2.3 Accuracy-Diversity dilemma

准确率和多样性往往是反比，比如下图中，随机的、矩阵分解的、神经图CF和需要的多样性算法（MMR、DUM、PFM+α+β 和 DPP），使用了一个真实世界最大的交易数据集TAOBAO

这需要找到一个平衡点！

3 METHOD

3.1 Overview

首先建立一个user-item图，边代表了行为，同时是一个无向图。
其次我们提出重新平衡邻居发现来解决不同类别的不一致问题，为了多样性，我们对负抽样过程做出了调整，增加了选择相似items的概率。同时我们添加了一个item类别的对抗性任务来增加多样性。

Rebalanced Neighbor Discovering 为了在图中发现更多不同的项，我们根据邻居的分布设计了一个邻居采样器，其中提高了选择劣势类别的概率，限制了优势类别。同时，在邻居采样器的引导下，多个类别的更容易到达
Category-Boosted Negative Sampling 我们建议选择相似且负的样本，并增加其选择概率，而不是随机采样。通过扭曲负样本的分布，user和item的表示会更好地被学习。
Adversarial Learning
在item的类别上玩一个最大最小的游戏。我们提取用户的类别偏好基于item偏好，但是却使得学习到的嵌入没有类别。因此，这种最大最小博弈使得嵌入空间会有更多的类别。

3.2 GCN

我们的GCN由一个嵌入层和一堆图卷积层组成，其中每个图卷积层包含一个广播操作和一个聚合操作。

3.2.1 Embedding Layer

GCN的输入仅仅是users和items的ID features（也就是说是one-hot ID后学习到的）；因此我们有了下面的嵌入查询表：

每个实体都会被喂入GCN中在图中传递信息。

3.2.2 Graph Convolutional Layer.

卷积层包含了一个发送和一个聚合！
发送方面：
图卷积层中，每个节点向所有邻居广播自己的嵌入，同时呢，也聚合发送给它本身的的所有消息来更新它自己的嵌入（因为每个节点既是下一跳的发送者，同时也是上一跳的接受者）！

聚合方面：

$h_v^k$ 是节点 $v$ 的 $k$ -th层的特征向量， $\mathcal{N}(v)$ 表明了节点 $v$ 的取样邻居的集合。在[59]的研究中，添加自环在图卷积网络中是至关重要的，因为它压缩了归一化拉普拉斯的频谱。因此我们也会将 $v$ 本身添加到 $\mathcal{N}(v)$ 中，通过这种方式，节点的嵌入以分层的方式在图上传播。

3.2.3 Interaction Modeling.

在匹配阶段，由于计算成本和延迟要求，所以内积和L2距离被广泛使用，而且在线服务中，也是很有效果的！因此可以加快邻居的寻找算法。因此，我们在图的最后一层卷积层使用user和items的表示，并取它们的内积来估计交互概率。

3.2.4 防止过度拟合

我们会以概率p来随机的去掉连续卷积层之间的中间节点嵌入，p是超参数需要学习。
下面我们将讲解利用高阶连通性来学习多样化。

3.3 Rebalanced Neighbor Discovering

将百万级别的图直接运行GCN不现实，而分成mini-batch会影响效果。因此，邻居取样器（neighbor sampler）应运而生！它可以从原始图中采样出子图，同时在图上的归纳学习会被实现，并且已经证明可以在数十亿级别的图上使用。具体而言，邻居采样器会生成 $N o d e F l o w$ ，这是一个多层的子图，其中边缘只存在于连续的层中。

图中： 2层的GCN的邻居采样器生成的Node Flow。在该例子中，一个小批由一定数量(即批大小)的user和item组成，组成种子集。所以在该图中节点node A和node B是种子节点。对于每个节点，随机取样它的两个邻居（比如A的就是D和G； B的就是D和F），然后对block 1使用GCN层；而在block 1中激活的邻居将作为新的种子（也就是D、F和G），重复每个节点再随机取两个邻居。再在Block 2上执行GCN。每个卷积层对应一个块。

上面所有的都是别人东西，下面是自己的东西。
但是上面的发现策略忽略了多样性问题。在真实世界中，不同类别的item会以不同的方式对待！根据用户花费的时间的长短，我们大致分为优势和劣势类别。优势类别会成为主流，而劣势类别不被关注。

因此我们提高了从劣势类别中抽取项目的概率，并限制了从优势类别中抽取项目的数量。强调了类别多样化，重新平衡的邻居发现算法如算法1和算法2所示，由于篇幅的限制，我们省略了GetNeighbors和SampleWithProbability的详细说明，这只是在邻接类别和给出分布的随机选项的简单的查找操作。在一个user node，我们首先生成item类别的直方图，然后取直方图的逆来增加劣势邻居的比例。同时，一个平衡参数α会控制bias；对于一个item node，我们平等对待与它相连的每一个user，并均匀地抽样它的邻居。这样就会增加了多样性。

知识图谱论文阅读（十七）【WWW2021】DGCN: Diversified Recommendation with Graph Convolutional Networks_第5张图片

3.4 Category-Boosted Negative Sampling

从字面上就能理解个大概，就是将上面的取样概率引入到负样本取样。

当前匹配的主要挑战也被称为是隐式反馈。隐式反馈的意思是说：负样本并不一定意味着用户真正不喜欢的！因此探索用户的隐式反馈也是一大挑战。在实际中，消极实例是通过从那些没有交互过的items中随机抽样的。在训练时，正样本和一定数量的负样本配对（负样本率），通过pointwise或者pairwise损失函数来优化，使得正向items与user更接近，而消极items和user越远。

很多工作在致力于negative sampler的设计，在本论文中，我们提出选择similar but negative items, 也就是与阳性样本类别相同的item。通过从positive category中抽取负面items，推荐系统将会在一个类别中区分用户的偏好。这样会使得推荐系统在同一类别中有更强大的区分能力，使得推荐系统会多考虑多种类别的items（就是说只有top-50，现在同一类别中冗余的少了，那么腾出位置给不同类别的了！）

超参数β用来控制相似items的取样比例。在训练阶段，等多similar but negative items会增强推荐系统的能力，从而从多种种类中捕获用户的兴趣。

图5:取样空间的说明。消极的实例是从积极的items中抽取的。我们提出了类别增强的负抽样，它提高了从积极类别(浅绿色区域)的项目中抽样的概率。
这里就是实际的生活，消极类别就是多于积极的类别，同时在积极类别中选取积极的items！而这里我们取样时，在积极类别中抽样消极实例，消极类别又多于积极类别，这增加了来自消极类别的积极items被推荐的可能（解释同上）。从而生成更多多样化的候选items

3.5 Adversarial Learning

模型训练阶段！大多数推荐模型都是单一的准确率目标，忽略了推荐的多样性。在只有一个准确率优化对象的情况下，用户的类别偏好是通过用户的物品偏好隐式学习的。以第2节中的相同例子为例，推荐系统可能会了解到用户对整个类别(即电子设备)的兴趣，但无法区分用户对不同电子设备的具体偏好（也就是说上面没有同类消极样本）。

所以不提取隐含的类别偏好会导致推荐更过积极类别的items！受生成模型研究进展的启发，我们建议增加items类别分类的竞争性任务，以达到精馏的目的，进一步增强多样性。具体上说，我们将推荐模型当作生成器，同时增加了一个分类器用来预测该item的类别。而推荐系统要尽力如fool分类器。

我们的实验中，采用全连接层作为分类器，并使用交叉熵损失进行优化。在推荐方法，采用log loss。

在对抗性学习的设置下，项目类别分类器的目标为最小化 $L_c$ ，推荐模型的目标是最小化 $L_r-\Upsilon L_c$ 。其中 $\Upsilon$ 是平衡主任务和额外对抗任务的。
在分类器中，是通过寻找item embedding的聚类来最小化分类损失的（就是分类！！分类就是聚类）；而推荐模型中，分类损失被逆转了，使得同一类别的item嵌入彼此远离（因为推荐系统就是要区分items使得不同的被推荐）。

在实现方面，反向传播过程中插入梯度反转层（GRL）可以很好的完成对抗学习，在领域自适应网络（GAN）中首次引入。同时我们期望分类器最小化 $L_c$ ，迫使GCN最大化 $L_c$ 。我们在从GCN中嵌入的item学习和完全连接的分类器之间插入一个GRL（两个D之间）。在反向传播过程中，最小化分类损失的梯度通过分类器反向流动，并经过GRL。梯度将被逆转（加负号），进一步流向GCN，即对于损失 $L_c$ ，分类器的参数进行梯度下降，对GCN的参数进行梯度上升。对于 $L_r$ ，梯度下降会被应用到GCN。

4. Experiment

在本节中，我们通过实验回答以下研究问题:
•RQ1:与其他多样化推荐算法相比，本文提出的方法表现如何?
•RQ2: DGCN中每个拟议成分的影响是什么?
•RQ3:如何使用DGCN在准确性和多样性之间进行权衡?

数据集：Taobao、Beibei、MSD、
基线： MMR、DUM、PMF+α+β、DPP
参数设计：

评估：我们使用内积来评估交互可能性；使用Faiss来生成候选items；在评估的时候，我们会在Faiss中创建一个search index（IndexFlatIP6用于基于内积的最近邻搜索），将用户嵌入作为查询向量提供给搜索索引，将检索与查询向量最大内积的项，并根据检索到的项进一步计算推荐指标。此外，评估中会生成batch，并在GPU上加速。在最近邻搜索的帮助下，我们成功地将评估的时间成本降低到几秒。

4.2 Overall Performance (RQ1)

我们提出的DGCN实现了更好的整体性能。

4.3 Study on DGCN (RQ2）

在本节中，我们对我们在DGCN中提出的每个组件进行消融研究。我们比较了我们所提出的方法在重新平衡邻居发现、类别增强负抽样和对抗学习方面的性能。

在不丢失GCN优越性能的前提下，我们提出的DGCN在GCN的基础上，采用了三种特殊的多样化设计，大大提高了多样性，同时也保证了推荐项目的相关性

4.4 Trade-off between Accuracy and Diversity(RQ3)

在提出的框架中，我们引入两个超参数α和β，以控制重平衡邻居发现和类别增强负抽样的强度。我们现在研究这两个超参数是否可以用于在准确性和多样性之间进行权衡。

总之，我们进行了广泛的实验来评估我们提出的DGCN，特别强调多样化。在真实数据集上的整体性能证实了我们方法在改善多样性方面的有效性。对DGCN的消融研究证实了各成分的功能。进一步的实验表明，通过调整引入的超参数，可以在精度和分集之间实现平滑的平衡。

python排序算法之桶排序华强笔记 python数据结构和算法 python 算法
桶排序主要适用于全是数字的列表排序代码如下：defbuckrt_sort(li,n=100,max_num=10000):bucket=[[]for_inrange(n)]
【无标题】
PyQt5相关论文方向扩充及技术特性解析PyQt5的核心优势PyQt5作为基于Qt框架的Python绑定库，在科研与工程应用中具备显著优势。其跨平台兼容性极强，可在Windows、macOS、Linux等主流操作系统上稳定运行，且能保持界面风格的一致性，这对开发多场景应用系统至关重要。在界面设计方面，PyQt5提供了丰富的UI组件库，从基础的按钮、文本框到高级的图表、3D控件应有尽有，同时支持Qt
Python数据读写与组织全解析（查缺补漏篇） Monkey的自我迭代 python学习的查缺补漏机器学习人工智能 python
1高维数据由键值对类型的数据构成，可以多层嵌套。高维数据相比一维和二维数据能表达更加灵活和复杂的数据关系，可以用字典类型表示。一维数据不用字典类型来表示。2read、readline、redlines和for循环输出读取的区别直接read，读取的结果就是一个字符串，和文件中一模一样f_2=open('cpi.csv','r')print(f_2.read())指标,2015,2016,2017,居
Python文件路径操作全面指南：从基础到高级应用 Monkey的自我迭代 python 开发语言
文件路径操作是Python编程中不可或缺的核心技能，无论是数据科学、Web开发还是自动化办公，都离不开对文件路径的有效管理。本文将系统性地介绍Python中文件路径操作的各类方法，帮助您掌握这一关键技术。一、文件路径基础概念1.1路径类型解析文件路径主要分为两种类型，理解它们的区别是路径操作的基础：绝对路径：从文件系统根目录开始的完整路径，如Windows系统中的C:\Users\Username
python排序算法之基数排序华强笔记 python数据结构和算法 python 算法
#代码如下：'''基数排序：1.把数据分为10个桶，以为数字有0-9这10个2.依次把数据的个位，十位，百位等等各个位数的数据进行分桶排序，放在这10个桶中3.最大的数有k位，则循环k次4.时间复杂度O(kn),空间复杂度O(k+n),其中k=log10(n)+1'''defradixs_sort(li):max_num=max(li)it=0while10**it<=max_num:bucket
京东零售重磅开源 | OxyGent：像搭乐高一样组装AI团队，实现群体智能京东零售技术零售开源人工智能
京东零售Oxygen团队正式开源发布多智能体协作框架——OxyGent。这一创新框架致力于帮助开发者高效组装多智能体协作系统，实现智能体间的无缝协作、弹性扩展与全链路可追溯。推动人工智能从“单点突破”迈向“群体智能”时代。OxyGent已在开源社区正式上线。开源地址：https://github.com/jd-opensource/OxyGent官网地址：https://oxygent.jd.co
具身智能的视觉-语言导航综述
24年2月来自曲阜师范、华东师大和哈工大的论文“Vision-LanguageNavigationwithEmbodiedIntelligence:ASurvey”。作为人工智能领域的长期愿景，具身智能的核心目标是提升智体与环境的感知、理解和交互能力。视觉-语言导航（VLN）作为实现具身智能的重要研究路径，致力于探索智体如何利用自然语言与人进行有效沟通，接收并理解指令，并最终依靠视觉信息实现精准导
python折半查找算法_python二分查找代码试用递归法编写python程序实现折半查找算法...
python二分查找算法函数bi_search(),该函数实现检回忆，很美却很伤；回忆只是回不到过去的记忆。输入格式:第一行为正整数n接下来若干行为待查找的数字，每行输入一个总是女人为了天长地久而烦恼，男人却可以洒脱地出乎意料。defprime(n):ifnend:return-1mid=(start+end)//2ifprimelist[mid]==prime:returnmidelifprim
具身智能：从理论到实践的跨越
具身智能（EmbodiedAI）的概念起源与发展是一个跨越半个多世纪的学术探索历程，其核心思想在不同学科的交叉碰撞中逐渐成型。以下从理论源头、技术奠基、术语演进三个维度展开解析，揭示这一概念的学术脉络与产业价值：一、理论源头：从图灵的哲学构想到认知科学的具身化转向1.图灵的"感官机器"设想（1950年）在人工智能奠基性论文《计算机器与智能》中，图灵提出了两种智能发展路径：抽象计算路径：如国际象棋等
PyCharm高效入门指南：从零开始掌握Python开发利器软考和人工智能学堂 Python开发经验强化学习 PyCharm
引言PyCharm是JetBrains公司推出的一款强大的Python集成开发环境(IDE)，被全球数百万Python开发者所青睐。无论你是Python初学者还是经验丰富的开发者，掌握PyCharm都能显著提升你的开发效率。本文将带你从零开始，全面了解PyCharm的核心功能和使用技巧。1.PyCharm的安装与配置1.1下载与安装首先访问JetBrains官网下载PyCharm。PyCharm有
python作业陈小铃子 python 开发语言
基础练习练习目标函数01.计算车费题目描述小红打车，起步价8元(3公里),每公里收费2元，她打车行驶了n公里，通过函数封装并计算车费输入描述输入一个公里数输出描述输出应付车费示例输入：5输出：12defcalculate_fare(distance):base_price=8#起步价per_km_cost=2#每公里费用min_distance=3#最小计费距离ifdistance0:sum_nu
【Python】(三）面试题和Py基础题戏精亿点点菜面试职场和发展 python
1.技术面试题（1）解释Linux中的进程、线程和守护进程的概念，以及如何管理它们？答：进程（Process）：进程是操作系统中资源分配的基本单位，是正在运行的程序的实例。每个进程都有自己的内存空间、文件描述符和执行上下文。管理：①查看进程：使用ps、top、htop等命令查看当前运行的进程。②启动进程：通过命令行或脚本启动新进程。③终止进程：使用kill命令发送信号终止进程，例如kill-9PI
python小工具：测内网服务器网速和延迟秃了也弱了。 python大家庭服务器 python java
文章目录一、使用1、代码2、使用3、注意事项一、使用1、代码importargparseimportsocketimporttimeimportsubprocessimportreimportsysdefmeasure_latency(host):#使用ping命令测量延迟try:#根据操作系统选择ping参数ifsys.platform.startswith('win'):output=subp
Python面试题-6 编织幻境的妖 python 服务器开发语言
1.请解释Python中的动态类型。Python中的动态类型Python是一种动态类型语言，这意味着你不需要在编程时声明变量的类型，而是在运行时自动推断类型。在Python中，变量的类型是在程序运行时决定的，这意味着同一个变量可以在不改变其类型的情形下被赋予不同类型的值。动态类型的优点在于它提高了编程的灵活性，因为你不需要预先确定数据的类型，可以更容易地写出简洁的代码。然而，这也可能导致运行时错误
火爆全网的条形竞赛图，Python轻松实现统计学家
image这个动图叫条形竞赛图，非常适合制作随时间变动的数据。我已经用streamlit+bar_chart_race实现了，然后白嫖了heroku的服务器，大家通过下面的网址上传csv格式的表格就可以轻松制作条形竞赛图，生成的视频可以保存本地。https://bar-chart-race-app.herokuapp.com/本文我将实现过程介绍一下，白嫖服务器+部署留在下期再讲。纯matplot
【无标题】Python---day9 模块化编程概念（模块、包、导入）及常见系统模块总结和第三方模块管理 AnAn__kang python java 服务器
系列文章目录前言跟着博主学Python，今天我们来到了第九天的学习，模块化编程的概念。Python作为一门编程语言，本身就是用于对模块以及各种包的使用来达到我们自己想到创作的目的。所以今天博主就给大家盘点一下有关于各种常见的包以及如何进行导入的。一.模块Module，模块1.1基本概念定义：模块是一个Python文件，每个.py.py.py文件就是一个模块。作用：用于组织代码，避免代码重复，提高复
Python --- day 10 Opencv模块的使用 AnAn__kang python opencv 开发语言
系列文章目录前言今天博主带大家进入Opencv的学习，这是一个专门针对处理图像和视频的一个模块，大家以理解为主，增强自己的编程思维，再后续我们训练模型时会大批量的处理图片时会经常用到这个模块。1OpenCV介绍OpenCV（开放源代码计算机视觉库）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成，用于图像处理、计算机视觉领域的算法实现。1.1OpenCV优势**开源免费：**完全
【无标题】Python --- Day5 函数的位置传参、关键词传参及其可变性和解包操作 AnAn__kang python 前端人工智能
系列文章目录前言今天小伙伴们跟我进入第五天的Python课程学习，主要是关于函数的位置传参，关键传参和可变性和解包传参这其中的具体定义以及它们的使用场景`一、调用传参函数调用时传递参数的方式有多种，包括位置传参、关键词传参、多个参数解包、参数默认值等。1.1位置传参最常见的传参方式，参数按定义的顺序依次传入函数。示例：defgreet(name,age):print(f"Hello,{name}.
时序数据库在数据库领域的行业应用数据库管理艺术数据库时序数据库 ai
时序数据库在数据库领域的行业应用关键词：时序数据库、数据库领域、行业应用、时间序列数据、实时分析摘要：本文深入探讨了时序数据库在数据库领域的行业应用。首先介绍了时序数据库的背景知识，包括其目的、适用读者、文档结构和相关术语。接着阐述了时序数据库的核心概念、架构和工作原理，通过Python代码详细讲解了核心算法。还介绍了相关的数学模型和公式，并举例说明。在项目实战部分，给出了开发环境搭建、源代码实现
Python --- Day3 推导式及常见语句和内置函数的学习！！！
系列文章目录前言相信各位伙伴们在前俩次的文章和Python的基础学习中大有收获，这次我们将进入推导式，常见语句和内置函数的学习！跟着博主一起成为一名Ai的算法工程师！一、推导式用更简洁的方式创建列表、字典和集合。是Python特有的一种表达式形式。1.1列表推导式a=[1,2,3,4]result=[x*2forxina]#创建一个新列表，元素是原列表每个元素的两倍1.2字典推导式a=['a','
生命3.0时代，面对人工智能时代的到来，我们可以做些什么笃定的沙丁鱼
生命的定义生命的定义有很多，最为人所熟知的是在生物学上的定义，即生命是蛋白质存在的一种形式。但是，这种定义可能不太适用于未来的智能机器和外星文明，我们不能将我们对未来生命的思考局限在过去遇到过的物种，所以需要将生命定义得更广阔一些：生命是一个能保持自身复杂性并能进行复制的过程。复制的对象并不是由原子组成的物质，而是能阐明原子是如何排列的信息，这种信息由比特组成。换句话说：我们可以将生命看作一种自我
cuda编程python接口_使用Python写CUDA程序的方法 weixin_39822184 cuda编程python接口
使用Python写CUDA程序有两种方式：*Numba*PyCUDAnumbapro现在已经不推荐使用了，功能被拆分并分别被集成到accelerate和Numba了。例子numbaNumba通过及时编译机制(JIT)优化Python代码，Numba可以针对本机的硬件环境进行优化，同时支持CPU和GPU的优化，并且可以和Numpy集成，使Python代码可以在GPU上运行，只需在函数上方加上相关的指
基于 Python 的网站信息探测工具设计与实现计算机毕业设计指导 python 网络服务器
基于Python的网站信息探测工具设计与实现摘要在渗透测试与网络安全评估中，信息探测是最基础且关键的一步。通过对目标网站的操作系统、服务器、CMS、端口、目录结构等信息进行自动化探测，可为后续攻击路径识别提供基础数据支撑。传统工具如WhatWeb、FOFA等虽功能强大，但在定制化与扩展性方面受限。本文设计并实现了一款基于Python的轻量级网站信息探测工具，支持URL/IP扫描、开放端口探测、CM
不正规不靠谱：假摩根士丹利内部群推荐绿色低碳减排平台骗局揭露!送一万体验资金做慈善全是假的! 易星辰分享普法
关于曝光网上摩根士丹利何晓斌宝丰能源节能减排在炒股群推荐智慧农业中粮仓平台骗局的文章，其内容主要揭示了近期频发的一种投资诈骗手段。以下是该骗局的主要特点和步骤：为什么明明跟老师对过视频，确认是本人，怎么还会被骗了?你有没有想过一个名人大咖怎么会有时间给你们一对一视频，其次我来给大家揭露一下，这个套路AI换脸骗局是一种利用人工智能技术，通过替换视频中的人脸来伪造身份或进行诈骗的行为。你的账户“余额”
使用CrewAI创建一个研究团队 AI量化投资 php 开发语言多智能体智能体人工智能
本指导文档将带你一步步完成使用CrewAI框架创建你的第一个AI代理团队的过程。通过这个简单的示例，你将学习如何构建一个研究团队，用于研究和分析指定主题，并生成一份综合报告。本教程基于CrewAI官方文档，适合初学者快速上手。前提条件在开始之前，请确保你已完成以下准备工作：安装Python：确保你的系统安装了Python版本在3.10到3.13之间。你可以通过以下命令检查Python版本：pyth
Python成第四个支持CUDA的编程语言
Python成第四个支持CUDA的编程语言3月19日NVIDIA的GTC2013图形技术大会将开幕，在此之前会有很多宣传造势内容，其中最重大也是最主要的就是NVIDIA老总黄仁勋的开幕词了，其他合作伙伴也会发布各自的演讲。ContinuumAnalytics联合NVIDIA宣布将会引入新的PythonCUDA编译器——NumbaPro，Python也成为继C、C++以及Fortan之后的第四个支持
Python FastMCP：让你的AI工具链飞起来
PythonFastMCP：让你的AI工具链飞起来FastMCPFastMCP是什么？1.工具(Tools)：赋予LLM执行能力2.Resources（资源）：安全数据通道3.Prompts（提示模板）：标准化LLM交互4.组件协同：构建项目AI工具链5.部署架构与性能优化博主热门文章推荐：官方文档：FastMCP官方文档：https://gofastmcp.com/MCP协议规范：https:/
Python 解析 PDF 文件的基础方法电脑维修员xy python pdf 前端
```htmlPython解析PDF文件的基础方法Python解析PDF文件的基础方法在现代数据处理和信息提取任务中，PDF文件是一种常见的文档格式。然而，PDF文件的结构复杂且难以直接解析，尤其是当需要从中提取文本或数据时。幸运的是，Python提供了多种强大的库来帮助我们轻松地解析PDF文件。1.PyPDF2库PyPDF2是一个功能强大的Python库，用于处理PDF文件。它可以读取、分割、合
socket网络通信TCP与UDP原理及代码实现（c++、python）
目录Socket原理通信协议原理TCPUDP代码实现TCPC++pythonUDPC++pythonSocket原理Socket（套接字）是计算机网络中用于实现进程间通信的一种机制，特别是在不同主机之间通过网络进行数据传输时。它是网络编程的核心概念之一，为应用程序提供了统一的接口，使得开发者可以通过网络发送和接收数据。可以将Socket类比为电话系统中的“电话机”。两台设备通过Socket建立连接
【Qt Designer使用快捷键】
QtDesigner简介QtDesigner是Qt框架提供的可视化界面设计工具，用于快速创建GUI（图形用户界面）。用户可通过拖拽控件（如按钮、文本框等）设计界面，无需手动编写布局代码。生成的界面文件（.ui）可通过pyuic或uic工具转换为代码（如Python或C++），与业务逻辑集成。常用快捷键及用途通用操作Ctrl+N：新建界面文件。Ctrl+O：打开现有.ui文件。Ctrl+S：保存当前
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa