GrandNovice

Neutral Graph Collaborative Filtering——论文提炼

Abstract

1.对user和item的向量表示（如embedding）是现代推荐系统的核心。
2.从矩阵分解到最近出现的基于深度学习的方法，现在的工作通常是通过描述user(item)的现有特征映射来获得embedding，缺点是：user-item中潜在的交互collaborative signal没有嵌入，因此，这种embedding不能捕获协同过滤效果。
3.本文建议将user-item整合到二部图（定义）结构中去，提出NGCF算法，该算法在图上传播embedding，这导致了表示模型的高阶连接性（high-order connectivity）。
4.将本模型在三个公开的基准数据集上做了实验，跟其他模型进行了对比，如MF、HOP-Rec和Collaborative Memory Network（CMN），进一步分析证明了 embedding propagation 的重要性。
5.实验代码：https://github.com/ xiangwang1223/neural_graph_collaborative_filtering.

KEYWORDS

Collaborative Filtering,Recommendation,High-order Connectivity, Embedding Propagation,Graph Neural Network

1 INTRODUCTION

1.推荐系统被广泛应用，它的核心是基于历史交互预测一个用户是否会选择某item，CF通过假设行为相似的用户会对同一item表现出相似的偏好来解决这个问题，为了实现这个假设，通常通过参数化user和item来重建历史交互，并且基于参数去预测用户的偏好。
2.两个关键因素：
（1）embedding，将user和item转化成向量化表示；
（2）interaction modeling ，重建基于embedding的历史交互。
例：MF用内积直接嵌入；collaborative deep learning从item的边信息中整合深度学习到的representations（embedding function ）；neural collaborative filtering 用非线性神经网络（interaction function）；translation-basedCF用Euclidean distance metric（interaction function）。
3.上述模型都不能为CF产生好的embedding，关键是embedding function 缺乏对collaborative signal的显式的编码，这种signal是在user-item之间潜在的交互，它可以反映users（or items）间的行为相似度，大部分现存方法建立embedding function仅仅使用表面特征而不考虑user-item间的交互，所以是低效的。
4.这种方式是有效且操作困难的，当信息规模较大时更难提取有效的collaborative signal，针对这个问题，本文提出利用high-order connectivity，可以很方便的在交互图结构上编码collaborative signal。

5.图 1 展示了一个 user-item 的二部图及 u1 的高阶连接性。u1 的高阶连接性表示 u1 通过长度大于 1 的路径连接到的节点。例如，u1 通过长度 l=2 的路径连接到 u2 和 u3，这代表 u1 的 2 阶连接性；u1 通过长度 l=3 的路径连接到 i4，i5，这代表 u1 的 3 阶连接性。需要注意的是，虽然 i4 和 i5 都是 u1 的 3 阶邻居，但是 i4 可以通过更多的路径连接到 u1，所以 i4 与 u1 的相似度更高。
6.本文设计了一个embedding propagation层，这层通过聚合有交互的items（or users）
的embedding来更新一个user（or item）的embedding。通过堆叠多个嵌入传播层，我们可以增强embedding在高阶连接性中去捕获交互信号的能力。
7.HOP-Rec考虑了high-order connectivity，但是它仅仅提出去enrich 训练数据，其预测模型仍为MF，通过优化具有高接连通行的损失进行训练，我们提出了将高阶连通性整合到预测模型中，该技术优于HOP-Rec。
（1）强调了在基于模型的CF方法的嵌入函数中显式的利用collaborative signal的重要性；
（2）提出NGCF，在embedding propagation层中以高阶连通性的形式显式的编码collaborative signal；
（3）实验研究证明模型的可行性和有效性。

2 METHODOLOGY

1.NGCF模型主要包含三个部分：
（1）Embedding Layer：将 user 和 item 的 ID 映射为向量初始化表示；
（2）Embedding Propagation Layers：联合高阶连通性来更新embedding
（3）Prediction：聚合来自传播层的更新embedding，输出预测结果
模型架构图见 Figure 2。
2.最后，讨论NGCF的时间复杂度和与现存方法的联系。

2.1 Embedding Layer

1.主流模型中，描述一个user u 用一个 embedding 向量 $e_u \in R^d$ ，这可以看作建立一个参数矩阵作为一个嵌入查找表：

2.embedding表作为user embedding 和 item embedding的初始化状态，以端到端的方式进行优化。
3.传统推荐模型，像MF和神经网络协同过滤把ID嵌入直接被喂到交互层去完成预测，相反在NGCF模型中，我们通过把embedding传到user-item交互图中去更新它们，由于embedding更新中显式的注入了collaborative signal而使embedding变得更加高效。

2.2 Embedding Propagation Layers

1.为了捕获图结构上的CF signal和细化user和item的embedding，我们建立了基于GNN的消息-传递结构。
2.我们首先设计了单层传播，然后将其推广到多层连续传播。

2.2.1 First-order Propagation

1.交互item对一个用户偏好提供直接证据，类似的，用户消费一个item可以看成是item的特征，用于度量两个item之间的协同相似性。
2.构建有关联的user和item的嵌入传播流程，主要包括两个步骤：消息构建和消息聚合
Message Construction：对于有关联的user-item对，我们定义从i到u的消息为：

$m_{u \leftarrow i}$ 是消息embedding， $f (\cdot)$ 是消息编码函数， $e_i$ 和 $e_u$ 作为输入，利用系数 $p_{ui}$ 控制边 $(u, i)$ 上每次传播的衰减因子。
$f (\cdot)$ 的实现：

3. $W_1 , W_2$ 是 $d^{'}*d$ 维的权值矩阵，去提取有用信息进行传播， $d^{'}$ 是变化大小，传统图卷积神经网络只考虑 $e_i$ 的作用，本文中我们通过 $e_i\odot e_u$ 把 $e_i$ 和 $e_u$ 之间的交互编码到传递的信息中，这使得消息依赖于 $e_i$ 和 $e_u$ 之间的关联性，传递更多来自相似items的消息。
4. 令 $p_{ui}$ 作为正则化系数 $\frac{1}{\sqrt{|N_u||N_i|}}$ ， $N_u$ 和 $N_i$ 表示user u 和 item i的第一跳的邻居。从表示学习观点看， $p_{ui}$ 表示历史item对用户偏好的贡献程度，从消息传递的观点看， $p_{ui}$ 被看成是一个折扣因子，表示消息在传播过程中的衰退。

Message Aggregation：
1.聚合从u的邻居传来的信息去更新u的表示，聚合函数为：

$e_u^{(1)}$ 表示用户u在经过第一嵌入传播层之后的表示，除了邻居的传入外，还考虑了u的自连接： $m_{u\leftarrow u = W_1e_u}$ ，它包含了信息的原始特征，对于 $e_i^{(1)}$ 类似.
2.嵌入传播层的优点在于：显式的利用一阶连接性去联系用户和商品的表示。

2.2.2 High-order Propagation

1.一阶连接性可以使得表示进一步准确，可以通过堆叠嵌入传播层去扩展高阶连接性信息，高阶连接性对于编码协同信号去估计用户和商品间的关联性来说是很重要的。
2.通过堆叠l个嵌入传播层一个用户能够收到它的l跳邻居传来的消息，如图二所示，在第l步，用户u的递归表示为：

被传递的消息定义如下：

$W_1^{(l)},W_2^{(l)},\in R^{d_l*d_{l-1}}$ 是训练的变换矩阵， $d_l$ 是变换大小。
3.如图三所示，协同信号例如 $u_1\leftarrow i_2\leftarrow u_2\leftarrow i_4$ 可以被嵌入传播过程捕捉，来自 $i_4$ 的消息被显式的编码在 $e_{u_1}^{(3)}$ 中。
4.Propagation Rule in Matrix Form分层传播的矩阵形式：

其中 $E^{(l)}\in R^{(N+M)*d_l}$ 是用户和商品在l步嵌入传播之后的表示， $I$ 表示单位阵， $L$ 表示user-item图的拉普拉斯矩阵，其形式为：

其中 $\in R^{N*M}$ 是用户商品交互矩阵， $A$ 是邻接矩阵， $D$ 是对角度矩阵，其中 $D_{tt}=|N_t|$ ，矩阵化可以使得所有用户和商品进行高效表示，可以不必节点采样。

2.3 Model Prediction

1.在经过L层传播之后，我们包含了多层表示：{ $e_u^{(1)},e_u^{(2)},...,e_u^{(L)}$ },我们级联他们区组成一个user的最终嵌入，对item来说类似：

||是级联操作，可以丰富初始化embedding，也可以通过调整L来控制传播的范围，除了级联，其他聚合方式也可，例如权重均值，最大池化，LSTM等，级联相对简单，它不用添加参数，在GNN中比较高效，设计层聚合机制。
2.最后用内积去预估用户对目标item的偏好程度：

我们强调嵌入函数学习，因此交互函数仅仅使用内积，还有基于神经网络的交互函数，留作后续思考。

2.4 Optimization

1.采用BRP损失进行优化，这在推荐系统中比较常见，它考虑可观察的和不可观察的user-item交互的相对顺序，BRP认为可观察的交互可以更好地反映用户偏好，相比于不可观察的交互应该给予更高的预测值，目标函数如下：

$\{(u,i,j)|(u,i)\in R^+,(u,j)\in R^-\}$ 表示训练数据对， $R^+$ 表示可观察的交互， $R^-$ 表示不可观察的交互， $Θ=\{E,\{W_1^{(l)},W_2^{(l)}\}_{l=1}^L\}$ 表示训练模型参数， $\lambda$ 控制正则项防止过拟合，采用mini-batch Adam对预测模型进行优化并更新参数。

2.4.1 Model Size

1.虽然NGCF在每一个传播层包含一个嵌入矩阵 $E^{(l)}$ ，但是它仅仅引进了很少的参数（两个 $d_l*d_{l-1}$ 维的权重矩阵），这些嵌入矩阵起源于 $E^{(0)}$ ，基于user-item图结构和权重矩阵进行变换。
2.比起MF，NGCF的参数仅仅多出 $2Ld_ld_{l-1}$ 个，比起users和items的数目几乎可以忽略不计。

2.4.2 Message and Node Dropout

1.深度学习虽然表示能力强大，但是经常过拟合，丢弃可以有效防止神经网络中的过拟合，我们提出了NGCF的两种丢弃策略：
（1）消息丢弃：以概率 $p_1$ 随机丢弃产出的消息，
（2）节点丢弃：随即阻止一个特殊节点并丢弃他的全部输出消息，对于第 $l$ 个传播层，我们从拉普拉斯矩阵中随机丢弃 $M+N)p_2$ 个节点， $p_2$ 是丢弃比率。
2.丢弃仅被用在训练阶段，禁止在测试阶段丢弃。

2.5 Discussions

首先真是NGCF怎么概括SVD++，然后分析了NGCF的时间复杂度。

2.5.1 NGCF Generalizes SVD++

1.SVD++可以被看作没有高阶连接层的NGCF，即设置L为1，在传播层不使用变换矩阵和非线性函数， $e_u^{(1)}$ 和 $e_i^{(1)}$ 即user和item的最终表示，这个简化模型又称NGCF-SVD：

通过设置 $p_{ui^{'}}$ 和 $p_{u^{'}i}$ 分别等于 $\frac{1}{\sqrt |N_u|}$ 和0，可以恢复SVD++模型，另一种广泛使用的基于item的CF模型，FISM，也可以被看成一种特殊的NGCF，其 $p_{ui^{'}}$ 被设置为0.

2.5.2 Time Complexity Analysis

略

3 RELATEDWORK

模型对比。

3.1 Model-based CF Methods

1.现代推荐系统通过向量化表示和重建基于模型参数的user-item交互数据来参数化用户和商品。例如MF，使用每个用户和商品的ID作为嵌入向量并且通过它们间的内积去预测交互。
2.为了增强嵌入函数，大量工作专注于整合边信息。
3.虽然内积可以表示相近的用户和商品之间的可观察的交互，但是他的线性性质使得它不能充分的去刻画复杂的非线性的关系。
4.针对真个问题，最近使用深度学习方法去增强交互函数，以使得它能够捕获非线性特征交互。
5.例如,neural CF models比如NeuMF使用非线性神经网络作为交互函数，同时，translation-based CF models比如LRML，用欧几里得距离矩阵代替了模型中的交互项。
6.尽管取得伟大成功，但是我们认为嵌入函数不足以为CF产出最优嵌入，因为CF信号仅仅被显式捕获。
7.嵌入函数将可描述性特征（ID和属性）转化为向量，交互函数作为向量的相似性度量。理想状态下，当user-item交互被完整重构时，可以捕获行为相似性的传递性属性。然而，这种传递效果不能被显式编码，因此不能保证在迁入空间中简介响亮的用户和商品是相近的。
8.不能显式的编码CF信号，就很难获得能达到理想状态的embedding。

3.2 Graph-Based CF Methods

1.利用user-item交互图去推测用户偏好，早期工作中，ItemRank and BiRank，使用标签传播去捕获CF效果，标签即为他的交互商品，并且在图上传播标签。
2.由于推荐系统的评分是基于历史item和目标item之间的结构相似度获得的，这些方法也属于基于邻居的方法，由于缺乏模型参数来优化目标函数，这些方法理论上不如基于模型的CF方法。
3.HOP-Rec将基于图的方法和基于嵌入的方法相结合，他首先使用随机游走去丰富一个用户和其多跳连接的item之间的交互，然后使用BRP在已经丰富的交互数据上去训练MF，对比发现HOP-Rec 优于MF，证明了整合关联性信息对于在捕获CF效果中获得较好的嵌入是有效的。
4.HOP-Rec没有充分使用高阶连接性，，仅仅利用了丰富的训练数据，而不是直接改进模型的嵌入函数，HOP-Rec很大程度上依赖于随机游走，这需要仔细的条有工作，比如设置适当的衰减因子。

3.3 Graph Convolutional Networks

1.通过在user-item交互图上设计一个图卷积操作，使得NGCF能够有效的利用高阶连接性的CF信号，这里我们讨论现存的也使用图卷积操作的推荐方法。
2.GC-MC在user-item图上使用图卷积操作，然而它仅对用户和商品的直接连接性使用一个卷积层，因此他不能表示高阶连接性的协同信号。
3.PinSage是一种工业解决方案，它在item-item图上使用多个图卷积层来做Pinterest imagine 推荐。CF效果在商品级别上被捕获，而不是跟用户行为协同。
4.SpectralCF提出谱卷积操作在谱域发现了在用户和商品间的所有可能的连接性，通过对图的邻接矩阵进行特征分解，可以发现user-item对之间的关联，但是特征分解计算量较大，非常耗时且不适合大规模推荐场景。

4 EXPERIMENTS

1.我们在三个数据集上做实验去评估我们的方法，特别是嵌入传播层，我们主要是为了回答下面的问题：
（1）与目前最先进的CF方法相比，NGCF的性能如何？
（2）不同的超参数设置（如层深度，嵌入传播层，层聚合机制，消息退出和节点退出），如何影响NGCF？
（3）如何利用高阶连接性进行表示？

4.1 Dataset Description

1.概括统计三个数据集在表一
2.随机挑选80%作为训练集，剩下20%为测试集，在训练集中挑选10%作为交叉验证集去优化超参数。
3.对每个观察到的user-item交互，把它作为一个正例，通过消极抽样策略去把该交互和一个用户之前没有使用过的消极item进行配对。

4.2 Experimental Settings

4.2.1 Evaluation Metrics

1.对于每个测试集中的user，我们吧该用户没有交互过的item都当做消极item，然后每个方法输出用户对所有item的喜好分数，出了训练集中使用的积极的item，为了评估K阶推荐和偏好的排序有效性，使用两个评估协议recall@K andndcg@K，默认K=20.

4.2.2 Baselines

为了显示有效性，我们将NGCF与下面的方法对比：
MF这是贝叶斯个性化排序BRP损失优化后的矩阵分解，利用user-item的直接交互作为交互函数的目标值。
NeuMF 最先进的神经网络CF模型，在用户和商品嵌入的每个元素上和级联上使用多个隐藏层，并去捕获他们的非线性特征交互，我们采用了立案层平面结构，并且每个隐藏层的维数保持不变。
CMN 最先进的基于记忆的模型，用户表示通过记忆层组合了邻居用户的记忆片，一阶连接被用于查找与相同商品交互的相似用户。
HOP-Rec 最先进的基于图的模型，高阶邻居源于随机游走被用作丰富user-item的交互数据
PinSage 是在item-item图上使用GraphSAGE ，本文中我们在user-item交互图上使用PinSage，使用两个图卷积层，隐藏层维度被设置成等于嵌入大小。
GC-MC应用GCN编码去省城用户和商品的表示，仅考虑一阶邻居，因此只有一个图卷积层，隐藏层维度被设置成等于嵌入大小。
SpectralCF使用矩阵分解，导致时间复杂度过高，不选择它进行比较。

4.2.3 Parameter Settings.

4.3 PerformanceComparison(RQ1)

4.3.1 Overall Comparison.

1.MF表现最差，表明仅仅通过内积不能充分捕获用户和商品的复杂联系。NeuMF比MF表现略好，表明了在用户和商品嵌入间的非线性特征交互的重要性，然而上述两种模型都没有考略嵌入学习过程的连接性。
2.GC-MC证明，整合一阶邻居可以提高表示学习能力。
3.CMN优于GC-MC，这可能归功于神经网络的注意力机制，它可以指定每个邻居用户的注意力权重，而不是使用相等的或启发式权重。
4.PinSage略微低于CMN，在嵌入函数中引入高阶连通性。利用高阶邻居来丰富训练数据，而CMN只考虑相似的用户。
5.NGCF性能最佳。通过叠加多个嵌入传播层，显式的探索高阶连接性，而CMN和GC-MC只用一阶邻居来指导表示学习。

4.3.2 Performance Comparison w.r.t. Interaction Sparsity Levels.

稀疏性问题通常限制了推荐系统的表达能力。
根据不同稀疏程度分组实验结果如下：

4.4 Study of NGCF(RQ2)

研究嵌入传播层对NGCF的影响，探索层数影响，研究拉普拉斯矩阵，分析节点退出和消息退出比率等因素。

4.4.1 Effect of Layer Numbers.

改变模型深度=｛1，2，3，4｝，实验结果如下：

NGCF-2和NGCF-3在各方面都比NGCF-1优秀，因为NGCF-1只考虑一阶邻域，当NGCF-3进一步叠加传播层时，出现了过拟合现象，应用太深的架构导致引入噪声。

4.4.2 Effect of Embedding Propagation Layer and LayerAggregation Mechanism.

4.4.3 Effect of Dropout.

使用节点退出和消息退出来防止过拟合。节点退出的性能较好。

4.5 Effect of High-order Connectivity(RQ3)

5 CONCLUSION AND FUTURE WORK

将注意力机制引入，在嵌入传播过程中来学习变化权重。

2025毕设springboot MVC框架下的精品课程管理平台论文+源码 zhihao501 课程设计 spring boot mvc
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景在教育信息化的大背景下，精品课程管理平台的构建成为提升教学质量和效率的重要手段。当前，许多高校和教育机构仍然采用传统的课程管理方式，不仅效率低下，还难以满足学生日益增长的个性化学习需求。SpringBootMVC框架作为一种轻量级、高效的JavaWeb开发框架，以其简洁的设计理
数据分析基础定义阿金要当大魔王~~ 数据分析数据分析数据挖掘
一、大数据的定义数据分析是基于商业等目的，有目的的进行收集、整理、加工和分析数据，提炼有价值信息的过程。大数据分析即针对海量的、多样化的数据集合的分析大数据分析是一种利用大规模数据集进行分析和挖掘知识的方法。随着互联网、社交媒体、移动设备等产生庞大的数据，大数据分析成为了当今世界各行业的重要技术。这篇文章将从数据收集、存储、处理、分析、可视化、应用等方面进行全面讲解，以帮助读者更好地理解大数据分析
python中graphviz 参数_python graphviz的使用(画图工具) weixin_39900608 python中graphviz 参数
一、graphviz安装及配置graphviz实际上是一个绘图工具，可以根据dot脚本画出树形图等。1、windows安装配置环境变量：把bin文件夹的路径加入到环境变量path里安装python的graphviz模块：pipinstallgraphviz2、linuxcentos7安装yum下载graphviz软件：yum-yinstallgraphviz安装python的graphviz模块：
Graphivz中文显示问题断桥bian 工具 graphviz 工具
Graphviz（相关详细教程请点击进入官网）是基于dot语言的绘图工具，可以画有向图，无向图，关系图，目录图，流程图等。在使用过程中，发现Graphivz对中文的支持还是不够，容易出现各种各样的问题。中文乱码问题这种问题，很多人都遇到过，因为Graphivz默认是不支持中文的，所以如果直接写中文的画，会显示成乱码，一般这种情况可以修改文件的编码格式为UTF-8,然后将fontname设置
python graphviz 中文乱码晓梦OvO python 决策树
问题：在调用graphviz库进行决策树绘图的时候，即使我们设置了fontname='SimHei',encoding='utf-8'，我们同样会发现出现了中文乱码的情况fromgraphvizimportDigraphdot=Digraph('决策树',encoding='utf-8')dot.attr(fontname='SimHei',encoding='utf-8')#改为系统中的中文字体
大模型GUI系列论文阅读 DAY2续：《一个具备规划、长上下文理解和程序合成能力的真实世界Web代理》 feifeikon 论文阅读
摘要预训练的大语言模型（LLMs）近年来在自主网页自动化方面实现了更好的泛化能力和样本效率。然而，在真实世界的网站上，其性能仍然受到以下问题的影响：(1)开放领域的复杂性，(2)有限的上下文长度，(3)在HTML结构上的归纳偏差不足。我们提出WebAgent，一个由LLM驱动的智能代理，能够通过自我学习的方式，在真实网站上按照自然语言指令完成任务。WebAgent通过将指令提前规划，将其分解为子指
基于TSN的实时通信网络延迟评估技术神一样的老师论文阅读分享网络
论文标题：ATSN-basedTechniqueforReal-TimeLatencyEvaluationinCommunicationNetworks作者信息：AlbertoMorato,ClaudioZunino,ManuelCheminod,StefanoVitturi，来自意大利国家研究委员会，CNR-IEIIT。电子邮件:{alberto.morato,claudio.zunino,ma
一文讲解常见API开发工具蚂蚁在飞- 运维人工智能
1.Hoppscotch•简介:•Hoppscotch是一个开源的、基于浏览器的API请求工具。•设计简单轻量，适合快速测试和调试HTTP请求。•特点:•开源免费:基于Web的开源工具，可在浏览器中直接使用。•支持多种协议:包括REST、GraphQL、WebSocket、Socket.IO和MQTT。•实时调试:提供实时响应查看。•无需安装:无需安装客户端，只需打开浏览器即可。•适合团队协作:提
战场物联网：通信挑战与最新解决方案综述神一样的老师论文阅读分享物联网物联网
论文标题TheInternetofBattleThings:ASurveyonCommunicationChallengesandRecentSolutions作者信息RachelKufakunesu,HermanMyburgh,AllanDeFreitas论文出处DiscoverInternetofThings(2025)5:3|Theinternetofbattlethings:asurvey
物联网：全面概述、架构、应用、仿真工具、挑战和未来方向神一样的老师论文阅读分享物联网物联网
中文论文标题：物联网：全面概述、架构、应用、仿真工具、挑战和未来方向英文论文标题：InternetofThings:acomprehensiveoverview,architectures,applications,simulationtools,challengesandfuturedirections作者信息：AnitaChoudhary论文出处：DiscoverInternetofThing
AAAI2024论文解读|Towards Fairer Centroids in k-means Clustering面向更公平的 k 均值聚类中心 paixiaoxin 文献阅读论文合集支持向量机机器学习人工智能聚类公平性 k 均值聚类质心代表性群体代表性公平性
论文标题TowardsFairerCentroidsink-meansClustering面向更公平的k均值聚类中心论文链接TowardsFairerCentroidsink-meansClustering论文下载论文作者StanleySimoes,DeepakP,MuirisMacCarthaigh内容简介本文提出了一种新的聚类级质心公平性（Cluster-levelCentroidFairne
JAVA计算机毕业设计基于SpringBoot的个人理财系统（附源码+springboot+开题+论文）杰简程序毕设 java 课程设计 spring boot
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景随着经济的快速发展和人们生活水平的日益提高，个人理财已成为现代生活中不可或缺的一部分。然而，传统的理财方式往往存在着效率低下、信息不对称、服务不便捷等问题，无法满足现代人对于个性化、高效理财的需求。在这个背景下，基于SpringBoot的个人理财系统应运而生。该系统旨在通过互联
AIGC视频生成国产之光：ByteDance的PixelDance模型好评笔记 AIGC-视频补档 AIGC 计算机视觉人工智能深度学习机器学习论文阅读面试
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance，论文于2023年11月发布，模型上线于2024年9月，同时期上线的模型还有Seaweed（论文未发布）。优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录论文摘要引言输入训练和推理时的数据处理总结相关工作视频生成长视频生成方法模型架构
论文阅读笔记：AI+RPA 几道之旅人工智能
文章目录论文题目下载地址论文摘要论文题目Challengesandopportunities:ImplementingRPAandAIinfrauddetectioninthebankingsector下载地址点击这里下载论文摘要在银行业中，将机器人流程自动化（RPA）和人工智能（AI）集成用于欺诈检测是一项重大变革，既带来了挑战，也带来了机遇。随着金融机构面临日益复杂的欺诈企图，RPA和AI成为
【AI日记】25.01.06 AI完全体 AI日记人工智能机器学习 kaggle 比赛
【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI日记】【读书与思考】AI参加：kaggle比赛ForecastingStickerSales读书书名：国家为什么会失败阅读原因：2024年诺贝尔经济学奖得主的力作，之前我已经读过他另一本书了《權力與進步》备注：有兴趣的建议读未删减版https://book.douban.com/subject/26388427/discussion
文献综述相关ChatGPT提示词分享 AIWritePaper官方账号 Prompt ChatGPT AIWritePaper chatgpt 人工智能数据分析 AIGC 信息可视化数据挖掘 prompt
文献综述ChatGPT可以帮助提高文献综述的有效性和全面性。ChatGPT可以高效搜索和审查与宝子们课题研究相关的文献资料来源。一些给力的插件工具还可以帮助您总结复杂的研究论文并提取信息以更快更好地消化信息。合理的运用ChatGPT和GPTs可以提高文献综述的清晰度和质量，使其更加全面和有洞察力。文献综述提示词*131.在[人工智能相关]领域中，主要发现有哪些？2.在[人工智能相关]领域中，引用次
【YOLOv8改进】 YOLOv8 更换骨干网络之 GhostNet ：通过低成本操作获得更多特征 (论文笔记+引入代码) YOLO大师 YOLO 论文阅读
YOLO目标检测创新改进与实战案例专栏专栏目录：YOLO有效改进系列及项目实战目录包含卷积，主干注意力，检测头等创新机制以及各种目标检测分割项目实战案例专栏链接:YOLO基础解析+创新改进+实战案例介绍摘要在嵌入式设备上部署卷积神经网络（CNNs）由于有限的内存和计算资源而变得困难。特征图中的冗余是那些成功的CNNs的一个重要特性，但在神经架构设计中很少被研究。本文提出了一种新颖的Ghost模块，
论文阅读：Deep Bilateral Learning for Real-Time Image Enhancement-google-hdrnet-slicing SetMaker 论文阅读
项目地址:https://gitcode.com/google/hdrnethdrnet作为超分领域的经典文章，由google提出主要用来用轻量化的方法来实现高分辨率的图像生成，hdrnet结合cnn可以让更高分辨率的图像部署在板端。如图所示，原始图像比如4k图像，首先分为两个主要模块：grid和guide。grid就是对应图上面的那一条特征提取网络，具体来说，原始图像经过下采样之后，默认256分
OpenVoiceV2：零样本跨语言语音克隆技术，支持多种风格控制智慧医疗 AIGC 语音识别人工智能语音克隆
1openvoicev2介绍语音克隆技术近年来取得了显著进展，但现有方法通常存在着局限性，例如无法灵活控制语音风格、需要大量多语言数据进行训练、生成速度慢等等。为了克服这些挑战，MyShell.ai团队推出了全新的语音克隆技术OpenVoiceV2，它能够在无需额外训练的情况下，仅凭少量参考音频，就能够克隆任何人的声音，并支持多种语音风格控制，以及快速高效的跨语言语音生成。论文地址：http://
2017-SIGGRAPH-Google,MIT-(HDRNet)Deep Bilateral Learning for Real-Time Image Enhancements WX Chen HDR技术深度学习神经网络机器学习
双边网格本质上是一个可以保存边缘信息的3维的数据结构。对于一张2维图片,在2维空间中增加了一维代表像素的强度slice操作(上采样)BilateralGuidedUpsampling这篇文章用双边网格实现图像的操作算子的加速。算法的核心思想是将一幅高分辨率的图像通过下采样转换成一个双边网格,在双边网格中每个格子就是一个图像的仿射变换算子,它的原理是在空间与值域相近的区域内,相似输入图像的亮度经算子
ASP.NET Core Web API 模板项目推荐余怡桔Solomon
ASP.NETCoreWebAPI模板项目推荐aspnetcore-webapi-templateThisprojectisanWebAPIOpen-SourceBoilerplateTemplatethatincludesASP.NETCore5,WebAPIstandards,cleann-tierarchitecture,GraphQLservice,Redis,Mssql,Mongodat
工作流开发过程 Dev2010Daily 软件开发基础知识工作 jbpm 引擎 java
1、首先要识别出工作流，即找出候选的工作流。2、可视化流程建模，此处将用到的是jBPM(jBPMGraphicalProcessDesignerGPD)editor3、开发运行时的元件4、布署运行时引擎jBPM提供了多种不同的布署场景：（1）引擎与实例同时使用---jBPMConsole（2）用JAVA类实例来实例化引擎5、实例化运行时实例6、监控和审计
【AI论文】迈向大型推理模型：大型语言模型增强推理综述东临碣石82 人工智能语言模型自然语言处理
摘要：语言长久以来被视为人类推理不可或缺的工具。大型语言模型（LLM）的突破激发了利用这些模型解决复杂推理任务的浓厚研究兴趣。研究人员已经超越了简单的自回归词元生成，引入了“思维”的概念——即代表推理过程中间步骤的词元序列。这一创新范式使LLM能够模仿复杂的人类推理过程，如树搜索和反思性思维。近期，一种新兴的学习推理趋势采用强化学习（RL）来训练LLM掌握推理过程。这种方法通过试错搜索算法自动生成
图像检索简介 handsomestWei AI 图像处理人工智能
图像检索主要分为两类，一类是基于文本的图像检索（TextBasedImageRetrieval），另一类是基于内容的图像检索（ContentBasedImageRetrieval）基于文本通过对图像进行文本描述（对内容分析进行自动标注和人工标注），提炼关键词等标签信息。后续在进行检索时，可以通过检索关键词的方式查找对应的图片。基于内容以图搜图。涉及图像特征提取、相似度计算、特征数据库存储和搜索。图
使用MoA(Mixture of Agents)混合智能体技术,结合多个开源大语言模型如Llama3、phi-3和Mistral,实现一个强大的AI智能体 fc&&fl 大模型实战应用人工智能语言模型自然语言处理
1.简介论文简介:论文提出了一种称为混合智能体(Mixture-of-Agents,MoA)的方法,利用多个大语言模型(LLM)的集体智慧来提高自然语言理解和生成任务的性能。MoA采用了分层结构,每一层包含多个LLM智能体。每个智能体都将前一层所有智能体的输出作为辅助信息来生成自己的回答。通过迭代地综合和优化回答,MoA可以充分利用不同LLM的独特优势。实验发现,即使其他模型提供的辅助回答质量较低
【论文投稿】Spring Boot 开发全攻略：从入门到精通小周不想卷艾思科蓝学术会议投稿 spring boot
目录一、SpringBoot简介与优势二、开发环境搭建三、创建SpringBoot项目四、项目结构剖析五、控制器开发六、服务层设计七、数据访问层构建一、SpringBoot简介与优势SpringBoot是一个基于Spring框架的快速开发框架，旨在简化Spring应用的初始搭建以及开发过程。它通过提供一系列的默认配置和约定，使得开发者能够快速地创建出可独立运行的、生产级别的Spring应用程序，极
【论文投稿】探秘计算机视觉算法：开启智能视觉新时代小周不想卷艾思科蓝学术会议投稿计算机视觉
目录引言一、计算机视觉算法基石：图像基础与预处理二、特征提取：视觉信息的精华萃取三、目标检测：从图像中精准定位目标四、图像分类：识别图像所属类别五、语义分割：理解图像的像素级语义六、计算机视觉算法前沿趋势与挑战引言在当今数字化浪潮中，计算机视觉宛如一颗璀璨的明珠，正深刻地改变着我们与世界的交互方式。从安防监控中的精准识别，到自动驾驶汽车的智能导航；从医疗影像的辅助诊断，到工业生产中的缺陷检测，计算
[cg] UE5 调试技巧 DXT00 ue5
UE中rhi命令的提交是在render线程，而graphicsapi真正的执行是在rhi线程，今天想看下rhi的底层调用，但由于是通过task执行的，无法获取到renderthread传入的地方，调试起来不太方便。可通过开启下面的命令来调试1.让RDG进入立即执行模式：;Uncommenttogetrendergraphexecutingpassesastheygetcreatedtoeasily
Android BitmapShader实现狙击瞄具十字交叉线准星，Kotlin zhangphil Android kotlin android kotlin
AndroidBitmapShader实现狙击瞄具十字交叉线准星，Kotlinimportandroid.content.Contextimportandroid.graphics.BitmapFactoryimportandroid.graphics.BitmapShaderimportandroid.graphics.Canvasimportandroid.graphics.Colorimpo
像素空间文生图之Imagen原理详解 funNLPer AI算法 Imagen stable diffusion AIGC
论文：PhotorealisticText-to-ImageDiffusionModelswithDeepLanguageUnderstanding项目地址：https://imagen.research.google/代码（非官方）：https://github.com/deep-floyd/IF模型权重：https://huggingface.co/DeepFloyd/IF-I-XL-v1.0
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象