默默然咯

KGCN_基于知识图谱的推荐系统（KG+GCN）

Knowledge Graph Convolutional Networks for Recommender Systems
Hongwei Wang, Miao Zhao, Xing Xie, Wenjie Li, Minyi Guo.
In Proceedings of The 2019 Web Conference (WWW 2019)
本文作者源码：https://github.com/hwwang55/KGCN

本人对KGCN的一些代码注释，有兴趣的道友可以看看
https://github.com/Archerxzs/KGCN-notes
文章最后附上本人对代码的解析

Abstract

为了缓解协同过滤的推荐系统的稀疏性和冷启动问题
所以收集用户和项目的属性，并且这些属性不是孤立的，所以就形成了知识图KG
从KG中每个实体的邻居中取样作为它们的邻域，然后在计算给定实体的表示时将邻居信息和偏差结合起来

Introduction

traditional method:Collaborative Filtering(CF)

问题：交互矩阵的稀疏性和冷启动
**解决方法：**用用户和项目的属性来弥补稀疏性提高性能 KG
KG的好处：

实体间的丰富语义关联帮助挖掘其中的联系，提高精确度
KG中关系类型丰富，可以合理扩展用户的想去，增加推荐的多样性
KG具有可解释性

KG的挑战：

高维
异构
常见解决方法：
- 知识图嵌入（Trans类模型），侧重于严格的语义关联建模，更适合用于KG补全和链接预测
- 基于meta-path/meta-graph来提取KG结构，但是过于依赖人工设计，现实中很难实现
本文解决方法：
- 自动捕获KG中的高阶结构和语义信息
  GCN->KGCN（计算KG中给定实体表示时，将邻域信息和偏差合并进来）
  优点：
  1、领域聚合，捕获并存储每个实体中的局部邻接结构
  2、根据连接关系和特定用户得分对邻居加权，表现KG语义信息

Problem Formulation

$M 个 u s e r s$ $U=\{u_1,u_2,...,u_M\}$
$N 个 i t e m s$ $V=\{v_1,v_2,...,v_N\}$
$u s e r s - i t e m s 交互矩阵$ $Y∈R^{M×N}=\left\{ \begin{aligned} y_{uv}=1 \ u和v有交互 \\ y_{uv}=0 \ u和v无交互 \end{aligned} \right.$
$知识图 G （实体 - 关系 - 实体 (h, r, t) ）$
- $h∈\varepsilon$ ，r∈R，t∈ $\varepsilon$
- $\varepsilon：KG中的实体集entity；R：KG中的关系集relation$
- $item\ v∈V 对应于\ entity\ e∈\varepsilon$

$目标：给定users-items交互矩阵Y和知识图G，预测user\ u是否会对之前未交互过的item\ v感兴趣$

$\widehat{y}_{uv}$ =F(u,v|\Theta,Y,G) $

$\widehat{y}_{uv}：user\ u和item\ v交互的概率$

$\Theta:函数F的模型参数$

KGCN Layer

$N (v) : 和 v 直接相连的 e n t i t y 集合$
$r_{e_i,e_j}：entity\ e_i和entity\ e_j的关系$
$function\ g:R^d×R^d->R(例如内积):计算用户和关系的分数$
$aggregators\ agg:R^d×R^d->R^d:聚合器$

entity neighborhood representation

$\pi^u_r=g(u,r)\begin{cases} u∈R^d \ user\ u的向量 \\ r∈R^d \ relation\ r的向量 \\ d \ 向量的纬度 \end{cases}$ 表示了 $relation\ r$ 对 $user\ u$ 的重要性
$v^u_{N(v)}=\Sigma_{e∈N(v)}\widetilde{\pi}^u_{r_{v,e}}e$ $item\ v$ 的拓扑邻域结构
- $\widetilde{\pi}^u_{r_{v,e}}=\frac{exp(\pi^u_{v,e})}{\Sigma_{e∈N(v)exp(\pi^u_{r_{v,e}})}}$ 归一化 $user-relation\ score$
$v^u_{S(v)}:entity\ v的所有邻域表示$
- $S(v)=\{e|e∈N(v)\}\ and \ |S(v)|=K(超参数,融合K个邻居)$

aggregator

将 $entity\ v$ 的表示 和其邻域表示 $v^u_{S(v)}$ 聚合为一个向量

Sum aggregator 两个向量相加，然后进行非线性转换：
- $agg_{sum}=\sigma(W·(v+v^u_{S(v)})+b)$
Concat aggregator 两个向量连接，然后进行非线性转换：
- $agg_{concat}=\sigma(W·concat(v,v^u_{S(v)})+b)$
Neighbor aggregator 只使用邻域向量，然后进行非线性转换：
- $agg_{neighbor}=\sigma(W·v^u_{S(v)}+b)$

Learning Algorithm

将user的向量和relation的向量进行乘积取均值（说明relation对user的重要性，比如一个用户可能对该电影的演员感兴趣，另一个用户对该电影的体裁感兴趣，每个用户对电影的关系的感兴趣程度是不一样的）

如果上面说的那个分数和当前实体的邻域实体向量进行内积取均值得到当前实体的邻域实体的集合表示

最后将这个邻域集合表示和当前实体相加，算出一个当前实体的最终向量表示

Experiments

Datasets

Movielens-20M阈值设为4

其他数据集（较为稀疏）不设阈值

Baselines

$\begin{cases} SVD(奇异值分解,使用内积建立user-item交互模型)& \\ LibFM(基于特征的分解模型，将userID和itemID连接起来作为输入)& \\libFM+TransE(附加上TransE学习后的实体来扩展libFM)\\PER(将KG视为异构网络，提取基于元路径的特征来表示users和items的连通性))\\CKE(CF+结构化知识)\\RippleNet(传播用户偏好来推荐) \end{cases}$

$S V D 、 L i b F M$ 为无KG方法

Results

AUC（ area under curve：ROC曲线下与坐标轴围成的面积）取值范围在0.5和1之间
ROC曲线的坐标轴：横轴为召回率(Recall)，纵轴为精确率(Precision)
- 精确率(Precision)：分类正确的正样本个数占模型判定为正样本的样本个数的比例
- 召回率(Recall)：分类正确的正样本个数占真正的正样本个数的比例
- $F1=\frac{2·Precision·Recall}{Precision+Recall}$ 精确率和召回率的调和平均值
结果
KGCN在book和music数据集的表现要高于movie，说明KGCN可以很好的解决稀疏问题
无KG的方法（SVD,LibFM）的表现要好于部分KG方法（PER,CKE），说明人工设计的meta-path和TransR系列的规则化不能充分利用KG
LibFM+TransE的方法在大多数情况下都要好于LibFM，说明KG对于推荐有帮助
PER在所有方法中表现最差，因为在实际情况中很难定义较好原路径
RippleNet较其他方法表现较好，因为使用了多跳邻域结构，说明KG中捕获邻域信息对推荐是有帮助的

具体代码实现流程：（以movie为例）

users：138159 user的数量

items：16954 movie的数量

interactions：13501622 user和movie的交互数量（有/无交互）

entities：102569 movie+item的数量

relations：32 KG中的关系的数量（制片人、导演、语言、体裁。。。）

triples：499474 KG中的三元组的数量

1、ratings_final.txt：userId、movieId、0/1

user1、movie1、1：user1对movie1有评分，且评分大于阈值

user1、movie1、0：user1对movie1无评分==（纠正：不是没大于阈值）==

即上面说的 $u s e r - i t e m 交互矩阵 Y$

2、kg_final.txt：movieId、relationId、itemId

泰坦尼克号的Id、“导演“的id、詹姆斯·卡梅隆的Id

泰坦尼克号的Id、“语言“的id、英语的Id

泰坦尼克号的Id、“体裁“的id、爱情的Id

泰坦尼克号的id、“主演”的id、莱昂纳多·迪卡普里奥的id

即上面说的 $知识图 G$

data_loader.py:

n_user:user的数量138159
n_item:item（即movie）的数量16954
n_entity:item(制片人、导演、体裁...)+movie的数量102569
n_relation:关系的数量32

rating_final.txt中的数据
train_data 0.6
eval_data 0.2
test_data 0.2

kg_final.txt中的数据
adj_entity:(n_entity,neighbour_size)(即102569，4)纬矩阵，随机挑选当前邻居实体中的四个作为样本
（eg:泰坦尼克号（詹姆斯·卡梅隆、英语、爱情、莱昂纳多·迪卡普里奥），花木兰（。。。。。））
adj_relation:(n_entity,neighbour_size)(即102569，4)纬矩阵，随机挑选当前邻居关系中的四个作为样本
(eg:泰坦尼克号（导演、语言、体裁、主演）,花木兰（。。。。）)

1、将relation和user的得分和领域entity的向量聚合起来得到一个当前entity的领域表示，然后将这个领域表示和自身表示根据聚合器聚合起来，最后得到自身entity的表示

entity neighborhood representation

$\pi^u_r=g(u,r)\begin{cases} u∈R^d \ user\ u的向量 \\ r∈R^d \ relation\ r的向量 \\ d \ 向量的纬度 \end{cases}$ 表示了 $relation\ r$ 对 $user\ u$ 的重要性
$v^u_{N(v)}=\Sigma_{e∈N(v)}\widetilde{\pi}^u_{r_{v,e}}e$ $item\ v$ 的拓扑邻域结构
- $\widetilde{\pi}^u_{r_{v,e}}=\frac{exp(\pi^u_{v,e})}{\Sigma_{e∈N(v)exp(\pi^u_{r_{v,e}})}}$ 归一化 $user-relation\ score$
$v^u_{S(v)}:entity\ v的所有邻域表示$
- $S(v)=\{e|e∈N(v)\}\ and \ |S(v)|=K(超参数,融合K个邻居)$

aggregator

将 $entity\ v$ 的表示 和其邻域表示 $v^u_{S(v)}$ 聚合为一个向量

Sum aggregator 两个向量相加，然后进行非线性转换：
- $agg_{sum}=\sigma(W·(v+v^u_{S(v)})+b)$
Concat aggregator 两个向量连接，然后进行非线性转换：
- $agg_{concat}=\sigma(W·concat(v,v^u_{S(v)})+b)$
Neighbor aggregator 只使用邻域向量，然后进行非线性转换：
- $agg_{neighbor}=\sigma(W·v^u_{S(v)}+b)$

2、将上面计算得到的entity的表示和user的表示内积计算得到一个概率（训练这个概率和标签的损失，使得这个概率达到最大（user和entity的表示越来越近））

代码大赏

preprocess.py

预处理数据集，保证数据集的id等信息是统一的

解析一些超参数，并指定实验的数据集
将数据集中原本user/item的id替换为新的连续的id
convert_rating():

以movie数据集为例，

评分大于等于4（满分为5）的评分视为正样本（user、item、1）

未进行评分的视为负样本（user、item、0）

最终数据集在ratings_final.txt
convert_kg():

以movie数据集为例，

kg中存放entity之间的交互（entity包括movie和一些movie的相关信息（例如：体裁、制片人、导演等等））

最终KG数据集在kg_final.txt

data_loader.py

从文件中加载数据至内存

load_rating():

将ratings_final.txt转换为npy文件，并从中读取数据至内存，并计算user和item（movie）的数量

按照设定好的训练、测试、验证集的比例随机产生数据集train_data、eval_data、test_data（格式为：user、item、0/1）

返回：n_user、n_item、train_data、eval_data、test_data
load_kg():

将kg_final.txt转换为npy文件，并从中读取数据至内存，并计算entity（movie和movie有关的item）和relation的数量
- construct_kg():
  
  将kg_final文件中的头实体和尾实体分别作为key构建成一个字典
  
  {“霸王别姬”“张国荣”，“演员”)}，{“张国荣”“霸王别姬”，“演员”)}
- construct_adj():
  
  adj_entity和adj_relation :[entity_num,neighbor_size]（矩阵大小）int64
  
  从上面说的字典中获取当前实体的邻域节点，并形成矩阵
  
  adj_entity[“霸王别姬”]=[“张国荣”，“陈凯歌”，“剧情”，“1993”]
  
  adj_rellation[“霸王别姬”]=[“演员”，“导演”，“体裁”，“出品时间”]
返回：n_entity、n_relation、adj_entity、adj_relation

model.py

KGCN的模型构建

**__init__(args, n_user, n_entity, n_relation, adj_entity, adj_relation)*初始化模型需要的参数和一些计算图
- **_parse_args(args, adj_entity, adj_relation)*解析参数
- **_build_inputs()*使用占位，构建输入，每次输入长度为batch_size
  
  user_indices：user的序号类似这样：[0 0 0 … 1104 1104 1105]
  
  item_indices：item(movie)的序号
  
  labels：具体的label(0/1)
- **_build_model(n_user, n_entity, n_relation)*构建模型，在此生成embeddding
  
  user_emb_matrix、entity_emb_matrix、relation_emb_matrix
  
  上面三个为[n_entity,dim]纬矩阵，经过初始化，可训练
  - user_embeddings
    
    通过tf.nn.embedding_lookup从user_emb_matrix中先随机抽取和user_indices对应的向量，后续可被训练
  - item_embeddings、aggregators
    
    因为使用需要对movie数据进行扩展升华（即使用周围实体信息来丰富自身），所以要先获取到周围节点在生成向量
    - get_neighbors(item_indices):
      
      item_indices的shape为65536
      
      首先进行扩展纬度，变为：（65536，1）
      
      然后封为列表entities，此时len(entities)=1,entities[0]=(65536,1)纬的矩阵，在创建一个relations的列表
      
      接下来去寻找当前节点的邻居（参数规定为寻找2次，每次找4个邻居）
      
      i=0：第一次找邻居
      
      从adj_entity切片，切片大小entities[0] (65536,1)纬矩阵，切出来为(65536,1,4)纬矩阵，然后reshape为(65536,4)纬矩阵
      
      同理，和邻居的关系的矩阵为(65536，4)纬矩阵
      
      此时，entities[0]=(65536,1)纬矩阵 entities[1]=(65536,4)纬矩阵
      
      relations[0]=(65536,4)纬矩阵
      
      i=1：第二次找邻居
      
      从adj_entity切片，切片大小entities[1] (65536,4)纬矩阵，切出来为(65536,4,4)纬矩阵，然后reshape为(65536,16)纬矩阵
      
      同理，和邻居的关系的矩阵为(65536，16)纬矩阵
      
      此时，entities[0]=(65536,1)纬矩阵 entities[1]=(65536,4)纬矩阵 entities[2]=(65536,16)纬矩阵
      
      relations[0]=(65536,4)纬矩阵 relations[1]=(65536,16)纬矩阵
      
      返回：entities,relations
    - aggregate(entities, relations)：
      
      将从上面获取到的节点的邻居节点和邻居关系用来丰富自身节点并转换为向量
      
      首先，entity_vectors通过tf.nn.embedding_lookup从entity_emb_matrix中先随机抽取和entities对应的向量，后续可被训练
      
      ev[0]:(65536,1,32) ev[1]:(65536,4,32) ev[2]:(65536,16,32)
      
      同理 relation_vectors
      
      rv[0]:(65536,4,32) rv[1]:(65536,16,32)
      
      接着，经过迭代，使用累加器来生成相应的向量
      
      i=0:第一次迭代，累加器激活函数使用relu
      
      h=0:
```
vector = aggregator(
    #(65536, 1, 32)
    self_vectors=entity_vectors[0],
    
    #(65536, 4, 32)===>(65536, 1,4, 32)
    neighbor_vectors=tf.reshape(entity_vectors[1], shape),
    
    #(65536, 4, 32)==>(65536,1,4,32)
    neighbor_relations=tf.reshape(relation_vectors[0], shape),
    
    #[65536,32]
    user_embeddings=self.user_embeddings)
```
      将参数传递至累加器计算用户和关系的分数（表示关系对用户的重要性）
      
      将user_embeddings进行reshape为(65536,1,1,32)
      
      计算user_embeddings和neighbor_relations的乘积的均值分数user_relation_scores（65536,1,4）
      
      将分数进行softmax归一化user_relation_scores_normalized(65536,1,4)
      
      将user_relation_scores_normalized扩展纬度为(65536,1,4,1)
      
      计算user_relation_scores_normalized和neighbor_vectors的乘积的均值neighbors_aggregated(65536,1,32)
      
      返回：neighbors_aggregated(65536,1,32)
      
      此时：entity_vectors_next_iter[0]=[65536,1,32]
      
      h=1:
```
vector = aggregator(
    #(65536, 4, 32)
    self_vectors=entity_vectors[1],
    
    #(65536, 16, 32)===>(65536, 4,4, 32)
    neighbor_vectors=tf.reshape(entity_vectors[2], shape),
    
    #(65536, 16, 32)==>(65536,4,4,32)
    neighbor_relations=tf.reshape(relation_vectors[1], shape),
    
    #[65536,32]
    user_embeddings=self.user_embeddings)
```
      将user_embeddings进行reshape为(65536,1,1,32)
      
      计算user_embeddings和neighbor_relations的乘积的均值分数user_relation_scores（655364,4）
      
      将分数进行softmax归一化user_relation_scores_normalized(65536,4,4)
      
      将user_relation_scores_normalized扩展纬度为(65536,4,4,1)
      
      计算user_relation_scores_normalized和neighbor_vectors的乘积的均值neighbors_aggregated(65536,4,32)
      
      返回：neighbors_aggregated(65536,4,32)
      
      此时：entity_vectors_next_iter[0]=[65536,1,32]，entity_vectors_next_iter[1]=[65536,4,32]
      
      i=0 此时要结束了
      
      entity_vectors_next_iter赋值给entity_vectors
      
      此时：entity_vectors[0]=[65536,1,32]，entity_vectors[1]=[65536,4,32]
      
      i=1:第二次迭代，累加器激活函数使用tanh
      
      h=0:
```
vector = aggregator(
    #(65536, 1, 32)
    self_vectors=entity_vectors[0],
    
    #(65536, 4, 32)===>(65536, 1,4, 32)
    neighbor_vectors=tf.reshape(entity_vectors[1], shape),
    
    #(65536, 4, 32)==>(65536,1,4,32)
    neighbor_relations=tf.reshape(relation_vectors[0], shape),
    
    #[65536,32]
    user_embeddings=self.user_embeddings)
```
      将user_embeddings进行reshape为(65536,1,1,32)
      
      计算user_embeddings和neighbor_relations的乘积的均值分数user_relation_scores（65536,1,4）
      
      将分数进行softmax归一化user_relation_scores_normalized(65536,1,4)
      
      将user_relation_scores_normalized扩展纬度为(65536,1,4,1)
      
      计算user_relation_scores_normalized和neighbor_vectors的乘积的均值neighbors_aggregated(65536,1,32)
      
      返回：neighbors_aggregated(65536,1,32)
      
      此时：entity_vectors_next_iter[0]=[65536,1,32]
      
      i=1 此时要结束了
      
      entity_vectors_next_iter赋值给entity_vectors
      
      此时：entity_vectors[0]=[65536,1,32]
      
      两次迭代结束后
      
      将最终的entity_vectors进行reshape为res(65536,32)
      
      返回：res,aggregators(两次使用的累加器)
    此时生成了item_embeddings向量和aggregators的累加器
  - scores
    
    使用user_embeddings和item_embeddings的乘积的和值，算出user和item的得分score(65536)（就是user选择这个movie的概率）
  - scores_normalized
    
    对scores进行sigmoid归一化

神经网络机器学习中说的过拟合是什么意思 yuanpan 机器学习神经网络人工智能
在神经网络和机器学习中，过拟合（Overfitting）是指模型在训练数据上表现非常好，但在未见过的测试数据上表现较差的现象。换句话说，模型过度学习了训练数据中的细节和噪声，导致其泛化能力（Generalization）下降，无法很好地适应新数据。过拟合的表现训练误差很低，但测试误差很高：模型在训练集上的准确率非常高，但在测试集上的准确率却显著下降。模型过于复杂：模型学习了训练数据中的噪声或不相关
训练大模型LLM选择哪种开发语言最好大0马浓人工智能训练 python
训练大型语言模型（LLM）时，选择合适的编程语言主要取决于效率、生态支持、开发便利性以及特定需求（如性能优化或硬件适配）。以下是常见语言的分析和推荐：---1.Python（首选语言）优势：-生态系统丰富：主流深度学习框架（PyTorch、TensorFlow、JAX）均以Python为主要接口，提供完整的工具链（数据处理、模型训练、评估部署）。-开发效率高：语法简洁，适合快速实验和原型开发，社区
android系统架构的前世今生，超强Android进阶路线知识图谱 m0_64319298 程序员面试 android 移动开发
4.Android专有的驱动程序除了上面这些不同点之外，最重要的是，为了突出android特性，支持android设备，Android还对Linux设备驱动进行了增强，主要如下所示。1)AndroidBinder基于OpenBinder框架的一个驱动，用于提供Android平台的进程间通信(InterProcessCommunication，IPC)功能。源代码位于drivers/staging/
Chebykan wx 文章阅读やっはろ深度学习
文献筛选[1]神经网络：全面基础[2]通过sigmoid函数的超层叠近似[3]多层前馈网络是通用近似器[5]注意力是你所需要的[6]深度残差学习用于图像识别[7]视觉化神经网络的损失景观[8]牙齿模具点云补全通过数据增强和混合RL-GAN[9]强化学习：一项调查[10]使用PySR和SymbolicRegression.jl的科学可解释机器学习[11]Z.Liu,Y.Wang,S.Vaidya,F
LeNet-5卷积神经网络详解 LChuck 深度学习人工智能神经网络深度学习数据结构计算机视觉 AIGC
LeNet-5卷积神经网络详解1.历史背景LeNet-5是由YannLeCun等人在1998年提出的一种卷积神经网络架构，是深度学习领域的一个重要里程碑。这个网络最初是为了解决手写数字识别问题而设计的，在当时取得了突破性的成果。它的成功不仅证明了卷积神经网络在计算机视觉任务中的有效性，更为后来深度学习的发展奠定了重要基础。图1：LeNet-5网络结构示意图2.网络结构LeNet-5的结构非常优雅且
论文阅读笔记：Graph Matching Networks for Learning the Similarity of Graph Structured Objects 游离态GLZ不可能是金融技术宅知识图谱机器学习深度学习人工智能
论文做的是用于图匹配的神经网络研究，作者做出了两点贡献:证明GNN可以经过训练，产生嵌入graph-leve的向量可以用于相似性计算。作者提出了一种新的基于注意力的跨图匹配机制GMN(cross-graphattention-basedmatchingmechanism)，来计算出一对图之间的相似度评分。（核心创新点）论文证明了该模型在不同领域的有效性，包括具有挑战性的基于控制流图(control
开发ai模型最佳的系统是Ubuntu还是linux？俺足人工智能 ubuntu
在AI/ML开发中，Ubuntu是更优选的Linux发行版，原因如下：1.开箱即用的AI工具链支持Ubuntu预装了主流的AI框架（如TensorFlow、PyTorch）和依赖库，且通过apt包管理器可快速部署开发环境。提供针对NVIDIAGPU的官方驱动支持，简化CUDA和cuDNN的配置流程（如nvidia-smi直接监控显存）。2.社区生态与长期维护（LTS）UbuntuLTS版本（如24
基于pytorch的神经病网络搭建学习停走的风 pytorch学习学习 pytorch 人工智能
1.pycharm中code方法的使用1.1父类重写技巧操作：在需要重写的方法上右键，选择code-->Generate>OverrideMethods。作用：自动生成重写父类或接口的方法2.简单神经网络importtorchfromtorchimportnnclassyu(nn.Module):def__init__(self,*args,**kwargs)->None:super().__in
如何增强机器学习基础，提升大模型面试通过概率 weixin_40941102 机器学习面试人工智能
我的好朋友没有通过面试所以我给我的好朋友准备了这一篇学习路线随着大模型（如Transformer、GPT-4、LLaMA等）在自然语言处理（NLP）、计算机视觉（CV）和多模态任务中的广泛应用，AI行业的招聘竞争愈发激烈。面试官不仅要求候选人熟练使用深度学习框架（如PyTorch、TensorFlow），还希望他们具备扎实的机器学习理论基础、算法实现能力和实际问题解决经验。本文将从机器学习基础入手
Bottleneck、CSP、DP结构详细介绍 CV工程师小朱深度学习笔记人工智能深度学习 CSP 深度可分离残差网络
文章目录前言一、BottleneckDarknetBottleneck二、CSPCSP思想pp-picodet中的CSPLayerDP卷积前言本篇文章详细介绍了三种神经网络中常见的结构，bottleneck、CSP、DP，并附上了代码加深理解。一、BottleneckBottleneck出现在ResNet50/101/152这种深层网络中，基本思想就是先用1x1减少通道数再进行卷积最后再通过1x1
算力服务器主要是指什么？ wanhengidc 服务器运维
随着科技的快速发展，人工智能也逐渐兴起，算力服务器也受到了各个企业的重视，本文就来为大家介绍一下算力服务器主要都是指什么吧！算力服务器对于人工智能领域来说，在深度学习模型的训练和推理过程中扮演着非常重要的角色，算力服务器可以执行大规模的矩阵计算，加速神经网络的训练和推理过程，帮助企业使得模型训练的时间大幅度缩短。算力服务器通常会配备高速网络接口，以此来实现快速的数据信息传输速度和通信速度，同时高速
机器学习模型-从线性回归到神经网络 Earth explosion 机器学习线性回归神经网络
在当今的数据驱动世界中，机器学习模型是许多应用程序的核心。无论是推荐系统、图像识别，还是自动驾驶汽车，机器学习技术都在背后发挥着重要作用。在这篇文章中，我们将探索几种基础的机器学习模型，并了解它们的基本原理和应用场景。1.线性回归基本原理线性回归是最简单的机器学习模型之一。它旨在找到一个最佳拟合线来预测目标变量（通常是连续值）。线性回归假设输入变量和输出变量之间存在线性关系，其数学表达式为：[y=
神经网络探秘：原理、架构与实战案例二川bro 智能AI 神经网络人工智能深度学习
神经网络探秘：原理、架构与实战案例前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，可以分享一下给大家。点击跳转到网站。https://www.captainbed.cn/ccc在人工智能的浪潮中，神经网络作为核心驱动力之一，正引领着技术革新与产业变革。本文旨在深入剖析神经网络的原理、常见架构，并通过一个实际的代码案例，带领读者亲手实践神经网络的构建与训练过程。无论你是机器学习初学者，还
用物理信息神经网络（PINN）解决实际优化问题：全面解析与实践青橘MATLAB学习深度学习网络设计人工智能深度学习物理信息神经网络强化学习
摘要本文系统介绍了物理信息神经网络（PINN）在解决实际优化问题中的创新应用。通过将物理定律与神经网络深度融合，PINN在摆的倒立控制、最短时间路径规划及航天器借力飞行轨道设计等复杂任务中展现出显著优势。实验表明，PINN相比传统数值方法及强化学习（RL）/遗传算法（GA），在收敛速度、解的稳定性及物理保真度上均实现突破性提升。关键词：物理信息神经网络；优化任务；深度学习；强化学习；航天器轨道一、
计算机视觉深度学习入门（4） yyc_audio 计算机视觉人工智能计算机视觉深度学习神经网络
在小型数据集上从头开始训练一个卷积神经网络利用少量数据来训练图像分类模型，这是一种很常见的情况。如果你从事与计算机视觉相关的职业，那么很可能会在实践中遇到这种情况。“少量”样本既可能是几百张图片，也可能是上万张图片。我们来看一个实例——猫狗图片分类，数据集包含5000张猫和狗的图片（2500张猫的图片，2500张狗的图片）。我们将2000张图片用于训练，1000张用于验证，2000张用于测试。将介
LLM大模型技术实战4：热门开源LLMs对比和选型大模型学习教程机器学习开源人工智能职场和发展
一、大语言模型的特点和能力LLM(LargeLanguageModel,大型语言模型)是指那些规模庞大、参数数量众多的深度神经网络模型，用于理解和生成自然语言文本。在自然语言处理（NLP）领域有着广泛的应用，因其强大的语言理解和生成能力，能够处理各种复杂的文本任务。1.1主要特点架构特点LLM主要基于Transformer架构，Transformer通过自注意力机制（Self-Attention）
情感识别（Emotion Recognition）路野yue 人工智能自然语言处理
情感识别（EmotionRecognition）是通过分析人类的多模态数据（如面部表情、语音、文本等）来识别和理解其情感状态的技术。它在人机交互、心理健康、市场分析等领域有广泛应用。情感识别的主要方法1.基于面部表情的情感识别方法：通过分析面部特征（如眼睛、嘴巴、眉毛等）来识别情感。技术：传统方法：使用特征提取（如Gabor滤波器、LBP）和分类器（如SVM）。深度学习方法：使用卷积神经网络（CN
人工智能机器学习算法分类全解析 power-辰南人工智能人工智能机器学习算法 python
目录一、引言二、机器学习算法分类概述（一）基于学习方式的分类1.监督学习（SupervisedLearning）2.无监督学习（UnsupervisedLearning）3.强化学习（ReinforcementLearning）（二）基于任务类型的分类1.分类算法2.回归算法3.聚类算法4.降维算法5.生成算法（三）基于模型结构的分类1.线性模型2.非线性模型3.基于树的模型4.基于神经网络的模型
【光流】——liteflownet论文与代码浅读农夫山泉2号光流计算机视觉深度学习人工智能光流 liteflownet
光流，liteflownetcode:mmflowCVPR20181.前言FlowNet2是最先进的光流估计卷积神经网络(CNN)，需要超过160M的参数来实现精确的流量估计。在本文中，我们提出了一种替代网络，它在Sintel和KITTI基准测试上优于FlowNet2，同时在模型尺寸上要小30倍，在运行速度上要快1.36倍。这是通过深入研究当前框架中可能被遗漏的架构细节而实现的：（1）我们通过轻量
机器学习入门指南：从 TensorFlow 到 PyTorch 6v6-博客机器学习 tensorflow pytorch
机器学习入门指南：从TensorFlow到PyTorch机器学习（MachineLearning）是人工智能的核心领域之一，近年来在图像识别、自然语言处理、推荐系统等领域取得了巨大进展。本文将从基础概念入手，介绍机器学习的核心知识，并带你快速上手两大主流框架：TensorFlow和PyTorch。机器学习基础什么是机器学习？机器学习是一种通过数据训练模型，使计算机能够自动学习和改进的技术。它主要分
PointNet++改进策略：模块改进 | x-Conv | PointCNN，结合局部结构与全局排列提升模型性能我是瓦力 PointNet++改进策略人工智能深度学习计算机视觉
目录前言PointCNN实现细节1.XXX-Conv操作输入输出步骤2.PointCNN网络架构层级卷积分类与分割任务3.数据增强4.效率优化前言这篇论文介绍了一种名为PointCNN的方法，旨在从点云（pointcloud）数据中学习特征。传统卷积神经网络（CNN）在处理规则网格数据（如图像）时非常有效，但由于点云是无序且不规则的，直接在其上应用卷积操作会导致形状信息丢失，并对点的排列顺序敏感。
人工智能学习星月IWJ 人工智能机器学习深度学习神经网络目标检测人工智能
//-----初探-----//人工智能三大核心要素数据/算法/算力人工智能是通过机器来模拟人类认知能力的技术机器学习/神经网络/深度学习(多层隐藏层神经网络)tf1.14python3.5keras2.1.5//-----数学基础&&数字图像-----//向量大小/方向矢量(有大小和方向)标量(只有大小没有方向(长度))单位向量线性变换(矩阵运算)T(v+w)=T(v)+T(w)T(cv)=cT
《自然语言处理实战入门》深度学习 ---- 预训练模型初探 shiter AI重制版】预训练 NLP 自然语言处理
文章大纲前言预训练模型简介语言表示学习神经上下文编码器为何需要预训练模型发展历史主流预训练模型预训练模型与分类将PTMs应用至下游任务微调策略未来研究方向参考文献前言随着深度学习的发展，各种神经网络被广泛用于解决自然语言处理(NLP)任务，如卷积神经网络(convolutionalneuralnetworks,CNNs)、递归神经网络(neuralnetworks,RNNs)、基于图的神经网络(g
时态知识图谱补全任务为什么要进行损坏四元组过滤？ sauTCc 知识图谱知识图谱人工智能
过滤设置（FilteredSetting）的目的是为了确保模型评估的公平性和合理性。以下详细解释为什么要进行这样的过滤：1.避免模型因预测正确事实而受到惩罚问题：在知识图谱（KG）或时序知识图谱（TKG）的链接预测任务中，模型需要为查询（如((s,r,?,t))）生成候选答案。如果候选答案中包含了已经存在于图谱中的正确事实，模型可能会将这些正确事实的排名降低，仅仅因为它们已经存在。例子：假设图谱中
【基于KG的大模型对话系统（fastapi）完整可上手】放飞自我的Coder python fastapi kg
以下是一个使用FastAPI搭建的基于知识图谱的大模型对话系统的示例代码。该系统包括：FastAPI服务器：提供RESTfulAPI。知识图谱：使用Neo4j作为存储和查询引擎。大模型：利用OpenAIGPT进行自然语言处理。查询解析：将用户输入解析为知识图谱查询，并结合LLM生成回答。主要功能：解析用户输入：检查用户输入是否包含知识图谱查询内容。执行Cypher查询：如果用户问题涉及知识图谱，向
【AI深度学习网络】Transformer时代，RNN（循环神经网络）为何仍是时序建模的“秘密武器”？ arbboter 人工智能 rnn 人工智能深度学习循环神经网络记忆序列数据循环连接
引言：什么是循环神经网络（RNN）？循环神经网络（RecurrentNeuralNetwork,RNN）是一种专门处理序列数据（如文本、语音、时间序列）的深度学习模型。与传统神经网络不同，RNN具有“记忆”能力，能够通过内部状态（隐藏状态）保留历史信息，从而捕捉序列中的时间依赖关系。在自然语言处理、语音识别、时间序列预测等领域，数据本质上是序列化的——即当前数据点与前后数据点存在依赖关系。传统的前
多模态大模型：技术原理与实战模型压缩实战 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
多模态大模型：技术原理与实战模型压缩实战作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：多模态大模型，技术原理，模型压缩，实战，TensorFlow，PyTorch，模型压缩方法，应用场景1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，多模态大模型在图像识别、语音识别、自然语言处理等领域的应用越来越广泛。然而，多模态大模型通常具有庞大
基于PyTorch的深度学习5—神经网络工具箱 Wis4e 深度学习 pytorch 神经网络
nn.Module是nn的一个核心数据结构，它可以是神经网络的某个层(Layer)，也可以是包含多层的神经网络。在实际使用中，最常见的做法是继承nn.Module，生成自己的网络/层。nn中已实现了绝大多数层，包括全连接层、损失层、激活层、卷积层、循环层等，这些层都是nn.Module的子类，能够自动检测到自己的Parameter，并将其作为学习参数，且针对GPU运行进行了cuDNN优化。nn中的
Python 在深度学习中的应用 2501_90435375 人工智能 python 深度学习开发语言
深度学习是机器学习的一个分支，它通过构建和训练深层神经网络来实现对数据的学习和理解。Python作为一种简洁、易读、功能强大的编程语言，在深度学习领域得到了广泛的应用。本文将详细介绍Python在深度学习中的应用，包括深度学习的基础概念、Python深度学习库和框架、实际案例。二、深度学习的基础概念1.神经网络神经网络是深度学习的基础，它由多个神经元组成，每个神经元接收输入信号，进行加权求和，并通
H800实战应用深度解析endofsentence 智能计算研究中心其他
内容概要H800作为新一代计算架构的核心组件，其设计理念聚焦于高性能计算与人工智能场景的深度融合。通过模块化异构计算架构，H800实现了计算密度与能效比的突破性提升。下表展示了H800在不同场景下的性能表现对比：场景类型训练速度提升推理延迟降低能效比提升自然语言处理35%22%40%计算机视觉28%18%33%推荐系统41%29%37%资深系统架构师指出："H800的异构计算架构在模型并行处理方面
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st

KGCN_基于知识图谱的推荐系统（KG+GCN）

Abstract

Introduction

Problem Formulation

KGCN Layer

entity neighborhood representation

aggregator

Learning Algorithm

Experiments

Datasets

Baselines

Results

具体代码实现流程：（以movie为例）

entity neighborhood representation

aggregator

代码大赏

preprocess.py

data_loader.py

model.py

你可能感兴趣的:(推荐系统,知识图谱,推荐系统,神经网络,tensorflow)