小明2766

【异构图-＞精读】Heterogeneous Graph Attention Network

HAN

Heterogeneous Graph Attention Network

Abstract

graph neural network没有考虑异构图。

异构图：在图里，节点的类型+边的类型>2。

异构性和丰富的语义信息给异构图的图神经网络设计带来了极大的挑战。

本文提出：heterogeneous graph neural network based on the hierarchical attention, including node-level and semantic-level attentions（基于层次注意力的异构图神经网络，包括节点级和语义级注意力）

具体来说，节点级注意旨在了解节点与其基于元路径的邻居之间的重要性，而语义级注意能够了解不同元路径的重要性。通过从节点级和语义级关注中学习到的重要性，可以充分考虑节点和元路径的重要性。

然后，该模型可以通过从元路径的邻居，以分层的方式聚合特征（aggregating features）。

Keywords

Social Network
Neural Network
Graph Analysis

1 Introduction

Graph neural network（GNN）在图的表示上很强大。

[10，20，24]利用深度神经网络学习基于节点特征node features和图形结构graph structure的节点表示node presentations。

同质图的Attention模型，Graph Attention Network（GAT）[35]

异构信息网络heterogeneous information network（HIN）[28] = heterogeneous graph 异构图。具有多种类型的节点和边。它有更全面的信息和丰富的语义。

meta-path 元路径[32]，连接两个对象的composite relation，是一种广泛用于捕获语义的结构。

以图1a为例，包含3种类型节点，movie，actor，director。2部电影的关系可以通过元路径揭示，元路径比如Movie-Actor-Movie（同一个演员）、Movie-Director-Movie（同一个导演）。

可以看出，根据元路径的不同，异构图中节点之间的关系可以具有不同的语义。

由于异构图的复杂性，传统的图神经网络不能直接应用于异构图。

T1. 这里相当于提示了一些模型构建的初衷和注意点：

在为异构图设计具有注意机制的图神经网络体系结构时，我们需要满足以下新的要求：

Heterogeneity of graph. 图的异质性，不同类型的节点有不同的特征，而且特征可能在不同的特征空间中。另一方面，例子中movie的特征可能涉及到plot（情节）和演员。
Semantic-level attention. 语义层面的注意力。
- 异构图中不同的元路径可以提取不同的语义信息。如何为特定任务选择最有意义的元路径并融合语义信息是一个尚未解决的问题[4，19，26]。语义级关注旨在了解每个元路径的重要性，并为其分配适当的权重。
- 例子：movie《终结者》可以通过actor或year连接movie《终结者2》或《Birdy》，显然前者的元路径更重要。
- 同等对待不同的元路径是不现实的，会削弱一些有用的元路径提供的语义信息。
Node-level attention. Node层面的注意力。
- 给定一个元路径，每个节点都有许多基于元路径的邻居。
- 如何区分这些邻居之间的细微差异，并选择一些信息丰富的邻居是必需的。对于每个节点，node-level注意力旨在了解基于元路径的邻居的重要性，并为其分配不同的注意力值。
- 例子：当使用Movie-Director-Movie时，《终结者》将通过导演詹姆斯·卡梅隆连接到《泰坦尼克号》和《终结者2》。为了更好地识别《终结者》作为科幻电影的类型，模型应该更多地关注《终结者2》，而不是《泰坦尼克号》。
- 因此，需要如何设计一个能够发现邻居的细微差异并正确学习其权重的模型。

本文提出了HAN，它同时考虑了node-level and semantic-level attentions.

use the type-specific transformation matrix to project different types of node features into the same space 使用类型特定的转换矩阵将不同类型的节点特征投影到同一空间中。
node-level attention: learn the attention values between the nodes and their meta-path based neighbor 学习节点与其基于元路径的邻居之间的注意值
semantic-level attention: learn the attention values of different meta paths for the specific task in the heterogeneous graph. 学习异构图中特定任务的不同元路径的注意值

2 Related Work

2.1 Graph Neural Network

GNN模型在深度网络应用于处理图结构数据[10, 24]
GNN的propagate information[20]
图结构数据使用卷积。图卷积神经工作一般分为两类，即谱域[2] [6] [18]和非谱域[14]。
Attention机制，分为self-attention[34]和soft-attention[1]
attention应用在图上做recommendation[15, 16]
用于学习节点及其邻居之间的重要性，并融合邻居进行节点分类[35]

上面都只能应用在同质图上。

2.2 Network Embedding

Network embedding = network representation learning(NRL)。旨在将network embed到低维空间中，同时保持network的结构和性质，以便将学习到的embedding应用于downstream network tasks。

例如，基于随机行走的方法[12，23]、基于深度神经网络的方法[36]、基于矩阵分解的方法[22，37]以及其他方法，例如LINE[33]。（在同质图上）

Heterogeneous graph embedding主要关注于保留基于元路径的结构信息。

ESim[26]，user-defined meta-paths作指导，学习顶点的向量，用于similarity search。
Meta-path2vec[7]，只使用一个原路径。
与上面类似，HERec[27]，提出了一种类型约束策略来过滤节点序列并捕获异构图中反映的复杂语义。
HIN2Vec[9]，执行多个预测训练任务，同时学习节点和元路径的潜在向量
PME[3]，通过欧几里得距离保持节点的邻近性。
HEER[29]，通过edge representations，嵌入异构图
metagraph2vec[8]，最大限度地保留了结构和语义以用于恶意软件检测。
meta-graph-based network embedding models[30]，同时考虑了元图中所有元信息的隐藏关系。

3 Preliminary

Heterogeneous Graph[31]，异构图。表示为 $\mathcal{G} = (\mathcal{V}, \varepsilon)$ （object set，link set）。
meta-path
meta-path based neighbors

论文符号表：

4 The Proposed Model

HAN framework

4.1 Node-level Attention

论文这里又复述了T1部分，说明了Node-level Attention的存在意义

由于异构性，不同类型节点有不同特征空间feature spaces。对于每种类型的节点，设计了type-specific transformation matrix $M_{\phi_i}$ ，以将不同类型节点的特征投影到相同的特征空间中。

与[13]不同，matrix是基于node-type，rather than edge-type。

h i, h i’分别是original, projected feature of node i。

之后，使用self-attention[34]学习各种节点之间的权重。

左边表示node j对node i来说有多重要， $\Phi$ 是元路径，ij在元路径上。
右边 att node表示 the deep neural network which performs the node-level attention。一条meta path中att node是共享的。

然后，inject the structural information into the model via masked attention。计算 i在元路径 $\Phi$ 上的所有邻居 j（复数加s）的 $e^{\Phi}_{ij}$ 。

之后，normalize，通过softmax获得权重系数 $\alpha^{\Phi}_{ij}$ 。

a $_\Phi$ 是针对meta-path $\Phi$ 的node-level attention vector。

然后，节点i的基于元路径的embedding可以通过neighbor’s projected features与相应系数进行聚合，如下所示：

左边 = node i 学习到的embedding，在元路径 $\Phi$ 上。

为了更好地理解aggregating process of node-level，可以看图3a。

Every node embedding is aggregated by its neighbors.
the attention weight $\alpha^{\Phi}_{ij}$ is generated for single meta-path, it is semantic-specific and able to capture one kind of semantic information.

再多头注意力，重复K次。

输入meta-path set { $...\Phi_p$ }、node features，就可以获得P组的 semantic-specific node embeddings { $...Z_{\Phi_p}$ }。

4.2 Semantic-level Attention

To learn a more comprehensive node embedding, we need to fuse multiple semantics which can be revealed by meta-paths.

输入：P组 semantic-specific node embeddings learned from node-level attention。每条元路径的学习权重 $\beta$ 如下所示：

att sem表示deep neural network which performs the semantic-level attention.

首先利用非线性转换(e.g., one-layer MLP) 转换 semantic-specific embedding。
然后通过transformed embedding和semantic-level attention vector q的相似性，评判semantic-specific embedding的重要性。
此外，我们平均所有 semantic-specific node embedding的重要性（可以解释为每个元路径的重要性 $w_{\Phi_i}$ ）。

在获得每个元路径的重要性之后，对其softmax进行normalizing。可以获得元路径Φi的权重，表示为βΦi

这可以解释为元路径Φi对特定任务的贡献。显然，βΦi越高，元路径Φi越重要。这些权重 * semantic-specific embeddings = 最终的embedding Z：

如图3(b)所示，final embedding = all semantic-specific embedding的聚合。然后根据特定任务，设计不同的loss function。针对半监督节点分类，使用Cross-Entropy：

HAN的整个过程如Algorithm 1所示。（很清晰）

4.3 Analysis of the Proposed Model

HAN有以下优点：

异构图有丰富的语义
容易并行化，时间复杂度低
对整个异构图的分层关注是共享的，这意味着参数的数量不依赖于异构图的规模，可以用于归纳问题[14]。
该模型对学习节点嵌入具有潜在的良好解释性，这是异构图分析的一大优势。通过学习节点和元路径的重要性，该模型可以更加关注特定任务的一些有意义的节点或元路径，并对异构图进行更全面的描述。

5 Experiments

5.2 Baselines

DeepWalk[23]，随机游走的网络embedding方法，用于同构图
ESim[26]，用于异构图embedding
metapath2vec[7]，异构图embedding。它执行基于元路径的随机遍历，并利用skipgram嵌入异构图。只考虑一个元路径。
HERec[27]，异构图embedding
GCN[18]，为同质图设计的半监督图卷积网络。
GAT[35]，半监督神经网络，考虑了异构图上的注意机制。

6 Conclusion

HAN可以捕获异构图背后的复杂结构和丰富语义。
leverages node-level attention and semantic-level attention to learn the importance of nodes and meta-paths, respectively.（利用节点级注意和语义级注意分别学习节点和元路径的重要性。）
utilizes the structural information and the feature information in a uniform way（统一利用了结构信息和特征信息）

我的疑问/总结

有些复杂的论文还是自己慢慢看一遍好理解。

你可能感兴趣的:(推荐系统,1024程序员节)

怎么能得到各种淘宝优惠券呢？领取淘宝优惠券的平台有哪些? 氧惠评测
要得到各种淘宝优惠券，可以通过以下几种途径：一、使用第三方优惠券平台除了直接在淘宝平台领取外，还可以使用第三方优惠券平台来获取更多的优惠券资源。这些平台通常会与淘宝商家合作，提供额外的优惠券和返利服务。以下是一些常见的领取淘宝优惠券的平台：氧惠APP特点：氧惠APP不仅提供了淘宝的优惠券，还涵盖了其他主流电商平台和生活服务平台，如美团、饿了么等。它以其全面的优惠信息和精准的推荐系统赢得了用户的喜爱
智能体学习记录一罗同学213 学习
智能体是什么智能体（IntelligentAgent）是一种能够感知周围环境、自主决策并执行行动以实现特定目标的智能化系统或程序。它可以是软件（如聊天机器人）、硬件（如机器人），或两者结合的实体，核心特征包括：自主性：无需人工实时干预，独立运行（如自动驾驶车辆避障）。反应性：实时感知环境变化并快速响应（如智能家居调节温度）。目标导向：基于预设目标优化行动（如推荐系统最大化用户点击率）。学习能力：通
java毕业设计源码案例-基于ssm+协同过滤的个性化小说推荐系统设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等) 项目帮 springboot java 计算机毕设 java 课程设计开发语言
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计，开题报告、任务书、全b
机器学习中的数据预处理：从入门到实践耐思nice～机器学习由浅入深-吴恩达机器学习人工智能
在当今的智能时代，机器学习已经渗透到我们生活的方方面面。比如我们常用的推荐系统，它能根据我们的浏览记录精准推送喜欢的商品或视频，这背后就离不开机器学习的支撑。而一个优秀的机器学习模型，离不开高质量的数据，数据预处理正是保证数据质量的关键环节，它就像烹饪前的食材处理，直接影响着最终“菜品”的口感，也就是模型的性能。今天，我们就来全面学习机器学习中数据预处理的关键步骤。一、数据预处理的重要性数据预处理
打造智能资讯引擎：基于 Python 的新闻数据爬取与个性化推荐系统实战全流程解析程序员威哥最新爬虫实战项目 python 开发语言
前言：数据时代的信息洪流，如何做到“千人千面”？在信息爆炸的时代，每天都有成千上万条新闻资讯涌现。如何从海量内容中挖掘出用户感兴趣的资讯？这不仅仅是爬虫技术的问题，更是数据建模与智能推荐算法的落地挑战。本篇文章将带你从零出发，构建一个具有实际应用价值的“个性化新闻阅读推荐系统”，从数据采集（爬虫）、文本处理（NLP）、兴趣建模（TF-IDF/协同过滤/Embedding）到推荐展示，覆盖整个推荐系
计算机视觉产品推荐,个性化推荐:人工智能中的计算机视觉、NLP自然语言处理和个性化推荐系统哪个前景更好一些？...
这个问题直接回答的话可能还是有着很强的个人观点，所以不如先向你介绍一些这几个领域目前的研究现状和应用情况(不再具体介绍其中原理)你自己可以斟酌一下哪方面更适合自己个性化推荐。一．所谓计算机视觉，是指使用计算机及相关设备对生物视觉的一种模拟个性化推荐。它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息，就像人类和许多其他类生物每天所做的那样[1]。现在人工智能的计算机视觉主要研究
RabitQ 量化：既省内存又提性能大禹智库《向量数据库指南》《实战AI智能体》人工智能 AI自动化大禹智库 AI智能体向量数据库
突破高维向量内存瓶颈：MlivusCloudRaBitQ量化技术的工程实践与调优指南作为大禹智库高级研究员，拥有三十余年向量数据库与AI系统架构经验的我发现，在当今多模态AI落地的核心场景中，高维向量引发的内存资源消耗问题已成为制约系统规模化部署的“卡脖子”因素。特别是在大规模图像检索、个性化推荐系统和语义搜索引擎中，动辄数亿级别的向量数据需要实时处理，传统全精度索引方式会让内存资源消耗呈指数级增
基于用户画像的商品推荐系统 Dush32 机器学习人工智能 python 推荐算法
随着人工智能和大数据技术的进步，产品推荐系统成为了现代广告与电商平台中不可或缺的部分。通过深度挖掘用户的行为数据，能够为广告主提供精准的用户画像，从而更高效地推荐相关产品，提升购买转化率。本项目基于科大讯飞AI营销云大赛的赛题，目的是利用用户画像进行产品推荐，预测用户是否会购买相应商品。我们使用了机器学习的二分类模型，通过分析用户的性别、年龄、常驻地、机型等信息，来判断用户的付费行为。项目目标：本
SpringBoot服装推荐系统实战 KENYCHEN奉孝 java AI spring boot 后端人工智能
SpringBoot服装推荐系统实例以下是基于SpringBoot实现的服装推荐系统的30个实例代码示例，涵盖核心功能和实现方法。用户注册与登录功能@RestController@RequestMapping("/api/auth")publicclassAuthController{@AutowiredprivateUserServiceuserService;@PostMapping("/re
知识表示与推理：AI智能的核心技术 AIGC应用创新大全人工智能 easyui 前端 ai
知识表示与推理：AI智能的核心技术1.引入与连接：AI如何"思考"世界？想象一下，当你询问智能助手："我明天需要带伞吗？"它如何得出答案？它需要理解"带伞"与"天气"的关系，需要获取天气预报信息，需要推断明天的天气状况，最终综合这些"知识"给出建议。这一看似简单的过程，背后正是AI的核心能力：知识表示（如何"记住"信息）和推理（如何"思考"问题）。从Siri到AlphaGo，从推荐系统到自动驾驶，
极限挑战：用知识蒸馏压缩模型，实时推荐系统在50ms内完成推荐
极限挑战：用知识蒸馏压缩模型，实时推荐系统在50ms内完成推荐标题极限挑战：用知识蒸馏压缩模型，实时推荐系统在50ms内完成推荐TagAI,知识蒸馏,实时推荐,模型压缩,技术挑战,高性能描述面对实时推荐系统必须在50ms内完成推荐这一极限条件，AI研发工程师团队在数据量从GB级飙升至PB级的巨大冲击下，展现出极高的技术实力和创新能力。团队通过引入先进的模型压缩和优化技术，成功在性能和精度之间找到了
图机器学习（13）——图相似性检测
图机器学习（13）——图相似性检测0.前言1.基于图嵌入的方法2.基于图核的方法3.基于GNN的方法4.应用0.前言图机器学习(machinelearning,ML)方法能广泛应用于各类任务，其应用场景涵盖从药物设计到社交网络推荐系统等多个领域。值得注意的是，由于这类方法在设计上具有通用性，同一算法可用于解决不同问题。学习图之间相似性的定量度量是一个关键问题。事实上，这是网络分析的重要步骤，同时也
推荐算法召回：架构理解 Jay Kay c++推荐算法推荐算法架构算法
一、召回服务的定位与挑战召回层是推荐系统的第一道漏斗，负责从亿级候选集中筛选出千级别的相关项，其效果直接决定推荐效果的天花板。核心挑战包括：低延迟约束：需在50ms内完成海量候选检索；高召回率要求：98%的召回率需覆盖用户多样化兴趣；数据漂移应对：实时用户行为分布变化需动态适应；误杀控制：避免优质内容被过度过滤引发用户投诉。⚙️二、召回服务核心架构1.多路召回并行召回策略实现方式适用场景规则召回基
推荐系统中的归因分析 liliangcsdn 人工智能大数据
推荐系统中，归因分析(AttributionAnalysis)分析用户完成转化前到底是哪个渠道最起决定性作用。参考网络相关资料，常用的用户转化归因分析模型有如下6种，现收录参阅。1）最后点击归因转化全部归因于用户转化前最后一次点击的渠道。用户8月1日小红书种草，8月5日搜索官网，8月10日淘宝广告点击并完成下单。“最后点击归因”将此次转化归于淘宝广告，适用电商促销季投放归因。2）首次点击归因转化价
Python 实战人工智能数学基础：推荐系统应用 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.背景介绍2.核心概念与联系2.1用户画像2.2相似性计算2.2.1基于物品的相似度2.2.2基于用户的相似度2.3协同过滤算法2.3.1基于用户的协同过滤算法2.3.2基于物品的协同过滤算法2.3.3基于上下文的协同过滤算法3.核心算法原理和具体操作步骤以及数学模型公式详细讲解3.1基于用户的协同过滤算法3.2基于物品的协同过滤算法3.3混合协同过滤算法3.
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
2025年人工智能、虚拟现实与交互设计国际学术会议学术小八学术人工智能 vr 交互
重要信息官网：www.aivrid.com时间：2025年10月17-19日地点：中国-东莞部分介绍征稿主题包括但不限于：生物特征模式识别机器视觉专家系统深度学习智能搜索自动编程智能控制智能机器人系统组件虚拟现实平台用于VR/AR的AI平台数据和生成、操作、分析和验证浸入式环境和虚拟世界的生成优化和现实的渲染人工智能与用户体验个性化推荐系统情感计算与用户响应虚拟现实与沉浸式技术沉浸式环境设计交互设
时尚搭配助手，深度解析用Keras构建智能穿搭推荐系统忆愿高质量领域文章 keras 人工智能深度学习机器学习 python
文章目录引言：当算法遇见时尚第一章数据工程：时尚系统的基石1.1数据获取的多元化途径1.2数据预处理全流程1.2.1图像标准化与增强1.2.2多模态数据处理第二章模型架构设计：从分类到推荐2.1基础CNN模型（图像分类）2.2多任务学习模型（属性联合预测）第三章推荐算法核心3.1协同过滤与内容推荐的融合第四章系统优化4.1注意力机制应用第五章实战演练5.2实时推荐API实现第六章前沿探索：时尚AI
Shusen Wang推荐系统学习 --召回 ItemCF 我.佛.糍.粑学习深度学习人工智能推荐算法
学习b站up主ShusenWang的推荐系统基于物品的协同过滤（ItrmCF）中心思想就是，如果你喜欢a，b，c三件商品，d商品与abc相似，那么你也可能喜欢d商品对此就要计算物品的相似程度物品相似度物品相似度的思想是，一个物品的相同用户很多就意味着这两件物品是相似的sim(i1,i2):=∣V∣∣W1∣∣W2∣sim(i_{1},i_{2}):={\frac{\big|\mathcal{V}\b
知识图谱系列（2）：知识图谱的技术架构与组成要素程序员查理 #知识图谱知识图谱架构人工智能 AI Agent RAG
1.引言知识图谱作为一种强大的知识表示和组织方式，已经在搜索引擎、推荐系统、智能问答等多个领域展现出巨大的价值。在之前的上一篇文章中，我们介绍了知识图谱的基础概念与发展历程，了解了知识图谱的定义、核心特征、发展历史以及在AI发展中的地位与作用。要深入理解和应用知识图谱，我们需要进一步探索其内部的技术架构和组成要素。知识图谱不仅仅是一个简单的数据结构，而是一个复杂的技术体系，涉及知识的表示、存储、查
Python在人工智能领域的实际应用：示例代码解析辣条yyds python python 人工智能开发语言
摘要：本文将通过几个典型的人工智能应用场景，展示Python在图像识别、自然语言处理、推荐系统等方面的高级用法。通过示例代码，带大家深入理解Python在人工智能领域的实际应用。正文：Python作为一门流行的编程语言，凭借其简洁的语法、丰富的库和框架，成为了人工智能（AI）领域的主流开发语言。下面，我们将通过几个示例，探讨Python在人工智能方向的实际应用。示例一：图像识别-使用OpenCV进
Python 机器学习实战：Scikit-learn 算法宝典，从线性回归到支持向量机清水白石008 python Python题库 python 机器学习算法
Python机器学习实战：Scikit-learn算法宝典，从线性回归到支持向量机引言各位Python工程师，大家好！欢迎来到激动人心的机器学习世界！在这个数据驱动的时代，机器学习已经渗透到我们生活的方方面面，从智能推荐系统到自动驾驶汽车，都离不开机器学习技术的支撑。作为一名Python开发者，掌握机器学习技能，无疑将为您的职业发展注入强大的动力，让您在人工智能浪潮中占据先机。Scikit-lea
LSA主题模型：基于奇异值分解的主题模型 AI天才研究院 AI人工智能与大数据 AI大模型企业级应用开发实战计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LSA主题模型：基于奇异值分解的主题模型1.背景介绍主题模型是一种无监督的机器学习技术，用于发现大规模文本语料库中隐藏的语义结构。它能够自动识别文档集合中的主题，并根据这些主题对文档进行聚类和分类。主题模型在文本挖掘、信息检索、推荐系统等领域有着广泛的应用。LSA（LatentSemanticAnalysis）是一种经典的主题模型算法，基于奇异值分解（SVD）对词-文档矩阵进行分解，从而揭示词语和
基于python+flask框架的某图书馆书籍推荐系统的设计与实现（开题+程序+论文）计算机毕设 zhihao502 python flask 课程设计
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表开题报告内容研究背景在数字化时代，图书馆作为知识传播与积累的重要场所，面临着如何更有效地服务于广大读者的挑战。随着信息量的爆炸式增长，读者在浩瀚的书海中寻找符合个人兴趣和需求的书籍变得日益困难。传统的图书检索方式已难以满足读者快速、精准获取推荐书籍的需求。因此，开发一套智能化的图书馆
Neo4j 的向量搜索（Neo4jVector）和常见的向量数据库（比如 Milvus、Qdrant）之间的区别与联系
先说联系（共同点）点内容✅都支持向量检索都可以基于embedding（向量）做相似度搜索，比如给一段文本、找出最相似的若干条记录。✅都用于语义检索你可以把它们用在RAG（检索增强生成）、ChatwithDocs、智能问答、推荐系统等应用里。✅都支持批量插入、查询都可以批量向数据库中插入文本+向量，然后用向量做top-k检索（如search(k=8)）。✅都和LangChain集成它们都可以通过la
推荐算法（推广搜）——广告和推荐有什么不同？
导语近几年新兴起一个行业：推广搜。即推荐、广告、搜索算法的简称。各大厂都隐隐将其作为公司核心技术来发展。此文将带领大家探秘广告和推荐有什么区别以及其相似处。再此强调一下，广告算法里面的推荐广告和自然推荐结果里的推荐系统进行对比，但因为广告算法里面还有“搜索广告”，搜索广告和推荐系统差异性就太大了，这里不做讨论。一、不同点1.1本质不同推荐广告和自然推荐本质中要处理的群体和衡量的利益完全不一样。（图
知识图谱的个性化智能教学推荐系统(论文+源码) 毕设工作室_wlzytw python论文项目知识图谱人工智能
目录摘要Abstract目录第1章绪论1.1研究背景及意义1.2国内外研究现状1.2.1知识图谱1.2.2个性化推荐系统1.3本文研究内容及创新点1.4全文组织结构第2章相关理论与技术概述2.1知识图谱2.1.1知识图谱的介绍与发展2.1.2知识图谱的构建2.3协同过滤推荐算法2.2.1推荐算法概述2.2.2Pearson相关系数2.2.3Spearman相关系数2.4Bert模型和Albert模
Linux下Redis安装配置全攻略（2024最新版）「已注销」 linux redis 运维
手残党也能搞定的Redis安装指南还在为Linux安装Redis发愁？（别问我怎么知道的）今天这个保姆级教程绝对能让你爽到飞起！从零开始到完全可用只要10分钟，连小白都能轻松上手！（信我，真的）环境准备（超级重要）先确认你的Linux发行版（敲黑板！）：#查看系统信息cat/etc/os-release推荐系统：Ubuntu20.04/22.04LTSCentOS7/8RockyLinux8/9安
【推荐算法课程二】推荐算法介绍-深度学习算法盒子6910 运维视角下的广告业务算法推荐算法深度学习运维开发运维人工智能
三、深度学习在推荐系统中的应用3.1深度学习推荐模型的演化关系图3.2AutoRec——单隐层神经网络推荐模型3.2.1AutoRec模型的基本原理AutoRec模型是一个标准的自编码器，它的基本原理是利用协同过滤中的共现矩阵，完成物品向量或者用户向量的自编码。再利用自编码的结果得到用户对物品的预估评分，进而进行推荐排序。什么是自编码器？自编码器是指能够完成数据“自编码”的模型。无论是图像、音频，
DeepFM算法原理及应用场景
DeepFM（DeepFactorizationMachine）是一种结合了因子分解机（FactorizationMachines,FM）和深度神经网络（DNN）的混合模型，主要用于处理高维稀疏数据（如推荐系统中的点击率预测）。其核心思想是同时捕捉低阶（线性）和高阶（非线性）特征交互。1.算法原理模型结构如下：FM部分：负责捕捉低阶特征交互（如一阶和二阶特征组合）。一阶项：线性特征权重。二阶项：通
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他