要不断变强的LSY

【从零开始】CS224W-图机器学习-2021冬季学习笔记3.1：Node Embeddings

课程主页：CS224W | Home
课程视频链接：斯坦福CS224W《图机器学习》课程(2021) by Jure Leskovec

文章目录

1 前言（图表示学习介绍）

2 节点嵌入：编码器和解码器

节点嵌入小结

3 使用随机游走来实现节点嵌入

3.1 定义

3.2 损失函数定义

3.3 提高计算效率——负采样

3.4 优化方法

3.5 随机游走小结

3.6 node2vec概述

3.6.1 有偏随机游走

3.6.2 node2vec算法

3.7 其他随机游走算法

4 总结

5 参考资料

1 前言（图表示学习介绍）

传统的图机器学习一般包含以下四个步骤，大部分的工作都花费在了特征工程(Feature Engineering)中,而图表示学习(Graph Representation Learing)能自动得到结构化的特征，所以图表示学习取代了特征工程的位置。

图表示学习的目标：有效地自动学习到图中用于机器学习的、与下游任务无关的特征。

如上图所示，将一个节点的信息映射到一个多维向量中，这个向量储存了节点的结构信息，通常被称为特征表示(Feature representation)或嵌入(embedding)。

那么为什么要嵌入(Embedding)呢？因为：

节点之间的嵌入程度表明了它们在网络中的相似性，如：有边连接的两个点对应的embedding应该离得更近；
Embedding能自动对网络的结构信息进行编码；
Embedding可用于下游预测任务，如：节点分类、链接预测、聚类等。

举例：使用DeepWalk算法将节点嵌入到二维空间中，可以看到Output将不同类的节点很好地分开了：

2 节点嵌入：编码器和解码器

定义：图、节点集合、图的邻接矩阵（简化起见：不考虑节点的特征或其他信息）

节点嵌入的目标：将节点编码到embedding space中，并使得embedding的相似度（通常选择向量点积表示）和原始图中节点的相似度（需要被定义）尽可能接近。

在学习节点嵌入的过程中，还需要定义以下几个重要的部分：

编码器Encoder：将每个节点都映射到一个d维的向量空间中：（d通常是64-1000维）

similarity(u,v)：衡量节点相似度的函数（如：衡量原始网络中节点相似度的函数）
解码器Decoder：将embedding通过点积得到节点相似度得分

学习节点嵌入的过程，就是不断优化Encoder的参数，使得点积最大化，使得下列式子越来越接近的过程：

举例：最简单的编码方式——编码器仅进行嵌入的查找

我们将所有的节点嵌入到矩阵中，每一列代表一个节点的嵌入，我们的目标就是不断学习优化矩阵，而列向量仅仅起到定位节点v的作用（除节点v对应位置为1外，其他位置为0，类似于one-hot编码），两个矩阵相乘即代表查找节点v的embedding的过程。

缺点：当网络中存在大量节点时，矩阵的维数也会变得很大，计算花销非常巨大，不具有可扩展性；

优点：如果得到了，各节点的embedding就能很快被查找到。

类似于这种分别学习每个节点的嵌入的方法还有：DeepWalk、node2vec。

节点嵌入小结

节点嵌入是一种无监督学习/自监督学习方法，无需使用节点的标签和特征；
节点嵌入的目标是估计节点的一组坐标(即嵌入)，这组坐标在一定程度上保留了网络的结构；
节点嵌入是一个独立于下游任务的过程，只根据网络本身进行训练，适用于任何下游任务。

3 使用随机游走来实现节点嵌入

上文一直提到节点相似度函数similarity(u,v)的定义，但是从未下定义。关于节点嵌入的方法有很多，他们的核心区别就在于对节点相似度的定义不同，对相似度的定义通常有以下几个角度：

节点间是否有边相连
节点间是否有很多共同的邻居
两个节点周围的网络结构类似等

接下来，我们将要学习用随机游走的方式来定义节点相似度，并学习如何来优化这样定义后的嵌入。

3.1 定义

节点u的embedding $z_{u}$ （我们的目标），从u节点开始随机游走到达v节点的预测概率 $P(v\mid z_{u})$ ，用于衡量节点u和节点v之间的相似性。

在之后，会用到Softmax和Sigmoid两个计算预测概率的非线性函数，简单介绍如下：

Softmax函数将返回一组包含个k数据的向量，且这些数据的和归一化为1，能体现数据的概率分布。其定义为 $Softmax(z_{i})=\frac{exp\left ( z_{i} \right )}{\sum_{k}^{}exp\left ( z_{k} \right )}$ ，其中 $z_{i}$ 是第个节点的输出，为输出节点的个数。

Sigmoid函数会将实数归一化到 (0,1) 上。

随机游走的大致过程：从某一节点开始，每一步随机选一个邻居走过去，不断重复。

这样，我们就可以认为： $z_{u}^{T}z{_{v}}\approx$ 节点u和v在随机游走过程中共同出现的概率。（即节点v在以节点u为起点的随机游走中出现的概率）

随机游走的步骤：

用随机游走策略估计节点v在以节点u为起点的随机游走中出现的概率。
用embedding空间中的相似性（如向量点积）来编码节点经过随机游走得出来的相似性。

随机游走的优势：

表现力强：为节点相似度提供了一个灵活的随机定义，将本地和高阶的邻居信息都包含了进去。比如：如果从节点u随机游走到达节点v的可能性高，说明u和v是相似的，他们也许有相似的邻居，也许彼此离的很近，也许它们之间有多条路径相连等等。
高效：我们在训练随机游走模型时不需要考虑所有节点对，只需要考虑在随机游走过程中出现的节点对即可。

随机游走是一个无监督特征学习的过程，我们的目的是在d维空间中找到能够保存节点间相似度的节点嵌入，即在网络中邻近的节点在嵌入空间中依然邻近。
所以，我们定义 $N_{R}\left ( u \right )$ 表示以随机游走策略取得的与节点的邻近节点集（取代上文中节点v的位置）。注意，因为同一个节点可能被多次访问到，所以 $N_{R}\left ( u \right )$ 中可能出现多次同一节点。

3.2 损失函数定义

给定一个图 $G=\left ( V,E \right )$

我们的目标是学习映射 $f:u\rightarrow \mathbb{R}^{d}$ （将节点u嵌入到一个d维向量中），即

所以，我们的目标函数可以用log-likelihood定义为：

对这个目标函数的理解是：对节点u，我们通过不断学习优化节点嵌入 $z_{u}$ ，使得节点u随机游走得到的邻近节点集 $N_{R}\left ( u \right )$ 的概率最大化。（即u和 $N_{R}\left ( u \right )$ 同时出现的概率最大化）

上边的式子还可以等价为：（最大似然估计加一个负号，就成了需被最小化的损失函数L）

上文中提到， $z_{u}^{T}z{_{v}}\approx$ $P\left ( v\mid z_{_{u}} \right )$ ，再对 $P\left ( v\mid z_{_{u}} \right )$ 使用softmax函数，得到：

将该式子替换到损失函数L中，得到我们最终要优化的损失函数：

优化思路：优化随机游走嵌入等同于找到一个嵌入 $z_{u}$ 使得最小。

但是计算这个损失函数代价很大，因为需要内外对所有节点进行2次遍历求和，复杂度达到 $O(\left | V \right |^{2})$ ,所以需要进一步改进我们的计算过程。

3.3 提高计算效率——负采样

我们发现问题就在于用于softmax归一化的这个分母：

为了解决这个分母，我们使用负采样（Negative Sampling）的方法：简单来说就是原本我们是用所有节点求和作为归一化的负样本（即当前的分母），现在我们只抽出一部分节点子集作为负样本来近似减少计算。

我们从网络的随机分布 $P_{V}$ 中取k个负样本进行归一化，新式子中使用sigmoid函数来辨别目标节点和从随机分布 $P_{V}$ 中采样得到的节点 $n_{i}$

负采样在word2vec算法中的使用具体参考：https://arxiv.org/pdf/1402.3722.pdf

注：k个负样本仅分布随机，抽取并不随机，取每个样本的概率与其度数成正比，度数更多的点更容易选为负样本。

k值的选取有以下注意事项：

优：更高的k会使估计结果更鲁棒
缺：更高的k会使负样本上的偏差bias过高
实践中k通常取：5-20

也就是说，通过负采样，我们不再需要遍历整个网络中的节点进行计算，而只需要5-20个节点，大大加快了计算的效率。

3.4 优化方法

采用随机梯度下降（SGD）算法来优化上文得到的损失函数。

先介绍一下梯度下降算法的简要步骤：

而在随机梯度下降算法中，我们不需要评估所有的样本，我们只需要评估一小部分样本或单个样本，以下是随机梯度下降算法的简要步骤：

3.5 随机游走小结

对图中每一个节点都执行一次short fixed-length随机游走；
对于每一个节点u，都要得到以它为起点随机游走得到的节点集 $N_{R}\left ( u \right )$ ；
用随机梯度下降法优化embedding（使用负采样来简化计算）

到现在，我们介绍完了如何优化一个通过策略R随机游走得到的嵌入，那么这个随机游走的策略到底是什么呢？换句话说，我们应该通过什么具体的策略来随机游走呢？

最简单的想法是：对每一个节点进行固定长度的，无偏的随机游走，即DeepWalk算法。但这种策略有很多局限性，那么我们怎么进行扩展呢?

3.6 node2vec概述

目标：相似的网络邻居经过节点嵌入之后他们在特征空间的坐标也是邻近的。（我们依然将这个目标建模为最大似然优化问题，且与后续的预测任务相互独立）
与DeepWalk的区别: 节点u有更加Flexible的邻近节点 $N_{R}\left ( u \right )$ ，这使得我们的节点嵌入更加丰富
创新点：开发2阶有偏随机游走策略来生成节点的邻近节点 $N_{R}\left ( u \right )$

一阶随机游走的每一步都仅考虑节点当前位置，二阶随机游走还考虑节点上一步的位置。

具体参考：node2vec算法

3.6.1 有偏随机游走

思路：使用灵活、有偏、能够平衡网络中局部和全局概念的随机游走方式。

比如两个经典的搜索策略：广度优先搜索(BFS)和深度优先搜索(DFS)

两种遍历方式各有特点：

BFS：关注节点邻居的微观结构

DFS：关注节点邻居的宏观结构

在node2vec中，我们将采用有偏定长的随机游走策略R得到节点u的邻域 $N_{R}\left ( u \right )$

我们先定义两个重要的参数：

回退参数（Return parameter）：返回上一个节点的概率
内外参数（In-out parameter）：向外走（DFS）vs. 向内走（BFS），选择深度优先和广度优先的比率

接下来，使用有偏的2阶随机游走研究网络邻居，如下图：

随机游走只是从 $S_{1}$ 到达，在这个位置上，它的下一步有三种选择：

关键思想：记住游走过程中的上一个节点。

如果在此过程中引入参数和，将会得到：

注：Prob.目前是非归一化的，将其归一化后将得到W下一步走向四个节点的概率分布。

关于BFS和DFS的选择上，由两个参数和决定：

当p值很小时，随机游走的下一步返回到 $S_{1}$ 的可能性更高，倾向于在该节点附近游走，即倾向于BFS；
当q值很小时，随机游走的下一步走向 $S_{3}$ 和 $S_{4}$ 的可能性更高，倾向于往更远的节点游走，即倾向于DFS。

3.6.2 node2vec算法

计算随机游走的两个概率参数和；
从每一个节点开始按照固定步长模拟进行有偏随机游走次；
用随机梯度下降法优化ndoe2vec的目标函数。

算法优点：

线性时间复杂度
所有的3个步骤都可以独立并行计算

算法缺点：

需要分别地学习每个节点的嵌入，当网络较大时，成本将增加

3.7 其他随机游走算法

4 总结

核心思想：在进行节点嵌入时，要尽量使嵌入中的向量距离能够反映原始网络中的节点相似度。

衡量节点相似度的指标：

Naive：两个节点彼此有边相连
两个节点有共同的邻居
随机游走过程中共同出现的概率

我们需要根据具体情况来选择算法。例如：Node2vec在节点分类任务重表现较好，而其他方法在链路预测任务重表现较好。

下面这篇论文调查了许多图嵌入方法，并将这些方法运用到各种不同的任务中进行了对比，对图嵌入方法进行了全面和结构化的分析：Graph Embedding Techniques, Applications, and Performance: A Survey

基于随机游走的方法通常来说会更有效，但总的来说，必须选择与应用程序相匹配的节点相似度定义。

5 参考资料

03-nodeemb.pdf (stanford.edu)
图神经网络（CS224w）学习笔记3 Node Embeddings_白衣少年不留白的博客-CSDN博客

机器学习Pandas_learn3 XW-ABAP 机器学习 pandas
frompandasimportDataFrameimportnumpypaints={"车名":["奥迪Q5L","哈弗H6","奔驰GLC"],"最低报价":[numpy.nan,9.80,numpy.nan],"最高报价":[49.80,23.10,58.78]}goods_in=DataFrame(paints,index=[1,2,3])print(goods_in)goods_in_n
【CSDN】java使用POI&EasyExcel操作文件学习笔记骑鱼过海的猫123 java 学习笔记
文章目录1.Apachepoi参考CSDNurl:[CSDNPOI文档](https://blog.csdn.net/fgghhfg574/article/details/103343030)参考B站视频:[B站POI视频](https://www.bilibili.com/video/BV1cG411M7ut?p=6&vd_source=31d376c1e57cf8a26a31cd3b47080
【技术解密】本地部署 DeepSeek-V3：完整指南海棠AI实验室 “智元启示录“-AI发展的深度思考与未来展望人工智能深度学习 DeepSeek
目录引言运行环境需求下载与安装推理部署总结参考资源引言随着人工智能的快速发展，开源大模型正逐步改变着技术生态。DeepSeek-V3作为最新的开源大模型之一，不仅提供了强大的推理能力，同时也支持本地部署，使开发者可以灵活地进行自定义优化。本文将详细介绍如何在本地部署DeepSeek-V3，涵盖系统要求、安装步骤、模型转换及不同推理框架的应用。1.运行环境需求1.1硬件要求✅NVIDIAGPU（支持
人工智能伦理与可持续发展 CarlowZJ 人工智能
前言人工智能（AI）技术正在深刻地改变我们的生活和工作方式。从自动驾驶汽车到智能医疗系统，从个性化推荐到自动化决策，AI的应用无处不在。然而，随着技术的快速发展，其伦理和社会影响也引发了广泛的关注。人工智能伦理不仅涉及技术本身的公平性、透明性和安全性，还涉及到更广泛的社会、经济和环境影响。本文将探讨人工智能伦理的核心问题，并从可持续发展的角度提出应对策略。一、人工智能伦理的核心问题1.1数据隐私与
小米音频理解技术重大突破：7B模型借助DeepSeek-R1算法引领行业新篇章耶耶Norsea 网络杂烩人工智能深度学习
摘要小米公司通过采用DeepSeek-R1算法的迁移技术，在音频理解领域实现了重大突破。其7B模型在MMAU音频评测基准中表现出色，成功登顶排行榜。MMAU评测基准包含10000条音频样本，涵盖语音、环境声和音乐等多种类型，难度极高。即便如此，该模型的表现已超越人类专家的82.2%识别准确率，展现出卓越的音频理解能力。关键词小米音频突破,DeepSeek-R1算法,7B模型进展,MMAU评测基准,
异步加载回调问题，多个资源异步加载，让其全部加载完回调 QO_GQ lua 开发语言
刚刚遇到一个bug，场景大图需要提前加载，所有场景组件就需要等图加载好后再处理，但是由于场景背景图是异步加载的，并且是同时for循环进行异步加载的，所以无法确认哪一个图是最后加载出来的，抱着试一试的心态，这样写了一下，发现没用：---记载所有背景图functionLoadBgRawImage(mapID,func)fori=1,lendo...localpath="xxx\xxx\xxx.jpg"
TRS收益互换系统开发为何敢称“无限拓展”？模块化架构+弹性集群揭秘！ Ashlee_code 架构 python java c++c语言
《【券商震惊】传统询价3小时→TRS黑科技10分钟！盈立证券交易量暴增150%背后秘密》开篇：询价耗时3小时？券商正在被低效“慢性杀死”电话询价、邮件比价、Excel汇总——传统场外交易中，一次询价流程动辄数小时，客户流失率高达40%！TRS收益互换平台，依托DeepSeek动态定价算法与多发行方实时比价引擎，将询价响应时间从3小时压缩至10分钟，助力盈立证券交易量飙升150%，彻底改写行业游戏规
24小时响应+零宕机！TRS收益互换系统售后如何成为券商“救命稻草”？ Ashlee_code 架构 java python c++c语言
《【券商震惊】传统询价3小时→TRS黑科技10分钟！盈立证券交易量暴增150%背后秘密》开篇：询价耗时3小时？券商正在被低效“慢性杀死”电话询价、邮件比价、Excel汇总——传统场外交易中，一次询价流程动辄数小时，客户流失率高达40%！令克软件TRS收益互换平台，依托DeepSeek动态定价算法与多发行方实时比价引擎，将询价响应时间从3小时压缩至10分钟，助力盈立证券交易量飙升150%，彻底改写行
音频 Alsa、Framework及Android ‘禹’你一起后端
目录1Alsa、Framework及Android1.1ALSA架构简介图11.2ALSA架构简介图21.3ALSA架构简介图31.4ALSA架构简介图41.5ALSA架构简介图51.6ALSA架构简介图61.8音频代码1Alsa、Framework及Android目前，linux系统常用的音频驱动有两种形式:alsa和oss。Alsa：现在是linux下音频驱动的主要形式，与简单的oss兼容。o
嵌入式开发之STM32学习笔记day06 小程同学>o< 嵌入式学习之STM32 stm32 学习笔记
基于STM32F103C8T6的开发实践——从入门到精通011.引言STM32系列微控制器是STMicroelectronics推出的一款高性能、低功耗的32位微控制器，广泛应用于嵌入式系统中。STM32F103C8T6是其中非常受欢迎的一款，凭借其强大的性能、丰富的外设接口和低廉的价格，成为了开发者的首选之一。本文将通过实例，详细介绍如何基于STM32F103C8T6进行开发，并带领读者完成从简
机器学习中输入输出Tokens的概念详解爱吃土豆的程序员机器学习基础机器学习人工智能 Tokens
随着深度学习技术的快速发展，大语言模型（LargeLanguageModels,LLMs）已经成为自然语言处理（NLP）领域的一个热点研究方向。这些模型不仅能够生成高质量的文本，还能在多种任务中展现出卓越的表现，比如机器翻译、问答系统、文本摘要等。在大语言模型的工作流程中，Tokens的概念扮演着至关重要的角色。本文将详细介绍大语言模型如何使用Tokens，以及如何计算Tokens的数量。什么是T
【深度学习基础】第二十四课：softmax函数的导数 x-jeff 深度学习基础深度学习人工智能
【深度学习基础】系列博客为学习Coursera上吴恩达深度学习课程所做的课程笔记。1.softmax函数softmax函数详解。2.softmax函数的导数假设神经网络输出层的激活函数为softmax函数，用以解决多分类问题。在反向传播时，就需要计算softmax函数的导数，这也就是本文着重介绍的内容。我们只需关注输出层即可，其余层和之前介绍的二分类模型一样，不再赘述。我们先考虑只有一个样本的情况
学习Web3.0需要具备哪些基础知识？ alankuo 人工智能人工智能
学习Web3.0需要具备以下基础知识：一、计算机科学基础1.编程知识-了解至少一种编程语言，如Python、JavaScript等。这将有助于理解Web3.0应用程序的开发和智能合约的编写。-熟悉编程概念，如变量、数据类型、控制结构、函数等。2.数据结构和算法-掌握常见的数据结构，如数组、链表、栈、队列、树、图等，以及它们的操作和应用。-了解基本的算法，如排序、搜索、递归等，以及它们的时间和空间复
音视频缓存数学模型锋风Fengfeng 安卓Android应用开发相关音视频缓存
2024年8月的笔记音视频缓存数学模型-Wesley’sBlog播放器作为消费者，缓存作为生产者。进入缓冲一次设消费者速率为v1，生产者为v2，视频长度为l，x为生产者至少距离消费者多远才能保证在播完视频前两者重合。实际上就是一个追及问题。v1t=v2t+x，即l=v2*l/v1+x，因为播放器速度是1，继续简化得x=l(1-v2)如果v2大于1，即满足消费者需求时，可以流畅播放。设l是一部45分
LLM-PowerHouse: 一站式大型语言模型定制训练与推理指南 Nifc666 语言模型人工智能自然语言处理 whisper langchain gpt 开源软件
LLM-PowerHouse:解锁大型语言模型的潜力在人工智能和自然语言处理领域,大型语言模型(LargeLanguageModels,LLMs)正在掀起一场革命。随着GPT、BERT等模型的出现,LLMs展现出了惊人的能力,可以执行各种复杂的语言任务。然而,如何有效地训练和使用这些强大的模型仍然是一个挑战。针对这一需求,GitHub上的LLM-PowerHouse项目应运而生,为开发者、研究人员
深入理解C++编程：从内存管理到多态与算法实现嵌入式Jerry C++c++算法开发语言
C++是一门功能强大的编程语言，广泛应用于系统编程、游戏开发和高性能计算等领域。本文将通过一系列经典问题，深入探讨C++的核心知识点，包括内存管理、多态（结合函数重载与覆盖）、多线程、TCP/IP模型、软链接与硬链接的区别，以及常见算法实现。每个知识点都配有详细的代码示例和解释，帮助你更好地理解和掌握。1.内存管理：内存泄露与检测什么是内存泄露？内存泄露是指程序在动态分配内存后，未能正确释放已不再
【sklearn 01】人工智能概述 @金色海岸人工智能 sklearn python
一、人工智能，机器学习，深度学习人工智能指由人类制造出的具有智能的机器。这是一个非常大的范围，长远目标是让机器实现人工智能，但目前我们仍处在非常初始的阶段，甚至不能称为智能机器学习是指通过数据训练出能完成一定功能的模型，是实现人工智能的手段之一，也是目前最主流的人工智能实现方法深度学习则是机器学习的分支，超过8层的神经网络模型就叫深度学习，深度即层数。深度学习目前在语音、图像等领域取得很好的效果
C/C++每日一练：实现选择排序風清掦 C/C++~每日一练 c语言 c++算法
选择排序选择排序是一种简单直观的排序算法，时间复杂度为，其中n是数组长度，不适合大数据集的排序，适合于元素较少且对性能要求不高的场景。选择排序的基本思想是：每次从未排序部分选择最小的元素，将其放到已排序部分的末尾。这样经过多轮操作后，整个数组会被逐步排好序。具体步骤如下：初始化：将第一个元素作为已排序区，剩余部分作为未排序区。遍历未排序区：从未排序区间找出最小的元素，记下其位置。交换位置：将找到的
C/C++每日一练：实现冒泡排序風清掦 C/C++~每日一练算法 c语言 c++排序算法
题目要求编写一个程序，实现冒泡排序算法。给定一个由n个整数组成的数组，要求通过冒泡排序对数组从小到大进行排序。输入：一个整数数组，长度为n，数组中的元素可能是正数或负数。输出：按照升序排序后的数组。做题思路冒泡排序是一种简单直观的排序算法。其基本思想是通过多次遍历数组，逐步将未排序部分中的最大或最小元素“冒泡”到数组的一端，直到整个数组有序。冒泡排序的步骤如下：从数组的第一个元素开始，依次比较相邻
【人工智能】【Python】在Scikit-Learn中使用决策树算法（ID3和CART） SmallBambooCode 机器学习人工智能 python 算法 scikit-learn 决策树机器学习 ai
importnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.treeimportDecisionTreeClassifier,plot_tree#加载数据集iris=load_iri
Day65 | 灵神 | 二分查找：红蓝染色法为了前进而后退，为了走直路而走弯路刷题记录数据结构算法学习笔记二分查找 c++
Day65|灵神|二分查找：红蓝染色法灵神讲解的非常好建议大家去听听灵神的，二分查找就是常忘常学常新，我之前学过很多次二分，但这次还是有新的理解，我把可能比较难理解的点写到了下面，大家没看懂视频的地方可以看看我写的当然主要的其实是check函数，在本题中就是大于等于target这个条件，估计灵神下个视频会讲吧二分查找红蓝染色法【基础算法精讲04】_哔哩哔哩_bilibili文章目录Day65|灵神
算法每日一练 (13) 张胤尘算法每日一练算法数据结构
欢迎来到张胤尘的技术站技术如江河，汇聚众志成。代码似星辰，照亮行征程。开源精神长，传承永不忘。携手共前行，未来更辉煌文章目录算法每日一练(13)全排列II题目描述解题思路解题代码`c/c++``golang``lua`官方站点：力扣Leetcode算法每日一练(13)全排列II题目地址：全排列II题目描述给定一个可包含重复数字的序列nums，按任意顺序返回所有不重复的全排列。示例1：输入：nums
差异中寻找共识：浅析中美欧AIGC服务商的标识义务人工智能
2025年1月7日，西藏日喀则地震中一张被广泛传播的图片“被压在废墟下的小男孩”被证明是AI合成图片，[1]这随即引发了社会对于人工智能生成物（ArtificialIntelligenceGeneratedContent，以下简称“AIGC”）的广泛讨论。随着AI大模型生成逼真图像、音频与视频的能力日益增强，人类作品与AIGC之间的界限愈发模糊。如不加以管控，则会产生“真相侵蚀”（TruthDec
迷雾渐开：美国AIGC可版权性剖析及案例梳理人工智能
当地时间2025年1月29日，美国版权局（U.S.CopyrightOffice,USCO）发布了版权和人工智能相关法律和政策报告的第二部分——《版权和人工智能：可版权性》（以下简称“《USCO可版权性报告》”）[1]，旨在探讨人工智能生成内容（AIGC）的可版权性问题。该报告明确指出，美国版权局认为现有的版权法足以解决AIGC问题，因此无需制定新的立法。具体而言，该报告在此前美国版权局于2023
智能体平台架构深度剖析：从底层到应用的全链路解析人工智能
在当今人工智能飞速发展的时代，智能体平台作为承载和驱动智能应用的关键基础设施，其架构设计至关重要。一个优秀的智能体平台架构，能够高效整合各类资源，实现智能体的灵活构建与稳定运行，为多样化的应用场景提供强大支持。稳固根基：基础资源层与并行平台层基础资源层是整个智能体平台的基石。其中，GPU和服务器构成了强大的计算硬件支撑，确保平台能够应对复杂的计算任务。而数据与OSS（对象存储服务）则如同智能体的“
美国首例AI训练数据版权案：从汤森路透诉罗斯案看AI训练数据的“合理使用” 人工智能
随着人工智能（AI）技术的快速发展和广泛应用，复杂的版权问题也随之而来。2025年2月11日，美国特拉华州联邦地区法院对汤森路透（ThomsonReuters）诉罗斯（Ross）案作出部分简易判决，认定被告罗斯公司未经授权使用受版权保护的作品训练AI法律检索工具的行为构成版权侵权，且不属于合理使用。[1]这是美国首个就AI训练数据作出实质性判决的案件。本文将重点分析其合理使用论述中对于“转换性目的
【常见的排序算法有哪些】 F_windy 排序算法算法
一、冒泡排序（BubbleSort）设计思想：像气泡上浮，两两比较相邻元素，顺序错误就交换，直到整个数组有序。Java代码：publicstaticvoidbubbleSort(int[]arr){for(inti=0;iarr[j+1]){inttemp=arr[j];arr[j]=arr[j+1];arr[j+1]=temp;}}}}复杂度：•时间：平均/最坏O(n²)，最好O(n)（已有序时
《java面向对象（2）》＜不含基本语法＞ java小白板 java 开发语言
提示：本笔记基于黑马程序员java教程整理，仅供参考文章目录前言1.继承2.多态2.1对象多态2.2行为对象2.3多态的问题前言本文纯笔记，主要记录了java面向对象的高级方法继承与多态1.继承在创建多个对象类时，它们可能会有很多相似的属性，如姓名，身高，体重等，就会造成代码的重复，所以我们可以采用继承的思想，将它们相同的属性放在同一个父类中，而其它作为子类的都可以继承父类的属性，子类本身就只用定
【sklearn 03】逻辑回归、决策树、支持向量机 @金色海岸 sklearn 逻辑回归决策树
逻辑回归、决策树、支持向量机-逻辑回归logisticsregression（逻辑回归）算法是经典的分类算法，基本思想是构造一个概率的拟合函数。决策树决策树的基本思想是根据样例去推断其背后的树形知识表征支持向量机支持向量机SVM(supportvectormachine)的基本思想是寻找最大的间隔的分割超平面。离分割超平面最近的这些样本点称为支持向量机
数据结构笔记月亮是我掰弯的！！！笔记数据结构笔记算法 c++c语言
17、循环链表（解决约瑟夫问题）1、定义链表typedefstruct_LinkNode{intdata;struct_LinkNode*next;}LinkNode,LinkList;2、初始化链表boolListInsert_back(linkList*&L,LinkNode*node){LinkNode*last=NULL;//防御性编程if(!L||!node)returnfalse;//
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st

【从零开始】CS224W-图机器学习-2021冬季学习笔记3.1：Node Embeddings

文章目录

1 前言（图表示学习介绍）

2 节点嵌入：编码器和解码器

节点嵌入小结

3 使用随机游走来实现节点嵌入

3.1 定义

3.2 损失函数定义

3.3 提高计算效率——负采样

3.4 优化方法

3.5 随机游走小结

3.6 node2vec概述

3.6.1 有偏随机游走

3.6.2 node2vec算法

3.7 其他随机游走算法

4 总结

5 参考资料

你可能感兴趣的:(CS224W,图机器学习,笔记,机器学习,人工智能,算法)