饮冰l

论文笔记：ICLR 2019 Deep Graph Infomax

前言

论文链接：https://arxiv.org/abs/1809.10341
github：https://github.com/PetarV-/DGI

之前的大部分图节点表示学习方法属于半监督学习例如经典的GCN，本文的主要创新是提出了一种无监督一般化的图节点表示学习方法。DGI依赖于最大限度地扩大图增强表示和目前提取到的图信息之间的互信息——两者都是使用已建立的图卷积网络体系结构导出的。

对于图增强表示，是根据感兴趣节点所生成的子图，因此可以用于下游节点的表示学习任务。相较于之前对于 GCN 的无监督学习方法，DGI 不依赖于随机游走，并且可以适用于直推式学习和归纳式学习。

1. Introduction

目前的基于图的无监督学习主要分为两类：基于随机游走的一系列方法、基于自动编码器的一些列方法

基于自动编码器的方法，经典的工作是 VGAE，通过自动编码器结构期望重构原始的邻接矩阵。以此来实现还原图结构的相似性来模拟映射到特征空间的相似性，实现无监督的节点表示学习。

基于随机游走的方法虽然有力但是存在局限性，最显著的是，随机游走目标会以牺牲结构信息为代价过分强调邻近信息，并且性能高度依赖于超参数的选择。此外，随着基于图卷积的更强编码器模型的引入，不清楚随机游走目标是否真的提供了任何有用的信号，因为这些编码器已经强制产生了一种感应偏差，即相邻节点具有类似的表示。

在概率论和信息论中，两个随机变量的互信息（Mutual Information，简称MI）或转移信息（transinformation）是变量间相互依赖性的量度。本文中提出的 DGI 方法就是基于互信息这一概念。近年来基于互信息的代表性工作是 MINE，其中提出了一种 Deep InfoMax (DMI) 方法来学习高维数据的表示。具体来说 DMI 训练一个编码模型来最大化高阶全局表示和输入的局部部分的互信息（如果从 cv 的角度理解就是一张图片中的 patches）。这鼓励编码器携带出现在所有位置(因此是全局相关的)的信息类型，例如类标签的情况。

2. Related Work

2.1 Contrastive methods

对于无监督学习一类重要的方法就是对比学习，通过训练编码器使它在特征表示中更具判别性来捕获感兴趣的和不感兴趣的统计依赖性。具体来说，一个对比学习方法可能使用一个评分函数来使编码器可以判别真实数据和假数据。DGI在这方面也具有对比性，因为 DGI 目标是基于对局部-全局的配对和负抽样配对的分类。

2.2 Sampling strategies

来实现对比学习的一个关键步骤在于如何采样正样本和负样本，关于无监督图表示学习的先前工作依赖于局部对比损失(强制近端节点具有类似的嵌入)。从语言建模的角度来看，正样本通常对应于在图中短时间的随机漫步中一起出现的节点对，有效地将节点视为单词，将随机漫步视为句子。最近有的方法提出使用节点锚定采样作为替代。这些方法的负采样主要是基于随机对的抽样。

2.3 Predictive coding

CPC 是另一种基于互信息最大化的学习深度特征表示的框架，CPC 也是一种对比学习方法。然而，与DGI 不同的是，CPC是预测性的：对比目标有效地训练了输入的结构指定部分(例如，相邻节点对之间或节点与其邻居之间)之间的预测器。DGI 不同之处在于同时对比一个图的全局/局部部分，其中全局变量是从所有的局部变量计算出来的。

3. DGI

3.1 Graph-based Unsupervised Learning

首先给出如下变量设置 $\mathbf{X}=\{x_1,x_2,\dots,x_N\}$ ，其中 $N$ 代表图中节点的数量，并且满足 $x_i \in\mathbb{R}^F$ 代表节点 $i$ 的特征表示。 $\mathbf{A} \in \mathbb{R}^{N \times N}$ ，在本文中默认所有处理的图是无权图，同时邻接矩阵存储的值维 0 或 1。

模型的目的是学习一个编码器 $\mathcal{E}:\mathbb{R}^{N \times N} \times \mathbb{R}^{N \times F} \rightarrow\mathbb{R}^{N \times F^{'}}$ 。可以形式化的表示为 $\mathcal{E}(\mathbf{X,A})=\mathbf{H}=\{h_1,h_2,\dots,h_N\}$ ，其中 $\mathbf{H}$ 代表高阶表示，并且每个节点 $i$ 满足 $h_i \in \mathbb{R}^{F^{'}}$ 。所得到的节点特征的高阶表示可以用于各种下游任务，例如节点分类任务。

对于图卷积这一操作，是不断通过聚合目标节点周边的邻居来完成特征学习，因此我们将 $h_i$ 看成是图中目标节点周边的一个 patch

3.2 Local-Global Mutual Infomation Maxmization

DGI 的核心思想在于通过最大化局部互信息来训练编码器，DGI 寻求获取节点(即局部)表示，该表示可以捕获由总结向量 $s$ 表示的整个图的全局信息内容。

为了得到图级别的总结向量 $s$ ，作者提出了一种 Readout Function， $\mathcal{R}:\mathbb{R}^{N \times F} \rightarrow \mathbb{R}^F$ 。进而使用它将获得的 patch 表示总结为图级别的总结向量。上述过程可以总结为 $s=\mathcal{R(\mathcal{E}\mathbf{(X,A)})}$

DGI 使用了一个鉴别器作为最大化本地互信息的代理， $\mathcal{D}:\mathbb{R}^F \times\mathbb{R}^F \rightarrow \mathbb{R}$ ，举例来说 $\mathcal{D}(h_i,s)$ 表示分配给这个 patch-总结对的概率分数(对于包含在总结中的 patch 应该更高)。

因此对应的负样例由 $\mathbf{(X,A)}$ 的总结向量 $s$ 和代替图 $(\widetilde{\mathbf{X}},\widetilde{\mathbf{A}})$ 的 patch表示 $\widetilde{h}$ 组成。在多图的数据集中，这样的图 $(\widetilde{\mathbf{X}},\widetilde{\mathbf{A}})$ 可以通过训练集的其他元素获得。然而，对于单个图，一个显式(随机)破坏函数 $\mathcal{C}:\mathbb{R}^{N \times F} \times \mathbb{R}^{N \times N} \rightarrow \mathbb{R}^{M \times F} \times \mathbb{R}^{M \times M}$ 来生成这样的图 $(\widetilde{\mathbf{X}},\widetilde{\mathbf{A}})$ 。上述过程可以表述为 $(\mathbf{\widetilde{X},\widetilde{A}})=\mathcal{C}(\mathbf{X,A})$ 。

DGI 使用带有标准二值交叉熵(BCE)损失的噪声对比型目标函数(来自联合样本(正样本)和边缘样本(负样本)的乘积)。

$\mathcal{L}=\frac{1}{N+M}(\sum_{i=1}^N\mathbb{E}_{\mathbf{(X,A)}}[log\mathcal{D}(h_i,s)]+\sum_{j=1}^M\mathbb{E}_{\mathbf{(\widetilde{X},\widetilde{A})}}[log(1-\mathcal{D}(\widetilde{h_j},s))]) \tag{1}$

通过上式可以有效地最大化 $h_i$ 和 $s$ 的互信息

3.3 Overview Of DGI

假设单图设置(即( $\mathbf{(X,A)}$ 作为输入)，DGI 的步骤:

通过使用腐化函数得到负采样实例： $(\mathbf{\widetilde{X},\widetilde{A}})\sim\mathcal{C}(\mathbf{X,A})$
通过编码器得到 patch 表示： $\mathbf{H}=\mathcal{E}(\mathbf{X,A})=\{h_1,h_2,\dots,h_N\}$
通过编码器得到负样本的 path 表示： $\mathbf{\widetilde{H}}=\mathcal{E}(\mathbf{\widetilde{X},\widetilde{A}})=\{\widetilde{h_1},\widetilde{h_2},\dots,\widetilde{h_N}\}$
通过 Readout Function 传递它的 patch 表示来得到图级别的总结向量 $s=\mathcal{R}(\mathbf{H})$
通过梯度下降法最小化目标函数 $\mathcal{L}$ ，更新 $\mathcal{E,R,D}$ 中的参数进行模型的训练

具体来说，对于直推式学习作者采用
$\mathcal{E}(\mathbf{X,A})=\sigma(\mathbf{\hat{D}}^{-\frac{1}{2}}\mathbf{\hat{A}}\mathbf{\hat{D}}^{-\frac{1}{2}}\mathbf{X\Theta}) \tag{2}$
其中 $\mathbf{\hat{A}}=\mathbf{A+I}_N$ 代表加上自环的邻接矩阵， $\mathbf{\hat{D}}$ 代表相应的度矩阵，满足 $\hat{D}_{ii}=\sum_j\hat{A}_{ij}$ ，对于非线性激活函数，作者选择 PReLU。 $\mathbf{\Theta}\in\mathbb{R}^{F \times F^{'}}$ 代表可学习的权重矩阵，也就是线性变换的参数。

对于腐蚀函数 $\mathcal{C}$ ，直接采用 $\mathbf{\widetilde{A}}=\mathbf{A}$ ，但是 $\mathbf{\widetilde{X}}$ 是由原本的特征矩阵 $\mathbf{X}$ 经过随机变换得到的。也就是说，损坏的图由与原始图完全相同的节点组成，但它们位于图中的不同位置，因此将得到不同的 patch 表示。

对于在大图中的归纳式学习，作者采用 GraphSAGE-GCN
$\mathbf{MP(X,A)}=\mathbf{\hat{D}}^{-1}\mathbf{\hat{A}\mathbf{X}\mathbf{\Theta}}\tag{3}$

$\mathbf{\hat{D}}^{-1}$ 实际上执行的是标准化的和(因此是均值)。尽管式（4）明确指定了邻接矩阵和度矩阵，但它们并不需要：因为 Const-GAT 模型中使用的持续关注机制可以观察到相同的归纳行为。对于Reddit，DGI 的编码器是一个带有跳过连接的三层均值池模型
$\widetilde{\mathbf{MP}}\mathbf{(X,A)}=\sigma(\mathbf{X\Theta^{'}||MP(X,A)})\\\mathcal{E}(\mathbf{X,A})=\widetilde{\mathbf{MP_3}}(\widetilde{\mathbf{MP_2}}(\widetilde{\mathbf{MP_1}}(\mathbf{X,A}),\mathbf{A}),\mathbf{A})\tag{4}$

其中 $∣ ∣$ 代表特征级联。

由于数据集的规模很大，它将不能完全适合GPU内存。因此，DGI 的子抽样方法，首先选择小批量的节点，然后通过对具有替换的节点邻域进行抽样，得到以每个节点为中心的子图。具体来说，DGI 在第一层、第二层和第三层分别采样10、10和25个邻居，这样每个次采样的 patch 有1 + 10 + 100 + 2500 = 2611个节点。只进行了推导中心节点 $i$ 的 patch 表示 $h_i$ 所必需的计算。这些表示然后被用来为minibatch(图2)导出摘要向量 $s$ 。在整个训练过程中使用了256个节点的 minibatch 。为了在此设置中定义破坏函数，DGI 使用与在直推式学习中类似的方法，将每个次采样的补丁作为一个单独的要破坏的图(即在次采样的补丁中按行随机打乱特征矩阵)。这很可能导致中心节点的特征被替换为抽样邻居的特征，进一步鼓励负样本的多样性。然后将在中心节点获得的 patch 表示提交给标识器。

对于在 多图上的归纳式学习，例如 PPI 数据集，编码器是一个带有密集跳过连接的三层均值池模型

$\mathbf{H}_1=\sigma(\mathbf{MP_1(X,A)})\\\mathbf{H}_2=\sigma(\mathbf{MP_2(H_1+XW_{skip},A)})\\\mathcal{E}(\mathbf{X,A})=\sigma(\mathbf{MP}_3(\mathbf{H_2+H_1+XW_{skip}},\mathbf{A}))\tag{5}$

在这个多图设置中，DGI 选择使用随机抽样的训练图作为负样例(即，DGI 的破坏函数只是从训练集中抽样一个不同的图)。作者发现该方法是最稳定的，因为该数据集中超过40%的节点具有全零特征。为了进一步扩大负面示例池，作者还将dropout 应用于采样图的输入特征。作者发现，在将学习到的嵌入信息提供给逻辑回归模型之前，将其标准化是有益的。

Readout，判别器的细节

对于 Readout Function，作者使用所有节点特征的简单平均值:
$\mathcal{R}(\mathbf{H})=\sigma(\frac{1}{N}\sum_{i=1}^Nh_i)\tag{6}$

其中 $\sigma$ 是非线性激活函数。作者通过应用一个简单的双线性评分函数对图级别的摘要- patch表示对进行评分:
$\mathcal{D}(h_i,s)=\sigma(h_i^T\mathbf{W}s) \tag{7}$

其中 $\mathbf{W}$ 是可学习的评分权重参数， $\sigma$ 用于将分数转换为 $h_i,s)$ 为正样例的概率。

4. Experiments

你可能感兴趣的:(图,弱监督,深度学习,机器学习,数据挖掘,神经网络)

神经网络初始化 (init) 介绍迷路爸爸180 神经网络人工智能深度学习初始化 init
文章目录引言1.初始化的重要性1.1打破对称性1.2控制方差1.3加速收敛与提高泛化能力2.常见的初始化方法及其应用场景2.1Xavier/Glorot初始化2.2He初始化2.3正交初始化2.4其他初始化方法3.如何设置初始化4.基于BERT的文本分类如何进行初始化4.1项目背景4.2模型构建4.3模型训练与评估4.4结果分析结论参考资料引言在深度学习的世界中，构建一个高效且性能优异的神经网络模
QML音视频实时通信 QT性能优化QT原理源码QT界面美化 qt qt6.3 qt5 QT教程 c++音视频
QML音视频实时通信使用AI技术辅助生成QT界面美化视频课程QT性能优化视频课程QT原理与源码分析视频课程QTQMLC++扩展开发视频课程免费QT视频课程您可以看免费1000+个QT技术视频免费QT视频课程QT统计图和QT数据可视化视频免费看免费QT视频课程QT性能优化视频免费看免费QT视频课程QT界面美化视频免费看1QML与音视频实时通信概述1.1QML音视频技术发展背景1.1.1QML音视频技
QML Web云应用开发 QT性能优化QT原理源码QT界面美化 qt qt6.3 qt5 QT教程 c++
QMLWeb云应用开发使用AI技术辅助生成QT界面美化视频课程QT性能优化视频课程QT原理与源码分析视频课程QTQMLC++扩展开发视频课程免费QT视频课程您可以看免费1000+个QT技术视频免费QT视频课程QT统计图和QT数据可视化视频免费看免费QT视频课程QT性能优化视频免费看免费QT视频课程QT界面美化视频免费看1QML与Web技术概述1.1QML与Web技术简介1.1.1QML与Web技术
QT硬件接口设计 QT性能优化QT原理源码QT界面美化 qt qt6.3 qt5 QT教程 c++
QT硬件接口设计使用AI技术辅助生成QT界面美化视频课程QT性能优化视频课程QT原理与源码分析视频课程QTQMLC++扩展开发视频课程免费QT视频课程您可以看免费1000+个QT技术视频免费QT视频课程QT统计图和QT数据可视化视频免费看免费QT视频课程QT性能优化视频免费看免费QT视频课程QT界面美化视频免费看1QT硬件接口设计概述1.1QT硬件接口设计简介1.1.1QT硬件接口设计简介QT硬件
【QT教程】QML音视频效果实现 QT音视频 QT性能优化QT原理源码QT界面美化 qt qt6.3 qt5 c++QT教程
QML音视频效果实现使用AI技术辅助生成QT界面美化视频课程QT性能优化视频课程QT原理与源码分析视频课程QTQMLC++扩展开发视频课程免费QT视频课程您可以看免费1000+个QT技术视频免费QT视频课程QT统计图和QT数据可视化视频免费看免费QT视频课程QT性能优化视频免费看免费QT视频课程QT界面美化视频免费看1QML与音视频效果1.1QML简介1.1.1QML简介QML简介QML简介QML
vue3大屏可视化项目，包含地图，各种图表，全屏适配方案 m0_74825526 javascript 开发语言 ecmascript
项目设计1.始终满屏适配，这种方案一般用在屏幕变化不会特别的大项目，项目基本上不会用在比例非常不协调的大屏，设计图按1920*1080标准电脑屏幕比，所用的屏幕也基本在这个比例左右2.涉及图表知识点简单，主要有自定义色系，环形图，堆叠柱状图，折线图3.使用高德地图标点做中间地图满屏适配方案实现思路1宽度使用vw，高度使用vh，严格按照设计图换算，并且留出缓冲空间2具体算法，设计图为1920_108
C#语言的数据结构技术的探险家包罗万象 golang 开发语言后端
C#语言的数据结构探讨数据结构是计算机科学中一种用于组织、存储和管理数据的方式。有效地使用数据结构能使算法更加高效，并提高程序的性能。在C#语言中，我们可以构建和使用多种数据结构，以满足不同的需求。本文将介绍C#中的常用数据结构，包括数组、链表、栈、队列、哈希表、树和图等，并探讨它们的特点、实现和应用场景。1.数组数组是一种最基础且常用的数据结构。它是一个固定大小的线性结构，可以通过索引访问其中的
机器学习02-发展历史补充坐吃山猪机器学习机器学习人工智能
机器学习02-发展历史补充文章目录机器学习02-发展历史补充1-机器学习个人理解1-初始阶段：统计学习和模式识别（20世纪50年代至80年代）2-第二阶段【集成时代】+【核方法】（20世纪90年代至2000年代初期）3-第三阶段【特征工程】+【模型优化】（2000年代中期至2010年代初期）4-大规模数据和分布式计算（2010年代中后期）5-自动化机器学习和特征选择（2010年代末至今）2-神经网
Python数据分析高频面试题及答案闲人编程程序员面试 python 数据分析面试题核心
目录1.基础知识2.数据处理3.数据可视化4.机器学习模型5.进阶问题6.数据清洗与预处理7.数据转换与操作8.时间序列分析9.高级数据分析技术10.数据降维与特征选择11.模型评估与优化12.数据操作与转换13.数据筛选与分析14.数据可视化与报告15.数据统计与分析16.高级数据处理以下是一些Python数据分析的高频核心面试题及其答案，涵盖了基础知识、数据1.基础知识问1：Python中列表
数据结构---C++版海狸_hlz 数据结构数据结构
第1章数据结构的基本概念1.1数据结构在程序设计中的作用1）程序设计的实质是什么?数据表示：将数据存储在计算机（内存）中数据处理：处理数据，设计方案（算法）1.2计算机求解问题:1）问题→抽象出问题的模型→求模型的解问题——数值问题、非数值问题2）数值问题→数学方程非数值问题→数据结构3）本书讨论非数值问题的数据组织和处理，主要内容如下：（1）数据的逻辑结构：线性表、树、图等数据结构，其核心是如何
数电票介绍及如何由数电票生成OFD文件源之缘-OFD解决方案之道 ofd 数电票
本人用c#、c++、typescript分别开发了数电票生成系统，可以生成ofd、pdf、图格式的数电票。采用微服务部署，方便调用！本文主要介绍一下数电票概念及生成过程。1.数电票的概念与特点数电票，即数字电子发票，是指以电子形式生成、传输和存储的发票。它完全取代了传统的纸质发票，具有与纸质发票同等的法律效力。数电票的推广和应用是税务数字化的重要一步，旨在提高开票效率、降低企业成本、减少资源浪费，
智能生成ER图工具。使用 SQL 生成 ER 图：让数据库设计更高效小林rr 数据库 sql oracle
使用SQL生成ER图：让数据库设计更高效在数据库设计中，ER图（实体关系图）是不可或缺的工具。它不仅能帮助开发者直观地展示数据库的结构，还能帮助团队成员更好地理解不同数据实体之间的关系。传统上，ER图的绘制需要手动操作或使用特定的工具，而通过SQL自动生成ER图则提供了一种更加高效、便捷的方式。今天，我们将向大家介绍如何使用SQL生成ER图，帮助您更轻松地进行数据库设计，同时推广一款强大易用的工具
Pytorch 三小时极限入门教程 power-辰南人工智能深度学习 pytorch 人工智能
一、引言在当今的人工智能领域，深度学习占据了举足轻重的地位。而Pytorch作为一款广受欢迎的深度学习框架，以其简洁、灵活的特性，吸引了大量开发者投身其中。无论是科研人员探索前沿的神经网络架构，还是工程师将深度学习技术落地到实际项目，Pytorch都提供了强大的支持。本教程将带你从零基础开始，一步步深入了解Pytorch的核心知识，助你顺利踏上深度学习的征程。二、Pytorch基础环境搭建安装An
Python机器学习之XGBoost从入门到实战(基本理论说明) 雪域枫蓝 Python Atificial Intelligence 机器学习 python 分布式
Xgboost从基础到实战XGBoost:eXtremeGradientBoosting*应用机器学习领域的一个强有力的工具*GradientBootingMachines(GBM)的优化表现，快速有效—深盟分布式机器学习开源平台(DistributedmachinelearningCommunity，DMLC)的分支—DMLC也开源流行的深度学习库mxnet*GBM：Machine：机器学习模型
【数据分析岗】关于数据分析岗面试python的金典问题+解答，包含数据读取、数据清洗、数据分析、机器学习等内容摇光~ 数据分析面试 python
大家好，我是摇光~，用大白话讲解所有你难懂的知识点最近和几个大佬交流了，说了很多关于现在职场面试等问题，然后也找他们问了问他们基本面试的话都会提什么问题。所以我收集了很多关于python的面试题，希望对大家面试有用。类别1：数据读取与处理问题1：如何用Python从Excel文件中读取数据？答：在Python中，可以使用pandas库从Excel文件中读取数据。pandas提供了read_exce
【Python篇】深入机器学习核心：XGBoost 从入门到实战半截诗 Python python 机器学习深度学习分类回归数据分析 XGBoost
文章目录XGBoost完整学习指南：从零开始掌握梯度提升1.前言2.什么是XGBoost？2.1梯度提升简介3.安装XGBoost4.数据准备4.1加载数据4.2数据集划分5.XGBoost基础操作5.1转换为DMatrix格式5.2设置参数5.3模型训练5.4预测6.模型评估7.超参数调优7.1常用超参数7.2网格搜索8.XGBoost特征重要性分析9.高级功能扩展9.1模型解释与可解释性9.2
【YOLOv8杂草作物目标检测】 stsdddd YOLO目标检测目标检测 YOLO 目标检测人工智能
YOLOv8杂草目标检测算法介绍模型和数据集下载算法介绍YOLOv8在禾本科杂草目标检测方面有显著的应用和效果。以下是一些关键信息的总结：农作物幼苗与杂草检测系统：基于YOLOv8深度学习框架，通过2822张图片训练了一个目标检测模型，用于检测田间的农作物幼苗与杂草对象。该系统支持图片、视频以及摄像头进行目标检测，并能保存检测结果。系统界面可实时显示目标位置、目标总数、置信度、用时等信息。YOLO
思维图GOT：用大语言模型解决复杂问题硅谷秋水大模型人工智能机器学习语言模型人工智能自然语言处理
23年8月份来自瑞士和波兰的大学以及一个数据公司Cledar的大语言模型论文“GraphofThoughts:SolvingElaborateProblemswithLargeLanguageModels“。思维图（GoT）是一个框架，提高大型语言模型（LLM）中的提示功能，超出思维链或思维树(ToT)等范式所提供的能力。GoT的关键思想和主要优势是能够将LLM生成的信息建模为任意图，其中信息单位
python连接485网关设备 dilqu python 网络开发语言
Python相关视频讲解：python的or运算赋值用法用python编程Excel有没有用处？011_编程到底好玩在哪？查看python文件_输出py文件_cat_运行python文件_shel如何实现Python连接485网关设备1.流程图gantttitlePython连接485网关设备流程图section了解485网关设备:1dsection安装Python库:1dsection编写Pyt
工业控制系统的8种类型 dotNET跨平台
工业控制系统（ICS）是指用于操作或自动化常见工业过程的任何设备、网络或系统及其相关仪表的统称。ICS几乎被所有工业领域和关键基础设施行业使用，包括但不限于能源、制造、运输和污水处理。工业控制系统有几种类型。它们在大小和复杂性上有所不同，并且是为不同的行业和不同的任务设计的。最常见的包括监督控制和数据采集（SCADA）系统、分布式控制系统（DCS）、可编程逻辑控制器（PLC）以及其他几种。继续阅读
深度学习(1) 浅忆へ梦微凉深度学习人工智能深度学习学习方法 python
一、torch的安装基于直接设备情况，选择合适的torch版本，有显卡的建议安装GPU版本，可以通过nvidia-smi命令来查看显卡驱动的版本，在官网中根据cuda版本，选择合适的版本号，下面是安装示例代码GPU：pipinstalltorch==2.5.0torchvision==0.20.0torchaudio==2.5.0--index-urlhttps://download.pytorc
提升数据科学工作流效率的10个Jupyter Notebook高级特性
JupyterNotebooks已成为数据科学家、机器学习工程师和Python开发人员的核心开发工具。其核心优势在于提供了一个集成式环境，支持代码执行、文本编辑和数据可视化的无缝整合。尽管大多数用户熟悉其基本功能，但许多能显著提升工作效率的高级特性往往被忽视。本文将介绍一些高级功能，帮助您在数据科学项目中充分发挥JupyterNotebooks的潜力。1、Magic命令：高效的命令行接口Jupyt
Python 数据建模完整流程指南木觞清 3天入门Python python 开发语言
在数据科学和机器学习中，建模是一个至关重要的过程。通过有效的数据建模，我们能够从原始数据中提取有用的洞察，并为预测或分类任务提供支持。在本篇博客中，我们将通过Python展示数据建模的完整流程，包括数据准备、建模、评估和优化等步骤。1.导入必要的库在进行任何数据分析或建模之前，首先需要导入必需的Python库。这些库提供了各种工具和算法，帮助我们更高效地完成任务。importnumpyasnpim
深度学习常用格式转化脚本xml2yolo/coco2yolo/bdd2yolo/frame2video等 qq1309399183 计算机视觉实战项目集合深度学习人工智能格式转化脚本 voc2yolo格式转化数据集格式转换 xml2yolo coco2yolo
文章目录1.**数据集格式转换脚本**`coco2yolo.py`示例注释：注释说明：`xml2yolo.py`示例注释：注释说明：2.**数据集可视化与统计**`vis_yolo_files.py`示例注释：注释说明：3.**其他工具脚本**`frames2video.py`示例注释：注释说明：该项目提供了一系列用于深度学习的数据处理工具，主要功能包括：数据集格式转换：提供多种脚本，将不同格式的
LLMs，即大型语言模型 maopig AI 语言模型人工智能自然语言处理
LLMs，即大型语言模型，是一类基于深度学习的人工智能模型，它们通过海量的数据和大量的计算资源进行训练，可以理解和生成自然语言。LLMs的核心架构是Transformer，其关键在于自注意力机制，使得模型能够同时对输入的所有位置进行“关注”，从而更好地捕捉长距离的语义依赖关系。LLMs在众多领域都有广泛的应用，如自然语言理解（NLU），语言生成，以及语音识别和合成等。例如，它们能够理解人类的语言
【LLM】大语言模型（LLMs）林九生人工智能语言模型人工智能自然语言处理
大型语言模型（LLMs）1.什么是大型语言模型？大型语言模型（LargeLanguageModel，LLM）是基于深度学习的自然语言处理模型，能够理解和生成自然语言文本。它们通过在大规模文本数据上进行训练，学习语言的语法、语义和各种语言特征，从而可以执行诸如文本生成、翻译、总结、问答等多种语言任务。以下是大型语言模型的定义和基本原理：1.1定义大型语言模型是由大量参数组成的神经网络，这些参数通过在
大语言模型（LLMs）入门教程（非常详细）从零基础入门到精通，看完这一篇就够了大模型零基础教程语言模型人工智能自然语言处理大模型
大语言模型（LLMs）作为人工智能（AI）领域的一项突破性发展，已经改变了自然语言处理（NLP）和机器学习（ML）应用的面貌。这些模型，包括OpenAI的GPT-4o和Google的gemini系列等，已经展现出了在理解和生成类人文本方面的令人印象深刻的能力，使它们成为各行各业的宝贵工具。如下这份指南将涵盖LLMs的基础知识、训练过程、用例和未来趋势……一.WhatareLargeLanguage
【Python】已解决：ModuleNotFoundError: No module named ‘sklearn‘ 屿小夏 python sklearn 人工智能
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
使用神经网络拟合6项参数 Andrew_Xzw 神经网络人工智能深度学习开发语言机器学习 python
使用神经网络拟合6项参数1.数据预处理1.1添加参数解析1.2数据预处理逻辑1.3数据归一化及划分1.4数据标签处理逻辑1.5数据转torch2.定义model2.1CNN_LSTM2.2Transformer3.定义train脚本3.1loss和optimizer3.2train3.3predict1.数据预处理1.1添加参数解析为了方便管理模型和训练等参数，统一用参数解析。defparse_a
如何快速在Windows 10 + Anaconda 3 中使用Mxnet及gluon qianchess mxnet使用 mxnet win10 anaconda gluon 人工智能
如何快速在Windows10+Anaconda3中使用Mxnet及gluon网络上Mxnet的安装以及使用方法很多，自从其作者之一李沐推出了基于Mxnet的深度学习课程之后，我也尝试着去使用了一下Mxnet。首先第一步就是在自己的系统中安装Mxnet及其相关组建。现在的Mxnet常常会跟其虚拟环境Gluon结合在一起，所以下文就一起阐述一下，顺便记录一下自己踩的坑。注意本文的大部分内容都可以在官网
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他