ye6

[HyperGraph专题]HGNN+:General Hypergraph Neural Networks

最近在做和超图相关的工作，自己主要偏编码的工作，但在敲代码和参考其他现有超图库的过程中发现了一个叫DeepHypergrah的库，里面涉及了很多和深度学习相关的内容，用到了pytorch、scipy、numpy之类啥啥啥，看的我一头雾水，想起之前给自己定了一个学习pytorch这一工具的目标，现在终于有契机去研究一下了，顺便也学习一下和图神经网络相关的知识。

论文标题：HGNN+:General Hypergraph Neural Networks

高阶网络乍听过来是一个很牛的概念，因为一般来说我只会用networkx(link:https://github.com/networkx/networkx)或easygraph(link:https://github.com/easy-graph/Easy-Graph)构建简单图来算一些图相关的指标。所以在了解了高阶网络的概念后往往会有一个疑惑就是我们为什么要定义超边（简单来讲就是一条连着多个点的边）、构造超图来建模我们的场景。通过这个文章中的说明或许可以找到一点答案。文章给出的解释是：
一方面，现实世界中的数据相关性远远超过了成对的相关性，这不能用平面图很好地建模。例如，社交网络中的用户可能有不同的属性，这些用户之间的相关性可能以组的方式存在，例如，几个用户可能共享相同的爱好或被调用在同一事件中。简单图的另一个局限性是它的多模态/多类型真实数据建模能力较弱。例如，社交网络中的微博数据可能包含时间、图像、表情符号甚至视频，这些信息它们之间有社交联系。
且考虑到多模态/多类型数据表示的相关性，传统的基于GNN的方法需要在学习阶段整合多个图，并探索相关性多模态/多类型数据中的相关性成为一项具有挑战性的任务。

Fig2（a)描述了超图和普通图之间的区别。(b)描述了超图针对多模态/多类型数据的策略。

主要贡献：

提出了一个超图神经网络框架：HGNN+，其中主要包括两个流程：超边建模和超图卷积。在超图的建模过程中，理论上提出了"超边组"并进一步定义了四个方式去生成超边组。
将原来的卷积策略HGNNConv从空间域扩展到一般的两阶段超图卷积运算。（讲真，这句话我不太懂想表达贡献，可能是可拓展性更好的意思吧）
做了很多实验，发现文章提出的东西效果很牛逼…还提出了一个叫DeepHypergrah的工具包

相关工作：

GNN相关

GNN用于修复深度卷积和非常规数据处理之间的鸿沟，且能直接应用到随机图结构上。GNN可以被分成两类，第一类是spectral-based(基于谱的)，第二类是spatial-based（基于空间的）。根据网上的说法，前者代表将graph看作一张image然后做卷积；后者是把在image上做卷积 kernel 转化为能再graph上卷积的样子，就是让graph的局部仿照image的卷积过程。让每个node对应原本image CNN中的pixel，它的邻接node 就是3*3 kernel周围的那8个pixel。
解释来源：https://zhuanlan.zhihu.com/p/338785684

Hypergraph Learning相关

超图学习首先在[ Zhou D, Huang J, Scholkopf B. Learning with Hypergraphs: ¨Clustering, Classification, and Embedding[C]. NeurIPS. 2007]中被引入，它可以进行可转换学习，可以看作是超图结构上的一个传播过程。超图的转换推理旨在最小化超图上连接较强的顶点之间的标签差异。在过去的几年里，超图学习一直被扩展在许多领域得到了良好的开发和应用。Wang等人[Wang Y, Zhu L, Qian X, et al. Joint Hypergraph Learning for Tagbased Image Retrieval[J]. TPAMI, 2018, 27(9): 4437-4451.]构建了一个包含全局、局部视觉特征和标签信息的复杂超图，以学习图像在ta任务中的相关性基于g的图像检索。为了模拟脑功能连接网络（FCN），Xiao等人[Xiao L, Stephen J M, Wilson T W, et al. A Hypergraph Learning Method for Brain Functional Connectivity Network Construction from fMRI Data[C]. MI. 2020, 11317: 1131710.]提出了加权超图学习，它能够捕获大脑区域之间的关系而不是传统的基于图的方法和现有的基于未加权超图的方法

THE FRAMEWORK OF HYPERGRAPH NEURAL NETWORK HGNN+

在本节中，我们将简要介绍超图神经网络（HGNN+）的框架，它旨在为对给定的原始数据的表示学习提供一个一般的框架。
它包括两个部分：超图建模和超图卷积。
超图建模：可用数据被用于生成高阶相关性，而这种相关性由超图表示。文章中定义了三类超边组：pairwise edge(成对边)、特征空间中的k-Hop与邻居。在这个过程中，将生成所有这些类型的超边缘组（如果可用），并连接到一个超图中，用于数据相关建模。
超图卷积：这些卷积过程可以利用来自高阶相关数据和多模态数据的信息来生成更好的表示。

这里针对三种超边组生成进行展开。其中pairwise edge、k-Hop这两种方法是当数据相关性与图结构相关时的场景。而数据相关性与图结构无关时，就需要使用attributes或features。
pairwise edge
就是普通图中点-点相连，在超边的情况下，就是将两个点包一起作为一条超边。
k-Hop
k-Hop有两种方式，第一种是随机游走k步到达的点叫k-hop neighbors，第二种是与其最短路径距离为k。看文章的意思感觉是随机游走那类。相比于上一种方法，这种方法能提供更加丰富的相关性信息。

attributes
下面这张图很直观的表示这种超图构造规则

features
给定每个顶点的特征，可以通过寻找特征空间中每个顶点的邻居来生成第二种类型的特征。这种方式就是给定一个顶点为质心，它在特征空间中的k个近邻可以用一个超边连接，也可以用与质心距离d内的所有邻居连接。这种类型的超边的目的是找到顶点特征背后的关系。它可以在多尺度上设置，例如在邻居查找过程中设置不同的k或d值

Combination of Hyperedge Groups

接下来介绍如何利用这些超边组去生成一张超图。
法一：Coequal Fusion
就是把这些超边组拼接到一起；但这种方法很明显太简单暴力了，文章认为不同超边的信息丰富程度是不同的，简单的拼接不能完全利用多模态的混合高阶相关性。从而有了法二。
法二：Adaptive Fusion
每个超边组与一个可训练的参数相关联，它可以自适应地调整多个超边组对最终顶点嵌入的影响，它的定义如下：

wk就是在一个超边组k中被所有超边共享的一个可训练参数
W是一个表示超图的权重矩阵的对角矩阵
H表示通过将多个超边群的关联矩阵连接起来（·||·）而生成的超图的关联矩阵

由构造的超边组生成超图关联矩阵H和超边权值矩阵W，然后会将这两个矩阵输入超图卷积层进行进一步计算。

Hypergraph Convolution

文章中提出的HGNNConv可以由以下公式定义

Dv和De分别表示顶点度和边度的对角矩阵，Θ是在训练过程中要学习的参数。

Spatial Convolution on Hypergraph

谈到这个方法，首先，让我们简要回顾一下一个典型的基于spatial的图卷积的定义。一个图像可以被看作是一个网格图，其中每个像素代表一个顶点，每个顶点只连接它周围的邻居顶点。图像中的每个顶点（像素）都具有一个c通道特征（C-channel)。对图像的滤波可以看作是中心顶点聚集其邻居特征的过程转换其特征后的平均聚合。类似地，对于一个简单的图，基于空间的图卷积利用其相邻顶点的聚合来得到一个新的表示中心顶点。空间图卷积中的消息从相邻的顶点运行到中心顶点，这遵循了简单图中的“路径”的定义。
图中的路径被定义为P（v1、vk）=（v1、v2、···、vk）。它是一个顶点序列，其属性是序列中的每个顶点都与它旁边的顶点相邻，这意味着i和i+ 1（1≤i≤k 1）的所有顶点对都有邻域关系（Neighbor Relation.）。
在这里，我们可以定义超图上的空间卷积。对于超图中的每个顶点，我们聚合其相邻的顶点消息，以根据中心顶点之间的“路径”来更新自己以及其邻域内的每个顶点。超图中两个不同顶点v1和vk之间的路径被定义为一个序列：

其中vj和vj+1属于由超边ej表示的同一个顶点子集。显然，超路径中的每个两个相邻顶点都由一个超边分隔，超图中两个顶点之间的消息通过相关的超边传播，与普通图中相比，通过超边可以利用高阶关系。

然后，根据邻域间关系定义了超边e的顶点间集Nv (e)和顶点v的超边间集Ne (v)。

在定义1、2、3之后，我们介绍了一个空间超图卷积层通过超路径的邻居顶点消息聚合的消息传递。给定超图G的一个顶点α∈V= {V，E，W}，我们的目标是聚合来自其超边间邻居集Ne(α)的消息。在第t层的一般空间超图卷积可以定义为：

其中xtα∈Xt是层t = 1中顶点α∈V的输入特征向量1,2，···，T，xt+1α是顶点α的更新特征。mtβ是超边β∈E的消息，wβ是一个权值等连接到超边缘β. mt+1 α表示顶点α的消息。ytβ是超边β的超边特征，它是超边特征集Y t = {yt1，yt2，···，ytM}，yti∈RCt层t.Mtv（·）、Ute（·）、Mte（·）、Utv（·）是第t层的顶点消息函数、超边更新函数、超边消息函数和顶点更新函数。

下一章是各种方法之间的比较，文章通过随机游走与马尔可夫链这两个例子比较普通图和超图。还比较了HGNN/HGNN+与GNN的区别，认为前者在继承后者的基础上还拥有学习高阶关系的能力。

Experiments

baselines:
GCN、GraphSage、GAT、GIN、GraphConv、HyperGCN、Hyper-Atten
选取的大多是GNN中比较经典的模型，且选取的和超图相关的图神经网络像是将普通图中的一些方法在超图上进行实现。

一些训练细节就跳过了

Loss Functions
对于单标签任务，采用交叉熵函数，对于多标签任务采用二进制交叉熵函数

Evaluation Metrics
对于单标签任务是accuracy、macro f1 score，对于多标签任务是exact match ratio、example-based accuracy

在有图结构的数据上进行节点分类

Datasets:
Citation Network(Cora、Citeseer、PubMed)
Social Media Network(Github Web ML、Facebook Page-Page)
Settings
数据预处理：
原始结点特征是一个二进制矩阵，维度为N*C。对于citation network，每个非0的元素值表明这个元素在该出版物中出现，对于每个特征按行归一化。
对于两个社交媒体网络数据集，每个非0元素代表该用户/网站有对应的属性。由于社交媒体中的属性更加复杂，归一化方面有难度，所以没有进行归一化处理。

训练/验证/测试集切分：
对于每个数据集，每个类别随机选择5/10个样本进行训练，每个类别随机选择5个样本进行验证。其余的顶点将用于测试实验中的所有数据集。

超图构建：
对于方法HGNN+，三种类型的超边缘群E(pair) (Eq。(3)), E (hop1 )(Eq.(4))，和E(hop2) (Eq。(4))进行超图生成，超边组的的融合策略采用自适应融合。在这里，采用两个卷积层来生成嵌入，然后将输出输入一个softmax层，以预测每个类别的概率分布最高点.所有数据集的隐藏维数都固定为64

实验部分的结果如下图

结果原因探究：
从图结构方面考虑，本文提出的方法更深度地利用数据的高阶相关性。
固定层数n的GNN，现有的基于GNN的方法只利用邻接矩阵明确表示的信息，希望横向捕获图上的高阶相关性，以便进一步考虑通过多层叠加来进行表示学习。然而，堆叠多层GCN可能会陷入k -hop邻域平滑的陷阱。文章中的说明固定层数n的GNN中每个结点在输出层的特征是由平滑n跳邻居获得的，但实际上不同任务中，不同跳数的领居的贡献度是不同的，所以传统的只有固定层数的GNN可能获得的只是次优解，但本文的方法通过定义多个超边组及超边组的权重来平衡上述这个问题。
至于为什么基于超图的方法效果也不好，文章中给出的解释是，HyperGCN对超图的结构进行了简化导致结构信息丢失；而Hyper-Atten虽然效果比HyperGCN好，但利用超边-结点注意力机制模块，使得参数化程度太高，即需要学习的参数太多，因此可能导致过拟合的概率变高。

这张图只用了每个类型下的10个样例去训练，想模拟训练数据较少的情况

文章通过这个实验想表达自己的模型即使在训练数据很少的情况下也能取得很牛逼的结果，这恰好说明了自己的模型是捕捉到数据之间的高阶相关性的。

Ablation Experiments（消融实验）

对无图结构的数据的顶点分类
这一部分采用了两个公开的三维对象数据集，包括ModelNet40 [40]数据集和NTU [41]数据集。
超图的构建：
因为没有图结构，所以采用K个最近邻（KNN）算法进行超图构造。且有两个被之前论文验证效果最好的3D对象特征提取算法被用于这篇文章，分别是MVCNN和GVCNN，文章使用这两个算法对应的特征构造了两个超边组，并且使用直接拼接的策略构建超图。
基于超图结构的数据的顶点分类：
这里使用的数据集是：Cooking-200 and MovieLens2k-v2，这两个数据集本身就是超图结构的。在MovieLens2k-v2数据集中，电影作为顶点，超边可以由[电影、标签、权重]和[电影、导演]的相关性来构建。且采用直接合并的方式融合不同超边组。

图的构建
对于第一个数据集，文章将原料当做超边，菜谱当作结点。这里有个细节是，由于GCN不能直接处理超图结构，所以文章采用非加权团展开和加权团展开两种方法，将超图结构转移到简单的图结构中。

原因探索：
HGNN和HGNN+的两阶段消息传递策略V→E、E→V可以有效地捕获超图中的高阶信息与基于图的方法中采用的单阶段消息传递策略V→V相比，从而获得了更好的性能。

可视化：
文章使用t-SNE的方法（一个非线性降维机器学习算法，非常适用于高维数据降维到 2 维或者 3 维，进行可视化），从下图结果来看，HGNN+算法的聚类效果更好

THU-DEEPHYPERGRAPH: AN OPEN TOOLBOX OF THE HGNN+ FRAMEWORK

这一节主要介绍了该团队开发的一个超图开发工具包:DeepHyperGraph

Conclusions

所提出的HGNN+框架在从多模态/多类型数据建模高阶数据相关性方面具有优势。
1.文章介绍了四种类型的数据相关性生成方法，并提出了一种自适应的超边缘融合策略来生成整体超图，引入了空间域中的超图卷积来学习表示。
2.在9个数据集上的实验和与最先进的方法的比较证明了文章所提出的方法的有效性，结果和数学讨论表明，所提出的框架能够实现新的最先进的性能，特别是当没有明确的数据相关性。
3.提出了一个超图工具包THU-DeepHyperGraph被发布供公众使用。

21-梯度累积原理与实现机器人图像处理深度学习算法与模型人工智能深度学习 YOLO
一、基本概念在深度学习训练的时候，数据的batchsize大小受到GPU内存限制，batchsize大小会影响模型最终的准确性和训练过程的性能。在GPU内存不变的情况下，模型越来越大，那么这就意味着数据的batchsize智能缩小，这个时候，梯度累积（GradientAccumulation）可以作为一种简单的解决方案来解决这个问题。二、Batchsize的作用训练数据的Batchsize大小对训
【人工智能基础2】Tramsformer架构、自然语言处理基础、计算机视觉总结 roman_日积跬步-终至千里人工智能习题人工智能自然语言处理计算机视觉
文章目录七、Transformer架构1.替代LSTM的原因2.Transformer架构：编码器-解码器架构3.Transformer架构原理八、自然语言处理基础1.语言模型基本概念2.向量语义3.预训练语言模型的基本原理与方法4.DeepSeek基本原理九、计算机视觉七、Transformer架构1.替代LSTM的原因处理极长序列时，效率下降：虽然LSTM设计的初衷是解决长期依赖问题，即让模型
怎么做一个AI产品经理？ AI筑梦师 AI产品经理人工智能产品经理
AI产品经理全面进化：在人工智能迅猛发展的时代，产品经理的角色正经历前所未有的转型。从传统的需求捕捉者到技术与商业紧密结合的创新推动者，AI产品经理肩负着将前沿AI技术转化为解决用户痛点的产品的重要任务。随着大数据、云计算和大模型技术的不断成熟，产品经理不仅需要具备敏锐的市场洞察，还必须深刻理解AI技术本质，跨界整合技术、数据与业务优势，从而推动产品的持续创新与落地。本文将全面解析AI产品经理的角
MV-EB435i立体相机对垃圾分类开哥kg pytorch 深度学习卷积神经网络分类人工智能
最近在v社区发了一篇文章，懒得转移过来了链接：V社区-机器视觉技术交流社区-MV-EB435i立体相机对垃圾分类我觉得这篇文章对于刚入门深度学习想看点项目学点代码的刚刚好，因为我也是新手，嘻嘻嘻！希望这篇文章对大家有所帮助，如有错误请大家指正。
LORA 微调大模型：从入门到入土大模型. 人工智能开发语言 gpt agi 架构大模型
在当今人工智能领域，预训练的大模型已经成为推动技术发展的核心力量。然而，在实际项目中，我们往往会发现这些预训练模型虽然强大，但直接就去应用于一些特定的任务时，往往无法完全满足需求。这时，微调就成为了必不可少的一步。而在众多微调方法中，LORA全名(Low-RankAdaptation)以高效性和实用性，逐渐成为了许多开发者训练模型的首选项。作为一名小有经验的咸鱼开发者，我深知在实际项目中高效的进行
AI人工智能中的概率论与统计学原理与Python实战：Python实现概率模型 AI天才研究院 AI实战 AI大模型企业级应用开发实战大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着人工智能技术的不断发展，概率论与统计学在人工智能领域的应用越来越广泛。概率论与统计学是人工智能中的基础知识之一，它们在机器学习、深度学习、自然语言处理等领域都有着重要的作用。本文将介绍概率论与统计学的核心概念、算法原理、具体操作步骤以及Python实现方法，并通过具体代码实例进行详细解释。2.核心概念与联系2.1概率论与统计学的区别概率论是一门数学学科，它研究随机事件发生的可能性。
如何使用 Python 实现生成对抗网络 NoABug python 生成对抗网络 tensorflow
如何使用Python实现生成对抗网络生成对抗网络（GenerativeAdversarialNetwork，GAN）是一种能够生成高质量、逼真图像的深度学习模型。GAN模型由两个神经网络组成：一个生成器和一个判别器。生成器的任务是以噪声为输入，生成看似真实的图像；而判别器则需要根据输入的图像，判断该图像是真实的还是由生成器生成的。下面我们将通过Python代码来实现一个简单的GAN模型。首先，我们
GAN模型的Python应用——生成对抗网络代码编织匠人 python 生成对抗网络开发语言
GAN模型的Python应用——生成对抗网络生成对抗网络（GenerativeAdversarialNetwork，GAN）是深度学习中的一种重要模型，已经被广泛应用于图像、文本生成等领域。GAN模型由两个神经网络组成：生成器（Generator）和判别器（Discriminator）。生成器用于生成假样本，判别器用于评估真实性。两个神经网络相互博弈，通过一次次迭代训练，最终生成器可以生成足以骗过
二值逻辑、三值逻辑到多值逻辑的变迁（含示例）搏博人工智能原理算法人工智能机器学习线性代数图像处理数据分析
二值逻辑、三值逻辑到多值逻辑的变迁是一个逻辑体系不断拓展和深化的过程，反映了人们对复杂现象和不确定性问题认识的逐步深入。前文，我们已经探讨过命题逻辑与谓词逻辑，了解了如何用符号语言从浅入深地刻画现实世界。具体可以看我的CSDN文章：人工智能的数学基础之命题逻辑与谓词逻辑（含示例）-CSDN博客人工智能中用到的逻辑可概括地划分为两大类。第一类是经典命题逻辑和一阶谓词逻辑，第二类是泛指除经典逻辑之外的
ollama下载的DeepSeek的模型(Model)文件在哪里？(C盘下) 神秘泣男子常见AI大模型部署与应用 Ollama部署LLM 人工智能 ollama llama 自然语言处理机器学习
目录一、下载大模型（DeepSeek）2.安装Ollama3.检查安装是否成功二、拉取大模型（DeepSeek）1.打开命令行2.下载模型3.测试下载4.等待下载完成三.模型存放路径这个位置！！在人工智能快速发展的今天，大语言模型已经成为许多人探索和使用的热门技术。而Ollama作为一款轻量级的本地大模型运行工具，让我们能够在个人电脑上体验各种强大的AI模型，如DeepSeek系列。不少用户在安装
如何使用Python实现生成对抗网络（GAN）「已注销」互联网前沿技术韩进的创作空间全栈开发知识库 python 生成对抗网络 tensorflow 深度学习数据分析
生成对抗网络（GAN）是一种深度学习模型，由两个部分组成：生成器和判别器。生成器负责生成与训练数据相似的新数据，而判别器负责判断输入数据是真实的还是由生成器生成的。这两个部分不断相互博弈，直到生成器能够生成非常逼真的数据，使判别器难以区分生成数据和真实数据。下面是一个简单的Python实现，使用TensorFlow和Keras库。在开始之前，请确保已经安装了TensorFlow和Keras。imp
【数学基础】线性代数#1向量和矩阵初步 -一杯为品- 数学线性代数矩阵
本系列内容介绍：主要参考资料：《深度学习》[美]伊恩·古德菲洛等著《机器人数学基础》吴福朝张铃著文章为自学笔记，仅供参考。目录标量、向量、矩阵和张量矩阵运算单位矩阵和逆矩阵线性相关和生成子空间范数特殊类型的矩阵和向量特征分解奇异值分解Moore-Penrose伪逆迹运算行列式标量、向量、矩阵和张量标量标量是一个单独的数。向量向量是一列有序排列的数：x=[x1x2⋮xn]\boldsymbolx=\
AIGC从入门到实战：可能消失的职业和新出现的机会 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AIGC从入门到实战：可能消失的职业和新出现的机会作者：禅与计算机程序设计艺术1.背景介绍人工智能生成内容（AIGC）正在迅速改变我们的世界。从文本、代码到图像和音乐，AIGC正在各个领域展示其强大的能力，并开始挑战传统的创意产业。本篇文章将深入探讨AIGC的概念、技术原理、应用场景以及其对未来职业的影响，并为读者提供入门AIGC的实用指南。1.1AIGC的兴起AIGC的兴起得益于近年来人工智能技
内容创作者必备！Deepseek赋能，让创作更高效小焱创作 AI改变未来人工智能人工智能写作 ai写作深度学习神经网络 ai chatgpt
内容创作者必备！DeepSeek赋能，让创作更高效在当今信息爆炸的时代，内容创作已成为自媒体博主们展现才华、吸引粉丝的重要途径。然而，面对日益增长的竞争压力和不断变化的用户需求，如何高效、高质量地产出内容成为了摆在我们面前的一大挑战。幸运的是，随着人工智能技术的飞速发展，一款名为DeepSeek的智能工具应运而生，为内容创作者提供了强大的赋能。本文将深入探讨DeepSeek的基本概念、深层次解读、
开源模型应用落地-Qwen2-VL-7B-Instruct-vLLM-OpenAI API Client调用开源技术探险家开源大语言模型-新手试炼深度学习 AI编程 AIGC
一、前言学习Qwen2-VL，为我们打开了一扇通往先进人工智能技术的大门。让我们能够深入了解当今最前沿的视觉语言模型的工作原理和强大能力。这不仅拓宽了我们的知识视野，更让我们站在科技发展的潮头，紧跟时代的步伐。Qwen2-VL具有卓越的图像和视频理解能力，以及多语言支持等特性。学习它可以提升我们处理复杂视觉信息的能力，无论是在学术研究中分析图像数据、解读视频内容，还是在实际工作中进行文档处理、解决
ChatGPT、DeepSeek、Grok 三者对比：AI 语言模型的博弈与未来一ge科研小菜菜人工智能人工智能
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注1.引言随着人工智能技术的飞速发展，AI语言模型已经成为人机交互、内容创作、代码生成、智能问答等领域的重要工具。其中，ChatGPT（OpenAI）、DeepSeek（中国团队研发）和Grok（xAI，ElonMusk旗下公司）是当前三大具有代表性的AI语言模型。它们在技术架构、应用场景、用户体验、生态开放性等多个维度各具特色，并针对不同的用户需
【go从入门到精通】探秘struct结构体转json为什么需要首字母大写？前网易架构师-高司机 golang从入门到精通 golang json go 结构体首字母大写 golang从入门到精通 go从入门到精通
目录作者简介：问题抛出分析结论作者简介：高科，先后在IBMPlatformComputing从事网格计算，淘米网，网易从事游戏服务器开发，拥有丰富的C++，go等语言开发经验，mysql，mongo，redis等数据库，设计模式和网络库开发经验，对战棋类，回合制，moba类页游，手游有丰富的架构设计和开发经验。并且深耕深度学习和数据集训练，提供商业化的视觉人工智能检测和预警系统（煤矿，工厂，制造业
【动手学深度学习】#1PyTorch基础操作 -一杯为品- 机器学习深度学习人工智能
主要参考学习资料：《动手学深度学习》阿斯顿·张等著【动手学深度学习PyTorch版】哔哩哔哩@跟李牧学AI目录1.1数据操作1.1.1入门1.1.2运算符1.1.3广播机制1.1.4索引和切片1.1.5节省内存1.1.6转换为其他Python对象1.2数据预处理1.2.1读取数据集1.2.2处理缺失值1.2.3转换为张量格式1.3线性代数1.3.1标量1.3.2向量1.3.3矩阵1.3.4张量1.
为什么转行大模型行业？深度解析职业变革与技术红利大模型入门教程大模型学习语言模型人工智能 AI 大模型程序员大模型入门
引言2023年ChatGPT的爆发式发展，标志着AI大模型技术正式进入大众视野。这一技术不仅重塑了人工智能的边界，更催生了全新的职业赛道。从传统算法工程师到互联网从业者，越来越多的人开始将目光投向大模型领域。本文将深入探讨这一现象背后的核心动因，并结合行业现状、技术趋势与职业发展路径，为从业者提供系统性分析。一、行业变革：传统岗位萎缩与大模型崛起传统技术岗位的困境以推荐算法为例，随着移动互联网流量
DeepSeek 与云原生后端：AI 赋能现代应用架构一ge科研小菜菜后端人工智能后端
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注1.引言在当今快速发展的互联网时代，云原生（CloudNative）架构已成为后端开发的主流趋势。云原生后端的核心目标是利用云计算的弹性、可扩展性和高可用性，为现代应用提供稳定可靠的后端支持。而人工智能（AI）技术的发展，使得智能化成为云原生后端的新趋势。DeepSeek作为新一代AI技术，在云原生后端的自动化运维、智能资源调度、安全增强和高效数
AI 大模型应用数据中心建设：高性能计算与存储架构 AI智能涌现深度研究 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
AI大模型、数据中心、高性能计算、存储架构、分布式训练、GPU加速、数据管理1.背景介绍近年来，人工智能（AI）技术取得了飞速发展，特别是深度学习模型的突破性进展，催生了一系列基于大规模数据训练的强大AI模型，例如GPT-3、BERT、DALL-E等。这些AI大模型在自然语言处理、计算机视觉、语音识别等领域展现出强大的应用潜力，但也对计算资源和数据存储提出了极高的要求。传统的计算架构难以满足AI大
人工智能直通车系列24【机器学习基础】（机器学习模型评估指标（回归））浪九天人工智能直通车开发语言 python 机器学习深度学习神经网络人工智能
目录机器学习模型评估指标（回归）1.均方误差（MeanSquaredError,MSE）2.均方根误差（RootMeanSquaredError,RMSE）3.平均绝对误差（MeanAbsoluteError,MAE）4.决定系数（CoefficientofDetermination,R2）机器学习模型评估指标（回归）1.均方误差（MeanSquaredError,MSE）详细解释均方误差是回归问
国央企AI落地：以智能客服系统为突破口的详细实施方案探讨数商云网络 B2B系统数字化电商平台人工智能大数据架构 java 微服务 spring
一、引言随着人工智能（AI）技术的飞速发展和广泛应用，国央企作为国民经济的重要支柱，正积极探索AI技术在企业管理、业务运营等方面的应用。智能客服系统作为AI技术的一个重要应用领域，具有提升服务效率、增强用户体验、降低运营成本等显著优势，成为国央企AI落地的重要突破口。本文将详细探讨国央企如何以智能客服系统为突破口，实施AI技术的落地应用，并结合数商云在智能客服系统领域的实践经验，为国央企提供一套切
CSDN社区，到底该不该用DeepSeek AI生成文章？ Small踢倒coffee_氕氘氚 python 经验分享
##引言在当今数字化时代，人工智能（AI）技术正以惊人的速度发展，逐渐渗透到各个行业和领域。作为AI技术的一个重要分支，自然语言处理（NLP）在内容创作、文本生成等方面展现出了巨大的潜力。DeepSeekAI作为一款先进的AI写作工具，能够自动生成高质量的文章，极大地提高了内容创作的效率。然而，随着AI生成内容的普及，CSDN社区中的开发者、技术爱好者和内容创作者们开始思考一个问题：我们到底该不该
AI大模型从入门到精通，2025终极指南！好卷啊，又不能躺平，只能悄悄卷你们了！大模型教程人工智能大模型训练 LLM 知识库大模型大模型入门大模型学习
什么是AI大模型？AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力，可以应用于各种领域，如自然语言处理、图像识别、语音识别等。为什么要学AI大模型？2024人工智能大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于
AI大模型学习路线：从入门到精通的完整指南【2025最新】 AI大模型-大飞人工智能学习大模型 LLM AI 程序员大模型学习
引言近年来，以GPT、BERT、LLaMA等为代表的AI大模型彻底改变了人工智能领域的技术格局。它们不仅在自然语言处理（NLP）任务中表现卓越，还在计算机视觉、多模态交互等领域展现出巨大潜力。本文旨在为开发者、研究者和技术爱好者提供一条清晰的学习路径，帮助读者逐步掌握大模型的核心技术并实现实际应用。一、基础阶段：构建知识体系数学与理论基础线性代数：矩阵运算、特征值与奇异值分解是大模型参数优化的基础
Python与Web 3.0：重新定义数字身份验证的未来 Echo_Wish Python！实战！python 前端开发语言
Python与Web3.0：重新定义数字身份验证的未来随着Web3.0的迅猛发展，传统的身份验证方式正面临越来越大的挑战。从依赖中心化服务器存储用户数据，到如今去中心化、用户掌控数据的新时代，身份验证系统经历了前所未有的变革。而作为一个人工智能、区块链和Python技术的深度爱好者，我认为Python将成为构建Web3.0身份验证系统的重要工具。今天，我们就来聊聊如何结合Python与Web3.0
大模型和数据要素赋能实体零售行业数字化转型建设和实施方案优享智库大模型数据要素数据治理数据仓库主数据零售
大模型和数据要素赋能实体零售行业数字化转型建设和实施方案更多参考公众号：优享智库引言项目背景与意义数字化转型目标与期望实施方案概述零售行业现状及挑战实体零售行业现状数字化转型面临的挑战市场需求与趋势分析大模型与数据要素赋能策略大模型技术及应用场景数据要素采集、整合与治理赋能策略制定与实施路径数字化转型关键技术与解决方案人工智能技术及应用大数据分析与挖掘技术云计算、物联网等技术支持定制化解决方案设计
从LLM出发：由浅入深探索AI开发的全流程与简单实践（全文3w字）码事漫谈 AI 人工智能
文章目录第一部分：AI开发的背景与历史1.1人工智能的起源与发展1.2神经网络与深度学习的崛起1.3Transformer架构与LLM的兴起1.4当前AI开发的现状与趋势第二部分：AI开发的核心技术2.1机器学习：AI的基础2.1.1机器学习的类型2.1.2机器学习的流程2.2深度学习：机器学习的进阶2.2.1神经网络基础2.2.2深度学习的关键架构2.3Transformer架构：现代LLM的核
我们的AI人工智能，自动发布了一篇假新闻…… 数据断案数据人的故事人工智能数据库 sql oracle 数据分析
今天这个故事，还得从一个事故开始说起。前些日子，我们被XX公司投诉，说我们的资讯发布了关于他们公司授信额度的不实报道：告诉我们这篇资讯与他们公司最新公开披露的数据不一致，相关内容并不属实，可能对广大网友们造成严重误导，并对他们公司造成了严重负面影响……balabala一堆指责，并要求我们3小时内删除全部相关信息。然后，他们丢了2篇公告附件过来。我们对照着仔细一看，还真是我们搞错了：由于数据错误，“
eclipse maven IXHONG eclipse
eclipse中使用maven插件的时候，运行run as maven build的时候报错 -Dmaven.multiModuleProjectDirectory system propery is not set. Check $M2_HOME environment variable and mvn script match. 可以设一个环境变量M2_HOME指
timer cancel方法的一个小实例 alleni123 多线程 timer
package com.lj.timer; import java.util.Date; import java.util.Timer; import java.util.TimerTask; public class MyTimer extends TimerTask { private int a; private Timer timer; pub
MySQL数据库在Linux下的安装 ducklsl mysql
1.建好一个专门放置MySQL的目录 /mysql/db数据库目录 /mysql/data数据库数据文件目录 2.配置用户，添加专门的MySQL管理用户 >groupadd mysql ----添加用户组 >useradd -g mysql mysql ----在mysql用户组中添加一个mysql用户 3.配置，生成并安装MySQL >cmake -D
spring------>>cvc-elt.1: Cannot find the declaration of element Array_06 spring bean
将-------- <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3
maven发布第三方jar的一些问题 cugfy maven
maven中发布第三方jar到nexus仓库使用的是 deploy:deploy-file命令有许多参数，具体可查看 http://maven.apache.org/plugins/maven-deploy-plugin/deploy-file-mojo.html 以下是一个例子： mvn deploy:deploy-file -DgroupId=xpp3
MYSQL下载及安装 357029540 mysql
好久没有去安装过MYSQL，今天自己在安装完MYSQL过后用navicat for mysql去厕测试链接的时候出现了10061的问题，因为的的MYSQL是最新版本为5.6.24，所以下载的文件夹里没有my.ini文件，所以在网上找了很多方法还是没有找到怎么解决问题，最后看到了一篇百度经验里有这个的介绍，按照其步骤也完成了安装，在这里给大家分享下这个链接的地址
ios TableView cell的布局张亚雄 tableview
cell.imageView.image = [UIImage imageNamed:[imageArray objectAtIndex:[indexPath row]]]; CGSize itemSize = CGSizeMake(60, 50); &nbs
Java编码转义 adminjun java 编码转义
import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符，也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static final Strin
Tomcat 配置和spring aijuans spring
简介 Tomcat启动时，先找系统变量CATALINA_BASE，如果没有，则找CATALINA_HOME。然后找这个变量所指的目录下的conf文件夹，从中读取配置文件。最重要的配置文件：server.xml 。要配置tomcat，基本上了解server.xml，context.xml和web.xml。 Server.xml -- tomcat主
Java打印当前目录下的所有子目录和文件 ayaoxinchao 递归 File
其实这个没啥技术含量，大湿们不要操笑哦，只是做一个简单的记录，简单用了一下递归算法。 import java.io.File; /** * @author Perlin * @date 2014-6-30 */ public class PrintDirectory { public static void printDirectory(File f
linux安装mysql出现libs报冲突解决 BigBird2012 linux
linux安装mysql出现libs报冲突解决安装mysql出现 file /usr/share/mysql/ukrainian/errmsg.sys from install of MySQL-server-5.5.33-1.linux2.6.i386 conflicts with file from package mysql-libs-5.1.61-4.el6.i686
jedis连接池使用实例 bijian1013 redis jedis连接池 jedis
实例代码： package com.bijian.study; import java.util.ArrayList; import java.util.List; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.clients.jedis.JedisPoo
关于朋友 bingyingao 朋友兴趣爱好维持
成为朋友的必要条件：志相同，道不合，可以成为朋友。譬如马云、周星驰一个是商人，一个是影星，可谓道不同，但都很有梦想，都要在各自领域里做到最好，当他们遇到一起，互相欣赏，可以畅谈两个小时。志不同，道相合，也可以成为朋友。譬如有时候看到两个一个成绩很好每次考试争做第一，一个成绩很差的同学是好朋友。他们志向不相同，但他
【Spark七十九】Spark RDD API一 bit1129 spark
aggregate package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} //测试RDD的aggregate方法 object AggregateTest { def main(args: Array[String]) { val conf = new Spar
ktap 0.1 released bookjovi kernel tracing
Dear, I'm pleased to announce that ktap release v0.1, this is the first official release of ktap project, it is expected that this release is not fully functional or very stable and we welcome bu
能保存Properties文件注释的Properties工具类 BrokenDreams properties
今天遇到一个小需求：由于java.util.Properties读取属性文件时会忽略注释，当写回去的时候，注释都没了。恰好一个项目中的配置文件会在部署后被某个Java程序修改一下，但修改了之后注释全没了，可能会给以后的参数调整带来困难。所以要解决这个问题。 &nb
读《研磨设计模式》-代码笔记-外观模式-Facade bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 百度百科的定义： * Facade（外观）模式为子系统中的各类（或结构与方法）提供一个简明一致的界面， * 隐藏子系统的复杂性，使子系统更加容易使用。他是为子系统中的一组接口所提供的一个一致的界面 * * 可简单地
After Effects教程收集 cherishLC After Effects
1、中文入门 http://study.163.com/course/courseMain.htm?courseId=730009 2、videocopilot英文入门教程（中文字幕） http://www.youku.com/playlist_show/id_17893193.html 英文原址： http://www.videocopilot.net/basic/ 素
Linux Apache 安装过程 crabdave apache
Linux Apache 安装过程下载新版本： apr-1.4.2.tar.gz（下载网站：http://apr.apache.org/download.cgi） apr-util-1.3.9.tar.gz（下载网站：http://apr.apache.org/download.cgi） httpd-2.2.15.tar.gz（下载网站：http://httpd.apac
Shell学习之变量赋值和引用 daizj shell 变量引用赋值
本文转自：http://www.cnblogs.com/papam/articles/1548679.html Shell编程中，使用变量无需事先声明，同时变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）中间不能有空格，可以使用下划线（_）不能使用标点符号不能使用bash里的关键字（可用help命令查看保留关键字）需要给变量赋值时，可以这么写：
Java SE 第一讲（Java SE入门、JDK的下载与安装、第一个Java程序、Java程序的编译与执行） dcj3sjt126com java jdk
Java SE 第一讲： Java SE：Java Standard Edition Java ME: Java Mobile Edition Java EE：Java Enterprise Edition Java是由Sun公司推出的（今年初被Oracle公司收购）。收购价格：74亿美金 J2SE、J2ME、J2EE JDK：Java Development
YII给用户登录加上验证码 dcj3sjt126com yii
1、在SiteController中添加如下代码： /** * Declares class-based actions. */ public function actions() { return array( // captcha action renders the CAPTCHA image displ
Lucene使用说明 dyy_gusi Lucene search 分词器
Lucene使用说明 1、lucene简介 1.1、什么是lucene Lucene是一个全文搜索框架，而不是应用产品。因此它并不像baidu或者googleDesktop那种拿来就能用，它只是提供了一种工具让你能实现这些产品和功能。 1.2、lucene能做什么要回答这个问题，先要了解lucene的本质。实际
学习编程并不难,做到以下几点即可! gcq511120594 数据结构编程算法
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
Java面试十问之三：Java与C++内存回收机制的差别 HNUlanwei java C++finalize()堆栈内存回收
大家知道， Java 除了那 8 种基本类型以外，其他都是对象类型（又称为引用类型）的数据。 JVM 会把程序创建的对象存放在堆空间中，那什么又是堆空间呢？其实，堆（ Heap）是一个运行时的数据存储区，从它可以分配大小各异的空间。一般，运行时的数据存储区有堆（ Heap）和堆栈（ Stack），所以要先看它们里面可以分配哪些类型的对象实体，然后才知道如何均衡使用这两种存储区。一般来说，栈中存放的
第二章 Nginx+Lua开发入门 jinnianshilongnian nginx lua
Nginx入门本文目的是学习Nginx+Lua开发，对于Nginx基本知识可以参考如下文章： nginx启动、关闭、重启 http://www.cnblogs.com/derekchen/archive/2011/02/17/1957209.html agentzh 的 Nginx 教程 http://openresty.org/download/agentzh-nginx-tutor
MongoDB windows安装基本命令 liyonghui160com
windows安装安装目录： D:\MongoDB\ 新建目录 D:\MongoDB\data\db 4.启动进城： cd D:\MongoDB\bin mongod -dbpath D:\MongoDB\data\db &n
Linux下通过源码编译安装程序 pda158 linux
一、程序的组成部分　　Linux下程序大都是由以下几部分组成：　　二进制文件：也就是可以运行的程序文件　　库文件：就是通常我们见到的lib目录下的文件　　配置文件：这个不必多说，都知道　　帮助文档：通常是我们在linux下用man命令查看的命令的文档　　二、linux下程序的存放目录　　linux程序的存放目录大致有三个地方：　　/etc, /b
WEB开发编程的职业生涯４个阶段 shw3588 编程 Web 工作生活
觉得自己什么都会 2007年从学校毕业，凭借自己原创的ASP毕业设计，以为自己很厉害似的，信心满满去东莞找工作，找面试成功率确实很高，只是工资不高，但依旧无法磨灭那过分的自信，那时候什么考勤系统、什么OA系统、什么ERP，什么都觉得有信心，这样的生涯大概持续了约一年。根本不是自己想的那样 2008年开始接触很多工作相关的东西，发现太多东西自己根本不会，都需要去学，不管是asp还是js，
遭遇jsonp同域下变作post请求的坑 vb2005xu jsonp 同域post
今天迁移一个站点时遇到一个坑爹问题,同一个jsonp接口在跨域时都能调用成功,但是在同域下调用虽然成功,但是数据却有问题. 此处贴出我的后端代码片段 $mi_id = htmlspecialchars(trim($_GET['mi_id '])); $mi_cv = htmlspecialchars(trim($_GET['mi_cv '])); 贴出我前端代码片段: $.aj