起舞的皮卡邱

TKGC综述2022

原文：https://arxiv.org/pdf/2201.08236.pdf

摘要

TKGC方法可以学习KGC方法未能捕获的知识图的动态演化。本文详细介绍TKGC的背景，包括问题定义、基准数据集和评估指标。然后，根据如何使用事实的时间戳来捕获时间动态来总结现有的TKGC方法。最后，对全文进行了总结，并提出了今后的研究方向。

介绍

TKGC的关键挑战是如何有效地将时间戳集成到模型中，以便能够恰当地捕获实体、关系和底层图的时间动态，并将其用于链接预测。
本文的主要贡献如下:1)提出了一种基于事实时间戳的链接预测方法分类。2)详细分析了现有的TKGC方法，总结了常用的基准数据集和通用的评估协议。3)讨论了现有TKGC方法的局限性，并提出了今后TKGC的研究方向。

背景

问题定义

知识图是包含结构化事实的有向多关系图。事实由两个实体、一个连接实体的关系和一个时间戳组成。除非另有说明，否则我们将时间戳视为其余内容中的时间点。
一个事实评分函数q(s)被用来衡量一个训练事实的正确性。负采样通过随机破坏真实事实创建负样本s’，这被TKGC方法广泛用于提高学习表征的表达性。损失函数的目标是对所有事实及其负样本，共同最小化q(s)和最大化q(s’)。总结了三种不同的损失通常采用TKGC方法。
为了保证事实与其对应的负样本之间有较大的得分差距，采用边际排名损失，其定义如下:

[x]+ = max(x, 0)和γ是一个超参数，用于调节预期的分数差的大小。

交叉熵损失也旨在获得事实和负样本之间较大的分离差距，但它并没有对所有事实强制规定固定的评分范围:

二元交叉熵损失强调个体事实和负样本的得分如下:

其中x∈D y = 1，否则y = 0。这种简便的计算使得二元交叉熵损失有利于基于神经网络的TKGC方法。

基准数据集

评估协议

Hits@k
Mean Ranking (MR)
Mean Reciprocal Ranking(MRR)
在实体预测的基础上，有些研究进一步引入了关系预测和时间预测。
目前的研究界主要关注于使用在数据集中有时间戳的查询来评估TKGC模型;然而，一个越来越大的挑战是使用看不见的时间戳进行进一步评估。看不见的时间戳可以分为两种类型，即未来时间戳和失踪时间戳。未来的时间戳旨在度量样本外预测的有效性，而缺失的时间戳则更多地关注于知识归因。

TKG补全方法

TransE的评分函数 q(h, r, t) = ||eh + er−et||，将r视为h和t之间的转换。
许多TKGC方法都建立在现有KGC方法的基础上，主要的挑战是设计有效的策略，将时间戳合并到事实评分函数中。本文分析了基于不同时间戳集成策略的现有TKGC方法。

1.Timestamp-included张量分解

张量分解是有效的方法，加权轻且易于训练。知识图可以看作一个三维的邻接矩阵，也就是三个二元张量。这三个张量分别表示头实体，关系和尾实体。实体和关系的表示是通过将张量分解成低维矩阵来学习的。考虑到时间戳是张量的另一种模态(知识图变成了四向张量)，这些张量分解方法自然可以扩展到TKGC，学习时间戳的低维表示用于分数测量。本文总结了基于不同张量分解技术的相关TKGC方法。

CP分解
Tucker分解

2.Timestamp-based转换

许多TKGC方法将时间戳视为一种转换，以学习与特定时间相对应的实体和关系表示。
合成时间关系
若可以将TKG的四元组变为KG的三元组，就可以很方便的利用现有的KGC模型，一种简单的方法是通过将关系与时间戳连接来创建合成的依赖于时间的关系。例如：{湖人，冠军，NBA，2010}转换成（冠军：2021）则这个例子变成了{湖人，冠军：2021，NBA}
q(s) = ||eh + u(r，τ)−et||，其中u(r， τ)为融合函数。三个基本融合函数er:τ， er + eτ和pτer (pτ∈(0,1)是一个可学习系数)的，实验结果表明u(r，τ) = er + eτ预测性能最好。不同事实的时间间隔可能会重叠，例如2010-2014和2012-2016，为解决这个问题，提出了通过分割（Splitting）或合并（M erging ）现有时间间隔来连接关系的最佳时间戳。Splitting通过在时间序列上采用变化点检测（change-point-detection (CPD) ）来分隔时间间隔，表示关系的变化；若事实相同，Merging 迭代合并时间间隔。
有文章将关系和时间戳串联成一个标记序列，例如：{championships of, 2y, 0y, 1y, 0y}，LSTM可以处理不同长度的序列，该方法的优势是可以适应不同格式的时间戳。
时间的单位可能不同，有以年为单位，有天为单位，对时间戳关系序列采用多头自注意的方法获得综合关系的表示。
线性变换
时间戳被视为可以将实体关系映射到相应表示的线性变换。具体来说，有2018年文章将时间戳视为超平面，将时间空间分隔成离散的时区。与时区相对应的实体/关系表示由超平面的投影获得。对于时间戳τ，超平面定义为wτ∈Rd，且||wτ|| = 1。τ的投影函数定义为P(e) = e−wTτ ewτ，其中e为实体或关系的静态表示。事实分数是用投影表示来计算的，即q(s) = ||P(eh) + P(er) - P(et)||。为了提高对多关系事实的表达能力，2019年文章包括了一个额外的关系矩阵，在超平面投影之前，将实体映射为特定关系。此外，2020年文章在超平面序列上采用GRU ，2014年文章进一步捕捉超平面之间的动力学。
除超平面外，2020年文章将实体的变换视为复杂空间中的线性旋转。即，ehτ = eh◦eτ和etτ = et◦eτ，其中◦是复空间中的厄密积。然后，将该关系视为旋转头部实体与尾实体的共轭的平移，即q(s) = kehτ + er−¯etτ k。为了实现任意时间精度，[Leblay等人，2020]首先将时间戳编码为一个热向量;向量中的不同区域代表不同的时间分辨率，例如，世纪或天。时间戳的一个热向量对应于一系列线性变换矩阵，这些矩阵用于将实体/关系映射为依赖于时间的。

3. 动态嵌入

依赖于时间的表示被期望表现出实体和关系的含义和背景随时间的变化。值得注意的是，实体/关系沿时间轴的表示不是独立的，而是通常遵循特定的动态演化模式。例如，一个人的生命周期只能是出生→工作→死亡，而且是不可逆的。动态嵌入方法的目标是通过在学习的表示中编码动态来捕获这些进化模式。
表示为时间戳函数
为了表示实体/关系的动态演化，一种直观的方法是将表示开发为时间戳函数，它表示不同类型的动态模式。[Xu et al.， 2020b]将实体和关系的表示形式视为时间序列，时间序列可以分解为三个分量，即e = e_static + trend(τ) +seasonal(τ) + N . e_static。static是表示实体/关系静态特征的不变分量，trend(τ)和seasonal(τ)(以τ为输入参数)分别表示趋势和季节特征，N是上瘾随机噪声。[Han等人，2020a]开发了一个类似的模型，该模型采用静态分量和时变分量表示;而是在双曲空间中定义的。双曲空间可以比欧几里德空间更灵活地表达图结构数据的几何结构。因此，实体和关系之间的相互作用被定义为黎曼流形的乘积。表示法的时变分量代表实体的动态演化，被看作是流形上的运动;也就是切线空间中的速度矢量。受历时词嵌入的启发，[Goel等人，2020]提出了实体和关系的历时词嵌入。在这个设置中，表示被分为静态段和时变段。同样，静态段表示时不变特征，而时变段是一个以时间戳作为输入的神经元。历时性嵌入是模型不可知的，可以方便地吸收相关领域知识，提高预测精度。
表示为RNN的隐藏状态
RNN能自适应的学习实体和关系的动态演化。。[Trivedi等人，2017]将事实的发生建模为一个多维时间点过程，它代表了多个动态事件的复杂协同进化。该模型使用一个条件强度函数(该函数被实现为实体/关系表示测量的事实分数)，以根据先前发生的事实推断下一个事实发生的时间。同时，学习事实在τ处的头部实体和尾部实体的表示，分别作为两个独立rnn的输出。两个rnn的输入都包括在τ之前出现的头尾实体的串联，目的是捕获它们随时间的动态共同进化模式。类似地，[Wu等人，2020]采用了实现多跳消息传递的结构编码器和时序编码器，如GRU或自注意[V aswani等人，2017]。结构编码器在每个时间戳学习实体的结构依赖关系，并将输出进一步馈入时间编码器以与时间动态集成。捕获这两种信息的隐藏状态被采用为动态实体表示。该模型进一步处理了时间的异质性，即实体出现的稀疏性和可变性，通过数据imputation(对于不活跃的实体)和基于频率的门控。

4.从知识图谱快照中学习

原始知识图可以看作是一系列知识图快照/子图，每个子图只包含用相应的时间戳标记的事实。通过这种方式，知识图成为具有不同关系链接的时间演化子图。连接预测问题是通过推断实体和关系之间的多关系的相互作用来实现的。
马尔可夫过程模型
，[Xul.2021b]将知识图的状态按照一阶马尔可夫过程随时间演化。即知识图快照的状态依赖于它的前一个快照，通过一个概率转移矩阵，即S_τ ₊₁ = S_τ·P_τ。S_τ表示G_τ的状态，并被定义为实体/关系表示和可学习状态参数的组合。模型训练以递归更新的方式实现，静态嵌入被用作有效的初始化。与确定性方法相比，[Liao.2021]采用基于变分贝叶斯推理的概率实体表示方法[Kingma and Welling, 2013]，联合建模实体特征和不确定性。表示被定义为高斯分布，具有可学习的均值和方差。模型中的生成过程定义为条件概率p(G_τ |E_τ， R_τ)。对于p(E _τ |E<_τ)) = p(E _τ |E_τ−1)的实体采用一阶马尔可夫规则。不同时间戳上的关系被认为是独立的，因为它们通常表示数据集中时间不敏感的动作。因此，联合概率可简化为p(G≤τ，E≤τ，R≤τ) =累乘i从1到T{ p(G_i|E_i, R_i)p(E_i|E_i−1)p(R_i)}。该模型学习的表达进化模式在离线和在线场景下都是有效的。
自回归模型
[Jin2019]采用自回归的方式对事实的动态演化进行建模，即属于G_τ的事实的生成依赖于G_{τ−m:τ−1}，其中m为自回归的阶数。除了承载图结构的G_{τ−m:τ−1}之外，生成过程进一步通过多关系图聚合器递归地整合事实的局部多跳邻接信息。除了图结构外，[Li2021b]在每个图快照上使用多层GCN [Kipf和Welling, 2016]来捕获并发事实的依赖关系。采用门循环分量，有效地从历史事实中学习长期的时间模式，同时也缓解了梯度的消失。此外，实体的静态属性(例如，类型)被用作约束来进一步细化学习到的表示。与离散演化过程不同，[Han2021]采用连续时间嵌入对历史知识图快照的时间和结构信息进行编码。结构信息通过多关系图卷积层捕获，动态演化通过神经常微分方程(NODES)学习[Chen2018]。考虑到许多事实在两个相邻的时间戳之间不发生变化时就不具有信息性，因此在模型中进一步包含了一个图过渡层，以强调在两个知识图快照之间无约束或无形式的事实。

5.历史背景下的推理

知识图中事实的时间顺序由时间戳的可用性来揭示。这可以通过查询的历史上下文来预测缺失的链接。通常，查询之前发生的和与查询相关的事实被视为它们的历史上下文。我们观察到现有的方法使用不同的视角来解释查询和它的历史上下文之间的关联，以进行链接预测。
Attention-based Relevance
试图有选择性地集中在几个重要方面的注意机制可以自动捕捉到事实的相关性。沿着这条线，[Han2020b]实现了一个推理过程，作为一个依赖于查询的推理子图的扩展。推理子图通过采样邻近的历史事实(共享同一个头实体)迭代扩展。根据边缘注意分数展开查询的兴趣，边缘注意分数是通过使用时间关系图注意层从历史事实传递消息来计算的。将最终的推理子图视为预测结果的可解释推理路径。为了更好地学习事实的长期依赖性，[Jung等人，2021]开发了一种基于路径的多跳推理过程，通过知识图上的边缘传播注意力(注意流[Xu等人，2018])。因此，推断的注意分布被用来作为预测的自然解释。具体来说，他们认为历史事实和查询之间的时间位移比确切的时间戳更有指示性;例如，对于标记为“14/01/2021”的查询，“2天前”比“12/01/2021”更明确。因此，该模型捕获了两种不同粒度的位移，即时间位移的符号(过去、现在和未来)和位移的精确大小。在推理过程中，采用了包含时间位移的两阶段GNN，从而捕获了与查询相关的实体和关系的结构特征。
Heuristic-based Relevance
另一种观点是在历史事实的相关性度量过程中采用外部/领域知识作为启发式或指导方针。具体来说，[Bai等人，2021]引入了两种预定义的倾向分数(亲和度)来组织历史事实进行链接预测。善意衡量关系的敌对程度，例如，制裁比合作更敌对，而亲密则衡量两个实体的合作程度。然后，根据趋势得分汇总历史事实，从而使用更多相关线索进行预测。进一步对每个时间戳汇总的历史事实采用GRU来学习动态推理过程。[Zhu et al.， 2021]观察到历史经常在知识图数据集中重复;例如，他们报告说，1995年至2019年ICEWS存储库记录的事件中，80%以上以前发生过。在此基础上，将模型分为复制和生成两种推理模式。Copy模式学习查询是相关历史事实重复的概率。生成模式通过线性分类器学习所有可能的候选对象作为预测的概率。这两种模式的输出被聚合为最终的预测。

结论及展望

本文首先介绍了TKGC的背景，并总结了基准数据集和用于评估的一般精度指标。然后，分析了现有的基于知识图事实时间戳的TKGC方法是如何用于学习链接预测的时间动态的。此外，考虑到现有方法的局限性，试图指出未来TKGC研究的几个有前景的方向。

1.吸收外部知识

预测精度方面仍有很大的提高空间，特别是在GDELT数据集上。与数据集相关的许多方面限制了性能;例如，事实的不平衡分布，这导致实体和关系的长尾结构[Mirtaheri等人，2020]。一种可能的解决方案是在模型学习过程中吸收外部知识来丰富有限的结构/时间信息。例如，关系领域知识(如，parentOf是childOf的倒置)[Goel等人，2020]使很少发生的关系能够从其他相关关系中学习;实体类型通过将语义背景与实体联系起来，有助于更逼真的表示学习[Li等人，2021b]。此外，实体/关系的语义(如名称)在很大程度上被现有方法所忽略。通过采用预训练的语言模型(如Bert [Devlin et al.， 2018])来利用它们，可以丰富知识图的有限信息，并为链接预测带来外部见解。

2.Time-aware负采样

负抽样通过生成与知识图中的真实事实相对照的负样本，帮助实体和关系的有效表示学习。生成有区别的负样本至关重要，因为如果不这样做，可能很难改进模型，甚至会导致梯度消失[Zhang et al.， 2019]。虽然负采样是KGC的一个活跃的研究领域(例如，生成式对抗网络[Cai and Wang, 2018])，但在TKGC场景中很少探索。由于额外的时间维度，TKGC的负采样可能更具挑战性，这需要适当地处理事实和时间戳之间的复杂交互。

3.大规模知识图

与用于评估TKGC方法的数据集相比，现实生活中的知识图要大得多，常常包含数十亿个事实。不幸的是，使用当前的基准数据集训练TKGC模型已经相当痛苦(需要数小时到数天);这使得将它们应用到现实生活中的知识图表上变得不可思议。为了提高效率，需要研究在不显著影响链接预测精度的情况下执行多节点计算资源的分布式模型，这带来了诸如最优数据集划分和分布式计算(考虑时间戳)等挑战。同时，现有方法的参数大小很大，因为每个实体/关系都需要学习唯一的嵌入。然而，考虑到实体/关系具有许多相似的特征，开发组合嵌入[Yu et al.， 2014]将实体/关系表示为一个小得多的显式/隐式共享特征组的组合是很有前途的。

4.知识进化图

虽然现有的大多数方法都是在一个不变的数据集上执行TKGC，但现实生活中的知识图是不断进化的，通过删除错误的事实和包含新的事实。通过这种方式，知识图将不断更新实体、关系和时间戳集。为了避免在每次知识图更新时从头开始训练一个新模型，TKGC应该被视为一个增量或持续学习问题。前沿研究试图通过经验回放和知识蒸馏来解决流场景中的灾难性遗忘问题[Wu等人，2021]，并取得了与基线相比的结果。未来，可以进一步研究TKGC的其他持续学习技术，如正则化和渐进式神经网络[Delange2021]。

【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
【Python深度学习】零基础掌握Pytorch Pooling layers nn.MaxPool方法 Mr数据杨 Python 深度学习 python 深度学习 pytorch
在深度学习的世界中，MaxPooling是一种关键的操作，用于降低数据的维度并保留重要特征。这就像是从一堆照片中挑选出最能代表某个场景的那张。PyTorch提供了多种MaxPooling层，包括nn.MaxPool1d、nn.MaxPool2d和nn.MaxPool3d，它们分别适用于不同维度的数据处理。如果处理的是声音信号（一维数据），就会用到nn.MaxPool1d。而处理图像（二维数据）时，
阅读笔记(2) 单层网络:回归 a2507283885 笔记
阅读笔记(2)单层网络:回归该笔记是DataWhale组队学习计划（共度AI新圣经：深度学习基础与概念）的Task02以下内容为个人理解，可能存在不准确或疏漏之处，请以教材为主。1.从泛函视角来看线性回归还记得线性代数里学过的“基”这个概念吗？一组基向量是一组线性无关的向量，它们通过线性组合可以张成一个向量空间。也就是说，这个空间里的任意一个向量，都可以表示成这组基的线性组合。函数其实也可以看作是
【深度学习解惑】如果用RNN实现情感分析或文本分类，你会如何设计数据输入？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 分类人工智能机器学习神经网络
以下是用RNN实现情感分析/文本分类时数据输入设计的完整技术方案：1.引言与背景介绍情感分析/文本分类是NLP的核心任务，目标是将文本映射到预定义类别（如正面/负面情感）。RNN因其处理序列数据的天然优势成为主流方案。核心挑战在于如何将非结构化的文本数据转换为适合RNN处理的数值化序列输入。2.原理解释文本到向量的转换流程：原始文本分词建立词汇表词索引映射词嵌入层序列向量关键数学表示：词嵌入表示：
Pytorch模型安卓部署 python&java pytorch 人工智能 python
Pytorch是一种流行的深度学习框架，用于算法开发，而Android是一种广泛应用的操作系统，多应用于移动设备当中。目前多数的研究都是在于算法上，个人觉得把算法落地是一件很有意思的事情，因此本人准备分享一些模型落地的文章(后续可能分享微信小程序部署，PyQt部署以及exe打包，ncnn部署，tensorRT部署，MNN部署)。本篇文章主要分享Pytorch的Android端部署。看这篇文章的读者
人工智能-基础篇-5-建模方式（判别式模型和生成式模型）
机器学习包括了多种建模方式，其中判别式建模（DiscriminativeModel）和生成式建模是最常见的两种。这两种建模方式都可以通过深度学习技术来实现，并用于创建不同类型的模型。简单来说：想要创建一个模型，依赖需求需要合适的建模方式来创建这个模型。通常建模方式主要分为两大类。一类是判别式模型，针对输入数据给出特定的输出。如：判断一张图片是猫还是狗，直接学习“猫”和“狗”的特征差异（如耳朵形状、
PyTorch教程：LSTM语言模型的动态量化技术解析怀灏其Prudent
PyTorch教程：LSTM语言模型的动态量化技术解析tutorialsPyTorchtutorials.项目地址:https://gitcode.com/gh_mirrors/tuto/tutorials前言在深度学习模型部署过程中，模型大小和推理速度是两个至关重要的考量因素。PyTorch提供的动态量化技术能够在不显著影响模型准确率的前提下，有效减小模型体积并提升推理速度。本文将深入解析如何对
【机器学习】数学基础——张量（傻瓜篇）一叶千舟深度学习【理论】机器学习人工智能
目录前言一、张量的定义1.标量（0维张量）2.向量（1维张量）3.矩阵（2维张量）4.高阶张量（≥3维张量）二、张量的数学表示2.1张量表示法示例三、张量的运算3.1常见张量运算四、张量在深度学习中的应用4.1PyTorch示例：张量在神经网络中的运用五、总结：张量的多维世界延伸阅读前言在机器学习、深度学习以及物理学中，张量是一个至关重要的概念。无论是在人工智能领域的神经网络中，还是在高等数学、物
后端开发实习生简历迭代的5个版本，希望能帮你找到实习今天不coding 简历实习后端 Java 大厂暑期实习
后端开发实习生简历迭代的5个版本，希望能帮你找到实习1.0研究生开学时写的第一份简历，主要是对本科做的项目的一些总结。本科主要是以深度学习的项目为主+比赛，开发的技术学的比较少，后端的项目也没有做过。但是凭此找到了一份算法的实习。当时研一还是想走算法工程师的。后面觉得自己不适合，就放弃了。2.0经历过几个月的算法实习和论文折磨之后，决定走后端开发岗了，选择Java为主语言，在B站大学做了一个项目，
【机器学习实战】Datawhale夏令营2：深度学习回顾城主_全栈开发机器学习机器学习深度学习人工智能
#DataWhale夏令营#ai夏令营文章目录1.深度学习的定义1.1深度学习＆图神经网络1.2机器学习和深度学习的关系2.深度学习的训练流程2.1数学基础2.1.1梯度下降法基本原理数学表达步骤学习率α梯度下降的变体2.1.2神经网络与矩阵网络结构表示前向传播激活函数反向传播批处理卷积操作参数更新优化算法正则化初始化2.2激活函数Sigmoid函数:Tanh函数:ReLU函数(Rectified
深度学习详解：通过案例了解机器学习基础 beist 深度学习机器学习人工智能
引言机器学习（MachineLearning，ML）和深度学习（DeepLearning，DL）是现代人工智能领域中的两个重要概念。通过让机器具备学习的能力，机器可以从数据中自动找到函数，并应用于各种任务，如语音识别、图像识别和游戏对战等。在这篇笔记中，我们将通过一个简单的案例，逐步了解机器学习的基础知识。1.1机器学习案例学习1.1.1回归问题与分类问题在机器学习中，根据所要解决的问题类型，任务
大模型量化需要重新演唱大模型量化
大模型量化是一种优化技术，旨在减少深度学习模型的内存占用和提高推理速度，同时尽量保持模型的精度。量化通过将模型中的浮点数权重和激活值转换为较低精度的表示形式来实现这一目标。以下是关于大模型量化的详细知识：目录1.量化基础1.1量化定义1.2量化优势1.3量化挑战2.量化方法2.1量化类型2.2量化粒度2.3量化算法3.量化实践3.1量化流程3.2量化工具4.量化案例4.1BERT量化4.2GPT-
pytorch 要点之雅可比向量积 AI大模型教程 pytorch 人工智能 python facebook 深度学习机器学习 webpack
自动微分是PyTorch深度学习框架的核心。既然是核心，就需要敲黑板、划重点学习。同时，带来另外一个重要的数学概念：雅可比向量积。PyTorch中的自动微分与雅可比向量积自动微分（AutomaticDifferentiation，AD）是深度学习框架中的关键技术之一，它使得模型训练变得更加简单和高效。且已知：PyTorch是一个广泛使用的深度学习框架，它内置了强大的自动微分功能。在本文中，我们将深
昇腾AI生态组件全解析：与英伟达生态的深度对比
随着人工智能技术的快速发展，国产AI芯片的崛起正在改变全球计算产业的格局。华为昇腾（Ascend）系列AI处理器凭借自主创新的达芬奇架构，构建了完整的软硬件生态体系。本文将从核心组件对比、显卡性能对标两个维度，深入剖析昇腾与英伟达（NVIDIA）生态的技术差异与适用场景。一、昇腾核心组件与英伟达对标分析1.推理引擎：MindIEvsTensorRT昇腾MindIE1.0.0基于昇腾芯片的深度学习推
智能汽车图像及视频处理方案，支持视频智能包装创作能力美摄科技汽车
在这个日新月异的智能时代，每一帧画面都承载着超越想象的力量。随着自动驾驶技术的飞速发展，智能汽车不仅成为了未来出行的代名词，更是技术与艺术完美融合的典范。在这场变革的浪潮中，美摄科技以创新为翼，推出了领先的智能汽车图像及视频处理方案，为智能汽车行业带来了前所未有的视觉盛宴，重新定义了智能出行的视觉体验。一、智能重塑，视觉新境界美摄科技的智能汽车图像及视频处理方案，是基于深度学习、人工智能及大数据处
深度学习计算机视觉开源系统OpenMMLab（mmsegmentation、mmdetection、mmpose）环境配置【详细、可运行】 nomoremorphine 深度学习计算机视觉开源
OpenMMLab（mmsegmentation、mmdetection、mmpose）环境配置OpenMMLab简介优势：一、Windows/Linux下环境配置（以mmsegmentationv1.2.2（最新版）为例）0.确认安装版本信息1）确认电脑显卡版本2）确认mmcv对应版本3）确认版本1.安装CUDA和cuDNN2.创建conda环境，下载pytorch3.安装mmcv4.安装MMS
编译OpenCV支持CUDA视频解码 AI标书 python openvc cuda nvidia docker build
如何在Ubuntu上编译OpenCV并启用CUDA视频解码支持（cudacodec）在深度学习、视频处理等高性能计算领域，OpenCV的GPU加速功能非常重要。特别是它的cudacodec模块，能直接利用NVIDIA硬件实现高效的视频解码，极大提升性能。本文将基于Ubuntu环境，详细介绍从环境准备到编译安装OpenCV，并开启cudacodec模块的全过程。完整的shell脚本以及本次编译所用到
深度学习：梯度下降法数字化与智能化人工智能深度学习深度学习梯度下降法
一、梯度的概念（1）什么是梯度梯度的本意是一个向量（矢量），表示某一函数在该点处的方向导数沿着该方向取得最大值，即函数在该点处沿着该方向（此梯度的方向）变化最快，变化率最大（为该梯度的模）。对于一个多元函数f(x1,x2,...,xn)，其梯度是一个由函数偏导数组成的向量，其梯度表示为：Gradient=(∂f/∂x1,∂f/∂x2,...,∂f/∂xn)其中，∂f/∂xi表示函数f对第i个自变量
C# vs Python：谁更适合初学者？用5个关键点教你掌握深度学习中的线性代数墨瑾轩一起学学C#【四】c#python 深度学习
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣嘿，小伙伴们！今天我们要一起探索如何使用C#来入门深度学习的世界，特别关注其中的线性代数部分。你可能会好奇：“为什么是C#而不是Python？”别急，我们会在接下来的内容中详细解释这个问题，并通过对比两种语言的特点，让你明白选择C#进行深度学习并不是一个坏主意
合规视角下银行智能客服风险防控 AI 智能服务智能客服人工智能 AIGC 数据库 chatgpt
1.AI驱动金融变革的政策与技术背景政策导向：我国《新一代人工智能发展规划》明确提出发展智能金融，要求：构建金融大数据平台，提升多媒体数据处理能力；创新智能金融产品与服务形态；推广智能客服、监控等技术应用；建立智能风控预警体系。技术支撑：云计算、大数据技术成熟为AI发展奠定了基础。深度学习算法的突破则引爆了本轮AI浪潮，显著提升了复杂任务处理精度，进而推动了计算机视觉、机器学习、自然语言处理（NL
GRU与Transformer结合：新一代序列模型 AI大模型应用工坊 gru transformer 深度学习 ai
GRU与Transformer结合：新一代序列模型关键词：GRU、Transformer、序列模型、结合、深度学习摘要：本文深入探讨了GRU与Transformer结合所形成的新一代序列模型。先介绍了GRU和Transformer各自的核心概念及工作原理，然后阐述了二者结合的原因、方式和优势。通过代码实际案例展示了如何搭建结合的模型，还探讨了其在自然语言处理、语音识别等领域的实际应用场景。最后对未
AI人工智能领域中OpenCV的深度学习融合 AI大模型应用实战人工智能 opencv 深度学习 ai
AI人工智能领域中OpenCV的深度学习融合关键词：AI人工智能、OpenCV、深度学习融合、计算机视觉、图像识别摘要：本文深入探讨了在AI人工智能领域中OpenCV与深度学习的融合。我们将先介绍OpenCV和深度学习的基本概念，再讲解它们融合的原理和方式，通过实际代码案例展示融合的具体操作，探讨其在不同场景的应用，推荐相关工具和资源，分析未来发展趋势与挑战。希望能让大家对这一融合有全面且深入的了
增强版 Kimi：AI 驱动的智能创作平台，实现一站式内容生成（图片、PPT、PDF）！每天译点晓知识 AI人工智能专栏人工智能 PPT PDF一键生成 AI 图片生成
前言基于扣子Coze零代码平台，我们从零到一轻松实现了专属Bot机器人的搭建。AI大模型（LLM）、智能体（Agent）、知识库、向量数据库、知识图谱，RAG，AGI的不同形态愈发显现，如何将其动态组合，凸显其强大爆发力！！！接下来，我们介绍通过Kimi进行功能增强？使得我们的Bot具备一键生成图片、PPT编写、PDF制作......模型配置Kimi月之暗面旗下国产大模型，以独特的长文本处理能力，
《AI办公类工具PPT系列之七——智谱清言》再见孙悟空_ 【2025 AI工具合集】人工智能 iSlide AI AI智能PPT powerpoint AI PPT PPT
一.简介官网地址为chatglm.cn智谱清言（也被称为ChatGLM）是一款基于大模型技术的人工智能产品，旨在通过其强大的自然语言处理能力，为用户提供高效、智能的交互体验。该产品不仅具备广泛的应用场景，还能够在多个领域内实现深度学习和自我优化。二.功能介绍内容创作：创意写作：帮助用户进行故事、诗歌等文学作品的创作。媒体写作：辅助撰写新闻稿、社交媒体帖子等内容。写作辅助：提供写作建议、结构安排和编
【深度学习解惑】训练RNN时如何解决梯度消失或梯度爆炸？
训练RNN时如何解决梯度消失或梯度爆炸？1.引言与背景介绍循环神经网络（RNN）是处理序列数据的核心模型，但在训练过程中面临两大挑战：梯度消失（GradientVanishing）和梯度爆炸（GradientExplosion）。梯度消失导致长距离依赖难以学习（如文本中相距50个词的关联），而梯度爆炸会造成参数剧烈震荡甚至数值溢出（NaN值）。本文系统分析问题根源并提供工程级解决方案。2.原理解释
找组织——机器学习社区、团体洞察小哥伯涵机器学习人工智能
在Github上，有一些中文社区可以看一看：prompt“如果我是个AI小白，想参加到一个组织，接收最新的AI有趣源项目、一些定期的刊物等。我应该加入哪些组织？”AI社区——深度学习社区Reddit上的MachineLearningsubreddit:https://www.reddit.com/r/MachineLearning/是一个拥有超过400,000名成员的活跃社区。在这里，您可以找到有
计算机视觉实战：OpenCV 与深度学习结合 QuantumWalker 计算机视觉 opencv 深度学习 python
```html计算机视觉实战：OpenCV与深度学习结合计算机视觉实战：OpenCV与深度学习结合在当今数字化时代，计算机视觉技术已经渗透到我们生活的方方面面。从智能手机的面部识别解锁，到自动驾驶汽车的环境感知，计算机视觉正在改变我们的世界。而在这个领域中，OpenCV和深度学习的结合，更是推动了计算机视觉技术的发展。什么是OpenCV？OpenCV（OpenSourceComputerVisio
AI 在自动驾驶路径规划中的深度强化学习优化 QuantumWalker 人工智能自动驾驶机器学习
```htmlAI在自动驾驶路径规划中的深度强化学习优化在当今快速发展的科技领域中，人工智能（AI）的应用正在不断拓展其边界。特别是在自动驾驶技术中，AI的应用已经从简单的感知和识别发展到了复杂的决策和控制阶段。其中，深度强化学习作为AI的一个重要分支，在自动驾驶路径规划中发挥着越来越重要的作用。一、深度强化学习简介深度强化学习是一种结合了深度学习和强化学习的机器学习方法。它通过让智能体在环境中进
深入理解AI人工智能深度学习的原理架构 AI学长带你学AI 人工智能深度学习 ai
深入理解AI人工智能深度学习的原理架构关键词：人工智能、深度学习、原理架构、神经网络、数学模型摘要：本文旨在深入剖析AI人工智能深度学习的原理架构。首先介绍了深度学习的背景，包括其目的、预期读者、文档结构和相关术语。接着阐述了深度学习的核心概念，如神经网络、激活函数等，并通过示意图和流程图进行直观展示。详细讲解了核心算法原理，如反向传播算法，并给出Python代码示例。同时，介绍了深度学习中的数学
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不