维客尼

基于图神经网络的知识追踪

（持续更新ing）

github源码：https://github.com/jhljx/GKT

Interaction Networks for Learning about Objects, Relations and Physics Code

Relational inductive biases, deep learning, and graph networks（关系归纳偏差，深度学习和图网络） code

Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation code

Inductive Representation Learning on Large Graphs (从大图中学习归纳表示) code

Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift

知识追踪 —— 使用图神经网络对学生知识点熟练度建模

(将学生的知识点掌握程度基于时间进行建模，用来预测学生随着时间做对练习题的概率)

1、背景介绍

2、知识追踪

3、GNN

4、基于图模型的知识追踪

4.1问题定义

4.2 解决方法

4.3 实现潜在的图结构和任意函数

4.4 同之前方法的比较

5、实验

5.1 数据集

5.2实现细节

5.3 预测性能

5.4 预测的可解释性

5.5 网络分析

6、合并Richer_GNN架构

知识追踪 —— 使用图神经网络对学生知识点熟练度建模

(将学生的知识点掌握程度基于时间进行建模，用来预测学生随着时间做对练习题的概率)

1、背景介绍

在智慧教育系统（E-learning 系统）上，学生的表现可以随着时间逐渐被预测，正确的预测能够帮助学生准确选择和现在认知水平相当的试题，这种电子学习平台可以帮助学生提高学习积极性，目前有很多知识追踪的方法，最近提出有：DKT（使用了RNN模型），这个方法证明比之前的方法都要好，从数据结构的角度来看，课程学习也可以被建模成图模型，将熟练掌握一个知识概念，所需要掌握的知识点建模成图上的点，并且这些知识点之间是互相关联的。众所周知，将关于数据的图结构性质的先验知识引入模型可以提高模型的性能和可解释性。

如：将一个知识概念拆分为三个知识点，表示为 V={v1,v2,v3}，并且掌握v1，就必须要掌握知识点v2,同时，掌握知识点v2,也必须要掌握v3 (比如要解决二元一次方程就必须会解一元一次方程，要解决一元一次方程就必须会移项)，因此结合图结构的知识点模型，可以有效地提高知识追踪模型，然而DKT并没有考虑到知识点之间地这种关系，以往基于深度学习地方法（如RNN）的体系结构，通常对序列数据表现良好，但是不能有效地处理图形结构的数据。

最近，基于图神经网络的研究兴起，虽然在这种不规则的域上操作数据，对现有的及其学习方法提出了挑战，各种泛化框架和重要操作在多个研究中也取得了比较好的结果，GNN从关系归纳偏差的角度出发，结合人类对数据本质的先验知识，提高了机器学习模型的效率，这部分，Battaglia等人认为是可解释的。GNN可以找到潜在的知识结构，但问题也在这，在知识追踪中使用图神经网络的时候，如何表示潜在知识结构是很困难的，GNN对于图形结构数据的建模具有相当大的表达能力。这篇论文，我们将其重新定义为一个GNN应用程序，并提出了一个新的模型，可以在考虑潜在知识结构的情况下预测学生知识掌握程度

在一些知识追踪的案例中，知识点之间的关系和关系的强度，没有明确的提供，对于人类专家来说，启发式和手动注释内容关系是必要的，但是需要有领域专家花费大量时间才可以完成。所以很难提前将所有的知识都进行知识点图建模，我们把这种问题定义为隐藏的图结构问题，像概念回答转移概率，另外一个解决方案是在学习图结构本身的同时优化主要任务，最近关于GNN研究中，相关的话题就是图的边（知识点关系）的学习。

这篇论文，主要提出了基于图神经网络的图知识追踪，将知识追踪重新定义为GNN中的时间序列节点级分类问题。这种构想是基于3种假设：1.课程知识被分解为指定数目的知识点 2.学生目前是有指定的知识掌握程度，设为（knowledge state）3. 课程知识被建模为一个图，这个图用来更新学生的知识点掌握程度，当学生答对/答错一道题，那么学生的认知状态受影响的不仅仅是这道题的知识点，还有这个知识点相关的其他知识点，也就是邻接点。

数据集使用的是两个开放的数学联系日志数据集的子集，对这个方法进行了实例验证，在预测性能上面，我们的模型比以往的基于深度学习的模型表现要优，这意味着我们的模型在改善学生成绩预测上面有很大的潜力。此外，通过对训练模型的预测模式的分析，可以从模型的预测中清楚地解释学生熟练程度的过程，即学生所理解的概念及其所需的时间，而以往的方法解释能力较差。这意味着我们的模型比以前的模型提供了更多可解释的预测。在假设目标课程是图结构的情况下，跟踪实际教育环境中的应用，所得结果都验证了我们的模型在提高知识的性能和适用性方面的潜力。

贡献如下：

我们证明了将图神经网络应用在知识追踪中，提高了学生学习成绩预测的性能，不需要任何附加的信息，在更加精准的内容个性化下，学生可以有效地掌握课程知识。平台可以提供更高质量的服务来维护用户的高参与度。

我们的模型提高了模型预测的可解释性。教师和学生可以更准确地识别学生的知识状态，通过理解推荐练习的原因，学生可以更积极地进行推荐练习。E-learning平台和教师可以通过分析学生的失败点来更容易地重新设计课程。

为了解决隐式图结构问题，我们提出各种实现方式，并通过实验验证其有效性。不需要专家花费大量的精力，对概念之间的关系进行的注释。教育专家可以有一个新的标准来考虑什么良好的知识结构是对课程的改进设计。

2、知识追踪

Xt 表示在时间t时刻是否正确回答一系列问题q（向量）的概率 r，yt是学生在下个时间 t+1正确回答每个练习的概率，KT是知识追踪模型。Since Piech等人第一次提出以深度学习为基础来做知识追踪，并且也证明了RNN的强大的解释能力，后续的研究都采用RNN或者其拓展知识来做知识追踪，这个模型定义了一个隐藏的状态，或者是学生当前的一个知识储备状态，并且随着学生做题的状态不断地更新，以RNN为代表地模型，定义了一个固定长度的向量X，Xt由两种离散的值0和1表示，0表示题目做错，1表示题目做对，训练目标是最小化模型下观察到的学生反应序列的负对数似然（NLL）。

3、GNN

GNN（Graph Nueral network）图神经网络是一种作用在图数据上的神经网络，虽然表示图数据很复杂，但是它的超强解释性还是吸引了很多人对此投入研究，对GNN的研究兴趣有很大一部分原因是来自CNN,CNN可以摘录多尺度局部空间特征及其组合构造表现力，从而在各种研究领域，如计算机视觉。然而，CNNs只能对常规的欧几里德数据（如图像和文本)，而现实世界中的一些应用程序生成非欧几里德数据。另一方面，GNN将这些非欧几里德数据结构视为图形，并使CNN的相同优点也能反映在这些高度多样化的数据上。巴塔利亚等人从关系归纳偏置的角度解释了GNN和CNN的这种表达能力，通过融合人类对数据本质的先验知识，提高了机器学习模型的样本效率。

在GNN的几个研究课题中，边缘特征学习是与我们工作最相关的。图形注意力网络（GATs）将多头部注意力机制应用于GNN，并在训练过程中学习边缘权值，而不需要预先定义它们。神经关系推理（NRI）利用变分自动编码器（VAE）以无监督的方式学习潜在的图结构。我们的方法假设一个课程的知识概念的潜在的图结构，并使用图形运算符来模拟学生随着时间对于知识点的熟练度变化。然而，在许多情况下，图结构本身并没有显式地提供。我们通过设计模型来解决这个问题，这些模型学习边连接本身，同时优化学生的表现，通过扩展这些边缘特征学习进行预测机制。我们请在第3.3节对此进行详细解释。

4、基于图模型的知识追踪

4.1问题定义

将一门知识建模为图，要熟练掌握这个知识，需要掌握很多子知识点，这里知识定义为 G = (V,E) , 知识点为 {v1,v2,v3....vN} ，这些子知识点之间的关系定义为边E(edge)，其中，学生当前的知识点熟练度建模为表示学生在t时刻，对于知识点v的掌握程度，并且这个掌握程度是随着时间而变化的，当学生回答了包含知识点vi的题目时候，与vi相关的,就会更新，并且与v相关的邻接知识点也会更新，Ni表示vi的所有相连的知识点

4.2 解决方法

GKT将GNN应用于知识跟踪任务，并利用知识的图结构特性。我们在图1中展示了GKT的体系结构。以下段落详细解释了这些过程。

4.2.1 聚合，首先，该模型集合了所回答的概念i及其邻近概念j∈Ni的隐藏状态和嵌入

，X表示对每一道题回答的结果的记录，是一个输入向量，是一个矩阵，嵌入了知识点的下标和的反馈，

表示每个知识点的下标，表示知识点矩阵的第K行，并且e是embeeding的大小。

4.2.2 更新。接下来将根据已经聚合的特征和知识图架构来更新整个知识的结构图

是一个多层的感知器，是一个擦除-添加门，是一个门控递归单元，表示任意函数，用来表示基于知识图谱结构将信息传送到邻接结点，我们在3.3节提出不同的实现方法。

4.2.3 预测。最后，这个模型输出的是，每个学生在下一个时间点正确回答每个知识点的预测概率。

Wout是每个节点的公共权重矩阵，bk是节点k的偏置项，是sigmoid函数，训练模型来最小化观测到的NLL的值。我们可以用边缘信息，从邻接的知识点中收集学生的知识掌握程度。我们验证了，基于目标学生知识状态来预测是更好的一种预测方式，所以我们只使用更新过的学生认知状态。

4.3 实现潜在的图结构和任意函数

GKT能够利用知识本质的图结构来进行知识追踪，但在大多数情况下，这种结构并没有给出，为了实现这种图结构和，我们介绍两种方法。

4.3.1 基于统计的方法，这种方法实现了基于一定统计量的邻接矩阵A，并且将这种方法应用到了

这里和都是多层感知机，这里介绍三种类型的图结构

（1）Dense graph 是一个紧密连接的图

（2）Transition graph 是一个转变概率矩阵，当i <> j，Ai,j = ，否则就是 0. 表示在概念i被回答后，j立马被回答的次数。

（3）DKT graph 基于被训练好的DKT模型的条件预测概率而生成的图。

GKT模型的架构，当学生回答了某一个知识点时，GKT首先聚合与其相关的知识点的特征，根据这些特征更新学生的认知状态，最后预测学生在下次正确回答这些知识点的概率。

4.3.2 基于学习的方法，在优化性能预测的同时，会同步学习到这种图结构，这里介绍三种图结构学习的方法。

（1）参数邻接矩阵（Parametric adjacency matrix PAM），简单地参数化邻接矩阵A，并且在一定条件下，用其他参数对其进行优化，比如A满足邻接矩阵，和公式2定义类似。

（2）多头机制 (Multi-head Attention MHA) ：利用多头注意力机制，依据两点之间的特征，推断两点之间关系（边）的权重。定义入下：

这里k是下标，标注是第k个head，表示从点vi到点vj的第k个head的注意力权重，fk表示第k个head的注意力权重。

（3）变量自动编码器（Variational autoencoder VAE）假设表示边类型的离散变量，并使用点的特征来进行填充，定义入下：

共有k种边类型，是从Gumbel-Softmax分布中采取的潜在变量，是第k个边类型的神经网络，VAE用来最小化NLL和在编码分布q(z|x)和先验分布p(z)中的KL散度的，使用一个边类型来展示非边类型，表示在这种类型的边上不会有任何信息会被传递，在这种非边的类型上设置高概率会导致生成稀疏图。

这种学习方法接近于基于边的特征的学习策略，MHA和VAE分别受到了GAT和NRI的启发，然而，我们是基于两种方法来修改的，首先，我们根据静态特征而不是动态特征计算边缘权值，如概念和响应的嵌入。这使得知识图的结构不会随着学生和时间而改变，考虑到知识追踪的实质，这种方式是更好的。然后，依据VAE的说法，我们限制了每一个时刻里面的与答案相关的边类型的推测，这符合知识追踪的状况，学生在每一个时间段里面只需要回答一小部分的概念，这也使得计算成本从原始NRI的降低到O(KN)。

我们会在5.1节讨论这三种方法的不同点

4.4 同之前方法的比较

可以从两个方面来进行比较，如图2

一个比较的点，是对学生当前认知水平的定义，在DKT中，表示单个隐藏的向量，并且每个知识状态都是相关的，但是，对每个概念的知识状态进行建模会变得复杂,导致长时间序列的性能下降，预测学生对于每一个知识点熟练度的可解释性变差，为了解决这些缺点，有人提出了动态键值记忆网络（Dynamic Key-Value memory network DKVMN）DKVMN使用了两种记忆矩阵，一种矩阵看作学生当前认知状态的栈，分别定义每个知识点，虽然这和GKT的概念差不多，但还是有些许差别，GKT是直接对每个知识点进行建模，而DKVMN则是定义了低维的潜在向量，再对它们的知识状态建模。

另一个方面是指知识状态更新过程中概念之间的相互作用。在DKVMN中，使用简单的点积注意机制计算原始输入概念和潜在概念之间的关系权重，这可能不足以建模知识概念之间的复杂和多重关系。同时，GKT利用K个不同神经网络对K个边缘类型的输入概念之间的关系权值或边缘权值进行建模。这可以对概念之间的多个复杂关系进行建模。

5、实验

5.1 数据集

这个实验我们使用了两个开放的学生数学练习日志数据集：在线教育服务ASSISTments的数据和KDDCU的用于教育数据挖掘挑战的数据。我们提供了表1中现有概念标签的示例。

使用某些条件对于数据进行预处理，对于ASSISTments数据集，将同时回答的日志组合成为一个，随后提取与命名概念标记关联的日志，最后提取回答了至少有10次的日志。对于KDDCup数据集，我们将问题和步骤的结合视为一个答案，然后抽取与概念标签相关的日志，最后抽取回答了至少有10次的日志。

将同步答案日志合并到一个集合中，可以防止不公平的高预测性能，因为频繁出现的标记，不包括概念***，每个概念标记的相应次数对日志进行阙值化，可以确保足够数量的日志来消除噪声。利用上述条件对数据集进行处理，最终在ASSISTments中获得了62，955条日志记录，包括1000个学生和101个知识点，在KDDCup数据集中获得了1000个学生和211个知识点。

5.2实现细节

每个数据集，都将学生的数据分成：训练、验证、测试三大块，所占比例分别为8：1：1，使用训练数据集来进行训练，用验证数据集来调整超参数。

DKT：根据Piech等人的研究，使用循环神经网络中的GRU来寻找超参数，隐藏层的大小为200，使用dropout为0.5的速率进行减枝，将变成，批大小为32，使用Adam为优化器，学习速率为0.001

DKVMN：根据Zhang等人的研究，对ASSISTments数据集，内存槽的大小为20，隐藏向量的大小为32；对KDDCup数据集，内存槽的的大小为50，隐藏向量的大小为128；批大小为32，使用Adam为优化器，学习速率为0.001

GKT：所有的隐藏向量和嵌入层矩阵的大小为32，对于模型中的MLP，将隐藏向量的dropout下降为

5.3 预测性能

5.4 预测的可解释性

接下来，将GKT预测学生认知状态的过程进行可视化，并且评估模型预测的可解释性。可视化帮助学生以及老师发现过去的知识掌握情况，高效且直观，这是非常有必要的。

我们从两个角度来评估模型的可解释性。1、根据学生已经回答过的知识点，更新相关知识点的掌握情况 2、被更新的部分是根据知识点的结构图来调整的

以下步骤是分析整个知识点状态的变化过程

（1）在时间T之前，随机抽取学生的做题情况

（2）在训练模型的输出层，移除掉偏差向量。

（3）将学生的回答向量输入到训练模型，并将输出向量进行叠加

（4）将输出值进行正则化，结果控制在0到1之间

在图3a和图3b中，我们随机抽取了一名学生的做题日志，并以图的形式描绘了学生的知识状态，x轴表示时间，Y轴表示知识点，格子颜色表示学生知识点掌握的变化情况，红格子表示掌握程度降低，绿色表示掌握情况增加。

图3a表示GKT会更具知识点的相关性来更新学生的知识点掌握情况，而DKT依据模糊的依据将所有状态进行更新，在图3b中，能看到时间点28和75的时候，虽然知识点29没有被回答，但是因为和4有关，4有被回答，所以29的状态也被更新了。这表明GKT可以对学生的知识点掌握情况提供更明确和合理的解释。

5.5 网络分析

最后，从被训练的GKT模型中抽象出已经学习到的图结构，进行分析。在基于学习的方法中，GKT学习有助于预测学生表现的图形结构。因此，从模型中提取的图显示了较高的预测性能，可以提供对良好知识结构的洞察。图中描述了网络，其中左侧显示网络概述，右侧显示图形的本地连接。节点的颜色是从蓝色到红色的，在那里，一个练习的答案越早，蓝色的是阴影。节点的大小与它们的出度成正比，这意味着更大的节点会影响更多的节点。首先，在用于比较的可视化DKT图中，类似颜色的节点相互连接，从而生成集群。当DKT用相同的单个隐藏向量对所有概念的隐藏状态进行建模时，对概念之间的存在长期依赖的建模是困难的。因此，该模型倾向于学习以时间接近的顺序回答的节点之间的依赖关系。从PAM中提取的图形表现出类似于DKT图的结构，其中构造了簇；从图形的右上角，我们可以看到一些几何概念是连接的。从MHA 中提取的图显示了来自某些节点的几个即将到来的边缘。虽然模型可能已经了解了不同于其他图中概念之间的一些特殊依赖关系，但它的预测可能是有偏差的。因此，我们必须评估这种结构对预测性能的影响。从VAE中提取的图与其他图不同，因为它形成了一个密集的图，其中几个节点相互连接。虽然这些联系很多都很难解释，但从图的右下角，我们可以识别一些统计概念是连接的。

6、合并Richer_GNN架构

我们提出了第一种基于GNN的知识跟踪方法，并验证了相对简单的体系结构。在下面，我们讨论了三个方向来改进我们的模型。一种是根据节点的边缘类型对节点之间的信息传播施加适当的约束。在本研究中，为了进行公平的比较，我们为基于统计的方法和基于学习的方法定义了两种类型的边缘。然而，我们没有对每个节点类型施加任何约束；因此，对每个节点类型（如依赖方向和因果关系）的意义可能很小，特别是对于学习的边缘。解决办法是根据节点的边缘类型对节点之间的信息传播施加一些约束例如定义边缘的方向，并将传播限制在从源节点到目标节点的一个方向上。此外，这可以作为关系归纳偏差，提高GKT的样本效率和可解释性。另一个是将所有概念(如DKT)所共有的隐藏状态合并到GKT中。虽然只采用单个隐藏向量来表示学生知识状态，使DKT中概念之间复杂交互的建模复杂化，但将这种类型的表示添加到GKT中可以通过充当全局特征来提高性能。全局特征意味着每个节点的共同特征，并且可以表示跨变量概念或学生原始概念的共同知识状态智力对个体概念理解的不变。最后一个可能的解决方案是实现多跳传播。在本研究中，我们将传播限制在单个跳，即响应某个节点的信息只在一个时间步长传播到其相邻节点。然而，要有效地模拟人类的学习机制，使用多跳将更合适。此外，这可以使模型能够学习稀疏连接，因为模型可以将特征传播到远程节点，而不连接到其他节点。

深度学习的黑盒问题被人诟病已久，图神经网络的信息传播机制相较传统深度学习模型更具有可解释性。知识图谱提供了现实世界的事实知识，利用图神经网络模型尤其是概率图神经网络应用在知识图谱中实现逻辑推理，从而显式地生成基于知识图谱的推理路径，或许可以期待打开深度学习的黑盒。　

论文学习11：Boundary-Guided Camouflaged Object Detection zl29 学习目标检测人工智能
代码来源GitHub-thograce/BGNet:Boundary-GuidedCamouflagedObjectDetection模块作用BGNet利用额外的目标相关边缘语义信息来引导COD任务的特征学习，从而强制模型生成能够突出目标结构的特征。这一机制有助于提高目标边界的精准定位，从而提升伪装目标的检测性能。模块结构BGNet的架构基于Res2Net-50，编码器提取多级特征，解码器通过EA
论文学习：基于机器学习的光声图像分析1 superace7911 基于机器学习的光声图像处理机器学习人工智能图像处理
3/25——3/31期间论文学习笔记，关于基于机器学习的光声图像分析的6篇1区论文血管结构模拟&分割：Quantificationofvascularnetworksinphotoacousticmesoscopy链接数据集链接摘要这篇论文提出了一种新的方法，利用中观光声成像（MesoscopicPhotoacousticImaging,PAI）技术和高级图像分析技术，来非侵入性地定量化和分析活体
GAN开山之作--Generative Adversarial Nets 星空彡深度学习机器学习神经网络
GAN开山之作–GenerativeAdversarialNets最近对GAN比较有兴趣，所以开个坑记录一下读论文学习的知识。这是本专栏的第一篇论文，所以笔者认为解析GAN的开山之作——GenerativeAdversarialNets[1]是非常有必要的。有关数学推导部分本文借鉴了深度之眼的b站发布的视频[2]。本文并不是逐字翻译，主要是写笔者对这篇论文的见解思考，其中难免会有错的地方，欢迎讨论
论文学习3：深度学习增强的光声成像（PAI）的最新进展（综述） superace7911 基于机器学习的光声图像处理机器学习图像处理
原文链接有空可以细看，这里中列出了文中提到的部分研究结果写作大纲1.引言光声成像（PAI）的介绍，它结合了光学和超声成像的优点，为生物医学成像提供了一种有前景的模态。深度学习（DL）在解决PAI中存在的技术限制（如硬件限制、生物特征信息缺乏等）方面的潜力。2.DL方法的原理介绍DL的子集：监督学习、无监督学习和强化学习。详细说明代表性DL架构：卷积神经网络（CNN）、U-形神经网络（U-Net）和
论文学习笔记 VMamba: Visual State Space Model Wils0nEdwards 学习笔记
概览这篇论文的动机源于在计算机视觉领域设计计算高效的网络架构的持续需求。当前的视觉模型如卷积神经网络（CNNs）和视觉Transformer（ViTs）在处理大规模视觉任务时展现出良好的表现，但都存在各自的局限性。特别是，ViTs尽管在处理大规模数据上具有优势，但其自注意力机制的二次复杂度对高分辨率图像处理时的计算成本极高。因此，研究者希望通过引入新的架构来降低这种复杂度，并提高视觉任务的效率。现
论文学习1----理解深度学习需要重新思考泛化Understanding deep learning requires rethinking generalization 夏洛的网机器学习深度学习论文深度学习神经网络
——论文地址：Understandingdeeplearningrequiresrethinkinggeneralization1、有关新闻1.1新闻一：参考1：机器之心尽管深度人工神经网络规模庞大，但它们的训练表现和测试表现之间可以表现出非常小的差异。传统的思考是将小的泛化误差要么归结为模型族的特性，要么就认为与训练过程中的正则化技术有关。通过广泛的系统性实验，我们表明这些传统的方法并不能解释大
半监督语义分割论文学习记录西瓜真的很皮啊半监督语义分割深度学习机器学习人工智能
Semi-SupervisedSemanticSegmentationwithCross-ConsistencyTraining1.1motivation一致性训练的目的是在应用于输入的小扰动上增强模型预测的不变性。因此，学习的模型将对这样的小变化具有鲁棒性。一致性训练的有效性在很大程度上取决于数据分布的行为，即集群假设，其中类必须由低密度区域分隔。在语义分割中，在输入中，我们没有观察到低密度区域
2019-1-27晨间日记紫薇忘了水葫芦
在柳州的第二天起床：八点半左右天气：晴心情：好像很复杂，一会儿开心一会儿不开心纪念日：参加了晗大姐的婚礼任务清单昨日完成的任务，最重要的三件事：⒈把之前的论文题目整理了一遍⒉参加了婚礼⒊送了礼物改进：要静下来多看些书做些运动，多思考。习惯养成：早睡早起，饮食清淡周目标·完成进度开始读论文学习·信息·阅读阅读健康·饮食·锻炼饮食清淡，多锻炼人际·家人·朋友多联系工作·思考怎么把自己的工作做得更好最美
语义分割系列之FCN、DeeplabV1、V2、V3、V3Plus论文学习 Diros1g 学习深度学习计算机视觉
FCNFullyConvolutionalNetworks论文：FullyConvolutionalNetworksforSemanticSegmentation地址:https://openaccess.thecvf.com/content_cvpr_2015/papers/Long_Fully_Convolutional_Networks_2015_CVPR_paper.pdf特点：用全卷积替
论文学习笔记 POSEIDON: Privacy-Preserving Federated Neural Network Learning JiangChSo 论文学习深度学习机器学习神经网络算法分布式
论文学习笔记POSEIDON:Privacy-PreservingFederatedNeuralNetworkLearningNDSS2021录用文章目录论文学习笔记POSEIDON:Privacy-PreservingFederatedNeuralNetworkLearning一、机器学习1.机器学习(ML)中的挑战2.隐私保护机器学习(PPML)二、POSEIDON方案1.系统和威胁模型2.方
论文学习——Vector Quantized Diffusion Model for Text-to-Image Synthesis 客院载论音频生成学习
文章目录引言正文Abstract文章的核心VQ潜在空间适合文本转图片生成VQDiffusion的比起自回归和GAN的其他模型的成果IntroductionNLP的成功给图片生成的启发自回归模型的单向误差解释预测误差累积VQDiffusion能够解决预测误差累计和单向误差两个问题解决单向误差的方式——每一次预测都是考虑所有token的上下文信息解决错误累积的方式——使用基于掩码和替换的扩散策略模型测
Python论文学习 -- 第二章 --- Python基础知识 Metallic Cat 学习
1.cmd命令器中如果想终止命令的话可以在终止行输入exit()函数调用停止命令一.字面量二.注释---对代码进行解释说明1.在print函数中：print(a,"asd",c)输出的结果为a变量对应的值+asd+c变量对应的值如：则输出的结果为：往type()函数中输入数据，它会返回数据的类型给我们，然后我们可以用print()函数将数据类型打出来1.值得注意的是变量本身是没有类型的，它只是一个
论文学习笔记：PoseFix: Model-agnostic General Human Pose Refinement Network wangyc1208 姿态估计
论文：https://arxiv.org/abs/1812.03595代码：https://github.com/mks0601/PoseFix_RELEASE—————————————————————————————————————————————————目标：多人姿态估计：本篇论文主要工作是利用一个人体姿势优化网络，从输入图像和姿势中对人体姿态进行优化。大概的效果如下图：———————————
2021-9-23晨间日记言二yaner
今天是什么日子起床：7：40就寝：23：00天气：美好心情：美好纪念日：无任务清单昨日完成的任务，最重要的三件事：投稿改进：想到就做到习惯养成：专注自己，提升自己周目标·完成进度准备再写一篇论文学习·信息·阅读多阅读，多学习健康·饮食·锻炼早饭：小米粥，鸡蛋，烧麦中饭：真味卤，杨枝甘露晚饭：黑米粥锻炼：一小时左右人际·家人·朋友一切都是最好的安排，虽然没有过去，但也有属于自己的收获工作·思考凡事早
论文学习记录之Deep-learning seismic full-waveform inversion for realistic structuralmodels 摘星星的屋顶论文深度学习人工智能
一、ABSTRACT—摘要标题：Deep-learningseismicfull-waveforminversionforrealisticstructuralmodels（用于真实结构模型的深度学习地震全波形反演）作者：BinLiu1,SenlinYang2,YuxiaoRen2,XinjiXu3,PengJiang2,andYangkangChen4（和SeisInvNet有共同作者，应该是同
论文学习记录之SeisInvNet（Deep-Learning Inversion of Seismic Data）摘星星的屋顶论文人工智能
目录1INTRODUCTION—介绍2RELATEDWORKS—相关作品3METHODOLOGYANDIMPLEMENTATION—方法和执行3.1方法3.2执行4EXPERIMENTS—实验4.1数据集准备4.2实验设置4.3基线模型4.4定向比较4.5定量比较4.6机理研究5CONCLUSION—结论1INTRODUCTION—介绍地震勘探是根据地震波在大地中的传播规律来确定地下地层结构的一种
基于变长频带选择的JPEG图像可逆数据隐藏-文献学习凌峰的博客学习算法计算机视觉
论文学习原文题目：ReversibleDataHidingofJPEGImageBasedonAdaptiveFrequencyBandLength发表期刊：TCSVT2023（中科院1区）作者：NingxiongMao,HongjieHe,FanChen,YuanYuan,LingfengQu摘要JPEG图像在互联网上被广泛使用。基于quantifieddiscretecosinetransfo
BASNet：Boundary-aware salient object detection Kun Li 应用算法目标检测计算机视觉
CVPR2019开源论文|BASNet：关注边界的显著性检测本文提出一种基于深度监督学习的前景提取构架BASNet，其在边缘感知上有优异的表现。https://mp.weixin.qq.com/s/fjq4UyDMN9Z9lvNZ7aNLWABASNet:Boundary-AwareSalientObjectDetection论文学习_basnet:boundary-awaresalientobj
Nerf-Wild神经辐射场论文学习笔记 Neural Radiance Fields for Unconstrained Photo Collections 出门吃三碗饭 Nerf学习记录三维重建学习笔记
前言：本文为记录自己在Nerf学习道路的一些笔记，包括对论文以及其代码的思考内容。公众号：AI知识物语B站后续同步更新讲解本篇文章主要针对其数学公式来学习其内容，欢迎批评指正！！！（代码下篇出）1：摘要提出基于学习（learning-based）方法，使用野外照片的非结构化集合（unstructuredcollectionsofin-the-wildphotographs）来合成复杂场景。之前的N
GroupMixFormer：Advancing Vision Transformers with Group-Mix Attention论文学习笔记 athrunsunny Transformer 学习笔记深度学习计算机视觉 transformer
论文地址：https://arxiv.org/pdf/2311.15157.pdf代码地址：https://github.com/AILab-CVC/GroupMixFormer摘要：ViT已被证明可以通过使用多头自注意力（MHSA）对远程依赖关系进行建模来增强视觉识别，这通常被表述为Query-Key-Value计算。但是，从“Query”和“Key”生成的注意力图仅捕获单个粒度的token-t
论文学习——基于查询的workload预测（CMU） _zhj 机器学习数据库
一、简介论文题目：Query-basedWorkloadForecastingforSelf-DrivingDatabaseManagementSystems发表在2018SIGMOD，来自cmu的数据库组（这个组真的很厉害）这篇论文主要讲数据库workload预测的问题。因为要实现数据库self-driving（如选择合适的时机在合适的列上自动创建索引），应该根据将要到来的查询对数据库进行优化，
第六十八周周报童、一周报深度学习
学习目标：项目论文学习时间：2023.12.23-2023.12.29学习产出：一、项目这周后两天在根据吉安方面的需求优化SQL，提升性能二、论文这周周六在杨老师的带领下仔细改了论文前两段，后面几天自己把剩下的改完了，目前还在给杨老师看。实验方面，由于LSUN一直跑不出好的效果，已经转为STL10和CelebA，预计得下周才能出结果。其他时间都在搞开题报告的东西。
DN-DETR论文学习彭祥. DETR系列学习深度学习计算机视觉
摘要本文提出了一种新颖的去噪训练方法，以加快DETR（DEtectionTRansformer）训练，并加深了对类DETR方法的慢收敛问题的理解。我们表明，缓慢收敛是由于二分图匹配的不稳定性导致早期训练阶段的优化目标不一致。为了解决这个问题，除了匈牙利损失之外，我们的方法还向Transformer解码器馈送了带有噪声的GT边界框，并训练模型重建原始框，从而有效地降低了二分图匹配难度，并加快了收敛速
MS-DETR: Efficient DETR Training with Mixed Supervision论文学习笔记 athrunsunny Transformer 学习笔记 transformer 深度学习算法
论文地址：https://arxiv.org/pdf/2401.03989.pdf代码地址（中稿后开源）：GitHub-Atten4Vis/MS-DETR:Theofficialimplementationfor"MS-DETR:EfficientDETRTrainingwithMixedSupervision"摘要DETR通过迭代生成多个基于图像特征的目标候选者，并为每个真实目标分配一个候选者，
经典论文学习：Attention Is All You Need（Transformer）才能我浪费 AI应用深度学习机器学习人工智能
1，概述《AttentionIsAllYouNeed》是一篇由GoogleDeepMind团队在2017年发表的论文，该论文提出了一种新的神经网络模型，称为Transformer模型，用于自然语言处理任务。该模型的创新点在于使用了一种称为“自注意力机制（self-attentionmechanism）”的技术，以取代传统的循环神经网络（RNN）和卷积神经网络（CNN）等结构，这使得模型在处理序列数
2022-6-17晨间日记七翎
今天是什么日子起床：7.30(因为今天考科四，好困啊！！！)就寝：科四成功考过，熬个小夜(嘻嘻)天气：昨天下雨了，今天超凉快！心情：开心更多一点纪念日：纪念我拿上驾照的日子任务清单昨日完成的任务，最重要的三件事：刷完10套科四卷子✔习惯养成：早睡早起(尽量吧)周目标·完成进度1.完成编程课程2.看完导师论文学习·信息·阅读看了网文(嘻嘻)放纵一下健康·饮食·锻炼吃了很多不健康的食物，但很快乐！人际
ChatGPT可以帮你做什么？ SiKi学院 chatgpt 人工智能
学习利用ChatGPT学习有很多，比如：语言学习、编程学习、论文学习拆解、推荐学习资源等，使用方法大同小异，这里以语言学习为例。在开始前先给GPT充分的信息：（举例）【角色】充当一名有丰富经验的英语老师【背景】我是一名英语雅思备考的学生，想进行英语相关学习（这里最好说明是帮助你做什么练习，如口语）【任务】你要和我进行对话，根据我输入的内容，去进行讲解和说明【要求】我希望你首先可以列举出雅思备
【论文学习】SOLVING INVERSE PROBLEMS IN MEDICAL IMAGING WITH SCORE-BASED GENERATIVE MODELS Lyrig~ 神经网络图像修复（Image Restoration）学习机器学习算法
【论文学习】SOLVINGINVERSEPROBLEMSINMEDICALIMAGINGWITHSCORE-BASEDGENERATIVEMODELS前言相关概念线性逆问题基于分数的生成模型扰动过程逆过程采样利用基于分数的生成模型求解逆问题一种简便的线性测量过程形式将给定的观测结果融合进无条件采样过程前言好不容易写完了这么长的一篇，整体看来，这篇文章更像是对去噪过程的一个改进。通过在不同时间步引入
论文学习使用基于NeRF的精炼特征从3D感知Diffusion模型下实现单视点下的人工重建 Lyrig~ 学习 3d 人工智能
论文学习使用基于NeRF的精炼特征从3D感知Diffusion模型下实现单视点下的人工重建论文连接前言摘要介绍相关工作2.13D生成的扩散模型2.2单视点下的新视点生成神经场（NeRF）以外的方法基于神经场（NeRF）的方法背景3.1图片条件NeRF3.2无几何视图合成NerfDiff论文连接NerfDiff:Single-imageViewSynthesiswithNeRF-guidedDist
【论文学习】InstructGPT：Training language models to follow instructions with human feedback Shackles Lay 学习语言模型自然语言处理
前言：语言模型的输出依赖于预训练的数据集，研究者想要探索无监督领域的模型，使其仅仅依赖无标签的数据就可以实现不错的效果，为了让模型的泛化性能尽可能的强，研究者会提供尽可能大的数据集。但这样的训练方法存在两个问题：一、有效性。模型的性能依赖于训练时使用的文本，但是研究者并不知道无标签的大批量的数据集是否可以使模型学习到解决指定任务的能力，可能对于特定领域来说，模型根本没见过这样的数据；二、安全性，模
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement

基于图神经网络的知识追踪

知识追踪 —— 使用图神经网络对学生知识点熟练度建模

(将学生的知识点掌握程度基于时间进行建模，用来预测学生随着时间做对练习题的概率)

1、背景介绍

2、知识追踪

3、GNN

4、基于图模型的知识追踪

4.1问题定义

4.2 解决方法

4.3 实现潜在的图结构和任意函数

4.4 同之前方法的比较

5、实验

5.1 数据集

5.2实现细节

5.3 预测性能

5.4 预测的可解释性

5.5 网络分析

6、合并Richer_GNN架构

你可能感兴趣的:(论文学习)