sereasuesue

Improving Knowledge Tracing via Pre-training Question Embeddings

论文：Improving Knowledge Tracing via Pre-training Question Embeddings | IJCAI

代码：https://github.com/lyf-1/PEBG

人工智能大会 IJCAI

摘要

知识追踪(KT)定义的任务是根据学生的历史反应预测学生是否能正确回答问题。尽管许多研究致力于开发问题信息，但问题和技能中丰富的高级信息没有被很好地提取出来，使得先前的工作难以充分执行。在本文中，我们证明了通过在丰富的边信息上对每个问题进行预训练嵌入，然后在所获得的嵌入上训练深度KT模型，可以在KT上实现大的增益。具体来说，边信息包括问题难度和包含在问题和技能之间的二分图中的三种关系。为了预训练问题嵌入，我们建议使用基于产品的神经网络来恢复边信息。因此，在现有深度KT模型中采用预包含嵌入，在三个常见的KT数据集上显著优于最先进的基线。

背景

虽然已有发深度的KT模型很好地预测学生的技能水平，但是存在一个主要的限制，即没有考虑特定问题的信息

具有相同技能的问题可能会有不同的难度，因此技能水平预测不能准确反映学生对特定问题的知识状态。虽然利用特定问题的信息在更细粒度的层次上解决KT是非常必要的，但是存在一个主要问题，即学生和问题之间的交互极其稀疏，如果直接使用问题作为网络输入，将导致灾难性的失误

本文提出了一种预训练方法，称为二分图预训练嵌入法(PEBG)，利用所有有用的边信息学习每个问题的低维嵌入。具体来说，辅助信息包括问题难度以及三种关系:显性问题技能关系、隐性问题相似性和技能相似性。为了有效地提取边信息中包含的知识，我们采用产品层融合问题顶点特征、技能顶点特征和属性特征来产生最终的问题嵌入。这样，学习的问题嵌入将保留问题难度信息以及问题和技能之间的关系。

本文的贡献总结如下。

第一个使用问题技能关系的二分图来获得问题嵌入的，它提供了丰富的关系信息。
我们提出了一种称为PEBG的预训练方法，它引入了一个产品层来融合所有的输入特征，以获得最终的问题嵌入。
PEBG得到的问题嵌入可以整合到现有的深度KT模型中。在三个真实数据集上的实验结果表明，使用PEBG可以优于最先进的模型，平均提高AUC 8.6%

问题表示

表示学生的过去学习交互

让成为所有不同问题的集合，让成为所有不同技能的集合。通常一个技能包含很多问题，一个问题和几个技能有关。所以问题-技能关系自然可以表示为二部图G = (Q，S，R)，其中R =[rij]∞{ 0，1}|Q|×|S|是二元邻接矩阵。如果问题qi和技能sj之间有边，那么rij = 1；否则rij = 0.这里我们介绍我们将用来训练模型中嵌入的信息，包括图中的信息和难度信息。

定义1(明确的问题-技能关系)。给定问题技能二部图，技能顶点和问题顶点之间的关系是显式问题技能关系，即问题顶点I和技能顶点j之间的显式关系取决于rij是否=1。

定义2(隐性问题相似性和技能相似性)。给定问题技能二部图，两个具有公共邻居问题顶点的技能顶点之间的关系被定义为技能相似性。同样，问题相似性是指共享共同邻居技能顶点的两个问题顶点之间的关系。

定义3(问题难度)。一个问题qi的问题难度di被定义为从训练数据集计算的正确回答的比率。所有的题难点形成一个向量d = [di] ∈ R|Q|。

模型

输入特征

为了预先训练问题嵌入，我们使用了如下三种特征。需要注意的是，顶点特征是随机初始化的，将在预处理阶段进行更新，这相当于学习从一次编码到连续特征的线性映射。

技能顶点特征：由特征矩阵 $S \epsilon R^{\left |S \right |Xdv}$ 表示，其中dv是特征的维数。对于一个技能si，顶点特征表示为si，是矩阵s的第I行。

问题顶点特征用特征矩阵 $Q \epsilon R^{\left |S \right |Xd{_{v}}}$ 表示，特征矩阵与技能顶点特征具有相同的维数dv。对于一个问题qj，顶点特征表示为qj，是矩阵q的第j行。

属性特征:是与问题难度相关的特征，如平均反应时间、问题类型等。对于问题 $q{_{i}}$ ，我们将特征连接为是特征的数量 $f{_{i}}=[f{_{i1}};\cdots;f{_{m}} ]$ 。如果第j个特征是分类的(例如，。问题类型)。如果第j个特征是数字的(例如,平均响应时间)。

二部图约束

技能和问题顶点特征通过二分图约束进行更新。由于图中存在不同的关系，我们设计了不同类型的约束，以便顶点特征可以保留这些关系。

显性问题-技能关系

在问题技能二部图中，问题顶点和技能顶点之间存在边，这是一个明确的信号。类似于LINE中的一阶近似模型[唐等，。2015]中，我们通过考虑技能和问题顶点之间的局部邻近性来建模显式关系。具体来说，我们使用内积来估计嵌入空间中问题和技能顶点之间的局部接近度，

其中σ(x)是sigmoid函数，它将关系值转换为概率。

为了保持显式关系，通过交叉熵损失函数，局部邻近性被强制接近二分图中的技能问题关系:

隐含的相似性

PEBG中使用的隐含相似性表示二分图中邻域之间的相似性。具体来说，存在两种相似性:技能相似性和问题相似性。我们希望使用隐含的相似性来同时更新顶点特征

难度约束

问题的难度信息在KT预测中很重要，但是它不包含在二分图中。因此，我们希望最终的问题嵌入能够恢复难度信息。[Vie和Kashima，2019]使用因式分解机器[Rendle，2010]对边信息进行编码，探索学生建模的特征交互。在本文中，我们使用属性特征与顶点特征的交互来学习高质量的嵌入。特别是受[屈等，。2016]，产品层用于学习高阶特征交互。

对于一个问题q(为了清楚起见省略了它的下标)，我们有它的问题顶点特征q和它的属性特征f。为了通过产品层使属性特征与顶点特征相互作用，我们首先使用由wa参数化的线性层将属性特征f映射到低维特征表示，该低维特征表示被表示为 $a\epsilon R^{dv}$ 。假设与q相关的技能集合，我们使用C中所有技能顶点特征的平均表示作为q的相关技能特征，表示为s,数学上

我们使用顶点特征q、平均技能特征s0和属性特征a来生成问题q的线性信息Z和二次信息P。具体来说，

然后我们引入一个乘积层，它可以将这两个信息矩阵转换成信号向量lz和lp，如图2所示。转换方程如下

……

实验

在这一部分，我们通过实验来评估基于问题嵌入的知识追踪模型的性能。

数据集

我们使用三个真实世界的数据集，这三个数据集的统计数据如表1所示

ASSIST09和ASSIST12都来自助教在线辅导平台[冯等人。2009]. 对于这两个数据集，我们在没有技能和支架问题的情况下移除记录。我们还删除少于三条记录的用户。经过预处理，ASSIST09数据集由123项技能、3841名学生回答的15911个问题组成，总共有190320条记录。ASSIST12数据集包含265项技能，27，405名学生回答了47，104个问题，记录为1，867，167条。

EdNet是由[Choi等人。2019]. 在本实验中，我们使用了由学生问题解决日志组成的EdNet-KT1数据集，并随机抽取了5000名学生的222，141条记录，其中包含13，169个问题和188项技能。

1. 比较模型

为了说明我们的模型的有效性，并展示我们的模型对现有深度KT模型的改进，我们比较了最先进的深度KT模型之间的预测性能。我们将比较模型分为技能级模型和问题级模型。

技能水平模型

技能水平模型只使用技能嵌入作为输入，它们都跟踪学生对技能的掌握。

BKT [Corbett and Anderson，1994]是一个二态动态贝叶斯网络，由初始知识、学习率、滑动和猜测参数定义。
DKT[皮赫等人。2015]使用递归神经网络对学生技能学习进行建模。
DKVMN[张等。2017]使用键值存储网络来存储技能的基本概念表示和状态。

问题级模型

除了技能级模型，以下模型利用问题信息进行问题级预测。

KTM [Vie and Kashima，2019]利用因式分解机器进行预测，让学生id、技能id、问题特征相互作用。
DKT-Q是我们对DKT模型的扩展，该模型直接使用问题作为DKT的输入，并预测学生对每个问题的反应。
dkwmn-Q是我们对dkwmn模型的扩展，直接使用问题作为dkwmn的输入，预测学生对每个问题的反应。
DHKT是DKT的扩展模型，它模拟技能-问题关系，还可以预测学生对每个问题的反应。

我们基于技能级深度学习模型来测试我们的模型。PEBG+DKT和PEBG+dkwmn利用PEBG预先训练的问题嵌入，使DKT和dkwmn实现问题级预测。

实施细节

为了评估每个数据集的性能，我们使用曲线下面积作为评估指标。

PEBG只有几个超参数。顶点特征dv的尺寸设置为64.最后一个问题嵌入维数d = 128.方程中的λ。(17)为0.5.我们使用亚当算法来优化我们的模型，三个数据集的小批量设置为256，学习率为0.001.我们还使用概率为0.5的辍学来减轻过度适应。我们将每个数据集分为80%用于训练和验证，20%用于测试。对于每个数据集，训练过程重复五次，我们报告平均测试AUC。

对于ASSIST09和ASSIST12数据集，平均响应时间和问题类型用作属性特征。对于EdNet数据集，平均响应时间被用作属性特征。

性能预测

表2说明了所有比较模型的预测性能，我们发现如下几个观察结果。

所提出的PEBG+DKT和PEBG+DKVMN模型在所有三个数据集上都获得了最高的AUC。特别是在ASSIST09数据集上，我们的PEBG+DKT和PEBG+DKVMN型号的AUC为0.8287，并且0.8299，与DKT和德国KVMN实现的0.7356和0.7394相比，平均显著提高了9.18%。在ASSIST12数据集上，结果显示平均增加了8%，PEBG+DKT的AUC为0.7665，PEBG+dkwmn的AUC为0.7701，而DKT的AUC为0.7013，dkwmn为0.6752。在EdNet数据集上，PEBG+DKT和PEBG+dkwmn比最初的DKT和dkwmn平均提高了8.6%。

在所有比较的模型中，BKT的表现最差。DKT、德国KVMN和KTM的表现相似。通过比较DKT和DKT-Q、dkwmn和dkwmn-Q的性能，我们发现DKT-Q和dkwmn-Q没有表现出优势，这表明直接将现有的深度KT模型应用于问题级预测会遇到问题交互稀疏问题。还有我们的PEBG、即使在稀疏数据集上，模型也能很好地改善DKT和DKVMN。尽管DHKT的表现优于DKT，但它的表现仍然不如我们提出的模型，这说明了PEBG在利用技能和问题之间更复杂的关系方面的有效性。

消融研究

在这一部分，我们进行了一些消融研究，以调查我们提出的模型的三个重要组成部分的有效性:(1)显式关系；(2)隐性相似性；(3)产品层。我们设置了四个比较设置，它们的性能如表3所示.下面列出了四种设置的详细信息:

RER(删除显式关系)不考虑问题和技能之间的显式关系，即。从方程中移除L1。(17).
RIS(消除隐含相似性)不考虑问题和技能之间的隐含相似性，即。从方程中删除L2和L3。(17).
RPL(移除产品层)直接连接q、s0和a作为预训练的问题嵌入，而不是使用产品层。
RPF(用全连接层替换产品层)将q、s0和a连接起来作为全连接层而不是产品层的输入。

除了上面提到的变化，模型的其他部分和实验设置保持不变。

从表3中我们可以发现(1) PEBG+DKT和PEBG+dkwmn表现最好，表明了模型不同组成部分的功效。(2)当去除显性关系和隐性相似性时，模型显示出相似的下降程度，这意味着这两条信息同等重要。(3)去掉产品层对性能伤害很大，使用全连接层也有较低的性能。通过探索

在特征交互方面，与直接连接特征相比，产品层有望学习高阶潜在模式。(4)在没有乘积层的情况下，RPF和RPL是标准的图嵌入方法，它们使用二分图的一阶和二阶邻居信息。并且我们提出的预训练模型PEBG可以更好地提高现有深度KT模型的性能。

嵌入比较

我们使用t-SNE [Maaten和Hinton，2008]将PEBG预先训练的多维问题嵌入和其他问题级深度KT模型学习的问题嵌入投射到二维点。

图3显示了问题嵌入的可视化。DKT和DKVMN学习的问题嵌入是随机混合的，完全失去了问题和技能之间的联系。DHKT学习的不同技能的问题嵌入是完全分离的，未能捕捉到隐含的相似性.由PEBG预先训练的问题嵌入结构良好。同一技能中的题型彼此接近，与共同技能无关的题型分开很好。PEBG+DKT和PEBG+dkwmn对PEBG预处理的问题嵌入进行微调，使其更适合KT任务，同时保留问题和技能之间的关系。

结论

本文提出了一种新的预训练模型PEBG，该模型首先将问题-技能关系表示为一个二分图，并引入一个产品层来学习用于知识追踪的低维问题嵌入。在真实数据集上的实验表明，PEBG显著提高了现有深度KT模型的性能。此外，可视化研究显示了PEBG在捕获问题嵌入方面的有效性，为其高性能提供了直观的解释。

大学生HTML期末大作业——HTML+CSS+JavaScript传统文化无·糖 Web前端期末大作业 html 课程设计 css 大学生前端大作业期末作业
HTML+CSS+JS【传统文化】网页设计期末课程大作业web前端开发技术web课程设计网页规划与设计文章目录一、网站题目二、网站描述三、网站介绍四、网站效果五、️网站代码六、️‍如何学习进步七、‍☠️更多干货文章目录一、网站题目传统文化精美设计5页含注册登录二、网站描述总结了一些学生网页制作的经验：一般的网页需要融入以下知识点：div+css布局、浮动、定位、高级css、表格、表单及验证、js轮
汇编语言:基于x86处理器第一章习题解答「已注销」 Linux 内核资深专家 arm
汇编语言习题解答习题解答1.1.3本节回顾习题解答1.1.3本节回顾1、汇编器和链接器是如何一起工作的？汇编程序要转化为可执行程序，需要先译码后组合。这是因为一个完整的汇编程序常常是由多个文件构成，先用汇编器将每一个文件中的汇编代码转化为机器语言后，链接器再把这些文件组合成一个可执行程序。2、学习汇编语言如何能提高你对操作系统的理解？可用汇编语言验证操作系统的理论知识，从而更深刻的掌握操作系统3、
StringBuilder练习项目代码及相关知识点
1.动态字符串操作需求：编写一个程序，接收用户输入的多个单词，并将它们组合成一个完整的句子，同时支持以下功能：动态添加单词删除某些单词将句子反转importjava.util.Scanner;publicclassStringBuilderDemo{publicstaticvoidmain(String[]args){StringBuildersb=newStringBuilder();Scann
Java技术栈/面试题合集(16)-SpringCloud篇霸道流氓气质 Java进阶 Java SpringCloud 微服务面试
场景Java入门、进阶、强化、扩展、知识体系完善等知识点学习、性能优化、源码分析专栏分享：Java入门、进阶、强化、扩展、知识体系完善等知识点学习、性能优化、源码分析专栏分享_java高级进阶-CSDN博客通过对面试题进行系统的复习可以对Java体系的知识点进行查漏补缺。注：博客：霸道流氓气质-CSDN博客实现什么是SpringCloud？一、SpringCloud的核心定位1.定义SpringC
【LLM】Llama-Index 架构 FOUR_A LLM llama 架构
数据源（DataSources）PDF/文档数据库API网页音频/视频知识库自定义源数据连接器（DataConnectors）用于从各种数据源提取和加载数据，以便进行索引和查询。1.SimpleDirectoryReader含义：简单目录读取器。功能：主要用于读取本地文件系统中的目录内容。它可以列出目录中的文件和子目录，通常用于文件管理或数据预处理阶段。例如，在一个数据处理项目中，你可能需要列出某
Python自动化测试基础知识心一 Python自动化测试 python 开发语言
Python自动化测试基础知识一、自动化测试基础概念1.什么是自动化测试使用脚本和工具代替人工执行测试用例的过程通过编写代码来模拟用户操作，验证系统功能核心目标是提高测试效率，减少重复劳动2.自动化测试的优势高效率：可快速执行大量测试用例可重复：相同测试可反复执行，结果一致准确性：避免人为错误覆盖率：可执行难以手动测试的复杂场景持续集成：易于与CI/CD流程集成3.自动化测试的适用场景回归测试性能
基于odoo17的设计模式详解---备忘模式花好月圆春祺夏安设计模式数据库
大家好，我是你的Odoo技术伙伴。在开发复杂的业务流程时，我们有时会遇到这样的需求：在对一个对象进行一系列复杂操作之前，保存其当前状态，以便在操作失败或用户希望撤销时，能够一键恢复到操作之前的样子。或者，我们需要追踪一个对象（如一份合同）在不同时间点的所有历史版本。实现这种“状态快照”和“时光倒流”功能的背后，正是我们今天要探讨的设计模式——备忘录模式（MementoPattern）。一、什么是备
在学校研究学习的偏算法，秋招投递开发岗位还有希望吗程序员
前言Thelasttime,Ihavelearned这是星球同学，在周五晚上答疑聊天的时候对我的提问：如果简历上的项目偏算法，但是自学了一些操作系统和计网的知识，秋招的时候投递偏开发的岗位有希望吗？简历上是否也要加上相关项目？估计也是很多朋友的疑问，毕竟很多同学读研，有些老师疯狂push，要成果，发论文。要想尽快发论文，那只能“研究”人工智能、算法的一些东西了。但是众所周知，算法要求很高，不仅要求
Docker容器技术核心知识点精要 18你磊哥 docker基础面试学习 docker 容器运维
学海无涯，志当存远。燃心砺志，奋进不辍。愿诸君得此鸡汤，如沐春风，事业有成。若觉此言甚善，烦请赐赞一枚，共励学途，同铸辉煌！1.什么是Docker容器？Docker容器是轻量级、可移植的软件单元，基于Docker镜像创建。它在隔离的进程空间中运行应用程序，包含代码、运行时环境、系统工具和依赖库。容器共享主机操作系统内核，启动快、资源占用低。2.Docker的应用场景✅微服务部署：独立部署/扩展单个
探秘Linux进程间通信：ipcdump 工具高慈鹃Faye
探秘Linux进程间通信：ipcdump工具IPCDump项目地址:https://gitcode.com/gh_mirrors/ip/IPCDumpipcdump是一个强大的开源工具，专门用于追踪Linux系统中的进程间通信（IPC）。这个工具涵盖了管道、FIFO、信号、Unix套接字、回环网络和伪终端等多种常见的IPC机制。无论是调试多进程应用程序还是理解系统中各个组件之间的交互方式，ipcd
高德开放平台——实时路径规划优化指南 hope kc 数据库开发语言机器学习 python
高德开放平台——实时路径规划优化指南在当今交通日益拥堵的环境下，实时路径规划变得越来越重要。高德开放平台提供了丰富的API，支持开发者利用实时交通数据来优化路径规划，帮助用户避开拥堵，节省时间。本文将深入探讨如何使用高德开放平台进行实时路径规划，并附带大量代码示例，以帮助开发者轻松上手并进行优化。目录高德开放平台简介路径规划的基础知识高德开放平台API介绍实时路径规划的实现路径优化策略高级优化案例
【深度学习新浪潮】什么是上下文长度？小米玄戒Andrew 深度学习新浪潮深度学习人工智能 LLM 语言模型大模型模型优化上下文长度
大型语言模型（LLM）的上下文长度是指模型在处理当前输入时能够有效利用的历史文本长度，通常以token（如单词、子词或标点）为单位衡量。例如，GPT-4支持128Ktoken的上下文，而Llama4Scout甚至达到了10Mtoken的惊人规模。这一指标直接影响模型在长文档理解、多轮对话等复杂任务中的表现。一、上下文长度的合理范围上下文长度的选择需结合具体应用场景：日常对话：通常需要8K–32Kt
如何阅读、学习 Git 核心源代码？ belldeep Linux Git 学习 git 源代码
学习Git核心源代码是一个深入理解版本控制系统底层原理的绝佳方式。以下是分阶段的系统性建议，结合了实践经验和学习路径设计：一、前置知识储备C语言进阶重点掌握指针操作（尤其是二级指针和函数指针）结构体嵌套与内存对齐哈希表、链表等基础数据结构实现POSIXAPI系统调用（文件IO、进程控制）Git原理深入重读《ProGit》第10章（GitInternals）理解对象模型四元组：blob/tree/c
大学生HTML期末大作业——HTML+CSS+JavaScript游戏网站（英雄联盟）无·糖 Web前端期末大作业 html 课程设计 css 美食游戏 javascript 大作业
HTML+CSS+JS【游戏网站】网页设计期末课程大作业web前端开发技术web课程设计网页规划与设计文章目录一、网站题目二、网站描述三、网站介绍四、网站效果五、️网站代码六、️‍如何学习进步七、‍☠️更多干货文章目录一、网站题目游戏网站（英雄联盟）含注册登录13页二、网站描述总结了一些学生网页制作的经验：一般的网页需要融入以下知识点：div+css布局、浮动、定位、高级css、表格、表单及验证、
Databend 产品月报（2025年6月）数据库
亲爱的Databend用户朋友们，大家好！这个六月，我们的研发团队可谓是火力全开，为大家带来了一系列重磅更新！最值得关注的就是全新推出的企业级审计系统，相信这个功能会让企业的数据安全团队眼前一亮~本月成果速览新增45+实用功能修复30+影响体验的bug完成15+项性能优化其他改进30+项重点功能一览核心升级✓全链路审计追踪：登录记录、查询日志、数据访问全面监控✓金融级精度计算：Decimal64精
JAVA——JAVA知识点集锦（下） Faith_chao JAVA基础 JAVA基础知识点
转自：http://blog.csdn.net/Scythe666/article/details/51994782这部分主要是开源JavaEE框架方面的内容，包括Hibernate、MyBatis、Spring、SpringMVC等，由于Struts2已经是明日黄花，在这里就不讨论Struts2的面试题，如果需要了解相关内容，可以参考我的另一篇文章《Java面试题集（86-115）》。此外，这篇
防火墙知识点总结知新zx 服务器网络运维
一、是什么定义：不同区域，安全策略的一台硬件设备二、为什么要用作用：保护内网终端、服务器和一些通信设备的安全三、怎么用（工作原理）分类：传统防火墙、下一代防火墙1、传统防火墙①包过滤工作层次：3/4层原理：类似于路由交换的ACL，路由交换基于端口in/out，防火墙基于区域与区域之间（默认任何区域deny）优缺点：只检测3，4层，处理速度快，开销小，但应用层威胁无法防御或检测，无会画状态跟踪②状态
机器学习知识点复习上（保研、复试、面试）百面机器学习笔记
机器学习知识点复习上一、特征工程1.为什么需要对数值类型的特征做归一化？2.文本表示模型3.图像数据不足的处理方法二、模型评估1.常见的评估指标2.ROC曲线3.为什么在一些场景中要使用余弦相似度而不是欧氏距离？4.过拟合和欠拟合三、经典算法1.支持向量机SVM2.逻辑回归3.决策树四、降维1.主成分分析（PrinalComponentsAnalysis,PCA）降维中最经典的方法2.线性判别分析
【ARM AMBA AXI 入门 5.1 - QoS是什么？QoS是怎么工作的？】主公讲 ARM #ARM AMBA AXI 系列 QoS是什么？QoS 怎么工作的？AXI QoS
请阅读【嵌入式及芯片开发学必备专栏】转自：揭秘数通知识：QoS是什么？QoS是怎么工作的？（一）文章目录QoS概述综合服务和差分服务QoS工具报文分类报文标记流量监管和整形工具拥塞管理工具拥塞避免工具队列策略FIFO（先进先出队列，FirstInFirstOutQueue）PriorityQueue（优先队列PQ）Weighted-fairQueue（加权平均队列WFQ）丢弃策略我们在学习嵌入的时
计算阶梯电费叶落 Python 基础课程 python python 基础 python 入门
实现一个Python程序，根据使用的电量（从控制台中让用户输入）计算需要交的电费，电量分为两个阶梯，小于200度和大于200度，如果电量小于等于200度，电价就是0.5元/度，如果电量大于200度，比200度大的部分的电量的价格是0.8元/度。前置知识，从控制台中获取用户输入的方法：name=input("请输入你的名字：")print(f"你好，{name}！")答案electricity_co
后端路线指导（3）：后端进阶版学习路线绝命Coding 后端技术分享学习经验分享后端职场和发展面试
后端进阶版学习路线：如果说基础版的学习路线是为了打地基，那么进阶版必然是添砖加瓦了。进阶版路线其实才是真正扎实“基本功”的阶段，这一阶段主要需要学习微服务的开发模式、并发编程、设计模式等编程技巧，学习Spring和Redis的底层设计思想和源码，以及针对面试问的最多的部分进行的专项提升训练（JVM、Spring的IOC、AOP等等）接下来先定义一下对于知识的掌握程度级别：入门->了解->熟悉->非
Linux 运维常用命令与基础知识指南一二三四！运维 linux
掌握这些核心命令和概念，将极大提升您的Linux运维效率一、系统信息与状态监控1.1系统基本信息#查看系统版本信息cat/etc/os-releaselsb_release-a#查看内核版本uname-r#查看CPU信息lscpucat/proc/cpuinfo#查看内存信息free-hcat/proc/meminfo1.2实时监控命令#实时进程监控（交互式）tophtop#增强版top#系统资源
多角色AI Agent：基于LLM的虚拟角色扮演系统 AI天才研究院 AI人工智能与大数据人工智能 ai
多角色AIAgent：基于LLM的虚拟角色扮演系统关键词多角色AIAgentLargeLanguageModel(LLM)虚拟角色扮演系统人工智能自然语言处理程序设计摘要本文旨在探讨多角色AIAgent的基础知识以及其如何在虚拟角色扮演系统中发挥作用。我们将首先介绍多角色AIAgent的概念、历史背景和基本原理。随后，我们将深入探讨LLM（大语言模型）在虚拟角色扮演系统中的应用，包括其工作原理、核
前端技术博客汇总文档长路 ㅤ 文章目录汇总前端技术 HTML5 CSS3 JavaScript Vue.js
文章目录前言前端技术博客汇总链接基础知识点HTMLCSSJavaScript基础语法ES6语法扩展知识点Ajax&Fetch与跨域请求Canvas模块化WebpackNode.jsvite框架与实战VueVue.jsVue-routerVuexvue-cli(脚手架)微信小程序性能提升开源生态组件使用资料获取前言博主介绍：✌目前全网粉丝4W+，csdn博客专家、Java领域优质创作者，博客之星、阿
企业和个人基于业务知识和代码库增强的大模型生成代码实践程序员
作者：京东零售杨亚龙1.源起李明是今年刚加入某互联网公司的研发新人，满怀期待地开始了他的职业生涯。然而，短短两周后，他的热情就被现实浇了一盆冷水。第一周：当他第一次接手需求时，mentor只是简单交代了几句：“这个功能之前做过类似的，你参考下历史代码。”可当他打开代码仓库，却发现注释寥寥，变量名像密码一样难懂，更找不到任何需求文档。他硬着头皮修改，结果上线后引发了线上故障——原来有个隐藏的业务规则
ReAct (Reason and Act) OR 强化学习（Reinforcement Learning, RL） SugarPPig 人工智能人工智能
这个问题触及了现代AI智能体（Agent）构建的两种核心思想。简单来说，ReAct是一种“调用专家”的模式，而强化学习(RL)是一种“从零试错”的模式。为了让你更清晰地理解，我们从一个生动的比喻开始，然后进行详细的对比。一个生动的比喻想象一下你要完成一项复杂的任务，比如“策划一场完美的生日派对”。ReAct的方式（像一位经验丰富的活动策划师）你是一位知识渊博的专家（大语言模型LLM）。你首先会思考
【PHP开发900个实用技巧】498.事件溯源：可追溯状态变更的架构设计精通代码大仙 PHP开发900个实用技巧 php android android studio 程序员创富
事件重构时间：用事件溯源让系统变更轨迹清晰可见——本文带你掌握PHP领域状态可追溯的核心架构设计方法论事件溯源：可追溯状态变更的架构设计事件溯源是什么？为什么传统方法会失忆PHP实现事件溯源四步法关键难点与破局技巧实战：用户积分系统改造事件=事实记录状态=事件叠加传统CRUD的痛点审计追踪困境定义领域事件事件存储设计状态重建逻辑快照优化策略并发事件处理版本迁移方案老系统改造过程事件处理器实现目录事
Java开发面试核心知识点解析：从Redis缓存到内存模型全面解读
Java开发面试核心知识点解析：从缓存到内存管理谢飞机的面试经历谢飞机：（擦汗）面试官，我准备好了！第一轮提问面试官：说说你在SpringBoot中如何使用Redis缓存？有啥优势？谢飞机：嗯...这个我会！Redis是一个内存数据库，可以用来做缓存。在SpringBoot中，可以通过@EnableCaching注解启用缓存功能，然后通过@Cacheable、@CachePut和@CacheEvi
找了两个月，没找到工作
最近接触的很多测试从业者：找了两个月，没找到工作。对于此现状，多数人，肯定是焦虑、着急。而且每次面试，面试官都会问，为何这么久没找到工作。最终，迫于压力，多半会找到一家不太满意的岗位，先应付当前现状。如此，恶性循环。这里十二根据自己的职场经验，分享几点建议，供参考：1、别裸辞。2、平时多积累、多归纳总结，整理自己的知识体系。3、多提升技术，「软件测试」职业，是技术岗位，脱离不了技术。4、出了问题，
Python训练打卡DAY47 韩哈哈1129 Python训练打卡 python 开发语言
DAY47：注意力热图可视化恩师@浙大疏锦行知识点：热力图#可视化空间注意力热力图（显示模型关注的图像区域）defvisualize_attention_map(model,test_loader,device,class_names,num_samples=3):"""可视化模型的注意力热力图，展示模型关注的图像区域"""model.eval()#设置为评估模式withtorch.no_grad
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class

Improving Knowledge Tracing via Pre-training Question Embeddings

Improving Knowledge Tracing via Pre-training Question Embeddings

摘要

背景

问题表示

模型

输入特征

二部图约束

隐含的相似性

难度约束

实验

​​​​​​​数据集

技能水平模型

问题级模型

​​​​​​​实施细节

​​​​​​​性能预测

​​​​​​​消融研究

​​​​​​​嵌入比较

结论

你可能感兴趣的:(知识追踪,KT,知识追踪,knowledge)

数据集

实施细节

性能预测

消融研究

嵌入比较