Highlight_Jin

2020-KDD-Context-Aware Attentive Knowledge Tracing

Context-Aware Attentive Knowledge Tracing

主要内容

Context-Aware Attentive Knowledge Tracing
- Abstract
- 1 Introduction
- 2 Knowledge tracing problem setup
- - 2.1 Question and Response Embeddings
- 3 The AKT model
- - 3.1 Context-aware Representations and The Knowledge Retriever
  - 3.2 The Monotonic Attention Mechanism
  - 3.3 Response Prediction
  - 3.4 Rasch Model-Based Embeddings
- 4 Experimental Results
- - 4.1 Experimental setup
  - 4.2 Result and Discussion
  - 4.3 Visualizing Learned AKT Parameters
- 5 Conclusions and Future work

Abstract

知识追踪（KT）是指在教育应用中，根据学习者过去的表现来预测他们未来的表现的问题。最近使用灵活的基于深度神经网络的模型的知识追踪的发展在这项任务中表现出色。然而，这些模型往往提供有限的可解释性，从而使它们不足以用于个性化学习，而个性化学习需要使用可解释的反馈和可操作的建议来帮助学习者取得更好的学习成果。在本文中，我们提出了注意力知识追踪（AKT），它将灵活的基于注意力的神经网络模型与一系列受认知和心理测量模型启发的新型可解释模型组件结合起来。AKT使用一种新的单调的注意力机制，将学习者未来对评估问题的反应与他们过去的反应联系起来；除了问题之间的相似性之外，还使用指数衰减和上下文感知的相对距离措施来计算注意力权重。此外，我们使用Rasch模型来规范概念和问题的嵌入；这些嵌入能够捕捉同一概念的问题之间的个体差异，而不使用过多的参数。我们在几个真实世界的基准数据集上进行了实验，结果表明AKT在预测未来学习者的反应方面优于现有的KT方法（在某些情况下AUC最高可达6%）。我们还进行了几个案例研究，并表明AKT表现出良好的可解释性，因此在现实世界的教育环境中具有自动反馈和个性化的潜力。

1 Introduction

数据分析和智能辅导系统[32]的最新进展使大规模学习者数据的收集和分析成为可能；这些进展暗示了大规模个性化学习的潜力，通过分析每个学习者的学习历史数据，自动提供个性化的反馈[24]和学习活动建议[11]。

2 Knowledge tracing problem setup

每个学习者的表现记录由每个离散时间步的问题和回答序列组成。对于时间步t的学习者i，我们把他们回答的问题、这个问题所涉及的概念和他们的分级回答的组合表示为一个元组 $(q^i_t, c^i_t, r^i_t )$ ，其中 $q^i_t∈N^+$ 是问题索引， $c^i_t∈N^+$ 是概念索引， $r^i_t∈\{0, 1\}$ 是反应。在这个符号下， $(q^i_t, c^i_t, 1)$ 意味着学习者i在时间t对概念 $c^i_t$ 上的问题 $q^i_t$ 做出了正确的回答。我们注意到，这种设置与之前一些关于深度知识追踪的工作不同，这些工作通常忽略了问题索引，而将学习者的表现总结为 $(c^i_t , r^i_t)$ 。这种选择是为了避免过度参数化；详细分析见第3.3节。在下面的讨论中，我们省略上标i，因为我们讨论的是如何预测单个学习者的未来表现。给出他们到时间t-1的过去历史为 ${(q_1, c_1, r_1), ... , (q_{t-1}, c_{t-1}, r_{t-1})}$ ，我们的目标是预测他们在当前时间步t对概念 $c_t$ 的问题 $q_t$ 的回答 $r_t$ 。

2.1 Question and Response Embeddings

继之前的工作 [36] 之后，我们使用实值嵌入向量 $x_t ∈ R^D$ 和 $y_t ∈ R^D$ 分别表示每个问题和每个问题-回答对 $q_t , r_t)$ 。 $x_t$ 表征有关问题的信息，而 $y_t$ 表征学习者通过回答问题获得的知识，分别具有正确和错误回答的两个独立嵌入。D表示这些嵌入的维度。因此，让Q表示问题的数量，总共有Q个问题嵌入向量和2Q个问题-回答嵌入向量。在大多数现实世界的教育环境中，题库中题目的数量比concept（即知识点）的数目要大得多，并且许多问题分配给很少的学习者。因此，大多数现有的 KT 方法使用概念来索引问题以避免过度参数化；涵盖同一概念的所有问题都被视为一个问题。在这种情况下， $q_t = c_t$ 且 $Q = C$ 。

3 The AKT model

AKT方法由四个部分组成：两个自我注意的编码器，一个用于问题，一个用于知识获取，一个基于注意力的知识检索器，以及一个前馈反应预测模型；图1直观地显示了AKT方法及其相关的组成部分。
我们使用两个自我注意的编码器来学习问题和回答的上下文感知表征。我们把第一个编码器称为问题编码器，它根据学习者以前练习过的问题序列，对每个问题产生修正的、上下文的表征。同样地，我们把第二个编码器称为知识编码器，它对学习者在回答过去的问题时获得的知识进行修改，并将其与上下文结合起来。另外，我们也可以使用与先前工作类似的问题和回答的原始嵌入。我们发现，在大多数数据集中，上下文感知的表述表现得更好。我们把知识演化模型称为知识检索器，它利用注意力机制检索过去获得的与当前问题相关的知识。最后，反应预测模型利用检索到的知识预测学习者对当前问题的反应。AKT方法是由植根于认知科学和心理测量学的三种直觉所激发的；我们将在下文中详细介绍这些直觉。

图 1：AKT 方法概述。我们使用基于 Rasch 模型的嵌入作为问题和回答的原始嵌入。问题和知识编码器计算问题和回答对的上下文感知表示。知识检索器使用这些表示作为输入并计算学习者的知识状态。为简单起见，我们没有在编码器中展示单调注意机制。我们也没有展示子层。

3.1 Context-aware Representations and The Knowledge Retriever

如上所述，我们在模型中使用了两个编码器。问题编码器采用原始问题嵌入 ${x_1, . . . , x_t \}$ 作为输入并输出一系列上下文感知问题嵌入 $\{\hat{x}_1, . . ., \hat{x}_t \}$ 使用单调注意机制（在下一小节中详细介绍）。每个问题的上下文感知嵌入取决于它本身和过去的问题，即 $\hat{x}_t = f_{enc1}(x_1, . . , x_t )$ 。类似地，知识编码器采用原始问题-响应嵌入 ${y_1, . . . , y_{t−1}\}$ 作为输入并输出一系列获得的实际知识 $\{\hat{y}_1, . . . ,\hat{y}_{t−1}\}$ 使用相同的单调注意机制。所获知识的上下文感知嵌入取决于学习者对当前问题和过去问题的反应，即 $\hat{y}_{t−1} = f_{enc2}(y_1, . . . , y_{t−1})$ 。

选择使用上下文感知嵌入而不是原始嵌入反映了我们的第一个直觉：学习者在回答问题时理解和学习的方式取决于学习者。
这些修改后的表示反映了每个学习者对问题的实际理解以及他们实际获得的知识，考虑到他们的个人反应历史。这种模型选择的动机是这样的直觉：对于具有不同过去响应序列的两个学习者，他们理解相同问题的方式以及他们从练习中获得的知识可能不同。

知识检索器将上下文感知问题和问题-响应对嵌入 $\hat{x}_{1:t}$ 和 $\hat{y}_{1:t−1}$ 作为输入，并为当前问题输出检索到的知识状态 $h_t$ 。我们注意到，在 AKT 中，学习者当前的知识状态也是上下文感知的，因为这取决于他们正在回答的当前问题；这种模型选择与包括 DKT 在内的大多数现有方法中的模型选择不同。我们还注意到知识检索器只能使用过去问题的信息、学习者对这些问题的回答以及当前问题的表示，而不能使用学习者对当前问题的回答，即 $h_t = f_{kr}(\hat{x}_1, . . . , \hat{x}_t , \hat{y}_1, . . , \hat{y}_{t−1})$ 。响应预测模型使用检索到的知识来预测当前响应。

3.2 The Monotonic Attention Mechanism

我们对编码器和知识检索器使用缩放点积注意机制的修改后的单调版本。我们首先简要总结原始的缩放点积注意机制。在这个框架下，每个编码器和知识检索器都有一个键、查询和值嵌入层，分别将输入映射到维度 Dq = Dk 、Dk 和 Dv 的输出查询、键和值。让 qt ∈ RDk×1 表示与学习者在时间 t 响应的问题对应的查询，缩放的点积注意力值 αt,τ 使用 softmax 函数 [5] 计算为 αt,τ = Softmax( q⊺ t kτ p Dk ) = exp( q⊺ tk √ τ Dk ) Í τ ′ exp( q⊺ √t kτ Dk ) ∈ [0, 1]。

缩放后的点积注意力机制的输出由Í τ αt,τ vτ ∈ RDv×1 给出。 kτ ∈ RDk×1 和 vτ ∈ RDv×1 分别表示问题在时间步 τ 的键和值。根据特定的组件，输出取决于过去和当前（τ ≤ t 对于问题和知识编码器）或仅过去（τ < t 对于知识检索器）。

两个编码器都采用自注意力机制，即使用相同的输入计算 qt 、 kt 和 vt ；问题编码器使用 {x1, . . . , xt } 而知识编码器使用 {y1, . . . , yt−1}。另一方面，知识检索器不使用自注意力。如图 1 所示，在时间步 t ，它使用 ˆxt（当前问题的修改嵌入），{ˆx1, . . . ,ˆxt−1}（过去问题的上下文感知嵌入）和 {ˆy1, . . . ,ˆyt−1}（过去问题-响应对的上下文感知嵌入）作为输入，分别生成查询、键和值。我们注意到 SAKT 使用问题嵌入来映射查询，而响应嵌入用于键值映射。在我们的实验中，我们发现使用问题嵌入来映射查询和键更有效。

然而，这种基本的缩放点积注意力机制对于 KT 来说可能是不够的。原因是学习是暂时的，记忆衰退[21]；当我们预测他们对当前问题的反应时，学习者在遥远过去的表现不如最近的表现那么有用。因此，我们开发了一种新的单调注意机制，反映了我们的第二个直觉：当学习者面临一个新问题时，过去的经验 i) 不相关的概念和 ii) 太久以前的经验不太可能高度相关。具体来说，我们向注意力分数添加一个乘法指数衰减项，如下所示：
$\alpha_{t,\tau} = \frac{exp(s_t,\tau)}{\sum_{\tau^{'}}exp(s_t,\tau')} \\ s_{t,\tau}=\frac{exp(-\theta d(t, \tau)) q_t^Tk_{\tau}}{\sqrt{D_k}}$
其中 θ > 0 是可学习的衰减率参数，d(t , τ ) 是时间步长 t 和 τ 之间的时间距离度量。换句话说，当前问题对过去问题的注意力权重不仅取决于相应查询和关键字之间的相似性，还取决于它们之间的相对时间步数。总之，我们的单调注意机制采用指数衰减曲线的基本形式，当过去的问题与当前的问题高度相似时，可能会在时间步长出现尖峰。我们注意到我们对注意力权重应用指数衰减而不是潜在知识，这是现有学习器模型中的常见方法（参见例如 [17, 26]）。

我们注意到，还有许多其他可能的方法来表征注意力的时间动态。首先，在注意力网络擅长的语言任务中，可以使用附加位置嵌入或可学习嵌入 [29] 对时间动态进行建模。其次，在我们的单调注意机制中，我们还可以将指数衰减参数化为 st,τ = q⊺ t k √ τ Dk − θ · d(t , τ )。然而，这些变化都不会导致与我们选择的模型设置相当的性能；在我们的实验中，我们将使用位置编码而不是单调注意力将 AKT 与其变体进行比较。

上下文感知距离度量。指数衰减函数决定了注意力权重随着当前时间指数与前一时间指数之间的距离增加而衰减的速率。定义两个时间指数之间距离的一种直接方法是它们的绝对值差，即 d(t , τ ) = |t − τ |。然而，这种距离不是上下文感知的，并且忽略了每个学习者的实践历史。例如，考虑学习者练习的以下两个概念序列：维恩图 (VD)1,VD2,···,VD8,素数 (PN)9,PN10 和 PN1,VD2,VD3,···,VD9 , PN10，其中符号“VD2”表示学习者在时间步长 2 练习了维恩图的概念。在这个例子中，学习者在 t = 10 时回答了一个关于素数的问题，即当前时间索引，在两个在这些序列中，但最近关于质数的过去实践来自不同的时间索引。由于维恩图和素数的概念并不是紧密相关的，所以在预测他们对当前练习题的答案时，学习者之前在素数上的练习比最近在维恩图上的练习更适合我们。在这种情况下，通过直接的绝对值差异，指数衰减曲线将显着降低分配给 t = 1 时素数练习的注意力权重。

因此，我们针对指数衰减机制（在编码器中）提出了以下时间步长 d(t , τ ) 之间的上下文感知距离度量，其中 τ ≤ t：
$\tau) = |t-\tau|\sum_{t'=\tau+1}^{t} \gamma_{t,t'} \\ \gamma_{t,t'} = \frac{exp(\frac{q_t^Tk_{t'}}{\sqrt{D_k}})}{\sum_{1≤\tau'≤t} exp(\frac{q_t^Tk_{\tau'}}{\sqrt{D_k}})}$
对于知识检索器，我们将 τ ′ ≤ t 替换为 τ < t，将 t ′ ≤ t 替换为 t ′ < t。换句话说，这个上下文感知距离度量使用另一个 softmax 函数根据过去实践的概念与当前概念的相关性来调整连续时间索引之间的距离。在实践中，在模型训练过程中的每次迭代中，我们使用当前的 AKT 模型参数来计算修改后的距离度量并加以固定；我们不通过距离度量传递梯度。

多头注意力和子层。我们还结合了多头注意力，它可以有效地在多个时间尺度上关注过去的位置 [29]。因此，我们使用 H 个独立的注意力头，其中每个头都有自己的衰减率 θ，将最终输出连接成 (Dv·H)×1 向量并将其传递给下一层。这种模型设计使 AKT 能够在多个时间尺度上总结过去的学习者表现，这与多尺度上下文、DASH 和 DAS3H 模型中的多个时间窗口有一些相似之处 [2, 15, 21]。我们还使用了几个子层，包括一个用于层归一化 [14]、一个用于 dropout [27]、一个全连接前馈层以及每个编码器和知识检索器中的一个残差连接层 [6]。

3.3 Response Prediction

AKT 方法的最后一个组成部分是预测学习者对当前问题的反应。预测模型的输入是一个向量，它连接了检索到的知识（知识检索器输出 ht ）和当前问题嵌入 xt ；该输入通过另一个全连接网络，最后通过 sigmoid 函数 [5] 生成学习者正确回答当前问题的预测概率 ˆ rt ∈ [0, 1]。通过最小化所有学习器响应的二元交叉熵损失，整个 AKT 方法中的所有可学习参数都以端到端的方式进行训练，即 ℓ = Í i Í t −(rit log ˆ rit + (1 − rit ) log(1 − ˆ rit ))。

3.4 Rasch Model-Based Embeddings

正如我们上面讨论的，现有的 KT 方法使用概念来索引问题，即设置 qt = ct 。由于数据稀疏，此设置是必要的。让 Q 表示问题的总数，L 表示学习者的数量。在大多数现实世界的学习者反应数据集中，学习者反应的数量与 CL 相当，远少于 QL，因为许多问题分配给了很少的学习者。因此，使用概念来索引问题可以有效避免过度参数化和过度拟合。然而，这种基本设置忽略了涵盖同一概念的问题之间的个体差异，从而限制了 KT 方法的灵活性及其个性化的潜力。

我们使用心理测量学中经典而强大的模型 Rasch 模型（也称为 1PL IRT 模型）[16, 25] 来构建原始问题和知识嵌入。 Rasch 模型使用两个标量来表征学习者正确回答问题的概率：问题的难度和学习者的能力。尽管它很简单，但当知识是静态的 [12, 31] 时，它在正式评估中表现出与更复杂的学习者表现预测模型相当的表现。具体来说，我们在时间步长 t 从概念 ct 构建问题 qt 的嵌入为 xt = cct + μqt · dct ，其中 cct ∈ RD 是这个问题涵盖的概念的嵌入，而 dct ∈ RD 是一个向量，总结了涵盖这个概念的问题的变化，而 μqt ∈ R 是一个标量难度参数，它控制这个问题偏离它所涵盖的概念的程度。来自概念 ct 的问题-响应对 (qt , rt ) 使用每一对的标量难度参数类似地扩展：yt = e(ct ,rt ) + μqt · f(ct ,rt )，其中 e(ct ,rt ) ∈ RD 和 f(ct ,rt ) ∈ RD 是概念-响应嵌入和变异向量。这种模型选择反映了我们的第三种直觉：标记为涵盖相同概念的问题密切相关，但具有不容忽视的重要个体差异。这种模型选择的部分灵感来自另一项融合 KT 和 IRT 模型的工作 [8]。

这些基于 Rasch 模型的嵌入在建模个体问题差异和避免过度参数化之间取得了适当的平衡。对于问题嵌入，该模型的嵌入参数总数为 2CD + Q，比使用概念索引问题（CD）的模型略多，但远低于每个问题的模型单独参数化 (QD)，因为 C ≪ Q 和 D ≫ 1。我们进一步将概念响应嵌入定义为 e(ct ,rt ) = cct + grt ，其中 g1 和 g0 表示正确和不正确响应的嵌入（无论概念），分别。
因此，对于概念-响应嵌入，我们只引入了总共 (C + 2)D + Q 个新嵌入参数，而不是 2CD + Q 个新嵌入参数。我们注意到我们的问题和问题-响应嵌入共享一组参数 (cct)；此设置与现有的基于神经网络的 KT 方法不同，后者两者相互独立。这些紧凑的嵌入表示不仅显着减少了 AKT 和其他一些 KT 方法中的参数数量，从而提高了未来学习器性能预测的性能；详见表 5。

4 Experimental Results

在本节中，我们详细介绍了我们为测试几个真实世界数据集而进行的一系列实验。我们通过预测未来学习者的反应定量评估 AKT，并通过一系列可视化和案例研究定性评估 AKT。

4.1 Experimental setup

Dataset.我们使用四个基准数据集评估 AKT 和几个基线在预测未来学习者反应方面的性能：ASSISTments2009、ASSISTments2015、ASSISTments2017 和 Statics2011。ASSISTments 数据集是从在线辅导平台收集的；特别是，ASSISTments2009 数据集在过去十年中一直是 KT 方法的标准基准。 Statics2011 数据集是从大学水平的静力学工程课程中收集的。在所有这些数据集上，我们遵循文献中的一系列标准预处理步骤。对于 ASSISTments2009 数据集，我们删除了所有与命名概念无关的交互。对于 ASSISTments2015 数据集，我们删除了“isCorrect”字段不是 0 或 1 的所有交互。
我们在表 1 中列出了学习者、概念、问题和问题响应对的数量。在这些数据集中，只有 ASSISTments2009 和 ASSISTments2017 数据集包含问题 ID；因此，基于 Rasch 模型的嵌入仅适用于这两个数据集。

Baseline methods and evaluation metric。我们将 AKT 与几种基线 KT 方法进行比较，包括 BKT+ [35]、DKT、DKT+（这是 DKT 的改进版本，具有预测一致性的正则化 [34]）、DKVMN [36] 和最近提出的自我注意 KT（ SAKT) 方法 [18]，它使用一种注意力机制，可以将其视为 AKT 的一个特例，没有问题和响应的上下文感知表示以及单调注意力机制。我们使用接收者操作特征曲线 (AUC) 下的面积作为指标来评估所有 KT 方法在预测二元值未来学习者对问题的回答方面的性能。

Training and testing。出于评估目的，我们对所有模型和所有数据集执行标准 k 折交叉验证（k = 5）。因此，对于每个折叠，20% 的学习器用作测试集，20% 用作验证集，60% 用作训练集。对于每个折叠，我们使用验证集来执行提前停止并调整每个 KT 方法的参数。

出于计算效率的原因，我们在 [23, 36] 之后截断了长度超过 200 的学习者响应序列。如果学习器有 200 多个响应，我们会将他们的整个序列分解为多个较短的序列。我们使用 Adam 优化器以 24 个学习器的批量大小训练所有模型 [10]，以确保整个批次都可以放入我们机器的内存中（配备一个 NVIDIA Titan X GPU）。我们实现了所有版本的 AKT火炬；我们还重新实现了 DKT、DKT+ 和 SAKT，因为包含问题 ID 需要新的数据集分区并导致新的实验结果。我们对AKT、DKT、DKT+和SAKT使用Xavier参数初始化方法[4]；对于 DKVMN，我们遵循他们的工作并使用来自正态分布的样本来初始化参数 [36]。我们不会重新实施 BKT+；它在各种数据集上的表现取自 [36]。对于大多数数据集和大多数算法，一个训练周期不到 10 秒。我们将最大 epoch 数设置为 300。

4.2 Result and Discussion

表 2 列出了所有数据集上所有 KT 方法在预测未来学习者反应方面的表现；我们报告了五个测试折叠的平均值和标准偏差。 AKT-R 和 AKT-NR 分别代表带有和不带有基于 Rasch 模型的嵌入的 AKT 模型的变体。我们看到 AKT（有时显着）在 ASSISTments 数据集上优于其他 KT 方法，而 DKT+ 在最小的 Statics2011 数据集上略胜于 AKT。一般来说，AKT 在较大的数据集上表现更好；这一结果表明注意力机制比循环神经网络更灵活，因此更有能力捕捉包含在大规模现实世界学习者反应数据集中的丰富信息。在 ASSISTments2015 和 ASSISTments2017 数据集上，AKT-NR 将 AUC 比最接近的基线提高了 6% 和 1%。它与在 Statics2011 和 ASSISTments2009 数据集上表现最佳的基线相当。更重要的是，在具有问题 ID 的 ASSISTments2009 和 2017 数据集上，AKT-R 显着优于其他 KT 方法，分别比最接近的基线高 2% 和 6%。我们注意到，在我们的实现中，DKT 优于更高级的 DKVMN 方法。虽然我们能够使用相同的实验设置复制 DKVMN 的性能 [36]，但我们发现 DKT 的性能比之前在该工作中报告的要好得多。DKT+ 的性能与 DKT 不相上下，但在 Statics2011 数据集上略有改进。我们还观察到基于 RNN 的模型 DKT 在所有数据集上都优于 SAKT。

Ablation study. 为了证明 AKT 方法中的三个关键创新、问题和响应的上下文感知表示、单调注意机制和基于 Rasch 模型的嵌入，我们进行了三个额外的消融实验，比较了 AKT 方法的几种变体。第一个实验使用上下文感知问题和响应表示（使用问题和知识编码器）与两个变体 AKTraw-NR 和 AKTraw-R 比较 AKT-NR 和 AKT-R；在这些变体中，我们使用原始问题和响应嵌入作为它们的表示，而不是上下文感知表示（即，不通过编码器传递它们）。第二个实验将 AKT-NR 与几种没有单调注意机制的变体进行比较。这些变体包括 AKT-NRpos，它使用（可学习的）位置编码来捕获学习者响应数据中的时间依赖性和 AKT-NRfixed，它使用使用不同频率的正弦和余弦函数的（固定）位置编码 [29]。第三个实验在 ASSISTments2009 和 2017 数据集上将 AKT-R 与 AKT-NR、DKT、DKT-R、DKT+、DKT±R、DKVMN、DKVMN-R、SAKT 和 SAKT-R 进行比较，其中问题 ID 可用； DKT-R、DKT±R、DKVMN-R 和 SAKT-R 分别是指使用基于 Rasch 模型的嵌入作为输入增强的 DKT、DKT+、DKVMN 和 SAKT 方法。

表 3 显示了上下文感知表示（即问题和知识编码器）的第一个消融实验的结果（由于空间限制，只有测试折叠的平均值而不是标准偏差）。在所有数据集上，AKT-R 和 AKTNR 都优于其对应物 AKTraw-NR 和 AKTraw-R，它们仅使用具有指数衰减的单一自注意力机制（即知识检索器）。这些结果表明，我们对问题和响应的上下文感知表示在总结每个学习者的实践历史方面是有效的。

表4显示了单调注意机制的第二次消融实验的结果。我们看到，AKT-NR在所有的数据集上都明显优于其他使用位置嵌入的注意机制，包括SAKT，约为1%到6%。我们推测，产生这一结果的原因是，与语言任务中更常见的词与词之间的强长距离依赖不同，未来学习者的表现对过去的依赖被限制在一个更短的时间窗口。因此，在注意力权重中使用具有不同指数衰减率的多头注意力可以有效地捕捉到不同时间尺度上对过去的短期依赖性。

表 5 显示了基于 Rasch 模型的嵌入在两个 ASSISTments 数据集上的第三个消融实验的结果，其中问题 ID 可用。所有添加了基于 Rasch 模型的嵌入的基线 KT 方法都优于其常规版本，尤其是在 ASSISTments2017 数据集上。这些结果证实了我们的直觉，即将涵盖相同概念的所有问题视为单个问题是有问题的。只要可以避免过度参数化，就不应忽视这些问题之间的个体差异。

Remark. 我们的标准实验设置遵循 [23, 36] 中使用的设置。在此设置中，对于标记有多个概念的问题（在 ASSISTments2009 数据集中），单个学习者的响应会重复多次，每个概念一个。其他作品对这些问题使用了不同的实验设置；在 [31] 中，作者删除了这些问题，因此 DKT 的性能下降到 0.71。在[33]中，作者为同时出现的单个概念的每个组合构建了新概念，因此，DKT 的性能下降到 0.73。因此，我们还在 ASSISTments2009 数据集上使用了另一种实验设置。对于标有多个概念的问题，我们对相应的概念嵌入求平均，并将它们用作输入嵌入和响应预测。表 6 列出了该设置下所有 KT 方法在 ASSISTments2009 数据集上的性能。使用平均嵌入时 DKT 的性能下降到 0.76，比 [31, 33] 下的设置要好。与我们所有 KT 方法的标准实验设置相比，我们观察到类似的性能下降，而 AKT-R 仍然轻松胜过所有基线。

4.3 Visualizing Learned AKT Parameters

Monotonic attention.图 2 显示了使用 ASSISTments2009 数据集的 AKT 单调注意机制提供的可解释性。图 2(a) 以一个学习者的知识检索器中的注意力权重为例；我们绘制了注意力权重，用于预测他们在三个注意力头上的 20 个连续练习问题上的表现。我们看到每个注意力头都在自己的时间尺度上运行：它们都有不同宽度的注意力窗口。例如，第二个头能够处理整个过去，最多 20 个时间步长（在本例中）；相反，第三个头只能关注最近的过去，主要关注最后的 3-5 个时间步骤。这一观察结果表明，过去的一些问题和回答包含高度预测学习者对当前问题的回答的信息；这些信息可以被具有不同衰减率的多个注意力头有效地捕获.

图 2(b) 将知识检索器中单个学习器的标准化注意力权重可视化为三个连续时间步长。在第一行，学习者在从 T − 10 到 T − 5 练习这个概念之后，在时间 T 回答关于概念 30 的问题，然后休息一下练习概念 42，然后在时间 T 回到概念 30 − 1. 我们看到 AKT 预测他们对当前问题的反应是更多地关注这个概念的先前实践（在最近和更远的过去），而不是在最近的另一个概念上的实践。在中间一行，学习者再次切换到概念 42 的练习。同样，AKT 学会在时间 T - 2 和 T - 1 时将注意力集中在同一概念的过去练习上，而不是紧接着的过去对不同概念的练习。在下一行中，学习者连续第二次对概念42进行练习，AKT显示出与第一行类似的焦点模式，但概念30和42的角色互换了。这些观察结果表明，AKT 的单调注意机制有可能通过将学习者当前的反应与过去的反应联系起来，向教师提供反馈；这些信息可能使教师能够选择他们已经练习过的某些问题，以便在继续之前重新练习并清除误解。我们还注意到，AKT 使用数据驱动的方法学习这些与现有 KT 方法中手工制作的特征相匹配的注意力模式（例如，对这个概念的总尝试次数和正确尝试次数）[15, 22]。

Rasch model-based embeddings. 图 3 使用 ASSISTments2009 数据集，使用 t-SNE [28] 将学习到的基于 Rasch 模型的几个概念的问题嵌入可视化，以及它们对选定问题的经验难度（跨学习者正确响应的部分）。我们还根据每个概念的经验困难突出显示了每个概念中最难和最简单的问题。

我们看到同一概念的问题形成一条曲线，并按难度排序：对于大多数概念，线段一端的问题是简单的，而另一端的问题是困难的。这个结果证实了我们的直觉，即来自同一概念的问题并不相同，而是彼此密切相关； Rasch 模型可以使用其难度参数很好地捕捉这种关系。
表 7 列出了三个不同概念的示例问题，“Ordering Positive Decimals”、“Probability of a Single Event”和“Conversion of Fractions to Percents”，以及它们的学习难度参数。我们为每个概念展示了三个问题：一个简单的一个，一个平均一个，一个艰难的。以“单个事件的概率”概念为例，学习难度参数值（μq）对于简单的为 -0.0515，对于平均为 0.0088，对于困难的为 0.0548。这些习得的难度级别符合我们对这些问题难度级别的理解。

这些结果表明 AKT 有可能应用于现实世界的教育环境。使用估计的难度参数，计算机化学习平台可以 i) 根据每个学习者过去的回答自动为每个学习者选择具有适当难度级别的问题，或者 ii) 通过向教师提供从真实数据中学到的问题难度级别的反馈，支持他们调整课程计划.因此，AKT 改进了现有的 KT 方法，不仅提供了最先进的预测性能，而且还展示了可解释性和个性化学习的潜力。

5 Conclusions and Future work

在本文中，我们提出了专注的知识追踪，这是一种完全依赖于注意力网络的知识追踪的新方法。我们的方法在现有知识追踪方法的基础上进行了改进，建立了问题和回答的上下文感知表征，使用单调的注意力机制来总结过去学习者在正确时间尺度上的表现，并使用Rasch模型来捕捉涵盖同一概念的问题之间的个体差异。在一系列基准的真实世界学习者反应数据集上的实验结果表明，我们的方法优于最先进的KT方法，并表现出良好的可解释性。未来工作的途径包括：i）纳入问题文本，以进一步提高问题和概念嵌入的可解释性；ii）测试我们的方法是否可以提高发生记忆衰减的语言学习数据集的预测性能[26]。

你可能感兴趣的:(知识追踪)

CEF 控制台添加一函数，枚举注册的供前端使用的CPP交互函数有哪些清水迎朝阳 CEF应用 CEF 交互注入函数注册 CPP
一、前序知识1、设置单进程模式，方便调试voidClientApp::OnBeforeCommandLineProcessing(constCefString&process_type,CefRefPtrcommand_line){if(process_type.empty()){//cef在debug模式下有问题#ifdef_DEBUGcommand_line->AppendSwitchWith
【自学笔记】Linux基础知识点总览-持续更新 Long_poem 笔记 linux 运维
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Linux基础知识点总览目录Linux简介文件和目录结构常用命令文件操作目录操作权限管理文本处理Shell脚本基础进程管理用户和组管理网络配置总结Linux基础知识点总览目录Linux简介文件和目录结构常用命令文件操作目录操作权限管理文本处理Shell脚本基础进程管理用户和组管理网络配置Linux简介Linux是一个基于Uni
LLM：软件测试的颠覆性力量 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LLM：软件测试的颠覆性力量关键词：大语言模型（LLM）、软件测试、人工智能、测试自动化、测试效率、质量保证、测试革新1.背景介绍在当今快速发展的软件行业中，测试一直是确保产品质量的关键环节。随着人工智能技术的飞速进步，特别是大语言模型（LargeLanguageModels，简称LLM）的出现，软件测试领域正经历着前所未有的变革。LLM凭借其强大的自然语言处理能力和广泛的知识储备，正在重塑我们对
JVM常用概念之编译器黑洞剑海风云 JDK（Java Development Kit）jvm 编译器编译器黑洞
问题JMH如何避免微小基准测试中的不会运行的代码的消除工作？是否有隐式或显式编译器支持？基础知识优化编译器擅长优化简单的东西。例如，如果存在任何人都无法观察到的计算，则可以将其视为“不会运行的代码”并将其删除。这通常是一件好事，直到你运行基准测试。在那里，你想要计算，但你不需要结果。本质上，你观察基准测试所占用的“资源”，但没有简单的方法可以与编译器争论这一点。比如下面的测试用例，该方法中只涉及到
零基础上手Python数据分析 (6)：Python 异常处理，告别程序崩溃的烦恼！ kakaZhui python 数据分析数据库 excel 数据挖掘
回顾一下，前几篇博客我们学习了Python的基本语法、数据结构和文件操作。现在，我们已经掌握了Python编程的基础知识，可以开始编写更复杂的数据分析代码了。但是，在实际的数据分析工作中，程序并非总能一帆风顺地运行，总会遇到各种意外情况，例如：文件找不到：程序尝试读取一个不存在的数据文件。数据格式错误：数据文件中包含非预期的格式，例如本应是数字的列包含了文本。网络连接中断：程序尝试从网络获取数据，
知识图谱中NLP新技术魔王阿卡纳兹知识图谱入门大数据治理与分析知识图谱自然语言处理人工智能
知识图谱与自然语言处理（NLP）的结合是当前人工智能领域的前沿方向，其技术发展呈现多维度融合与场景深化的特点。以下从核心技术突破、应用场景创新及未来趋势三个层面，系统梳理知识图谱中NLP的最新进展：一、核心技术突破基于预训练模型的图谱构建与增强预训练语言模型与知识嵌入融合：以BERT、KEPLER为代表的模型通过联合优化知识嵌入（KE）和语言建模目标，将知识图谱中的结构化知识融入预训练过程，显著提
「Kubernetes Objects」- Service（学习笔记） @20210227 k4nzdroid
Service，服务，用于暴露Pod以供访问。官方文档及手册KubernetesAPIv1.18/Servicev1coreService?Pod会被创建，并且还会消失，这由ReplicaSets控制。每个Pod都有自己的IP地址，但是这些IP地址不能视为可靠的。那么，如果前端的一部分Pod依赖于后端的Pod，那前端的这些Pod如何找出并追踪后端的Pod？ServiceService是一个抽象，定
JavaScript基础-DOM事件流難釋懷 javascript 开发语言
在Web开发过程中，理解和掌握DOM事件流是实现高效交互的关键。DOM事件流描述了当一个事件发生时，它在文档树中的传播路径。了解事件流的概念有助于我们更精确地控制事件处理逻辑，避免不必要的行为，并提升用户体验。本文将深入探讨DOM事件流的基本概念，包括事件捕获、目标阶段和事件冒泡，并通过示例展示如何应用这些知识。一、什么是DOM事件流？DOM事件流是指事件在整个页面结构中传播的过程。根据W3C标准
Activity渲染完成第一帧时机 brycegao321 Android 渲染完成第一帧
Activity第一帧渲染涉及知识点setContentView流程、帧绘制流程、SurfaceFlinger等。统计开始时间：hookActivityThread的Instrumentation，得到Activity各个生命周期的开始、结束时间；参考：Activity的生命周期是谁调用的？注意：ActivityLifecycleCallbacks的回调函数是执行结束后触发的，无法得到开始执行时间
AI学习资料|3月最新版可下载 2501_91122183 人工智能学习
AI学习资料：https://pan.quark.cn/s/d7452a3222d8都说AI是2025年新的风口，都想成为站在风口上的猪，可如何学习AI却成了拦住大多数人的第一道门槛。其实，学习AI很简单，你缺的只是一个信息差！这段时间，清华北大出品AI教学资料，火遍全网，从基础知识到实操应用，各种应用场景和进阶玩法讲解。即便是零基础新人也能轻松上手，从入门到精通。资料我已经帮大家整理好了，放在最
STM32八股【1】-----启动流程和startup文件理解 Invinciblenuonuo stm32 arm
启动流程知识点MCU上电复位。MSP从向量表第0个地址读取一个32位（2字节）的值并保存，该值为栈顶地址。PC计数器从第1个地址读取一个两字节的值并保存，该值为程序入口，一般是Reset_Handler。想了解FLASH地址映射可以看STM32八股【4】-----AHB地址映射__VectorsDCD__initial_sp;TopofStackDCDReset_Handler;ResetHand
计算机毕业设计指南晴天毕设课程设计毕业设计 java 毕设开发语言
毕业设计是计算机专业学生展示综合能力的重要环节，不仅是对所学知识的总结，也是进入职场或深造前的实战演练。本文将从选题、需求分析、系统设计、编码实现、测试优化、论文撰写、答辩准备等方面，为你提供一份详细的毕业设计指南。如果有其他问题，可以点击文章末尾名片咨询，可免费分享源码1.选题阶段选题是毕业设计的起点，直接影响后续工作的难度和完成质量。选题原则兴趣驱动：选择自己感兴趣的方向，能够激发研究动力。创
Java 大视界 -- Java 大数据在智能医疗远程会诊与专家协作中的技术支持（146）青云交大数据新视界 Java 大视界 java 大数据智能医疗远程会诊专家协作数据安全病例诊断
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
使用Pygame实现记忆拼图游戏点我头像干啥 Ai pygame python 开发语言
引言记忆拼图游戏是一种经典的益智游戏，玩家需要通过翻转卡片来匹配相同的图案。这类游戏不仅能够锻炼玩家的记忆力，还能带来很多乐趣。本文将详细介绍如何使用Pygame库来实现一个简单的记忆拼图游戏。我们将从Pygame的基础知识开始，逐步构建游戏的各个部分，最终完成一个完整的游戏。1.Pygame简介Pygame是一个用于编写视频游戏的Python库，它基于SDL库（SimpleDirectMedia
《Python实战进阶》No28: 使用 Paramiko 实现远程服务器管理带娃的IT创业者 Python实战进阶 python 服务器开发语言
No28:使用Paramiko实现远程服务器管理摘要在现代开发与运维中，远程服务器管理是必不可少的一环。通过SSH协议，我们可以安全地连接到远程服务器并执行各种操作。Python的Paramiko模块是一个强大的工具，能够帮助我们实现自动化任务，如代码部署、批量命令执行和文件传输。本集将深入讲解Paramiko的核心功能，并通过实战案例展示如何高效管理远程服务器。核心概念和知识点SSH协议的基本原
初始OpenCV 指尖下的技术 OpenCV opencv 人工智能计算机视觉
OpenCV是一个功能强大、应用广泛的计算机视觉库，它为开发人员提供了丰富的工具和算法，可以帮助他们快速构建各种视觉应用。随着计算机视觉技术的不断发展，OpenCV也将会继续发挥重要的作用。OpenCV提供了大量的计算机视觉算法和图像处理工具，广泛应用于图像和视频的处理、分析以及机器学习领域。所以学习人计算机视觉或者图像处理方面的知识，OpenCV是一个要重点学习的工具库。首先介绍一下OpenCV
一文读懂什么是服务器小熊猫Q 服务器科普服务器运维
服务器基础介绍介绍服务器相关基础知识，如服务器分类、组成、机箱内部构造等，个人公众号：SRE杂谈，欢迎关注1、什么是服务器？服务器品牌有惠普、戴尔、浪潮、华为、华三、曙光等，各厂商服务器型号存在差异，惠普DL380G10、戴尔PowerEdgeR750、浪潮NF5280M5、华为2288HV5、曙光R6230HA一般用SN序列号和资产编号来对服务器进行标识，其中SN为唯一标识2、服务器演进2.1、
WRF移动嵌套结合伏羲模型与CFD（PALM）高精度多尺度降尺度分析研究 Hardess-god WRF 算法人工智能
随着大气科学与数值模拟技术的发展，高精度多尺度气象模拟日益成为科研与应用的热点问题。本文将详细介绍如何使用WRF移动嵌套技术结合伏羲（Fuxi）模型，并通过CFD模型PALM实现精细化降尺度，以满足城市或区域局地精细化气象预报的需求。1.技术路线概述WRF移动嵌套（MovingNesting）：动态调整高分辨率嵌套网格位置，追踪天气系统（如台风、强对流系统）以提高局地预报精度。伏羲（Fuxi）模型
“三分钟”带你看懂批次管理!（一） wms系统
一、批次管理的定义与重要性1.批次管理的定义：批次管理是一种针对产品或物料的管理方法，它将同一生产周期或相同条件下生产、具有一致质量特征、生产信息和使用属性的产品组作为一个批次，进行分类、标识、追踪和管理。2.批次管理的重要性：提高可追溯性：精准追踪物料和产品的来源、去向及生命周期，在质量问题或召回需求出现时，能快速锁定问题批次，降低损失。增强质量控制：监控不同批次产品的质量指标，及时发现和分析质
python 列表排序 rainynights Python
在我们实际使用中，对于列表的操作是十分常见的。对于列表的数据，在很多特殊的情况下我们需要对列表内的数据进行排列以达到我们特定的显示需求。今天，我们一起看一下python中关于列表排序的一些知识。有些时候我们希望对列表进行排序后，列表可以保存我们排序后的结果，但是很多情况下我们只是希望通过列表的排序，临时的显示排序结果而已。所以对于列表的排序可以分为永久性的排序和临时性的排序。sort()sort(
使用Python和LangChain构建检索增强生成（RAG）应用的详细指南 m0_57781768 python langchain 搜索引擎
使用Python和LangChain构建检索增强生成（RAG）应用的详细指南引言在人工智能和自然语言处理领域，利用大语言模型（LLM）构建复杂的问答（Q&A）系统是一个重要应用。检索增强生成（RetrievalAugmentedGeneration，RAG）是一种技术，通过将模型知识与额外数据结合来增强LLM的能力，使其能够回答关于特定源信息的问题。这些应用不仅限于公开数据，还可以处理私有数据和模
3.19学习总结 2402_88131930 学习
学习了Java中的面向对象的知识点完成一道算法题，找树左下角的值，错误的以为左下角只能是最底层的左节点，但指的是最底层最左边的节点
Python基础知识点总结豆芽819 tip python 开发语言
1Python简介Python特点：解释型语言：无需编译，逐行执行。动态类型：变量类型在运行时确定。简洁易读：语法接近自然语言，代码简洁。跨平台支持：Windows/Linux/macOS均可运行。应用领域：Web开发、数据分析、人工智能、自动化脚本等。开发环境：推荐使用IDLE、PyCharm、VSCode或JupyterNotebook。2Python数值运算基本运算符：算术：+,-,*,/,
Flink相关面试题努力的搬砖人. 面试 java 后端 flink
以下是150道ApacheFlink面试题及其详细回答，涵盖了Flink的基础知识、核心架构、API使用、性能调优等多个方面，每道题目都尽量详细且简单易懂：Flink基础概念类1.什么是ApacheFlink？ApacheFlink是一个开源的流处理和批处理框架，能够实现快速、可靠、可扩展的大数据处理。它既可以处理无界的数据流，也可以处理有界的数据批，提供了低延迟和高吞吐量的实时数据处理能力。Fl
【架构设计】前置知识 GIS程序媛—椰子架构设计架构设计
架构设计是软件开发的进阶技能，需要结合理论知识和实践经验。以下是掌握架构设计所需的前置知识及其重要性，以及学习路径建议：一、基础编程能力1.编程语言与核心概念掌握至少一门主流语言（如Java、Python、C#、Go等），理解其语法、特性及生态。核心概念：面向对象（OOP）、函数式编程（FP）、并发/异步、内存管理等。示例：通过Java理解接口、多态、设计模式。通过Go学习并发模型（Gorouti
LLM 大模型技术知识最佳学习路径图发布！ AGI-杠哥学习人工智能语言模型 agi 自然语言处理
近日，经常有小伙伴私信我，大模型知识太多了，有点懵啊，我该如何学习LLM大模型？今天我们就来剖析下LLM大模型技术知识的学习路径。如果你是一个LLM大模型的“技术小白”，我们建议的学习路径如下：技术交流群前沿技术资讯、算法交流、求职内推、算法竞赛、面试交流(校招、社招、实习)等、与10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企开发者互动交流~我们建了大模型技术与面试交流群
前端面试请叫我子鱼编程语言笔试面试程序员 web interview
前端面试之道JS基础知识点及常考面试题原始（Primitive）类型面试题：原始类型有哪几种？null是对象嘛？在JS中，存在着6种原始值，分别是：booleannullundefinednumberstringsymbol首先原始类型存储的都是值，是没有函数可以调用的对象（Object）类型面试题：对象类型和原始类型的不同之处？函数参数是对象会发生什么问题？在JS中，除了原始类型那么其他的都是对
初级：数组与字符串面试题深度剖析佩奇的技术笔记 Java面试小册 java
一、引言在Java开发中，数组和字符串是最常用的数据结构之一。面试官通过相关问题考察候选人对数组和字符串的理解和运用能力，以及在实际开发中解决相关问题的经验。本文将深入剖析常见的数组与字符串面试题，结合实际开发场景，帮助读者全面掌握这些知识点。二、数组面试题：如何对数组进行初始化和遍历？答案：数组的初始化可以使用直接初始化、动态初始化等方式。遍历数组可以使用传统的for循环、增强型for循环（fo
windows使用ssh-copy-id命令的解决方案爱编程的喵喵 Windows实用技巧 windows ssh ssh-copy-id 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了windows使用ssh-copy-
关于swoole的初步了解记录 snacy swoole php 服务器
今天初步了解了一下关于swoole的相关知识，在这里记录一下。关于swoole的初步了解记录安装swoole扩展swoole扩展需要在Linux环境下安装，目前还不支持在Windows环境下安装，当前操作系统为centOS系统安装swoole需要：PHP、php-pear(这个是为了稍后可以使用pecl来安装swoole)、php-devel、gcc先执行更新操作：yumupdate(已更新过的可
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f