耩豇

KBQA知识图谱问答（二）记忆网络Memory Network

文章目录

前言
MemNN
End-to-End MemNN
Key-Value MemNN
BAMnet
最后

前言

最近刚好在看BAMnet这篇做KBQA的实验，顺带把记忆网络的几篇经典文章看了一下做一下总结。另外就是 Facebook 7月份刚上传的一篇用 memory 来改进 BERT 结构的文章 Large Memory Layers with Product Keys 在精度不降的前提下提高了 BERT 的效率，看来脸书是真的喜欢 Memory这个概念的运用拓展。

MemNN

MEMORY NETWORKS ICLR2015

记忆网络的提出主要是解决 RNN 的隐层无法保存长期记忆、能传达的记忆内容太少的问题。这里就引入了一种外部记忆模块就和 RAM 一样能保存大量历史信息，与一些读写模块一起组成了 Memory Network，如下图：

由图中可以看出一共有四个模块：

I: input feature map
把输入映射为向量
G: generalization
使用新的输入数据更新记忆内容
O: output
给定新的输入和现有的记忆状态，在特征空间里产生输出
R: response
将输出转化为指定输出形式（自然语言）

具体来说，I模块是 embedding lookup，将原始文本转化为词向量，G模块将输入的向量存储在memory数组的下一个位置，不做其他操作，对老的记忆不做修改。O模块根据输入的问题向量在所有的记忆中选择出 topk 相关的记忆，具体选择方式为，先选记忆中最相关的memory：
$o_{1}=O_{1}(x, \mathbf{m})=\underset{i=1, \ldots, N}{\arg \max } s_{O}\left(x, \mathbf{m}_{i}\right)$
其中目标函数是用 Bilinear Regression 来建模问题 $q$ 和记忆 $m$ 的相关程度：
$y)=\Phi_{x}(x)^{\top} U^{\top} U \Phi_{y}(y)$
接下来根据选择出的 $o_1$ 和输入 $x$ 一起选择与他们两个最相关的记忆 $o_2$ ：
$o_{2}=O_{2}(x, \mathbf{m})=\underset{i=1, \ldots, N}{\arg \max } s_{O}\left(\left[x, \mathbf{m}_{o_{1}}\right], \mathbf{m}_{i}\right)$
然后一直迭代下去，就这样选择出于Question最相关的 topk 个 memory slot 。将其作为R模块的输入，用于生成最终的答案。其实这里也很简单就是使用与上面相同的评分函数计算所有候选词与R输入的相关性，得分最高的词语就作为正确答案输出即可：
$r=\operatorname{argmax}_{w \in W} s_{R}\left(\left[x, \mathbf{m}_{o_{1}}, \mathbf{m}_{o_{2}}\right], w\right)$
如果数据集是输出一句话的，那么最后可以用RNNLM来生成带有回复信息的句子。
最后它定义的损失函数（margin ranking loss）如下，设 $k = 2$ ：
$\begin{array}{c}{\sum_{\overline{f} \neq \mathbf{m}_{o_{1}}} \max \left(0, \gamma-s_{O}\left(x, \mathbf{m}_{o_{1}}\right)+s_{O}(x, \overline{f})\right)+} \\ {\sum_{\overline{f}^{\prime} \neq \mathbf{m}_{o_{2}}} \max \left(0, \gamma-s_{O}\left(\left[x, \mathbf{m}_{o_{1}}\right], \mathbf{m}_{o_{2}}\right]\right)+s_{O}\left(\left[x, \mathbf{m}_{o_{1}}\right], \overline{f}^{\prime}\right] ) )+} \\ {\sum_{\vec{r} \neq r} \max \left(0, \gamma-s_{R}\left(\left[x, \mathbf{m}_{o_{1}}, \mathbf{m}_{o_{2}}\right], r\right)+s_{R}\left(\left[x, \mathbf{m}_{o_{1}}, \mathbf{m}_{o_{2}}\right], \overline{r}\right]\right) )}\end{array}$
第一个意思是有没有挑选出正确的第一句话，第二个意思是正确挑选出了第一句话后能不能正确挑出第二句话，合起来就是能不能挑选出正确的语境，用来训练 attention 参数，第三个式子把正确的 supporting fact 作为输入，能不能挑选出正确的答案，来训练 response 参数。

总结

奠定了记忆网络的基础模型，里面所有模块都是可以用其它算法的
还没有做成端到端的形式

End-to-End MemNN

End to End MEMORY NETWORKS NIPS2015

上文的损失函数可以看出O和R模块承担了主要的任务并且都需要监督，我们需要知道O选择的supporting fact 是否正确，R生成的 response 是否正确。这篇其实就是用了soft attention 来估计每一个 supporting fact 的相关程度，实现了端到端的 BP 过程。论文中提出了单层和多层两种架构，多层其实就是将单层网络进行stack。
单层结构如下：

其中A,B,C三个矩阵就是 embedding 矩阵，主要是将输入文本和 Question 编码成词向量，W是最终的输出矩阵。

1、输入模块的主要作用是将输入的文本转化成向量并保存在memory中，本文中的方法是将每句话压缩成一个向量对应到memory中的一个slot（上图中的蓝色或者黄色竖条）。其实就是根据一句话中各单词的词向量得到句向量。论文中提出了两种编码方式，BoW和位置编码。BoW就是直接将一个句子中所有单词的词向量求和表示成一个向量的形式，这种方法的缺点就是将丢失一句话中的词序关系，进而丢失语义信息；而位置编码的方法，不同位置的单词的权重是不一样的，然后对各个单词的词向量按照不同位置权重进行加权求和得到句子表示。位置编码公式如下：
$l_{k j}=(1-j / J)-(k / d)(1-2 j / J)$
$m_{i}=\sum_{j} l_{j} \cdot A x_{i j}$
另外为了编码时序信息，我们需要在上面得到 $m_i$ 的基础上再加上个矩阵对应每句话出现的顺序，不过这里是按反序进行索引。将该时序信息编码在 $T_a$ 和 $T_c$ 两个矩阵里面，所以最终每句话对应的记忆mi的表达式如下所示：
$m_{i}=\sum_{j} l_{j} \cdot A x_{i j}+T_{A}(i)$
2、上面的 Input 模块可以将输入文本编码为向量的形式并保存在 memory 中，这里分为两个部分，一个用于跟 Question 相互作用得到各个 memory slot 与问题的相关程度，另一个则使用该信息产生输出。

第一部分将Question经过输入模块编码成一个向量u，与mi维度相同，然后将其与每个mi点积得到两个向量的相似度，在通过一个softmax函数进行归一化：
$p_{i}=\operatorname{Softmax}\left(u^{T} m_{i}\right)$
$p_i$ 就是 $q$ 与 $m_i$ 的相关性指标。然后对 Output 中各个记忆 $c_i$ 按照 $p_i$ 进行加权求和即可得到模型的输出向量 $o$ 。

3、输出模块根据Question产生了各个memory slot的加权求和，也就是记忆中有关Question的相关知识，Response模块主要是根据这些信息产生最终的答案。其结合o和q两个向量的和与W相乘在经过一个softmax函数产生各个单词是答案的概率，值最高的单词就是答案。并且使用交叉熵损失函数最为目标函数进行训练。

4、多层结构（K hops）也很简单，相当于做多次 addressing、 attention，每次 focus 不同的 memory 上，不过在第 k+1 次 attention 时 query 的表示需要把之前的 context vector 和 query 拼起来，其他过程几乎不变，也就是说上面几层的输入就是下层o和u的和 $u^{k+1}=u^{k}+o^{k}$ 。最后在顶层输出时就是：
$\hat{a}=\operatorname{Softmax}\left(W u^{K+1}\right)=\operatorname{Softmax}\left(W\left(o^{K}+u^{K}\right)\right)$
至于各层的参数选择，论文中提出了两种方法来减少参数量，而且如果每层参数都不同的话会导致参数很多难以训练:

Adjacent：这种方法让相邻层之间的A=C。也就是说 $A^{k+1}=C^k$ ，此外W等于顶层的C，B等于底层的A，这样就减少了一半的参数量。
Layer-wise (RNN-like)：与RNN相似，采用完全共享参数的方法，即各层之间参数均相等。 $A^{1}=A^{2}=\ldots=A^{K}$ and $C^{1}=C^{2}=\ldots=C^{K}$ ，由于这样会大大的减少参数量导致模型效果变差，所以原文通过实验，提出一种改进方法，即令 $u^{k+1}=H u^{k}+o^{k}$ ，也就是在每一层之间加一个线性映射矩阵H。

总结

由上图的 3-hop 的实验结果可以看出这种记忆网络的推理效果还是有点成型了但是效果还是不理想，它只是简单的把context线性变换成了一个整体的memory，为了在对话中引入更多的外部知识，我们就引出了下面要说的 key-value MemNN。

Key-Value MemNN

Key-Value Memory Networks for Directly Reading Documents EMNLP2016

其实看到key-value我第一反应就是之前看的self-attention，看完论文个人感觉其实还是挺相近的，key做寻址value做后续的加权求和。这里的KV-MemNN将memory存入（key，value）键值对，并且引入了Wiki、KB、IE三种知识库，整体框架如下：

Key hashing:根据输入的问题从知识源中用倒排索引检索出与问题相关的facts存入memory，从而减小后续的进一步匹配数据量
Key addressing：利用hashing的得到的 candidate memories 去和 query 线性变换后的结果计算一个相关概率：
$p_{h_{i}}=\operatorname{Softmax}\left(A \Phi_{X}(x) \cdot A \Phi_{K}\left(k_{h_{i}}\right)\right)$
Value Reading:得到相关概率后对 value 进行加权求和得到输出向量 $o$ :
$o=\sum_{i} p_{h_{i}} A \Phi_{V}\left(v_{h_{i}}\right)$
这样就完成了一个hop的操作，接下来将输出向量o与输入问题的向量表示q相加，经过Ri矩阵进行映射，在作为下一层的输入 $q_{2}=R_{1}(q+o)$ ，相关概率也随之更新 $p_{h_{i}}=\operatorname{Softmax}\left(q_{j+1}^{\top} A \Phi_{K}\left(k_{h_{i}}\right)\right)$ 重复循环这个过程即可。最后在答案预测如下，其中 $\Phi_{Y}\left(y_{i}\right)$ 是对 candidates 的向量表示。
$\hat{a}=\operatorname{argmax}_{i=1, \ldots, C} \operatorname{Softmax}\left(q_{H+1}^{\top} B \Phi_{Y}\left(y_{i}\right)\right)$
总结
总体来看其实和端到端的很像，但是引入了key-value对之后可以事先对外部知识编码，这样就不用更多的依赖模型训练的embedding而是在每次查询配对知识信息，使模型能找到更准确的记忆得到与答案更接近的输出。

BAMnet

Bidirectional Attentive Memory Networks for Question Answering over Knowledge Bases NAACL2019

之前看的记忆网络全是为了这篇19年做KBQA的做铺垫，也算是对KBQA的理解性试验，代码作者也已经开源，这里主要还是关注文章中如何利用MemNN解决关系检测的问题。下图就是整体框架：

乍一看这图还是挺复杂的，模块很多箭头也飞来飞去的，下面我会拆分开一步一步记录整个模型的流程。
1、Input module
这里使用BiLSTM对输入问句的 word embedding做编码得到 $H^Q$
2、Memory module
首先得到候选实体（答案） $\left\{A_{i}\right\}_{i=1}^{|A|}$ 并对其做三种信息的编码（实体候选文中用的也是别人的方法，这里就不介绍了），三种信息可以结合下图来看：

Answer type：每个实体都有一定的描述信息，利用这些描述信息体现实体类别可以有效的缩小检索范围，这里用BiLSTM进行编码
Answer path：就是三元组中的关系信息，这里用了关系词向量的BiLSTM编码以及relation embedding的平均值拼接作为这一层面的信息
Answer context：利用 candidate answer 周边的信息来约束答案，比如 Jon A. Husted 周围的government position titlesecretary of state 和 starting date 2011-01-09，这是解决有些question有指代歧义的问题的，比如问到“石头记”就可能指代电视剧或者书两种实体，他们附近的答案信息可以有效反馈约束信息。但是对于简单的问题这样反而会引入噪声，论文使用了两种解决方案：importance module（下面讲）和如果question和候选答案周围信息有重叠的情况下使用。

Key-value memory module使用了一个 key-value memory network来存储候选答案。将以上三种编码信息按 $d * 3$ 的形式分别存储到（key，value）中。

3、Reasoning module
整个框架的核心部分就是这个推理模块。

KB-aware attention module

对 $H^Q$ 做self-attention后 $\mathbf{A}^{Q Q}=\operatorname{softmax}\left(\left(\mathbf{H}^{Q}\right)^{T} \mathbf{H}^{Q}\right)$ 再用BiLSTM编码得到 question vector： $\mathbf{q}=\operatorname{BiLSTM}\left(\left[\mathbf{H}^{Q} \mathbf{A}^{Q Q^{T}}, \mathbf{H}^{Q}\right]\right)$ 。后面就像一个 Multi-head Attention一样拼接三个信息流得到 KB summary ： $\mathbf{m}=\left[\mathbf{m}_{t} ; \mathbf{m}_{p} ; \mathbf{m}_{c}\right]$ ，将其与 $H^Q$ 相乘得到 $q$ 中每个单词 $q_i$ 与KB信息的相关性，用maxpool、softmax得到 $\tilde{\mathbf{a}}^{Q}$ ，他代表的是问句中每个单词 $q_i$ 对于 $t y p e, p a t h, c o n t e x t$ 的权重分配。
Importance module

其中 $A^{QM}$ 建模了三种信息各自对于 $q$ 的联系， $\tilde{\mathbf{A}}^{M}$ 表示每种信息对于候选答案的重要程度。然后将权重赋予key值得到 *question-aware memory representations $\tilde{\mathbf{M}}^{k}$ 。
Enhancing module
这个模块的式子写的很复杂，相当于在之前得到的互信息注意力机制权重的基础上对于原始的 $q$ 和 KB信息做augmentation。对于 $q$ 来说，标准化 $\mathbf{A}_{M}^{Q}=\max _{k}\left\{\mathbf{A}_{ . . ., k}^{Q M}\right\}_{k=1}^{3}$ 得到 $\tilde{\mathbf{A}}_{M}^{Q}$ 并把它结合到 question representation： $\tilde{\mathbf{H}}^{Q}=\mathbf{H}^{Q}+\tilde{\mathbf{a}}^{Q} \odot\left(\tilde{\mathbf{A}}_{M}^{Q} \tilde{\mathbf{M}}^{v}\right)^{T}$ ，最终的 KB-enhanced question representation： $\tilde{\mathbf{q}}=\tilde{\mathbf{H}}^{Q} \tilde{\mathbf{a}}^{Q}$
同样的，对于KB来说，增强后的 question-enhanced KB representation $\overline{\mathbf{M}}^{k}$ ：
$\begin{aligned} \overline{\mathbf{M}}^{k} &=\tilde{\mathbf{M}}^{k}+\tilde{\mathbf{a}}^{M} \odot\left(\tilde{\mathbf{A}}_{Q}^{M}\left(\tilde{\mathbf{H}}^{Q}\right)^{T}\right) \\ \tilde{\mathbf{a}}^{M} &=\left(\tilde{\mathbf{A}}_{M}^{Q}\right)^{T} \tilde{\mathbf{a}}^{Q} \in \mathbb{R}^{|A| \times 1} \\ \tilde{\mathbf{A}}_{Q}^{M} &=\operatorname{softmax}\left(\mathbf{A}_{M}^{Q^{T}}\right) \in \mathbb{R}^{|A| \times|Q|} \end{aligned}$
Generalization modul
最后的答案生成模块将上述的两个输出做attention、GRU，并用残差和batch mormalization得到最终的输出 $\hat{\mathbf{q}}$ ：
$\mathbf{a}=\operatorname{Att}_{\mathrm{add}}^{\mathrm{GRU}}\left(\tilde{\mathbf{q}},\overline{\mathbf{M}}^{k}\right)$ $\tilde{\mathbf{m}}=\sum_{i=1}^{|A|} a_{i} \cdot \tilde{\mathbf{M}}_{i}^{v}$ $\mathbf{q}^{\prime}=\operatorname{GRU}(\tilde{\mathbf{q}}, \tilde{\mathbf{m}})$ $\hat{\mathbf{q}}=\mathrm{BN}\left(\tilde{\mathbf{q}}+\mathbf{q}^{\prime}\right)$

4、Answer module
简单的目标函数： $S(\mathbf{q}, \mathbf{a})=\mathbf{q}^{T} \cdot \mathbf{a}$ 计算 $\hat{\mathrm{q}}$ 和每个候选 answer 的匹配得分并排序。

损失函数还是基于 hinge loss：
$\ell(y, \hat{y})=\max (0,1+\hat{y}-y)$ $g(\mathbf{q},\mathbf{M})=\sum_{a^{+} \in A^{+}} \ell\left(S\left(\mathbf{q}, \mathbf{M}_{a^{+}}\right), S\left(\mathbf{q}, \mathbf{M}_{a^{-}}\right)\right)$ $\begin{aligned} o=g\left(\mathbf{H}^{Q} \tilde{\mathbf{a}}^{Q}\right.&, \sum_{j=1}^{3} \mathbf{M}_{\cdot, j}^{k} )+g\left(\tilde{\mathbf{q}}, \overline{\mathbf{M}}^{k}\right) \\ &+g\left(\hat{\mathbf{q}}, \overline{\mathbf{M}}^{k}\right)+g\left(\mathbf{q}^{w}, \mathbf{H}^{t_{2}}\right) \end{aligned}$

总结
这篇文章并没有拿MemNN做多跳的推理，因为训练测试集里对于每个entity数据都会挖掘2-hop以内answer的，其实还是有点失望的，这种是针对数据集本身的特性做出的而不能泛化到更复杂的数据集上，但是它里面的互注意力机制在对 q 和 KB 的建模起到十分关键的作用。

最后

记忆网络能很好地针对QA任务中的Multi-hop特性，如阅读理解中的上下文推理、多篇章的答案抽取，如KBQA中的多关系多实体的问题，如对话系统中的状态跟踪、多轮对话，最近facebook还用memory嵌入BERT体系大大提高BERT的效率，更多运用个人认为还是可以继续跟进的。
另外因为是由KBQA引入的记忆网络，所以这里很多关于记忆网络其他的论文没有提及，还有 Gate MemNN、Dynamic Memory Networks 等论文可以做进一步研究，也有一些写的质量很好的博客可以参考：
知乎专栏-记忆网络

C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
为什么会出现“与此站点的连接不安全”警告？
当浏览器弹出“与此站点的连接不安全”的红色警告时，不仅会让访客感到不安，还可能直接导致用户流失、品牌信誉受损，甚至引发数据泄露风险。作为网站运营者，如何快速解决这一问题？一、为什么会出现“与此站点的连接不安全”警告？浏览器提示“不安全连接”，本质上是检测到当前网站与用户之间的数据传输未经过加密保护。以下是触发警告的常见原因：1.未安装SSL证书SSL（SecureSocketsLayer）证书是网
求是网：“内卷式”竞争的突出表现和主要危害有哪些？加百力财经研究科技知识人工智能大数据
"内卷式"竞争主要表现为：企业层面的低价竞争、同质化竞争和营销"逐底竞争"；地方政府层面的违规优惠政策、盲目重复建设和设置市场壁垒。危害体现在三个层面：微观上导致"劣币驱逐良币"，损害消费者利益；中观上破坏行业生态，挤压产业链利润空间；宏观上扭曲资源配置，抑制创新活力。什么是“内卷式”竞争？概括其一般特征，是指经济主体为了维持市场地位或争夺有限市场，不断投入大量精力和资源，却没有带来整体收益增长的
WHQL签名怎么申请 GDCA SSL证书 windows
WHQL（WindowsHardwareQualityLabs）签名是微软对硬件和驱动程序进行认证的一种方式，以确保它们与Windows操作系统的兼容性和稳定性。以下是申请WHQL签名的基本步骤，供您参考：1.准备阶段准备硬件设备和驱动程序：确保您的硬件设备已经准备好，并且对应的驱动程序已经经过充分的测试，能够在各种配置和环境下正常工作。获取EV代码签名证书：根据微软的要求，驱动程序进行WHQL认
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
基于定制开发开源AI智能名片S2B2C商城小程序的社群游戏定制策略研究说私域人工智能小程序游戏
摘要：本文聚焦社群游戏定制领域，深入探讨以社群文化和用户偏好为导向的定制策略。通过分析互动游戏活动、社群文化塑造等关键要素，结合定制开发开源AI智能名片S2B2C商城小程序的技术特性，提出针对性游戏定制方案。研究旨在提升社群用户参与度与游戏体验，为社群游戏发展提供理论支持与实践指导。关键词：社群游戏定制；定制开发开源AI智能名片S2B2C商城小程序；社群文化；用户偏好一、引言在数字化社交蓬勃发展的
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
前端项目架构设计要领
1.架构设计的核心目标在设计前端项目架构时，核心目标是模块化、可维护、可扩展、可测试，以及开发效率的最大化。这些目标可以通过以下几个方面来实现：组件化：将UI功能封装为可复用的组件。模块化：将业务逻辑分解为独立的模块或服务。自动化构建与部署：实现自动化构建、测试和部署流程，减少人为操作的错误。代码规范化与检查：确保团队协作时，代码风格和质量一致。2.项目目录结构设计一个清晰合理的目录结构对大型项目
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
22、文档：Google Docs的强大与易用性 pear55 探索云技术的无限可能 Google Docs 云端文档语音输入
文档：GoogleDocs的强大与易用性1.GoogleDocs简介GoogleDocs是Google提供的在线办公套件的一部分，它是一个基于云端的文字处
ARM嵌入式可编程控制器技术开发拉勾科研工作室 arm开发
PLC自动化设计|毕业设计指导|工业自动化解决方案✨专业领域：PLC程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列PLC编程三菱/欧姆龙PLC应用触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：PLC控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以
Android ViewBinding 使用与封装教程积跬步DEV Android 开发实战大全 android
AndroidViewBinding使用与封装教程：一、ViewBinding是什么？核心功能：为每个XML布局文件自动生成一个绑定类（如ActivityMainBinding），直接暴露所有带ID的视图引用。优点：避免繁琐的findViewById()，类型安全且编译时检查。对比DataBinding：ViewBinding仅处理视图引用，无数据绑定功能。DataBinding支持双向数据绑定，
理解TCP连接中的进程阻塞与CPU调度机制 109702008 编程 #C语言网络 tcp/ip 网络人工智能
引言在计算机网络通信中，TCP连接的建立是一个经典的三次握手过程。当用户调用connect()函数发起连接时，内核会发送SYN报文并等待对方的SYN-ACK响应。此时，调用进程通常会进入阻塞状态，暂停执行直至连接成功或超时。这一机制看似简单，但其背后的内核实现却涉及进程调度、等待队列管理和CPU资源分配等复杂操作。本文将深入探讨阻塞状态的实现原理，并解析CPU在进程阻塞期间的行为。一、进程阻塞的实
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
基于开源AI智能名片链动2+1模式与S2B2C商城小程序的渠道选择策略研究说私域人工智能小程序
摘要：在数字化商业环境下，品牌与产品的渠道选择对其市场推广和运营成功至关重要。本文聚焦于如何依据自身品牌和产品特性，结合开源AI智能名片链动2+1模式与S2B2C商城小程序，运用科学的渠道选择方法，慎重挑选1-2个适宜平台，集中资源发力并取得成绩后再拓展其他渠道。通过理论分析与案例研究，探讨该策略的有效性和可行性，为企业渠道布局提供参考。关键词：渠道选择；开源AI智能名片；链动2+1模式；S2B2
深入解析 TCP 连接状态与进程挂起、恢复与关闭誰能久伴不乏 tcp/ip 网络服务器
文章目录深入解析TCP连接状态与进程挂起、恢复与关闭一、TCP连接的各种状态1.**`LISTEN`**（监听）2.**`SYN_SENT`**（SYN已发送）3.**`SYN_RECEIVED`**（SYN已接收）4.**`ESTABLISHED`**（已建立）5.**`FIN_WAIT_1`**（关闭等待1）6.**`FIN_WAIT_2`**（关闭等待2）7.**`CLOSE_WAIT`**
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比

KBQA知识图谱问答（二） 记忆网络Memory Network