achun_haha

BiMPM:Bilateral Multi-Perspctive Matching for Natural Language Sentences

导言

本论文的工作主要是在 'matching-aggregation'的sentence matching的框架下，通过增加模型的特征（实现P与Q的双向匹配和多视角匹配），来增加NLSM（Natural language sentence matching）的accuracy

Relation work

在NLSM中，主要有两个DL的框架：

Siamese框架：
介绍：在该框架中，相同的神经网络编码器（例如，CNN或RNN）被单独地应用于两个输入句子，使得P和Q两个句子中的两个被编码到同一嵌入空间中的句子向量中。然后，仅基于两个句子向量做出匹配决策。
优点： a、共享参数使模型更小更容易训练，b、句子矢量可用于可视化，也可以用到句子聚类和其他目的
缺点：两个句子之间没交互，可能丢失重要信息
matching-aggregation 框架
介绍：先对P和Q两个句子进行跟小粒度的匹配（word or contextual vectors），再对他们匹配的结果进行聚集，最后做出决策。
优点：抽取更多的两个句子交互性的特征
缺点：a、仅有word-by-word的匹配，粒度单一 b、P和Q匹配方向单一，只有P←Q的匹配；
BiMPM创新点：
在matching-aggregation基础上，a、增加P→Q和P←Q连个方向的匹配 b、在每个方向增加不同视角的匹配；

Our model essentially belongs to the“matching-aggregation”framework. Given two sentences P and Q, our model first encodes them with a bidirectional Long Short-Term Memory Network (BiLSTM). Next, we match the two encoded sentences in two directions P→Q and P←Q. In each matching direction, let’s say P→Q, each time step of Q is matched against all time-steps of P from multiple perspectives.

模型介绍

Overview

BiMPM模型的目标是学习条件概率分布：

\[Pr(y|P,Q) \]

模型一共5个部分组合而成：

Word Representation Layer： 输入的vector由word vector 与 character vector 拼接成
Context Representation Layer： 使用Bi-LSTM对P或Q的每个time-step进行上下文词嵌入（contextual embedding）进行编码。
Matching Layer： 使用cosine相似度函数，对经Context Representation层后，P中每个time-step 的contextual embedding与Q的所有（all）time-step进行多个（4个）视角的相似度计算（即P←Q相似度匹配），输出 matching vector。反之，反方向P→Q的相似度匹配亦然。
Aggregation Layer： 针对Matching Layer输出P或Q每个 time-step的matching vector，用Bi-LSTM进行相似度的聚集成固定长度(fixed-matching)的matching vector，并仅仅将Bi-LSTM两个方向最后一个(last) time-step 的 fixed-matching matching vector 作为该层输出，P与Q分别各输出两个fixed-matching matching vector 。
Prediction Layer： 两层全连接层对4个fixed-matching matching vector 进行总结‘consume’，并用Softmax函数作为输出。

Word Representation Layer

为了增加更多的特征信息，该层输入的词向量采用word +character的形式，增加输入不同粒度的信息。

word vector：
维度：300-d
来源：GloVe 预训练的词向量 or word2vec
character vector：
维度：50-d
来源：用LSTM在其他NLSM任务中训练，初始化为20-d，经过LSTM后输出50-d
输出：将word vector 连接 character vector 句子，该层的输出为 P：$p_i$ 和句子 Q：$q_i$

        #https://github.com/pengshuang/Text-Similarity/blob/master/models/BiMPM.py
        if self.args.use_char_emb:
            # (batch, seq_len, max_word_len) -> (batch * seq_len, max_word_len)
            seq_len_p = kwargs['char_p'].size(1)
            seq_len_h = kwargs['char_h'].size(1)

            char_p = kwargs['char_p'].view(-1, self.args.max_word_len)
            char_h = kwargs['char_h'].view(-1, self.args.max_word_len)
            
            # 用LSTM 将（max_word_len, char_dim）维输出为 （char_hidden_size）维vector
            # (batch * seq_len, max_word_len, char_dim)-> (1, batch * seq_len, char_hidden_size)
            _, (char_p, _) = self.char_LSTM(self.char_emb(char_p))
            _, (char_h, _) = self.char_LSTM(self.char_emb(char_h))
            # 
            # (batch, seq_len, char_hidden_size)
            char_p = char_p.view(-1, seq_len_p, self.args.char_hidden_size)
            char_h = char_h.view(-1, seq_len_h, self.args.char_hidden_size)

            # (batch, seq_len, word_dim + char_hidden_size)
            # torch.cat是将两个张量（tensor）拼接在一起，cat是concatnate的意思，即拼接，联系在一起。
            # 若矩阵为2维矩阵，按维数0（行）拼接,#按维数1（列）拼接
            p = torch.cat([p, char_p], dim=-1)
            h = torch.cat([h, char_h], dim=-1)

Context Representation Layer

用Bi-LSTM对 P 或 Q 对输入每个time-step($p_i$ 和 $q_i$ )的进行上下文词嵌入编码（contexture embedding coding），即抽出上下文特征信息。
输入：每个time-step ( $p_i$ 和 $q_i$ )
输出：每个time-step( $\overrightarrow{h^p_i}$ 、 $\overleftarrow{h^p_i}$ 和 $\overrightarrow{h^q_i}$ 、 $\overleftarrow{h^q_i}$)

句子 P 的$p_i$上下文词嵌入编码：
句子 Q 的$q_i$上下文词嵌入编码：
示意图：

Matching Layer （创新点）

Matching Layer 中主要负责 P 与 Q 之间 cosine 相似度的匹配计算。其中，主要创新点有两个（BiMPM：bilateral multi-perspective matching）：

0、consine相似度匹配函数

在此，对Matching Layer 中，定义了cosine相似度匹配函数 $f_m$ ，计算两个向量的相似度，公式如下：

\[m=f_m (v_1,v_2 ;W) \]

其中$f_m$为$cosine$ 函数，$W$为可训练参数，$W\in R^{l\times d}$（$W$的维度是$l\times d$，$l$为视角数，$d$为输入向量的维度）。$m \in [m_1,...,m_k,...,m_l]$，并且 $m_k$表示第$k$个视角的相似度值，具体为：

\[m_k=cosine(W_k\circ v_1,W_k\circ v_2) \]

1、bilateral

双向相似度匹配。除了之前相关工作，只有 P 每个 time-step 与 Q 中所有 time-step 的，P←Q的单向相似度匹配外，增加了只有 Q 每个 time-step 与 P 中所有 time-step 的相似度匹配。即增加了P→Q方向的双向相似度匹配，即双向的相似度匹配。增加了P与Q的相似度的特征信息。

2、multi-perspective

多视角相似度匹配。即在P←Q和P→Q中，有单一的每个 time-step 与另一个句子所有（all) time-step相似度匹配，变成每个 time-step 与另一个句子的Full-Matching（所有 time-step 总体相似度）/ Maxpooling-Matching（每个time-step 相似度中最大值） /Attentive-Matching（加权平均 time-step的相似度）/Max-Attentive-Matching 等四个不同视角相似度的匹配。（ps：括号里面为个人理解，不是直译，仅供参考。）

在此，以 $P ← Q$ 的 foward 方向 $\overrightarrow{P}$ ← $\overrightarrow{Q}$ 和 backward 方向 $\overleftarrow{P}$ ← $\overleftarrow{Q}$ 为例，分别对Full-Matching、Maxpooling-Matching、Attensive-Matching、Max-Attensive-Matching作简要说明。$P → Q$ 的 $\overrightarrow{P}$ → $\overrightarrow{Q}$ 和 $\overleftarrow{P}$ → $\overleftarrow{Q}$ 两个方向上的同理可得。(ps: $\overrightarrow{P}$ 指 P 在Bi-LSTM的foward放向的 time-step，$\overleftarrow{P}$ 指 P 在Bi-LSTM 二点backward放向的 time-step .)

Full-Matching： 句子P中，每一个time-step ${\overrightarrow h}_i^p$ 都与句子Q中，foward方向最后一个time-step 输出${\overrightarrow h}_N^q$，进行相似度匹配计算，公式表示为：

并且，$\overrightarrow{P}$ ← $\overrightarrow{Q}$ 的 Full-Matching 的图示为：

另外， $\overrightarrow{P}$ ← $\overrightarrow{Q}$ 的 Full-Matching 公式，则表示为：

为此，我个人理解为P 中每一个方向(foward/backward)的time-step，都与Q中所有time-step上文或下文（因为foward和backward相似度分开计算的）信息，做一个相似度匹配的计算。这是一个Q全文信息的视角。

Maxpooling-Matching： 句子P中，每一个 time-step ${\overrightarrow h}_i^p$ 都与句子Q中，foward方向每一个time-step ${\overrightarrow h}_i^q$，进行相似度计算$ {\overrightarrow m}_i$，并且经过Max-pooling 选取所有 time-step 相似度最大值 ${\overleftarrow m}_i^{max}$，公式表示为：

并且，$\overrightarrow{P}$ ← $\overrightarrow{Q}$ 的 Max-Matching 的图示为：

另外， $\overrightarrow{P}$ ← $\overrightarrow{Q}$ 的 Max-Matching 公式，则表示为：

同样，我个人理解为P 中每一个方向(foward/backward)的time-step，采用Max-pooling选择Q中所有time-step上文或下文相似度最高的信息。这是一个Q最大相似度的视角。

Attentive-Matching： 句子P中，每一个 time-step ${\overrightarrow h}_i^p$ 都与句子Q中，foward方向所有time-step的加权平均（attentive） ${\overrightarrow h}_i^{mean}$（权重为cosine距离），进行相似度计算 ${\overrightarrow m}_i^{att}$ 。其中，
${\overrightarrow h}_i^{mean}$ 的计算公式为：
$.$

因此，${\overrightarrow m}_i^{att}$的相似度计算则为：

并且，$\overrightarrow{P}$ ← $\overrightarrow{Q}$ 的 Attentive-Matching 的图示为：

另外， $\overrightarrow{P}$ ← $\overrightarrow{Q}$ 的 Attentive-Matching 公式，则表示为：

为此，我个人理解为P 中每一个方向(foward/backward)的time-step，与Q中所有time-step上文或下文加权平均值的${\overrightarrow h}_i^{mean}$，做一个相似度匹配的计算。这是一个Q平均相似度的视角。

Max-Attensive-Matching： 句子P中，每一个 time-step ${\overrightarrow h}_i^p$ 都与句子Q中，foward方向所有time-step的最大attentive的 ${\overrightarrow h}_i^{max}$，进行相似度计算${\overrightarrow m}_i^{max-att}$。（ps：与Max-pooling有点区别，Max-pooling选择所有经$f_m$计算后${\overrightarrow m}_i$中的最大值，其cosine相似度有可训练参数W参与计算。而这里，是纯粹${\overrightarrow h}_i^q$ 与${\overrightarrow h}_i^q$ 的cosine距离${\overrightarrow m}_{i,j}$（其cosine相似度没W参与计算），选择${\overrightarrow m}_{i,j}$对应最大的${\overrightarrow h}_i^q$，再计算出其相似度${\overrightarrow m}_i^{max-att}$）。另外，Max-Attensive-Matching 的公式与Attensive-Matching 极为相近，区别是${\overrightarrow h}_i^{mean}$ 变成 ${\overrightarrow h}_i^{max}$ ，而${\overrightarrow h}_i^{max}$计算公式为：

\[{\overrightarrow h}_i^{max} ← map( \underset{j \in (1...N)}{\max}({\overrightarrow \alpha}_{i,j})) \]

而$\overrightarrow{P}$ ← $\overrightarrow{Q}$ 的 Max-Attentive-Matching 的图示为：

为此，我个人理解为P 中每一个方向(foward/backward)的time-step，与Q中所有time-step上文或下文加权平均值的${\overrightarrow h}_i^{max}$，做一个相似度匹配的计算。这是一个Q每个time-step最大cosine距离相似度的视角。

3、BiMPM与之前Matching-Aggregation之间Matching Layerde的对比

总来的说，BiMPM的Matching Layer与之前的Matching-Aggregation匹配框架相比较：

匹配方向的创新：
之前：单向匹配：$P ← Q$（$\overrightarrow{P}$ ← $\overrightarrow{Q}$ 和 $\overleftarrow{P}$ ← $\overleftarrow{Q}$ ）
BiMPM：双向匹配： $P ← Q$（$\overrightarrow{P}$ ← $\overrightarrow{Q}$ 和 $\overleftarrow{P}$ ← $\overleftarrow{Q}$ ）和 $P→Q$（$\overrightarrow{P}$ → $\overrightarrow{Q}$ 和 $\overleftarrow{P}$ → $\overleftarrow{Q}$ ）!
匹配视觉的创新：
之前：单一视觉： Full-Matching
BiMPM：多种视觉： Full-Matching/ Maxpooling-Matching /Attentive-Matching/Max-Attentive-Matching
每个time-step输出的matching vector形式
之前：2个matching-vector concatenate。$\overrightarrow{P}$ ← $\overrightarrow{Q}$ 和 $\overleftarrow{P}$ ← $\overleftarrow{Q}$ 各单个视角的 matching vector 作 concatenate。
BiMPM：8个matching-vector concatenate。$\overrightarrow{P}$ ← $\overrightarrow{Q}$ 和 $\overleftarrow{P}$ ← $\overleftarrow{Q}$ （或$\overrightarrow{P}$ → $\overrightarrow{Q}$ 和 $\overleftarrow{P}$ → $\overleftarrow{Q}$ ）各4个视角的 matching vector 作 concatenate。

Aggregation Layer & Prediction Layer

该层将上层输出相似度向量matching-vector $m_i$，按Bi-LSTMde foward 和backward作信息聚合/特征提取，并将foward 和backward的最后time-step 的 fixed-length matching-vector 输出至2层全连接层的 Prediction Layer 中，最后采用 softmax 作分类。如图示，其中，图中4个绿色的vector为 fixed-length matching-vector：

实验与总结

Paraphrase Identification实验

1、BiMPM在NLSM中有效：在Paraphrase Identification实验中，BiMPM的Acc能高于之前state-of-art 2.6%。但对于实际应用，要考虑即训练难度和inference速率。
2、双向和四种视角都对BiMPM有部分促进作用。

Naural Language实验

1、BiMPM在inference任务中效果一般，甚至在相对与state-of-art还有差距。
2、虽然BiMPM在Ensemble情况下Acc最高，但也只搞0.5%，个人认为有待商榷。

Answer Sentence Selection实验

1、BiMPM在针对不同些数据集效果不同。

总体收获：

1、该模型给我最大的思路是，针对提升NLP任务的性能提升，可以从增加正向逆向与增视角信息的方面考虑（但还是有点炼丹学）。 2、cosine函数作为Matching Layer的输出，可以将其与sigmoid和tanh激活函数作简单比较，这里包含可训练参数W的cosine函数已经可以看作相似度的激活函数。它将P与Q信息投影至一个相似度空间，然后经过Aggregation Layer作相似度的信息聚合，经全连接层分类。

Cursor怎样设置中文 dkgee vscode
要将Cursor软件设置为中文，可以按照以下步骤进行操作：1.打开Cursor软件：首先，启动Cursor软件。2.打开命令面板：按下键盘组合键`Ctrl+Shift+P`，这将打开命令面板。3.输入语言配置命令：在命令面板的搜索框中输入`ConfigureDisplayLanguage`，然后按下回车键。4.选择中文：在弹出的选项中选择中文（Chinese），系统会提示您重启软件以应用更改。5.
When Large Language Models Meet Speech: A Survey on Integration Approaches UnknownBody LLM Daily Survey Paper 语言模型人工智能自然语言处理
主要内容研究背景：大语言模型（LLMs）在自然语言处理领域取得显著进展，其与语音的融合具有广泛应用前景，但缺乏相关集成方法的综述。文章将语音与LLMs集成方法分为基于文本、基于潜在表示和基于音频令牌三大类。集成方法基于文本的集成：通过级联集成、LLM重打分和LLM生成式错误纠正等方式，利用文本作为LLMs的输入和输出，处理语音相关任务，但存在信息损失和准确性与多样性平衡的问题。基于潜在表示的集成：
Github上神仙级大模型项目：大语言模型(LLM)入门学习路线图，三个月让你从大模型基础到精通！ AI大模型-大飞 github 语言模型学习人工智能 AI大模型程序员 AI
Github项目上有一个大语言模型学习路线笔记，它全面涵盖了大语言模型的所需的基础知识学习，LLM前沿算法和架构，以及如何将大语言模型进行工程化实践。这份资料是初学者或有一定基础的开发/算法人员入门活深入大型语言模型学习的优秀参考。这份资料重点介绍了我们应该掌握哪些核心知识，并推荐了一系列优质的学习视频和博客，旨在帮助大家系统性地掌握大型语言模型的相关技术。大语言模型（LargeLanguageM
基于roop/insightface将视频中包含指定人脸的视频片段提取并合并成新视频阆遤 python roop pytorch insightface
利用insightface.app.FaceAnalysis提最一个视频中包含指定人脸的视频片段，并将其合并成一个新视频，使用“buffalo_l”模型，模型需安装在代码当前目录下的.\models中。需要roop或其他支持pytorch、insightface、moviepy的环境。pytorch安装请见我其他文章。#cython:language_level=3str#-*-coding:ut
LLM：软件测试的颠覆性力量 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LLM：软件测试的颠覆性力量关键词：大语言模型（LLM）、软件测试、人工智能、测试自动化、测试效率、质量保证、测试革新1.背景介绍在当今快速发展的软件行业中，测试一直是确保产品质量的关键环节。随着人工智能技术的飞速进步，特别是大语言模型（LargeLanguageModels，简称LLM）的出现，软件测试领域正经历着前所未有的变革。LLM凭借其强大的自然语言处理能力和广泛的知识储备，正在重塑我们对
NLP高频面试题（七）——GPT和Bert的mask有什么区别？ Chaos_Wang_ NLP常见面试题自然语言处理 gpt bert
GPT和BERT的Mask机制对比：核心区别与优化策略在NLP领域，GPT和BERT是最具代表性的预训练语言模型之一。它们都在训练过程中使用了Mask机制来引导模型学习语言表示，但具体实现方式和目标却有所不同。本文将深入探讨GPT和BERT的Mask方法的核心区别，并分析其优化策略。1.BERT的Mask机制：基于MLM（MaskedLanguageModel）BERT（Bidirectional
基于ChatGPT、GIS与Python机器学习的地质灾害风险评估、易发性分析、信息化建库及灾后重建高级实践 weixin_贾防洪评价风险评估滑坡泥石流地质灾害
第一章、ChatGPT、DeepSeek大语言模型提示词与地质灾害基础及平台介绍【基础实践篇】1、什么是大模型？大模型（LargeLanguageModel,LLM）是一种基于深度学习技术的大规模自然语言处理模型。代表性大模型：GPT-4、BERT、T5、ChatGPT等。特点：多任务能力：可以完成文本生成、分类、翻译、问答等任务。上下文理解：能理解复杂的上下文信息。广泛适配性：适合科研、教育、行
文章去除AI味的指令 wirepuller_king AI word技巧人工智能
去AI味指令-1Role:AI文章人性化优化专家Profile:author:wirepullerVersion:5.2.0Language:中文Description:专门优化AI生成文章,使其更接近人类自然写作风格的专家Background:你是一位精通自然语言处理和人类写作风格的专家。你的任务是将AI生成的文章转化为更自然、更有人情味的文章,去除机械化和公式化的痕迹,增加文章的可读性和亲和力
GitHub项目推荐--基于LLM的开源爬虫项目惟贤箬溪穷玩Ai github 爬虫
以下是一些基于大语言模型（LLM，LargeLanguageModel）的开源爬虫项目，它们结合了自然语言处理（NLP）技术与爬虫的功能，能在一定程度上提升爬取的智能化和精度。这些项目可以用于自动化抓取、内容提取、数据分析等任务。1.GPT-3WebScraper简介：这是一个基于OpenAIGPT-3模型的网页抓取工具，利用GPT-3的自然语言理解能力来生成有用的爬虫策略、处理网页内容并提取有价
DPO 核心理论推导：参考策略距离约束下的最优策略 + 损失函数设计 iiiiii11 机器学习人工智能论文阅读笔记语言模型深度学习
Rafailov,Rafael,etal.“Directpreferenceoptimization:Yourlanguagemodelissecretlyarewardmodel.”AdvancesinNeuralInformationProcessingSystems36(2023):53728-53741.本文整理了DPO论文中两个核心结论的推导，包括参考策略距离约束下的最优策略的形式，以及
CLR中的类型转换 qzy0621 C#C++笔记 c++c#
CLR中的类型转换字符串类型转换容器类型转换自定义类型相互转换项目设置CLR（CommonLanguageRuntime，公共语言运行时）是微软.NET框架的核心组件，是微软对CLI标准的具体实现，负责管理和执行托管代码，提供跨语言互操作性、内存管理、安全性等关键服务CLR的类型转换机制是.NET框架中实现类型安全与多语言互操作的核心功能之一若调试不能命中，可参考C#通过CLR调用C++代码无法命
【数据库系统原理】Ch4 SQL与关系数据库基本操作 GIS程序媛—椰子数据库数据库 sql
目录大纲4.1SQL概述4.2MySQL预备知识4.3数据定义4.4数据更新4.5数据查询4.6视图习题真题2024-102024-042023-102023-042022-10大纲4.1SQL概述结构化查询语言(StructuredQueryLanguage,SQL)是关系数据库的标准语言,也是本课程需要掌握的一类语言。4.1.1SQL的发展了解SQL的产生和发展历程,要求达到"识记"层次。4.
用 pytorch 从零开始创建大语言模型（零）：汇总墨绿色的摆渡人用 pytorch 从零开始创建大语言模型 pytorch 语言模型人工智能
用pytorch从零开始创建大语言模型（零）：汇总本系列官方代码库：https://github.com/rasbt/LLMs-from-scratch/tree/main官方书籍：BuildaLargeLanguageModel(FromScratch)本系列文章：用pytorch从零开始创建大语言模型（一）：理解大型语言模型用pytorch从零开始创建大语言模型（二）：待更新用pytorch从
大语言模型学习路线：从入门到实战大模型官方资料语言模型学习人工智能产品经理自然语言处理搜索引擎
大语言模型学习路线：从入门到实战在人工智能领域，大语言模型（LargeLanguageModels,LLMs）正迅速成为一个热点话题。本学习路线旨在为有基本Python编程和深度学习基础的学习者提供一个清晰、系统的大模型学习指南，帮助你在这一领域快速成长。本学习路线更新至2024年02月，后期部分内容或工具可能需要更新。适应人群已掌握Python基础具备基本的深度学习知识学习步骤本路线将通过四个核
PyTorch深度学习框架60天进阶学习计划 - 第28天：多模态模型实践（一）凡人的AI工具箱深度学习 pytorch 学习 AI编程人工智能 python
PyTorch深度学习框架60天进阶学习计划-第28天：多模态模型实践（一）引言：跨越感知的边界欢迎来到我们的PyTorch学习旅程第28天！今天我们将步入AI世界中最激动人心的领域之一：多模态学习。想象一下，如果你的模型既能"看"又能"读"，并且能够理解图像与文字之间的联系，这将为我们打开怎样的可能性？今天我们将专注于构建图文匹配系统，学习如何使用CLIP（ContrastiveLanguage
深入了解 C# 中的 LINQ：功能、语法与应用解析江沉晚呤时 Net core C#solr lucene c#.netcore
1.什么是LINQ？LINQ（LanguageIntegratedQuery，语言集成查询）是C#和其他.NET语言中的一种强大的查询功能，它允许开发者在语言中直接执行查询操作。LINQ使得开发者可以使用C#语法（或VB.NET）直接对集合、数据库、XML等数据源进行查询和操作，而不需要依赖外部查询语言（如SQL）或者复杂的API。LINQ提供了一个统一的查询模型，可以对各种数据源进行查询，包括集
【NLP】 API在大语言模型中的应用 Nerous_ 深度学习自然语言处理语言模型人工智能
大语言模型（LargeLanguageModels,LLMs）通过API（应用程序接口）为开发者提供了便捷的调用方式，使其能够快速集成自然语言处理能力到各类应用中。以下是API在LLM中的核心应用场景及技术实现细节：一、核心应用场景自然语言理解与生成应用示例：智能客服：解析用户问题并生成回复（如ChatGPTAPI）。内容创作：自动生成文章、广告文案或代码（如OpenAI的GPT-4）。技术实现：
HRM：分层多步奖励模型大模型最新论文速读深度学习语言模型人工智能自然语言处理
论文标题TowardsHierarchicalMulti-StepRewardModelsforEnhancedReasoninginLargeLanguageModels论文地址https://arxiv.org/pdf/2503.13551代码地址https://github.com/tengwang0318/hierarchial_reward_model作者背景香港大学，北京大学，新加坡国
mysql修改表中所有字段不许为空_如何用SQL语句修改一个表的字段，让它不能为空... Asama浅间
展开全部ALTERTABLE表ALTERCOLUMN[字段名]字段类型NOTNULLSQL语句1、基32313133353236313431303231363533e78988e69d8331333365643661本介绍：sql语句是对数据库进行操作的一种语言。结构化查询语言(StructuredQueryLanguage)简称SQL，结构化查询语言是一种数据库查询和程序设计语言，用于存取数据以
Linux学习1_Linux命令及英文全称 Wang_Zhenwei —Linux 转载 linux
LinuxCommandreferences(命令全称，方便记忆)aliasCreateyourownnameforacommandarchprintmachinearchitectureashashcommandinterpreter(shell)awk(gawk)patternscanningandprocessinglanguagebasenameRemovedirectoryandsuff
【MyDB】6-TabelManager 字段与表管理之2-SQL语句解析 -$_$- Java项目 sql python 数据库
【MyDB】6-TabelManager字段与表管理之2-SQL语句解析前言SQL语法Parser类具体实现入口方法Parse(byte[]statement)事务控制parseBegin()parseCommit()，parseAbortDDL(DataDefinitionLanguage)parseCreate()parseDrop()DML语句parseSelect()parseInsert
CAPL变量输出的格式说明符正当少年 CAPL CAPL
在CAPL（CANAccessProgrammingLanguage）中，变量输出的格式说明符用于控制变量在输出时的显示格式。以下是常用的CAPL变量输出格式说明符分类整理：以下是CAPL变量格式说明符的具体实例，展示了如何使用这些说明符来输出不同类型的变量：1.整数类型%d输出有符号十进制整数。intx=123;write("Value:%d",x);//输出:Value:123%u输出无符号十
【MySQL必知必会】数据库操纵语言（DML）超全总结：增删改查一文搞定！秀儿还能再秀数据库 MySQL 学习笔记
一、DML简介数据库操纵语言（DataManipulationLanguage,DML）是SQL的核心组成部分，主要用于对数据库中的数据进行增（INSERT）、删（DELETE）、改（UPDATE）、查（SELECT）操作，掌握DML都是必备技能！二、核心操作详解1.插入数据：INSERT--插入单条数据（全字段）INSERTINTO表名VALUES(值1,值2,...);--指定字段插入INSE
【BERT和GPT的区别】调皮的芋头人工智能深度学习机器学习 bert gpt
BERT采用完形填空（MaskedLanguageModeling,MLM）与GPT采用自回归生成（AutoregressiveGeneration）的差异，本质源于两者对语言建模的不同哲学导向与技术目标的根本分歧。这种选择不仅塑造了模型的架构特性，更决定了其应用边界与能力上限。以下从语言建模本质、任务适配性、技术约束及后续影响四个维度深入剖析：一、语言建模的本质差异1.BERT的“全知视角”与全
HTML 教程：从零开始掌握常用语法 LoveYa! 前端 html 前端笔记学习
免费无广纯净版微信小程序测mbti很有趣，不需要任何授权，也不需要登录，直接就是测，几分钟了解自己的人格mbti，快来试试吧。可以微信直接搜索小程序名“一秒MBTI”HTML教程：从零开始掌握常用语法欢迎来到HTML的世界！HTML（HyperTextMarkupLanguage，超文本标记语言）是网页开发的基石，它负责定义网页的结构和内容。无论你是想成为一名前端开发者，还是仅仅想了解网页背后的魔
【VSCode】VSCode常用插件 Ctrl Z. vscode ide 编辑器
Chinese(Simplified)(简体中文)LanguagePackforVisualStudioCode：简体中文支持插件HTML/CSS/JavaScriptSnippets：支持HTML/CSS/JavaScript快速匹配输入HTMLSnippets：这个插件提供了一系列HTML代码片段，通过简单的缩写就可以快速生成常用的HTML结构。例如，输入!并按下Tab键，就可以快速生成一个完
LangChain入门：使用Python和通义千问打造免费的Qwen大模型聊天机器人南七小僧人工智能网站开发 AI技术产品经理服务器数据库 windows
前言LangChain是一个用于开发由大型语言模型（LargeLanguageModels，简称LLMs）驱动的应用程序的框架。它提供了一个灵活的框架，使得开发者可以构建具有上下文感知能力和推理能力的应用程序，这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。LangChain库：Python和JavaScript库。包含了各种组件的接口和集成，一个基本的运行时，用于将这些组件组合
大规模语言模型从理论到实践分布式训练的集群架构 AI智能涌现深度研究 DeepSeek R1 &大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大规模语言模型从理论到实践分布式训练的集群架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，大规模语言模型（LargeLanguageModels,LLMs）在自然语言处理（NaturalLanguageProcessing,NLP）领域取得了突破性进展。LLMs，如BERT、GPT-3等，通
【论文阅读】MMedPO：用临床感知多模态偏好优化调整医学视觉语言模型勤奋的小笼包论文阅读语言模型人工智能自然语言处理 chatgpt
MMedPO：用临床感知多模态偏好优化调整医学视觉语言模型1.背景2.核心问题：3.方法：3.实验结果与优势4.技术贡献与意义5.结论MMedPO:AligningMedicalVision-LanguageModelswithClinical-AwareMultimodalPreferenceOptimizationMMedPO：用临床感知多模态偏好优化调整医学视觉语言模型gitgub:地址1.
Python前端开发 PITSU 正则表达式 html css3 mysql
Python前端开发1.前端三剑客（HTML，CSS和JavaScript）1.1HTML1.1.1HTML简介HyperTextMark-upLanguage,指的是超文本标记语言；html是开发网页的语言；html中的标签大多数都是成对出现的,格式:1.1.2HTML结构第一行是文档声明部分HTML：分为页头，页身和页脚。标签大部分是成对出现1.1.3第一行文档声明部分HTML在vscode中
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n