lqfarmer

Deep LSTM siamese network for text similarity源码分析

获得更多深度学习在NLP方面应用的经典论文、实践经验和最新消息，欢迎关注微信公众号“DeepLearning_NLP” 或者扫描头像二维码添加关注。

上文讲解了基于SimaseLSTM来计算两个句子或单词之间相关性的原理和个人的一些经验这里来分析一下源码是怎么实现的：

Github实现地址：https://github.com/dhwajraj/deep-siamese-text-similarity

具体实现的是文章SiameseRecurrent Architectures for Learning Sentence Similarity所提出的网络结构，实现代码主要分为模型定义siamese_network.py，数据处理input_helpers.py，模型训练train.py三个部分。

第一部分是输入训练样本处理函数input_helpers.py：

class InputHelper(object):
#读取输入的文件，文件分为三行，行与行之间用\t分隔开，前两行为需要计算相似度的两个句子，后两行为类别标记
def getTsvData(self, filepath):
print("Loading training data from "+filepath)
x1=[]
x2=[]
y=[]
# positive samples from file
for line in open(filepath):
l=line.strip().split("\t")
if len(l)<2:
continue
#随机打乱两个句子之间的位置关系
if random() > 0.5:
x1.append(l[0].lower())
x2.append(l[1].lower())
else:
x1.append(l[1].lower())
x2.append(l[0].lower())
#默认原始数据为正样本
y.append(1)#np.array([0,1]))
# generate random negative samples
combined = np.asarray(x1+x2)
shuffle_indices = np.random.permutation(np.arange(len(combined)))
combined_shuff = combined[shuffle_indices]
#对两个句子进行拼接，做为负样本
for i in xrange(len(combined)):
x1.append(combined[i])
x2.append(combined_shuff[i])
y.append(0) #np.array([1,0]))
return np.asarray(x1),np.asarray(x2),np.asarray(y)

def getTsvTestData(self, filepath):
#获得测试数据
print("Loading testing/labelled data from "+filepath)
x1=[]
x2=[]
y=[]
# positive samples from file
for line in open(filepath):
l=line.strip().split("\t")
if len(l)<3:
continue
x1.append(l[1].lower())
x2.append(l[2].lower())
y.append(int(l[0])) #np.array([0,1]))
return np.asarray(x1),np.asarray(x2),np.asarray(y)

def batch_iter(self, data, batch_size, num_epochs, shuffle=True):
"""
生成训练需要使用的minibatch数据
"""
data = np.asarray(data)
print(data)
print(data.shape)
data_size = len(data)
num_batches_per_epoch = int(len(data)/batch_size) + 1
for epoch in range(num_epochs):
# Shuffle the data at each epoch
if shuffle:
shuffle_indices = np.random.permutation(np.arange(data_size))
shuffled_data = data[shuffle_indices]
else:
shuffled_data = data
for batch_num in range(num_batches_per_epoch):
start_index = batch_num * batch_size
end_index = min((batch_num + 1) * batch_size, data_size)
#生成训练样本minibatch的迭代器
yield shuffled_data[start_index:end_index]

def dumpValidation(self,x1_text,x2_text,y,shuffled_index,dev_idx,i):
print("dumping validation "+str(i))
x1_shuffled=x1_text[shuffled_index]
x2_shuffled=x2_text[shuffled_index]
y_shuffled=y[shuffled_index]
x1_dev=x1_shuffled[dev_idx:]
x2_dev=x2_shuffled[dev_idx:]
y_dev=y_shuffled[dev_idx:]
del x1_shuffled
del y_shuffled
with open('validation.txt'+str(i),'w') as f:
for text1,text2,label in zip(x1_dev,x2_dev,y_dev):
f.write(str(label)+"\t"+text1+"\t"+text2+"\n")
f.close()
del x1_dev
del y_dev

# Data Preparatopn
# ==================================================


def getDataSets(self, training_paths, max_document_length, percent_dev, batch_size):
#读取训练样本
x1_text, x2_text, y=self.getTsvData(training_paths)

# 根据训练样本构建词典，并且把词典存放到本地，用于训练样本时构建句子的词向量
print("Building vocabulary")
#根据词的出现顺序构造hashmap，由此构建词典。这种方法比较构建词向量虽然效率高但精度不高，建议自己用word2vec来train一个词表
vocab_processor = MyVocabularyProcessor(max_document_length,min_frequency=0)
vocab_processor.fit_transform(np.concatenate((x2_text,x1_text),axis=0))
print("Length of loaded vocabulary ={}".format( len(vocab_processor.vocabulary_)))
i1=0
train_set=[]
dev_set=[]
sum_no_of_batches = 0
x1 = np.asarray(list(vocab_processor.transform(x1_text)))
x2 = np.asarray(list(vocab_processor.transform(x2_text)))
# Randomly shuffle data
np.random.seed(131)
shuffle_indices = np.random.permutation(np.arange(len(y)))
x1_shuffled = x1[shuffle_indices]
x2_shuffled = x2[shuffle_indices]
y_shuffled = y[shuffle_indices]
dev_idx = -1*len(y_shuffled)*percent_dev//100
del x1
del x2
# 对训练集和测试集进行切分
self.dumpValidation(x1_text,x2_text,y,shuffle_indices,dev_idx,0)
# TODO: This is very crude, should use cross-validation
x1_train, x1_dev = x1_shuffled[:dev_idx], x1_shuffled[dev_idx:]
x2_train, x2_dev = x2_shuffled[:dev_idx], x2_shuffled[dev_idx:]
y_train, y_dev = y_shuffled[:dev_idx], y_shuffled[dev_idx:]
print("Train/Dev split for {}: {:d}/{:d}".format(training_paths, len(y_train), len(y_dev)))
sum_no_of_batches = sum_no_of_batches+(len(y_train)//batch_size)
train_set=(x1_train,x2_train,y_train)
dev_set=(x1_dev,x2_dev,y_dev)
gc.collect()
return train_set,dev_set,vocab_processor,sum_no_of_batches

def getTestDataSet(self, data_path, vocab_path, max_document_length):
#获取测试数据，方法与构造训练样本相同
x1_temp,x2_temp,y = self.getTsvTestData(data_path)

# Build vocabulary
vocab_processor = MyVocabularyProcessor(max_document_length,min_frequency=0)
vocab_processor = vocab_processor.restore(vocab_path)
print len(vocab_processor.vocabulary_)

x1 = np.asarray(list(vocab_processor.transform(x1_temp)))
x2 = np.asarray(list(vocab_processor.transform(x2_temp)))
# Randomly shuffle data
del vocab_processor
gc.collect()
return x1,x2, y

第二部分是模型的定义siamese_network.py：

class SiameseLSTM(object):
"""
A LSTM based deep Siamese network for text similarity.
Uses an character embedding layer, followed by a biLSTM and Energy Loss layer.
"""
#定义了一个双向的lstm结构，虽然tensorflow提供了双向rnn的函数tf.nn.bidirectional_rnn()，本人觉得这个并不好使用，因为不方便修改网络的结构
#实际训练时用起来也不方便
def BiRNN(self, x, dropout, scope, embedding_size, sequence_length):
n_input=embedding_size
n_steps=sequence_length
n_hidden=n_steps
n_layers=3
# Prepare data shape to match `bidirectional_rnn` function requirements
# Current data input shape: (batch_size, n_steps, n_input) (?, seq_len, embedding_size)
# Required shape: 'n_steps' tensors list of shape (batch_size, n_input)
# Permuting batch_size and n_steps
x = tf.transpose(x, [1, 0, 2])
# Reshape to (n_steps*batch_size, n_input)
x = tf.reshape(x, [-1, n_input])
# Split to get a list of 'n_steps' tensors of shape (batch_size, n_input)
x = tf.split(0, n_steps, x)
print(x)
# Define lstm cells with tensorflow
# Forward direction cell
#定义正向LSTM，也可以替换为GRU，本人实践发现训练速度更快
with tf.name_scope("fw"+scope),tf.variable_scope("fw"+scope):
print(tf.get_variable_scope().name)
fw_cell = tf.nn.rnn_cell.BasicLSTMCell(n_hidden, forget_bias=1.0, state_is_tuple=True)
lstm_fw_cell = tf.nn.rnn_cell.DropoutWrapper(fw_cell,output_keep_prob=dropout)
lstm_fw_cell_m=tf.nn.rnn_cell.MultiRNNCell([lstm_fw_cell]*n_layers, state_is_tuple=True)
# Backward direction cell
#定义反向LSTM
with tf.name_scope("bw"+scope),tf.variable_scope("bw"+scope):
print(tf.get_variable_scope().name)
bw_cell = tf.nn.rnn_cell.BasicLSTMCell(n_hidden, forget_bias=1.0, state_is_tuple=True)
lstm_bw_cell = tf.nn.rnn_cell.DropoutWrapper(bw_cell,output_keep_prob=dropout)
lstm_bw_cell_m = tf.nn.rnn_cell.MultiRNNCell([lstm_bw_cell]*n_layers, state_is_tuple=True)
# Get lstm cell output
#try:
#把正负向LSTM包到一起
with tf.name_scope("bw"+scope),tf.variable_scope("bw"+scope):
outputs, _, _ = tf.nn.bidirectional_rnn(lstm_fw_cell_m, lstm_bw_cell_m, x, dtype=tf.float32)
# except Exception: # Old TensorFlow version only returns outputs not states
# outputs = tf.nn.bidirectional_rnn(lstm_fw_cell_m, lstm_bw_cell_m, x,
# dtype=tf.float32)
#将正向输出和负向输出拼接到一起，并取出最后时刻得输出，这里这样做并不合适，因为当句子的长度比maxSenLen短时，实际不足的部分是
#补0的，相当于引入噪声，这里最好求平均，tf.reduce_sum(outputs,0)做为输出，并且为提升效果，还可以串接一个全连接层
return outputs[-1]

def contrastive_loss(self, y,d,batch_size):
#论文中的cos目标函数
tmp= y *tf.square(d)
#tmp= tf.mul(y,tf.square(d))
tmp2 = (1-y) *tf.square(tf.maximum((1 - d),0))
return tf.reduce_sum(tmp +tmp2)/batch_size/2

def __init__(
self, sequence_length, vocab_size, embedding_size, hidden_units, l2_reg_lambda, batch_size):

# Placeholders for input, output and dropout
self.input_x1 = tf.placeholder(tf.int32, [None, sequence_length], name="input_x1")
self.input_x2 = tf.placeholder(tf.int32, [None, sequence_length], name="input_x2")
self.input_y = tf.placeholder(tf.float32, [None], name="input_y")
self.dropout_keep_prob = tf.placeholder(tf.float32, name="dropout_keep_prob")

# Keeping track of l2 regularization loss (optional)
l2_loss = tf.constant(0.0, name="l2_loss")

# 把两个输入转换为句子向量
with tf.name_scope("embedding"):
self.W = tf.Variable(
tf.random_uniform([vocab_size, embedding_size], -1.0, 1.0),
trainable=True,name="W")
self.embedded_chars1 = tf.nn.embedding_lookup(self.W, self.input_x1)
#self.embedded_chars_expanded1 = tf.expand_dims(self.embedded_chars1, -1)
self.embedded_chars2 = tf.nn.embedding_lookup(self.W, self.input_x2)
#self.embedded_chars_expanded2 = tf.expand_dims(self.embedded_chars2, -1)
#构建两个双向LSTM并获得输出，
# Create a convolution + maxpool layer for each filter size
with tf.name_scope("output"):
#两个双向LSTM处于不同的variable_scope下，所以是两套参数
self.out1=self.BiRNN(self.embedded_chars1, self.dropout_keep_prob, "side1", embedding_size, sequence_length)
self.out2=self.BiRNN(self.embedded_chars2, self.dropout_keep_prob, "side2", embedding_size, sequence_length)
#计算两个堆叠的双LSTM的输出特征的余弦相似度
self.distance = tf.sqrt(tf.reduce_sum(tf.square(tf.sub(self.out1,self.out2)),1,keep_dims=True))
self.distance = tf.div(self.distance, tf.add(tf.sqrt(tf.reduce_sum(tf.square(self.out1),1,keep_dims=True)),tf.sqrt(tf.reduce_sum(tf.square(self.out2),1,keep_dims=True))))
self.distance = tf.reshape(self.distance, [-1], name="distance")
with tf.name_scope("loss"):
#与target对比，构造损失函数
self.loss = self.contrastive_loss(self.input_y,self.distance, batch_size)
with tf.name_scope("accuracy"):
#这部分实际没用，当采用softmax做为损失函数时可以使用
correct_predictions = tf.equal(self.distance, self.input_y)
self.accuracy=tf.reduce_mean(tf.cast(correct_predictions, "float"), name="accuracy")

最后一部分，模型训练模型训练train.py：

#! /usr/bin/env python

import tensorflow as tf
import numpy as np
import re
import os
import time
import datetime
import gc
from input_helpers import InputHelper
from siamese_network import SiameseLSTM
from tensorflow.contrib import learn
import gzip
from random import random
# Parameters
# ==================================================
#超参数的定义
tf.flags.DEFINE_integer("embedding_dim", 100, "Dimensionality of character embedding (default: 300)")
tf.flags.DEFINE_float("dropout_keep_prob", 0.5, "Dropout keep probability (default: 0.5)")
tf.flags.DEFINE_float("l2_reg_lambda", 0.0, "L2 regularizaion lambda (default: 0.0)")
tf.flags.DEFINE_string("training_files", "person_match.train2", "training file (default: None)")
tf.flags.DEFINE_integer("hidden_units", 50, "Number of hidden units in softmax regression layer (default:50)")

# Training parameters
tf.flags.DEFINE_integer("batch_size", 64, "Batch Size (default: 64)")
tf.flags.DEFINE_integer("num_epochs", 300, "Number of training epochs (default: 200)")
tf.flags.DEFINE_integer("evaluate_every", 1000, "Evaluate model on dev set after this many steps (default: 100)")
tf.flags.DEFINE_integer("checkpoint_every", 1000, "Save model after this many steps (default: 100)")
# Misc Parameters
tf.flags.DEFINE_boolean("allow_soft_placement", True, "Allow device soft device placement")
tf.flags.DEFINE_boolean("log_device_placement", False, "Log placement of ops on devices")

#打印输出各个超参数的值
FLAGS = tf.flags.FLAGS
FLAGS._parse_flags()
print("\nParameters:")
for attr, value in sorted(FLAGS.__flags.items()):
print("{}={}".format(attr.upper(), value))
print("")

if FLAGS.training_files==None:
print "Input Files List is empty. use --training_files argument."
exit()

#设置训练样本最大长度，> 30个词的句子被截断，小于30则补0
max_document_length=30
inpH = InputHelper()
#读取训练样本，词表
train_set, dev_set, vocab_processor,sum_no_of_batches = inpH.getDataSets(FLAGS.training_files,max_document_length, 10, FLAGS.batch_size)

# Training
# ==================================================
print("starting graph def")
#配置并启动图
with tf.Graph().as_default():
session_conf = tf.ConfigProto(
allow_soft_placement=FLAGS.allow_soft_placement,
log_device_placement=FLAGS.log_device_placement)
sess = tf.Session(config=session_conf)
print("started session")
with sess.as_default():
#初始化simasemodel
siameseModel = SiameseLSTM(
sequence_length=max_document_length,
vocab_size=len(vocab_processor.vocabulary_),
embedding_size=FLAGS.embedding_dim,
hidden_units=FLAGS.hidden_units,
l2_reg_lambda=FLAGS.l2_reg_lambda,
batch_size=FLAGS.batch_size)

# Define Training procedure
#创建全局step并创建adam优化器
global_step = tf.Variable(0, name="global_step", trainable=False)
optimizer = tf.train.AdamOptimizer(1e-3)
print("initialized siameseModel object")
#计算梯度并得到对应的variable
grads_and_vars=optimizer.compute_gradients(siameseModel.loss)
#传入梯度和变量，初始化一个training op
tr_op_set = optimizer.apply_gradients(grads_and_vars, global_step=global_step)
print("defined training_ops")
# Keep track of gradient values and sparsity (optional)
#获取梯度相关信息给tensorbord
grad_summaries = []
for g, v in grads_and_vars:
if g is not None:
grad_hist_summary = tf.histogram_summary("{}/grad/hist".format(v.name), g)
sparsity_summary = tf.scalar_summary("{}/grad/sparsity".format(v.name), tf.nn.zero_fraction(g))
grad_summaries.append(grad_hist_summary)
grad_summaries.append(sparsity_summary)
grad_summaries_merged = tf.merge_summary(grad_summaries)
print("defined gradient summaries")
# Output directory for models and summaries
#定义输出路径
timestamp = str(int(time.time()))
out_dir = os.path.abspath(os.path.join(os.path.curdir, "runs", timestamp))
print("Writing to {}\n".format(out_dir))

# Checkpoint directory. Tensorflow assumes this directory already exists so we need to create it
checkpoint_dir = os.path.abspath(os.path.join(out_dir, "checkpoints"))
checkpoint_prefix = os.path.join(checkpoint_dir, "model")
if not os.path.exists(checkpoint_dir):
os.makedirs(checkpoint_dir)
saver = tf.train.Saver(tf.all_variables(), max_to_keep=100)

# Write vocabulary
vocab_processor.save(os.path.join(checkpoint_dir, "vocab"))

# Initialize all variables
sess.run(tf.initialize_all_variables())

print("init all variables")
graph_def = tf.get_default_graph().as_graph_def()
graphpb_txt = str(graph_def)
with open(os.path.join(checkpoint_dir, "graphpb.txt"), 'w') as f:
f.write(graphpb_txt)

def train_step(x1_batch, x2_batch, y_batch):
"""
A single training step
"""
#随机打乱两个输入句子之间的位置关系
if random()>0.5:
feed_dict = {
siameseModel.input_x1: x1_batch,
siameseModel.input_x2: x2_batch,
siameseModel.input_y: y_batch,
siameseModel.dropout_keep_prob: FLAGS.dropout_keep_prob,
}
else:
feed_dict = {
siameseModel.input_x1: x2_batch,
siameseModel.input_x2: x1_batch,
siameseModel.input_y: y_batch,
siameseModel.dropout_keep_prob: FLAGS.dropout_keep_prob,
}
_, step, loss, accuracy, dist = sess.run([tr_op_set, global_step, siameseModel.loss, siameseModel.accuracy, siameseModel.distance], feed_dict)
time_str = datetime.datetime.now().isoformat()
#获取最后的输出值 >= 0.5为0，小于0.5为1
d = np.copy(dist)
d[d>=0.5]=999.0
d[d<0.5]=1
d[d>1.0]=0
accuracy = np.mean(y_batch==d)
print("TRAIN {}: step {}, loss {:g}, acc {:g}".format(time_str, step, loss, accuracy))
print y_batch, dist, d

def dev_step(x1_batch, x2_batch, y_batch):
"""
A single training step
#同训练
"""
if random()>0.5:
feed_dict = {
siameseModel.input_x1: x1_batch,
siameseModel.input_x2: x2_batch,
siameseModel.input_y: y_batch,
siameseModel.dropout_keep_prob: FLAGS.dropout_keep_prob,
}
else:
feed_dict = {
siameseModel.input_x1: x2_batch,
siameseModel.input_x2: x1_batch,
siameseModel.input_y: y_batch,
siameseModel.dropout_keep_prob: FLAGS.dropout_keep_prob,
}
step, loss, accuracy, dist = sess.run([global_step, siameseModel.loss, siameseModel.accuracy, siameseModel.distance], feed_dict)
time_str = datetime.datetime.now().isoformat()
d = np.copy(dist)
d[d>=0.5]=999.0
d[d<0.5]=1
d[d>1.0]=0
accuracy = np.mean(y_batch==d)
print("DEV {}: step {}, loss {:g}, acc {:g}".format(time_str, step, loss, accuracy))
print y_batch, dist, d
return accuracy

# 产生训练batch，进入主要循环
batches=inpH.batch_iter(
list(zip(train_set[0], train_set[1], train_set[2])), FLAGS.batch_size, FLAGS.num_epochs)

ptr=0
max_validation_acc=0.0
for nn in xrange(sum_no_of_batches*FLAGS.num_epochs):
batch = batches.next()
if len(batch)<1:
continue
x1_batch,x2_batch, y_batch = zip(*batch)
if len(y_batch)<1:
continue
#训练网络参数并获取当前step
train_step(x1_batch, x2_batch, y_batch)
current_step = tf.train.global_step(sess, global_step)
sum_acc=0.0
if current_step % FLAGS.evaluate_every == 0:
print("\nEvaluation:")
dev_batches = inpH.batch_iter(list(zip(dev_set[0],dev_set[1],dev_set[2])), FLAGS.batch_size, 1)
for db in dev_batches:
if len(db)<1:
continue
x1_dev_b,x2_dev_b,y_dev_b = zip(*db)
if len(y_dev_b)<1:
continue
acc = dev_step(x1_dev_b, x2_dev_b, y_dev_b)
sum_acc = sum_acc + acc
print("")
if current_step % FLAGS.checkpoint_every == 0:
if sum_acc >= max_validation_acc:
max_validation_acc = sum_acc
saver.save(sess, checkpoint_prefix, global_step=current_step)
#保存模型
tf.train.write_graph(sess.graph.as_graph_def(), checkpoint_prefix, "graph"+str(nn)+".pb", as_text=False)
print("Saved model {} with sum_accuracy={} checkpoint to {}\n".format(nn, max_validation_acc, checkpoint_prefix))

.NET 学习：从基础到进阶的全面指南来恩1003 .NET .net 学习
.NET学习资料.NET学习资料.NET学习资料在当今软件开发的广阔领域中，.NET是一个备受瞩目的开发平台，以其强大的功能、跨平台的特性以及丰富的生态系统，吸引着众多开发者投身其中。无论是构建企业级应用、Web应用还是移动应用，.NET都展现出了卓越的能力。以下将为你详细介绍.NET的学习路径，帮助你从入门逐步走向精通。一、认识.NET：基础概念与环境搭建了解.NET框架：.NET是一个由微软开
【深度学习】AMP（Automatic Mixed Precision，自动混合精度） shanks66 深度学习人工智能
@[toc]AMP（AutomaticMixedPrecision，自动混合精度）AMP在深度学习中，AMP（AutomaticMixedPrecision，自动混合精度）是一种通过混合使用单精度（FP32）和半精度（FP16）来加速训练并减少显存占用的技术。它能够在不显著损失模型精度的情况下，大幅提升训练速度和效率。1.什么是混合精度训练？混合精度训练是指在训练过程中同时使用两种不同的浮点数精度
day11备份与恢复 Long韵韵 MySQL学习 adb android oracle
MySQL备份介绍文章目录MySQL备份介绍1.DBA备份与恢复职责2.MySQL备份工具分类mysqldump逻辑备份1.介绍2.重要参数3.备份命令4.分库分表备份5.故障恢复演练5.1模拟环境5.2模拟周一23:00全备5.3模拟周二白天数据变化5.4模拟周二下午2点，误删除了核心库5.5恢复数据6.mysqldump多种备份策略和恢复策略6.1场景6.2备份策略Xtrabackup物理备份
ASP.NET Core 全局异常处理步、步、为营 asp.net 后端 c#
一、引言在ASP.NETCore的开发过程中，全局异常处理是保障应用程序健壮性与稳定性的关键环节。当应用程序遭遇未预料的错误时，妥善的异常处理机制不仅能够避免程序崩溃，还能为用户提供清晰、友好的反馈，同时帮助开发者快速定位和解决问题。在实际应用场景中，假设我们正在开发一个在线商城系统。当用户进行商品下单操作时，可能由于网络波动、数据库连接异常或业务逻辑错误等原因，导致订单提交失败。如果没有良好的全
fanuc机器人与plc的通讯_FANUC机器人：西门子1200PLC与FANUC机器人实现Profinet通讯 weixin_39612554 fanuc机器人与plc的通讯 fanuc机器人以太网通讯配置
西门子1200PLC与fanuc机器人使用Profinet通讯时，fanuc机器人需要适配Profinet通讯板卡，系统要刷入Profinet通讯选项。一、机器人配置1、配置机器人Profinet参数，在[I/O]选项[Profinet]，选择[2频道]。IP地址和名称要和PLC组态中的一致。图1fanuc机器人通讯配置12、机器人通讯数据长度设置，和PLC组态中的设置一致。图2fanuc机器人通
python3验证有效正则表达式少陽君 python 正则表达式 python 开发语言
Python中字符串类型本质上没有标记“是否原始”的特性，原始字符串只是为了书写方便。运行时，原始字符串与普通字符串的表现是相同的，唯一的区别是编写代码时是否进行了转义。因此，如果需要确保某些输入是有效正则表达式，可以结合re模块验证：importredefis_valid_regex(pattern):try:re.compile(pattern)returnTrueexceptre.error
工业互联网架构 st20195114 架构
工业互联网架构详解引言工业互联网（IndustrialInternet）是工业领域与互联网技术深度融合的产物，它推动了智能制造和数字化转型的进程。工业互联网架构的设计不仅需要满足数据处理和通信的要求，还需考虑设备互联、数据分析和安全等多方面的因素。本文将对工业互联网架构进行详细阐述，帮助理解其关键组成部分及其功能。工业互联网架构概述工业互联网架构通常包括设备层、网络层、数据层和应用层四个主要部分。
202、Python王者归来：Django、Flask、FastAPI框架争霸与应用解析多多的编程笔记 python django flask
Python开发框架Django之Django与其他框架：与Flask、FastAPI等框架的比较与集成大家好，今天我将向大家介绍Python开发框架Django，并与其他框架如Flask、FastAPI等进行比较和集成。希望这篇文章能帮助大家更好地理解Django的优势和使用场景。1.Django简介首先，让我们来了解一下Django。Django是一个开源的高级PythonWeb框架，它鼓励快
汽车售后诊断用户管理后台：功能、设计与应用芊言凝语项目细节分析 java 前端人工智能
一、引言在汽车行业蓬勃发展的今天，汽车售后市场的重要性日益凸显。汽车售后诊断用户管理后台作为连接汽车维修企业、技术人员与车主的关键枢纽，在提升售后服务质量、优化客户体验以及促进企业运营效率方面发挥着核心作用。它整合了客户信息管理、车辆诊断数据处理、维修流程跟踪、售后市场分析等多个功能模块，为汽车售后产业链的各个环节提供了全方位的支持。二、功能模块剖析（一）客户信息管理基本信息录入与存储：详细记录车
汽车发动机系统（ems）详细解析芊言凝语汽车人工智能
汽车发动机系统EMS，即Engine-Management-System（发动机管理系统），是现代汽车电子控制技术的重要组成部分。以下是对汽车发动机系统EMS的详细解析，内容将涵盖其定义、工作原理、主要组成、功能特点、技术发展以及市场应用等多个方面一、EMS定义与概述EMS，全称Engine-Management-System，中文称为发动机管理系统，是一个高度集成的电子控制系统，负责收集发动机运
Zookeeper（14）Zookeeper的客户端与服务器之间的通信机制是什么？辞暮尔尔-烟火年年微服务 spring cloud
Zookeeper的客户端与服务器之间的通信机制采用了基于TCP的长连接（Long-livedTCPconnection）方式，主要通过以下几个步骤来实现高效、可靠的通信：连接建立：客户端启动时，会尝试与Zookeeper服务器建立TCP连接。连接成功后，客户端会发送一个会话请求。服务器收到会话请求后，返回一个会话ID和会话超时时间。会话维护：客户端与服务器之间的连接是长连接，通过心跳机制来维持会
29、号外！号外！ERA5再分析数据下载方式更新啦爱转呼啦圈的小兔子气象数据处理与可视化 python 气象可视化气象 ERA5 再分析数据
文章目录1.前言2.账号注册与协议签署2.1账号注册2.2签署CDS-Beta使用条款2.3更新.cdsapi文件3.常见问题与解决方法（持续更新中）3.1问题1：更新完.cdsapi文件之后，原有下载代码不可以使用3.2问题2:RuntimeError:403ClientError:requiredlicencesnotaccepted3.3问题3：.cdsapi报错1.前言最近，更新ERA5月
智能化植物病害检测：使用深度学习与图像识别技术的应用机器懒得学习深度学习人工智能
植物病害一直是农业生产中亟待解决的问题，它不仅会影响作物的产量和质量，还可能威胁到生态环境的稳定。随着人工智能（AI）技术的快速发展，尤其是深度学习和图像识别技术的应用，智能化植物病害检测已经成为一种趋势，能够大幅提高病害检测的效率与准确性。本文将介绍如何使用深度学习和图像识别技术，通过Python编写的智能化病害检测程序，实现对植物叶片病害的自动识别与分类。1.项目背景与目标在农业领域，及时发现
用java 实现生成二维码同意授权给公众号访问其信息。这通常通过将用户重定向到一个由微信提供的授权页面完成。用心去追梦 java 微信 python
要使用Java实现生成二维码以同意授权给微信公众号访问用户信息，你可以结合OAuth2.0网页授权流程与微信提供的二维码生成接口。具体来说，你需要创建一个带有授权链接的二维码，当用户扫描并同意授权后，可以重定向到指定页面。步骤1:构建授权URL首先，根据之前的指导构建授权URL。这个URL将用于生成二维码，使得用户在扫描二维码时被重定向到微信的授权页面。步骤2:使用微信API生成二维码微信提供了两
深度学习-45-大型语言模型LLM之本地化部署运行自己的大模型皮皮冰燃深度学习深度学习人工智能
文章目录1深度学习1.1神经网络和深度学习1.2神经网络的工作原理1.3神经网络的专业术语2LLM概述2.1大模型的"大"是指什么?2.2训练大模型有多烧钱？2.3如何入门大模型？2.4LLM的结构2.4.1Transformer2.4.2Prompts2.4.3FineTuning3本地跑大模型3.1Ollama运行开源LLM3.1.1启动并运行3.1.2使用api访问3.1.3设置外网访问3.
Bash 命令：系统操作的得力助手阿贾克斯的黎明运维 bash 开发语言
目录Bash命令：系统操作的得力助手目录操作命令文件操作命令文件查看命令在Linux系统的日常使用与运维工作中，Bash命令起着核心作用。它就像一把万能钥匙，能够开启系统各种功能的大门，让我们高效地管理和操作计算机资源。接下来，我们将详细介绍一些常用的Bash命令及其用法。目录操作命令ls（list）：用于列出目录内容。例如，在终端输入ls，会显示当前目录下的文件和子目录。如果要查看详细信息，可以
C++中“::”与“.”的区别阿贾克斯的黎明 C++c++
在C++编程中，“::”（作用域解析运算符）和“.”（成员访问运算符）是两个非常重要的符号，但它们有着不同的用途和功能。一、“.”成员访问运算符“.”用于访问类、结构体或联合体对象的成员。以下是一个简单的示例：#includeclassMyClass{public:intmemberVariable;voidmemberFunction(){std::coutnamespaceMyNamespac
深度学习笔记——前向传播与反向传播、神经网络（前馈神经网络与反馈神经网络）、常见算法概要汇总好评笔记深度学习笔记深度学习笔记神经网络人工智能
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文简要介绍深度学习的前向传播与反向传播，以及前馈神经网络与反馈神经网络。文章目录前向传播与反向传播前向传播（ForwardPropagation）反向传播（BackPropagation）总结神经网络简介结构类型前馈神经网络（FeedforwardNeuralNetwork,FFNN）特点常见变体反馈神经网络（Feedb
深度学习笔记——生成对抗网络GAN 好评笔记深度学习笔记深度学习生成对抗网络人工智能神经网络 aigc gan 机器学习
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍早期生成式AI的代表性模型：生成对抗网络GAN。文章目录一、基本结构生成器判别器二、损失函数判别器生成器交替优化目标函数三、GAN的训练过程训练流程概述训练流程步骤1.初始化参数和超参数2.定义损失函数3.训练过程的迭代判别器训练步骤生成器训练步骤4.交替优化5.收敛判别GAN训练过程的挑战四、GAN的常见变体
机器学习笔记——Boosting中常用算法（GBDT、XGBoost、LightGBM）迭代路径好评笔记机器学习笔记机器学习 boosting 人工智能深度学习 AI 算法工程师
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文主要阐述Boosting中常用算法（GBDT、XGBoost、LightGBM）的迭代路径。文章目录XGBoost相对GBDT的改进引入正则化项，防止过拟合损失函数L(yi,y^i)L(y_i,\hat{y}_i)L(yi,y^i)正则化项Ω(fm)\Omega(f_m)Ω(fm)使用二阶导数信息，加速收敛一阶导数与二
Knowledge Boundary of Large Language Models: A Survey UnknownBody LLM Daily Survey Paper 语言模型人工智能自然语言处理
本文是LLM系列文章，针对《KnowledgeBoundaryofLargeLanguageModels:ASurvey》的翻译。大型语言模型的知识边界：综述摘要1引言2知识边界的定义3不良行为4知识边界的识别5缓解6挑战与前景7结论局限性摘要尽管大型语言模型（LLM）在其参数中存储了大量的知识，但它们在记忆和利用某些知识方面仍然存在局限性，导致了不良的行为，如产生不真实和不准确的反应。这突显了理
十几套JavaWeb项目，快拿去当毕业设计，简直不要太爽了 VX_BYDZ1988 django flask eclipse spring boot spring cloud servlet
1、基于web的图书管理系统设计与实现图书管理系统就是利用计算机，结合互联网对图书进行结构化、自动化管理的一种软件，来提高对图书的管理效率。本系统采用Java+Servlet+Jsp的方式实现基于web的图书管理系统。开发工具及相关技术Java技术HTML、css、javascript技术Servlet技术Eclipse开发工具MySql数据库功能概述用户端：图书查询：根据图书编号、图书名称查询图
RPA财务机器人是什么，RPA的具体应用场景有哪些？| 实在RPA研究实在智能RPA rpa 机器人自动化人工智能数字员工
越来越多的人工智能及超自动化技术在企业财务工作中得以普及应用，以提升财务工作效率，促进财务部门实现全面数字化转型。RPA财务机器人是什么？RPA，即机器人流程自动化（RoboticProcessAutomation），允许软件机器人（或“机器人”）自动执行重复性、规律性强的业务流程任务。RPA软件机器人可以模仿人类用户的行为，通过用户界面与应用程序交互，执行任务如数据输入、报告生成、数据迁移、邮件
软体机器人研究报告：设计方法、材料与驱动、感知与控制 MocapLeader 软体机器人连续体机器人手术机器人运动规划运动控制游泳机器人人工肌肉
软体机器人因其出色的可变形性和高适应性受到了广泛关注，这些特性使其在医疗、救援、探测等复杂场景中展现出独特的优势和巨大的应用潜力。研究人员对软体机器人的设计方法、材料与驱动技术、感知与控制策略等方面进行深入研究，取得了一系列成果。本文汇总了10项软体机器人领域的优秀研究成果，并介绍了不同成果的研究亮点。在下述研究中，NOKOV度量动作捕捉系统通过实时记录机器人的运动过程、获取高精度空间定位，为实验
2023全国职业院校技能大赛网络系统管理赛项（Linux部分真题） Jackson~Y linux 运维服务器
一、Linux项目任务描述你作为一个Linux的技术工程师，被指派去构建一个公司的内部网络，要为员工提供便捷、安全稳定内外网络服务。你必须在规定的时间内完成要求的任务，并进行充分的测试，确保设备和应用正常运行。任务所有规划都基于Linux操作系统，请根据网络拓扑、基本配置信息和服务需求完成网络服务安装与测试，网络拓扑图和基本配置信息如下：（一）拓扑图（二）网络地址规划服务器和客户端基本配置如下表，
北大数学校友胡懿娟归国任教！重回母校，专注于统计学、微生物学和遗传学的交叉领域量子位
关注前沿科技量子位又一科学家从美归国——北大数学系校友胡懿娟。援引人民日报消息，在北京大学北京国际数学研究中心发布的2024年工作回顾中显示，她于去年7月入职北大。回来之后，她将继续专注于统计学、微生物学和遗传学的交叉领域，致力于解决实际的生物医学数据分析问题。△北大官网截图网友纷纷为她点赞：能力与颜值并存！同时也感叹，越来越多的科学家选择回到祖国，为科学技术发展和人才培养添砖加瓦。北大数学校友胡
全球人形机器人的创新发展与未来趋势 Gearidea 机器人机器人
随着科技的迅猛进步，人形机器人作为人工智能与机器人技术交汇的产物，正在全球范围内引发广泛关注。人形机器人以其仿人的外观和行为，不仅在工业生产领域展现出巨大的潜力，而且在日常生活中也逐渐发挥着不可忽视的作用。本文将全面剖析全球人形机器人的发展现状，展望未来发展的潜在趋势，并深入探讨其在不同领域中的应用和影响。一、全球人形机器人行业的发展现状全球人形机器人领域经历了从概念提出、原型制作到商业化应用的演
财务RPA，财务RPA机器人的应用场景有哪些？弘玑RPA智能机器人 rpa
众所周知，机器人流程自动化RPA在过去几年中得到了快速发展。现在，已经可以实现端到端完全自动化流程，并可以利用智能自动化扩展RPA部署。目前RPA机器人在金融与银行、保险、电力、能源、制造业、公共服务、零售、业务流程外包/共享中心等行业中广泛应用。本文将重点讲一下财务RPA机器人在金融银行业的使用场景。相对于传统的人工办公，财务RPA机器人对于金融机构意味几何？加快合规减少成本和合规积压提高运营效
LeetCode：3097. 或值至少为 K 的最短子数组 II（滑动窗口 Java） Cosmoshhhyyy LeetCode leetcode java 算法
目录3097.或值至少为K的最短子数组II题目描述：实现代码与解析：滑动窗口原理思路：3097.或值至少为K的最短子数组II题目描述：给你一个非负整数数组nums和一个整数k。如果一个数组中所有元素的按位或运算OR的值至少为k，那么我们称这个数组是特别的。请你返回nums中最短特别非空子数组的长度，如果特别子数组不存在，那么返回-1。示例1：输入：nums=[1,2,3],k=2输出：1解释：子数
回顾 2024— 浔川社团：在数字浪潮中的成长与奋进浔川社团官方联合会浔川社团官方联合会总社团联合会浔川python社推广部 python
回顾2024—浔川社团：在数字浪潮中的成长与奋进在过去的2024年，浔川社团以其独特的魅力和不懈的努力，在网络的舞台上绽放出别样的光彩。从各项数据指标中，我们能清晰地看到社团这一年来的发展轨迹，见证其在内容创作、社区互动等方面所取得的斐然成绩。一、流量数据：持续攀升的影响力截至2024年底，浔川社团相关内容的总访问量达到了74,556次，这一数字直观地反映出社团所产出内容的广泛吸引力。无论是技术分
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round

Deep LSTM siamese network for text similarity源码分析

你可能感兴趣的:(深度学习与NLP)