shillyshally

TensorFlow|基于Transformer的自然语言推理（SNLI）

在经历了看论文，看源码，看Bert源码之后，整理思路，实现了一下Transformer，并搭建了一个小型的Transformer做了一下SNLI任务。

同时吸取以前的教训，这次好好的写了注释

1.Transofrmer

原理不再重述，其他博客中讲的很好，

比如：https://jalammar.github.io/illustrated-transformer/

和他的翻译版：https://blog.csdn.net/qq_41664845/article/details/84969266

直接进入代码

1.1.激活函数

Transformer原文中使用的都是Relu，但Bert包括之后的工作，大多采用的是Gelu（高斯误差线性单元），效果更好（只是参考了论文中的数据对比，还并未亲自实验对比）。

抱着举贤不举亲的原则，就算平时使用的大多Relu，在此也将默认的激活函数设为Gelu。

关于Gelu的原论文：https://arxiv.org/abs/1606.08415

Gelu：

def gelu(inputs):
    """
    gelu: https://arxiv.org/abs/1606.08415
    :param inputs: [Tensor]
    :return: [Tensor] outputs after activation
    """
    cdf = 0.5 * (1.0 + tf.tanh(tf.sqrt(2 / np.pi) * (inputs + 0.044715 * tf.pow(inputs, 3))))
    return inputs * cdf

获得激活函数的方法（设置默认gelu）：

def get_activation(activation_name):
    """
    get activate function
    :param activation_name: [Tensor]
    :return: [Function] activation function
    """
    if activation_name is None:
        return gelu
    else:
        act = activation_name.lower()
        if act == "relu":
            return tf.nn.relu
        elif act == "gelu":
            return gelu
        elif act == "tanh":
            return tf.tanh
        else:
            raise ValueError("Unsupported activation: %s" % act)

1.2.嵌入（embedding）

Transformer除了词嵌入，还做了位置嵌入（Positional Encoding），来使每个单词携带位置信息，否则可以想象它只是一个复杂一些的，通过训练获得每个单词权重的词袋模型了。

同时为了完成SNLI这类需要最终输出shape一致的任务，采用了Bert的想法，对每个输入的起始加入[CLS]token，使用该token的最终输出做预测，而这样做的话，需要加入segment embedding来更好的区分两个不同的句子（参考Bert）

1.2.1.词嵌入（Word Embedding）

这里可以通过随机初始化嵌入矩阵，也可以通过载入其他任务（比如Glove，Fast text）产生的词嵌入矩阵来完成这部分，只需要在restore的时候声明一下即可。paper中提到需要对embedding做scale，这里照做。

def get_embedding(inputs, vocab_size, channels, scale=True, scope="embedding", reuse=None):
    """
    embedding
    :param inputs: [Tensor] Tensor with first dimension of "batch_size"
    :param vocab_size: [Int] Vocabulary size
    :param channels: [Int] Embedding size
    :param scale: [Boolean] If True, the output will be multiplied by sqrt num_units
    :param scope: [String] name of "variable_scope"
    :param reuse: [Boolean] tf parameter reuse
    :return: [Tensor] outputs of embedding of sentence with shape of "batch_size * length * channels"
    """
    with tf.variable_scope(scope, reuse=reuse):
        lookup_table = tf.get_variable('lookup_table',
                                       dtype=tf.float32,
                                       shape=[vocab_size, channels],
                                       initializer=tf.contrib.layers.xavier_initializer())
        lookup_table = tf.concat((tf.zeros(shape=[1, channels], dtype=tf.float32),
                                  lookup_table[1:, :]), 0)

        outputs = tf.nn.embedding_lookup(lookup_table, inputs)

        if scale:
            outputs = outputs * math.sqrt(channels)

    return outputs

1.2.2.位置嵌入（Position Embedding）

获得和inputs经过word embedding之后相同shape的位置嵌入，没有使用word embedding之后的作为输入，是考虑这样可以为之后的mask提供便利

def get_positional_encoding(inputs, channels, scale=False, scope="positional_embedding", reuse=None):
    """
    positional encoding
    :param inputs: [Tensor] with dimension of "batch_size * max_length"
    :param channels: [Int] Embedding size
    :param scale: [Boolean] If True, the output will be multiplied by sqrt num_units
    :param scope: [String] name of "variable_scope"
    :param reuse: [Boolean] tf parameter reuse
    :return: [Tensor] outputs after positional encoding
    """
    batch_size = tf.shape(inputs)[0]
    max_length = tf.shape(inputs)[1]
    with tf.variable_scope(scope, reuse=reuse):
        position_ind = tf.tile(tf.expand_dims(tf.range(tf.to_int32(1), tf.add(max_length, 1)), 0), [batch_size, 1])

        # Convert to a tensor
        lookup_table = tf.convert_to_tensor(get_timing_signal_1d(max_length, channels))

        lookup_table = tf.concat((tf.zeros(shape=[1, channels]),
                                  lookup_table[:, :]), 0)
        position_inputs = tf.where(tf.equal(inputs, 0), tf.zeros_like(inputs), position_ind)

        outputs = tf.nn.embedding_lookup(lookup_table, position_inputs)

        if scale:
            outputs = outputs * math.sqrt(channels)

    return tf.cast(outputs, tf.float32)

通过get_timing_signal_1d()方法获得 [ 句子长度 * embedding维度 ]的矩阵

def get_timing_signal_1d(length, channels, min_timescale=1.0, max_timescale=1.0e4, start_index=0):
    """
    positional encoding的方法
    :param length: [Int] max_length size
    :param channels: [Int] Embedding size
    :param min_timescale: [Float]
    :param max_timescale: [Float]
    :param start_index: [Int] index of first position
    :return: [Tensor] positional encoding of shape "length * channels"
    """
    position = tf.to_float(tf.range(start_index, length))
    num_timescales = channels // 2
    log_timescale_increment = (math.log(float(min_timescale) / float(max_timescale)) /
                               (tf.to_float(num_timescales) - 1))
    inv_timescales = min_timescale * tf.exp(tf.to_float(tf.range(num_timescales)) * -log_timescale_increment)

    scaled_time = tf.expand_dims(position, 1) * tf.expand_dims(inv_timescales, 0)
    signal = tf.concat([tf.sin(scaled_time), tf.cos(scaled_time)], axis=1)
    signal = tf.pad(signal, [[0, 0], [0, tf.mod(channels, 2)]])
    return signal

1.2.3.Segment Embedding

该嵌入仅仅是为了让模型能够更好的区分输入的两个句子，其实通过[SEP]这个token以及能够区分两个句子了，但是对于模型来说显然还不够，在不加入segment embedding的情况下，模型的表现不太良好。

对于[PAD]这个token，所有的embedding（seg、pos）都设为了全零向量，以便后面attention的时候加入mask

def get_seg_embedding(inputs, channels, scale=True, scope="seg_embedding", reuse=None):
    """
    segment embedding
    :param inputs: [Tensor] with first dimension of "batch_size" like [1 1 1 2 2 2 2 0 0 0 ...]
    :param channels: [Int] Embedding size
    :param scale: [Boolean] If True, the output will be multiplied by sqrt num_units
    :param scope: [String] name of "variable_scope"
    :param reuse: [Boolean] tf parameter reuse
    :return: [Tensor] outputs of embedding of sentence with shape of "batch_size * length * channels"
    """
    with tf.variable_scope(scope, reuse=reuse):
        lookup_table = tf.get_variable('lookup_table',
                                       dtype=tf.float32,
                                       shape=[3, channels],
                                       initializer=tf.contrib.layers.xavier_initializer())
        lookup_table = tf.concat((tf.zeros(shape=[1, channels], dtype=tf.float32),
                                  lookup_table[1:, :]), 0)

        outputs = tf.nn.embedding_lookup(lookup_table, inputs)
        if scale:
            outputs = outputs * math.sqrt(channels)

    return outputs

1.3.Self-Attention和Encoder-Decoder Attention

到这里，输入的处理就算完成了，到了重头戏Attention机制

两个输入的tensor总觉的一行用英语讲不清楚，就写在这里吧，from tensor对于两个Attention都是一致的就是输入，to tensor对于self-attention来说也是一致的，但对于encoder-decoder attention来说是最后一层encoder的输出，用来捕捉decoder和encoder之间的attention关系。

因为前面做了处理，所有的[PAD]这个token的embedding都是全零，所以对这个维度求绝对值后reduce sum之后，零就是[PAD]这个token，这样就不用再额外的添加一个mask ids作为输入了。

按照paper中的描述

def multi_head_attention(from_tensor: tf.Tensor,  to_tensor: tf.Tensor, channels=None, num_units=None, num_heads=8,
                         dropout_rate=0, is_training=True, attention_mask_flag=False, scope="multihead_attention",
                         activation=None, reuse=None):
    """
    multihead attention
    :param from_tensor: [Tensor]
    :param to_tensor: [Tensor] 
    :param channels: [Int] channel of last dimension of output
    :param num_units: [Int] channel size of matrix Q, K, V
    :param num_heads: [Int] head number of attention
    :param dropout_rate: [Float] dropout rate when 0 means no dropout
    :param is_training: [Boolean] whether it is training, If true, use dropout
    :param attention_mask_flag: [Boolean] If true, units that reference the future are masked
    :param scope: [String] name of "variable_scope"
    :param activation: [String] name of activate function
    :param reuse: [Boolean] tf parameter reuse
    :return: [Tensor] outputs after multihead self attention with shape of "batch_size * max_length * (channels*num_heads)"
    """
    with tf.variable_scope(scope, reuse=reuse):
        if channels is None:
            channels = from_tensor.get_shape().as_list()[-1]
        if num_units is None:
            num_units = channels//num_heads
        activation_fn = get_activation(activation)
        # shape [batch_size, max_length, channels*num_heads]
        query_layer = tf.layers.dense(from_tensor, num_units * num_heads, activation=activation_fn)
        key_layer = tf.layers.dense(to_tensor, num_units * num_heads, activation=activation_fn)
        value_layer = tf.layers.dense(to_tensor, num_units * num_heads, activation=activation_fn)

        # shape [batch_size*num_heads, max_length, channels]
        query_layer_ = tf.concat(tf.split(query_layer, num_heads, axis=2), axis=0)
        key_layer_ = tf.concat(tf.split(key_layer, num_heads, axis=2), axis=0)
        value_layer_ = tf.concat(tf.split(value_layer, num_heads, axis=2), axis=0)

        # shape = [batch_size*num_heads, max_length, max_length]
        attention_scores = tf.matmul(query_layer_, tf.transpose(key_layer_, [0, 2, 1]))
        # Scale
        attention_scores = tf.multiply(attention_scores, 1.0 / tf.sqrt(float(channels)))
        # attention masks
        attention_masks = tf.sign(tf.abs(tf.reduce_sum(to_tensor, axis=-1)))
        attention_masks = tf.tile(attention_masks, [num_heads, 1])
        attention_masks = tf.tile(tf.expand_dims(attention_masks, axis=1), [1, tf.shape(from_tensor)[1], 1])
        neg_inf_matrix = tf.multiply(tf.ones_like(attention_scores), (-math.pow(2, 32) + 1))
        attention_scores = tf.where(tf.equal(attention_masks, 0), neg_inf_matrix, attention_scores)

        if attention_mask_flag:
            diag_vals = tf.ones_like(attention_scores[0, :, :])
            tril = tf.linalg.LinearOperatorLowerTriangular(diag_vals).to_dense()

            masks = tf.tile(tf.expand_dims(tril, 0), [tf.shape(attention_scores)[0], 1, 1])
            neg_inf_matrix = tf.multiply(tf.ones_like(masks), (-math.pow(2, 32) + 1))
            attention_scores = tf.where(tf.equal(masks, 0), neg_inf_matrix, attention_scores)

        # attention probability
        attention_probs = tf.nn.softmax(attention_scores)

        # query mask
        query_masks = tf.sign(tf.abs(tf.reduce_sum(from_tensor, axis=-1)))
        query_masks = tf.tile(query_masks, [num_heads, 1])
        query_masks = tf.tile(tf.expand_dims(query_masks, -1), [1, 1, tf.shape(to_tensor)[1]])

        attention_probs *= query_masks

        # dropout
        attention_probs = tf.layers.dropout(attention_probs, rate=dropout_rate,
                                            training=tf.convert_to_tensor(is_training))
        outputs = tf.matmul(attention_probs, value_layer_)
        # shape [batch_size, max_length, channels*num_heads]
        outputs = tf.concat(tf.split(outputs, num_heads, axis=0), axis=2)

        # reshape to from tensor
        outputs = tf.layers.dense(outputs, channels, activation=activation_fn)
        # Residual connection
        outputs += from_tensor
        # group normalization
        outputs = group_norm(outputs)
    return outputs

1.4.Feed Ward

论文中的Position-wise Feed-Forward Networks，论文中第二层的激活函数为线性激活函数，将第二层的activation function参数改为None才是原论文的做法，这里出于一些实验的原因没有照做

def feed_forward(inputs, channels, hidden_dims=None, scope="multihead_attention", activation=None, reuse=None):
    """
    :param inputs: [Tensor] with first dimension of "batch_size"
    :param channels: [Int] Embedding size
    :param hidden_dims: [List] hidden dimensions
    :param scope: [String] name of "variable_scope"
    :param activation: [String] name of activate function
    :param reuse: [Boolean] tf parameter reuse
    :return: [Tensor] outputs after feed forward with shape of "batch_size * max_length * channels"
    """
    if hidden_dims is None:
        hidden_dims = 2*channels
    with tf.variable_scope(scope, reuse=reuse):
        activation_fn = get_activation(activation)

        params = {"inputs": inputs, "num_outputs": hidden_dims, "activation_fn": activation_fn}
        outputs = tf.contrib.layers.fully_connected(**params)

        params = {"inputs": outputs, "num_outputs": channels, "activation_fn": activation_fn}  # activation_fn可以改为None
        outputs = tf.contrib.layers.fully_connected(**params)
        outputs += inputs
        outputs = group_norm(outputs)
    return outputs

1.5.Layer Normalization

对了，还有layer normalization。

def group_norm(inputs: tf.Tensor, epsilon=1e-8, scope="layer_normalization", reuse=None):
    """
    layer normalization
    :param inputs: [Tensor] with first dimension of "batch_size"
    :param epsilon: [Float] a number for preventing ZeroDivision
    :param scope: [String] name of "variable_scope"
    :param reuse: [Boolean] tf parameter reuse
    :return: [Tensor] outputs after normalized
    """
    with tf.variable_scope(scope, reuse=reuse):
        inputs_shape = inputs.get_shape()
        params_shape = inputs_shape[-1:]
        mean, variance = tf.nn.moments(inputs, [-1], keep_dims=True)
        beta = tf.Variable(tf.zeros(params_shape))
        gamma = tf.Variable(tf.ones(params_shape))
        normalized = (inputs - mean) * tf.rsqrt(variance + epsilon)
        outputs = gamma * normalized + beta
    return outputs

2.Transformer for SNLI

基本工作都做好了，接下来使用之前写好的代码来搭建一个6层的Transformer

先定义一些模型的细节配置：

class ConfigModel(object):
    vocab_size_en = len(word_dict_en)
    channels = 400
    learning_rate = 0.0005
    layer_num = 6
    is_training = True
    is_transfer_learning = False
    restore_embedding = False
    shuffle_pool_size = 2560
    dropout_rate = 0.1
    num_heads = 8
    batch_size = 64
    max_length = 100
    num_tags = 3

然后搭建模型，整体按照Bert的思路搭建，最后取 [CLS] token的输出：

class TransformerSNLICls():
    def __init__(self, inputs, segs, label, config):
        self.inputs = tf.to_int32(inputs)  # batch_size*max_length
        self.segs = tf.to_int32(segs)  # 标识属于第几个句子 ([1 1 2 2 2 0 0 0 ...])
        self.target = tf.to_int32(label)
        self.vocab_size_en = config.vocab_size_en
        self.channels = config.channels
        self.num_heads = config.num_heads
        self.dropout_rate = config.dropout_rate
        self.is_training = config.is_training
        self.num_layer = config.layer_num
        self.learning_rate = config.learning_rate
        # {'_PAD': 0, '_BEGIN': 1, '_EOS': 2, '_CLS': 3, '_SEP': 4, '_MASK': 5}
        self.inputs = tf.concat((tf.ones_like(self.inputs[:, :1])*3, self.inputs), axis=-1)
        self.segs = tf.concat((tf.ones_like(self.segs[:, :1]), self.segs), axis=-1)

        with tf.variable_scope("encoder"):
            self.encode = get_embedding(self.inputs, self.vocab_size_en, self.channels, scope="en_embed")
            self.encode += get_positional_encoding(self.inputs, self.channels, scope="en_pe")
            self.encode += get_seg_embedding(self.segs, self.channels, scope="en_se")
            self.encode = tf.layers.dropout(self.encode, rate=self.dropout_rate,
                                            training=tf.convert_to_tensor(self.is_training))
            for i in range(self.num_layer):
                with tf.variable_scope("encoder_layer_{}".format(i)):
                    self.encode = multi_head_attention(self.encode, self.encode, self.channels,
                                                       num_heads=self.num_heads,
                                                       dropout_rate=self.dropout_rate,
                                                       is_training=self.is_training,
                                                       attention_mask_flag=False)
                    self.encode = feed_forward(self.encode, self.channels)
            self.encode_cls = tf.reshape(self.encode[:, :1, :], [-1, self.channels])

        self.output = tf.layers.dense(self.encode_cls, config.num_tags)
        self.preds = tf.to_int32(tf.argmax(self.output, axis=-1))
        self.acc = tf.reduce_mean(tf.to_float(tf.equal(self.preds, self.target)))
        if self.is_training:
            self.loss = tf.reduce_mean(tf.nn.sparse_softmax_cross_entropy_with_logits(logits=self.output, labels=self.target))
            self.global_step = tf.Variable(0, name='global_step', trainable=False)
            self.optimizer = tf.train.AdamOptimizer(learning_rate=self.learning_rate,
                                                    beta1=0.9, beta2=0.98, epsilon=1e-8)
            self.grads = self.optimizer.compute_gradients(self.loss)
            if config.is_transfer_learning:
                var_list = tf.trainable_variables()
                layer_name_list = ["encoder_layer_" + str(i) for i in range(4)]
                var_list_ = [v for v in var_list if v.name.split("/")[1] in layer_name_list]
                var_list_ += [v for v in var_list if "lookup_table" in v.name]
                for index, grad in enumerate(self.grads):
                    if grad[1] in var_list_:
                        self.grads[index] = (grad[0]*0.2, grad[1])
            self.train_op = self.optimizer.apply_gradients(self.grads, global_step=self.global_step)

到这里模型就准备好了，接下来对数据进行一些处理

3.SNLI to TF Record

将所有数据进行处理并生成segment ids：

def get_data(snli_name, max_length=config.max_length//2, word_dict=word_dict_en):
    sentence_1 = list()
    sentence_2 = list()
    label = list()
    texts = list()
    seg_ids = list()
    with open(os.path.join(data_path, snli_name), 'r') as f:
        for item in jsonlines.Reader(f):
            try:
                label.append(label_to_num_dict[item["gold_label"]])
            except KeyError:
                continue
            sentence_1.append(normalize_text(item["sentence1"]))
            sentence_2.append(normalize_text(item["sentence2"]))

    en_data_num_1 = text_to_numbers(sentence_1, word_dict_en, max_length=max_length)
    en_data_num_2 = text_to_numbers(sentence_2, word_dict_en, max_length=max_length)

    for i_ in range(len(en_data_num_1)):
        texts.append(en_data_num_1[i_] + [word_dict["_SEP"]] + en_data_num_2[i_] + [word_dict["_SEP"]])
        seg_ids.append((len(en_data_num_1[i_])+1)*[1]+(len(en_data_num_2[i_])+1)*[2])
    return texts, label, seg_ids

并转换为tf record格式，以便tensorflow 更高效的读取：

def write_binary(record_name, texts_, label_, seg_ids_):
    writer = tf.python_io.TFRecordWriter(record_name)
    for it, text in tqdm(enumerate(texts_)):
        example = tf.train.Example(
            features=tf.train.Features(
                feature={
                    "text_ids": tf.train.Feature(int64_list=tf.train.Int64List(value=text)),
                    "seg_ids": tf.train.Feature(int64_list=tf.train.Int64List(value=seg_ids_[it])),
                    "label": tf.train.Feature(int64_list=tf.train.Int64List(value=[label_[it]])),
                }
            )
        )
        serialized = example.SerializeToString()
        writer.write(serialized)
    writer.close()

4.训练

加载模型，加载数据：

if __name__ == '__main__':
    with tf.Session() as sess:
        data_set_train = get_dataset(train_snli_name_tf)
        data_set_train = data_set_train.shuffle(config.shuffle_pool_size).repeat(). \
            padded_batch(config.batch_size, padded_shapes=([config.max_length], [config.max_length], []))
        data_set_train_iter = data_set_train.make_one_shot_iterator()
        train_handle = sess.run(data_set_train_iter.string_handle())

        data_set_test = get_dataset(os.path.join(test_snli_name_tf))
        if test_total_acc:
            data_set_test = data_set_test.shuffle(config.shuffle_pool_size). \
                padded_batch(config.batch_size, padded_shapes=([config.max_length], [config.max_length], []))
        else:
            data_set_test = data_set_test.shuffle(config.shuffle_pool_size).repeat(). \
                padded_batch(config.batch_size, padded_shapes=([config.max_length], [config.max_length], []))
        data_set_test_iter = data_set_test.make_one_shot_iterator()
        test_handle = sess.run(data_set_test_iter.string_handle())

        handle = tf.placeholder(tf.string, shape=[])
        iterator = tf.data.Iterator.from_string_handle(handle, data_set_train.output_types,
                                                       data_set_train.output_shapes)

        inputs, segs, target = iterator.get_next()

        tsl = TransformerSNLICls(inputs, segs, target, config)
        sess.run(tf.global_variables_initializer())
        saver = tf.train.Saver(max_to_keep=1)

开始训练：

        print("starting training")
        for i in range(12000):
            train_feed = {handle: train_handle}
            sess.run(tsl.train_op, train_feed)
            if (i+1) % 100 == 0:
                pred, acc, loss = sess.run([tsl.preds, tsl.acc, tsl.loss], train_feed)
                print("Generation train {} : acc: {}  loss: {} ".format(i, acc, loss))
            if (i+1) % 200 == 0:
                tpred, tacc, tloss = sess.run([tsl.preds, tsl.acc, tsl.loss], {handle: test_handle})
                print("Generation test {} : acc: {}  loss: {} ".format(i, tacc, tloss))
            if (i+1) % 2000 == 0:
                print("Generation train {} model saved ".format(i))
                saver.save(sess, os.path.join(model_save_path, model_name.format(model_choose)))
        saver.save(sess, os.path.join(model_save_path, model_name.format(model_choose)))

最后，初步在整个测试集上达到78.7%的准确度

你可能感兴趣的:(DL,ML,NLP,TensorFlow)

SpringBoot之@Component，@Bean与@Configuration配置编码博客控程序员程序员 JAVA
目前对于Spring帮助我们管理Bean分为两个部分，一个是注册Bean，一个装配Bean。而完成这两个动作有三种方式，一种是使用自动配置的方式、一种是使用JavaConfig的方式，一种就是使用XML配置的方式。接下来我们只是初级的认识它们一.对于XML配置方式如下:<!--使用构造器注入的属性值可以指定参数的类型和参数的位置，以区分重载的构造器如果字面值包含特殊字符
android FragmentTabHost 的简单使用冰糖心158 android 开发
效果图：1、下面是一个简单的Demo,仅供参考packagecom.example.fragmentpageadapter;importjava.util.List;importandroid.os.Bundle;importandroid.support.v4.app.Fragment;importandroid.support.v4.app.FragmentActivity;importand
全面解读 Databricks：从架构、引擎到优化策略克里斯蒂亚诺罗纳尔多阿维罗架构 spark 大数据
导语：Databricks是一家由ApacheSpark创始团队成员创立的公司，同时也是一个统一分析平台，帮助企业构建数据湖与数据仓库一体化（Lakehouse）的架构。在Databricks平台上，数据工程、数据科学与数据分析团队能够协作使用Spark、DeltaLake、MLflow等工具高效处理数据与构建机器学习应用。本文将深入介绍Databricks的平台概念、架构特点、优化机制、功能特性
Java EE 11 中Servlet 6.1 的API 网址Apache组织 xiaoyustudiowww java
JavaEE11中Servlet6.1的API网址Apache组织，喜欢研究新技术的看过来https://tomcat.apache.org/tomcat-11.0-doc/servletapi/index.html
微信公众号h5更新内容部分手机出现白屏或者旧内容,需要刷新学无止境s_m_w 微信缓存前端 vue
出现的问题：大部分苹果手机，部分安卓手机第一次关注公众号时进入页面更新会出现白屏情况，或者内用没有更新，需要用户主动刷新才能解决为什么会出现和解决方案：1,一般情况js，css等文件添加版本号或者随机值会解决缓存问题如2,文件名使用hash形式3,在html中添加标签的缓存设置//用于定义页面缓存,不缓存页面(为了提高速度一些浏览器会缓存浏览者浏览过的页面,通过下面的定义,浏览器一般不会缓存页面,
[随笔] uniapp微信小程序端踩坑记2---input监听、点击事件、Wxml中不可使用this "William'_ uni-app 小程序 vue.js
在微信小程序端使用watch()监听input标签输入的值时出错。处理：不使用watch()监听，对input标签绑定@input事件，方法中使用e.detail.value获取输入值。<inputclass="lu-input"@input="search"v-model="iuputShow"/
微信小程序开发入门教程天马3798 教程系列整理微信小程序小程序
微信小程序开发入门教程#1、微信小程序的概念、历史、发展微信小程序的概念、历史、发展-CSDN博客#2、微信小程序的开发工具微信官方给出的开发工具：概览|微信开放文档#3、微信小程序的项目结构、创建、发布审核#4、微信小程序开发常见问题整理#5、微信小程序的框架接口#6、微信小程序的wxml基础语法微信小程序数组绑定使用案例（一）_微信小程序绑定一个数组对象list到页面,修改数组中的一个值,在把
docker 部署带多种配置文件的 springboot 项目淘气小姑娘 docker linux java
准备工作：1、将要制作镜像的Springboot项目打成jar包。2、将jar包和该程序所有配置文件放在同一文件夹下（xml、yml、txt、jar等），我这里文件夹名字为json3、在该文件夹下写Dockerfile.txt文件：#指含有jdk1.8的镜像FROMjava#将当前目录下面的json-0.0.1-SNAPSHOT.jar复制命名为app.jar（复制后的名字可以自定义）。copya
洞悉人性的职场沟通技术黎女士企业培训在线学习职场沟通职场和发展
http://www.dianzikejian.com/content_2395.html背景：在企业管理的过程中为什么频频出现沟而不通，为什么每次沟通的事项不能有效的跟进和落实，为什么同事之间误会频频、协作不畅？……通过对企业大量的案例研究分析，我们发现很多时候是因为组织中每一位员工自身的沟通能力有待提升；同时当沟通出现问题，作为职场中每一位伙伴首先应该建立的认知是：沟通出现问题首先是我的问题。
MongoDB 客户端工具(图) IT古董 Mongodb mongodb 工具 couchdb 集群 php windows
转自:http://hi.baidu.com/shepherdnewage/blog/item/962368f05d1f427fdcc4747c.htmlhttp://www.javabloger.com/article/mongodb-gui-win-linux-mac.htmlNoSQL的运动不止，MongoDB作为其中的主力军发展迅猛，但是图形化工具少见，我在此做了一个简单的收集，如果将来有
基于深度学习CNN网络 mini-xception网络实现构建一个完整的人脸表情检测_识别分类系统，包括训练、评估、前端和服务端代码计算机c9硕士算法工程师卷积神经网络深度学习 cnn 分类
人脸表情检测该项目已训练好网络模型，配置好环境即可运行使用，效果见图像，实现图像识别、摄像头识别、摄像头识别/识别分类项目-说明文档-UI界面-cnn网络项目基本介绍：【网络】深度学习CNN网络mini-xception网络【环境】python>=3.5tensorflow2opencvpyqt5【文件】训练预测全部源代码、训练好的模型、fer2013数据集、程序算法讲解文档【类别】对7种表情检测
制作图片木马摸金校尉-马学习
图片文件通常有称作幻数的头字节，我们来看一下几种图片文件的幻数：（注意！下面是二进制而不是文本格式的数据）通过检查头几位字节，可以分辨是否是图片文件！通过检查头几位字节，可以分辨是否是图片文件！给上传脚本加上相应的幻数头字节就可以，php引擎会将GIF89a的内容当作html文本，不解释而跳过，后面的代码仍然能够得到执行比如下面：（一般不限制图片文件格式的时候使用GIF的头比较方便，因为全都是文本
uniapp 微信小程序金额展示套餐竣子好逑 uniapp v2 组件 uni-app 微信小程序小程序
html喜欢作者其他金额-->￥{{item}}js//打赏asyncfun_reward(price){//里面写逻辑},css.gradelist{padding:30rpx;background:#f5f5f5;border-radius:8rpx;box-sizing:border-box;border-radius:12rpx;margin-top:30rpx;.gradelisTitl
微信小程序 ggggyyyyy0928 微信小程序小程序
一、小程序文件结构1.目录结构pages文件夹：存放【页面文件夹】，一个【页面文件夹】就是一个页面，存放着小程序页面文件。即pages中的每一个文件夹都存放着一个小程序页面的文件（js、wxml、json、wxss）页面文件夹一个【页面文件夹】中必须包含以下4个文件，为了方便开发者减少配置项，描述页面的四个文件必须具有相同的路径与文件名。.json后缀的JSON配置文件.wxml后缀的WXML模板
uniapp实现拨打电话功能： Sun Peng 小程序端 uniapp 前端
1.实现:电话:{{item.contactNumber}}//电话按钮handlePhoneBtn(tel){uni.makePhoneCall({//直接使用uniapp里面的方法phoneNumber:'"'+tel+'"'});},2.效果:
保姆级解析雪花算法原理，看完必懂！程序员
引言最近发现项目里主键id生成算法很短小精悍，遂深入看了下，还蛮有意思，在此分享一下，源码如下。privatestaticSpinLockmLock=newSpinLock();privatestaticvolatileintrotateId=0;privatestaticvolatilelongtimeId=0;privatestaticintnodeId=0;privatestaticintr
SnowNLP 情感分析 Taichi呀 python 开发语言
#-*-coding:utf-8-*-importsysfromsnownlpimportSnowNLPfromjiebaimportanalysefromjiebaimportpossegtxt=u'''在文学的海洋中，有一部名为《薄雾》的小说，它犹如一颗闪耀的明珠，让人过目难忘。这部作品讲述了一段发生在上世纪初的跨越阶级的爱情故事。在这篇文学短评中，我们将探讨这部小说所展现的情感与人性，以及它
设计模式之代理模式 Code额设计模式代理模式
代理模式这里主要是对代理模式中的JDK动态代理、CGLIB代理以代码的形式做简单的介绍1.JDK动态代理代理对象和目标对象必须实现相同的接口。使用Proxy类提供了为对象产生代理对象的方法：publicstaticObjectnewProxyInstance(ClassLoaderloader,Class[]interfaces,InvocationHandlerh)ClassLoaderload
多商户商城系统会用的技术有哪些 hunzi_1 uni-app java php
前端技术HTML/CSS：超文本标记语言（HTML）用于构建页面的结构，层叠样式表（CSS）负责页面的样式设计，它们共同决定了商城系统的页面展示效果，包括商品展示、店铺页面、用户界面等的布局和外观。JavaScript：是一种脚本语言，用于为网页添加动态效果和交互性，如实现菜单的展开与收缩、商品图片的轮播、用户操作的响应等。Vue.js/React：流行的前端框架，能够帮助开发者更高效地构建复杂的
搭建商城系统有可能运用到什么技术 hunzi_1 微信小程序小程序
搭建商城系统涉及多种技术，涵盖前端、后端和数据库等多个方面：一、前端技术HTML（超文本标记语言）这是构建网页的基础语言，用于定义页面的结构。在商城系统中，通过HTML可以创建商品展示页面、购物车页面、用户注册登录页面等的基本框架。例如，使用标签来划分页面的不同区域，如商品图片展示区、商品描述区、购买按钮区域等；用标签来显示商品图片，通过设置其src属性来指定图片的来源路径。CSS（层叠样式表）用
48.MVVM简简单单描述 C#例子 WPF例子军训猫猫头 c#wpf 开发语言
MVVM（Model-View-ViewModel）为什么要用它因为它好维护一、MVVM的组成Model独立于View和ViewModelViewXAML语言的用户界面层ViewModel包括View的状态、操作和命令
Spring boot 集成分布式定时任务沉默,王二 spring boot 分布式后端
Springboot集成分布式定时任务定义及作用在分布式定时任务中，需要一种机制来确保同一任务在不同的服务实例中不会同时执行，这就是分布式定时任务锁的作用。集成引入相关依赖net.javacrumbs.shedlockshedlock-spring4.30.0net.javacrumbs.shedlockshedlock-provider-redis-spring4.30.0编写配置类packag
第三讲隐语架构 huang8666 人工智能
第三讲隐语架构产品层白屏黑屏两大模块通过可视化产品，降低终端用户的体验和演示成本通过模块化API降低技术集成商的研发成本隐语产品SecretPad：轻量化安装快速验证POC可定制集成SecretNote：Notebook形式交互式建模多节点一站式管理和交互运行状态跟踪算法层PSI/PIR、DataAnalysis、FederatedLearningPSI（PrivateSetIntesection
媒体资讯视频数据采集-yt-dlp 使用指南 (中文版) 救救孩子把媒体音视频 yt-dlp
yt-dlp使用指南(中文版)开源项目地址https://github.com/yt-dlp/yt-dlpyt-dlp是一款功能丰富的命令行音视频下载器，支持数千个网站。该项目是基于已停止维护的youtube-dlc项目的youtube-dl的分支。yt-dlp可以下载多家流媒体平台的音视频资源，仓库地址为：yt-dlp/yt-dlp:Afeature-richcommand-lineaudio/
python 手动安装第三方库 xiongerbuer python python 库
1.下载对应操作系统的安装包，如lxml包官网有下载，网上也有很多下载地址2.安装wheelpipinstallwheel3.安装lxmlpipinstallF:\Downloads\lxml-3.6.0-cp35-cp35m-win32.whl
docker部署ELK日志系统+kafka weixin_50837690 docker kafka elk elasticsearch
docker部署ELK日志系统+kafka1.部署elasticsearch#拉取镜像dockerpullelasticsearch:7.6.2#创建文件夹mkdir-p/data/elk/es/config#创建elasticsearch.yml文件vi/data/elk/es/config/elasticsearch.yml------------------------写入---------
Emgu.CV 报错 Emgu.CV.Util.CvException: OpenCV Echo_Wish C#笔记 OpenCV opencv 计算机视觉人工智能
Emgu.CV报错Emgu.CV.Util.CvException:OpenCV异常信息：Emgu.CV.Util.CvException:OpenCV:在Emgu.CV.CvInvoke.CvErrorHandler(Int32status,IntPtrfuncName,IntPtrerrMsg,IntPtrfileName,Int32line,IntPtruserData)在Emgu.CV.C
Python调用.dll文件,报错FileNotFoundError: Could not find module ‘xx\....\xx.dll 腿。 python 经验分享开发语言
一、代码及报错详情fromctypesimportCDLLimportosdll_path=r"path_to_your_dll\name.dll"#替换为实际的DLL文件路径tmp=CDLL(dll_path)Traceback(mostrecentcalllast):self._handle=_dlopen(self._name,mode)FileNotFoundError:Couldnotf
[WIN7 Python3.8] FileNotFoundError-- 找不到dll的问题雅各布_001 python 算法
文章目录一、报错二、分析1.按照找不到lib_lightgbm.dll库来分析——失败2.按照缺失依赖查找(***oroneofitsdependencies***)2.1Dependencywalker简介
python使用pyzbar报错filenotfounderror: could not find module ‘libiconv.dll‘ susu1083018911 python
查了好久的问题，也不知道为什么。记录一下解决办法：libiconv.dll需要安装动态连接库，下载地址：https://download.microsoft.com/download/F/3/5/F3500770-8A08-488E-94B6-17A1E1DD526F/vcredist_x64.exe下载完以后双击安装，安装好就没有问题了。
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS