滚滚的纸盒子

textCNN在tensorflow上的故事——记一个tf入门者的学习之路

背景

这篇博客主要用来记录一个从不会tensorflow到第一个project（textCNN—中文短文本分类）正式开张的故事，用来与同样刚入门tf的童鞋交流，大神就不必看了：

本人有一定机器学习的理论基础，如果你对CNN原理不了解的可以去Coursera上看看Andrew Ng的Machine Learning课程关于NN部分，遇到不懂的百度/Google翻阅博客，基本看一部分再把不懂得琢磨查资料思考后对NN大致会有了解了，然后查查各种博客看看CNN的原理与过程，理论上就大致有个印象了
之前在torch上实现了4层CNN对cifar-10的78%准确率识别，之所以没有直接用VGG或者GoogleNet这种已经有的大佬网络，主要是方便自己感受下CNN的搭建使用以及框架的熟悉。tensorflow这次是第一次用。
本人仍然是在笔记本（mac pro 2015）上进行textCNN代码试运行后再考虑去台式机带GPU上调参，本子cpu跑3s一个batch，台式带gpu（linux系统）1s三个batch，心累。。
主要描述我这种业余选手从不会tf到运行project v1的经历，并不高大上。

- 背景
- tensorflow初次见面
- 正片是啥
- data_helperspy相关解释
- text_cnnpy相关解释
- trainpy相关解释
- 最后贴一个效果

tensorflow初次见面

安装：直接去官网，上面有完整指南。个人不建议windows，在linux、mac、windows都装过，在windows上面第一个程序关于mnist手写识别的就崩了，mac安然无恙。可能是我水平次，但win给我的印象太…
官方tf教程：如果英文看起来吃力，给个传送门http://wiki.jikexueyuan.com/project/tensorflow-zh/get_started/introduction.html，中文版，但是像我这种性格官方版本过于官方不够细致和通俗，显然是看不太下的。
如果官方版本看不下去，有个B站的系列视频做的不错，传送门在此http://www.bilibili.com/video/av6653880/，不过up主貌似是双系统（刚刚被我黑的win…）。
经过理论的饲养（Andrew Ng+各种博客），再加上上述官方文档和视频（不懂再去查资料看博客）的熏陶，基本上对tf这个框架和CNN都有个大致了解了。
接下来进行textCNN对短文本分类，因为不像图形处理那样直接数据就是像素矩阵，所以相对麻烦一些，原始代码是Github上的某位大佬的，表示感谢，帮了我大忙链接在此https://github.com/dennybritz/cnn-text-classification-tf
感觉使用实际代码来操作几波对textCNN和tensorflow熟悉感增加不少，直接看论文，真的看不太动。

正片是啥

对上述Github上代码的做一些注释，帮助类似我的初学者理解，代码可能有不同，请与原来的代码对比，下面会陆续贴部分代码，主要用到了data_helpers.py、text_cnn.py、train.py，第三个可以看做是主函数

data_helpers.py相关解释

这部分主要是定义了两个函数：

（1）第一个是数据载入函数
输入样本文档，输出样本data、样本label的list，这个没啥好说的。不过值得注意的是，这里作者是一次性将所有样本塞进去内存了，存在一个隐患问题，样本大了后会爆内存，别问我为什么会知道。解决方案可能稍后会做一些对比尝试或许更新博客，比如对超大大样本随机抽样（有放回和无放回到底哪样最合适待验证）出100个不爆内存的样本，然后按照随机顺序放进模型训练，训练仍采用minibatch。（为什么使用minibatch训练，我直接给个链接http://hp.stuhome.net/index.php/2016/09/20/tensorflow_batch_minibatch/，其实大家应该都知道原委）

这部分代码请根据自己的样本文档特征修改，我的就不贴了，可能大家的样本情况格式都不一样。

（2）第二个函数为一个batch样本生成器

def batch_iter(data, batch_size, num_epochs, shuffle=True):
    """
    Generates a batch iterator for a dataset.批量数据batchsize生成器
    定义一个函数，输出batch样本，参数为data（包括feature和label），batchsize，epoch
    """
    data = np.array(data)#全部数据转化为array
    data_size = len(data)
    num_batches_per_epoch = int((len(data)-1)/batch_size) + 1#每个epoch有多少个batch，个数
    for epoch in range(num_epochs):
        # Shuffle the data at each epoch
        if shuffle:
            shuffle_indices = np.random.permutation(np.arange(data_size))
            shuffled_data = data[shuffle_indices]# shuffled_data按照上述乱序得到新的样本
        else:
            shuffled_data = data
        for batch_num in range(num_batches_per_epoch):#开始生成batch
            start_index = batch_num * batch_size
            end_index = min((batch_num + 1) * batch_size, data_size)#这里主要是最后一个batch可能不足batchsize的处理
            yield shuffled_data[start_index:end_index]
            #yield，在for循环执行时，每次返回一个batch的data，占用的内存为常数

这里可以看出作者的细心，第一个是end_index = min((batch_num + 1) * batch_size, data_size)，考虑最后最后一个batch可能大小不够batchsize了，这在上一篇博客也见到过，第二个是生成器，而不是返回一个包含各个batch样本的list（这一点是否是我多虑了呢，没有仔细观察内存状况对比）

text_cnn.py相关解释

这部分主要是建立了一个text_cnn结构的类
结构比较简单，一个embedding layer+一个convolution layer（Relu）+一个maxpooling层+softmax
主要会引起思考的问题在哪呢，如果你一行行敲代码就会发现：

（1）每个层的参数设置问题
（2）embedding layer和所谓的word2vec是个什么关系

先回答第二个问题，一开始我接触这个project的时候，天真的想，word2vec不就是一个把词的one-hot形式转化为稠密的短向量表示的工具么，用过后一个文本就变成了稠密矩阵，再当图像处理不行么？当然不行！
为什么？

reason one > 如果你仔细看下word2vec的原理，会发现vector其实是一个中间产物，本质上是模型的一部分参数，那意味着什么，不同的训练目标和样本结构得到的最优参数是不一样的，所以不存在固定的vector来表示某个word，具体分析贴一个链接http://spaces.ac.cn/archives/4122/，这是找了数篇资料才发现的解答，贼棒！当然，上面提到的B站up主也有相关解释，也不错。

reason two > 图像处理的卷积核比如3*3，可以横向和纵向两个方向移动，而文本是不行的，因为一个word的表示就是一个横向量，你不能通过原来这种卷积核把一个单词的表示拆开，破坏单词的表示，在这里，一个单词应该和图像的像素点对应即最小单元（但是实际效果我还没去对比过，后续有时间我可能会做以下对比试验），所以卷积核只会在一个维度上移动，比如词的vector为256长度，那么卷积核应该为3*256。

—另外注意他的maxpooling参数设置，好好感受下，利用CNN解决文本分类问题的文章还是很多的，比如这篇 A Convolutional Neural Network for Modelling Sentences 最有意思的输入是在 pooling 改成 (dynamic) k-max pooling ，pooling阶段保留 k 个最大的信息，保留了全局的序列信息，效果我暂时还没去尝试，后续有兴趣了再更新吧。

然后回答第一个问题：
我当时用torch的时候没有遇到这种问题，因为torch写CNN太轻松了，一个卷积层你直接add一个卷积模块就行了，但是tensorflow很细节化，需要你写出参数矩阵w、b的tensor规格，所以这里涉及卷积核参数维度、移动维度等问题，这里接着贴一个链接，也是找了一些资料才发现回答的比较好的。http://blog.csdn.net/hymanyoung/article/details/65444288直接看“TensorFlow卷积神经网络实践”后面的部分，比较清楚的说明了各参数的结构

这一部分我的整体加注释的代码，可能不专业，但希望有助于理解。

import tensorflow as tf
import numpy as np


class TextCNN(object):#定义了1个TEXTCNN的类，包含一张大的graph
    """
    A CNN for text classification.
    Uses an embedding layer, followed by a convolutional, max-pooling and softmax layer.
    embedding层，卷积层，池化层，softmax层
    """
    def __init__(
      self, sequence_length, num_classes, vocab_size,
      embedding_size, filter_sizes, num_filters, l2_reg_lambda=0.0):#定义各种输入参数，这里的输入是句子各词的索引？

        # Placeholders for input, output and dropout
        self.input_x = tf.placeholder(tf.int32, [None, sequence_length], name="input_x")
        #定义一个operation，名称input_x,利用参数sequence_length，None表示样本数不定，
        #不一定是一个batchsize，训练的时候是，验证的时候None不是batchsize
        #这是一个placeholder，
        #数据类型int32，（样本数*句子长度）的tensor，每个元素为一个单词
        self.input_y = tf.placeholder(tf.float32, [None, num_classes], name="input_y")
        #这个placeholder的数据输入类型为float，（样本数*类别）的tensor
        self.dropout_keep_prob = tf.placeholder(tf.float32, name="dropout_keep_prob")
        #placeholder表示图的一个操作或者节点，用来喂数据，进行name命名方便可视化

        # Keeping track of l2 regularization loss (optional)
        l2_loss = tf.constant(0.0)
        #l2正则的初始化，有点像sum=0
        #其实softmax是需要的

        # Embedding layer
        #参见
        with tf.device('/cpu:0'), tf.name_scope("embedding"):#封装了一个叫做“embedding'的模块，使用设备cpu，模块里3个operation
            self.W = tf.Variable(
                tf.random_uniform([vocab_size, embedding_size], -1.0, 1.0),
                name="W")#operation1，一个（词典长度*embedsize）tensor，作为W，也就是最后的词向量
            self.embedded_chars = tf.nn.embedding_lookup(self.W, self.input_x)
            #operation2，input_x的tensor维度为[none，seq_len],那么这个操作的输出为none*seq_len*em_size
            self.embedded_chars_expanded = tf.expand_dims(self.embedded_chars, -1)
            #增加一个维度，变成，batch_size*seq_len*em_size*channel(=1)的4维tensor，符合图像的习惯

        # Create a convolution + maxpool layer for each filter size
        pooled_outputs = []#空list
        for i, filter_size in enumerate(filter_sizes):#比如（0，3），（1，4），（2，5）
            with tf.name_scope("conv-maxpool-%s" % filter_size):#循环第一次，建立一个名称为如”conv-ma-3“的模块
                # Convolution Layer
                filter_shape = [filter_size, embedding_size, 1, num_filters]
                #operation1，没名称，卷积核参数，高*宽*通道*卷积个数
                W = tf.Variable(tf.truncated_normal(filter_shape, stddev=0.1), name="W")
                #operation2，名称”W“，变量维度filter_shape的tensor
                b = tf.Variable(tf.constant(0.1, shape=[num_filters]), name="b")
                #operation3，名称"b",变量维度卷积核个数的tensor
                conv = tf.nn.conv2d(
                    self.embedded_chars_expanded,
                    W,
                    strides=[1, 1, 1, 1],#样本，height，width，channel移动距离
                    padding="VALID",
                    name="conv")
                #operation4，卷积操作，名称”conv“，与w系数相乘得到一个矩阵
                # Apply nonlinearity
                h = tf.nn.relu(tf.nn.bias_add(conv, b), name="relu")
                #operation5，加上偏置，进行relu，名称"relu"
                # Maxpooling over the outputs
                pooled = tf.nn.max_pool(
                    h,
                    ksize=[1, sequence_length - filter_size + 1, 1, 1],
                    strides=[1, 1, 1, 1],
                    padding='VALID',
                    name="pool")
                pooled_outputs.append(pooled)
                #每个卷积核和pool处理一个样本后得到一个值，这里维度如batchsize*1*1*卷积核个数
                #三种卷积核，appen3次

        # Combine all the pooled features
        num_filters_total = num_filters * len(filter_sizes)
        #operation，每种卷积核个数与卷积核种类的积
        self.h_pool = tf.concat(pooled_outputs, 3)
        #operation，将outpus在第4个维度上拼接，如本来是128*1*1*64的结果3个，拼接后为128*1*1*192的tensor
        self.h_pool_flat = tf.reshape(self.h_pool, [-1, num_filters_total])
        #operation，结果reshape为128*192的tensor

        # Add dropout
        with tf.name_scope("dropout"):
            self.h_drop = tf.nn.dropout(self.h_pool_flat, self.dropout_keep_prob)
        #添加一个"dropout"的模块，里面一个操作，输出为dropout过后的128*192的tensor

        # Final (unnormalized) scores and predictions
        with tf.name_scope("output"):#添加一个”output“的模块，多个operation
            W = tf.get_variable(
                "W",
                shape=[num_filters_total, num_classes],
                initializer=tf.contrib.layers.xavier_initializer())
            #operation1，系数tensor，如192*2，192个features分2类，名称为"W"，注意这里用的是get_variables
            b = tf.Variable(tf.constant(0.1, shape=[num_classes]), name="b")
            #operation2,偏置tensor，如2，名称"b"
            l2_loss += tf.nn.l2_loss(W)
            #operation3，loss上加入w的l2正则
            l2_loss += tf.nn.l2_loss(b)
            #operation4，loss上加入b的l2正则
            self.scores = tf.nn.xw_plus_b(self.h_drop, W, b, name="scores")
            #operation5，scores计算全连接后的输出，如[0.2,0.7]名称”scores“
            self.predictions = tf.argmax(self.scores, 1, name="predictions")
            #operations，计算预测值，输出最大值的索引，0或者1，名称”predictions“

        # CalculateMean cross-entropy loss
        with tf.name_scope("loss"):#定义一个”loss“的模块
            losses = tf.nn.softmax_cross_entropy_with_logits(logits=self.scores, labels=self.input_y)
            #operation1，定义losses，交叉熵，如果是一个batch，那么是一个长度为batchsize1的tensor？
            self.loss = tf.reduce_mean(losses) + l2_reg_lambda * l2_loss
            #operation2，计算一个batch的平均交叉熵，加上全连接层参数的正则

        # Accuracy
        with tf.name_scope("accuracy"):#定义一个名称”accuracy“的模块
            correct_predictions = tf.equal(self.predictions, tf.argmax(self.input_y, 1))
            #operation1，根据input_y和predictions是否相同，得到一个矩阵batchsize大小的tensor
            self.accuracy = tf.reduce_mean(tf.cast(correct_predictions, "float"), name="accuracy")
            #operation2，计算均值即为准确率，名称”accuracy“

train.py相关解释

就是主函数了，输入样本和超参数，训练网络、存储参数、计算准确率等，带“summary”的函数或者模块是tensorflow储存参数和可视化的工具，我暂时也不怎么熟练，就没怎么写注释，不过不影响功能。

这一节没什么大的引起思考的问题，加了一点点注释和改了一点点参数：

import tensorflow as tf
import numpy as np
import os
import time
import datetime
import data_helpers
from text_cnn import TextCNN
from tensorflow.contrib import learn

# Parameters
# ==================================================

# Data loading params,
#数据集里10%为验证集
tf.flags.DEFINE_float("dev_sample_percentage", .1, "Percentage of the training data to use for validation")
#原数据的文件路径
tf.flags.DEFINE_string("data_file", "/Users/xuhy/Downloads/cnn-text-wujun/data/after_fenci_wujuncnndata", "Data source.")

# Model Hyperparameters
#embedding维度256，4种卷积核，每种128个，0.5的dropout
tf.flags.DEFINE_integer("embedding_dim", 256, "Dimensionality of character embedding (default: 128)")
tf.flags.DEFINE_string("filter_sizes", "2,3,4,5", "Comma-separated filter sizes (default: '2,3,4,5')")
tf.flags.DEFINE_integer("num_filters", 128, "Number of filters per filter size (default: 128)")
tf.flags.DEFINE_float("dropout_keep_prob", 0.5, "Dropout keep probability (default: 0.5)")
tf.flags.DEFINE_float("l2_reg_lambda", 0.0, "L2 regularization lambda (default: 0.0)")

# Training parameters
#batchsize为64，20个epoch，每100个batch后，计算验证集上的表现，每100个batch后保存模型，checkpoint是个啥？
tf.flags.DEFINE_integer("batch_size", 64, "Batch Size (default: 64)")
tf.flags.DEFINE_integer("num_epochs", 20, "Number of training epochs (default: 200)")
tf.flags.DEFINE_integer("evaluate_every", 100, "Evaluate model on dev set after this many steps (default: 100)")
tf.flags.DEFINE_integer("checkpoint_every", 100, "Save model after this many steps (default: 100)")
tf.flags.DEFINE_integer("num_checkpoints", 5, "Number of checkpoints to store (default: 5)")

# Misc Parameters
#true表示自动寻找一个存在并支持的cpu或者gpu，防止指定的设备不存在
#如果将False改为True，可以看到operations被指派到哪个设备运行
tf.flags.DEFINE_boolean("allow_soft_placement", True, "Allow device soft device placement")
tf.flags.DEFINE_boolean("log_device_placement", False, "Log placement of ops on devices")

FLAGS = tf.flags.FLAGS#FLAGS是一个对象，保存了解析后的命令行参数
FLAGS._parse_flags()
print("\nParameters:")
for attr, value in sorted(FLAGS.__flags.items()):
    print("{}={}".format(attr.upper(), value))
print("")


# Data Preparation
# ==================================================

# Load data

print("Loading data...")
print("start_time"+"\t\t"+str(datetime.datetime.now().isoformat()))
x_text, y = data_helpers.load_data_and_labels(FLAGS.data_file)
print("end_time"+"\t\t"+str(datetime.datetime.now().isoformat()))
#这里的y是数值，x还是单词序列
#！！！这里一次性载入所有数据，注意考虑内存，大数据的情况下如何载入需要分析

# Build vocabulary
print("生成单词索引，构成样本索引矩阵...")
print("start_time"+"\t\t"+str(datetime.datetime.now().isoformat()))
max_document_length = 298#每一条评价的最多单词数字
vocab_processor = learn.preprocessing.VocabularyProcessor(max_document_length)
#单词转化为在字典中的位置，这是一个操作
x = np.array(list(vocab_processor.fit_transform(x_text)))
y = np.array(y)
print("end_time"+"\t\t"+str(datetime.datetime.now().isoformat()))
#在不够长度的评价最后加0，样本变成了索引数值矩阵，这里的x已经是索引序列了，n*seq_len的tensor

# Randomly shuffle data
print("打乱样本顺序...")
print("start_time"+"\t\t"+str(datetime.datetime.now().isoformat()))
np.random.seed(10)
shuffle_indices = np.random.permutation(np.arange(len(y)))#打乱样本
x_shuffled = x[shuffle_indices]#新的乱序样本
y_shuffled = y[shuffle_indices]#新的乱序label
print("end_time"+"\t\t"+str(datetime.datetime.now().isoformat()))

# Split train/test set
# TODO: This is very crude, should use cross-validation训练集、验证集划分完毕，全部是索引数值
print("生成训练集和验证集...")
print("start_time"+"\t\t"+str(datetime.datetime.now().isoformat()))
dev_sample_index = -1 * int(FLAGS.dev_sample_percentage * float(len(y)))#负数，倒过来数
x_train, x_dev = x_shuffled[:dev_sample_index], x_shuffled[dev_sample_index:]#切片
y_train, y_dev = y_shuffled[:dev_sample_index], y_shuffled[dev_sample_index:]
print("Vocabulary Size: {:d}".format(len(vocab_processor.vocabulary_)))#字典长度
print("Train/Dev split: {:d}/{:d}".format(len(y_train), len(y_dev)))#训练集和验证集长度
print("end_time"+"\t\t"+str(datetime.datetime.now().isoformat()))

# Training
# ==================================================

with tf.Graph().as_default():
    session_conf = tf.ConfigProto(
      allow_soft_placement=FLAGS.allow_soft_placement,
      log_device_placement=FLAGS.log_device_placement)#这个session配置，按照前面的gpu，cpu自动选择
    sess = tf.Session(config=session_conf)#建立一个配置如上的会话
    with sess.as_default():#在上述session填充内容
        cnn = TextCNN(
            sequence_length=x_train.shape[1],#[0]是样本维度，样本数量，[1]是单个样本的长度
            num_classes=y_train.shape[1],#同理，这里是类别数量
            vocab_size=len(vocab_processor.vocabulary_),#字典长度
            embedding_size=FLAGS.embedding_dim,
            filter_sizes=list(map(int, FLAGS.filter_sizes.split(","))),
            num_filters=FLAGS.num_filters,
            l2_reg_lambda=FLAGS.l2_reg_lambda)  #包含一个CNN
        #TextCNN是一个类，输入参数，得到一个CNN结构

        # Define Training procedure
        global_step = tf.Variable(0, name="global_step", trainable=False)#定义一个变量step
        optimizer = tf.train.AdamOptimizer(1e-3)#里面是学习速率，选择优化算法，建立优化器
        grads_and_vars = optimizer.compute_gradients(cnn.loss)#选择目标函数，计算梯度；返回的是梯度和变量
        #函数minimize() 与compute_gradients()都含有一个参数gate_gradient，用于控制在应用这些梯度时并行化的程度。这里没有？
        train_op = optimizer.apply_gradients(grads_and_vars, global_step=global_step)#运用梯度

中间summary环节我就没怎么写，就不贴了，直接帖后面的。

        # Initialize all variables
        sess.run(tf.global_variables_initializer())#初始化所有变量

        #定义了一个函数，输入为1个batch
        def train_step(x_batch, y_batch):
            """
            A single training step
            """
            feed_dict = {
              cnn.input_x: x_batch,
              cnn.input_y: y_batch,
              cnn.dropout_keep_prob: FLAGS.dropout_keep_prob
            }
            _, step, summaries, loss, accuracy = sess.run(
                [train_op, global_step, train_summary_op, cnn.loss, cnn.accuracy],
                feed_dict)
            #梯度更新（更新模型），步骤加一，存储数据，计算一个batch的损失，计算一个batch的准确率
            time_str = datetime.datetime.now().isoformat()#当时时间
            print("{}: step {}, loss {:g}, acc {:g}".format(time_str, step, loss, accuracy))
            train_summary_writer.add_summary(summaries, step)

        #定义了一个函数，用于验证集，输入为一个batch
        def dev_step(x_batch, y_batch, writer=None):
            """
            Evaluates model on a dev set
            """
            #验证集太大，会爆内存，采用batch的思想进行计算，下面生成多个子验证集
            num=20
            x_batch=x_batch.tolist()
            y_batch=y_batch.tolist()
            l=len(y_batch)
            l_20=int(l/num)
            x_set=[]
            y_set=[]
            for i in range(num-1):
                x_temp=x_batch[i*l_20:(i+1)*l_20]
                x_set.append(x_temp)
                y_temp=y_batch[i*l_20:(i+1)*l_20]
                y_set.append(y_temp)
            x_temp=x_batch[(num-1)*l_20:]
            x_set.append(x_temp)
            y_temp=y_batch[(num-1)*l_20:]
            y_set.append(y_temp)

            #每个batch验证集计算一下准确率，num个batch再平均
            lis_loss=[]
            lis_accu=[]
            for i in range(num):    
                feed_dict = {
                cnn.input_x: np.array(x_set[i]),
                cnn.input_y: np.array(y_set[i]),
                cnn.dropout_keep_prob: 1.0
                }
                step, summaries, loss, accuracy = sess.run(
                    [global_step, dev_summary_op, cnn.loss, cnn.accuracy],
                    feed_dict)
                lis_loss.append(loss)
                lis_accu.append(accuracy)
                time_str = datetime.datetime.now().isoformat()
                print("{}: step {}, loss {:g}, acc {:g}".format(time_str, step, loss, accuracy))
            print("test_loss and test_acc"+"\t\t"+str(sum(lis_loss)/num)+"\t\t"+str(sum(lis_accu)/num))
            if writer:
                writer.add_summary(summaries, step)


        # Generate batches（生成器），得到一个generator，每一次返回一个batch，没有构成list[batch1,batch2,batch3,...]
        batches = data_helpers.batch_iter(
            list(zip(x_train, y_train)), FLAGS.batch_size, FLAGS.num_epochs)
        #zip将样本与label配对，
        # Training loop. For each batch...
        for batch in batches:
            x_batch, y_batch = zip(*batch)#unzip，将配对的样本，分离出来data和label
            train_step(x_batch, y_batch)#训练，输入batch样本，更新模型
            current_step = tf.train.global_step(sess, global_step)
            if current_step % FLAGS.evaluate_every == 0:#每多少步，算一下验证集效果
                print("\nEvaluation:")
                dev_step(x_dev, y_dev, writer=dev_summary_writer)#喂的数据为验证集，此时大小不止一个batchsize1的大小
                print("")
            if current_step % FLAGS.checkpoint_every == 0:#每多少步，保存模型
                path = saver.save(sess, checkpoint_prefix, global_step=current_step)
                print("Saved model checkpoint to {}\n".format(path))

这里当时遇到了一个问题，就是每次验证集计算的时候，内存就爆了，然后我就采用minibatch的想法改进了以下，没毛病了。

最后贴一个效果

初级版本，后续会尽量优化
目前，23w+样本，类别25+，下面是训练不到2个epoch的情况，测试集准确率86.17%：

test_loss and test_acc 0.475186523795 0.861730447412

Saved model checkpoint to /Users/xuhy/runs/1498792747/checkpoints/model-6800

后面有空更。
谢谢！

学习宣传贯彻党的建设工作会议精神，谱写组织工作新篇章一切照旧
1月18日，广西壮族自治区党委召开党的建设工作领导小组会议，学习贯彻全国组织部长会议精神，研究部署下步工作，切实把会议精神贯彻落实到组织工作全过程、各方面，努力谱写组织工作高质量发展新篇章。要坚持加强党中央集中统一领导。突出抓好党的政治建设，落实健全全面从严治党体系任务要求，始终聚焦基层基础，以开展基层党建“五基三化”提升年行动重点工作为总抓手，不断筑牢基层堡垒、打造过硬队伍，持续增强基层党组织政
张柏芝与陈乔恩同框，两人竟只相差1岁？守护你的喵
张柏芝和陈乔恩罕见同框！两个女神貌美如花。张柏芝身穿秋冬系列皮衣，内搭及膝吊带连身裙，整个人显得既高贵大气又性感。陈乔恩一袭褐色的v领修身针织衫，搭配红唇，肤白美貌。两位女神一同出镜，难免让网友们互相比较了起来，经过一番比较，不难看出的是，陈乔恩38岁，张柏芝37岁，明明只相差了一岁左右的两人，陈乔恩要显得年轻得多，张柏芝却比陈乔恩老了很多。女神同框不得不说陈乔恩30多岁保养的很好，皮肤白皙水嫩，
复杂场景检测失效？陌讯多模态算法在千万级监控网的落地实战 2501_92473061 算法视觉检测安全计算机视觉
开篇痛点：安防监控的检测困境"明明人就在画面里，系统却毫无反应！"——这是某智慧园区安防负责人的吐槽。传统目标检测模型在安防监控场景面临三大死穴：漏报：夜间、遮挡场景下召回率骤降（实测ResNet50漏报率>40%）误报：树叶晃动、光影变化引发的误报占比超35%延迟：1080P视频流检测延迟普遍>100ms，难以满足实时响应需求技术解析：陌讯算法的三阶优化架构陌讯视觉算法采用多模态特征金字塔（MM
复杂场景检测老翻车？陌讯算法实测提升 40% 2501_92453489 算法视觉计算机视觉视觉检测
在工业质检、安防监控等计算机视觉落地场景中，工程师常面临棘手问题：传统算法在光照突变、目标遮挡等复杂环境下，漏检率高达20%以上，泛化能力不足成为项目落地的最大阻碍。而陌讯AI视觉算法通过架构创新，正在重新定义复杂场景下的检测精度标准。技术解析：从单模态到多模态的跨越传统目标检测模型多依赖单一RGB图像输入，在特征提取阶段容易受环境干扰。以经典的FasterR-CNN为例，其区域提议网络（RPN）
为什么说永远也不要考验人性孤_b0d8
很多著名的实验都告诉我们一个道理，人性经受不住考验。在《ThePush》这档真人秀中，达伦布朗选择了四名没有犯罪前科，没有情绪问题的正常人当小白鼠，作为试验对象，看能不能在72小时把他们变成一个杀人犯。结局很让人震惊，四个实验对象，三个人都成为了“杀人犯，”仅仅只是72个小时，就能让一个正常人变成杀人犯，让人不寒而栗。在实验开始的时候，通过一个小小的测试，达伦布朗选择了4名顺从度高的人，并告知他们
与谁相约妖精欣儿
看到这周的主题是《见面》，我瞬间愣住，脑子思绪万千，在这诺大的城市，有什么人是许久不见，甚是想念的？回想这些年，每天除了工作就是家庭与孩子，唯一的娱乐项目就是看小说，即使与人聊天，也脱离不开工作、家庭、孩子，偶尔加点女性话题点缀。在孩童时代，羡慕大人们可以不用上学做作业，可以想去哪就去哪里，可以去很多城市见识不同的风景，而自己长大成人后，才知道,才知道成人了，每天需要考虑家里的油盐酱醋茶是否还有，
人生中的第一篇博客——梦开始的地方爱和冰阔落经验分享笔记
文章目录前言`一、自我介绍二、编程目标1.扎实掌握C语言2.深度挖掘C++三、编程学习时间的花费四、梦寐以求的大厂offer前言`写一篇博客记录自己从一直知道CSDN这个软件到自己真正开始用它写一篇博客来开启记录记录学习生活的风景提示：以下是本篇文章正文内容，下面案例可供参考一、自我介绍大家好！我是一名大一网络工程专业的小萌新，踏入编程世界的时间不长，目前只能算是刚入门的水平。虽然现在还只是“小小
查看环境配置井底蛙蛙呱呱呱
忘了转自哪里了。。。系统#uname-a#查看内核/操作系统/CPU信息#head-n1/etc/issue#查看操作系统版本#cat/proc/cpuinfo#查看CPU信息#hostname#查看计算机名#lspci-tv#列出所有PCI设备#lsusb-tv#列出所有USB设备#lsmod#列出加载的内核模块#env#查看环境变量资源#free-m#查看内存使用量和交换区使用量#df-h#查
cf1925B&C
B.https://codeforces.com/contest/1925/problem/B题目背景：将x划分为n个数，使x个数字之间有最大的gcd。数据范围：1#defineiosccios::sync_with_stdio(false),cin.tie(0),cout.tie(0)#defineendl'\n'#defineme(a,x)memset(a,x,sizeofa)#definea
lesson17：Python函数之递归、匿名函数与变量作用域
目录引言一、递归函数：用自身解构复杂问题1.递归的基本结构2.递归的典型应用场景3.递归的优缺点与优化二、匿名函数：用lambda实现“一句话函数”1.lambda与普通函数的区别2.lambda的典型应用3.lambda的局限性三、变量作用域：理解LEGB规则1、LEGB规则的深度解析（1）Local（局部作用域）（2）Enclosing（嵌套作用域）（3）Global（全局作用域）（4）Bui
新手发小红书笔记怎么赚钱?新手小红书赚钱攻略详解日常购物技巧呀
小红书作为一个社交分享平台，用户在这里可以搜集到各种各样的干货，帮助他们解决生活中的问题。如果有这方面经验的用户，可以在小红书上面注册账号，分享一些干货，运气好的话也可以进行变现赚钱，那么如何做小红书赚钱？大家好，我是高省APP联合创始人万方导师，高省APP是2021年推出的电商导购平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个可省钱佣金高，能赚钱有收益的平台，
英超直播：纽卡斯尔联队十年前五名，球迷们难忘的时刻体育日记本
在过去的十年里，纽卡斯尔联队创造了许多特别而难忘的时刻，但是在这十年里，我们对俱乐部最美好的回忆是什么？过去的十年在卡通军心中引发了一场情绪的过山车。纽卡斯尔联队成功跻身前五，并在同一个十年经历了两次降级。从在圣詹姆斯公园听到欧罗巴联赛的圣歌，到在冠军路上迎战普利茅斯阿盖尔，一点都不好玩。尽管如此，在所有的低潮时刻，这十年确实包含了一些令人难忘的时刻，纽卡斯尔联队的球迷可以在未来几年与年轻一代分享
初二尘埃不确定
回娘家，不知道是中国人的习俗，还是北方人的习俗。和爸妈弟弟吃罢中午饭，开车两个小时回到了老婆娘家，中途去县城三姨家坐了一会儿。后山就是比城市里冷的多，气温很低，下了点雪，风不大。家里来了很多亲戚，晚辈给长辈拜年，到处跑，到了哪里那里就特别热闹。
精彩纷呈宋王朝（第三部，第十三章，第九节）司马吹风
第十三章奸臣的黑暗年代第九节清余毒秦桧弄权，赵构其实洞若观火、心如明镜，只不过，赵构的底线是，相权决不能威胁皇权，而秦桧也深谙个中深浅，始终不敢踩红线，因此赵构对秦桧的种种弄权行为，采取睁一只眼闭一只眼的态度。秦桧弄权，无非从两个方面着手，一是提拔自己亲信，二是打击自己政敌。秦桧推荐提拔亲信，赵构为照顾秦桧脸面，几乎一概予以批准；秦桧打击政敌，无外乎打着政敌诽谤朝廷，怨望君主等旗号，赵构不得不批准
lesson11：Python的字典及方法你的电影很有趣 windows python
目录前言一、字典的定义与核心价值创建方式：二、核心特性：键的规则与无序性演变1、键的不可变性与唯一性2、无序性与Python版本差异三、常用操作与方法全解析四、与列表/元组的对比：数据结构选型指南五、高级应用技巧六、避坑指南：常见错误与最佳实践总结前言在Python的“数据结构工具箱”中，字典（Dictionary）无疑是最灵活、最强大的工具之一。无论是存储用户信息、解析JSON数据，还是实现缓存
无题唐春元ok
北方的雪美了冬天南方的夜暖了骄阳我在南方守着一寸夕阳思念家乡，多了惆怅雪是我来到这个世界第一眼遇见的光芒。就在今天我哇哇落地家乡也美美的下了一场雪只是不知南方当时的融融暖意。图片发自App图片发自App
你在羡慕别人的时候，别人也在羡慕你小火慢炖
昨天听闺蜜诉说自己的委屈，突然发现我们都在羡慕着别人拥有的东西，却不知道这世界上还有很多人在羡慕我们。闺蜜跟自己家人吵架，生气跑出门，在外面待了三个小时。她哭着说，为什么家人总是不理解他？她觉得自己的生活有点悲惨。其实在我看来，她有房有车，有疼爱自己的老公，还有一个可爱的孩子。生活已经很幸福了，不过当然，再幸福的生活也免不了琐碎的事情，磕磕绊绊。这些都是非常正常的，但是大多数人都会存在在这样一个循
雪落无声，你的动静打扰了我们 VickyLi_文丽
早上起来，外面路上铺满了白色的雪花，来到学校白茫茫一片，孩子们很高兴。在第二节课后阳光活动，由于天气原因，没法进行跑操，所以有的班依然在上课。我在二班上课，隔壁的三班机几个男生大声喊叫，大声吵闹。我作为班主任赶紧回班看看发生了什么事情？原来，我们班孩子在没有老师的情况下，跃跃欲试，要出去玩雪。本身，喜欢玩耍是孩子的天性，如果是平时，出去玩也没事情。可是偌大的走廊上，另外的班在上课，只有我们班在吵闹
C语言实现扫雷游戏：从经典玩法到代码构建
文章目录C语言实现扫雷游戏：从经典玩法到代码构建一、游戏简介：经典玩法回顾二、扫雷游戏的设计与实现2.1整体设计思路与技术选型核心技术栈多文件分工2.2棋盘设计：核心数据结构棋盘尺寸与扩展设计双棋盘机制2.3核心功能实现1.棋盘初始化与打印2.随机布置地雷3.地雷排查与数字计算2.4游戏流程控制4.排查逻辑完整实现三、功能扩展：提升游戏体验四、总结C语言实现扫雷游戏：从经典玩法到代码构建扫雷作为一
感恩疫情期间，依然可以看见阳光 Tina与你同行
女儿佳琳一路小跑着来到我的工作室，边跑边说，快把手机给我：“我一定要把这美丽的一幕拍下来。”原来是撒落在客厅里的阳光。她要在阳光驻足的时候把它留住。过了一会，她拿来这张照片给我看。她趴在被照亮的沙发一角，小脸紧贴着深蓝色的沙发面，放松得裹在暖阳里，露出灿烂的笑容。看着好温暖。感谢女儿让我留意到温暖的阳光，还有任何情况下都可以嘴角上扬的微笑。疫情基本不出门，享受不到户外的阳光。可是，太阳就在那里。它
【1107】说写让人生更精彩杜香开花2008
课堂践行说写共121天，每天学生只需5-10分钟就可以说写一篇文章。但是收获却很大，坚持下来的学生都有了自己人生的第一本文集。新学期开学我将是一名四年级语文教师，从2021年12月接触喜悦说写，立即在班级践行，我每天会在群里发一个主题，说明“说写”要求，比如内容、字数等，第一个学期我教五年级二班，共践行说写55天，学生每人每天一篇说写，到过完春节新学期即将开学时。我发出说写文集整理的具体要求，比如
蒲公英仰望记（136）我的人间四月天白露霜花
你是爱，是暖，是希望。你是人间的四月天。____题记爸妈的爱从我呱呱坠地的那一刻起，就如四月的阳光和煦地走进我的心灵，照亮我的人生。老公的爱从我们相识的那一刻起，就如四月的春风款款走进我的心灵，温暖我的日子。朋友的爱从我们相交的那一刻起，就如四月的春雨淅淅沥沥走进我的心灵，湿润我的心田。小时候体弱的我总是多得到爸妈一些疼爱，每次下地爸妈都分一些轻的给我，从不白眼我干不过姐姐妹妹。大学报到正赶上爸爸
keil5中添加stc单片机芯片包（附加C51文件夹的添加）彳亍独䓷单片机嵌入式硬件
用到这个软件双击打开软件打开keil查看注意（若添加成功下面就可以忽略了）：C51文件夹其实存放的是STC公司的芯片库(以下附上C51文件夹的添加方式)：KeilProductDownloads（点击进入官网）双击安装包（一般情况下一直点击next就好），检查是否成功安装
sshpass原理详解及自动化运维实践
什么是SSHpass？SSHpass是一个用于非交互式SSH密码验证的工具，它能够通过命令行直接提供SSH密码，从而绕过交互式密码输入提示。这在自动化脚本和批处理操作中尤为有用。工作原理SSHpass的工作原理可以概括为以下几个关键点：密码传递机制：SSHpass通过命令行参数、环境变量或文件等方式接收密码伪终端模拟：它模拟一个伪终端（pseudo-terminal）来与SSH客户端交互自动响应：
深度学习超参数优化（HPO）终极指南：从入门到前沿
摘要：在深度学习的实践中，模型性能的好坏不仅取决于算法和数据，更在一半程度上取决于超参数的精妙设置。本文是一篇关于超参数优化（HyperparameterOptimization,HPO）的综合性指南，旨在带领读者从最基础的概念出发，系统性地梳理从经典到前沿的各类优化方法，并最终落地于实用策略和现代工具。无论您是初学者还是资深从业者，都能从中获得宝贵的见解。第一部分：夯实基础——HPO的核心概念1
Conda 核心命令快速查阅表拉拉拉拉拉拉拉马 conda
本表旨在提供一个简洁、高效的Conda命令参考，专注于最常用功能的快速查找。1.环境管理(EnvironmentManagement)功能(Function)命令(Command)示例(Example)创建新环境condacreate-n[packages...]condacreate-nmyenvpython=3.9pandas激活环境condaactivatecondaactivatemyen
Apple设备双重认证-获取验证码 fb69e982796d
方式1.在新设备上登录appleid和密码登录，在其他信任的设备上会出现登录通知，轻点”允许“以接受验证码，在这台新设备上输入这个验证码登录即可方式2.若身边无可信任设备，点按登录屏幕上的”没有收到验证码吗“，选择将验证码发送到受信任的电话号码，apple将通过短信或者电话向您提供验证码。新设备输入此验证码以完成登录。方式3.从受信任设备上的“设置”获取验证码。如果无法在受信任设备上自动收到验证码
使用 Git 结合 GitHub 管理代码 - Autodl（笔记）
核心目标：在AutoDL服务器上方便地获取、修改和同步代码。利用GitHub作为中央代码仓库，实现版本控制、备份和协作。保持本地开发环境（如果有的话）与AutoDL服务器环境的代码同步。全流程步骤：阶段一：准备工作(在本地和GitHub上)拥有GitHub账户:如果没有，先去GitHub官网注册一个账户。创建GitHub仓库(Repository):登录GitHub。点击右上角的"+"号，选择"N
【嘟嘟嘀嘀】20180223学习力践行D136 嘟嘟嘀嘀
今天年初八，我们从老家开车回来广东，一路都有交通事故，所以一路都有塞车，总共开了8个来小时，时间比较长，宝宝在车上总体也算好，就是堵车的时候他也比较烦躁，会哭闹一下，烦躁时我们会念念手指谣，听听音乐，他的心情就会好些。回来家里，睡前也看了《蹦》、《语言启蒙》红本。
复盘，温故而知新 yang40
———————今日复盘———————回顾本周的学习写作，请谈谈你的收获和反思【我的技能】本周学习，对之前已经学习一次的写作技巧，又在此复习一遍，如何开头，如何结尾，有了新体验和新想法。【我要发问】本周所学内容中，你有哪些不会的呢？如何系统的输出干货，如何让自己不断积累，找到适合自己的速度和方法，坚持的动力是什么？【我的闪光点】本周你做的好的地方？继续早起，并且开始自由写作，对自由写作有新的认识，和
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla