Vic·Tory

循环神经网络解决文本分类问题

1、概念

1.1、循环神经网络

循环神经网络（Recurrent Neural Network, RNN）是一类以序列数据为输入，在序列的演进方向进行递归且所有节点（循环单元）按链式连接的递归神经网络。

卷积网络的输入只有输入数据X，而循环神经网络除了输入数据X之外，每一步的输出会作为下一步的输入，如此循环，并且每一次采用相同的激活函数和参数。在每次循环中，x0乘以系数U得到s0，再经过系数W输入到下一次，以此循环构成循环神经网络的正向传播。

在反向传播中要求损失函数E对参数W的导数，通过链式求导法则可以得到右下的公式

循环神经网络与卷积神经网络作比较，卷积神经网络是一个输出经过网络产生一个输出。而循环神经网络可以实现一个输入多个输出（生成图片描述）、多个输入一个输出（文本分类）、多输入多输出（机器翻译、视频解说）。

RNN使用的是tan激活函数，输出在-1到1之间，容易梯度消失。距离输出较远的步骤对于梯度贡献很小。

将底层的输出作为高层的输入就构成了多层的RNN网络，而且高层之间也可以进行传递，并且可以采用残差连接防止过拟合。

1.2、长短期记忆网络

RNN的每次传播之间只有一个参数W，用这一个参数很难描述大量的、复杂的信息需求，为了解决这个问题引入了长短期记忆网络(Long Short Term Memory,LSTM)。这个网络可以进行选择性机制，选择性的输入、输出需要使用的信息以及选择性地遗忘不需要的信息。选择性机制的实现是通过Sigmoid门实现的，sigmoid函数的输出介于0到1之间，0代表遗忘，1代表记忆，0.5代表记忆50%

LSTM网络结构如下图所示，

如上右图所示为本轮运算的隐含状态state，当前状态Ct由上一状态Ct-1和遗忘门结果ft作点积，再加上传入门结果得到

如下左图所示为遗忘门结构，上一轮的输出ht-1和数据xt在经过遗忘门选择是否遗忘之后，产生遗忘结果ft

如下中图所示为传入门结构，ht-1和xt在经过遗忘门的结果it和tanh的结果Ct作点积运算得到

如下右图所示为输出门结构，ht-1和xt经过遗忘门的结果ot与当状态作点积产生本次的输出ht

如下实现LSTM网络，首先定义_generate_params函数用于生成每个门所需的参数，调用该函数定义输入门、输出门、遗忘门、和中间状态tanh的参数。每个门的参数都是三个，输入x、h的权重和偏置值。

接着开始进行LSTM的每轮循环计算，输入门计算就是将输入embedded_input矩阵乘以输入门参数x_in，再加上h和对应参数相乘的结果，最后再加上偏置值b_in经过sigmoid便得到输入门结果。

同理进行矩阵相乘加偏置操作得到遗忘门、输出门的结果。中间态tanh与三个门的操作类似，只不过最后经过tanh函数。

将上一个隐含态state乘以遗忘门加上输入门乘以中间态的结果就得到当前的隐含态state

将当前的state经过tanh函数再加上输出门就得到本轮的输出h

经过多轮输入循环得到的就是LSTM网络的最后输出。

# 实现LSTM网络
    # 生成Cell网格所需参数
    def _generate_paramas(x_size, h_size, b_size):
        x_w = tf.get_variable('x_weight', x_size)
        h_w = tf.get_variable('h_weight', h_size)
        bias = tf.get_variable('bias', b_size, initializer=tf.constant_initializer(0.0))
        return x_w, h_w, bias

    scale = 1.0 / math.sqrt(embedding_size + lstm_nodes[-1]) / 3.0
    lstm_init = tf.random_uniform_initializer(-scale, scale)
    with tf.variable_scope('lstm_nn', initializer=lstm_init):
        # 输入门参数
        with tf.variable_scope('input'):
            x_in, h_in, b_in = _generate_paramas(
                x_size=[embedding_size, lstm_nodes[0]],
                h_size=[lstm_nodes[0], lstm_nodes[0]],
                b_size=[1, lstm_nodes[0]]
            )
        # 输出门参数
        with tf.variable_scope('output'):
            x_out, h_out, b_out = _generate_paramas(
                x_size=[embedding_size, lstm_nodes[0]],
                h_size=[lstm_nodes[0], lstm_nodes[0]],
                b_size=[1, lstm_nodes[0]]
            )
        # 遗忘门参数
        with tf.variable_scope('forget'):
            x_f, h_f, b_f = _generate_paramas(
                x_size=[embedding_size, lstm_nodes[0]],
                h_size=[lstm_nodes[0], lstm_nodes[0]],
                b_size=[1, lstm_nodes[0]]
            )
        # 中间状态参数
        with tf.variable_scope('mid_state'):
            x_m, h_m, b_m = _generate_paramas(
                x_size=[embedding_size, lstm_nodes[0]],
                h_size=[lstm_nodes[0], lstm_nodes[0]],
                b_size=[1, lstm_nodes[0]]
            )

        # 两个初始化状态，隐含状态state和初始输入h
        state = tf.Variable(tf.zeros([batch_size, lstm_nodes[0]]), trainable=False)
        h = tf.Variable(tf.zeros([batch_size, lstm_nodes[0]]), trainable=False)
        # 遍历LSTM每轮循环，即每个词的输入过程
        for i in range(max_words):
            # 取出每轮输入，三维数组embedd_inputs的第二维代表训练的轮数
            embedded_input = embedded_inputs[:, i, :]
            # 将取出的结果reshape为二维
            embedded_input = tf.reshape(embedded_input, [batch_size, embedding_size])
            # 遗忘门计算
            forget_gate = tf.sigmoid(tf.matmul(embedded_input, x_f) + tf.matmul(h, h_f) + b_f)
            # 输入门计算
            input_gate = tf.sigmoid(tf.matmul(embedded_input, x_in) + tf.matmul(h, h_in) + b_in)
            # 输出门
            output_gate = tf.sigmoid(tf.matmul(embedded_input, x_out) + tf.matmul(h, h_out) + b_out)
            # 中间状态
            mid_state = tf.tanh(tf.matmul(embedded_input, x_m) + tf.matmul(h, h_m) + b_m)
            # 计算隐含状态state和输入h
            state = state * forget_gate + input_gate * mid_state
            h = output_gate + tf.tanh(state)
        # 最后遍历的结果就是LSTM的输出
        last_output = h

1.3、文本分类

文本分类问题就是对输入的文本字符串进行分析判断，之后再输出结果。字符串无法直接输入到RNN网络，因此在输入之前需要先对文本拆分成单个词组，将词组进行embedding编码成一个向量，每轮输入一个词组，当最后一个词组输入完毕时得到输出结果也是一个向量。embedding将一个词对应为一个向量，向量的每一个维度对应一个浮点值，动态调整这些浮点值使得embedding编码和词的意思相关。这样网络的输入输出都是向量，再最后进行全连接操作对应到不同的分类即可。

RNN网络不可避免地带来问题就是最后的输出结果受最近的输入较大，而之前较远的输入可能无法影响结果，这就是信息瓶颈问题，为了解决这个问题引入了双向LSTM。双向LSTM不仅增加了反向信息传播，而且每一轮的都会有一个输出，将这些输出进行组合之后再传给全连接层。

另一个文本分类模型就是HAN(Hierarchy Attention Network)，首先将文本分为句子、词语级别，将输入的词语进行编码然后相加得到句子的编码，然后再将句子编码相加得到最后的文本编码。而attention是指在每一个级别的编码进行累加前，加入一个加权值，根据不同的权值对编码进行累加。

由于输入的文本长度不统一，所以无法直接使用神经网络进行学习，为了解决这个问题，可以将输入文本的长度统一为一个最大值，勉强采用卷积神经网络进行学习，即TextCNN。文本卷积网络的卷积过程采用的是多通道一维卷积，与二维卷积相比一维卷积就是卷积核只在一个方向上移动。例如下左图所示，1×1+5×2+2×2+4×3+3×3+3×4=48，之后卷积核向下移动一格重复上述操作得到45，以此类推。如下右图所示，输入长短不一的多个词汇。首先将其统一填充为长度为6的embedding数组，然后采用长度为6的一维卷积核从上到下进行卷积，得到一维的数组，然后再经过池化层和全连接层后输出。

多卷积核：一维卷积的卷积核长度需要和词向量的长度保持一样，但是宽度为多少，即一次对几个词向量进行卷积？由于词组长度可能不同，我们可以采用多个宽度不同的卷积核同时进行卷积操作。如下所示，分别采用宽度为2、3、4，且每种两个、一共6个卷积核对同一输入进行卷积操作，得到不同宽度的特征向量，经过1-max pooling得到六个长度为1的向量，拼接之后经过全连接操作得到2个分类结果。

可以看到CNN网络不能完美处理输入长短不一的序列式问题，但是它可以并行处理多个词组，效率更高，而RNN可以更好地处理序列式的输入，将两者的优势结合起来就构成了R-CNN模型。首先通过双向RNN网络对输入进行特征提取，再使用CNN进一步提取，之后通过池化层将每一步的特征融合在一起，最后经过全连接层进行分类。

无论什么模型都需要使用embedding将输入转化为一个向量，当输入过大时，转化的embedding层参数就会过大，不仅不利于存储，还会造成过拟合，因此需要对embedding层进行压缩。原来的embedding编码是一个参数对应一个输入，例如wait对应参数x1，for对应x2，the对应x3。如果输入过多，编码参数就会很大，可以采用两个参数对组合的方式来编码输入，例如wait对应(x1,x2)，for对应(x1,x3)...，这样就可以极大的节省参数的数量，这就是共享压缩。

2、通过Text RNN进行文本分类

2.1、数据预处理

在网上下载的文本分类数据集文件如下，分为测试集和训练集数据，每个训练集下有四个文件夹，每个文件夹是一个分类，每个分类有1000个txt文件，每个文件中有一条该分类的文本

通过os.walk遍历所有训练集文件，将分类文本通过jieba库拆分成单个词组，用空格分隔。然后将分类文本添加到开头，并用制表符分隔，最后将结果输出到train_segment.txt，

# 将文件中的句子通过jieba库拆分为单个词
def segment_word(input_file, output_file):
    # 循环遍历训练数据集的每一个文件
    for root, folders, files in os.walk(input_file):
        print('root:', root)
        for folder in folders:
            print('dir:', folder)
        for file in files:
            file_dir = os.path.join(root, file)
            with open(file_dir, 'rb') as in_file:
                # 读取文件中的文本
                sentence = in_file.read()
                # 通过jieba函数库将句子拆分为单个词组
                words = jieba.cut(sentence)
                # 文件夹路径最后两个字即为分类名
                content = root[-2:] + '\t'
                # 去除词组中的空格，排除为空的词组
                for word in words:
                    word = word.strip(' ')
                    if word != '':
                        content += word + ' '
            # 换行并将文本写入输出文件
            content += '\n'
            with open(output_file, 'a') as outfile:
                outfile.write(content.strip(' '))

结果如下：

由于一些词组出现次数很少，不具有统计意义，所以需要排除，通过get_list()方法统计每个词组出现的频率。利用python自带的dictionary数据类型可以轻易实现词组数据统计，格式为{"keyword":frequency}，frequency记录keyword出现的次数。如果一个词组是新出现的则作为新词条加入词典，否则将frequency值+1。

# 统计每个词出现的频率
def get_list(segment_file, out_file):
    # 通过词典保存每个词组出现的频率
    word_dict = {}
    with open(segment_file, 'r') as seg_file:
        lines = seg_file.readlines()
        # 遍历文件的每一行
        for line in lines:
            line = line.strip('\r\n')
            # 将一行按空格拆分为每个词，统计词典
            for word in line.split(' '):
                # 如果这个词组没有在word_dict词典中出现过，则新建词典项并设为0
                word_dict.setdefault(word, 0)
                # 将词典word_dict中词组word对应的项计数加一
                word_dict[word] += 1
        # 将词典中的列表排序，关键字为列表下标为1的项，且逆序
        sorted_list = sorted(word_dict.items(), key=lambda d: d[1], reverse=True)
        with open(out_file, 'w') as outfile:
            # 将排序后的每条词典项写入文件
            for item in sorted_list:
                outfile.write('%s\t%d\n' % (item[0], item[1]))

统计结果如下：

2.2、数据读入

直接使用词组无法进行编码学习，需要将词组转化为embedding编码，根据刚才生成的train_list列表，按照从前往后的顺序为每个词组编号，如果词组频率小于阈值则排除掉。通过Word_list类来构建训练数据、测试数据的词组对象，在类的构造函数__init__()实现词组的编码。并定义类方法sentence2id将拆分好的句子词组转化为对应的id数组，如果词组列表中没有该词，则将该值置为-1。

在定义类之前首先规定一些超参数供后续使用：

# 定义超参数
embedding_size = 32  # 每个词组向量的长度
max_words = 10  # 一个句子最大词组长度
lstm_layers = 2  # lstm网络层数
lstm_nodes = [64, 64]  # lstm每层结点数
fc_nodes = 64  # 全连接层结点数
batch_size = 100  # 每个批次样本数据
lstm_grads = 1.0  # lstm网络梯度
learning_rate = 0.001  # 学习率
word_threshold = 10  # 词表频率门限，低于该值的词语不统计
num_classes = 4  # 最后的分类结果有4类

class Word_list:
    def __init__(self, filename):
        # 用词典类型来保存需要统计的词组及其频率
        self._word_dic = {}
        with open(filename, 'r',encoding='GB2312',errors='ignore') as f:
            lines = f.readlines()
        for line in lines:
            word, freq = line.strip('\r\n').split('\t')
            freq = int(freq)
            # 如果词组的频率小于阈值，跳过不统计
            if freq < word_threshold:
                continue
            # 词组列表中每个词组都是不重复的，按序添加到word_dic中即可，下一个词组id就是当前word_dic的长度
            word_id = len(self._word_dic)
            self._word_dic[word] = word_id

    def sentence2id(self, sentence):
        # 将以空格分割的句子返回word_dic中对应词组的id，若不存在返回-1
        sentence_id = [self._word_dic.get(word, -1)
                       for word in sentence.split()]
        return sentence_id


train_list = Word_list(train_list_dir)

定义TextData类来完成数据的读入和管理，在__init__()函数中读取刚才处理好的train_segment.txt文件，根据制表符分割类别标记和句子词组，将类别和句子分别转化为数字id。如果句子的词组超过了最大阈值，则截去后面多余的，如果不够则用-1填充。定义类函数_shuffle_data()用于清洗数据，next_batch()用于按批次返回数据和标签，get_size()用于返回词组总条数。

class TextData:
    def __init__(self, segment_file, word_list):
        self.inputs = []
        self.labels = []
        # 通过词典管理文本类别
        self.label_dic = {'体育': 0, '校园': 1, '女性': 2, '出版': 3}
        self.index = 0

        with open(segment_file, 'r') as f:
            lines = f.readlines()
            for line in lines:
                # 文本按制表符分割，前面为类别，后面为句子
                label, content = line.strip('\r\n').split('\t')[0:2]
                self.content_size = len(content)
                # 将类别转换为数字id
                label_id = self.label_dic.get(label)
                # 将句子转化为embedding数组
                content_id = word_list.sentence2id(content)
                # 如果句子的词组长超过最大值，截取max_words长度以内的id值
                content_id = content_id[0:max_words]
                # 如果不够则填充-1，直到max_words长度
                padding_num = max_words - len(content_id)
                content_id = content_id + [-1 for i in range(padding_num)]
                self.inputs.append(content_id)
                self.labels.append(label_id)
        self.inputs = np.asarray(self.inputs, dtype=np.int32)
        self.labels = np.asarray(self.labels, dtype=np.int32)
        self._shuffle_data()

    # 对数据按照(input,label)对来打乱顺序
    def _shuffle_data(self):
        r_index = np.random.permutation(len(self.inputs))
        self.inputs = self.inputs[r_index]
        self.labels = self.labels[r_index]

    # 返回一个批次的数据
    def next_batch(self, batch_size):
        # 当前索引+批次大小得到批次的结尾索引
        end_index = self.index + batch_size
        # 如果结尾索引大于样本总数，则打乱所有样本从头开始
        if end_index > len(self.inputs):
            self._shuffle_data()
            self.index = 0
            end_index = batch_size
        # 按索引返回一个批次的数据
        batch_inputs = self.inputs[self.index:end_index]
        batch_labels = self.labels[self.index:end_index]
        self.index = end_index
        return batch_inputs, batch_labels

    # 获取词表数目
    def get_size(self):
        return self.content_size

# 训练数据集对象
train_set = TextData(train_segment_dir, train_list)
# print(data_set.next_batch(10))
# 训练数据集词组条数
train_list_size = train_set.get_size()

2.3、构建计算图模型

定义函数create_model来实现计算图模型的构建。首先定义模型输入的占位符，分别为输入文本inputs、输出标签outputs、Dropout的比率keep_prob。

首先构建embedding层，将输入的inputs编码抽取出来拼接成一个矩阵，例如输入[1,8,3]则抽取embeding[1]、embedding[8]和embedding[3]拼接成一个矩阵

接下来构建LSTM网络，这里构建了两层网络，每层的结点数在之前的参数lstm_node[]数组中定义。每个cell的构建通过函数tf.contrib.rnn.BasicLSTMCell实现，之后经过Dropout操作。再将两个cell合并为一个LSTM网络，通过函数tf.nn.dynamic_rnn将输入embedded_inputs输入到LSTM网络中进行训练得到输出rnn_output。这是一个三维数组，第二维表示训练的步数，我们只取最后一维的结果，即下标值为-1.

接下来构建全连接层，通过tf.layers.dense函数定义全连接层，再经过一个dropout操作后将输出映射到类别上，类别的种类的参数num_classes，得到估计值logits

接下来就可以求损失、精确率等评估值了。计算算预测值logits与标签值outputs之间的交叉熵损失值，接下来通过arg_max计算预测值，进而求准确率

接下来定义训练方法，通过梯度裁剪应用到变量上以防止梯度消失。

最后将输入占位符、损失等评估值、其他训练参数返回到调用函数的外部。

# 创建计算图模型
def create_model(list_size, num_classes):
    # 定义输入输出占位符
    inputs = tf.placeholder(tf.int32, (batch_size, max_words))
    outputs = tf.placeholder(tf.int32, (batch_size,))
    # 定义是否dropout的比率
    keep_prob = tf.placeholder(tf.float32, name='keep_rate')
    # 记录训练的总次数
    global_steps = tf.Variable(tf.zeros([], tf.float32), name='global_steps', trainable=False)

    # 将输入转化为embedding编码
    with tf.variable_scope('embedding',
                           initializer=tf.random_normal_initializer(-1.0, 1.0)):
        embeddings = tf.get_variable('embedding', [list_size, embedding_size], tf.float32)
        # 将指定行的embedding数值抽取出来
        embedded_inputs = tf.nn.embedding_lookup(embeddings, inputs)

    # 实现LSTM网络
    scale = 1.0 / math.sqrt(embedding_size + lstm_nodes[-1]) / 3.0
    lstm_init = tf.random_uniform_initializer(-scale, scale)
    with tf.variable_scope('lstm_nn', initializer=lstm_init):
        # 构建两层的lstm，每层结点数为lstm_nodes[i]
        cells = []
        for i in range(lstm_layers):
            cell = tf.contrib.rnn.BasicLSTMCell(lstm_nodes[i], state_is_tuple=True)
            # 实现Dropout操作
            cell = tf.contrib.rnn.DropoutWrapper(cell, output_keep_prob=keep_prob)
            cells.append(cell)
        # 合并两个lstm的cell
        cell = tf.contrib.rnn.MultiRNNCell(cells)
        # 将embedded_inputs输入到RNN中进行训练
        initial_state = cell.zero_state(batch_size, tf.float32)
        # runn_output:[batch_size,num_timestep,lstm_outputs[-1]
        rnn_output, _ = tf.nn.dynamic_rnn(cell, embedded_inputs, initial_state=initial_state)
        last_output = rnn_output[:, -1, :]

    # 构建全连接层
    fc_init = tf.uniform_unit_scaling_initializer(factor=1.0)
    with tf.variable_scope('fc', initializer=fc_init):
        fc1 = tf.layers.dense(last_output, fc_nodes, activation=tf.nn.relu, name='fc1')
        fc1_drop = tf.contrib.layers.dropout(fc1, keep_prob)
        logits = tf.layers.dense(fc1_drop, num_classes, name='fc2')

    # 定义评估指标
    with tf.variable_scope('matrics'):
        # 计算损失值
        softmax_loss = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=logits, labels=outputs)
        loss = tf.reduce_mean(softmax_loss)
        # 计算预测值，求第1维中最大值的下标，例如[1,1,5,3,2] argmax=> 2
        y_pred = tf.argmax(tf.nn.softmax(logits), 1, output_type=tf.int32)
        # 求准确率
        correct_prediction = tf.equal(outputs, y_pred)
        accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

    # 定义训练方法
    with tf.variable_scope('train_op'):
        train_var = tf.trainable_variables()
        # for var in train_var:
        #     print(var)
        # 对梯度进行裁剪防止梯度消失或者梯度爆炸
        grads, _ = tf.clip_by_global_norm(tf.gradients(loss, train_var), clip_norm=lstm_grads)
        # 将梯度应用到变量上去
        optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate)
        train_op = optimizer.apply_gradients(zip(grads, train_var), global_steps)

    # 以元组的方式将结果返回
    return ((inputs, outputs, keep_prob),
            (loss, accuracy),
            (train_op, global_steps))

# 调用构建函数，接收解析返回的参数
placeholders, matrics, others = create_model(train_list_size, num_classes)
inputs, outputs, keep_prob = placeholders
loss, accuracy = matrics
train_op, global_steps = others

2.4、进行训练

通过Session运行计算图模型，从train_set中按批次获取训练集数据并填充占位符，运行sess.run，获取损失值、准确率等中间值打印

# 进行训练
init_op = tf.global_variables_initializer()
train_keep_prob = 0.8       # 训练集的dropout比率
train_steps = 10000

with tf.Session() as sess:
    sess.run(init_op)

    for i in range(train_steps):
        # 按批次获取训练集数据
        batch_inputs, batch_labels = train_set.next_batch(batch_size)
        # 运行计算图
        res = sess.run([loss, accuracy, train_op, global_steps],
                       feed_dict={inputs: batch_inputs, outputs: batch_labels,
                                  keep_prob: train_keep_prob})
        loss_val, acc_val, _, g_step_val = res
        if g_step_val % 20 == 0:
            print('第%d轮训练，损失：%3.3f,准确率：%3.5f' % (g_step_val, loss_val, acc_val))

在我的数据集进行一万轮训练后，训练集的准确率在90%左右徘徊

源代码及相关数据文件：https://github.com/SuperTory/MachineLearning/tree/master/TextRNN

ChatGPT 在旅游和酒店服务中的实践应用计算机小陈 chatgpt 人工智能
摘要：ChatGPT是一种先进的对话生成技术，具备强大的语义理解和智能回答能力。在旅游和酒店服务领域，ChatGPT可以应用于在线客户咨询、预订管理、旅行建议等方面，为用户提供个性化、高效的服务体验。本文将探讨ChatGPT在旅游和酒店服务中的实践应用，并讨论其优势、挑战和未来发展。引言随着人工智能技术的快速发展，ChatGPT（ChatGenerativePre-trainedTransform
Spring AI系列教程：从工业革命到人工智能的全面探索 king-agic spring 人工智能
在这个信息爆炸的时代，人工智能（AI）已经成为我们生活中不可或缺的一部分。从第一次工业革命的蒸汽机到今天的智能时代，技术的飞速发展不断推动着社会的进步。今天，将分享一套SpringAI教程视频，深入探索人工智能的奥秘。课程概览本系列教程涵盖了从基础的SpringAI课程介绍到复杂的多模态API开发，无论你是AI领域的新手还是有一定基础的开发者，都能在本系列教程中找到适合自己的内容。以下是部分课程的
大数据公司 Databricks 详解 Bj陈默大数据
Databricks是一家在大数据和人工智能领域具有重要影响力的美国企业软件公司，以下是关于它的详细技术解析：1.起源与背景：Databricks成立于2013年，由来自加州大学伯克利分校AMP实验室的Spark大数据处理系统的多位创始人联合创立，包括AliGhodsi、AndyKonwinski、IonStoica、PatrickWendell、ReynoldXin、MateiZaharia、A
深度强化学习(DRL)原理与代码实战案例讲解 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1人工智能的演进：从符号主义到连接主义人工智能(AI)的发展经历了漫长的历程，从早期的符号主义到如今的连接主义，标志着人工智能从基于规则的推理演变到基于数据的学习。符号主义AI试图通过逻辑和符号系统来模拟人类的思维过程，而连接主义AI则侧重于构建类似于人脑神经网络的结构，通过大量数据进行训练，从而实现智能。1.2强化学习：智能体与环境的互动强化学习(ReinforcementLea
深度剖析 DeepSeek V3 技术报告：架构创新与卓越性能表现微凉的衣柜科技头条人工智能大模型语言模型
随着人工智能（AI）技术的不断发展，各种大规模语言模型（LLM）层出不穷，DeepSeekV3作为其中的一员，凭借其出色的性能表现和创新的架构设计，吸引了广泛关注。本文将通过对官方发布的DeepSeekV3技术报告的深入解析，从多个维度剖析DeepSeekV3如何通过先进的技术手段，在保持性能卓越的同时优化计算和内存开销。一、性能卓越，超越同行DeepSeekV3在多个权威基准测试中展现了强大的性
1024 程序员节：探索计算机科学与技术的魅力与挑战 WD77 笔记 1024程序员节经验分享
在这个数字化飞速发展的时代，计算机科学与技术无疑是推动社会进步的核心力量之一。值此1024程序员节之际，让我们一同深入探索这个充满无限可能的专业领域。一、计算机科学与技术的魅力（一）创新的驱动力计算机科学与技术始终站在创新的前沿，不断催生新的技术和应用，改变着我们的生活方式。从智能手机的普及到人工智能的崛起，从电子商务的繁荣到区块链技术的应用，每一次的突破都离不开计算机科学与技术的支撑。它为我们提
立足西安，昇腾AI为开发者留下了脚印一串科技前沿资讯人工智能
“人工智能的时代，我能够成为推动世界发展的一支桨吗？”“我爱西安这座城市，而且在学校学习了那么多与IT开发相关的课程，未来我很希望能留在西安发展。”西安电子科技大学计算机学院的几名学生如是对笔者说。每个人在学校里都会有迷茫，不论你所学是什么，只有站在当下，脚踏实地方可仰望苍穹。他们也是如此，面对智能时代的变数，他们渴望去做更多的尝试。4月23日，以“创未来，享非凡”为主题的昇腾AI开发者创享日首站
瞄准K12阶段，日本生成式AI会弯道超车吗？科技前沿资讯人工智能
12月26日，日本正式将生成式AI的教育下沉到K12教育阶段，初等和中等教育阶段。指南全名为《中小学阶段生成式人工智能使用指南》，指南很长，涉及内容大体涵盖了生成式AI的基本理念、学校使用生成式AI的注意事项、教师与学生该如何使用AI等。在当前，人工智能的趋势是不可阻挡的。因此，任何试图抵抗AI发展的行为都会像当年的马拉火车一样，被技术抛在身后。因此，拥抱AI几乎是想要在未来有所突破的必然选择。而
学习AI大模型的小白入门建议和具体的学习方法推荐 aFakeProgramer 机器学习人工智能人工智能
深度思考我是一名在汽车行业工作的嵌入式系统工程师，现在我想进入人工智能领域，特别是大型语言模型。说到人工智能，我是一个完全的新手，所以我需要弄清楚从哪里开始。让我们把它分解一下。首先，我知道嵌入式系统涉及许多低级编程、微控制器、实时操作系统等。人工智能，特别是像GPT这样的大型模型，似乎处于另一端，处理高级计算、海量数据集和复杂算法。这里肯定有一个学习曲线。我可能应该从了解机器学习的基础知识开始。
AIGC与劳动力市场：技术进步与就业结构的重塑蒙娜丽宁 AI AIGC
随着人工智能（AI）技术的迅猛发展，尤其是生成式AI（AIGC），劳动力市场正经历前所未有的变革。从内容创作到自动化生产线，几乎每个行业都在经历一场技术的洗礼。然而，这场革命并不是全然的光明，它带来了深刻的社会变动，也引发了广泛的担忧和不安。我们不得不面对一个核心问题：AIGC将如何影响未来的工作？会让人类的大多数工作消失，还是会创造出全新的职业机会？一、AIGC对现有职业的影响——取代与重塑AI
2024年网络安全最全CTF —— 网络安全大赛_ctf网络安全大赛网安墨雨 web安全安全
前言随着大数据、人工智能的发展，人们步入了新的时代，逐渐走上科技的巅峰。\⚔科技是一把双刃剑，网络安全不容忽视，人们的隐私在大数据面前暴露无遗，账户被盗、资金损失、网络诈骗、隐私泄露，种种迹象表明，随着互联网的发展，网络安全需要引起人们的重视。\互联网安全从其本质上来讲就是互联网上的信息安全。从广义来说，凡是涉及到互联网上信息的保密性、完整性、可用性、真实性和可控性的相关技术和理论都是网络安全的研
AI技术架构：从基础设施到应用 fuqinyijiu AI 人工智能架构
人工智能（AI）的发展，正以前所未有的速度重塑我们的世界。了解AI技术架构，不仅能帮助我们看懂AI的底层逻辑，还能掌握其对各行业变革的潜力与方向。一、基础设施层：AI技术的坚实地基基础设施层是AI技术架构的“地基”，为整个系统提供计算能力和存储保障。没有强大的基础设施，复杂的AI模型和应用无法落地。1.GPU（图形处理单元）：并行计算的核心GPU是深度学习的核心引擎，专为大规模并行计算设计。技术优
把研发中心建到德国慕尼黑！中国智能车的诺曼底登陆开始了量子位
理想汽车，刚刚有了出海新动作。理想宣布首个海外研发中心开业，就建在了全球汽车工业老家——德国。这次出海，理想将联合德国研发团队，共同完成四大领域的下一代技术研究。不久前的理想AITalk上，李想称要“做一家人工智能企业”，当前大规模的技术加码，就是在一步步兑现。德国慕尼黑作为汽车工业的发源地，承载着传统汽车的技术核心，现在中国的智能车代表，开始了诺曼底登陆的时代改写时刻。理想首个海外研发中心开业1
离线免费最新超长AI视频模型！一句话即可生成120秒视频，免费开源！只需要一张照片和音频，即可生成会说话唱歌的AI视频！能自行完成整个软件项目的AI工具，以及 Llama 3 在线体验和本地安装部署代码讲故事机器人智慧之心人工智能音视频开源 sora 视频 llama 离线
离线免费最新超长AI视频模型！一句话即可生成120秒视频，免费开源！只需要一张照片和音频，即可生成会说话唱歌的AI视频！能自行完成整个软件项目的AI工具，以及Llama3在线体验和本地安装部署。StreamingT2V（StreamingText-to-Video）模型是一种将文本描述转换为视频内容的人工智能技术。这种模型能够根据文本输入生成视频，通常用于自动视频生成、虚拟现实、增强现实、游戏开发
智能化植物病害检测：使用深度学习与图像识别技术的应用机器懒得学习深度学习人工智能
植物病害一直是农业生产中亟待解决的问题，它不仅会影响作物的产量和质量，还可能威胁到生态环境的稳定。随着人工智能（AI）技术的快速发展，尤其是深度学习和图像识别技术的应用，智能化植物病害检测已经成为一种趋势，能够大幅提高病害检测的效率与准确性。本文将介绍如何使用深度学习和图像识别技术，通过Python编写的智能化病害检测程序，实现对植物叶片病害的自动识别与分类。1.项目背景与目标在农业领域，及时发现
RPA财务机器人是什么，RPA的具体应用场景有哪些？| 实在RPA研究实在智能RPA rpa 机器人自动化人工智能数字员工
越来越多的人工智能及超自动化技术在企业财务工作中得以普及应用，以提升财务工作效率，促进财务部门实现全面数字化转型。RPA财务机器人是什么？RPA，即机器人流程自动化（RoboticProcessAutomation），允许软件机器人（或“机器人”）自动执行重复性、规律性强的业务流程任务。RPA软件机器人可以模仿人类用户的行为，通过用户界面与应用程序交互，执行任务如数据输入、报告生成、数据迁移、邮件
全球人形机器人的创新发展与未来趋势 Gearidea 机器人机器人
随着科技的迅猛进步，人形机器人作为人工智能与机器人技术交汇的产物，正在全球范围内引发广泛关注。人形机器人以其仿人的外观和行为，不仅在工业生产领域展现出巨大的潜力，而且在日常生活中也逐渐发挥着不可忽视的作用。本文将全面剖析全球人形机器人的发展现状，展望未来发展的潜在趋势，并深入探讨其在不同领域中的应用和影响。一、全球人形机器人行业的发展现状全球人形机器人领域经历了从概念提出、原型制作到商业化应用的演
神经网络初始化 (init) 介绍迷路爸爸180 神经网络人工智能深度学习初始化 init
文章目录引言1.初始化的重要性1.1打破对称性1.2控制方差1.3加速收敛与提高泛化能力2.常见的初始化方法及其应用场景2.1Xavier/Glorot初始化2.2He初始化2.3正交初始化2.4其他初始化方法3.如何设置初始化4.基于BERT的文本分类如何进行初始化4.1项目背景4.2模型构建4.3模型训练与评估4.4结果分析结论参考资料引言在深度学习的世界中，构建一个高效且性能优异的神经网络模
5分钟搞定Spring AI支持SpringBoot快速构建人工智能AI应用_springai_springboot_AI应用 web17886480312 spring 人工智能 spring boot
通过阅读这篇文章，你将了解SpringAI，它是一个借鉴了langchain的设计理念，并结合Java的优势，为开发者提供易于替换实现的统一接口。此外，文章还基于SpringAI的模型调用和Prompt模板，构建一个可操作的示例，让你可以快速的了解具体怎么在springboot的环境下使用springai来构建人工智能AI的应用SpringAI：简化Java大模型集成的统一框架在Java调用大模型
3.ChatClient&Chat Model简化与AI模型的交互 laopeng301 Spring AI 人工智能交互
1.ChatModel对话模型是一种利用人工智能技术，能够生成类似人类对话响应的工具。通过向预训练语言模型（如GPT等）发送提示词或部分对话内容，模型依据自身训练数据及对自然语言模式的理解，生成对话的延续或完整回复，并返回给应用程序。应用程序可以将其呈现给用户或用于进一步处理。SpringAIChatModelAPI设计目标为简单且可移植的接口，用于与各种人工智能模型进行交互，使开发人员能够在不同
《智守数据堡垒——AI驱动的MySQL数据治理合规框架》墨夶数据库学习资料2 人工智能 mysql 数据库
在当今数字化转型加速的时代，企业面临着前所未有的数据挑战。一方面，海量的数据为企业带来了巨大的商业价值；另一方面，如何确保这些数据的安全性、一致性和合法性成为了亟待解决的问题。尤其是在金融、医疗等高度监管行业中，任何数据泄露或不当使用都可能导致严重的法律后果和社会影响。为此，构建一个既高效又能满足法律法规要求的数据治理体系显得尤为重要。今天，我们将探讨一种创新性的解决方案——利用人工智能（AI）技
Pytorch 三小时极限入门教程 power-辰南人工智能深度学习 pytorch 人工智能
一、引言在当今的人工智能领域，深度学习占据了举足轻重的地位。而Pytorch作为一款广受欢迎的深度学习框架，以其简洁、灵活的特性，吸引了大量开发者投身其中。无论是科研人员探索前沿的神经网络架构，还是工程师将深度学习技术落地到实际项目，Pytorch都提供了强大的支持。本教程将带你从零基础开始，一步步深入了解Pytorch的核心知识，助你顺利踏上深度学习的征程。二、Pytorch基础环境搭建安装An
NVIDIA下一代Hopper架构曝光，采用5nm工艺晶体管超1400亿 Java小海. 架构人工智能后端程序人生 java
据媒体报道，NVIDIA下一代主要面向高性能计算、人工智能等Hopper架构，将会采用5nm工艺制程，晶体管多达1400亿个，面积核心达到了900平方毫米，是有史以来最大的GPU。作为参考，NVIDIA自家旗舰Ampere架构的A100为542亿个晶体管（每平方毫米约为6560万个晶体管），AMD阵营中采用Aldebaran架构的InstinctMI200系列为582亿个晶体管（每平方米约为736
NVIDIA Hopper解说白总Server redis 数据库缓存 rust mongodb 大数据数据仓库
NVIDIAHopper架构是NVIDIA推出的面向高性能计算（HPC）和人工智能（AI）的最新一代GPU架构。它代表了NVIDIA在加速计算领域的最新进展，旨在为AI训练和推理、HPC应用提供前所未有的性能提升。NVIDIAHopper架构和基于该架构的GPU产品H100的详细信息：NVIDIAHopper架构技术特点：第四代TensorCore：Hopper架构引入了第四代TensorCore
LLMs，即大型语言模型 maopig AI 语言模型人工智能自然语言处理
LLMs，即大型语言模型，是一类基于深度学习的人工智能模型，它们通过海量的数据和大量的计算资源进行训练，可以理解和生成自然语言。LLMs的核心架构是Transformer，其关键在于自注意力机制，使得模型能够同时对输入的所有位置进行“关注”，从而更好地捕捉长距离的语义依赖关系。LLMs在众多领域都有广泛的应用，如自然语言理解（NLU），语言生成，以及语音识别和合成等。例如，它们能够理解人类的语言
第79期 | GPTSecurity周报云起无垠 GPTSecurity AIGC gpt
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.TrojanWhi
第60期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能语言模型网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.映射你的模型：评估
大语言模型（LLMs）入门教程（非常详细）从零基础入门到精通，看完这一篇就够了大模型零基础教程语言模型人工智能自然语言处理大模型
大语言模型（LLMs）作为人工智能（AI）领域的一项突破性发展，已经改变了自然语言处理（NLP）和机器学习（ML）应用的面貌。这些模型，包括OpenAI的GPT-4o和Google的gemini系列等，已经展现出了在理解和生成类人文本方面的令人印象深刻的能力，使它们成为各行各业的宝贵工具。如下这份指南将涵盖LLMs的基础知识、训练过程、用例和未来趋势……一.WhatareLargeLanguage
1.8 GPT-4：开创人工智能的新纪元少林码僧 AI大模型应用实战专栏人工智能
GPT-4：开创人工智能的新纪元自从OpenAI推出GPT-4以来，人工智能领域经历了显著的突破。作为“生成预训练转换器”家族中的最新成员，GPT-4不仅在功能上进行了提升，更在语言处理能力、理解深度以及适应性方面带来了全新的变革。本篇文章将深入探讨GPT-4的特点、创新以及它如何定义未来人工智能技术的发展。GPT-4的技术亮点1.规模与深度的进一步提升GPT-4的规模比前代模型更大，训练数据量和
第83期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.混乱中建立秩序：人
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><