weixin_39952074

lstm原理_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例...

点击上方蓝字关注我呀！

[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例

从本专栏开始，正式开始研究Python深度学习、神经网络及人工智能相关知识。前一篇讲解了TensorFlow如何保存变量和神经网络参数，通过Saver保存神经网络，再通过Restore调用训练好的神经网络。本文将详细讲解循环神经网络RNN和长短期记忆网络LSTM的原理知识，并采用TensorFlow实现手写数字识别的RNN分类案例。基础性文章，希望对您有所帮助，如果文章中存在错误或不足之处，还请海涵~

前文：[Python人工智能] 一.TensorFlow2.0环境搭建及神经网络入门[Python人工智能] 二.TensorFlow基础及一元直线预测案例[Python人工智能] 三.TensorFlow基础之Session、变量、传入值和激励函数[Python人工智能] 四.TensorFlow创建回归神经网络及Optimizer优化器[Python人工智能] 五.Tensorboard可视化基本用法及绘制整个神经网络[Python人工智能] 六.TensorFlow实现分类学习及MNIST手写体识别案例[Python人工智能] 七.什么是过拟合及dropout解决神经网络中的过拟合问题[Python人工智能] 八.卷积神经网络CNN原理详解及TensorFlow编写CNN[Python人工智能] 九.Tensorflow+Opencv实现CNN自定义图像分类案例及与机器学习KNN图像分类算法对比[Python人工智能] 十.Tensorflow如何保存神经网络参数

文章目录：

一.循环神经网络
- 1.RNN原理
- 2.RNN应用
二.LSTM RNN原理详解
- 1.为什么引入LSTM
- 2.LSTM
三.Tensorflow编写RNN代码

一.循环神经网络

在编写代码之前，我们需要介绍什么是RNN，RNN是怎样运行的以及RNN的结构。

1.RNN原理

循环神经网络英文是Recurrent Neural Networks，简称RNN。假设有一组数据data0、data1、data2、data3，使用同一个神经网络预测它们，得到对应的结果。如果数据之间是有关系的，比如做菜下料的前后步骤，英文单词的顺序，如何让数据之间的关联也被神经网络学习呢？这就要用到——RNN。

lstm原理_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例..._第3张图片

假设存在ABCD数字，需要预测下一个数字E，会根据前面ABCD顺序进行预测，这就称为记忆。预测之前，需要回顾以前的记忆有哪些，再加上这一步新的记忆点，最终输出output，循环神经网络(RNN)就利用了这样的原理。

首先，让我们想想人类是怎么分析事物之间的关联或顺序的。人类通常记住之前发生的事情，从而帮助我们后续的行为判断，那么是否能让计算机也记住之前发生的事情呢？

lstm原理_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例..._第4张图片

在分析data0时，我们把分析结果存入记忆Memory中，然后当分析data1时，神经网络(NN)会产生新的记忆，但此时新的记忆和老的记忆没有关联，如上图所示。在RNN中，我们会简单的把老记忆调用过来分析新记忆，如果继续分析更多的数据时，NN就会把之前的记忆全部累积起来。

lstm原理_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例..._第5张图片

RNN结构如下图所示，按照时间点t-1、t、t+1，每个时刻有不同的x，每次计算会考虑上一步的state和这一步的x(t)，再输出y值。在该数学形式中，每次RNN运行完之后都会产生s(t)，当RNN要分析x(t+1)时，此刻的y(t+1)是由s(t)和s(t+1)共同创造的，s(t)可看作上一步的记忆。多个神经网络NN的累积就转换成了循环神经网络，其简化图如下图的左边所示。

lstm原理_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例..._第6张图片

总之，只要你的数据是有顺序的，就可以使用RNN，比如人类说话的顺序，电话号码的顺序，图像像素排列的顺序，ABC字母的顺序等。在前面讲解CNN原理时，它可以看做是一个滤波器滑动扫描整幅图像，通过卷积加深神经网络对图像的理解。

lstm原理_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例..._第7张图片

而RNN也有同样的扫描效果，只不过是增加了时间顺序和记忆功能。RNN通过隐藏层周期性的连接，从而捕获序列化数据中的动态信息，提升预测结果。

lstm原理_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例..._第8张图片

2.RNN应用

RNN常用于自然语言处理、机器翻译、语音识别、图像识别等领域，下面简单分享RNN相关应用所对应的结构。

RNN情感分析： 当分析一个人说话情感是积极的还是消极的，就用如下图所示的RNN结构，它有N个输入，1个输出，最后时间点的Y值代表最终的输出结果。

lstm原理_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例..._第9张图片

RNN图像识别： 此时有一张图片输入X，N张对应的输出。

lstm原理_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例..._第10张图片

RNN机器翻译： 输入和输出分别两个，对应的是中文和英文，如下图所示。

lstm原理_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例..._第11张图片

二.LSTM RNN原理详解

接下来我们看一个更强大的结构，称为LSTM。

1.为什么引入LSTM

RNN是在有序的数据上进行学习的，RNN会像人一样对先前的数据发生记忆，但有时候也会像老爷爷一样忘记先前所说。为了解决RNN的这个弊端，提出了LTSM技术，它的英文全称是Long short-term memory，长短期记忆，也是当下最流行的RNN之一。

lstm原理_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例..._第12张图片

假设现在有一句话，如下图所示，RNN判断这句话是红烧排骨，这时需要学习，而“红烧排骨“在句子开头。

lstm原理_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例..._第13张图片

"红烧排骨"这个词需要经过长途跋涉才能抵达，要经过一系列得到误差，然后经过反向传递，它在每一步都会乘以一个权重w参数。如果乘以的权重是小于1的数，比如0.9，0.9会不断地乘以误差，最终这个值传递到初始值时，误差就消失了，这称为梯度消失或梯度离散。

lstm原理_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例..._第14张图片

反之，如果误差是一个很大的数，比如1.1，则这个RNN得到的值会很大，这称为梯度爆炸。

lstm原理_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例..._第15张图片

梯度消失或梯度爆炸：
在RNN中，如果你的State是一个很长的序列，假设反向传递的误差值是一个小于1的数，每次反向传递都会乘以这个数，0.9的n次方趋向于0，1.1的n次方趋向于无穷大，这就会造成梯度消失或梯度爆炸。

这也是RNN没有恢复记忆的原因，为了解决RNN梯度下降时遇到的梯度消失或梯度爆炸问题，引入了LSTM。

2.LSTM

LSTM是在普通的RNN上面做了一些改进，LSTM RNN多了三个控制器，即输入、输出、忘记控制器。左边多了个条主线，例如电影的主线剧情，而原本的RNN体系变成了分线剧情，并且三个控制器都在分线上。

lstm原理_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例..._第16张图片

输入控制器(write gate): 在输入input时设置一个gate，gate的作用是判断要不要写入这个input到我们的内存Memory中，它相当于一个参数，也是可以被训练的，这个参数就是用来控制要不要记住当下这个点。
输出控制器(read gate): 在输出位置的gate，判断要不要读取现在的Memory。
忘记控制器(forget gate): 处理位置的忘记控制器，判断要不要忘记之前的Memory。

LSTM工作原理为：如果分线剧情对于最终结果十分重要，输入控制器会将这个分线剧情按重要程度写入主线剧情，再进行分析；如果分线剧情改变了我们之前的想法，那么忘记控制器会将某些主线剧情忘记，然后按比例替换新剧情，所以主线剧情的更新就取决于输入和忘记控制；最后的输出会基于主线剧情和分线剧情。

通过这三个gate能够很好地控制我们的RNN，基于这些控制机制，LSTM是延缓记忆的良药，从而带来更好的结果。

三.Tensorflow编写RNN代码

接下来我们通过手写数字图片集数据编写RNN代码。RNN是基于顺序的数据，想象下图片的顺序，它是一行一行像素组成的，最终判定图片的数字属于哪类。

lstm原理_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例..._第17张图片

lstm原理_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例..._第18张图片

第一步，打开Anaconda，然后选择已经搭建好的“tensorflow”环境，运行Spyder。

lstm原理_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例..._第19张图片

第二步，导入扩展包。

import tensorflow as tffrom tensorflow.examples.tutorials.mnist import input_data

第三步，下载数据集。
由于MNIST数据集是TensorFlow的示例数据，所以我们只需要下面一行代码，即可实现数据集的读取工作。如果数据集不存在它会在线下载，如果数据集已经被下载，它会被直接调用。

# 下载手写数字图像数据集mnist = input_data.read_data_sets('MNIST_data', one_hot=True)

lstm原理_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例..._第20张图片

第四步，定义参数。

# 设置参数learning_rate = 0.001     # 学习效率train_iters = 100000      # 训练次数batch_size = 128          # 自定义n_inputs = 28             # MNIST 输入图像形状 28*28 黑白图片高度为1n_steps = 28              # time steps 输入图像的28行数据n_hidden_units = 128      # 神经网络隐藏层数量n_classes = 10            # 分类结果 数字0-0

第五步，定义placeholder，用于传入值xs和ys至神经网络。

# 设置传入的值xs和ysx = tf.placeholder(tf.float32, [None, n_steps, n_inputs])  #每张图片28*28=784个点y = tf.placeholder(tf.float32, [None, n_classes])          #每个样本有10个输出

第六步，定义权重和误差变量。
权重和偏置包括输入和输出值，需要注意其设置的形状。

# 定义权重 进入RNN前的隐藏层 输入&输出weights = {    # (28, 128)    'in': tf.Variable(tf.random_normal([n_inputs, n_hidden_units])),    # (128, 10)    'out': tf.Variable(tf.random_normal([n_hidden_units, n_classes])),}# 定义偏置 进入RNN前的隐藏层 输入&输出biases = {    # (128, )    'in': tf.Variable(tf.constant(0.1, shape=[n_hidden_units, ])),    # (10, )    'out': tf.Variable(tf.constant(0.1, shape=[n_classes, ])),}

第七步，定义RNN神经网络。
RNN定义分别对应三层，X输入、Cell为中心计算、H为最终输出，需要注意数据形状的变化。在RNN运算过程中，每一步的输出都存储在outputs序列中，LSTM包括c_state(主线)和m_state(分线)。最终输出结果为Cell的输出和权重输出的乘积，再加上输出偏置。(详见注释)

#---------------------------------定义RNN-------------------------------def RNN(X, weights, biases):    # hidden layer for input to cell    #######################################################    # X (128 batch, 28 steps, 28 inputs) 28行*28列     # X ==> (128*28, 28 inputs)    X = tf.reshape(X, [-1, n_inputs])    # 隐藏层 输入    # X_in ==> (128batch*28steps, 128 hidden)    X_in = tf.matmul(X, weights['in']) + biases['in']    # 二维数据转换成三维数据     # 注意：神经网络学习时要注意其形状如何变化    # X_in ==> (128 batch, 28 steps, 128 hidden)    X_in = tf.reshape(X_in, [-1, n_steps, n_hidden_units]) # 128个隐藏层    # cell    #######################################################    # Cell结构 隐藏层数 forget初始偏置为1.0(初始时不希望forget)    lstm_cell = tf.nn.rnn_cell.BasicLSTMCell(n_hidden_units, forget_bias=1.0, state_is_tuple=True)    # RNN会保留每一步计算的结果state    # lstm cell is divided into two parts (c_state, m_state) 主线c_state 分线m_state    _init_state = lstm_cell.zero_state(batch_size, dtype=tf.float32)    # RNN运算过程 每一步的输出都存储在outputs序列中    # 常规RNN只有m_state LSTM包括c_state和m_state    outputs, states = tf.nn.dynamic_rnn(lstm_cell, X_in, initial_state=_init_state, time_major=False)    # hidden layer for output as final results    #######################################################    # 第三层加工最终的输出    # 最终输出=Cell的输出*权重输出+偏置数据    # states包含了主线剧情和分线剧情 states[1]表示分线剧情的结果 即为outputs[-1]最后一个输出结果    results = tf.matmul(states[1], weights['out']) + biases['out']    # 第二种方法    # 解包 unpack to list [(batch, outputs)..] * steps    #outputs = tf.unstack(tf.transpose(outputs, [1,0,2])) # states is the last outputs    #results = tf.matmul(outputs[-1], weights['out']) + biases['out']    return results

第八步，定义误差和准确度。

#---------------------------------定义误差和训练-------------------------------pre = RNN(x, weights, biases)# 预测值与真实值误差cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=pre, labels=y))# 训练学习 学习效率设置为0.001train_step = tf.train.AdamOptimizer(learning_rate).minimize(cost) #梯度下降减小误差# 预测正确个数correct_pred = tf.equal(tf.argmax(pre, 1), tf.argmax(y, 1))# 准确度accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))

第九步，初始化及训练。

#---------------------------------初始化及训练-------------------------------init = tf.initialize_all_variables()with tf.Session() as sess:    sess.run(init)    step = 0    # 循环每次提取128个样本    while step * batch_size < train_iters:        # 从下载好的数据集提取128个样本        batch_xs, batch_ys = mnist.train.next_batch(batch_size)        # 形状修改 [128, 28, 28]        batch_xs = batch_xs.reshape([batch_size, n_steps, n_inputs])        # 训练        sess.run([train_step], feed_dict={            x: batch_xs,            y: batch_ys,        })        # 每隔20步输出结果        if step % 20 == 0: # 20*128            print(sess.run(accuracy, feed_dict={                x: batch_xs,                y: batch_ys,            }))        step += 1

最终输出结果如下所示，可以看到，最早预测的准确度结果非常低为2.187%，最后提升到了96.87%，其结果高于之前的一般神经网络的结果87.79%(第六篇博客)，由此可见TensorFlow RNN的分类学习效果还不错，并且在不断学习中。

Extracting MNIST_data\train-images-idx3-ubyte.gzExtracting MNIST_data\train-labels-idx1-ubyte.gzExtracting MNIST_data\t10k-images-idx3-ubyte.gzExtracting MNIST_data\t10k-labels-idx1-ubyte.gz0.21875000.67968750.82812500.82031250.83593750.89843750.88281250.83593750.9062500....0.98437500.96093750.94531250.96093750.97656250.93750000.99218750.96093750.99218750.9687500

完整代码如下：

# -*- coding: utf-8 -*-import tensorflow as tffrom tensorflow.examples.tutorials.mnist import input_data# 下载手写数字图像数据集mnist = input_data.read_data_sets('MNIST_data', one_hot=True)# 设置参数learning_rate = 0.001     # 学习效率train_iters = 100000      # 训练次数batch_size = 128          # 自定义n_inputs = 28             # MNIST 输入图像形状 28*28 黑白图片高度为1n_steps = 28              # time steps 输入图像的28行数据n_hidden_units = 128      # 神经网络隐藏层数量n_classes = 10            # 分类结果 数字0-0#-----------------------------定义placeholder输入-------------------------# 设置传入的值xs和ysx = tf.placeholder(tf.float32, [None, n_steps, n_inputs])  #每张图片28*28=784个点y = tf.placeholder(tf.float32, [None, n_classes])          #每个样本有10个输出# 定义权重 进入RNN前的隐藏层 输入&输出weights = {    # (28, 128)    'in': tf.Variable(tf.random_normal([n_inputs, n_hidden_units])),    # (128, 10)    'out': tf.Variable(tf.random_normal([n_hidden_units, n_classes])),}# 定义偏置 进入RNN前的隐藏层 输入&输出biases = {    # (128, )    'in': tf.Variable(tf.constant(0.1, shape=[n_hidden_units, ])),    # (10, )    'out': tf.Variable(tf.constant(0.1, shape=[n_classes, ])),}#---------------------------------定义RNN-------------------------------def RNN(X, weights, biases):    # hidden layer for input to cell    #######################################################    # X (128 batch, 28 steps, 28 inputs) 28行*28列     # X ==> (128*28, 28 inputs)    X = tf.reshape(X, [-1, n_inputs])    # 隐藏层 输入    # X_in ==> (128batch*28steps, 128 hidden)    X_in = tf.matmul(X, weights['in']) + biases['in']    # 二维数据转换成三维数据     # 注意：神经网络学习时要注意其形状如何变化    # X_in ==> (128 batch, 28 steps, 128 hidden)    X_in = tf.reshape(X_in, [-1, n_steps, n_hidden_units]) # 128个隐藏层    # cell    #######################################################    # Cell结构 隐藏层数 forget初始偏置为1.0(初始时不希望forget)    lstm_cell = tf.nn.rnn_cell.BasicLSTMCell(n_hidden_units, forget_bias=1.0, state_is_tuple=True)    # RNN会保留每一步计算的结果state    # lstm cell is divided into two parts (c_state, m_state) 主线c_state 分线m_state    _init_state = lstm_cell.zero_state(batch_size, dtype=tf.float32)    # RNN运算过程 每一步的输出都存储在outputs序列中    # 常规RNN只有m_state LSTM包括c_state和m_state    outputs, states = tf.nn.dynamic_rnn(lstm_cell, X_in, initial_state=_init_state, time_major=False)    # hidden layer for output as final results    #######################################################    # 第三层加工最终的输出    # 最终输出=Cell的输出*权重输出+偏置数据    # states包含了主线剧情和分线剧情 states[1]表示分线剧情的结果 即为outputs[-1]最后一个输出结果    results = tf.matmul(states[1], weights['out']) + biases['out']    # 第二种方法    # 解包 unpack to list [(batch, outputs)..] * steps    #outputs = tf.unstack(tf.transpose(outputs, [1,0,2])) # states is the last outputs    #results = tf.matmul(outputs[-1], weights['out']) + biases['out']    return results#---------------------------------定义误差和训练-------------------------------pre = RNN(x, weights, biases)# 预测值与真实值误差cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=pre, labels=y))# 训练学习 学习效率设置为0.001train_step = tf.train.AdamOptimizer(learning_rate).minimize(cost) #梯度下降减小误差# 预测正确个数correct_pred = tf.equal(tf.argmax(pre, 1), tf.argmax(y, 1))# 准确度accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))#---------------------------------初始化及训练-------------------------------init = tf.initialize_all_variables()with tf.Session() as sess:    sess.run(init)    step = 0    # 循环每次提取128个样本    while step * batch_size < train_iters:        # 从下载好的数据集提取128个样本        batch_xs, batch_ys = mnist.train.next_batch(batch_size)        # 形状修改 [128, 28, 28]        batch_xs = batch_xs.reshape([batch_size, n_steps, n_inputs])        # 训练        sess.run([train_step], feed_dict={            x: batch_xs,            y: batch_ys,        })        # 每隔20步输出结果        if step % 20 == 0: # 20*128            print(sess.run(accuracy, feed_dict={                x: batch_xs,                y: batch_ys,            }))        step += 1

注意，在运行代码过程中可能会报错“ValueError: Variable rnn/basic_lstm_cell/kernel already exists, disallowed. Did you mean to set reuse=True or reuse=tf.AUTO_REUSE in VarScope?”

在Spyder中有kernel选项，点击选择 “ Restart & RunAll ” 重新运行代码即可解决问题。

lstm原理_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例..._第21张图片

希望文章对大家有所帮助，如果有错误或不足之处，还请海涵。 真心想把自己所学所感所做分享出来，还请各位多多指教，真诚邀请您的关注！谢谢。

点个赞，证明你还爱我

lstm原理_[Python人工智能] 十一.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例..._第22张图片

机器学习-K近邻算法 shy_snow python 机器学习机器学习近邻算法人工智能
k-近邻分类算法，即物以类聚的思想，通过已知分类中的点和未知分类的点距离最近的前k个点的分类来预测未知点的分类。kNN.pyfromnumpyimport*importoperatordefcreateDataSet():group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])labels=['A','A','B','B']returngroup,label
华为od 机试 2025 B卷 - 数值同化 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD2025B卷华为OD机试2025B卷华为OD机考2025B卷
数值同化华为OD机试真题目录:点击去查看华为OD2025B卷100分题型题目描述存在一个m*n的二维数组，其成员取值范围为0，1，2。其中值为1的元素具备同化特性，每经过1S，将上下左右值为0的元素同化为1，而值为2的元素，免疫同化。将数组所有成员随机初始化为0或2，再将矩阵的[0,0]元素修改为1，在经过足够长的时间后，求矩阵中有多少个元素是0或2（即0和2数量之和）。输入描述输入的前两个数字是
使用Python调用C++：简单易学的方法程序员杨弋 Python全栈工程师学习指南 python c++开发语言
Python是一种易于学习和理解的编程语言，而C++是强大的编程语言。Python代码可以在很短的时间内编写出来，但如果涉及到大量的计算或需要高性能，则需要使用更快、更高效的编程语言。在这种情况下，Python调用C++是一种常见的方法，因为它可以提供C++的高速性能和Python的便捷性。在本文中，我们将介绍如何使用Python调用C++。首先，需要创建C++函数库（DLL），并确保该库包含需要
python之vars函数使用介绍 yueguang8 python python 开发语言
在Python中,vars()是一个内置函数,它可以用来获取对象的属性字典。1.vars()函数的用法无参数调用vars()：当不带参数调用vars()时,它会返回当前本地作用域中的变量名和值组成的字典。带参数调用vars()：当传递一个对象作为参数时,vars()会返回该对象的属性字典。这等价于object.__dict__。下面是一些示例:#无参数调用x=10y=20print(vars())
从数据到智慧：AI原生知识库构建的完整技术栈解析 AI天才研究院 Agentic AI 实战 AI大模型企业级应用开发实战 AI人工智能与大数据 AI-native 大数据 ai
从数据到智慧：AI原生知识库构建的完整技术栈解析关键词AI原生知识库、知识图谱、向量数据库、大语言模型、RAG技术、知识工程、智能问答系统摘要在人工智能飞速发展的今天，构建能够真正理解、组织和应用知识的系统已成为企业数字化转型的核心竞争力。本文将深入剖析AI原生知识库的完整技术栈，从数据采集与预处理，到知识表示与建模，再到存储架构与检索增强生成技术，全方位解读如何将原始数据转化为可行动的智慧。我们
【人工智能】大比拼：文心一言 VS ChatGPT —— 禅与计算机程序设计艺术亲自测评 AI天才研究院 ChatGPT 人工智能文心一言 chatgpt
收到了百度“文心一言”的内测邀请，现在给大家亲身体验测评一下！禅与计算机程序设计艺术先说结论：文心一言表现基本符合预期。与ChatGPT有一定差距，应该在几个月左右。但是禅与计算机程序设计艺术，挺期待ChatGLM-130B版本的效果的。因为，ChatGLM-6B在本地测评的效果，还是非常不错的！目录文心一言写一篇论文介绍一下你自己，从技术原理、应用场景、未来发展、当前不足等方面，不少于3000字
python中vars()的作用 m0_45093979 python 开发语言
在Python中，vars()是一个内置函数，用于返回对象的属性和属性值的字典。它可以用于获取一个对象的命名空间中的所有变量和属性，然后以字典的形式返回这些变量和属性的名称及其对应的值。如果没有提供参数给vars()，它会返回当前作用域（scope）的变量和属性。通常在函数内部调用vars()，它将返回函数的局部命名空间中的所有变量和属性。在模块级别调用vars()，它将返回当前模块的全局命名空间
C++调用python的方法
一、C++中调用python接口在线手册：https://docs.python.org/3/c-api/intro.htmlWindows环境下python安装时提供了给C++调用的头文件及库文件。C++中引用头文件include，放在所有标准引用之前。将头文件目录、库文件目录添加到工程属性。调用python提供的API，传入模块名、函数名、函数参数（封装成PyObject的形式）获取返回值并解
在Windows系统中配置Python 3.11环境安装教程俊星学长 windows python3.11
在Windows系统中配置Python3.11环境安装教程是一个相对直接且简单的过程，但为了确保所有步骤都被详细覆盖，我将分步介绍，并提供必要的背景信息和注意事项。以下是详细的安装教程：一、下载Python3.11首先，需要从Python的官方网站下载Python3.11的安装包。请按照以下步骤操作：访问Python官方网站：打开浏览器，访问Python的官方网站。在网站首页，找到并点击“Down
python vars的作用 jjw_zyfx python python 开发语言后端
classMyDict:name="jjw"age=14result=vars(MyDict)print(result)print("*"*30)print(MyDict.__dict__)#说明vars的一个做用就是其等价于调用类的__dict__属性print(result==MyDict.__dict__)print('-'*30)print(vars())print('#'*30)#函数会
项目篇：加入Python程序之如何在Python中使用C++？ guangcheng0312q python c++windows 开发语言
项目篇：加速Python程序之如何在Python中使用C++？通常像一些耗时的操作，我们期望在C++中去实现，然后使用Python去调用对应的接口，或者因为底层库的原因，需要支持对外的PythonAPI，那么我们通常需要支持在Python中访问C++，如何实现呢？方法比较多，本节以pybind11为例，引入一个完整的项目工程模版，如果你后续有这种需求，可以基于模版去修改。注：(懒人版)本节的所有代
1. RAG 权威指南：从本地实现到生产级优化的全面实践 javascript
1.RAG权威指南：从本地实现到生产级优化的全面实践大型语言模型（LLM）的知识受限于其训练数据，这是一个众所周知的痛点。检索增强生成（RAG）技术应运而生，它如同一座桥梁，将这些强大的基础模型与企业所需的实时、动态信息连接起来，极大地拓展了AI的能力边界。RAG将LLM从一个封闭的知识库，转变为一个能够提供准确、实时且紧密贴合上下文的动态工具。本文将作为你的向导，带你深入探索RAG的世界。我们首
Python与c++互相调用（pybind11）欢迎下辈子光临 CPP Python python c++开发语言
1.安装pybind11看网上使用pipinstallpybind11,没有弄明白，因此下载源码编译。1.1下载pybind11gitclonehttps://github.com/pybind/pybind11.git1.2源码编译cd/pybind11mkdirbuildcdbuildcmake..make编译完成2.cpp样例//example.cpp#include#include"Abs
Python vars() 函数：探索对象的内部程序员喵哥 Python python 开发语言
更多Python学习内容：ipengtao.comPython是一门具有强大而灵活的编程语言，可以访问和探索对象的内部属性。vars()函数是Python标准库中的一个强大工具，它可以获取对象的属性和属性值，并以字典的形式返回它们。在本文中，将深入研究vars()函数，探讨它的用途、示例和适用场景。前言在Python中，对象是一切。对象可以是数字、字符串、列表、字典、函数、类实例等等。每个对象都可
2.4G收发SOC芯片 XL2417D，集成高性能2.4GHz射频收发器、32位MCU
XL2417D芯片是一款低功耗、高性能和高度集成的2.4GSoC芯片，带有蓝牙5.2BLE和2.4G收发器。它集成了高性能2.4GHz射频收发器、丰富的基带功能、32位MCU和各种外围IO。它支持128KB的flash和8KB的RAM，以实现可编程协议和配置文件，支持定制应用程序。XL2417D采用先进的55nmCMOS低泄漏工艺制造，降低BOM成本的同时简化了整个系统设计。丰富的外围设备包括10
python和C++相互调用使用妄想出头的工业炼药师 c++开发语言
结论：首选PyBind11：综合性能、易用性最佳（GitHub⭐48k+）优先考虑Cython：涉及大量科学计算或已有Cython代码避免Boost.Python（历史包袱重）和SWIG（配置复杂），除非维护旧项目。python调用C++接口C++调用python接口在C++中使用Python库，特别是使用pybind11，是一个非常强大的方法，可以让你在C++项目中轻松地利用Python的强大功
华为OD机试 2025B卷 - 士兵过河 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD机考2025A卷华为OD2025B卷华为OD机试2025B卷华为OD机考2025B卷
士兵过河2025B卷目录点击查看：华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解华为OD2025B卷200分题型题目描述一支N个士兵的军队正在趁夜色逃亡，途中遇到一条湍急的大河。敌军在T的时长后到达河面，没到过对岸的士兵都会被消灭。现在军队只找到了1只小船，这船最多能同时坐上2个士兵。当1个士兵划船过河，用时为a[i]；0<=i
AI技术正在深度重构全球产业格局，其影响已超越工具属性，演变为推动行业变革的核心引擎。
一、AI如何重塑AI的工作与行业（AI助手领域）能力升级理解与生成：基于LLM（大语言模型），AI能处理开放式问题、撰写报告、翻译代码，替代部分人类知识工作。个性化交互：通过用户历史对话分析，提供定制化建议（如学习计划、投资策略）。多模态扩展：结合图像/语音识别（如GPT-4V），实现图文分析、医学影像解读等跨模态任务。行业变革客服行业：AI客服处理70%+常规咨询（如阿里小蜜），人力转向复杂问题
如何在 Ubuntu 22.04 上使用 LEMP 安装 WordPress 教程 vvw& 技术文章 Linux 开源项目推荐 ubuntu linux 运维服务器 wordpress LEMP php
简介：本教程旨在指导你如何在Ubuntu22.04上使用LEMP栈安装WordPress。WordPress是一个用PHP编写的开源内容管理系统。LEMP栈是Linux，NGINX，MySQL和PHP的缩写。WordPress非常用户友好，并提供了多种选项，例如不同的插件和具有精美设计的各种主题，使其成为用户最可定制的CMS。以下段落将介绍安装WordPress之前LEMP安装的所有步骤。在Ubu
【题解-Acwing】1057. 股票买卖 IV X CODE 算法练习题解算法动态规划状态机模型
题目：1057.股票买卖IV题目描述给定一个长度为NNN的数组，数组中的第iii个数字表示一个给定股票在第iii天的价格。设计一个算法来计算你所能获取的最大利润，你最多可以完成kkk笔交易。注意：你不能同时参与多笔交易（你必须在再次购买前出售掉之前的股票）。一次买入卖出合为一笔交易。输入格式第一行包含整数NNN和kkk，表示数组的长度以及你可以完成的最大交易笔数。第二行包含NNN个不超过10000
想转行网络安全，可以先看看过来人的建议孤独的汤姆 web安全安全
在当前就业形势下，不少朋友面临转行的困境。网络安全作为一个热门领域，自然也吸引了许多人的目光。本文将就转行网络安全这一话题，提供一些切实可行的建议。网络安全行业概况网络安全涵盖了从基础的脚本编写到高级的漏洞研究等多个层面。该领域包括但不限于：渗透测试、漏洞评估、恶意软件分析、入侵检测、信息安全管理等。这些内容的复杂性不一，从基础的安全监控到复杂的安全架构设计都涉及其中。这就意味着，尽管有些领域可能
【思考】对“私有化利润，公有化风险”现象的思考海绵波波107 其他的思考学习
如果万达破产，谁的钱会受到影响？如果万达集团申请破产，不同相关方的资金和资产将受到不同程度的影响，具体取决于破产类型（清算或重组）、债务结构以及法律管辖。以下是主要受影响方及影响程度分析：1.债权人（最直接受影响）（1）优先债权人有抵押债权人（银行等金融机构）万达通过资产抵押获得的贷款（如商业地产抵押），债权人有权通过拍卖抵押物优先受偿。但若资产贬值，可能无法全额回收。例如：某银行持有万达广场的抵
【线上故障排查】缓存穿透攻击的识别与布隆过滤器（面试题 + 3 步追问应对 + 案例分析）程序员岳彬从项目到面试：Java 高频面试题场景化通关指南缓存 java 后端 spring boot linux redis
一、高频面试题问题1：什么是缓存穿透？它对系统的核心危害是什么？参考答案：缓存穿透指的是用户请求的数据在缓存和数据库中都不存在，导致请求直接绕过缓存打到数据库。核心危害是大量无效请求会耗尽数据库资源，比如CPU、内存或连接数，严重时可能引发数据库宕机，进而导致整个系统崩溃，影响服务可用性。第一步追问：缓存穿透和缓存雪崩有什么本质区别？参考答案：两者本质不同。缓存穿透是请求不存在的数据，攻击或逻辑漏
MySQL事务实现原理巴里巴气 MySQL知识记录 mysql 数据库
目录MySQL事务介绍事务基础及其实现原理回滚日志MVCC多版本并发控制事务的特性多个事务同时执行出现的三种现象四种隔离级别及其实现原理尽量不要使用长事务MySQL事务介绍要保证⼀组数据库操作，要么全部成功，要么全部失败事务是在存储引擎层实现的,MySQL是支持多存储引擎的系统,不是所有的存储引擎都支持事务,目前最常用的存储引擎InnoDB是支持事务的事务基础及其实现原理回滚日志回滚日志是一种用于
使用 duckdb::arrow 实现表格输出的 DuckDB CLI 代码
试图让DeepSeek编写输出列名、并支持各种数据类型的代码，总是不成功，在duckdb-rs主页看到它的示例代码支持arrow表格，把此示例提交给DeepSeek,并让他删除语法高亮代码，就能正常处理各种查询了。如下所示。usestd::{error::Error,io::{self,BufRead},time::Instant,};useduckdb::{params,Connection,a
12行脚本实现duckdb自动完成tpch测试 l1t 数据库编程语言软件工程数据库 sql github
核心思想：利用duckdbtpch插件内置的tpch_queries()表函数输出查询Sql语句到qs.txt，然后读入生成的qs.txt,将结果输出到res.txt,在控制台输出计时。autotpch.txt脚本如下：LOADtpch;PRAGMAdisable_progress_bar;CALLdbgen(sf=0.3);.outputqs.txt.modelist.headeroffsele
大模型——什么是 Vibe Coding？从零开始学习 AI 辅助编程不二人生大模型学习人工智能大模型辅助编程
大模型——什么是VibeCoding？从零开始学习AI辅助编程VibeCoding：代码消失，直觉驱动的软件开发新浪潮？生成式人工智能的指数级增长正不断重塑各个行业，软件开发领域也不例外。大约在2025年初，一股源自美国硅谷的新思潮开始引起关注：开发者似乎可以借助AI工具，在几乎不直接编写代码的情况下构建产品。这种依赖直觉、跳脱传统编码苦役的开发方式，被赋予了一个颇具时代感的名字——VibeCod
CMake基础：条件判断详解
目录1.简介2.核心判断类型及示例2.1.变量相关判断2.2.数值判断2.3.文件/路径判断2.4.目标/组件判断2.5.系统与编译器判断2.6.逻辑组合（与/或/非）2.7.括号分组（优先级控制）2.8.判断某个元素是否在列表中3.常见实用场景4.注意事项相关链接1.简介CMake的条件判断是通过if()/elseif()/else()/endif()结构实现流程控制的核心，常用于根据环境、配置
Gemini vs DeepSeek：Transformer 架构下的技术路线差异与企业级选择 charles666666 transformer 架构深度学习语言模型产品经理人工智能
一、引言：从商业价值切入Gemini和DeepSeek都基于Transformer架构，但在技术路线和应用场景上各有侧重。本文将解密同源Transformer下的技术分野，帮助企业做出更明智的大模型选型决策。二、Transformer核心机制精要Transformer架构是现代大语言模型的基础，其核心机制包括自注意力机制和前馈神经网络。自注意力机制使模型能够捕捉序列中元素的全局依赖关系，但也是GP
沃丰科技和印尼MAP集团战略合作，智能化服务印尼2.8亿消费者沃丰科技科技人工智能大数据
在东南亚零售市场风起云涌之际，印尼综合性零售巨头MAP集团与智能客户服务领域领军企业（Udesk）达成深度战略合作，共同启动一项具有里程碑意义的数字化转型工程——通过AI赋能MAP集团旗下客户忠诚度计划平台，为印尼2.8亿消费者打造全场景、个性化的智能客户服务体验。此次合作不仅标志着印尼零售业智能化升级的加速，更将重塑企业与消费者之间的情感连接。一.MAPClub：零售忠诚度战略要地MAP集团：在
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen