mybabe0312

TensorFlow1.4之LSTM的使用

TensorFlow Data Flow Graph

一：层的理解

为了形象的理解神经网络，我们提出了层的概念，虽然这更加的形象了，但同时也给初学者带来了很多困扰和不太理解的地方，主要就是在涉及到代码的时候。
层的责任可以理解为三个，一是从某个地方拿到需要用于运算的数据；二是对这些数据进行运算；三是将运算的结果经过处理后输出到其他地方。那么取数据的地方和输出的地方是哪里呢？其实就是某些变量。
标准的神经网络分为三种层，分别为输入层(input layer)、隐藏层(hidden layer)和输出层(output layer)。
输入层：从我们自定义的变量中取得数据，将数据进行矩阵运算，再应用于激活函数，接着将结果存入到变量
隐藏层：从输入层输出的变量中获取数据，并进行运算和使用激活函数后，将结果输出到变量供下一个隐藏层使用，此过程根据你定义的隐藏层的层数会迭代执行多次。
输出层：从最后个隐藏层的输出变量中获取数据，经过运算和使用激活函数后，根据业务需要得到对应个数的输出结果。

二：词的向量化

对于神经网络，在处理字符等类型数据的时候，我们首先需要将字符数字化，然后再作为训练的数据输入网络进行训练。如何将字符数字化，根据自己的需要可以采用多种方案，比较常见的方案是采用one-hot编码，以及参照这种思想自定义的其他格式。在神经网络中，我们对字符数字化都是将字符或词语编码成向量,如果采用one-hot，词向量的大小一般由字符的个数来决定。
如果我们对“我们在这里很好”这句话进行one-hot编码，首先将这句话分为：“我们”、“在”、“这里”、“很好”四个词语，然后对每个词语进行one-hot编码，编码后的格式可能为：[[1,0,0,0],[0,1,0,0],[0,0,1,0],[0,0,0,1]]。不难发现，one-hot编码的思想等同于每个词语依次分别放到表格的每列里面，表示哪个词语就将词语所在的列设置为1，其它列则设置为0。
在实际使用的场景下，我们可以参照这种思想来对输入的数据进行变换，我们可以根据词语的重要性使用不同的编号，例如上面如果“我们”比其他的都重要，那么可以将“我们”设置编号为3，则得到的向量就为：[[3,0,0,0],[0,1,0,0],[0,0,1,0],[0,0,0,1]]
在此我们引出第一个变量input_vec_size，该变量定义每个词向量的大小，在这里就是4。

三：训练数据的批量化

训练的数据在进行训练前需要先将其批量化处理，批量化的方法下面举例说明。我们对下面的歌唱进行批量化：“西边的太阳快要落山了, 微山湖上静悄悄。弹起我心爱的土琵琶, 唱起那动人的歌谣”
为了方便演示我们把里面的标点符号去掉，同时字符数字化的操作也省略掉，后面看到的这些词就当作是已经是数字化后的结果。
接下来我们先认识下几个变量：

batch_size：批次的大小，就是batch里面有多少行，这里设置为2.
num_steps：步长，就是每行里面最大的列数，这里设置为3.
首先，我们将数据分成batch_size行，得到如下格式：
西边的太阳快要落山了微山湖上静悄悄
弹起我心爱的土琵琶唱起那动人的歌谣
此时，在代码里面就等同于以下的二维数据：
```
[
[西,边,的,太,阳,快,要,落,山,了,微,山,湖,上,静,悄,悄]
[弹,起,我,心,爱,的,土,琵,琶,唱,起,那,动,人,的,歌,谣]
]
```
接着我们根据num_steps来分割每一行，得到如下格式：
```
西边的 | 太阳快 | 要落山 | 了微山 | 湖上静 | 悄悄
弹起我 | 心爱的 | 土琵琶 | 唱起那 | 动人的 | 歌谣
```

如此一来，每次输入到神经网络的数据就是一个小的二维数组的batch数据，如：

[
    [西,边,的]
    [弹,起,我]
]

我们再将每个字进行向量化，得到如下结果（input_vec_size=6）

[
    [[1,0,0,0,0,0],[0,1,0,0,0,0],[0,0,1,0,0,0]]
    [[0,0,0,1,0,0],[0,0,0,0,1,0],[0,0,0,0,0,1]]
]

这个三维的矩阵（[batch_size,num_steps,input_vec_size]）就是LSTM的训练输入。

数据的批量化示例图如下：

注：输入的矩阵可以是[batchsize,numsteps,inputvecsize]或[numsteps，batchsize,inputvecsize]。由于tf.nn.dynamicrnn函数的参数timemajor默认值为False，所以默认输入格式是[batchsize,numsteps,inputvecsize]；如果使用[numsteps，batchsize,inputvecsize]效率会稍微高一点，因为内部的计算也会转换成这个结构。同时请注意，隐藏层输入的是什么结构，最终隐藏层输出的结构也一致。

四：构建模型

1，初始化对象

def __init__(self,batch_size,num_steps,input_vec_size,num_classes,lstm_size,num_layers,is_training=True,
             learning_rate=0.001,grad_clip=5):
    print("--tensorflow version:", tf.__version__)
    print("--tensorflow path:", tf.__path__)
    #batch的大小和截断长度
    self.batch_size = batch_size
    #等同其他地方的time_steps
    self.num_steps = num_steps
    #词向量大小(等同其他地方的input_size)   embedding_size
    self.input_vec_size = input_vec_size
    #输出的类型数（词数）
    self.num_classes = num_classes
    #LSTM隐藏层神经元数:num_units，hidden_size
    self.lstm_size = lstm_size
    #LSTM隐藏层层数
    self.num_layers = num_layers
    #是否是训练状态
    self.is_training = is_training
    #学习率
    self.learning_rate = learning_rate
    #梯度裁剪
    self.grad_clip = grad_clip

2，构建输入数据（实际数据占位符，变量）

def build_inputs(self,batch_size, num_steps, input_vec_size, num_classes):
    # 输入定义数据占位符(TensorFlow默认使用GPU可能导致参数更新过慢,所以建议参考项目中的代码，尤其在定义Variables时注意要绑定CPU)
    with tf.device("/cpu:0"):
        # 输入的词矩阵,维度为batch_size * num_steps * input_vec_size
        inputs = tf.placeholder(tf.float32, shape=(batch_size, num_steps, input_vec_size), name='inputs')
        #预期输出 batch_size * num_classes
        labels = tf.placeholder(tf.float32, shape=(batch_size, num_classes), name='labels')
        #节点不被dropout的概率
        keep_prob = tf.placeholder(tf.float32, name='keep_prob')
    return inputs,labels,keep_prob

3，创建输入层

def build_input_layer(self,input_data, num_steps, input_vec_size, lstm_size):
    with tf.variable_scope("input_wb"):
        with tf.device("/cpu:0"):
            input_wight = tf.Variable(tf.truncated_normal([input_vec_size, lstm_size]))
            input_bias = tf.Variable(tf.zeros([lstm_size, ]))
    tf.summary.histogram("input_weight",input_wight)
    tf.summary.histogram("input_bias", input_bias)
    #首先将向量转换为矩阵
    inputs_data = tf.reshape(input_data, shape=[-1, input_vec_size])
    #执行运算
    rnn_inputs = tf.matmul(inputs_data, input_wight) + input_bias
    #add 将输入运用sigmoid激活函数
    #rnn_inputs = tf.nn.sigmoid(rnn_inputs)
    #将数据再转换为隐藏层需要的格式 [batch_size,num_steps,lstm_size]
    self.rnn_inputs = tf.reshape(rnn_inputs, shape=[-1, num_steps, lstm_size])
    return self.rnn_inputs

4，构建隐藏层

def build_lstm_layer(self,lstm_size, num_layers, batch_size, keep_prob):
    lstm_cell = tf.nn.rnn_cell.LSTMCell(lstm_size, state_is_tuple=True)
    with tf.name_scope('dropout'):
        if self.is_training:
            # 添加dropout.为了防止过拟合，在它的隐层添加了 dropout 正则
            lstm_cell = tf.nn.rnn_cell.DropoutWrapper(lstm_cell, output_keep_prob=keep_prob)
            tf.summary.scalar('dropout_keep_probability', keep_prob)
    #堆叠多个LSTM单元
    stacked_lstm = tf.nn.rnn_cell.MultiRNNCell([lstm_cell for _ in range(num_layers)], state_is_tuple=True)
    #初始化 LSTM 存储状态.batch_size,stacked_lstm.state_size
    initial_state = stacked_lstm.zero_state(batch_size, tf.float32)
    return stacked_lstm, initial_state

5，构建输出层

'''
    构造输出层，与LSTM层 进行全连接
    :param lstm_output  lstm层的输出结果,[batch_size,num_steps,lstm_size]
    :return:
'''
def build_output_layer(self,hidden_output, lstm_size, num_classes):
    with tf.variable_scope("softwax"):
        softmax_w = tf.Variable(tf.truncated_normal([lstm_size,num_classes]))
        softmax_b = tf.Variable(tf.zeros(num_classes))
    hidden_output = tf.transpose(hidden_output, [1, 0, 2])
    hidden_output = tf.gather(hidden_output, int(hidden_output.get_shape()[0]) - 1)
    #计算logits
    logits = tf.matmul(hidden_output,softmax_w) + softmax_b
    #输出层softmax返回概率分布
    softmax_out = tf.nn.softmax(logits,name='predictions')
    return softmax_out, logits

注意：下面的方式可以实现“多目标”的场景

def build_output_layer(self,hidden_output, lstm_size, num_classes):
    with tf.variable_scope("output_wb"):
        with tf.device("/cpu:0"):
            output_w = tf.Variable(tf.truncated_normal([lstm_size, num_classes]))
            output_b = tf.Variable(tf.zeros(num_classes))
    tf.summary.histogram("output_weight", output_w)
    tf.summary.histogram("output_bias", output_b)
        # 将输出的维度进行转换(B,T,D) => (T,B,D)
    hidden_output = tf.transpose(hidden_output, [1, 0, 2])
    #这里取最后个num_steps得到的数据
    hidden_output = tf.gather(hidden_output, int(hidden_output.get_shape()[0]) - 1)
    #计算并得出结果
    output_vec = tf.matmul(hidden_output, output_w) + output_b
    #预测结果
    product = tf.nn.sigmoid(output_vec)
    return output_vec, product

6，构造损失（成本）函数

def build_loss(self,output_vec, labels):
    #根据logits和labels计算损失。
#logits：[batch_size,num_classes]; labels：[batch_size,num_classes]
    loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(
logits=output_vec, labels=labels))
    return loss

注意：下面的方式可以实现“多目标”的场景

def build_loss(self,output_vec, labels):
    # 根据output_vec和labels计算损失。
    #output_vec 未经过sigmod或softmax处理的输出
    #logits：[batch_size,num_classes]; labels：[batch_size,num_classes]
    loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(
        logits=output_vec, labels=labels))
    return loss

7，构造优化器

def build_optimizer(self,loss, learning_rate, grad_clip):
    # 构造加速训练的优化方法
    with tf.name_scope('train'):
        optimizer = tf.train.AdamOptimizer(learning_rate)
        '''
        optimizer = tf.train.AdadeltaOptimizer(learning_rate)
        optimizer = tf.train.AdagradOptimizer(learning_rate)
        optimizer = tf.train.FtrlOptimizer(learning_rate)
        optimizer = tf.train.RMSPropOptimizer(learning_rate)
        '''
        #optimizer.apply_gradients(zip(grads,tvar))
        #该函数是简单的合并了compute_gradients()与apply_gradients()函数，返回为一个优化更新后的var_list
        #如果global_step非None，该操作还会为global_step做自增操作
        train_op = optimizer.minimize(loss)
    return train_op

8，定义精准度评估函数

'''
定义计算模型预测结果准确度
'''
def accuracy_eval(self, product, y):
    correct_pred = tf.equal(tf.argmax(product, 1), tf.argmax(y, 1))
    accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))
    return accuracy

9，构建模型

def build_model(self):
    self.inputs, self.labels = self.build_inputs(self.batch_size, self.num_steps, self.input_vec_size, self.num_classes)
    #输入层
    rnn_inputs = self.build_input_layer(self.inputs, self.num_steps, self.input_vec_size, self.lstm_size)
    #隐藏层
    stacked_lstm, self.initial_state = self.build_lstm_layer(self.lstm_size, self.num_layers, self.batch_size, self.keep_prob)
    hidden_output, self.final_state = tf.nn.dynamic_rnn(stacked_lstm, rnn_inputs, initial_state=self.initial_state)
    #输出层
    output_vec, self.predict = self.build_output_layer(hidden_output, self.lstm_size, self.num_classes)
    if self.is_training :
        # 使用损失函数
        self.loss = self.build_loss(output_vec, self.labels)
        #使用优化器
        self.train_op = self.build_optimizer(self.loss, self.learning_rate, self.grad_clip)
    return self.predict

10，将字符批量化

'''return 可迭代的元祖
    x：[batch_size,num_steps,input_vec_size]的X训练数据
    y：[batch_size,num_classes]
'''
def get_batches(batch_size,num_steps,input_vec_size):
    n_batches = 12 #通过计算得出的批量数
    for num in range(n_batches):
        yield x, y

11，训练和保存模型

class Training:
    def __init__(self, batch_size, num_steps, input_vec_size, num_classes, lstm_size, num_layers,epoch_size=1000,
                 learning_rate=0.001, keep_prob=0.75,grad_clip=5, checkpoint_dir='./checkpoints/v2',log_dir='./logs/v2'):
        self.epoch_size = epoch_size
        self.keep_prob = keep_prob
        #检查点文件的存放目录
        self.checkpoint_dir = checkpoint_dir
        self.log_dir = log_dir
        if not os.path.exists(checkpoint_dir):
            os.makedirs(checkpoint_dir)
        #训练轮数计数器变量(不需要被训练)
        self.global_step = tf.Variable(0,name='global_step',trainable=False)
        #创建模型
        self.model = SitePrectModel(batch_size=batch_size, num_steps=num_steps, input_vec_size=input_vec_size,
                                    num_classes=num_classes, lstm_size=lstm_size, num_layers=num_layers,
                                    learning_rate=learning_rate,is_training=True,grad_clip=grad_clip)
        self.model()
        #初始化或重新加载会话
        self.init_or_load_session()
        #加载数据
        self.data_util = DataUtil(batch_size)

    def __call__(self, *args, **kwargs):
        print('start training')
        self.summary_writer = tf.summary.FileWriter(self.log_dir,tf.get_default_graph())
        self.summary_log = tf.summary.merge_all()
        self.current_epoch = 0
        self.counter = 0
        for epoch in range(self.epoch_size):
            print('>>>>>>>训练轮数:{}'.format(epoch))
            self.current_epoch = epoch
            state = self.sess.run(self.model.initial_state)
            batches = self.data_util.get_batches()
            for x, y in batches:
                self.counter += 1
                state, product = self.optimization(x,y,state)
                if self.counter % 20 == 0:
                    feed_dict = {self.model.inputs: x,
                                 self.model.labels: y,
                                 self.model.keep_prob:1.}
                    accuracy = self.sess.run(self.model.accuracy,feed_dict=feed_dict)
            if (epoch+1)%100 == 0:
                self.evaluation()
        self.evaluation()
        print('training end')

    '''
        初始化或加载Session
    '''
    def init_or_load_session(self):
        self.sess = tf.Session()
        self.saver = tf.train.Saver()
        ckpt = tf.train.latest_checkpoint(checkpoint_dir=self.checkpoint_dir)
        if ckpt:
            print('restore session from ',ckpt)
            self.saver.restore(self.sess, ckpt)
        else:
            print('initialize all variables')
            self.sess.run(tf.initialize_all_variables())

    def evaluation(self):
        self.saver.save(self.sess,self.checkpoint_dir+'/model{}.ckpt'.format(self.current_epoch),
                        global_step=self.global_step)

    def optimization(self,batch_x,batch_y,state):
        feed_dict = {self.model.inputs: batch_x,
                     self.model.labels: batch_y,
                     self.model.keep_prob: self.keep_prob,
                     self.model.initial_state:state}
        final_state, train_op, batch_loss, product,summary_log = self.sess.run([self.model.final_state,
                                                           self.model.train_op,
                                                           self.model.loss,
                                                           self.model.product,
                                                           self.summary_log],
                                                          feed_dict=feed_dict)
        if self.counter % 100 == 0:
            self.summary_writer.add_summary(summary_log, self.current_epoch)
            print('训练误差: {:.4f}... '.format(batch_loss))
        return final_state,product

12，开始训练

#训练模型
batch_size = 4  # 单个batch中序列的个数
num_steps = 1  # 单个序列中的字符数目
input_vec_size = 151  # 隐层节点个数,输入神经元数(单词向量的长度)
num_classes = 30  # 输出神经元数(最后输出的类别总数，例如这的基站数)
lstm_size = 160
num_layers = 6  # LSTM层个数

learning_rate = 0.0001  # 学习率
#feed in 1 when testing, 0.75 when training
keep_prob = 0.75  # 训练时dropout层中保留节点比例
epoch_size = 100  # 迭代次数

training = Training(batch_size=batch_size, num_steps=num_steps, input_vec_size=input_vec_size,
                    num_classes=num_classes, lstm_size=lstm_size, num_layers=num_layers,
                    learning_rate=learning_rate,epoch_size=epoch_size)
training()

tensorboard --logdir=./logs/v2
http://localhost:6006/

Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
JAVA·一个简单的登录窗口 MortalTom java 开发语言学习
文章目录概要整体架构流程技术名词解释技术细节资源概要JavaSwing是Java基础类库的一部分，主要用于开发图形用户界面（GUI）程序整体架构流程新建项目，导入sql.jar包（链接放在了文末），编译项目并运行技术名词解释一、特点丰富的组件提供了多种可视化组件，如按钮（JButton）、文本框（JTextField）、标签（JLabel）、下拉列表（JComboBox）等，可以满足不同的界面设计
数据分析-24-时间序列预测之基于keras的VMD-LSTM和VMD-CNN-LSTM预测风速皮皮冰燃数据分析数据分析
文章目录1普通的LSTM模型1.1数据重采样1.2数据标准化1.3切分窗口1.4划分数据集1.5建立模型1.6预测效果2VMD-LSTM模型2.1VMD分解时间序列2.2对每一个IMF建立LSTM模型2.2.1IMF1—LSTM2.2.2IMF2-LSTM2.2.3统一代码2.3评估效果3CNN-LSTM模型3.1数据预处理3.2建立模型3.3效果预测4VMD-CNN-LSTM模型4.1VMD分解
互联网 Java 工程师面试题（Java 面试题四）苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
下面列出这份Java面试问题列表包含的主题多线程，并发及线程基础数据类型转换的基本原则垃圾回收（GC）Java集合框架数组字符串GOF设计模式SOLID抽象类与接口Java基础，如equals和hashcode泛型与枚举JavaIO与NIO常用网络协议Java中的数据结构和算法正则表达式JVM底层Java最佳实JDBCDate,Time与CalendarJava处理XMLJUnit编程现在是时候给
【NLP5-RNN模型、LSTM模型和GRU模型】一蓑烟雨紫洛 nlp rnn lstm gru nlp
RNN模型、LSTM模型和GRU模型1、什么是RNN模型RNN（RecurrentNeuralNetwork)中文称为循环神经网络，它一般以序列数据为输入，通过网络内部的结构设计有效捕捉序列之间的关系特征，一般也是以序列形式进行输出RNN的循环机制使模型隐层上一时间步产生的结果，能够作为当下时间步输入的一部分（当下时间步的输入除了正常的输入外还包括上一步的隐层输出）对当下时间步的输出产生影响2、R
JAVA相关知识 M_灵均 java jvm 开发语言
JAVA基础知识说一下对象创建的过程？类加载检查：当Java虚拟机（JVM）遇到一个类的new指令时，它首先检查这个类是否已经被加载、链接和初始化。如果没有，JVM会通过类加载器（ClassLoader）加载这个类。分配内存：JVM为新对象分配内存。这个内存分配是在堆（Heap）上进行的，堆是JVM用来存储对象实例的地方。分配内存的大小在类加载时就已经确定，因为类的结构（包括字段和方法）已经确定。
字节跳动面试官亲述：Android开发学会了这些技术，你离大厂不远了 m0_65322636 程序员架构移动开发 android
HTTPSHTTP是超文本传输协议，明文传输；HTTPS使用SSL协议对HTTP传输数据进行了加密HTTP默认80端口；HTTPS默认443端口优点：安全缺点：费时、SSL证书收费，加密能力还是有限的，但是比HTTP强多了2、Java基础&容器&同步&设计模式StringBuilder、StringBuffer、+、String.concat链接字符串：StringBuffer线程安全，Strin
Java基础一十一路客 java 开发语言
哔哩哔哩Java开发工程师面试该如（）何准备？-知乎一.JavaOOP面试题(1)什么是B/S架构?什么是C/S架构Java都有那些开发平台?B/S(Browser/Server)，浏览器/服务器程序C/S(Client/Server)，客户端/服务端，桌面应用程序1、C/S和B/S各有优势，C/S在图形的表现能力上以及运行的速度上肯定是强于B/S模式的，不过缺点就是他需要运行专门的客户端，而且更
Java 学习路线：语言、框架、中间件与数据库高危型 java
Java是一门功能强大、应用广泛的编程语言，适用于企业级应用、Web开发、大数据处理、Android开发等各种场景。这里为大家介绍了一下我认为较为合适的学习路线一、Java基础1.1Java语言基础1.1.1安装JDK和IDE安装JDK：下载JDK：访问Oracle官网，下载最新的JavaDevelopmentKit（JDK）。安装JDK：按照操作系统要求安装JDK并配置环境变量。Windows上
java基础-线程间通信方式问道飞鱼 Java开发技术 java 开发语言
文章目录1.wait()和notify()2.volatile关键字3.Java.util.concurrent包提供的工具类Semaphore（信号量）BlockingQueue（阻塞队列）4.Atomic类在Java中，线程间的通信是非常重要的，尤其是在多线程编程中，它有助于协调线程的行为，确保资源的正确访问和更新。Java提供了多种方式来实现线程间的通信，主要包括以下几种方法：1.wait(
Java并发复习 vd_vd Java并发安全容器 java 开发语言
Java基础1.为什么要使用并发编程？一般我们工作的电脑都有多核，我们创建多个线程，然后操作系统可以将多个线程分配给不同的CPU去执行，每个CPU执行一个线程，这样就提高了CPU使用效率。在网络购物中，我们买了一个东西的同时，需要减库存，生成订单等等这些操作，就可以进行拆分利用多线程的技术完成。面对复杂业务模型，并行程序串行会比程序更适应业务需求，而并发编程更能吻合这种业务拆分。->充分利用多核C
Android 高频面试必问之Java基础 2401_86022611 android 面试 java
常用的JVM调参如下表：|参数|作用描述||—|—||-XX:MetaspaceSize|分配给Metaspace（以字节计）的初始大小。如果不设置的话，默认是20.79M，这个初始大小是触发首次MetaspaceFullGC的阈值，例如-XX:MetaspaceSize=256M||-XX:MaxMetaspaceSize|分配给Metaspace的最大值，超过此值就会触发FullGC，此值默认
Java基础day08ArrayList和继承没有信仰的小白
ArrayList类对象数组数组长度是固定，无动态扩容java.util.ArrayList集合类，更方便image无参构造函数image基本格式,Jdk7之后右侧尖括号可以留空，但是必须保留ArrayListlist=newArrayList<>();成员方法添加元素publicbooleanadd(Ee)获取元素publicEget(intindex)集合中的元素publicintsize()
探索深度学习的奥秘：从理论到实践的奇幻之旅小周不想卷深度学习
目录引言：穿越智能的迷雾一、深度学习的奇幻起源：从感知机到神经网络1.1感知机的启蒙1.2神经网络的诞生与演进1.3深度学习的崛起二、深度学习的核心魔法：神经网络架构2.1前馈神经网络（FeedforwardNeuralNetwork,FNN）2.2卷积神经网络（CNN）2.3循环神经网络（RNN）及其变体（LSTM,GRU）2.4生成对抗网络（GAN）三、深度学习的魔法秘籍：算法与训练3.1损失
java基础系列02--面向对象 addin_gao
java面向对象封装(encapsulation)继承(inheritance)多态(polymorphism)成员变量和局部变量的区别：在类中的位置不同:成员变量：在类中方法外局部变量：在方法定义中或者方法声明上在内存中的位置不同:成员变量：在堆内存(成员变量属于对象,对象进堆内存)局部变量：在栈内存(局部变量属于方法,方法进栈内存)生命周期不同:成员变量：随着对象的创建而存在，随着对象的消失而
关于python版本与TensorFlow安装的版本问题 iiimharrygGc. python tensorflow 开发语言
实测在conda环境下，python3.12的版本无法安装TensorFlow2.14.0（截至2024.5.21）最新版本在python3.7版本下正常安装ps：上述安装均在anacondanavigator软件内安装
Java基础全程学习笔记（二）网路侠客 java 学习笔记开发语言
第06章：面向对象-基础#面向对象内容的三条主线：>类及类的内部成员：属性、方法、构造器;代码块、内部类>面向对象的三大特征：封装性、继承性、多态性>其它关键字的使用：package、import、this、super、static、final、abstract、interface等1.理解：面向过程vs面向对象#简单的语言描述二者的区别>面向过程：以`函数`为组织单位。是一种“`执行者思维`”，
Vue + Django的人脸识别系统 DXSsssss python DRF tensorflow 人脸识别
最近在研究机器学习，刚好最近看了vue+Djangodrf的一些课程，学以致用，做了一个人脸识别系统。项目前端使用Vue框架，用到了elementui组件，写起来真是方便。比之前传统的dtl方便了太多。后端使用了drf，识别知识刚开始打算使用opencv+tensorflow,但是发现吧识别以后的结果返回到浏览器当中时使用opencv比较麻烦（主要是我太菜，想不到比较好的方法），因此最终使用了tf
Awesome TensorFlow weixin_30594001 人工智能移动开发大数据
AwesomeTensorFlowAcuratedlistofawesomeTensorFlowexperiments,libraries,andprojects.Inspiredbyawesome-machine-learning.WhatisTensorFlow?TensorFlowisanopensourcesoftwarelibraryfornumericalcomputationusin
【ShuQiHere】小白也能懂的 TensorFlow 和 PyTorch GPU 配置教程 ShuQiHere tensorflow pytorch 人工智能
【ShuQiHere】在深度学习中，GPU的使用对于加速模型训练至关重要。然而，对于许多刚刚入门的小白来说，如何在TensorFlow和PyTorch中指定使用GPU进行训练可能会感到困惑。在本文中，我将详细介绍如何在这两个主流的深度学习框架中指定使用GPU进行训练，并确保每一个步骤都简单易懂，跟着我的步骤来，你也能轻松上手！1.安装所需库首先，确保你已经安装了TensorFlow或PyTorch
Java基础：什么是多态试着奔跑的菜鸟 java java 开发语言
什么是多态多态是面向对象的三大特性之一（另外两个是封装和继承），指的是同一个方法能执行不同的行为，在代码上的体现是：声明为父类的对象，可以被不同的实现类赋值，其中实现类必须继承或者实现父类接口，然后程序在运行时会执行实现类的方法。//如ArrayList和LinkedList都实现了List接口classArrayListimplementsList{}classLinkedListimpleme
TensorFlow的基本概念以及使用场景张柏慈决策树
TensorFlow是一个机器学习平台，用于构建和训练机器学习模型。它使用图形表示计算任务，其中节点表示数学操作，边表示计算之间的数据流动。TensorFlow的主要特点包括：1.多平台支持：TensorFlow可以运行在多种硬件和操作系统上，包括CPU、GPU和移动设备。2.自动求导：TensorFlow可以自动计算模型参数的梯度，通过优化算法更新参数，以提高模型的准确性。3.分布式计算：Ten
java基础之继承 Absinthe_苦艾酒 java 开发语言
1.一个子类只能有一个直接父类（一个父类可以多个子类）2.private修饰符和void不能继承、不同包不能继承代码如下：父类packagebegan;//定义一个父类publicclassPet01{//属性publicStringname;//方法publicvoidrun(Stringname){System.out.println(name+"running");}}子类packagebe
Java基础 --- 多线程&JUC，以及一些常用的设计模式总结 lzhlizihang java 设计模式
文章目录一、多线程1、线程和进程的区别2、创建多线程的四种方式3、集合中的线程安全二、设计模式1、单例模式2、装饰者模式（IO流缓冲流）3、适配器模式4、模板模式一、多线程1、线程和进程的区别进程是操作系统资源分配的基本单位，而线程是处理器任务调度和执行的基本单位，一个进程可以运行多个线程多进程：操作系统中同时运行的多个程序多线程：在同一个进程中同时运行的多个任务2、创建多线程的四种方式Runna
Java学习路线：从零基础到高级开发者的完整指南何遇mirror java
初学者入门指南1.环境搭建安装JDK:下载并安装最新版本的JDK（JavaDevelopmentKit）。配置环境:设置JAVA_HOME环境变量，并将bin目录添加到PATH中。选择IDE:使用Eclipse、IntelliJIDEA或其他任何你喜欢的Java集成开发环境。2.Java基础知识HelloWorld:编写你的第一个Java程序。基本语法:学习变量、数据类型（原始类型、包装类型）、运
Java 学习路线：适合小白的超细学习路线及实例代码 Dreams°123 后端 java eclipse jvm spring tomcat ide intellij-idea
Java学习路线：适合小白的超细学习路线及实例代码一、入门基础1.1、Java基础语法1.2、面向对象编程(OOP)二、核心Java编程2.1、数据结构和算法基础2.2、输入输出(I/O)三、进阶Java编程3.1、多线程编程3.2、网络编程四、高级应用4.1、数据库编程4.2、Web开发4.3、框架与库五、实践项目与进阶学习（留作业啦）5.1、实践项目5.2、持续学习一、入门基础1.1、Java
基于VGG的猫狗识别卑微小鹿 tensorflow tensorflow
由于猫和狗的数据在这里，所以就做了一下分类的神经网络1、首先进行图像处理：importcsvimportglobimportosimportrandomos.environ['TF_CPP_MIN_LOG_LEVEL']='2'importtensorflowastffromtensorflowimportkerasfromtensorflow.kerasimportlayersimportnum
轻松升级：Ollama + OpenWebUI 安装与配置【AIStarter】 ai_xiaogui AI作画 AI软件人工智能 AI写作 AIStarter
Ollama是一个开源项目，用于构建和训练大规模语言模型，而OpenWebUI则提供了一个方便的前端界面来管理和监控这些模型。本文将指导你如何更新这两个工具，并顺利完成配置。准备工作确保你的系统已安装Git和Python环境。安装必要的依赖库，如TensorFlow或PyTorch等。更新步骤克隆项目：使用Git命令行工具克隆最新的Ollama和OpenWebUI仓库到本地。更新代码：确保你正在使
深度学习之基于Tensorflow卷积神经网络水果蔬菜分类识别系统 qq1744828575 python python plotly
欢迎大家点赞、收藏、关注、评论啦，由于篇幅有限，只展示了部分核心代码。文章目录一项目简介二、功能三、系统四.总结一项目简介一、项目背景与目标背景：在现代农业、智能零售等领域，自动化分类与识别技术对于提高效率、优化供应链管理具有重要意义。为了响应这一需求，本项目旨在构建一个基于深度学习技术的水果蔬菜分类识别系统。目标：构建一个准确率高、性能稳定的水果蔬菜分类识别模型，利用Tensorflow框架
Java基础：单例模式，Spring源码中有哪些单例模式生活诙谐号 Java基础 Spring源码设计模式单例模式 java spring
单例模式是一种常用的软件设计模式，其目的是确保一个类仅有一个实例，并提供一个全局访问点来获取这个唯一实例。在Java中，实现单例模式通常需要遵循以下几个关键原则：私有化构造器：将类的构造器声明为private，以防止外部代码通过new操作符直接创建该类的实例。静态工厂方法：提供一个静态方法（通常称为getInstance()），用于获取单例对象。这个方法负责检查是否已经创建过实例，如果尚未创建，则
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam