Snail_Walker

RNN, LSTM详解以及浅尝试

RNN
LSTM
Example

RNN也就是循环神经网络，这个东西有着非常多的用途，尤其是在对于时间序列方面，可变长序列到序列或者说是在上下文模型中有着非常广泛的应用。现在论文中说到RNN，基本上说的就是LSTM，但是最近又有了GRU，用了比LSTM更少的gate，更少的参数，可以达到类似的效果。这篇博客主要是介绍RNN，LSTM的原理，以及举了一个程序的例子来说明如何用TF实现LSTM【1】。

RNN

对于DNN我们都很熟悉了，就是输入feature全链接到下一层的神经元，通过一个linear regression加到神经元，然后神经元上有一个激活函数，（一般来说，使用Sigmod函数做RNN的激活函数，使用ReLU会产生指数爆炸的问题，不过有一篇论文用ReLU训练RNN，居然比LSTM效果还好。CNN用的是ReLU，maxout，各种变形）然后输出的feature按照同样的方法堆几层，最后一个softmax输出结果。我们会发现DNN是insatnce的，他只考虑当前的状态，是一种MDP。所以它没有考虑之前的状态，但是在具体应用的时候，我们会发现在处理有些任务的时候，具有memory的网络才能够解决问题。比如我们进行视频行为分析，一个人的手停在半空中，你说他的手是要往上还是往下呢。只有结合之前的视频才能够更有效做出判断。所以我们给神经网络以记忆。这里还有一个特别有意思的视频，几分钟，但是把RNN和LSTM介绍得非常清楚，例子举的是关于吃饭的【3】，这个人的视频强推，真是不愧为MIT的phd，讲得特别清楚。

所以在RNN中就把前一个输出的hinding layer或者是output保存起来，然后在下一个有输入的时候，把保存的值输入进来。如下图所示：所以呢上一次的输出或者hinding layer就会影响下一个的输出，同时会更新存储的值【4】。

当然，这个RNN可以有多个隐层，如下图：不要看它是有这么多，其实它就是一个网络，表示的是不同的时刻。我们想想CPU的流水线，每过一个时刻，各个寄存器的状态就会更新，这里的寄存器就是memory，蓝色的箭头。

RNN的网络结构还有下图，其实总结起来就是要保存memory，但是这里的RNN一般会保存上一个状态的memory，通俗来说就是它只有上一个时刻的记忆。

这里的双向的RNN，训练的时候，比如训练一个sentence auto-encoder，下面的训练的输入时正向的，上面的输入正好和下面的sentence顺序相反，为什么要这么训练呢？我觉得这样的话就使得这个RNN有了prediction的功能。

其实熟悉DNN的话，其实就是在DNN的基础上加入了memory这个东西，同时把memory作为input。但是在training的时候就有了不少技巧。

RNN在训练的时候，会有gradient vanishing和gradient explode的情况。一个是指数爆炸，一个是后向传递的时候参数接近于0，权值没有被更新。使用LSTM可以解决gradient vanishing的问题，因为memory和input操作都是加法。【7】【8】在RNN的作者训练RNN的时候，增加了一个叫做Clipping的操作，将梯度限制在一定的范围内，不让它超过一定的范围。

LSTM

LSTM的图我们经常可以看到下图，基本上一脸懵逼，这是什么gui【5】【6】。

这里我们先来把整个框架画出来：在输入的地方有一个input gate，来判断输入是否有效。gate打开输入才会进入memory cell。在与memory gate相连的有一个Forget gate，这里的作用是是否把memory置为0，置为0就是Forget了。然后有一个输出Gate，是否对外进行输出。这些gate的开关都是由神经网络决定的（其实就是由输入的feature进行了一个linear regression，再输入到Gate function，某种激活函数，Sigmoid）。

下图中对memory cell进行了详细的解释： zi , z , zf , zo 是四个gate，由input feature经过linear regression得到。输入的z通过activation function之后变成了g(z)，然后这个g(z)和f(zi)相乘送进了memory cell，得到新的memory：这里面的c就是memory，f(zf)如果是0，那么Forget Gate启动，memory被清空。否则就保留memory。输出的a受到output gate的控制。

其实通过对比就会发现，LSTM和CNN很像，因为每个gate的input feature也是从最原始的输入通过linear regression这种线性变化来的。

当然实际在计算的时候输入的不仅仅是有input feature，还有memory，还有memory的输出。

Example

目前RNN有什么用处呢？

sentiment anlysis：输入一个序列，输出的是情感，比如对某部电影的评价。
speech recognition：输入原始的声音信号，输出的是识别的文字。声音被分成了多个片段，然后每个片段对应一个字，其中有一个null的字，表示什么都没有。
machine translation：进行机器翻译，首先是输入sequence，然后输入结束后输出，有终止符表示停止了。
syntactic parsing：对一句话进行语法组织。
sequence-to-sequence Auto-Encoder：输入一句话，然后进行encode，再decoder，把整句话恢复回来。用这样的方法，可以获取它的sequence feature，接着可以用来做匹配。如果是声音，就可以进行声音的匹配，不过这里匹配出来的是语义上的联系。用这个方法就可以从语料库里面选出语义类似的片段，进行可以得出文本。这里面可以看到有两个部分，一个部分是LSTM Encoder，一个是LSTM的Decoder，使用Encoder输入input sequence，LSTM的Decoder就是输出回答，那么就是所谓的问答系统。非常神奇~
image caption generation：输入图片，输出描述的话。
Attention-based model：（Neural Turing Machine）会把各种资源表示成feature vector存储在memory之中。然后会训练一个RNN从memory中选择合适的项目，然后整合输出。
Reading Comprehension：给题目，然后一堆选项，需要找到合适的选项，这些都是可以用LSTM进行训练。
Visual Question Answering：比如给你一副图片，然后提问题，这个人穿什么颜色的衣服？然后会回答：xxx
speech Question Answering：比如托福的听力材料。

Attention Model：以前的冯诺依曼机架构在人工智能领域已经是下面的model。

这里有个example：还有一个example看【9】，代码在这里【10】
以【2】为例子，这个要做的就是：首先进行数据预处理，把每个词进行word2vec，或者就叫做word embedding，每个输入的embedding layer通过LSTM之后就会获得整个句子的feature vector，通过一个DNN就可以得到最后对这句话是Negative或者Positive的一个分析。还有一种Vector h表示方法就是bag of words，把文本每个词进行切割，得到每个词的个数，得到一句话的vector。

在数据中还有没有标记的数据，可以使用EM算法，KNN等等进行标记。这里提供的是使用已经标记好的数据训练的模型对未标记的数据进行标记。

首先创建一个utils目录，理由有一个util.py。对数据进行预处理，构建vocabulary等等。

import os
import tensorflow as tf
import numpy as np
from keras.preprocessing.text import Tokenizer
from keras.preprocessing.sequence import pad_sequences
from keras.utils import to_categorical
import _pickle as pk

# calss to address the data.
class DataManager:
    def __init__(self):
        self.data = {}

    def add_data(self,name,data_path,with_label=True):
        print('read data from %s ...' % data_path)
        X, Y = [], []
        with open(data_path, 'r') as f:
            for line in f:
                if with_label:
                    lines = line.strip().split(' +++$+++ ')
                    X.append(lines[1])
                    Y.append(int(lines[0]))
                else:
                    X.append(line)  
        if with_label:
            self.data[name] = [X,Y]
        else:
            self.data[name] = [X]

    def tokenize(self, vocab_size):
        print('Create new tokenizer')
        self.tokenizer = Tokenizer(num_words=vocab_size)
        for key in self.data:
            print('Tokenizing %s' %key)
            texts = self.data[key][0]
            self.tokenizer.fit_on_texts(texts)

    def save_tokenizer(self, path):
        print('Save tokenizer to %s' % path)
        pk.dump(self.tokenizer, open(path, 'wb'))

    def load_tokenizer(self, path):
        print('Load tokenizer from %s' % path)
        self.tokenizer = pk.load(open(path, 'rb'))          

    def to_sequence(self, maxlen):
        self.maxlen = maxlen
        for key in self.data:
            print('Converting %s to sequence ' % key)
            tmp = self.tokenizer.texts_to_sequences(self.data[key][0])
            self.data[key][0] = np.array(pad_sequences(tmp, maxlen=maxlen))     

    def to_bow(self):
        for key in self.data:
            print ('Converting %s to tfidf'%key)
            self.data[key][0] = self.tokenizer.texts_to_matrix(self.data[key][0],mode='count')

    # Convert label to category type, call this function if use categorical loss
    def to_category(self):
        for key in self.data:
            if len(self.data[key]) == 2:
                self.data[key][1] = np.array(to_categorical(self.data[key][1]))                                 


    def get_semi_data(self,name,label,threshold,loss_function) : 
        # if th==0.3, will pick label>0.7 and label<0.3
        label = np.squeeze(label)
        index = (label>1-threshold) + (label0]
        semi_Y = np.greater(label, 0.5).astype(np.int32)
        if loss_function=='binary_crossentropy':
            return semi_X[index,:], semi_Y[index]
        elif loss_function=='categorical_crossentropy':
            return semi_X[index,:], to_categorical(semi_Y[index])
        else :
            raise Exception('Unknown loss function : %s'%loss_function)

    def get_data(self,name):
        return self.data[name]

    # split data to two part by a specified ratio
    #  name  : string, same as add_data
    #  ratio : float, ratio to split
    def split_data(self, name, ratio):
        data = self.data[name]
        X = data[0]
        Y = data[1]
        data_size = len(X)
        val_size = int(data_size * ratio)
        return (X[val_size:],Y[val_size:]),(X[:val_size],Y[:val_size])

主函数叫做main.py，实现如下：

import sys, argparse, os
import keras
import _pickle as pk
import readline
import numpy as np

from keras import regularizers
from keras.models import Model
from keras.layers import Input, GRU, LSTM, Dense, Dropout, Bidirectional
from keras.layers.embeddings import Embedding
from keras.optimizers import Adam
from keras.callbacks import EarlyStopping, ModelCheckpoint

import keras.backend.tensorflow_backend as K
import tensorflow as tf
from utils.util import DataManager

parser = argparse.ArgumentParser(description='Sentiment classification')
parser.add_argument('model')
parser.add_argument('action', choices=['train','test','semi'])

# training argument
parser.add_argument('--batch_size', default=128, type=float)
parser.add_argument('--nb_epoch', default=20, type=int)
parser.add_argument('--val_ratio', default=0.1, type=float)
parser.add_argument('--gpu_fraction', default=0.3, type=float)
parser.add_argument('--vocab_size', default=20000, type=int)
parser.add_argument('--max_length', default=40,type=int)

# model parameter
parser.add_argument('--loss_function', default='binary_crossentropy')
parser.add_argument('--cell', default='LSTM', choices=['LSTM','GRU'])
parser.add_argument('-emb_dim', '--embedding_dim', default=128, type=int)
parser.add_argument('-hid_siz', '--hidden_size', default=512, type=int)
parser.add_argument('--dropout_rate', default=0.3, type=float)
parser.add_argument('-lr','--learning_rate', default=0.001,type=float)
parser.add_argument('--threshold', default=0.1,type=float)

# output path for your prediction
parser.add_argument('--result_path', default='result.csv',)

# put model in the same directory
parser.add_argument('--load_model', default = None)
parser.add_argument('--save_dir', default = 'model/')
args = parser.parse_args()

train_path = 'data/training_label.txt'
test_path = 'data/testing_data.txt'
semi_path = 'data/training_nolabel.txt'

def simpleRNN(args):
    inputs = Input(shape=(args.max_length,))

    # Embedding layer
    embedding_inputs = Embedding(args.vocab_size, 
                                 args.embedding_dim, 
                                 trainable=True)(inputs)
    # RNN 
    return_sequence = False
    dropout_rate = args.dropout_rate
    if args.cell == 'GRU':
        RNN_cell = GRU(args.hidden_size, 
                       return_sequences=return_sequence, 
                       dropout=dropout_rate)
    elif args.cell == 'LSTM':
        RNN_cell = LSTM(args.hidden_size, 
                        return_sequences=return_sequence, 
                        dropout=dropout_rate)

    RNN_output = RNN_cell(embedding_inputs)

    # DNN layer
    outputs = Dense(args.hidden_size//2, 
                    activation='relu',
                    kernel_regularizer=regularizers.l2(0.1))(RNN_output)
    outputs = Dropout(dropout_rate)(outputs)
    outputs = Dense(1, activation='sigmoid')(outputs)

    model =  Model(inputs=inputs,outputs=outputs)

    # optimizer
    adam = Adam()
    print ('compile model...')

    # compile model
    model.compile( loss=args.loss_function, optimizer=adam, metrics=[ 'accuracy',])

    return model

def main():
    # limit gpu memory usage
    def get_session(gpu_fraction):
        gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=gpu_fraction)
        return tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))  
    K.set_session(get_session(args.gpu_fraction))

    save_path = os.path.join(args.save_dir,args.model)
    if args.load_model is not None:
        load_path = os.path.join(args.save_dir,args.load_model)

    ### process data###
    #####read data#####
    dm = DataManager()
    print ('Loading data...')
    if args.action == 'train':
        dm.add_data('train_data', train_path, True)
    elif args.action == 'semi':
        dm.add_data('train_data', train_path, True)
        dm.add_data('semi_data', semi_path, False)
    else:
        raise Exception ('Implement your testing parser')

    # prepare tokenizer
    print ('get Tokenizer...')
    if args.load_model is not None:
        # read exist tokenizer
        dm.load_tokenizer(os.path.join(load_path,'token.pk'))
    else:
        # create tokenizer on new data
        dm.tokenize(args.vocab_size)

    if not os.path.isdir(save_path):
        os.makedirs(save_path)
    if not os.path.exists(os.path.join(save_path,'token.pk')):
        dm.save_tokenizer(os.path.join(save_path,'token.pk')) 

    # convert to sequences
    dm.to_sequence(args.max_length)

        # initial model
    print ('initial model...')
    model = simpleRNN(args)    
    print (model.summary())

    if args.load_model is not None:
        if args.action == 'train':
            print ('Warning : load a exist model and keep training')
        path = os.path.join(load_path,'model.h5')
        if os.path.exists(path):
            print ('load model from %s' % path)
            model.load_weights(path)
        else:
            raise ValueError("Can't find the file %s" %path)
    elif args.action == 'test':
        print ('Warning : testing without loading any model')
    # training
    if args.action == 'train':
        (X,Y),(X_val,Y_val) = dm.split_data('train_data', args.val_ratio)
        earlystopping = EarlyStopping(monitor='val_acc', patience = 3, verbose=1, mode='max')

        save_path = os.path.join(save_path,'model.h5')
        checkpoint = ModelCheckpoint(filepath=save_path, 
                                     verbose=1,
                                     save_best_only=True,
                                     save_weights_only=True,
                                     monitor='val_acc',
                                     mode='max' )
        history = model.fit(X, Y, 
                            validation_data=(X_val, Y_val),
                            epochs=args.nb_epoch, 
                            batch_size=args.batch_size,
                            callbacks=[checkpoint, earlystopping] )
    # testing
    elif args.action == 'test' :
        raise Exception ('Implement your testing function')
    # semi-supervised training
    elif args.action == 'semi':
        (X,Y),(X_val,Y_val) = dm.split_data('train_data', args.val_ratio)

        [semi_all_X] = dm.get_data('semi_data')
        earlystopping = EarlyStopping(monitor='val_acc', patience = 3, verbose=1, mode='max')

        save_path = os.path.join(save_path,'model.h5')
        checkpoint = ModelCheckpoint(filepath=save_path, 
                                     verbose=1,
                                     save_best_only=True,
                                     save_weights_only=True,
                                     monitor='val_acc',
                                     mode='max' )
        # repeat 10 times
        for i in range(10):
            # label the semi-data
            semi_pred = model.predict(semi_all_X, batch_size=1024, verbose=True)
            semi_X, semi_Y = dm.get_semi_data('semi_data', semi_pred, args.threshold, args.loss_function)
            semi_X = np.concatenate((semi_X, X))
            semi_Y = np.concatenate((semi_Y, Y))
            print ('-- iteration %d  semi_data size: %d' %(i+1,len(semi_X)))
            # train
            history = model.fit(semi_X, semi_Y, 
                                validation_data=(X_val, Y_val),
                                epochs=2, 
                                batch_size=args.batch_size,
                                callbacks=[checkpoint, earlystopping] )

            if os.path.exists(save_path):
                print ('load model from %s' % save_path)
                model.load_weights(save_path)
            else:
                raise ValueError("Can't find the file %s" %path)

if __name__ == '__main__':
        main()

如果是训练模型，那就是：

python main.py train –cell LSTM

如果加入semi-supervised learning，那就是：

python main.py semi –load_model

转载请注明出处： http://blog.csdn.net/c602273091/article/details/78940207

Ref Links：
【1】CMU 10707： https://www.cs.cmu.edu/~rsalakhu/10707/
【2】kaggle 比赛： https://www.kaggle.com/c/ml-2017fall-hw4/data
【3】RNN，LSTM： https://www.youtube.com/watch?v=WCUNPb-5EYI
【4】RNN，LSTM：http://speech.ee.ntu.edu.tw/~tlkagk/courses/ML_2016/Lecture/RNN%20(v2).pdf
【5】极好的博客： http://colah.github.io/posts/2015-08-Understanding-LSTMs/
【6】对LSTM的解释： https://deeplearning4j.org/lstm.html
【7】Gradient vanishing： http://www.wildml.com/2015/10/recurrent-neural-networks-tutorial-part-3-backpropagation-through-time-and-vanishing-gradients/
【8】Gradient Exploding： https://www.quora.com/How-does-LSTM-help-prevent-the-vanishing-and-exploding-gradient-problem-in-a-recurrent-neural-network
【9】MNIST RNN： https://www.youtube.com/watch?v=IASyrQamTQk
【10】RNN Code： https://github.com/MorvanZhou/tutorials/tree/master/tensorflowTUT/tf20_RNN2

Java——列表（List）不会Hello World的小苗 Java java list python
概述在Java中，列表（List）是一种有序的集合，它允许元素重复，并且每个元素都有一个对应的索引值。Java提供了List接口及其实现类，用于表示和操作列表数据。常用的实现类包括ArrayList、LinkedList和Vector。1、List接口概述List是Java集合框架中的一种接口，继承自Collection接口。它定义了许多常见的操作，如：添加元素：add(Ee)、add(intin
34、深度学习-自学之路-深入理解-NLP自然语言处理-RNN一个简单的程序，可以从程序中理解RNN的基本思想。小宇爱深度学习-自学之路深度学习自然语言处理 rnn
importsys,random,mathfromcollectionsimportCounterimportnumpyasnpf=open('tasks_1-20_v1/en/qa1_single-supporting-fact_train.txt','r')raw=f.readlines()f.close()tokens=list()forlineinraw[0:1000]:tokens.ap
最新版AndroidStudio踩坑(新建项目无法正常运行) 沙漠蓝色披头 android studio
2023.7.20日雨今天花了六个小时才搞定新版AS创建app应用并可以运行，所以记录一下as版本是：AndroidStudioFlamingo|2022.2.1Patch2新建一个app应用，结果gradle一直下载不下来，提示connectrefuse，如果你配置了代理，建议设置为无代理同时要记得把.gradle/gradle.properties里面相关的代理设置给清除了，如果设置了代理的话
C++(23)：lambda可以省略() 风静如云 C/C++c++
C++越来越多的使用了lambda，C++23也进一步的放宽了对lambda的限制，这一次，如果lambda没有参数列表，那么可以直接省略掉()：#includeusingnamespacestd;voidfunc(){autof=[]{cout<<"inf"<<endl;};f();}intmain(){func();return0;}允许程序输出：inf
chatgpt pro是什么？和chatgpt plus有什么区别？如何升级chatgpt pro? chatgpt
chatgptpro是什么？chatGPTPro是openAI推出的目前最高级别的付费订阅服务，一个月200美元.这对于一般用户来说是一个比较昂贵的费用。chatgptpro和chatgptplus有什么区别？chatGPTPlus官网原文：EverythinginFreeExtendedlimitsonmessaging,fileuploads,advanceddataanalysis,andi
Android Gradle使用总结 Wei_Leng Android studio android gradle 脚本
其他Groovy入门学习http://blog.csdn.net/zhaoyanjun6/article/details/70313790AndroidGradleAndroid项目使用Gradle作为构建框架，Gradle又是以Groovy为脚本语言。所以学习Gradle之前需要先熟悉Groovy脚本语言。Groovy是基于Java语言的脚本语言，所以它的语法和Java非常相似，但是具有比jav
机器学习·文本数据读写处理 AAA顶置摸鱼 python 深度学习机器学习人工智能数据处理
前言在自然语言处理的第一步，需要面对的是各种各样以不同形式表现的文本数据，比如，txt、Excel中的表格数据，还有无法直接打开的pkl文件等。针对这些不同类型的数据，可以基于Python中的基本功能函数或者调用某些库进行读写以及作一些基本的处理。一、文本数据读写方法1.读写TXT文件读取方法：read()：读取整个文件，返回字符串。readline()：逐行读取，返回字符串。readlines(
Failed to initialize editor Mac Zhu android
今天遇到很奇葩的问题layout文件不能预览花了很长的时间处理，就是各种AndroidStudio相关的缓存文件的处理1.Invalidateandrestart2.删除Administrator下面的.android和.gradle3.删除Administrator\AppData\Local\Google\AndroidStudio2024.2目录4.重装AS5.升级降低AGPVersion和
关于AndroidStudio中Gradle文件引发的问题导致HelloWorld无法运行的解决方法 ZSH月下独饮 Android学习 android studio 安卓 android kotlin
关于AndroidStudio中Gradle文件引发的问题导致HelloWorld无法运行的解决方法前言AndroidStudio下载安装教程（超级详细）官网下载点击启动安装配置文件HelloWorld无法运行问题1：Unabletolocateadb问题2：运行按钮灰色问题3：小锤子不能用解决方法感想在下的绵薄之力如果您已安装好AndroidStudio,并且创建好了HelloWorld项目和虚
mid-360|环境配置及传感器特定方向点云数据提取 yangjh542426 px4 ros ubuntu ubuntu 无人机
本文将使用mid360实现简单的识别前方有障碍物时无人机悬停功能环境配置新建文件夹用于存储SDK以及ROS包gitclonehttps://github.com/Livox-SDK/Livox-SDK2.gitcdLivox-SDK2mkdirbuildcdbuildcmake..makesudomakeinstall完成sdk的安装根目录下gitclonehttps://github.com/L
Excel导入导出（注解）静谧空间 excel java 开发语言
1、Excel适配器publicinterfaceExcelHandlerAdapter{/***格式化**@paramvalue单元格数据值*@paramargsexcel注解args参数组**@return处理后的值*/Objectformat(Objectvalue,String[]args);}2、自定义注解packagecom.zz.common.annotation;importjav
vue中nextTick函数和react类似实现向画 vue.js react.js 前端
Vue3基本用法：import{nextTick}from'vue';//全局调用nextTick(()=>{//在下一个DOM更新循环后执行的代码});//在组件内部调用setup(){asyncfunctionhandleUpdate(){//修改数据...awaitnextTick();//在数据引发的DOM更新完成后执行的代码}}nextTick函数现在作为vue包的一个导出成员，需要显式
江科大51单片机学习笔记（1）悠闲漫步者 51单片机 51单片机学习笔记
点亮一个LEDLED介绍中文名：发光二极管外文名：LightEmittingDiode简称：LED用途：照明、广告灯、指引灯、屏幕。如果想让LED发光，需要让发光二极管两端产生电位差。LED模块中串并联电阻是为了保护电路（限流）电阻的运算(上图电阻中所标注)：102(1010^2=1000=1K)473(4710^3=47000=47K)1001(100*10^1=1000=1K)VCC：电源正极
通过nginx对arcgispro生成的矢量瓦片发布并调用（干货）蓝布城发动机 nginx arcgis
一、矢量瓦片的制作与发布试验采用国土调查的土地利用现状的数据，制作的矢量瓦片的流程如图所示：图1矢量瓦片数据生产流程数据生产分为两个步骤：1、数据配图先在ArcMap软件中建立好工程并配图，土地利用现状的配图样式按照《规程》设计的土地利用符号保存为style文件，在ArcMap加载土地利用数据后，通过数据中DLBM字段与符号库做样式匹配，并保存为MXD格式工程。打开ArcgisPro新建工程，导入
拔河 24蓝桥省b 亿秒签到算法
#includeusingnamespacestd;#defineintlonglong#defineendl'\n'signedmain(){ios::sync_with_stdio(0);cin.tie(0);cout.tie(0);intn;cin>>n;vectora(n+1);multisets;for(inti=1;i>a[i],a[i]=a[i-1]+a[i];for(inti=1;
STM32启动文件.s解析贾saisai 嵌入式STM32及操作系统 stm32 单片机
文章目录基本介绍实践详解栈空间开辟堆空间的开辟中断向量表定义复位程序对于_main函数的分析中断服务程序用户堆栈初始化系统启动流程基本介绍启动文件由汇编编写，是系统上电复位后第一个执行的程序。启动文件主要做了以下工作：1、初始化堆栈指针SP=_initial_sp2、初始化程序计数器指针PC=Reset_Handler3、设置堆和栈的大小4、初始化中断向量表5、配置外部SRAM作为数据存储器（可选
Autojs: 使用 SQLite xxxxxue 自动化工具 sqlite 数据库 autojs autox
例子letdb=newSQLiteUtil("/sdcard/A_My_DB/sqlite.db");db.fastCreateTable("user_table",{name:"",online:false,},["name"]//设置name为唯一,重复项不会添加成功);//新增数据的IDletrow_id=db.insert("user_table",{name:"小明5",online:t
CS4386 AI Game Programming 后端
CS4386AIGameProgramming(SemesterB,2024-2025)Assignment1:TrapGomokuSetbyCS4386TATeamTournament1Deadline:Friday28February202523:59Tournament2Deadline:Wednesday12March202523:59Thisassignmentisworth15%(fi
GSND 5345Q, Fundamentals of Data Science 后端
Homework4GSND5345Q,FundamentalsofDataScienceDueWednesday,February19th,2025Nowitstimetopracticewhatwehavelearnedinclassandlearnevenmore!NotethatfromnowonyourhomeworkshouldbewritteninRMarkdown.Turninyou
HarmonyOS NEXT开发：通过线性容器实现数组指导「已注销」鸿蒙开发 HarmonyOS OpenHarmony 开发语言前端服务器 harmonyos 华为鸿蒙鸿蒙系统
线性容器实现能按顺序访问的数据结构，其底层主要通过数组实现，包括ArrayList、Vector、List、LinkedList、Deque、Queue、Stack七种。线性容器，充分考虑了数据访问的速度，运行时（Runtime）通过一条字节码指令就可以完成增、删、改、查等操作。ArrayListArrayList即动态数组，可用来构造全局的数组对象。当需要频繁读取集合中的元素时，推荐使用Arra
MONAI 1.4新版本发布，抢先体验MAISI扩散模型以及VISTA交互式分割模型 Tina姐 Monai 人工智能
MONAI1.4新版本发布，抢先体验MAISI扩散模型以及VISTA交互式分割模型上周，MONAI发布了备受期待的1.4版本，这是时隔一年的重大更新。新版本带来了一系列令人兴奋的新功能和改进，让我们一起来看看：MAISI：这是一个最先进的3D潜在扩散模型（3DLatentDiffusionModel），专为生成高质量的合成CT图像而设计，无论是否带有解剖标注。MAISI在数据增强和创建逼真的医学成
从零到入门：人工智能学习路径全解析这题有点难度人工智能学习
一、打破迷雾：重新认识人工智能人工智能（AI）早已不再是科幻电影中的专属概念，而是渗透到我们生活的方方面面。从手机里的语音助手到电商平台的推荐系统，从自动驾驶到医疗影像分析，AI技术正在重塑人类社会的运行方式。对于初学者而言，建立正确的认知框架至关重要：1.技术图谱解析：机器学习（ML）：AI的核心驱动力，使计算机具备从数据中学习的能力深度学习（DL）：基于神经网络的进阶技术，擅长处理图像、语音等
如何让C++程序自动生成dump文件？以及如何分析dump文件？ dvlinker C/C++实战专栏 C/C++软件开发从入门到实战 c++生成dump文件 windbg 分析dump文件
目录1、API函数SetUnhandledExceptionFilter介绍2、调用SetUnhandledExceptionFilter设置异常处理函数3、调用MiniDumpWriteDump函数导出包含异常上下文的dump文件4、dump文件的多种生成方式5、使用Windbg分析dump文件6、最后C++软件异常排查从入门到精通系列教程（专栏文章列表，欢迎订阅，持续更新...）https:/
AWS Lambda参考架构：MapReduce实现指南郜逊炳
AWSLambda参考架构：MapReduce实现指南lambda-refarch-mapreduceThisrepopresentsareferencearchitectureforrunningserverlessMapReducejobs.ThishasbeenimplementedusingAWSLambdaandAmazonS3.项目地址:https://gitcode.com/gh_m
mount.nfs: Stale file handle infiniteWei linux
错误信息“mount.nfs:Stalefilehandle”通常表示NFS客户端用于访问NFS服务器上的文件或目录的文件句柄已失效。这可能是由于服务器上的更改（例如，文件或目录被删除或重新挂载文件系统）没有在客户端上反映出来导致的。以下是一些排查和解决此问题的步骤：解决“StaleFileHandle”错误的步骤：重新挂载NFS文件系统:卸载NFS文件系统，然后重新挂载。sudoumount/p
Linux安装MySQL 小小程序员.¥ MySQL数据库 linux mysql 运维
1.下载MySQL安装包2.在Linux创建Linuxmysql文件夹，并解压mkdirlinuxmysqltar-xvfmysql-8.0.26-1.el7.x86_64.rpm-bundle.tar-Clinuxmysql大C是安装到指定目录3.切换到linuxmysql目录按顺序解压cdlinuxmysqlrpmivhmysql-community-common-8.0.26-1.e17.x
16、《SpringBoot+MyBatis集成（4） - 性能优化 - 事务与缓存机制剖析》 wolf犭良 SpringBoot spring boot mybatis 性能优化
SpringBoot+MyBatis集成-深度解析事务机制与缓存性能优化实践一、架构整合核心原理剖析1.1事务控制底层实现SpringBoot通过@EnableTransactionManagement激活声明式事务管理，其核心在于DataSourceTransactionManager与MyBatis的整合。当使用@Transactional注解时：通过AOP代理创建事务边界使用ThreadLo
AGP 8.0 适配 - 问题列表 zhuzhumouse gradle android-studio android
不管是基于编译速度，包体积，新特性等那个方面的考虑，大家都应该开始AGP8.0的适配了，下面使我适配过程中遇到的各种问题，这里列出来，给大家的适配做一个参考。问题一：编译失败@TaskAction解决方案：在根目录的setting.gradle或者build.gradle里面添加如下代码：classpath'com.android.tools.build:gradle:8.0.0'原因说明：AGP
Android 第四十四章 Menu 漂泊的蚂蚁 Android android
publicclassMainActivityextendsAppCompatActivity{@OverrideprotectedvoidonCreate(BundlesavedInstanceState){super.onCreate(savedInstanceState);setContentView(R.layout.activity_main);}@Overridepublicboole
Android中Handler的post（Runnable）用法莫空0000 Android
privateHandlermhandler=newHandler();privatevoidabc(){newThread(newRunnable(){@Overridepublicvoidrun(){try{/*dosomething*///里面执行的事件是被handler放在主线程中执行的，与Run所在线程无关。//.post方法一般用于更新UImhandler.post(newRunnab
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt

RNN, LSTM详解以及浅尝试

RNN

LSTM

Example

你可能感兴趣的:(RL,&,DL,&,SLAM)