剑之所致，心之所往

基于tensorflow 使用seq2seq+attention+beansearch搭建一个聊天机器人教程（附github源码）

版权声明：博主原创文章，转载请注明来源，谢谢合作！！
https://blog.csdn.net/hl791026701/article/details/84404901

这篇博文主要是介绍基于tensorflow使用google的seq2seq模型来构建一个聊天机器人，主要是学习一下encoder、decoder、attention、bean search等原理和实现方式。
seq2seq是一种很常见的技术。例如，在法语-英语翻译中，预测的当前英语单词不仅取决于所有前面的已翻译的英语单词，还取决于原始的法语输入;另一个例子，对话中当前的response不仅取决于以往的response，还取决于消息的输入。其实，seq2seq最早被用于机器翻译，后来成功扩展到多种自然语言生成任务，如文本摘要和图像标题的生成。本文将介绍几种常见的seq2seq的模型原理，seq2seq的变形以及seq2seq用到的一些小trick。

—、 seq2seq模型简介

seq2seq属于encoder-decoder结构的一种，这里看看常见的encoder-decoder结构，基本思想就是利用两个RNN，一个RNN作为encoder，另一个RNN作为decoder。encoder负责将输入序列压缩成指定长度的向量，这个向量就可以看成是这个序列的语义，这个过程称为编码，如上图，获取语义向量最简单的方式就是直接将最后一个输入的隐状态作为语义向量C。也可以对最后一个隐含状态做一个变换得到语义向量，还可以将输入序列的所有隐含状态做一个变换得到语义变量。而decoder则负责根据语义向量生成指定的序列，这个过程也称为解码，如下图，最简单的方式是将encoder得到的语义变量作为初始状态输入到decoder的rnn中，得到输出序列。可以看到上一时刻的输出会作为当前时刻的输入，而且其中语义向量C只作为初始状态参与运算，后面的运算都与语义向量C无关。
encoder-decoder模型对输入和输出序列的长度没有要求，应用场景也更加广泛。
详情可以参考:seq2seq模型详解

二、数据文本处理

构建模型的第一步是进行语料的获取和处理。
这次我们使用的中文电视剧对白语料 https://github.com/fateleak/dgk_lost_conv。
另外博主还搜集了其它市面上已有的开源中文聊天语料并系统化整理工作

wget https://lvzhe.oss-cn-beijing.aliyuncs.com/dgk_shooter_min.conv.zip

下载预料后要用unzip dgk_shooter_min.conv.zip进行解压。输出dgk_shooter_min.conv
我们可以看下原始语料格式

2. 我们要对语料进行简单的清洗处理，然后根据根据’“ / ”进行split得到一个个字。

for line in tqdm(fp):
        if line.startswith('M '):
            line = line.replace('\n','')
            if '/' in line:
                line = line[2:].split('/')
            else:
                line = list(line[2:])
            line = line[:-1] #

            group.append(list(regular(''.join(line))))
        else:
            lsat_line=None
            if group:
                groups.append(group)
                group=[]

处理完之后我们要自己构造Q、A问答句。从上面语料我们可以看出每段会话由标识符“E”分割，所以我们根据（a1,a2),(a1+a2,a3) ,(a1,a2+a3)这样的组合来构造问答语句：

            #假设 a1,a2,a3,三句话  （a1,a2),(a1+a2,a3) ,(a1,a2+a3)
            if next_line:
                x_data.append(line) 
                y_data.append(next_line)
            if last_line and next_line:
                x_data.append(last_line + make_split(last_line) + line)
                y_data.append(next_line)
            if next_line and next_next_line:
                x_data.append(line)
                y_data.append(next_line + make_split(next_line) + next_next_line)

构建好输入X、Y即输入的问答后，接下来我们要进行序列化处理。

   ws_input = WordSequence()
   ws_input.fit(x_data + y_data)

构建了一个word_sequence类：主要函数的作用分别是创建字典、句子转向量、词向量映射、根据超参定制化训练数据、基础数据标记、初始化词典。
4.1 每个句子特殊处理
（1）在训练过程中，每个batch中句子长度不一样，此时对于短句子用填充
（2）用于句子结尾，告诉decoder停止预测
（3）不在字典中的词用替换
（4） decoder第一个输入,告诉decoder预测开始

def fit(self,sentences,min_count=5,max_count=None,max_features=None):
        """
        Args:
        min_count 最小出现次数
        max_count 最大出现次数
        max_features 最大特征数
        """
        assert not self.fited , 'WordSequence 只能 fit 一次'

        count={}
        for sentence in sentences:
            arr=list(sentence)
            for a in arr:
                if a not in count:
                    count[a]=0
                count[a]+=1  
        
        print(count)

        if min_count is not None:
            count={k : v for k,v in count.items() if v >= min_count}  

        if max_count is not None:
            count={k : v for k,v in count.items() if v<=max_features}

        self.word_dict = {
            WordSequence.PAD_TAG:WordSequence.PAD,
            WordSequence.UNK_TAG:WordSequence.UNK,
            WordSequence.START_TAG:WordSequence.START,
            WordSequence.END_TAG:WordSequence.END

        }
        if isinstance(max_features,int):
            count = sorted(list(count.items()),key=lambda x:x[1]) #对value排序 升序 返回list元组
            if max_features is not None and len(count) > max_features:
                count = count[-int(max_features):]
            for w,_ in count:
                self.word_dict[w] = len(self.word_dict) #构建{word:index}
        else:
            for w in sorted(count.keys()):   #按照key排序，返回keylist
                self.word_dict[w]=len(self.word_dict)  
            
        self.fited=True

        #采用预训练好的部分词向量
        embeddings_index={}
        print("正在加载预训练词向量……")
        with open(self.word_vec_dic, 'rb') as f:
            for line in f:
                values = line.decode('utf-8').split(' ')
                word = values[0]
                embedding=values[1:301]
                embeddings_index[word]=embedding
        print("预训练词向量加载完毕。")
        nb_words = len(self.word_dict)
        self.word_embedding_matrix=np.zeros((nb_words,self.embedding_dim),dtype=np.float32)
        for word,i in self.word_dict.items():
            if word in embeddings_index:
                self.word_embedding_matrix[i] = embeddings_index[word]
            else:
                new_embedding = np.array(np.random.uniform(-1,1,self.embedding_dim))
                embeddings_index[word] = new_embedding
                self.word_embedding_matrix[i] = embeddings_index[word]
        print('词向量映射完成')

以上就是把文本转换成对应的索引，
[‘你’, ‘好’, ‘啊’] ——>[6, 56, 34]
[‘嗯’, ‘你’, ‘好’]——>[67, 6, 56]
最后把输入语料全部fit一遍用转换成对应的索引，pickle.dump进行序列化保存

    ws_input = WordSequence()
    ws_input.fit(x_data + y_data)
    print('dump')
    #序列化保存
    pickle.dump(
        (x_data,y_data),
        open('./data/chatbot.pkl','wb')
    ) 
    pickle.dump(ws_input,open('./data/ws.pkl','wb')) 
    print('done')

三、模型构建

构建seq2seq模型我们大体上按照如下方式进行：

初始化训练，预测所需要的变量
构建编码器(encoder) build_signal_cell -> encoder_cell -> build_encoder
seq2seq ：用seq2seq模型把Encoder 和decoder联系起来
构建解码器(decoder) build_decoder_cell -> build_decoder
构建优化器(optimizer)
保存模型(save)
整体框架：

    def build_model(self):
        """
        1. 初始化训练, 预测所需要的变量
        2. 构建编码器（encoder） build_encoder -> encoder_cell -> build_signal_cell
        3. 构建解码器（decoder） build_decoder -> decoder_cell -> build_signal_cell
        4. 构建优化器（optimizer）
        5. 保存
        """
        self.init_placeholders()
        encoder_outputs, encoder_state = self.build_encoder()
        self.build_decoder(encoder_outputs, encoder_state)
        
        if self.mode == 'train':
            self.init_optimizer()

        self.saver = tf.train.Saver()

初始化主要是设置输入、输出词表大小，其实就是分完字之后整个语料库的大小，因为问答使用相同的语料所以他们的大小是一样的，如果是机器翻译的话大小就不一样了要另做处理。batch_size可以根据你的GPU显存来设置大小博主使用的Tesla P100 16g显存比较壕设置128，如果是10g左右的显存建议64就行了。接下来rnn单元我们选的是LSTM,实际上GRU和LSTM在性能上不分伯仲，GRU参数更好更容易收敛罢了，但在大数据集情况下，LSTM表达性能更好。hidden_units为RNN单元Cell中隐藏神经元的数量，depth为RNN层数，同样神经元个数越多，层数越深，训练时间越长，效果越好，但是同样要注意GPU显存问题。还有一些参数就不一一介绍了，使用的时候我们在细细详谈。

def __init__(self,               #
                input_vocab_size,    #输入词表的大小
                target_vocab_size,   #输出词表的大小
                batch_size=32,       #数据batch的大小
                embedding_size=300,  #输入词表与输出词表embedding的维度
                mode="train",        #取值为train, 代表训练模式, 取值为decide,代表预训练模式
                hidden_units=256,    #Rnn模型的中间层大小,encoder和decoder层相同
                depth=1,             #encoder和decoder的rnn层数
                beam_width=0,        #是beamsearch的超参数,用于解码
                cell_type="lstm",    #rnn的神经元类型, lstm, gru
                dropout=0.2,         #随机丢弃数据的比例,是要0到1之间
                use_dropout=False,   #是否使用dropout
                use_residual=False,  #是否使用residual
                optimizer='adam',    #使用哪一个优化器
                learning_rate=1e-3,  #学习率
                min_learning_rate=1e-5,  #最小学习率
                decay_steps=50000,   #衰减步数
                max_gradient_norm=5.0,  #梯度正则裁剪的系数
                max_decode_step=None,   #最大decode长度, 可以非常大
                attention_type='Bahdanau', #使用attention类型
                bidirectional=False,     #是否使用双向encoder
                time_major=False,       #是否在计算过程中使用时间作为主要的批量数据
                seed=0,               #一些层间的操作的随机数
                parallel_iterations=None,  #并行执行rnn循环的个数
                share_embedding=False,    #是否让encoder和decoder共用一个embedding
                pretrained_embedding=False):  #是不是要使用预训练的embedding
        self.input_vocab_size = input_vocab_size
        self.target_vocab_size = target_vocab_size
        self.batch_size = batch_size
        self.embedding_size = embedding_size
        self.hidden_units = hidden_units
        self.depth = depth
        self.cell_type = cell_type.lower()
        self.use_dropout = use_dropout
        self.use_residual = use_residual
        self.attention_type = attention_type
        self.mode = mode 
        self.optimizer = optimizer
        self.learning_rate = learning_rate
        self.min_learning_rate = min_learning_rate
        self.decay_steps = decay_steps
        self.max_gradient_norm = max_gradient_norm
        self.keep_prob = 1.0 -dropout
        self.seed = seed
        self.pretrained_embedding =  pretrained_embedding
        self.bidirectional = bidirectional

        if isinstance(parallel_iterations, int):
            self.parallel_iterations= parallel_iterations
        else:
            self.parallel_iterations = batch_size
        self.time_major = time_major
        self.share_embedding = share_embedding
        #生成均匀分布的随机数  用于变量初始化
        self.initializer = tf.random_uniform_initializer(
            -0.05, 0.05, dtype=tf.float32
        )
        assert self.cell_type in ('gru', 'lstm'), 'cell_type 应该是GRU 或者是 LSTM'

        if share_embedding:
            assert input_vocab_size == target_vocab_size, '如果share_embedding 为True 那么两个vocab_size 必须一样'
        assert mode in ('train', 'decode'), 'mode 必须是train 或者是decode , 而不是{}'.format(mode)

        assert dropout >=0.0 and dropout< 1.0, 'dropout 必须大于等于0 且小于等于1'

        assert attention_type.lower() in ('bahdanau', 'loung'), 'attention_type 必须是bahdanau 或者是 loung'
           
        assert beam_width < target_vocab_size, 'beam_width {} 应该小于target_vocab_size{}'.format(beam_width,target_vocab_size)

        self.keep_prob_placeholder = tf.placeholder(
            tf.float32,
            shape=[],
            name='keep_prob'
        )
        self.global_step = tf.Variable(
            0, trainable = False, name = 'global_step'
        )

        self.use_beamsearch_decode = False
        self.beam_width = beam_width 
        self.use_beamsearch_decode = True if self.beam_width > 0 else False
        self.max_decode_step = max_decode_step

        assert self.optimizer.lower() in ('adadelta', 'adam', 'rmsprop', 'momentum', 'sgd'), \
            'optimizer 必须是下列之一: adadelta, adam, rmsprop, momentum, sgd '
        self.build_model()

接下来要定义inputs和targets 的tf占位符。

def init_placeholders(self):
        """初始化训练，初始化所需要的变量 """
        self.add_loss = tf.placeholder(
            dtype=tf.float32,
            name='add_loss'
        )
        #编码器的输入
        # 编码器输入，shape=(batch_size, time_step)
        # 有 batch_size 句话，每句话是最大长度为 time_step 的 index 表示
        self.encoder_inputs = tf.placeholder(
            dtype=tf.int32,
            shape=(self.batch_size,None),
            name='encoder_inputs'
        )
        #编码器的长度输入
        # 编码器长度输入，shape=(batch_size, 1)
        # 指的是 batch_size 句话每句话的长度
        self.encoder_inputs_length = tf.placeholder(
            dtype = tf.int32,
            shape=(self.batch_size, ),
            name = 'encoder_inputs_length'
        )
        if self.mode =='train':
            #解码器的输入
            # 解码器输入，shape=(batch_size, time_step)
            # 注意，会默认里面已经在每句结尾包含 
            self.decoder_inputs = tf.placeholder(
                dtype = tf.int32,
                shape=(self.batch_size, None),
                name = 'decoder_inputs'
            )
            #解码器输入的rewards 用于强化学习训练，shape=(batch_size, time_step)
            self.rewards = tf.placeholder(
                dtype = tf.float32,
                shape=(self.batch_size, 1),
                name='rewards'
            ) 
            
            #解码器的长度输入
            self.decoder_inputs_length = tf.placeholder(
                dtype = tf.int32,
                shape=(self.batch_size,),
                name ='decoder_inputs_length'
            )

            self.decoder_start_token = tf.ones(
                shape=(self.batch_size, 1),
                dtype=tf.int32
            ) * WordSequence.START

            #实际训练时解码器的输入, start_token + decoder_inputs
            self.decoder_inputs_train = tf.concat([
                self.decoder_start_token,
                self.decoder_inputs
            ],axis=1)

接下构建encoder。首先要用tf的LSTMCell构建rnn单元，n_hidden来设置LSTM神经元个数，ResidualWrapper残差网络用来解决在深度网络中发生梯度弥散/爆炸，导致无法收敛问题。在tensorflow使用方法和其他的Wrapper都是一样的。把构建好的单个LSTM实例传入到MultiRNNCell类就可以实现多层Deep RNN了。

    def build_signle_cell(self, n_hidden, use_residual):
        """
        构建一个单独的 RNNCell
        n_hidden : 隐藏层的神经元数量
        use_residiual : 是否使用residual wrapper
        """
  
        if self.cell_type == 'gru':
            cell_type = GRUCell  
        else:
            cell_type = LSTMCell
        
        cell = cell_type(n_hidden)
        if self.use_dropout:
            cell = DropoutWrapper(
                cell,
                dtype = tf.float32,
                output_keep_prob = self.keep_prob_placeholder,
                seed = self.seed
            )

        if use_residual:
            cell = ResidualWrapper(cell)
        return cell
    def build_encoder_cell(self):
        """构建单独的编码器 """
        # 通过MultiRNNCells类来实现Deep RNN
        return MultiRNNCell([
            self.build_signle_cell(self.hidden_units, use_residual=self.use_residual) for _ in range(self.depth)
        ])

至此开始搭建真正的encoder_cell已经弄好了。首先用tf.nn.embedding_lookup来对输入做一个embedding当做encoder的输入。其中它的shape为batch_size, time_step, embedding_size]，time_step是batch_size中每一句话的长度，embedding_size是词向量维度。
bidirectional_dynamic_rnn是双向动态RNN。
双向RNNs模型是RNN的扩展模型，RNN模型在处理序列模型的学习上主要是依靠上文的信息，双向RNNs模型认为模型的输出不仅仅依靠序列前面的元素，后面的元素对输出也有影响。比如说，想要预测序列中的一个缺失值，我们不仅仅要考虑该缺失值前面的元素，而且要考虑他后面的元素。
简单点来将两个RNN堆叠在一起，分别从两个方向计算序列的output和state，而最终的输出则根据两个RNNs的隐藏状态计算。值得注意的是：向后和向前隐含层之间没有信息流，是独立计算的，只是最后输出的时候把二者的状态向量结合起来，这保证了展开图是非循环的。函数的返回值：
一个（outputs, outputs_state）的一个元祖。

outputs=(outputs_fw, outputs_bw),是一个包含前向cell输出tensor和后向tensor输出tensor组成的元祖。
outputs_state = (outputs_state_fw， output_state_bw),包含了前向和后向最后的隐藏状态的组成的元祖。outputs_state_fw和output_state_bw的类型都是LSTMStateTuple。LSTMStateTuple由(c, h)组成，分别代表memory cell和hidden state

(
                    (encoder_fw_outputs, encoder_bw_outputs),
                    (encoder_fw_state, encoder_bw_state)
                ) = tf.nn.bidirectional_dynamic_rnn(  #动态多层双向lstm_rnn
                    cell_fw=encoder_cell,
                    cell_bw = encoder_cell_bw,
                    inputs = inputs,
                    sequence_length = self.encoder_inputs_length,
                    dtype=tf.float32,
                    time_major=self.time_major,
                    parallel_iterations=self.parallel_iterations,
                    swap_memory = True
                )
                encoder_outputs = tf.concat([encoder_fw_outputs, encoder_bw_outputs], 2)
        
                encoder_state = []
                for i in range(self.depth):
                    encoder_state.append(encoder_fw_state[i])
                    encoder_state.append(encoder_bw_state[i])
                encoder_state = tuple(encoder_state)
            
            return encoder_outputs, encoder_state

这样encoder已经构建好了。首先说一下attention(注意力机制)，只有在decoder才用到:
在Encoder-Decoder结构中，Encoder把所有的输入序列都编码成一个统一的语义特征c再解码，因此， c中必须包含原始序列中的所有信息，它的长度就成了限制模型性能的瓶颈。如机器翻译问题，当要翻译的句子较长时，一个c可能存不下那么多信息，就会造成翻译精度的下降。Attention机制通过在每个时间输入不同的c来解决这个问题。下图是带有Attention机制的Decoder：

每一个c会自动去选取与当前所要输出的y最合适的上下文信息。具体来说，我们用 a_ ij衡量Encoder中第j阶段的hj和解码时第i阶段的相关性，最终Decoder中第i阶段的输入的上下文信息 c_ i 就来自于所有 h_ j 对 a_ ij 的加权和。
实现方式简单地说，就是先定义一层普通的 RNNCell（例如 LSTM），然后定义某种 Attention 机制的实例（如 LuongAttention 或者 BahdanauAttention），最后把这俩东西都传给 AttentionWrapper，返回封装后的 RNNCell。
这里decoder_cell 博主跟encoder_cell一样采用LSTM并且隐藏神经元个数和depth层数采用相同的参数。attention_mechanism（attention机制）我们采用BahdanauAttention

        def cell_input_fn(inputs, attention):
            """ 根据attn_input_feeding属性来判断是否在attention计算前进行一次投影的计算"""
            if not self.use_residual:
                return array_ops.concat([inputs, attention], -1)
            
            attn_projection = layers.Dense(self.hidden_units,
                                            dtype = tf.float32,
                                            use_bias=False,
                                            name='attention_cell_input_fn')
            return attn_projection(array_ops.concat([inputs, attention], -1))

        attention_cell = AttentionWrapper(
            cell = cell,
            attention_mechanism = self.attention_mechanism,
            attention_layer_size= self.hidden_units,
            alignment_history = alignment_history,
            cell_input_fn = cell_input_fn,
            name = 'AttentionWrapper'
        )

在进行decoder时训练阶段和预测阶段是不一样的

training 1. seq2seq.TrainingHelper 2.seq2seq.BasicDecoder 3. seq2seq.dynamic_decode 4.seq2seq.sequence_loss返回loss对象。
prediction 1.BeamSearchDecoder 2.seq2seq.dynamic_decode
Beam Search算法是一种平衡性能与消耗的搜索算法，目的是在序列中解码出相对较优的路径，它算法作为一种折中手段，在相对受限的搜索空间中找出其最优解，得出的解接近于整个搜索空间中的最优解。
要想用beam_search的话，需要先将encoder的output、state、length使用tile_batch函数处理一下，将batch_size扩展beam_size倍变成batch_size*beam_size，具体原因就不说了。beam search的方法只用在测试的情况，因为在训练过程中，每一个decoder的输出是有正确答案的，也就不需要beam search去加大输出的准确率。当然也可以使用贪心策略进行搜索：prediction 1seq2seq.GreedyEmbeddingHelper 2.seq2seq.BasicDecoder 3.seq2seq.dynamic_decode不过从效率上和效果上没有beam_search策略好。

encoder-decoder构建完之后就是设置optimizer(优化器)。优化器有很多种 ‘sgd’、'momentum’等这里我们就不一一展开了。博主使用的是tf.train.AdamOptimizer优化器设置好。在训练DL模型时，随着模型epoch迭代，往往会推荐逐渐减小learning rate,可以对训练的收敛有正向效果。博主采用tf.train.polynomial_decay多项式衰减的方式来更新学习率。这里博主家加上一个tf.clip_by_global_norm （梯度裁剪）修正梯度值，用于控制梯度爆炸的问题。梯度爆炸和梯度弥散的原因一样，都是因为链式法则求导的关系，导致梯度的指数级衰减。为了避免梯度爆炸，需要对梯度进行修剪。最后更新梯度参数列表。

def init_optimizer(self):
        """
        sgd, adadelta, adam, rmsprop, momentum
        """
        learning_rate = tf.train.polynomial_decay(
            #多项式衰减
            self.learning_rate,
            self.global_step,
            self.decay_steps,
            self.min_learning_rate,
            power=0.5
        )

        self.current_learning_rate = learning_rate
        #返回需要训练的参数列表 trainalbe=True
        trainable_params = tf.trainable_variables()
        #设置优化器
        if self.optimizer.lower() == 'adadelta':
            self.opt = tf.train.AdadeltaOptimizer(
                learning_rate = learning_rate
            )
        elif self.optimizer.lower() == 'adam':
            self.opt = tf.train.AdamOptimizer(
                learning_rate = learning_rate
            )
        elif self.optimizer.lower() == 'rmsprop':
            self.opt = tf.train.RMSPropOptimizer(
                learning_rate= learning_rate
            )
        elif self.optimizer.lower() == 'momentum':
            self.opt = tf.train.MomentumOptimizer(
                learning_rate = learning_rate, momentum=0.9
            )
        elif self.optimizer.lower() == 'sgd':
            self.opt = tf.train.GradientDescentOptimizer(
                learning_rate=learning_rate
            )
        
        gradients = tf.gradients(ys=self.loss, xs=trainable_params) #函数列表ys里的每一个函数对xs中的每一个变量求偏导,返回一个梯度张量的列表
        
        #梯度裁剪 放置梯度爆炸
        clip_gradients, _ = tf.clip_by_global_norm(
            gradients, self.max_gradient_norm
        )
        #更新model
        self.updates = self.opt.apply_gradients(
            #进行BP算法
            #由于apply_gradients函数接收的是一个(梯度张量, 变量)tuple列表
            #所以要将梯度列表和变量列表进行捉对组合,用zip函数
            zip(clip_gradients, trainable_params),
            global_step = self.global_step
        )
        
         #添加self.loss_rewards 的update
        gradients = tf.gradients(self.loss_rewards, trainable_params)
        clip_gradients, _ = tf.clip_by_global_norm(
            gradients, self.max_gradient_norm
        )
        self.updates_rewards = self.opt.apply_gradients(
            zip(clip_gradients, trainable_params),
            global_step=self.global_step
        )

        #添加self.loss_add 的update
        gradients = tf.gradients(self.loss_add, trainable_params)  # loss_add = loss+add_loss
        clip_gradients, _ = tf.clip_by_global_norm(
            gradients, self.max_gradient_norm
        )
        self.updates_add = self.opt.apply_gradients(
            zip(clip_gradients, trainable_params),
            global_step = self.global_step
        )

至此聊天机器人重要部分已近介绍完了。
博主使用tf版本是1.10 ,训练了30个epoch,loss值大概降到1.36左右。下图是效果图

可以看出还有有一点点效果的，但是要达到工业级这种还有很长路的要走，目前主流的问答问答系统大多数目前还是采用基于检索的方式。
完整代码请访问这里。
也欢迎各位志同道合的朋友留言讨论。

pycharm新建python的快捷键_Pycharm超级好用的快捷键——效率之王 weixin_39679468
最重要的快捷键ctrl+shift+A:万能命令行shift两次:查看资源文件新建工程第一步操作module设置把空包分层去掉,compactemptymiddlepackage设置当前的工程是utf-8,设置的Editor-->FileEncodings-->全部改成utf-8,注释ctrl+/:单行注释光标操作ctrl+alt+enter:向上插入shift+enter:向下插入end:光标操
【python】GUI框架——wxPython 草莓泰面包 python python 开发语言
文章目录GUIwxPython结构启动界面——wx.App代码遇到报错：wx.Frame()框架wx.Panel()容器布局——wx.SizerBox布局管理器（默认水平布局）控件statictext文本类字体格式Fonttextctrl输入文本类wx.Validator是用于验证用户输入的类，它允许您自定义输入验证规则和错误处理。Button按钮FileDialogMessageDialogEv
Python中的异常处理 -- (转) weixin_30379531
python中的异常异常是指程序中的例外，违例情况。异常机制是指程序出现错误后，程序的处理方法。当出现错误后，程序的执行流程发生改变，程序的控制权转移到异常处理。Exception类是常用的异常类，该类包括StandardError，StopIteration,GeneratorExit,Warning等异常类。StandardError类是python中的错误异常，如果程序上出现逻辑错误，将引发
如何获取股票行情数据接口？有哪些可靠的途径与方法？财云量化 python炒股自动化量化交易程序化交易股票行情数据接口可靠途径官方渠道股票量化接口股票API接口
炒股自动化：申请官方API接口，散户也可以python炒股自动化（0），申请券商API接口python炒股自动化（1），量化交易接口区别Python炒股自动化（2）：获取股票实时数据和历史数据Python炒股自动化（3）：分析取回的实时数据和历史数据Python炒股自动化（4）：通过接口向交易所发送订单Python炒股自动化（5）：通过接口查询订单，查询账户资产股票量化，Python炒股，CSDN
「Py」基础语法篇之 Python缩进规则何曾参静谧「Py」Python程序设计数据库
✨博客主页何曾参静谧的博客（✅关注、点赞、⭐收藏、转发）全部专栏（专栏会有变化，以最新发布为准）「Win」Windows程序设计「IDE」集成开发环境「UG/NX」BlockUI集合「C/C++」C/C++程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「UG/NX」NX定制开发「Py」Python程序设计「Math」探秘数学世界「PK」Pa
参加【2025年春季】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽子凯哥 web安全学习安全 CTF夺旗赛网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
参加【2025年春季】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽子凯哥 web安全学习安全 CTF夺旗赛网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
python json 用法云连山 python python json
JSON简介JSON（JavaScriptObjectNotation）是一种轻量级的数据交换格式。它基于JavaScript的一个子集，易于人阅读和编写，同时也易于机器解析和生成。在Python中，使用json模块来处理JSON数据。JSON支持的数据类型主要有对象（在Python中类似于字典）、数组（在Python中类似于列表）、字符串、数字、布尔值和null。将Python对象转换为JSON
基于Python的开源量化交易框架：构建你的量化投资策略 ShAutoit python 开发语言
量化投资是一种利用数学和统计模型来进行投资决策的方法，它将大量的金融数据与算法相结合，以识别交易机会并执行交易。Python作为一种功能强大且易于使用的编程语言，为开发和实施量化交易策略提供了很好的支持。本文将介绍基于Python的开源量化交易框架，帮助你构建自己的量化投资策略。数据获取和处理在量化投资中，数据是至关重要的。你需要获取和处理市场数据，包括股票价格、指数数据、财务数据等。在Pytho
python爬取自如网房源信息 2401_87368790 python 开发语言
本次爬取自如网房源信息所用到的知识点:requestsget请求lxml解析htmlXpathMongoDB存储正文分析目标站点url:http://hz.ziroom.com/z/nl/z3.html?p=2的p参数控制分页get请求获取单页源码--coding:utf-8--importrequestsimporttimefromrequests.exceptionsimportRequest
python的小技巧一 2401_87368790 python 开发语言
print(res)####一个数值的范围比较*常规的写法deftest_judge5(self):“”"判断一个值得的范围大小@return:“”"num=int(input(“请输入一个数字：”))ifnum>=0andnum>在判断字典的某一个key是否为空，可以用try…exception来实现>>>deftest_judge3(self):dict_data={“user_base”:{
Python演奏《起风了》 2401_86461228 python 数据库
代码：importctypesimportthreadingimporttimewinmm=ctypes.windll.winmmclassScale:Rest=0C8=108B7=107A7s=106A7=105G7s=104G7=103F7s=102F7=101E7=100D7s=99D7=98C7s=97C7=96B6=95A6s=94A6=93G6s=92G6=91F6s=90F6=89E
【Python】自动化神器PyAutoGUI —告别手动操作，一键模拟鼠标键盘，玩转微信及各种软件自动化墩墩分墩 Python python 自动化自动化脚本自动化测试 pyautogui
文章目录1.PyAutoGUI简介2.不同操作系统引入模块3.全局延迟和临时休眠4,自动防故障功能5.获取屏幕分辨率—用于定位，这是最关键的，找到要点击的位置（像素坐标）6.获取鼠标位置7.判断坐标是否在屏幕范围内：8.鼠标移动8.1.鼠标移动的基本操作8.2.鼠标移动效果-缓动/渐变（Tween/Easing）9.鼠标点击10.鼠标滚轮控制11.鼠标拖拽12.键盘控制13.消息弹窗函数14.屏幕
pygame下载 2401_86461228 pygame python
pygame下载先进入pygame官网下载与你python对应的版本，然后解压：https://www.pygame.org/download.shtml然后打开cmd命令输入pipinstallpygame等待执行结束，然后打开python输入代码importpygame再运行，入出现以下情况说明安装成功注：我的python是32位的
Python3【字符串】：文本操作的瑞士军刀李智 - 重庆 Python 精讲精练 -从入门到实战 python 开发语言经验分享编程实战趣味编程编程技巧
Python3【字符串】：文本操作的瑞士军刀内容简介本系列文章是为Python3学习者精心设计的一套全面、实用的学习指南，旨在帮助读者从基础入门到项目实战，全面提升编程能力。文章结构由5个版块组成，内容层层递进，逻辑清晰。基础速通：n个浓缩提炼的核心知识点，夯实编程基础；经典范例：10个贴近实际的应用场景，深入理解Python3的编程技巧和应用方法；避坑宝典：10个典型错误解析，提供解决方案，帮助
使用Python实现并行计算算法：效率提升的利器 Echo_Wish Python进阶 python 算法开发语言
在处理大规模数据和计算密集型任务时，单线程的处理方式往往显得力不从心。并行计算作为一种提升计算效率的重要手段，能够充分利用多核处理器的优势，加速任务的完成。Python作为一种灵活且功能强大的编程语言，提供了丰富的并行计算工具。本文将详细介绍如何使用Python实现并行计算算法，并通过具体代码示例展示其实现过程。项目概述本项目旨在通过Python实现一个并行计算算法，展示如何利用Python的多线
华为OD机试2024年E卷-分苹果[100分]（ Java | Python3 | C++ | C语言 | JsNode | Go ）实现100%通过率梅花C 华为OD题库华为od
题目描述A、B两个人把苹果分为两堆，A希望按照他的计算规则等分苹果Q，他的计算规则是按照二进制加法计算，并且不计算进位12+5=9(1100+0101=9)，B的计算规则是十进制加法，包括正常进位，B希望在满足A的情况下获取苹果重量最多。输入苹果的数量和每个苹果重量，输出满足A的情况下B获取的苹果总重量。如果无法满足A的要求，输出-1。数据范围1<=总苹果数量<=200001<=每个苹果重量<=1
python做并行计算_python做并行计算可以吗角动量不守恒 python做并行计算
python可以做并行计算，下面是相关介绍：一、概览ParallelPython是一个python模块，提供在SMP(具有多个处理器或多核的系统)和集群(通过网络连接的计算机)上并行执行python代码的机制。它轻巧，易于安装和与其他python软件集成。ParallelPython是一个用纯Python编写的开源和跨平台模块。二、特性在SMP和集群上并行执行python代码易于理解和实现基于Jo
7. 马科维茨资产组合模型+金融研报AI长文本智能体(Qwen-Long)增强方案（理论+Python实战） AI量金术师金融资产组合模型进化论人工智能金融 python 机器学习算法大数据线性回归
目录0.承前1.深度金融研报准备2.核心AI函数代码讲解2.1函数概述2.2输入参数2.3主要流程2.4异常处理2.5清理工作2.7get_ai_weights函数汇总3.汇总代码4.反思4.1不足之处4.2提升思路5.启后0.承前本篇博文是对前两篇文章，链接:5.马科维茨资产组合模型+政策意图AI金融智能体(Qwen-Max)增强方案（理论+Python实战）6.马科维茨资产组合模型+政策意图A
python字符串写入excel-python 将数据写入excel weixin_37988176
摘要链接：python第三方库——xlrd和xlwt操作Excel文件学习：http://blog.csdn.net/wangkai_123456/article/details/50457284python操作Excel读写(使用xlrd和xlrt)：http://blog.csdn.net/mr__fang/article/details/7089581Python中一般使用xlrd（exce
python并行计算 weixin_30894389
0.基础并行/发：multiprocessing/threading1.concurrent2.并发：asynico3.Ipython下的并行计算：使用ipyparallel库的IPython提供了前所未有的能力，将科学Python的探索能力与几乎即时访问多个计算核心相结合。系统可以直观地与本地或网络的计算节点集群进行交互，而不管集群的实现方式如何。这种易于交互使用帮助IPython和Python
Python并行计算：提高效率的利器 uote_e python java linux Python
在现代计算领域中，处理大规模数据和复杂计算任务是常见的挑战。为了应对这些挑战，一种常见的解决方案是利用并行计算技术。Python作为一种流行的编程语言，也提供了强大的工具和库来支持并行计算。本文将介绍Python中的并行计算概念和技术，并提供一些示例代码。并行计算简介并行计算是指同时执行多个计算任务，以提高计算效率。在传统的串行计算中，任务是按顺序依次执行的，而并行计算可以将任务分解成多个子任务，
深度学习-97-大语言模型LLM之基于langchain的实体记忆和知识图谱记忆皮皮冰燃深度学习深度学习语言模型 langchain
文章目录1内存记忆Memory1.1记忆系统支持的操作1.2记忆的存储1.3记忆的查询2记忆的应用2.1设置环境变量2.2ConversationEntityMemory实体记忆2.3ConversationKGMemory知识图谱记忆2.3.1创建ConversationKGMemory2.3.2创建ConversationChain2.4ConversationBufferWindowMemo
PyTorch 实战教程：从模型搭建到训练的每一步 AI_小站 pytorch 人工智能 python transformer 深度学习大模型 LLM
用深度学习搞事情，模型搭建和训练是绕不开的两步。而PyTorch，作为一个“又灵活又好用”的深度学习框架，简直就是写代码的快乐源泉。今天我们就从0到1，实战PyTorch的模型搭建和训练流程。说白了，看完你就能自己搭个神经网络，喂点数据进去，再让它干点活。安装PyTorch要用PyTorch，得先装上它。PyTorch的安装稍微有点讲究，主要是要根据你的硬件选择CPU版本还是GPU版本。基本安装命
Python pip安装、使用详解南山南北山北 Python语言 python pip 开发语言
1、Pythonpip简介pip是Python的软件包安装管理程序（你可以把它简单理解为类似Linux操作系统中的rpm/apt包管理工具），你可以使用pip从Python包索引和其他索引安装包。一般情况下，Python2.7/Python3.4以上版本默认自带安装了pip工具，当然，如果你的安装方式是如下3种之一，那么pip也会被自动安装：在虚拟环境中工作；使用从python.org下载的Pyt
PyQt6医疗多模态大语言模型（MLLM）实用系统框架构建初探（下.代码部分） Allen_LVyingbo 医疗高效编程研发 python 健康医疗 python pyqt 语言模型人工智能
医疗MLLM框架编程实现本医疗MLLM框架结合Python与PyQt6构建，旨在实现多模态医疗数据融合分析并提供可视化界面。下面从数据预处理、模型构建与训练、可视化界面开发、模型-界面通信与部署这几个关键部分详细介绍编程实现。6.1数据预处理在医疗MLLM框架中，多模态数据的预处理是非常关键的一步，它直接影响到后续模型的训练效果和性能。我们需要对医学影像、文本数据和音频数据分别进行预处理，以确保数
计算机视觉：卷积核每天五分钟玩转人工智能计算机视觉计算机视觉深度学习人工智能机器学习卷积神经网络
本文重点卷积神经网络（ConvolutionalNeuralNetwork，CNN）是一种深度学习模型，广泛应用于图像识别、自然语言处理、语音识别等领域。在卷积神经网络中，卷积核是网络的核心组件之一。通过不断堆叠卷积层和池化层，可以逐渐提取出更高级别的特征，从而实现更复杂的任务。卷积神经网络中的卷积核可以通过反向传播算法进行训练和优化，使其能够自适应地学习输入数据中的特征。因此，卷积神经网络在图像
【Python】红旗超市线下缴电费用户数据分析及可视化（pandas+pyecharts）风度78 百度人工智能 python 机器学习数据分析
场景分析：一部分用户习惯在红旗超市线下进行缴电费，电力公司希望了解哪些用户喜欢到线下缴费，具体分布在哪里，才能有针对性地宣传掌上电力app引导用户体验更高效的线上缴费方式，提升用户满意度。需求分析：首先要拿到红旗超市线下缴费清单数据，对所有数据进行隐私化处理，数据预览如图所示：可以看出台区名称为本项目的核心字段，通过台区匹配到经纬度信息，然后利用经纬度信息进行线下缴费热力图展示。同时可以提供分析报
浅谈人群扩展（lookalike）模型 eso1983 算法
Lookalike主要用于广告或者推荐系统中，找到与种子用户相似的人群。常用的算法应该包括协同过滤、基于标签的相似度计算，还有一些机器学习模型，比如逻辑回归、随机森林，以及深度学习的模型，比如DNN或者Embedding方法。这里简单介绍一下Lookalike人群扩展（相似人群扩展）中常用算法模型的解析，涵盖原理、数学公式、实现步骤、优缺点及适用场景。1.基于标签的相似度匹配原理通过用户标签（兴趣
Python之JSON数据结构 CL.LIANG python基础 python json 数据结构
JSON数据结构介绍JSON（JavaScriptObjectNotation）优势：1.易于阅读和编写JSON的结构直观、简单，类似于键值对的形式，易于人类阅读和编写。与XML等数据格式相比，JSON的语法更简洁，没有复杂的标记符号。2.轻量化JSON格式相比其他数据格式（如XML），更简洁，没有多余的标记，数据体积较小，这使得数据传输更加高效，尤其是在网络应用中。3.与JavaScript天然
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &

基于tensorflow 使用seq2seq+attention+beansearch搭建一个聊天机器人教程（附github源码）

—、 seq2seq模型简介

二、数据文本处理

三、模型构建

你可能感兴趣的:(nlp,python,深度学习)