旭旭_哥

cnn、rnn相结合进行文本分类

主要参考代码思路：

     
     
     
     
      
      
      
      https://github.com/jiegzhan/multi-class-text-classification-cnn-rnn

cnn和rnn结合一起进行文本分类主要思路如下:

    
    
    
    
     
     
     
     data--->batch iter-->cnn input-->embedding--->卷积--->池化--->rnn输入--->lstm cell--softmax

在前面的博客已经提到如何把文本数据转化了一个batch iter的形式，下面贴上关于cnn-rnn文本分类的一些代码:

基本配置:

     
     
     
     
      
      
      
      class TCNNRNNConfig(object):
      
      
      
          # 模型参数
      
      
      
          embedding_dim = 64  # 词向量维度
      
      
      
          seq_length = 300  # 序列长度
      
      
      
          num_classes = 2  # 类别数
      
      
      
          num_filters = 256  # 卷积核数目
      
      
      
          kernel_size = 5  # 卷积核尺寸
      
      
      
          vocab_size = 130000  # 词汇表达小
      
      
      
          max_pool_size=4   #最大的pool层
      
      
      
      
      
      
      
          hidden_dim = 128  # 全连接层神经元
      
      
      
      
      
      
      
          dropout_keep_prob = 0.8  # dropout保留比例
      
      
      
          learning_rate = 1e-3  # 学习率
      
      
      
          hidden_unit=256  #lstm神经元的个数
      
      
      
          batch_size = 128  # 每批训练大小
      
      
      
          num_epochs = 20  # 总迭代轮次
      
      
      
      
      
      
      
          print_per_batch = 100  # 每多少轮输出一次结果
      
      
      
          multi_kernel_size = '3,4,5'
      
      
      
          l2_reg_lambda = 0.0

模型代码：

     
     
     
     
      
      
      
      #!/usr/bin/python
      
      
      
      # -*- coding: utf-8 -*-
      
      
      
      import tensorflow as tf
      
      
      
      import numpy  as np
      
      
      
      class  TextCnnRnn(object):
      
      
      
          def __init__(self,config):
      
      
      
              self.config=config
      
      
      
              self.input_x=tf.placeholder(tf.int32,[None, self.config.seq_length],name="input_x")
      
      
      
              self.input_y=tf.placeholder(tf.float32,[None, self.config.num_classes],name="inpyt_y")
      
      
      
              self.keep_prob=tf.placeholder(tf.float32,None,name='keep_prob')
      
      
      
              self.pad = tf.placeholder(tf.float32, [None, 1, self.config.embedding_dim, 1], name='pad')
      
      
      
              self.l2_loss = tf.constant(0.0)
      
      
      
              self.real_len = tf.placeholder(tf.int32, [None], name='real_len')
      
      
      
              self.filter_sizes = list(map(int, self.config.multi_kernel_size.split(",")))
      
      
      
              self.cnnrnn()
      
      
      
          def input_embedding(self):
      
      
      
              """词嵌套"""
      
      
      
              with tf.device('/cpu:0'):
      
      
      
                  embedding =tf.get_variable("embedding",[self.config.vocab_size,self.config.embedding_dim])
      
      
      
                  _input = tf.nn.embedding_lookup(embedding, self.input_x)
      
      
      
                  _input_expanded = tf.expand_dims(_input, -1)
      
      
      
              return _input_expanded
      
      
      
      
      
      
      
          def cnnrnn(self):
      
      
      
              emb=self.input_embedding()
      
      
      
              pooled_concat = []
      
      
      
              reduced = np.int32(np.ceil((self.config.seq_length) * 1.0 / self.config.max_pool_size))
      
      
      
              for i, filter_size in enumerate(self.filter_sizes):
      
      
      
                  with tf.name_scope('conv-maxpool-%s' % filter_size):
      
      
      
                      # Zero paddings so that the convolution output have dimension batch x sequence_length x emb_size x channel
      
      
      
                      num_prio = (filter_size - 1) // 2
      
      
      
                      num_post = (filter_size - 1) - num_prio
      
      
      
                      pad_prio = tf.concat([self.pad] * num_prio, 1)
      
      
      
                      pad_post = tf.concat([self.pad] * num_post, 1)
      
      
      
                      emb_pad = tf.concat([pad_prio, emb, pad_post], 1)
      
      
      
      
      
      
      
                      filter_shape = [filter_size, self.config.embedding_dim, 1, self.config.num_filters]
      
      
      
                      W = tf.Variable(tf.truncated_normal(filter_shape, stddev=0.1), name='W')
      
      
      
                      b = tf.Variable(tf.constant(0.1, shape=[self.config.num_filters]), name='b')
      
      
      
                      conv = tf.nn.conv2d(emb_pad, W, strides=[1, 1, 1, 1], padding='VALID', name='conv')
      
      
      
      
      
      
      
                      h = tf.nn.relu(tf.nn.bias_add(conv, b), name='relu')
      
      
      
      
      
      
      
                      # Maxpooling over the outputs
      
      
      
                      pooled = tf.nn.max_pool(h, ksize=[1, self.config.max_pool_size, 1, 1], strides=[1, self.config.max_pool_size, 1, 1], padding='SAME',
      
      
      
                                              name='pool')
      
      
      
                      pooled = tf.reshape(pooled, [-1, reduced, self.config.num_filters])
      
      
      
                      pooled_concat.append(pooled)
      
      
      
              pooled_concat = tf.concat(pooled_concat, 2)
      
      
      
              pooled_concat = tf.nn.dropout(pooled_concat, self.keep_prob)
      
      
      
      
      
      
      
              # lstm_cell = tf.nn.rnn_cell.LSTMCell(num_units=self.config.hidden_unit)
      
      
      
      
      
      
      
              # lstm_cell = tf.nn.rnn_cell.GRUCell(num_units=self.config.hidden_unit)
      
      
      
              lstm_cell = tf.contrib.rnn.GRUCell(num_units=self.config.hidden_unit)
      
      
      
      
      
      
      
              # lstm_cell = tf.nn.rnn_cell.DropoutWrapper(lstm_cell, output_keep_prob=self.dropout_keep_prob)
      
      
      
              lstm_cell = tf.contrib.rnn.DropoutWrapper(lstm_cell, output_keep_prob=self.keep_prob)
      
      
      
      
      
      
      
              self._initial_state = lstm_cell.zero_state(self.config.batch_size, tf.float32)
      
      
      
              # inputs = [tf.squeeze(input_, [1]) for input_ in tf.split(1, reduced, pooled_concat)]
      
      
      
              inputs = [tf.squeeze(input_, [1]) for input_ in tf.split(pooled_concat, num_or_size_splits=int(reduced), axis=1)]
      
      
      
              # outputs, state = tf.nn.rnn(lstm_cell, inputs, initial_state=self._initial_state, sequence_length=self.real_len)
      
      
      
              #outputs, state = tf.contrib.rnn.static_rnn(lstm_cell, inputs, initial_state=self._initial_state,
      
      
      
              #                                           sequence_length=self.real_len)
      
      
      
              outputs, state=tf.nn.static_rnn( lstm_cell, inputs,self._initial_state,sequence_length=self.real_len)
      
      
      
              # Collect the appropriate last words into variable output (dimension = batch x embedding_size)
      
      
      
              output = outputs[0]
      
      
      
              with tf.variable_scope('Output'):
      
      
      
                  tf.get_variable_scope().reuse_variables()
      
      
      
                  one = tf.ones([1, self.config.hidden_unit], tf.float32)
      
      
      
                  for i in range(1, len(outputs)):
      
      
      
                      ind = self.real_len < (i + 1)
      
      
      
                      ind = tf.to_float(ind)
      
      
      
                      ind = tf.expand_dims(ind, -1)
      
      
      
                      mat = tf.matmul(ind, one)
      
      
      
                      output = tf.add(tf.multiply(output, mat), tf.multiply(outputs[i], 1.0 - mat))
      
      
      
      
      
      
      
              with tf.name_scope('score'):
      
      
      
                  self.W = tf.Variable(tf.truncated_normal([self.config.hidden_unit, self.config.num_classes], stddev=0.1), name='W')
      
      
      
                  b = tf.Variable(tf.constant(0.1, shape=[self.config.num_classes]), name='b')
      
      
      
                  self.l2_loss += tf.nn.l2_loss(W)
      
      
      
                  self.l2_loss += tf.nn.l2_loss(b)
      
      
      
                  self.scores = tf.nn.xw_plus_b(output, self.W, b, name='scores')
      
      
      
                  self.pred_y = tf.nn.softmax(self.scores, name="pred_y")
      
      
      
                  tf.add_to_collection('pred_network', self.pred_y)
      
      
      
                  self.predictions = tf.argmax(self.scores, 1, name='predictions')
      
      
      
      
      
      
      
              with tf.name_scope('loss'):
      
      
      
                  losses = tf.nn.softmax_cross_entropy_with_logits(labels=self.input_y,
      
      
      
                                                                   logits=self.scores)  # only named arguments accepted
      
      
      
                  self.loss = tf.reduce_mean(losses) + self.config.l2_reg_lambda * self.l2_loss
      
      
      
              with tf.name_scope("optimize"):
      
      
      
                  # 优化器
      
      
      
                  optimizer = tf.train.AdamOptimizer(
      
      
      
                      learning_rate=self.config.learning_rate)
      
      
      
                  self.optim = optimizer.minimize(self.loss)
      
      
      
              with tf.name_scope('accuracy'):
      
      
      
                  correct_predictions = tf.equal(self.predictions, tf.argmax(self.input_y, 1))
      
      
      
                  self.acc = tf.reduce_mean(tf.cast(correct_predictions, "float"), name='accuracy')
      
      
      
      
      
      
      
              with tf.name_scope('num_correct'):
      
      
      
                  correct = tf.equal(self.predictions, tf.argmax(self.input_y, 1))
      
      
      
                  self.num_correct = tf.reduce_sum(tf.cast(correct, 'float'))

run代码:

     
     
     
     
      
      
      
      #!/usr/bin/python
      
      
      
      # -*- coding: utf-8 -*-
      
      
      
      
      
      
      
      from  cnn_rnn_model import  TextCnnRnn
      
      
      
      from  configuration import TCNNRNNConfig
      
      
      
      from  data_utils_cut  import preocess_file,batch_iter
      
      
      
      import time
      
      
      
      import tensorflow as tf
      
      
      
      import os
      
      
      
      import numpy  as np
      
      
      
      from  datetime  import timedelta
      
      
      
      
      
      
      
      trainpath="/Users/shuubiasahi/Desktop/tensorflow/adx/"
      
      
      
      def run_epoch(cnnrnnmodel=True):
      
      
      
          # 载入数据
      
      
      
          print('Loading data...')
      
      
      
          start_time = time.time()
      
      
      
      
      
      
      
          x_train, y_train, words = preocess_file(data_path=trainpath+"cnn.txt")
      
      
      
      
      
      
      
          if cnnrnnmodel:
      
      
      
              print('Using CNNRNN model...')
      
      
      
              config = TCNNRNNConfig()
      
      
      
              config.vocab_size = len(words)
      
      
      
              print("vocab_size is:", config.vocab_size)
      
      
      
              model = TextCnnRnn(config)
      
      
      
              tensorboard_dir = '/Users/shuubiasahi/Desktop/tensorflow/boardlog'
      
      
      
      
      
      
      
          end_time = time.time()
      
      
      
          time_dif = end_time - start_time
      
      
      
          time_dif = timedelta(seconds=int(round(time_dif)))
      
      
      
          print('Time usage:', time_dif)
      
      
      
      
      
      
      
          print('Constructing TensorFlow Graph...')
      
      
      
          session = tf.Session()
      
      
      
          session.run(tf.global_variables_initializer())
      
      
      
          saver = tf.train.Saver()
      
      
      
          # 配置 tensorboard
      
      
      
          tf.summary.scalar("loss", model.loss)
      
      
      
          tf.summary.scalar("accuracy", model.acc)
      
      
      
      
      
      
      
          if not os.path.exists(tensorboard_dir):
      
      
      
              os.makedirs(tensorboard_dir)
      
      
      
      
      
      
      
          merged_summary = tf.summary.merge_all()
      
      
      
          writer = tf.summary.FileWriter(tensorboard_dir)
      
      
      
          writer.add_graph(session.graph)
      
      
      
      
      
      
      
          # 生成批次数据
      
      
      
          print('Generating batch...')
      
      
      
          batch_train = batch_iter(list(zip(x_train, y_train)),
      
      
      
              config.batch_size, config.num_epochs)
      
      
      
      
      
      
      
          def feed_data(batch):
      
      
      
              """准备需要喂入模型的数据"""
      
      
      
              x_batch, y_batch = zip(*batch)
      
      
      
              feed_dict = {
      
      
      
                  model.input_x: x_batch,
      
      
      
                  model.input_y: y_batch,
      
      
      
                  model.real_len:real_len(x_batch)
      
      
      
              }
      
      
      
              return feed_dict, len(x_batch)
      
      
      
      
      
      
      
          def real_len(batches):
      
      
      
              return [np.ceil(np.argmin(batch + [0]) * 1.0 / config.max_pool_size) for batch in batches]
      
      
      
      
      
      
      
          def evaluate(x_, y_):
      
      
      
              """
      
      
      
              模型评估
      
      
      
              一次运行所有的数据会OOM，所以需要分批和汇总
      
      
      
              """
      
      
      
              batch_eval = batch_iter(list(zip(x_, y_)), 128, 1)
      
      
      
      
      
      
      
              total_loss = 0.0
      
      
      
              total_acc = 0.0
      
      
      
              cnt = 0
      
      
      
              for batch in batch_eval:
      
      
      
                  feed_dict, cur_batch_len = feed_data(batch)
      
      
      
                  feed_dict[model.keep_prob] = 1.0
      
      
      
                  loss, acc = session.run([model.loss, model.acc],
      
      
      
                      feed_dict=feed_dict)
      
      
      
                  total_loss += loss * cur_batch_len
      
      
      
                  total_acc += acc * cur_batch_len
      
      
      
                  cnt += cur_batch_len
      
      
      
      
      
      
      
              return total_loss / cnt, total_acc / cnt
      
      
      
      
      
      
      
          # 训练与验证
      
      
      
          print('Training and evaluating...')
      
      
      
          start_time = time.time()
      
      
      
          print_per_batch = config.print_per_batch
      
      
      
          for i, batch in enumerate(batch_train):
      
      
      
              feed_dict, lenbatch = feed_data(batch)
      
      
      
              feed_dict[model.keep_prob] = config.dropout_keep_prob
      
      
      
              feed_dict[model.pad]=np.zeros([lenbatch, 1, config.embedding_dim, 1])
      
      
      
      
      
      
      
      
      
      
      
              if i % 5 == 0:  # 每5次将训练结果写入tensorboard scalar
      
      
      
                  s = session.run(merged_summary, feed_dict=feed_dict)
      
      
      
                  writer.add_summary(s, i)
      
      
      
      
      
      
      
              if i % print_per_batch == print_per_batch - 1:  # 每200次输出在训练集和验证集上的性能
      
      
      
                  loss_train, acc_train = session.run([model.loss, model.acc],
      
      
      
                      feed_dict=feed_dict)
      
      
      
                  #loss, acc = evaluate(x_val, y_val)   验证机暂时不需要
      
      
      
      
      
      
      
                  # 时间
      
      
      
                  end_time = time.time()
      
      
      
                  time_dif = end_time - start_time
      
      
      
                  time_dif = timedelta(seconds=int(round(time_dif)))
      
      
      
      
      
      
      
                  msg = 'Iter: {0:>6}, Train Loss: {1:>6.2}, Train Acc: {2:>7.2%},'\
      
      
      
                      + '  Time: {3}'
      
      
      
                  print(msg.format(i + 1, loss_train, acc_train, time_dif))
      
      
      
              # if  i%10==0 and i>0:
      
      
      
              #     graph=tf.graph_util.convert_variables_to_constants(session,session.graph_def,["keep_prob","input_x","score/pred_y"])
      
      
      
              #     tf.train.write_graph(graph,".","/Users/shuubiasahi/Desktop/tensorflow/modelsavegraph/graph.db",as_text=False)
      
      
      
              if i%500==0  and i>0:
      
      
      
                  graph = tf.graph_util.convert_variables_to_constants(session, session.graph_def,
      
      
      
                                                                       ["keep_prob","real_len","pad", "input_x", "score/pred_y"])
      
      
      
                  if cnnrnnmodel:
      
      
      
                      tf.train.write_graph(graph, ".", trainpath+"graphcnnrnn.model",
      
      
      
                                           as_text=False)
      
      
      
                  print("模型在第{0}步已经保存".format(i))
      
      
      
              session.run(model.optim, feed_dict=feed_dict)  # 运行优化
      
      
      
      
      
      
      
          # 最后在测试集上进行评估
      
      
      
      
      
      
      
          session.close()
      
      
      
      
      
      
      
      if __name__ == '__main__':
      
      
      
      
      
      
      
          run_epoch()

简单的结果分析:

     
     
     
     
      
      
      
      Using CNNRNN model...
      
      
      
      vocab_size is: 160238
      
      
      
      Time usage: 0:00:35
      
      
      
      Constructing TensorFlow Graph...
      
      
      
      2017-10-30 23:22:18.426329: W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use SSE4.2 instructions, but these are available on your machine and could speed up CPU computations.
      
      
      
      2017-10-30 23:22:18.426342: W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use AVX instructions, but these are available on your machine and could speed up CPU computations.
      
      
      
      2017-10-30 23:22:18.426346: W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use AVX2 instructions, but these are available on your machine and could speed up CPU computations.
      
      
      
      2017-10-30 23:22:18.426351: W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use FMA instructions, but these are available on your machine and could speed up CPU computations.
      
      
      
      Generating batch...
      
      
      
      Training and evaluating...
      
      
      
      Iter:    100, Train Loss:   0.66, Train Acc:  71.09%,  Time: 0:02:47
      
      
      
      Iter:    200, Train Loss:   0.65, Train Acc:  61.72%,  Time: 0:05:38

迭代几百步相比单纯的用cnn、bi-lstm实际效果是很差了，可能文本本身的特征已经够明显，再用这种反而效果会变差吧，cnn这种相当于一个超级n-gram，bi-lstm正反两面捕捉文本上下文的信息进行信息输出，之前在GitHub上看到别人做文本分类，cnn、bilstm这种量效果是最佳。。。由于电脑原因并没有迭代很多步，哪天用gpu试试吧

你可能感兴趣的:(python编程)

利用Pygame实现Python塔防游戏开发阿卞是宝藏啊
本文还有配套的精品资源，点击获取简介：本项目介绍如何使用Python的pygame库制作塔防游戏，强调游戏开发的各个基本流程和技巧。包括初始化pygame、游戏结构设计、游戏逻辑实现、图像与声音处理，以及游戏优化和调试过程。项目旨在提升开发者在Python编程和游戏开发方面的技能。1.Python与pygame库基础简介Python是一种广泛应用于各个领域的高级编程语言，以其简洁明了的语法和强大的
STLG_05_04_Python - 函数魔都天健开发语言前端笔记 python
Python函数是一种可重用的代码块，用于执行特定任务。它通过def关键字定义，可以接受参数作为输入，并通过return语句返回值。函数能够提高代码的模块化和可读性，方便维护和调试。无论是内置函数还是自定义函数，它们都是Python编程中实现功能和逻辑的重要工具。1.函数的定义和调用1.1函数的定义在Python中，函数是一段可重复使用的代码块，用于执行特定的任务。函数可以帮助我们将代码模块化，提
代码编写java代做c++程序代编程Python代c#设计C语言接单软件定制 matlabgoodboy java c++c#
您提到的服务涵盖了多种编程语言和软件开发需求，包括Java代码编写、C++程序代编、Python编程代做、C#设计、C语言编程，以及软件定制服务。这些服务在软件开发领域非常常见，且有着广泛的应用。以下是对这些服务更详细的解释和接单时的一些建议：服务详解Java代码编写Java以其跨平台性、面向对象和丰富的API而著称，广泛应用于企业级应用、Android应用开发、Web服务端开发等领域。您可以提供
Python调用另一个py文件并传递参数的全面解析 cda2024 python java 服务器
在Python编程的世界里，模块化和代码复用是提高开发效率的重要手段。当你面对复杂的项目时，将功能拆分成多个文件不仅有助于团队协作，还能提升代码的可读性和可维护性。然而，如何在一个py文件中调用另一个py文件，并且能够传递参数呢？这正是本文要探讨的核心问题。通过本文，你将了解到几种常见的方法及其应用场景，帮助你在实际开发中更加游刃有余。1.使用import语句1.1基本用法最直观的方法就是使用im
AI大模型学习路线 liuhenghui5201 AI python AI 大模型
阶段1Python编程基础主要内容掌握的核心能力·Python基础语法·Python数据处理·函数·文件读写·异常处理·模块和包1、掌握Python开发环境基本配置；2、掌握运算符、表达式、流程控制语句、数组等的使用；3、掌握字符串的基本操作；4、初步建立面向对象的编程思维；5、熟悉异常捕获的基本流程及使用方式；6、掌握类和对象的基本使用方式。可解决的现实问题：熟练掌握人工智能Python语言，建
使用迭代工具返回连续负数的最长列表。groupby 潮易 python
使用迭代工具返回连续负数的最长列表。groupby要使用Python编程解决这个问题，我们可以采用迭代和条件判断的方法。以下是一个简单的实现方法：```pythondeflongest_negatives(nums):max_length=0current_length=0start=-1foriinrange(len(nums)):ifnums[i]<0:ifcurrent_length==0:
Python延时函数详解及实例代码 HackDyno python java 前端 Python
Python延时函数详解及实例代码在Python编程中，有时我们需要在程序中添加延时，以便在执行特定操作之前等待一段时间。延时函数允许我们在代码中创建一个暂停的时间间隔。本文将详细介绍Python中的延时函数，并提供一些实例代码供参考。Python中的延时函数可以通过time模块来实现。time模块是Python标准库中的一部分，提供了与时间相关的函数和方法。我们可以使用time.sleep()函
Python 中无穷的表示梦想是优秀社畜 Python python 编程语言经验分享
我们在python编程过程中可能需要设定一个无穷大的值来辅助我们的逻辑语句，下面展示python中无穷大的表示，和无穷的判断方法。上代码！！！#无穷的判断需要导入math模块importmath#正无穷zheng_wq=float('inf')#负无穷fu_wq=-float('inf')#float('-inf')#判断是否无穷math.isinf(zhengwq)#最终结果是True希望我的笔
Python中的十六进制字节转换为字符串时代在召唤吗 python 前端开发语言 Python
Python中的十六进制字节转换为字符串在Python编程中，有时我们需要将十六进制字节（hexbytes）转换为字符串。这种情况可能出现在网络通信、文件读取或加密解密等应用中。本文将介绍如何使用Python将十六进制字节转换为字符串，并提供相应的源代码示例。在Python中，可以使用binascii模块提供的函数来进行十六进制字节和字符串之间的转换。下面是一个示例代码，演示了如何将十六进制字节转
Python 包与模块：深入理解与实践 kdayjj966 python 开发语言 windows
一、引言在Python编程的广阔领域中，包（Package）和模块（Module）是构建大型、可维护项目的重要基石。它们不仅提供了一种组织代码的有效方式，还能实现代码的复用与共享。想象一下，当我们编写一个复杂的应用程序时，如果所有的代码都堆积在一个文件中，那将是多么混乱和难以管理。而包和模块的出现，就如同为我们的代码提供了一个个有序的“文件夹”和“文件”，使得代码结构清晰，易于理解和维护。理解包和
深入探索Python编程技术：从入门到精通的全方位学习指南小码快撩 python 开发语言
引言在当今信息技术飞速发展的时代，Python以其简洁优雅、功能强大、易于上手的特点，成为了众多开发者和初学者首选的编程语言。无论是数据科学、机器学习、Web开发、自动化脚本编写，还是桌面应用开发，Python都能发挥其独特优势，帮助开发者高效完成任务。本文旨在为Python学习者提供一个全面的学习路径与关键知识点概述，助您快速掌握这门强大的编程语言。一、基础语法1.变量定义与数据类型示例代码：#
获取列表中最后一个位置的元素内容 - Python 雪域Code python 开发语言 Python
获取列表中最后一个位置的元素内容-Python在Python编程中，经常需要对列表进行操作，其中一项常见的需求是获取列表中最后一个位置的元素内容。本文将介绍如何使用Python编程语言来实现这一功能，并提供相应的源代码示例。获取列表最后一个元素的方法有多种，下面将介绍其中的两种常见方法。方法一：使用索引在Python中，可以使用负数索引来获取列表中的元素，其中-1代表最后一个元素，-2代表倒数第二
Python实现定时器的几种方式（超详细）夏天Aileft Python python 开发语言定时器
✨前言：在Python编程中，定时器是一种非常有用的工具，用于执行特定任务或函数，例如定时任务、轮询操作、定时检查等。Python提供了多种方式来创建和使用定时器，本文将介绍一些高级的定时器使用方式，包括使用threading模块、使用schedule库以及在异步编程中使用定时器。1使用time.sleep()结合循环这是最基础的计时方法，通过让程序暂停一定时间来实现简单的定时任务。#!/usr/
解锁函数的魔力：Python 中的多值传递、灵活参数与无名之美 kdayjj966 python 开发语言
在Python编程的世界里，函数宛如魔法的咒语，能够将复杂的任务拆解为简洁、可复用的代码块。而其中的多值传递、灵活参数与匿名函数（lambda）特性，更是为这魔法增添了绚丽多彩的光芒，极大地提升了编程的效率与灵活性。接下来，让我们一同深入探索这些特性的奇妙之处。一、多值返回：数据传递的便捷通道在Python中，函数具备强大的多值返回能力。当函数需要同时传递多个数据时，无需借助复杂的容器封装，只需使
python连接485网关设备 dilqu python 网络开发语言
Python相关视频讲解：python的or运算赋值用法用python编程Excel有没有用处？011_编程到底好玩在哪？查看python文件_输出py文件_cat_运行python文件_shel如何实现Python连接485网关设备1.流程图gantttitlePython连接485网关设备流程图section了解485网关设备:1dsection安装Python库:1dsection编写Pyt
深入理解Python生成器与协程：原理、实践与最佳应用场景20240919 Narutolxy 技术干货分享 Python笔记 python 网络
深入理解Python生成器与协程：原理、实践与最佳应用场景引言在Python编程中，生成器和协程是两个核心概念，它们能够帮助开发者编写高效、可维护的代码。生成器提供了一种延迟计算的机制，节省内存并提高性能；协程则允许程序在多个任务之间高效切换，实现并发操作。然而，要充分利用它们的优势，需要深入理解其工作原理。本文将详细解析生成器和协程的工作机制，探讨它们之间的关系，并通过实际应用场景和最佳实践，帮
Python编程与在线医疗平台数据挖掘与数据应用交互性研究 Allen_LVyingbo 数智化医院2025 python 数据挖掘
一、引言1.1研究背景与意义在互联网技术飞速发展的当下，在线医疗平台如雨后春笋般涌现，为人们的就医方式带来了重大变革。这些平台打破了传统医疗服务在时间和空间上的限制，使患者能够更加便捷地获取医疗资源。据相关报告显示，中国基于互联网的医疗保健行业已进入新的发展阶段，2023年中国在线医疗服务增长显著，高质量医院和在线医疗平台取得了长足进步，在线医疗的用户规模也在持续扩大，其中在线咨询服务的用户占比较
实时监控社区帖子删除的Python系统构建永不放弃yes
本文还有配套的精品资源，点击获取简介：本系统采用Python开发，专注于实时监测网络平台上的帖子删除情况。Python语言以其简洁和丰富的第三方库支持，如requests、BeautifulSoup、Selenium，构成了系统的核心。系统通过定时任务执行监测，实现帖子信息的记录和比较，并提供异常处理及日志记录功能。用户界面和合规性考虑也是系统设计的一部分。1.Python编程语言在删贴监测系统中
避免Python内存泄漏的有效方法使用详解 Rocky006 python 开发语言
概要在Python编程中，内存管理通常由Python的垃圾回收机制自动处理。然而，在某些复杂的场景中，内存泄漏问题可能会悄然出现，导致应用程序的内存使用量持续增长，进而影响性能甚至导致崩溃。本文将详细介绍如何在Python代码中进行内存优化，特别是如何检测和防止内存泄漏，并提供相应的示例代码帮助你掌握这些技术。什么是内存泄漏？内存泄漏是指程序运行期间无法释放已经不再使用的内存，导致内存资源被占用且
Python中的面向对象编程（OOP） python
在Python编程领域中，面向对象编程（Object-OrientedProgramming，简称OOP）是一种强大而灵活的编程范式，它允许开发者以对象为中心组织代码，使得程序结构更加清晰、可维护。在本文中，我们将深入探讨Python中的面向对象编程，介绍关键概念，并通过实例演示如何利用OOP构建更健壮的应用。1.类与对象OOP的核心概念是类与对象。类是一个抽象的概念，用于描述具有相似属性和方法的
【列表复制】详解python中list列表复制的几种方法（赋值、切片、copy()，deepcopy()）有梦想的程序星空 Python开发教程 python 开发语言
在Python编程领域，列表是一种极为常用的数据结构，用于存储多个元素的有序集合。当涉及到对列表进行复制操作时，浅拷贝和深拷贝是两种重要的概念与技术手段，它们在处理列表数据的过程中有着截然不同的行为和影响，深刻理解二者的差异与应用场景对于编写高效、准确且健壮的Python代码至关重要。1、浅拷贝和深拷贝浅拷贝复制指向某个对象的地址（指针），而不复制对象本身，新对象和原对象共享同一内存。深拷贝会额外
Python 装饰器暮色尽染 Python python 开发语言
Python装饰器是一种强大且优雅的工具，它允许我们在不修改原始函数代码的情况下，增加或改变函数的功能。装饰器的使用可以显著提高代码的复用性和可读性，是Python编程中不可或缺的一部分。装饰器的基本概念装饰器本质上是一个函数，它接受一个函数作为参数并返回一个新的函数。通过装饰器，我们可以在函数执行前后添加额外的逻辑，而不需要修改函数本身的代码。这种特性使得装饰器非常适合用于日志记录、性能测试、事
Python入门：3.Python的输入和输出格式化平凡程序猿~ Python python 开发语言
引言在Python编程中，输入与输出是程序与用户交互的核心部分。而输出格式化更是对程序表达能力的极大增强，可以让结果以清晰、美观且易读的方式呈现给用户。本文将深入探讨Python的输入与输出操作，特别是如何使用格式化方法来提升代码质量和可读性。一、输入操作Python提供了简单而强大的输入功能，通过内置函数input()可以从用户那里获取字符串形式的输入。以下是一些基本用法和注意事项：1.基本用法
Python入门之Lesson2:Python基础语法小熊同学哦 Python入门课程 python 开发语言算法数据结构青少年编程
目录前言一.介绍1.变量和数据类型2.常见运算符3.输入输出4.条件语句5.循环结构二.练习三.总结前言欢迎来到《Python入门》系列博客的第二课。在上一课中，我们了解了Python的安装及运行环境的配置。在这一课中，我们将深入学习Python的基础语法，这是编写Python代码的根基。通过本节内容的学习，你将掌握变量、数据类型、运算符、输入输出、条件语句等Python编程的基础知识。一.介绍1
Python编程 - 函数进阶易辰君 Python核心编程 python 开发语言
目录前言一、函数参数的高级用法（一）缺省参数（二）命名参数（三）不定长参数二、拆包（一）函数返回值拆包（二）通过星号拆包（三）总结三、匿名函数（一）函数定义（二）使用匿名函数四、递归函数（一）简介（二）基本结构（三）简单示例（四）优缺点总结前言上篇文章主要了解了函数基础，如何定义函数，函数种类以及局部变量和全局变量的差异等，接下来就讲解python函数较为进阶的知识点，若有任何想法欢迎一起沟通讨论
Python编程 - 初识面向对象易辰君 Python核心编程 python 开发语言
目录前言一、面向对象二、类和对象（一）类简介定义类（二）对象简介创建对象（三）总结三、实例属性和实例方法（一）实例属性创建的基本语法使用示例（二）实例方法定义实例方法的基本语法调用示例方法的示例（三）总结四、类中的self（一）基本概念（二）作用访问实例属性调用其他实例方法在构造函数中初始化对象（三）总结五、__init__方法（一）__init__方法的特点（二）基本语法（三）示例（四）总结前言
深入理解Python中的“_,”：一个实用的语法特性小桥流水---人工智能 Python程序代码 Python常见bug 深度学习 python 开发语言
在Python编程中，你可能经常会看到一个特殊的标识符“_”。这个符号在Python中有多种用途，其具体含义依上下文而定。本文将探讨其中一种常见用法——作为一个临时性的占位符——并解释它在实际编程中的实用性和应用场景。1.“_”作为占位符在Python中，下划线（_）经常被用作一个临时或不重要的变量。当你在解包（unpacking）一个表达式但又不想使用其中某些值时，下划线可用作占位符。这样做的好
【Python基础】Python迭代器与生成器（两种强大工具）姑苏老陈 Python编程入门 python 开发语言 python迭代器与生成器
本文收录于《Python编程入门》专栏，从零基础开始，分享一些Python编程基础知识，欢迎关注，谢谢！文章目录一、前言二、迭代器2.1创建迭代器2.2自定义迭代器2.3处理大型文件三、生成器四、生成器表达式五、实际应用案例5.1数据库查询5.2网络数据流处理六、总结一、前言在Python中，迭代器与生成器是两种非常强大的工具，它们可以帮助我们有效地处理大量数据，特别是在需要逐个访问元素的情况下。
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
Python字符串比较：如何判断两个字符串是否相等？程序员杨弋 Python全栈工程师学习指南 python 开发语言
在Python编程中，字符串是最常用的数据类型之一。当我们需要比较两个字符串时，通常需要判断它们是否相等。这篇文章将详细介绍Python中比较两个字符串的方法。1、使用“==”运算符比较字符串在Python中，可以使用“==”运算符比较两个字符串是否相等。这个运算符返回True，表示两个字符串相等，返回False，表示两个字符串不相等。例如：str1="hello"str2="hello"ifst
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文