就是求关注

深度学习CNN模型预测电影评论中的情感问题

情感分析是一种自然语言处理问题，其中理解文本并预测潜在意图。

在这篇文章中，您将了解如何使用Keras深度学习库在Python中预测电影评论的积极或消极情绪。

阅读这篇文章后你会知道：

关于自然语言处理的IMDB情绪分析问题以及如何在Keras中加载它。
如何在Keras中使用单词嵌入来解决自然语言问题。
如何开发和评估IMDB问题的多层感知模型。
如何为IMDB问题开发一维卷积神经网络模型。环境：Keras 2.0.2，TensorFlow 1.0.1和Theano 0.9.0
IMDB电影评论情绪问题描述

数据集是大型电影评论数据集，通常称为IMDB数据集。
大型电影评论数据集（通常称为IMDB数据集）包含25,000个用于培训的高极移动评论（好的或坏的）以及用于测试的相同数量。问题是确定给定的移动评论是否具有正面或负面情绪。
这些数据由斯坦福大学的研究人员收集并用于论中 [PDF]，其中50/50的数据用于培训和测试。准确率达到88.89％。
该数据还被用作2014年底至2015年初举办的名为“ Bag of Words Meets Bags of Popcorn ” 的Kaggle比赛的基础。获胜者达到99％时，准确率达到97％以上

使用Keras加载IMDB数据集

Keras提供对内置IMDB数据集的访问。

keras.datasets.imdb.load_data（）允许您以准备好在神经网络和深度学习模型中使用的格式加载数据集。

单词已被整数替换，这些整数表示数据集中单词的绝对流行度。因此，每个评论中的句子由一系列整数组成。

第一次调用imdb.load_data（）会将IMDB数据集下载到您的计算机并将其作为32兆字节文件存储在〜/ .keras / datasets / imdb.pkl下的主目录中。

有用的是，imdb.load_data（）提供了额外的参数，包括要加载的顶部字的数量（其中具有较低整数的字在返回的数据中标记为零），要跳过的顶部字的数量（以避免“该”的）以及支持的最大评论期限。

让我们加载数据集并计算它的一些属性。我们将首先加载一些库并将整个IMDB数据集作为训练数据集加载。

 
             1 
           
             2 
           
             3 
           
             4 
           
             5 
           
             6 
           
             7 
           
            import  
            numpy 
           
            from  
            keras 
            . 
            datasets  
            import  
            imdb 
           
            from  
            matplotlib  
            import  
            pyplot 
           
            # load the dataset 
           
            ( 
            X_train 
            , 
              
            y_train 
            ) 
            , 
              
            ( 
            X_test 
            , 
              
            y_test 
            ) 
              
            = 
            load_data 
            ( 
            ) 
           
            X 
              
            = 
              
            numpy 
            . 
            concatenate 
            ( 
            ( 
            X_train 
            , 
              
            X_test 
            ) 
            , 
              
            axis 
            = 
            0 
            ) 
           
            y 
              
            = 
              
            numpy 
            . 
            concatenate 
            ( 
            ( 
            y_train 
            , 
              
            y_test 
            ) 
            , 
              
            axis 
            = 
            0 
            )

接下来，我们可以显示训练数据集的形状。

 
             1 
           
             2 
           
             3 
           
             4 
           
            # summarize size 
           
            print 
            ( 
            "Training data: " 
            ) 
           
            print 
            ( 
            X 
            . 
            shape 
            ) 
           
            print 
            ( 
            y 
            . 
            shape 
            )

运行此代码段，我们可以看到有50,000条记录。

 
             1 
           
             2 
           
             3 
           
             Training data: 
           
             (50000,) 
           
             (50000,)

我们还可以打印唯一的类值。

 
             1 
           
             2 
           
             3 
           
            # Summarize number of classes 
           
            print 
            ( 
            "Classes: " 
            ) 
           
            print 
            ( 
            numpy 
            . 
            unique 
            ( 
            y 
            ) 
            )

我们可以看到，这是一个二元分类问题，在评论中有好的和坏的情绪。

接下来，我们可以了解数据集中唯一单词的总数。

 
             1 
           
             2 
           
             3 
           
            # Summarize number of words 
           
            print 
            ( 
            "Number of words: " 
            ) 
           
            print 
            ( 
            len 
            ( 
            numpy 
            . 
            unique 
            ( 
            numpy 
            . 
            hstack 
            ( 
            X 
            ) 
            ) 
            ) 
            )

有趣的是，我们可以看到整个数据集中只有不到100,000个单词。

 
             1 
           
             2 
           
             Number of words: 
           
             88585

最后，我们可以了解平均审核长度。

 
             1 
           
             2 
           
             3 
           
             4 
           
             5 
           
             6 
           
             7 
           
            # Summarize review length 
           
            print 
            ( 
            "Review length: " 
            ) 
           
            result 
              
            = 
              
            [ 
            len 
            ( 
            x 
            ) 
              
            for 
              
            X  
            in 
              
            X 
            ] 
           
            print 
            ( 
            "Mean %.2f words (%f)" 
              
            % 
              
            ( 
            numpy 
            . 
            mean 
            ( 
            result 
            ) 
            , 
              
            numpy 
            . 
            std 
            ( 
            result 
            ) 
            ) 
            ) 
           
            # plot review length 
           
            pyplot 
            . 
            boxplot 
            ( 
            result 
            ) 
           
            pyplot 
            . 
            show 
            ( 
            )

我们可以看到平均评论不到300字，标准差超过200字。

 
             1 
           
             2 
           
             Review length: 
           
             Mean 234.76 words (172.911495)

我们可以看到一个指数分布的盒子和胡须图，我们可以看到一个指数分布，我们可以覆盖分布的质量，剪切长度为400到500字。

Word嵌入

自然语言处理领域的最新突破称为嵌入。

这是一种在高维空间中将单词编码为实值向量的技术，其中单词之间的意义相似性转换为向量空间中的接近度。

离散词被映射到连续数的向量。当使用神经网络处理自然语言问题时这很有用，深度学习模型我们需要数字作为输入。

Keras提供了一种方便的方法，可以将单词的正整数表示转换为的嵌入层单词嵌入。

该层采用定义映射的参数，包括也称为词汇表大小的预期单词的最大数量（例如，将被视为整数的最大整数值）。该图层还允许您为每个单词向量指定维度，称为输出维度。

我们想为IMDB数据集使用单词嵌入表示。

假设我们只对数据集中前5,000个最常用的单词感兴趣。因此我们的词汇量将为5,000。我们可以选择使用32维向量来表示每个单词。最后，我们可以选择将最大审核长度设置为500字，将评论截断时间缩短，并将填充评论缩短为0值。

我们将加载IMDB数据集，如下所示：

然后，我们将使用Keras实用程序使用sequence.pad_sequences（）函数将数据集截断或填充到每个观察的长度500。

 
           1 
         
           2 
         
          X_train 
            
          = 
            
          sequence 
          . 
          pad_sequences 
          ( 
          X_train 
          , 
            
          maxlen 
          = 
          500 
          ) 
         
          X_test 
            
          = 
            
          sequence 
          . 
          pad_sequences 
          ( 
          X_test 
          , 
            
          maxlen 
          = 
          500 
          )

最后，稍后，我们模型的第一层将是使用Embedding类创建的单词嵌入层，如下所示：

 
           1 
         
          Embedding 
          ( 
          5000 
          , 
            
          32 
          , 
            
          input_length 
          = 
          500 
          )

对于给定的复习训练或整数格式的测试模式，该第一层的输出将是大小为32×500的矩阵。

现在我们知道如何在Keras中加载IMDB数据集以及如何使用单词嵌入表示，让我们开发并评估一些模型。

用于IMDB数据集的简单多层感知器模型

我们可以从开发一个具有单个隐藏层的简单多层感知器模型开始。

嵌入表示这个词是一个真正的创新，我们将通过一个相对简单的神经网络展示2011年被认为是世界级的结果。

让我们开始导入的类并为这种模式所要求的功能和初始化随机数生成器的恒定值，以确保我们可以很容易地重现的结果。

 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
          # MLP for the IMDB problem 
         
          import  
          numpy 
         
          from  
          keras 
          . 
          datasets  
          import  
          imdb 
         
          from  
          keras 
          . 
          models  
          import  
          Sequential 
         
          from  
          keras 
          . 
          layers  
          import  
          Dense 
         
          from  
          keras 
          . 
          layers  
          import  
          Flatten 
         
          from  
          keras 
          . 
          layers 
          . 
          embeddings  
          import  
          Embedding 
         
          from  
          keras 
          . 
          preprocessing  
          import  
          sequence 
         
          # fix random seed for reproducibility 
         
          seed 
            
          = 
            
          7 
         
          numpy 
          . 
          random 
          . 
          seed 
          ( 
          seed 
          )

接下来，我们将加载IMDB数据集。我们将简化数据集，正如单词嵌入一节中所讨论的那样。只会加载前5,000个单词。

我们还将使用50％/ 50％的数据集拆分进行培训和测试。这是一种很好的标准拆分方法。

 
           1 
         
           2 
         
           3 
         
          # load the dataset but only keep the top n words, zero the rest 
         
          top_words 
            
          = 
            
          5000

我们将以500字为单位限制评论，截断较长评论和零填充较短评论。

 
           1 
         
           2 
         
           3 
         
          max_words 
            
          = 
            
          500 
         
          X_train 
            
          = 
            
          sequence 
          . 
          pad_sequences 
          ( 
          X_train 
          , 
            
          maxlen 
          = 
          max_words 
          ) 
         
          X_test 
            
          = 
            
          sequence 
          . 
          pad_sequences 
          ( 
          X_test 
          , 
            
          maxlen 
          = 
          max_words 
          )

现在我们可以创建我们的模型。我们将使用嵌入层作为输入层，将词汇表设置为5,000，将字矢量大小设置为32维，将input_length设置为500.第一层的输出将是32×500大小的矩阵，如上一节所述。

我们将嵌入层输出展平为一维，然后使用一个250单位的密集隐藏层和整流器激活功能。输出层有一个神经元，并将使用sigmoid激活输出0和1的值作为预测。

该模型使用对数损失，并使用有效的ADAM优化程序进行优化。

 
     
      
       
           1 
         

           2 
         

           3 
         

           4 
         

           5 
         

           6 
         

           7 
         

           8 
         
 
        
          # create the model 
         
 
          model 
            
          = 
            
          Sequential 
          ( 
          ) 
         
 
          model 
          . 
          add 
          ( 
          Embedding 
          ( 
          top_words 
          , 
          nput_length 
          = 
          max_words 
          ) 
          ) 
         
 
          model 
          . 
          add 
          ( 
          Flatten 
          ( 
          ) 
          ) 
         
 
          model 
          . 
          add 
          ( 
          Dense 
          ( 
          250 
          , 
            
          activation 
          = 
          'relu' 
          ) 
          ) 
         
 
          model 
          . 
          add 
          ( 
          Dense 
          ( 
          1 
          , 
            
          activation 
          = 
          'sigmoid' 
          ) 
          ) 
         
 
          model 
          . 
          compile 
          ( 
          loss 
          = 
          'binary_crossentropy' 
          , 
            
          optimizer 
          = 
          'adam' 
          , 
            
          metrics 
          = 
          [ 
          'accuracy' 
          ] 
          ) 
         
 
          print 
          ( 
          model 
          . 
          summary 
          ( 
          ) 
          ) 
         
 
      
 
     
   

我们可以适应模型并在训练时使用测试集作为验证。这个模型非常快速，因此我们将使用很少的训练时期，在这种情况下只有2个。

有很多数据，所以我们将使用128的批量大小。在训练模型后，我们评估其在测试数据集上的准确性。

 
     
      
       
           1 
         

           2 
         

           3 
         

           4 
         

           5 
         
 
        
          # Fit the model 
         
 
          model 
          . 
          fit 
          ( 
          X_train 
          , 
            
          y_train 
          , 
            
          validation_data 
          = 
          ( 
          X_test 
          , 
            
          y_test 
          ) 
          , 
            
          epochs 
          = 
          2 
          , 
            
          batch_size 
          = 
          128 
          , 
            
          verbose 
          = 
          2 
          ) 
         
 
          # Final evaluation of the model 
         
 
          scores 
            
          = 
            
          model 
          . 
          evaluate 
          ( 
          X_text 
          , 
            
          y_test 
          , 
            
          verbose 
          = 
          0 
          ) 
         
 
          print 
          ( 
          "Accuracy: %.2f%%" 
            
          % 
            
          ( 
          scores 
          [ 
          1 
          ] 
          * 
          100 
          ) 
          ) 
         
 
      
 
     
   

运行此示例适合模型并总结估计的性能。我们可以看到，这个非常简单的模型获得了近86.94％的分数，这是在原始论文的附近，只需很少的努力。

 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           Train on 25000 samples, validate on 25000 samples 
         
           Epoch 1/2 
         
           39s - loss: 0.5160 - acc: 0.7040 - val_loss: 0.2982 - val_acc: 0.8716 
         
           Epoch 2/2 
         
           37s - loss: 0.1897 - acc: 0.9266 - val_loss: 0.3143 - val_acc: 0.8694 
         
           Accuracy: 86.94%

我确信如果我们训练这个网络，我们可以做得更好，可能使用更大的嵌入并添加更多的隐藏层。我们尝试不同的网络类型。

IMDB数据集的一维卷积神经网络模型

设计卷积神经网络以尊重图像数据中的空间结构，同时对场景中学习对象的位置和方向具有鲁棒性。

该相同原理可用于序列，例如电影评论中的一维单词序列。使CNN模型对学习识别图像中的对象具有吸引力的相同属性可以帮助学习单词段落中的结构，即对特征的特定位置的技术不变性。

Keras分别支持Conv1D和MaxPooling1D类的一维卷积和池化。

再次，让我们导入此示例所需的类和函数，并将随机数生成器初始化为常量值，以便我们可以轻松地重现结果。

 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
           8 
         
           9 
         
           10 
         
           11 
         
           12 
         
           13 
         
          # CNN for the IMDB problem 
         
          import  
          numpy 
         
          from  
          keras 
          . 
          datasets  
          import  
          imdb 
         
          from  
          keras 
          . 
          models  
          import  
          Sequential 
         
          from  
          keras 
          . 
          layers  
          import  
          Dense 
         
          from  
          keras 
          . 
          layers  
          import  
          Flatten 
         
          from  
          keras 
          . 
          layers 
          . 
          convolutional  
          import  
          Conv1D 
         
          from  
          keras 
          . 
          layers 
          . 
          convolutional  
          import  
          MaxPooling1D 
         
          from  
          keras 
          . 
          layers 
          . 
          embeddings  
          import  
          Embedding 
         
          from  
          keras 
          . 
          preprocessing  
          import  
          sequence 
         
          # fix random seed for reproducibility 
         
          seed 
            
          = 
            
          7 
         
          numpy 
          . 
          random 
          . 
          seed 
          ( 
          seed 
          )

我们也可以像以前一样加载和准备我们的IMDB数据集。

 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           7 
         
          # load the dataset but only keep the top n words, zero the rest 
         
          top_words 
            
          = 
            
          5000 
         
          ( 
          X_train 
          , 
            
          y_train 
          ) 
          , 
            
          ( 
          X_test 
          , 
            
          y_test 
          ) 
            
          = 
          load_data 
          ( 
          num_words 
          = 
          top_words 
          ) 
         
          # pad dataset to a maximum review length in words 
         
          max_words 
            
          = 
            
          500 
         
          X_train 
            
          = 
            
          sequence 
          . 
          pad_sequences 
          ( 
          X_train 
          , 
            
          maxlen 
          = 
          max_words 
          ) 
         
          X_test 
            
          = 
            
          sequence 
          . 
          pad_sequences 
          ( 
          X_test 
          , 
            
          maxlen 
          = 
          max_words 
          )

我们现在可以定义我们的卷积神经网络模型。这次，在嵌入输入层之后，我们插入一个Conv1D层。该卷积层具有32个特征映射，并且一次读取嵌入的单词表示3个向量元素。

卷积层之后是1D max pooling layer，其长度和步幅为2，使卷积层的特征映射的大小减半。网络的其余部分与上面的神经网络相同。

 
     
      
       
           1 
         

           2 
         

           3 
         

           4 
         

           5 
         

           6 
         

           7 
         

           8 
         

           9 
         

           10 
         
 
        
          # create the model 
         
 
          model 
            
          = 
            
          Sequential 
          ( 
          ) 
         
 
          model 
          . 
          add 
          ( 
          Embedding 
          ( 
          top_words 
          , 
            
          input_length 
          = 
          max_words 
          ) 
          ) 
         
 
          model 
          . 
          add 
          ( 
          Conv1D 
          ( 
          filters 
          = 
          32 
          , 
          padding 
          = 
          'same' 
          , 
            
          activation 
          = 
          'relu' 
          ) 
          ) 
         
 
          model 
          . 
          add 
          ( 
          MaxPooling1D 
          ( 
          pool_size 
          = 
          2 
          ) 
          ) 
         
 
          model 
          . 
          add 
          ( 
          Flatten 
          ( 
          ) 
          ) 
         
 
          model 
          . 
          add 
          ( 
          Dense 
          ( 
          250 
          , 
            
          activation 
          = 
          'relu' 
          ) 
          ) 
         
 
          model 
          . 
          add 
          ( 
          Dense 
          ( 
          1 
          , 
            
          activation 
          = 
          'sigmoid' 
          ) 
          ) 
         
 
          model 
          . 
          compile 
          ( 
          loss 
          = 
          'binary_crossentropy' 
          , 
            
          optimizer 
          = 
          'adam' 
          , 
            
          metrics 
          = 
          [ 
          'accuracy' 
          ] 
          ) 
         
 
          print 
          ( 
          model 
          . 
          summary 
          ( 
          ) 
          ) 
         
 
      
 
     
   

我们也像以前一样适应网络。

 
     
      
       
           1 
         

           2 
         

           3 
         

           4 
         

           5 
         
 
        
          # Fit the model 
         
 
          model 
          . 
          fit 
          ( 
          X_train 
          , 
            
          y_train 
          , 
            
          validation_data 
          = 
          ( 
          X_test 
          , 
            
          y_test 
          ) 
          , 
            
          epochs 
          = 
          2 
          , 
            
          batch_size 
          = 
          128 
          , 
            
          verbose 
          = 
          2 
          ) 
         
 
          # Final evaluation of the model 
         
 
          scores 
            
          = 
            
          model 
          . 
          evaluate 
          ( 
          X_test 
          , 
            
          y_test 
          , 
            
          verbose 
          = 
          0 
          ) 
         
 
          print 
          ( 
          "Accuracy: %.2f%%" 
            
          % 
            
          ( 
          scores 
          [ 
          1 
          ] 
          * 
          100 
          ) 
          ) 
         
 
      
 
     
   

运行该示例，我们首先会看到网络结构的摘要。我们可以看到我们的卷积层保留了32维输入的嵌入输入层的维度，最多500个字。池化层通过将其减半来压缩此表示。

运行该示例对上述神经网络模型提供了一个小但令人欢迎的改进，准确率接近87.79％。

 
           1 
         
           2 
         
           3 
         
           4 
         
           5 
         
           6 
         
           Train on 25000 samples, validate on 25000 samples 
         
           Epoch 1/2 
         
           38s - loss: 0.4451 - acc: 0.7640 - val_loss: 0.3107 - val_acc: 0.8660 
         
           Epoch 2/2 
         
           39s - loss: 0.2373 - acc: 0.9064 - val_loss: 0.2909 - val_acc: 0.8779 
         
           Accuracy: 87.79%

同样，存在进一步优化的大量机会，例如使用更深和/或更大的卷积层。一个有趣的想法是将最大池层设置为使用500的输入长度。这会将每个要素图压缩为单个32长度向量，并可以提高性能。

芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
开心蒋泳频
从无比抗拒来上课到接受，感动，收获～看着波哥成长，晶晶幸福笑容满面。感觉自己做的事情很有意义，很开心！还有3个感召目标就是还有三个有缘人，哈哈。明天感召去明日计划：8：30-11：00小公益11：00-21点上班，感召图片发自App图片发自App图片发自App
放下是一段成长的修行小莳玥
人来到这个世界上，只有两件事：生和死。一件事已经做完了，另一件你还急什么呢?是人，都有七情六欲。是心，都有喜怒哀乐，这些再正常不过了。别总抱怨自己活得累，过得辛苦。永远记住：舒坦是留给死人的。苦，才是生活；累，才是工作；变，才是命运；忍，才是历练；容，才是智慧；静，才是修养；舍，才会得到；做，才会拥有。人生，活得太清楚，才是最大的不明白。有些事，看得很清，却说不清；有些人，了解很深，却猜不透；有些
活给自己看，笑容才灿烂听着了么
白岩松说“有时候，我们活得很累，并非生活过于刻薄，而是我们太容易被外界的氛围所感染，被他人的情绪所左右。”心情是自己的。若只是活在别人的眼里、嘴里，便掌握不了让自己开心的主动权。人活着，不是为了活给别人看的，唯有做最真实的自己，活给自己看，笑容才灿烂。诚然，世事纷繁复杂，人人都有一张嘴，管也管不了。永远有人欣赏你，也永远有人批评你，不可能做到让所有人都满意，开心做自己才是最重要的。人生苦短，有太多
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
【华为OD机试真题2023B卷 JAVA&JS】We Are A Team 若博豆 java 算法华为 javascript
华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
2.0践行没有你的参与就不完美 x秀丽x
亲爱的伙伴们早上好，今天早上我们开了一次班委竞选的会议，全程只有20多个人参与，宫班本着对大家负责任的态度告诉我们，此次竞选作废，原因是这没有达到2.0的100%参会要求，如果没有大家的参与那么这个班委选出来还有什么意义，这说明选出来的人也是不一定是我们大家心目中认可的那个人，所以为了让大家的这个90天能够更好的激发出自己的的“做”的能力，那么要从第一次竞选班委的会议开始做到100%出席会议，竞选
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
阶段总结反思轻争
马上就要进入10月份了，今天做一下前段时间的总结和反思。前段时间，日更、英语、健身、护肤坚持的比较好。阅读、书法坚持的不好。1.中间被迫停更半个多月，其余时间一直在坚持日更挑战。偶尔也有不想写的时候，就做一下摘抄。因为阅读（输入）没跟上来，所以写作（输出）质量有待进一步加强。2.英语做到了一周至少学习5天，每次不少于30分钟，但是小班课没有跟上更新速度，下一步要争取利用零碎时间补听小班课。3.减肥
冬天短期的暴利小生意有哪些？那些小生意适合新手做？一起高省
短期生意不失为创业的一个商机，不过短期生意的商机是转瞬即逝的，而且这类生意也很难作为长期的生意去做，那冬天短期暴利小生意查看更多关于短期暴利小生意的文章有哪些呢?给大家先推荐一个2023年风口项目吧，真很不错的项目，全程零投资，当做副业来做真的很稳定，不管你什么阶层的人，或多或少都网购吧？你们知道网购是可以拿提成，拿返利，拿分佣的吗？你们知道很多优惠券群里面，天天群主和管理发一些商品吗？他们其实在
怎么做淘客赚钱(2022最新免费淘客盈利的方法) 高省_飞智666600
很多人都不知道什么是淘宝客，今天小编为大家解答一下吧。淘宝客，现在简称淘客，是时下比较流行的一个词语，特质为淘宝店推广商品获取提成的人，这些人没有自己的产品，只是在淘宝里面选择适合自己的产品，在自己比较熟悉的领域推广，把产品卖出去之后，会从淘宝店家那里获得百分之五到百分之五十左右的佣金。淘宝客付出的是什么呢？时间。你需要花时间去选适合自己推广的产品，需要花时间去选自己的推广方法，如果你打算自己做个
那个严厉的启蒙老师小米星的天空
本文参加鹏哥教师节征文活动我的启蒙老师李老师，大概是唯一动手打过我，但是我仍然很感恩的老师吧。李老师当年四十多岁，擅长珠心算教学，算是我们乡镇小学的王牌老师。李老师很严厉，不仅要骂学生，还要动手打人，他的大眼睛一瞪，全班同学都瑟瑟发抖。在九十年代，家长不像现在这样宠溺孩子。许多家长都跟老师说，管得严一点，不听话就给我打。那时候棍棒教育是很正常的，教室里的木质米尺，常常因为被用来打调皮男生的屁股而折
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
EIO国际确定性的交易（3/10）资管，资金委托安全吗？古城鹏哥
大家可能都知道资金托管，账户是自己开，钱在自己的账户上，密码是由自己掌控，别人提不走你账户的资金，每天可以看下到自己的账户，也可以看到交易流水。现金只能提到自己的银行卡中。账户由技术人员或操作人员，或者是机构团队帮你操作账户，产生盈利和收入，以获得的利润来分配盈利，技术强硬和做的时间久了过硬技术团队，会保证你的资金本金，不会让你的本金亏损的按照一定比例分配收入。所以在这个过程当中一定要看清楚技术的
2018-07-20 韻梅
念亲爱的好感谢亲爱的每天照顾我们！因为有你我们心里踏实！念儿子的好儿子感谢你昨晚为我们煎手抓饼，让我们感到你满满的爱与幸福:你煎的与外边买的没有区别，也是脆脆的金黄黄的！我也不担心你的温饱问题，因为你能自己做简单的点心啊！儿子已经长大了，妈妈可要享福了咯！儿子加油！只要你敢想敢行动定能会成功的！
我希望，你快乐浅香笑
你总说，你过于沉闷我知道，那只是你的外衣你低垂的眉眼里常盛开你从未言语的笑意你总说，请忽视你的悲伤我知道，你对他人暖意的安慰是如此的渴望！其实那滑落的泪珠不是没人心疼你总说，你喜欢一个人的角落在那里你安然的做自己我知道，人生来就是群居动物没谁喜欢一直孤独的旅程你总说，总说……我知道，都知道试着放开自己吧，给予他人你的美丽，拥抱他人的善意你知道的，我希望，你快乐啊
4招写出高价值文章 zhiliner
文章写得泛泛是因为思考得不够深，思考得越深文章会越有价值。拿到一个主题一定要去深入挖掘事件背后的东西，比如人物困境以及趋势性的东西。写作过程中有几个深度思考的方法一、解剖，让旧素材焕发新意作为一个写作者，我们能够做的最大贡献，就是给出自己看世界的角度。解剖其实就是把这个话题相关的信息都列出来，详细的列出来，看清楚它的内部。我们看到一个老话题或者一段旧素材的时候，不要只看这个素材或者话题本身，一定要
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
2022-08-28 蔚蓝一片晴
初三暑假培训收获点滴从8月25至8月27日三天两晚的培训结束了，回到家中，该静下心来整理一下触动心灵的收获，成为成长的积淀。1.在优秀团队中快速成长与提升，做一名反思成长型教师一名专业型教师的教学指导包括了教学原理知识、案例知识、策略知识。面对教学中的遇到的有趣的情形、问题会去研究其理，寻找更好的教法学法对策。从新手到成熟型教师，再走向专业型教师，需要的是觉醒与反思，多进行案例研究，从案例中观察、
中原焦点团队网络初中级30期阴丽丽坚持分享第三百八十八次2022.10.18分享约练次数（74）咨询师（6）来访者（53）观察者（15）阴丽丽
今天是忙碌的一天，一早起来，总想着找点把事情弄完，可总也弄不完。就这样弄着吧！孩子的事，自己的事都在那里搁置着，不想做，有点欧！今天总体还不错，只是在下午起床时走神了俩小时，也算是给自己的放松吧！今日难得1.儿子乖巧、听话，努力配合，一天下来也是忙忙碌碌，这真的很难得！2.儿子今天录的视频被班主任认可，这真的很难得3.我今天早上做核酸时，自己把教案整了一下，这真的很难得
做好总书记心中的新青年漂洋过海来看岐岐
习近平总书记在党的二十大报告中强调：“广大青年要坚定不移听党话、跟党走，怀抱梦想又脚踏实地，敢想敢为又善作善成，立志做有理想、敢担当、能吃苦、肯奋斗的新时代好青年。”青年的本领要从基层一线的服务中来，主动跟群众交友，促膝长谈交心，深入基层，为民排忧解难。俗话说，事业都是拼搏出来的，但事业取得成功的前提是要有过硬的本领、足够精湛的技艺，只要肯学习，坚持学以致用，努力求得真知、锤炼本领，就一定会有所收
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

深度学习CNN模型预测电影评论中的情感问题

IMDB电影评论情绪问题描述

使用Keras加载IMDB数据集

Word嵌入

用于IMDB数据集的简单多层感知器模型

IMDB数据集的一维卷积神经网络模型

你可能感兴趣的:(计算机类,人工智能,深度学习,计算机毕业设计,计算机毕设代做,tensorflow,keras,机器学习算法实现,本科生毕业设计,CNN)