张酒肉

影评文本分类

电影评论分类：二分类问题

使用IMDB 数据集，它包含来自互联网电影数据库（IMDB）的50 000 条严重两极分
化的评论。数据集被分为用于训练的25 000 条评论与用于测试的25 000 条评论，训练集和测试集都包含50% 的正面评论和50% 的负面评论。

加载IMDB数据集

IMDB 数据集内置于Keras 库。它已经过预处理：评论（单词序列）已经被转换为整数序列，其中每个整数代表字典中的某个单词。

imdb = keras.datasets.imdb
(train_data,train_labels), (test_data, test_labels) = imdb.load_data(num_words=10000)

参数num_words=10000 的意思是仅保留训练数据中前10 000 个最常出现的单词。低频单词将被舍弃。这样得到的向量数据不会太大，便于处理。

探索数据

train_data 和test_data 这两个变量都是评论组成的列表，每条评论又是单词索引组成
的列表（表示一系列单词）。train_labels 和test_labels 都是0 和1 组成的列表，其中0
代表负面（negative），1 代表正面（positive）。

print("Training entries: {}, labels: {}".format(len(train_data), len(train_labels)))

>>Training entries: 25000, labels: 25000

print(train_data[0])

>>[1, 14, 22, 16, 43, 530, 973, 1622, 1385, 65, 458, 4468, 66, 3941, 4, 173, 36, 256, 5, 25, 100, 43, 838, 112, 50, 670, 2, 9, 35, 480, 284, 5, 150, 4, 172, 112, 167, 2, 336, 385, 39, 4, 172, 4536, 1111, 17, 546, 38, 13, 447, 4, 192, 50, 16, 6, 147, 2025, 19, 14, 22, 4, 1920, 4613, 469, 4, 22, 71, 87, 12, 16, 43, 530, 38, 76, 15, 13, 1247, 4, 22, 17, 515, 17, 12, 16, 626, 18, 2, 5, 62, 386, 12, 8, 316, 8, 106, 5, 4, 2223, 5244, 16, 480, 66, 3785, 33, 4, 130, 12, 16, 38, 619, 5, 25, 124, 51, 36, 135, 48, 25, 1415, 33, 6, 22, 12, 215, 28, 77, 52, 5, 14, 407, 16, 82, 2, 8, 4, 107, 117, 5952, 15, 256, 4, 2, 7, 3766, 5, 723, 36, 71, 43, 530, 476, 26, 400, 317, 46, 7, 4, 2, 1029, 13, 104, 88, 4, 381, 15, 297, 98, 32, 2071, 56, 26, 141, 6, 194, 7486, 18, 4, 226, 22, 21, 134, 476, 26, 480, 5, 144, 30, 5535, 18, 51, 36, 28, 224, 92, 25, 104, 4, 226, 65, 16, 38, 1334, 88, 12, 16, 283, 5, 16, 4472, 113, 103, 32, 15, 16, 5345, 19, 178, 32]

print(train_labels[0])

>>1

len(train_data[0]), len(train_data[1])

>>(218, 189)

将整数转换回字词

了解如何将整数转换回文本可能很有用。在以下代码中，将创建一个辅助函数来查询包含整数到字符串映射的字典对象。

# A dictionary mapping words to an integer index
word_index = imdb.get_word_index()

# The first indices are reserved
word_index = {k:(v+3) for k,v in word_index.items()}
word_index[""] = 0
word_index[""] = 1
word_index[""] = 2  # unknown
word_index[""] = 3

reverse_word_index = dict([(value, key) for (key, value) in word_index.items()])

def decode_review(text):
    return ' '.join([reverse_word_index.get(i, '?') for i in text])

decode_review(train_data[0])

>>" this film was just brilliant casting location scenery story direction everyone's really suited the part they played and you could just imagine being there robert  is an amazing actor and now the same being director  father came from the same scottish island as myself so i loved the fact there was a real connection with this film the witty remarks throughout the film were great it was just brilliant so much that i bought the film as soon as it was released for  and would recommend it to everyone to watch and the fly fishing was amazing really cried at the end it was so sad and you know what they say if you cry at a film it must have been good and this definitely was also  to the two little boy's that played the  of norman and paul they were just brilliant children are often left out of the  list i think because the stars that play them all grown up are such a big profile for the whole film but these children are amazing and should be praised for what they have done don't you think the whole story was so lovely because it was true and was someone's life after all that was shared with us all"

准备数据

不能将整数序列直接输入神经网络。需要将列表转换为张量。转换方法有以下两种。

填充列表，使其具有相同的长度，再将列表转换成形状为 (samples, word_indices)
的整数张量，然后网络第一层使用能处理这种整数张量的层（即Embedding 层，本书后面会详细介绍）。
对列表进行 one-hot 编码，将其转换为 0 和 1 组成的向量。举个例子，序列[3, 5]将会被转换为10 000 维向量，只有索引为3 和5 的元素是1，其余元素都是0。然后网络第一层可以用Dense 层，它能够处理浮点数向量数据。

# 影评转换为张量。由于影评的长度必须相同，使用 pad_sequences 函数将长度标准化
train_data = keras.preprocessing.sequence.pad_sequences(train_data,
                                                        value=word_index[""],
                                                        padding='post',
                                                        maxlen=256)

test_data = keras.preprocessing.sequence.pad_sequences(test_data,
                                                       value=word_index[""],
                                                       padding='post',
                                                       maxlen=256)

len(train_data[0]), len(train_data[1])

>>(256, 256)

# 第一条影评
print(train_data[0])

>>[   1   14   22   16   43  530  973 1622 1385   65  458 4468   66 3941
    4  173   36  256    5   25  100   43  838  112   50  670    2    9
   35  480  284    5  150    4  172  112  167    2  336  385   39    4
  172 4536 1111   17  546   38   13  447    4  192   50   16    6  147
 2025   19   14   22    4 1920 4613  469    4   22   71   87   12   16
   43  530   38   76   15   13 1247    4   22   17  515   17   12   16
  626   18    2    5   62  386   12    8  316    8  106    5    4 2223
 5244   16  480   66 3785   33    4  130   12   16   38  619    5   25
  124   51   36  135   48   25 1415   33    6   22   12  215   28   77
   52    5   14  407   16   82    2    8    4  107  117 5952   15  256
    4    2    7 3766    5  723   36   71   43  530  476   26  400  317
   46    7    4    2 1029   13  104   88    4  381   15  297   98   32
 2071   56   26  141    6  194 7486   18    4  226   22   21  134  476
   26  480    5  144   30 5535   18   51   36   28  224   92   25  104
    4  226   65   16   38 1334   88   12   16  283    5   16 4472  113
  103   32   15   16 5345   19  178   32    0    0    0    0    0    0
    0    0    0    0    0    0    0    0    0    0    0    0    0    0
    0    0    0    0    0    0    0    0    0    0    0    0    0    0
    0    0    0    0]

构建网络

输入数据是向量，而标签是标量（1和0），这是最简单的情况。有一类网络在这种问题上表现很好，就是带有relu激活的全连接层（Dense）的简单堆叠。

# input shape is the vocabulary count used for the movie reviews (10,000 words)
vocab_size = 10000

model = keras.Sequential()
model.add(keras.layers.Embedding(vocab_size, 16))
model.add(keras.layers.GlobalAveragePooling1D())
model.add(keras.layers.Dense(16, activation=tf.nn.relu))
model.add(keras.layers.Dense(1, activation=tf.nn.sigmoid))

model.summary()

# 第一层是 Embedding 层。该层会在整数编码的词汇表中查找每个字词-索引的嵌入向量。模型在接受训练时会学习这些向量。这些向量会向输出数组添加一个维度。
# 生成的维度为：(batch, sequence, embedding)
# 接下来，一个 GlobalAveragePooling1D 层通过对序列维度求平均值，针对每个样本返回一个长度固定的输出向量。
# 这样，模型便能够以尽可能简单的方式处理各种长度的输入
# 该长度固定的输出向量会传入一个全连接 (Dense) 层（包含 16 个隐藏单元）
# 最后一层与单个输出节点密集连接。应用 sigmoid 激活函数后，结果是介于 0 到 1 之间的浮点值，表示概率或置信水平。

>>
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
embedding (Embedding)        (None, None, 16)          160000    
_________________________________________________________________
global_average_pooling1d (Gl (None, 16)                0         
_________________________________________________________________
dense (Dense)                (None, 16)                272       
_________________________________________________________________
dense_1 (Dense)              (None, 1)                 17        
=================================================================
Total params: 160,289
Trainable params: 160,289
Non-trainable params: 0
_________________________________________________________________

配置模型使用优化器和损失函数

由于面对的是一个二分类问题，网络输出是一个概率值（网络最后一层使用sigmoid 激活函数，仅包含一个单元），那么最好使用binary_crossentropy（二元交叉熵）损失。这并不是唯一可行的选择，比如你还可以使用mean_squared_error（均方误差）。但对于输出概率值的模型，交叉熵（crossentropy）往往是最好的选择。交叉熵是来自于信息论领域的概念，用于衡量概率分布之间的距离，在这个例子中就是真实分布与预测值之间的距离。

model.compile(optimizer=tf.train.AdamOptimizer(),
              loss='binary_crossentropy',
              metrics=['accuracy'])

留出验证集

x_val = train_data[:10000]
partial_x_train = train_data[10000:]

y_val = train_labels[:10000]
partial_y_train = train_labels[10000:]

训练模型

# 用有 512 个样本的小批次训练模型 40 个周期。这将对 x_train 和 y_train 张量中的所有样本进行 40 次迭代。
# 在训练期间，监控模型在验证集的 10000 个样本上的损失和准确率：
history = model.fit(partial_x_train,
                    partial_y_train,
                    epochs=40,
                    batch_size=512,
                    validation_data=(x_val, y_val),
                    verbose=1)

>>
Train on 15000 samples, validate on 10000 samples
WARNING:tensorflow:From E:\Anaconda3\Anaconda3_install\lib\site-packages\tensorflow\python\ops\math_ops.py:3066: to_int32 (from tensorflow.python.ops.math_ops) is deprecated and will be removed in a future version.
Instructions for updating:
Use tf.cast instead.
Epoch 1/40
15000/15000 [==============================] - 1s 50us/sample - loss: 0.6912 - acc: 0.6431 - val_loss: 0.6881 - val_acc: 0.7217
Epoch 2/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.6828 - acc: 0.7466 - val_loss: 0.6772 - val_acc: 0.7467
Epoch 3/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.6660 - acc: 0.7658 - val_loss: 0.6565 - val_acc: 0.7680
Epoch 4/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.6377 - acc: 0.7761 - val_loss: 0.6250 - val_acc: 0.7729
Epoch 5/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.5980 - acc: 0.8033 - val_loss: 0.5849 - val_acc: 0.7972
Epoch 6/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.5505 - acc: 0.8249 - val_loss: 0.5409 - val_acc: 0.8117
Epoch 7/40
15000/15000 [==============================] - 1s 44us/sample - loss: 0.5003 - acc: 0.8397 - val_loss: 0.4951 - val_acc: 0.8294
Epoch 8/40
15000/15000 [==============================] - 1s 43us/sample - loss: 0.4523 - acc: 0.8573 - val_loss: 0.4549 - val_acc: 0.8410
Epoch 9/40
15000/15000 [==============================] - 1s 43us/sample - loss: 0.4096 - acc: 0.8701 - val_loss: 0.4203 - val_acc: 0.8516
Epoch 10/40
15000/15000 [==============================] - 1s 43us/sample - loss: 0.3729 - acc: 0.8810 - val_loss: 0.3927 - val_acc: 0.8556
Epoch 11/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.3424 - acc: 0.8876 - val_loss: 0.3703 - val_acc: 0.8642
Epoch 12/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.3169 - acc: 0.8959 - val_loss: 0.3531 - val_acc: 0.8669
Epoch 13/40
15000/15000 [==============================] - 1s 43us/sample - loss: 0.2959 - acc: 0.9011 - val_loss: 0.3383 - val_acc: 0.8718
Epoch 14/40
15000/15000 [==============================] - 1s 44us/sample - loss: 0.2771 - acc: 0.9070 - val_loss: 0.3273 - val_acc: 0.8761
Epoch 15/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.2611 - acc: 0.9111 - val_loss: 0.3183 - val_acc: 0.8766
Epoch 16/40
15000/15000 [==============================] - 1s 43us/sample - loss: 0.2468 - acc: 0.9168 - val_loss: 0.3109 - val_acc: 0.8766
Epoch 17/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.2334 - acc: 0.9210 - val_loss: 0.3048 - val_acc: 0.8806
Epoch 18/40
15000/15000 [==============================] - 1s 43us/sample - loss: 0.2216 - acc: 0.9249 - val_loss: 0.2997 - val_acc: 0.8825
Epoch 19/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.2109 - acc: 0.9263 - val_loss: 0.2953 - val_acc: 0.8831
Epoch 20/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.2013 - acc: 0.9311 - val_loss: 0.2925 - val_acc: 0.8831
Epoch 21/40
15000/15000 [==============================] - 1s 43us/sample - loss: 0.1913 - acc: 0.9369 - val_loss: 0.2900 - val_acc: 0.8844
Epoch 22/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.1831 - acc: 0.9399 - val_loss: 0.2880 - val_acc: 0.8849
Epoch 23/40
15000/15000 [==============================] - 1s 43us/sample - loss: 0.1747 - acc: 0.9437 - val_loss: 0.2876 - val_acc: 0.8847
Epoch 24/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.1675 - acc: 0.9466 - val_loss: 0.2865 - val_acc: 0.8848
Epoch 25/40
15000/15000 [==============================] - 1s 43us/sample - loss: 0.1601 - acc: 0.9500 - val_loss: 0.2855 - val_acc: 0.8856
Epoch 26/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.1535 - acc: 0.9529 - val_loss: 0.2866 - val_acc: 0.8840
Epoch 27/40
15000/15000 [==============================] - 1s 43us/sample - loss: 0.1472 - acc: 0.9550 - val_loss: 0.2864 - val_acc: 0.8856
Epoch 28/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.1412 - acc: 0.9570 - val_loss: 0.2875 - val_acc: 0.8851
Epoch 29/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.1359 - acc: 0.9601 - val_loss: 0.2893 - val_acc: 0.8851
Epoch 30/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.1304 - acc: 0.9613 - val_loss: 0.2891 - val_acc: 0.8864
Epoch 31/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.1248 - acc: 0.9644 - val_loss: 0.2906 - val_acc: 0.8861
Epoch 32/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.1198 - acc: 0.9671 - val_loss: 0.2924 - val_acc: 0.8855
Epoch 33/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.1150 - acc: 0.9682 - val_loss: 0.2951 - val_acc: 0.8846
Epoch 34/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.1106 - acc: 0.9693 - val_loss: 0.2976 - val_acc: 0.8851
Epoch 35/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.1065 - acc: 0.9704 - val_loss: 0.3005 - val_acc: 0.8840
Epoch 36/40
15000/15000 [==============================] - 1s 43us/sample - loss: 0.1023 - acc: 0.9723 - val_loss: 0.3024 - val_acc: 0.8833
Epoch 37/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.0980 - acc: 0.9737 - val_loss: 0.3054 - val_acc: 0.8828
Epoch 38/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.0942 - acc: 0.9755 - val_loss: 0.3093 - val_acc: 0.8816
Epoch 39/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.0911 - acc: 0.9767 - val_loss: 0.3135 - val_acc: 0.8816
Epoch 40/40
15000/15000 [==============================] - 1s 42us/sample - loss: 0.0871 - acc: 0.9781 - val_loss: 0.3166 - val_acc: 0.8824

评估模型

results = model.evaluate(test_data, test_labels)
print(results)

25000/25000 [==============================] - 0s 16us/sample - loss: 0.3390 - acc: 0.8702
[0.338996932888031, 0.87016]

绘制准确率和损失的变化图

# model.fit() 返回一个 History 对象，该对象包含一个字典，其中包括训练期间发生的所有情况：
history_dict = history.history
history_dict.keys()

>>dict_keys(['loss', 'acc', 'val_loss', 'val_acc'])

import matplotlib.pyplot as plt

acc = history.history['acc']
val_acc = history.history['val_acc']
loss = history.history['loss']
val_loss = history.history['val_loss']

epochs = range(1, len(acc) + 1)

# "bo" is for "blue dot"
plt.plot(epochs, loss, 'bo', label='Training loss')
# b is for "solid blue line"
plt.plot(epochs, val_loss, 'b', label='Validation loss')
plt.title('Training and validation loss')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()

plt.show()

plt.clf()   # clear figure
acc_values = history_dict['acc']
val_acc_values = history_dict['val_acc']

plt.plot(epochs, acc, 'bo', label='Training acc')
plt.plot(epochs, val_acc, 'b', label='Validation acc')
plt.title('Training and validation accuracy')
plt.xlabel('Epochs')
plt.ylabel('Accuracy')
plt.legend()

plt.show()

参考资料

影评文本分类
Python深度学习

数据标注工具及其对预训练模型性能的影响 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1预训练模型的崛起近年来，预训练模型（Pre-trainedModels）在自然语言处理（NLP）领域取得了显著的成功。这些模型通过在大规模无标注文本数据集上进行预训练，学习到丰富的语言知识和语义表示，并在下游任务中展现出优异的性能。BERT、GPT-3等预训练模型的出现，标志着NLP领域进入了一个新的时代。1.2数据标注的重要性尽管预训练模型展现出强大的能力，但它们仍然需要针对特
大语言模型（LLMs）全面学习指南（非常详细）零基础入门到精通，收藏这一篇就够了网络安全大白科技程序员人工智能语言模型人工智能自然语言处理
大语言模型（LLMs）作为人工智能（AI）领域的一项突破性发展，已经改变了自然语言处理（NLP）和机器学习（ML）应用的面貌。这些模型，包括OpenAI的GPT-4o和Google的gemini系列等，已经展现出了在理解和生成类人文本方面的令人印象深刻的能力，使它们成为各行各业的宝贵工具。如下这份指南将涵盖LLMs的基础知识、训练过程、用例和未来趋势……一.WhatareLargeLanguage
Python API接口君王的羔羊 Python AI python
人工智能机器人EverydayWechat老李API图灵机器人：http://www.turingapi.com/（需求实名制认证，并每天免费数量只有100条）青云客智能聊天机器人：http://api.qingyunke.com/（无须申请，无数量限制，但有点智障，分手神器。分手神器，慎用）智能闲聊（腾讯）：https://ai.qq.com/product/nlpchat.shtml(申请使用
自然语言处理（NLP）技术介绍风吹晚风悠 gpt 人工智能 nlp 自然语言处理
自然语言处理（NLP）是一种涉及计算机和人类语言之间交流的技术。NLP技术可以应用于多个领域，例如机器翻译、情感分析、文本分类、问答系统等。以下是一些NLP技术的示例：机器翻译：NLP技术可用于将一个语言的文本自动翻译成另一个语言。例如，GoogleTranslate和百度翻译等在线翻译工具就使用了NLP技术。情感分析：NLP技术可用于分析文本中的情感和情感倾向。这可以帮助企业了解公众对其产品或服
基于Transformer的医学文本分类：从BERT到BioBERT Evaporator Core 人工智能 #深度学习 #DeepSeek快速入门 transformer 分类 bert
随着自然语言处理（NLP）技术的快速发展，Transformer模型在文本分类、情感分析、机器翻译等任务中取得了显著成果。在医学领域，文本数据（如电子病历、医学文献、临床报告）具有高度的专业性和复杂性，传统的NLP方法往往难以处理。Transformer模型，尤其是BERT及其变体，通过预训练和微调的方式，能够有效捕捉医学文本中的语义信息，为医学文本分类提供了强大的工具。本文将探讨Transfor
TF-IDF：文本挖掘中的关键词提取利器巷955 tf-idf
引言在自然语言处理（NLP）和文本挖掘中，TF-IDF是一种常用的技术，用于评估一个词在文档中的重要性。它不仅在信息检索领域广泛应用，还在文本分类、关键词提取等任务中发挥着重要作用。本文将详细介绍TF-IDF的原理，并通过一个实际的代码示例来展示如何使用TF-IDF从《红楼梦》中提取核心关键词。1.什么是TF-IDF？TF-IDF是一种统计方法，用于评估一个词在文档中的重要性。它由两部分组成：-T
AI 之路——数据分析（1）Pandas小结与框架整理 Robin_Pi 机器学习之路数据分析数据分析 python 人工智能可视化
目录1.写在前面1.1AI之路：1.2工具/技能：2.数据分析2.1数据分析的流程2.2数据的基本操作方法2.2.1Pandas概览2.2.2使用Pandas操作数据的核心(1)选择数据(2)操作数据2.2.2数据详解3.写在最后1.写在前面主要是阶段性框架总结1.1AI之路：数据分析——机器学习——深度学习——CV/NLP1.2工具/技能：Python、NumPy、Pandas、Matplotl
spring boot 基础学习 - 请求参数映射与参数j校验破小孩儿乖 spring boot 学习笔记 spring 请求参数 spring boot spring mvc
springboot支持多种类型的请求参数映射1.简单数据的映射简单数据我们只需要给handler添加相应的形参，保证形参名称和页面请求参数的名称一致，spring就会回自动的帮我们将请求参数进行格式装换并封装到形参中：handler代码：@RequestMapping("paramstest")publicStringsimpleparam(Integerid,Stringusername,Bo
大模型（DeepSeek等）是否会动摇AI工程师的工作？点我头像干啥 Ai 深度学习人工智能 AI编程计算机视觉
引言近年来，人工智能（AI）领域取得了突飞猛进的发展，尤其是大模型（如GPT-3、BERT、DeepSeek等）的出现，极大地推动了自然语言处理（NLP）、计算机视觉（CV）等领域的进步。大模型凭借其强大的泛化能力和广泛的应用场景，逐渐成为AI领域的核心技术之一。然而，随着大模型的普及，一个备受关注的问题浮出水面：大模型是否会动摇AI工程师的工作？本文将从多个角度探讨这一问题，分析大模型对AI工程
深度学习 bert与Transformer的区别联系 Humingway 深度学习 bert transformer
BERT（BidirectionalEncoderRepresentationsfromTransformers）和Transformer都是现代自然语言处理（NLP）中的重要概念，但它们代表不同的层面。理解这两者之间的区别与联系有助于更好地掌握它们在NLP任务中的应用。TransformerTransformer是一种特定的深度学习模型架构，由Vaswani等人在2017年的论文《Attenti
PyTorch深度学习框架进阶学习计划 - 第21天：自然语言处理基础凡人的AI工具箱深度学习 pytorch 学习人工智能 AI编程 AIGC 自然语言处理
PyTorch深度学习框架进阶学习计划-第21天自然语言处理基础今天我们将深入学习自然语言处理(NLP)的基础概念，重点关注词嵌入技术、序列建模原理以及主流模型之间的区别和优缺点。通过理解这些基础知识，你将能够更好地应用PyTorch构建NLP应用。1.词嵌入原理与实现词嵌入(WordEmbeddings)是NLP中的核心概念，它将单词映射到连续向量空间，使得语义相似的词在向量空间中距离较近。为什
渗透攻击零基础学习-XXE（非常详细）零基础入门到精通，收藏这一篇就够了程序员霸哥计算机工具网络安全程序员学习网络 web安全物联网前端安全 python
XXEXXE（PHP5.45之后不解析实体）DTD实体是用于定义引用文本或字符的快捷方式的变量，可内部声明或外部引用。约束通过类别关键词ANY声明的元素，可包含任何可解析数据的组合：同时xxe可进行内网探测读取/etc/hostsPayloadPHP文件读取]>&xxe;file协议读取文件]>&xxe;SVG格式]>&file;数据外带%remote;]>shell.dtd">%int;%sen
AI基于深度学习的代码搜索案例（一）人工智能MOS 人工智能深度学习机器学习
1.背景近年来，人工智能逐渐进入各个领域并展现出了强大的能力。在计算机视觉领域，以ImageNet为例，计算机的图像分类水平已经超过了人类。在自然语言处理(NLP)领域，BERT、XLNet以及MASS也一遍遍的刷新着任务榜单。当人工智能进入游戏领域，也取得了惊人的成绩，在Atari系列游戏中，计算机很容易超过了大部分人类，在围棋比赛中，AlphaGo和AlphaZero也已经超越了人类顶尖棋手。
DeepSeek在供热行业中的应用杨航 AI 人工智能深度学习 python 机器学习算法
目录引言1.1DeepSeek技术概述1.2供暖行业业务挑战1.3DeepSeek在供暖行业的应用前景DeepSeek技术基础2.1深度学习与机器学习2.2自然语言处理（NLP）2.3图像识别与处理2.4数据挖掘与分析供暖行业应用场景3.1设备监控与维护3.1.1设备状态监控3.1.2故障预测与诊断3.1.3维护计划优化3.2能源管理与优化3.2.1能耗数据分析3.2.2热负荷预测3.2.3节能优
应用商店评论分析实战：Python逆向工程破解Google Play加密接口与NLP建模西攻城狮北物联网 python 爬虫实战案例
一、项目概述在移动互联网时代，应用商店中的用户评论成为了开发者优化应用、提升用户体验的重要依据。然而，GooglePlay等应用商店对评论数据进行了加密处理，直接爬取难度较大。本文将介绍如何使用Python逆向工程破解GooglePlay的加密接口，实现对应用商店评论的实时采集，并结合NLP（自然语言处理）技术进行情感分析和主题建模，为开发者提供有价值的数据支持。二、技术选型（一）Python逆向
Transformer大模型实战对比ALBERT与BERT AI天才研究院 AI大模型企业级应用开发实战 Python实战 DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
文章标题在当今人工智能领域的迅速发展中，Transformer大模型无疑成为了自然语言处理（NLP）领域的璀璨明星。为了深入理解这一技术，我们特别撰写了《Transformer大模型实战对比ALBERT与BERT》这篇文章，旨在为广大读者提供一场关于Transformer模型及其实战应用的技术盛宴。关键词：Transformer，BERT，ALBERT，自然语言处理，深度学习，模型对比，实战应用摘
Diffusion Transformer与Differential Transformer：技术创新与应用前景 AI大模型learner 深度学习人工智能机器学习
引言Transformer架构已成为自然语言处理（NLP）和计算机视觉（CV）领域的主流技术。随着技术的不断发展，DiffusionTransformer和DifferentialTransformer等新型架构逐步涌现，为生成模型和注意力机制带来了突破性的进展。本文旨在从科学视角探讨这两种模型的核心原理、技术特点及应用前景。DiffusionTransformer概念与原理DiffusionTr
Vision Transformer (ViT)：将Transformer带入计算机视觉的革命性尝试（代码实现）阿正的梦工坊 Deep Learning DL Papers transformer 计算机视觉深度学习
VisionTransformer(ViT)：将Transformer带入计算机视觉的革命性尝试作为一名深度学习研究者，如果你对自然语言处理（NLP）领域的Transformer架构了如指掌，那么你一定不会对它在序列建模中的强大能力感到陌生。然而，2021年由GoogleResearch团队在ICLR上发表的论文《ANIMAGEISWORTH16x16WORDS:TRANSFORMERSFORIM
NLP常见任务专题介绍（3）-垂直领域的聊天机器人搭建详细教程 AI专题精讲大模型专题系列自然语言处理机器人人工智能
一、整体流程构建垂直领域的聊天机器人需要结合特定行业的需求，采用自然语言处理和机器学习等技术。以下是一个典型的构建流程及相关技术实现：需求分析：明确机器人需要解决的问题范围和功能，例如客户服务、信息查询等。数据收集与预处理：数据收集：从行业相关的网站、论坛、数据库等渠道获取大量专业领域的文本数据。数据清洗：去除广告、无意义回复等噪声数据，确保数据质量。数据标注：对文本进行意图识别和实体识别的标注，
基于 DeepSeek 的自动化运维（适合企业降本增效） Real Man★ 运维自动化
基于DeepSeek的自动化运维解决方案DeepSeek凭借其强大的AI能力（如自然语言处理、时序预测、异常检测），可显著提升运维效率，实现从监控告警到故障自愈的全流程自动化。以下是结合企业级场景的实战方案：一、核心应用场景与实现路径智能监控与告警日志分析：使用DeepSeek-NLP模型自动解析日志，提取关键错误模式（如OutOfMemory、Timeout）。python复制fromdeeps
Adapter-Tuning：高效适配预训练模型的新任务花千树-010 Tuning prompt embedding AIGC 机器学习 chatgpt pytorch
1.引言近年来，预训练语言模型（PLM）如BERT、GPT和T5在自然语言处理（NLP）任务中取得了巨大成功。然而，Fine-Tuning这些大型模型通常需要大量计算资源，并且每个新任务都需要存储一套完整的微调权重，这导致存储成本高昂。Adapter-Tuning作为一种高效的模型调优方法，允许我们在预训练模型的基础上，通过引入轻量级“Adapter”层来进行任务特定的学习。Adapter层只占用
Adobe Firefly 技术浅析（二）：Transformer生成模型爱研究的小牛 AIGC——图像 transformer 深度学习人工智能 AIGC 机器学习
AdobeFirefly的图像生成技术不仅依赖于生成式对抗网络（GAN），还引入了基于Transformer的生成模型。Transformer模型在处理长距离依赖关系和生成复杂图像结构方面具有显著优势。1.基本原理1.1Transformer模型简介Transformer模型最初由Vaswani等人在2017年提出，用于自然语言处理（NLP）任务。其核心是自注意力机制（Self-Attention
如何增强机器学习基础，提升大模型面试通过概率 weixin_40941102 机器学习面试人工智能
我的好朋友没有通过面试所以我给我的好朋友准备了这一篇学习路线随着大模型（如Transformer、GPT-4、LLaMA等）在自然语言处理（NLP）、计算机视觉（CV）和多模态任务中的广泛应用，AI行业的招聘竞争愈发激烈。面试官不仅要求候选人熟练使用深度学习框架（如PyTorch、TensorFlow），还希望他们具备扎实的机器学习理论基础、算法实现能力和实际问题解决经验。本文将从机器学习基础入手
大模型问答机器人如何实现自然交互杭州大厂Java程序媛 DeepSeek R1 &AI人工智能与大数据 java python javascript kotlin golang 架构人工智能
大模型问答机器人如何实现自然交互关键词：大模型问答机器人,自然语言处理(NLP),深度学习,深度对话,多轮对话,意图理解,信息检索,逻辑推理1.背景介绍1.1问题由来近年来，随着人工智能技术的飞速发展，自然语言处理(NLP)领域取得了巨大的突破。特别是深度学习模型在自然语言理解和生成方面的卓越表现，使得基于深度学习的大模型问答机器人（LargeLanguageModel-basedChatbots
各大AI平台优缺点分析：选对工具，让AI更高效 JXY_AI 人工智能生活 AI编程
人工智能（AI）技术的快速发展，催生了许多强大的AI平台，帮助开发者、企业和研究人员更高效地构建和部署AI应用。然而，不同的AI平台各有优缺点，如何选择合适的平台是许多从业者关心的问题。本文将分析几大主流AI平台的特点，以便大家根据需求做出更好的选择。1.OpenAI(ChatGPT、DALL·E、Codex)优点：自然语言处理（NLP）能力强：ChatGPT在对话、文本生成、翻译等方面表现优异，
Transformer 的原理是什么？玩人工智能的辣条哥人工智能 transformer 深度学习人工智能
环境：Transformer问题描述：Transformer的原理是什么？通俗易懂一点。解决方案：Transformer是一种基于注意力机制（AttentionMechanism）的深度学习架构，最初由Vaswani等人在2017年的论文《AttentionisAllYouNeed》中提出。它在自然语言处理（NLP）领域取得了巨大成功，并逐渐扩展到计算机视觉（CV）和其他领域。Transforme
LLM大模型技术实战4：热门开源LLMs对比和选型大模型学习教程机器学习开源人工智能职场和发展
一、大语言模型的特点和能力LLM(LargeLanguageModel,大型语言模型)是指那些规模庞大、参数数量众多的深度神经网络模型，用于理解和生成自然语言文本。在自然语言处理（NLP）领域有着广泛的应用，因其强大的语言理解和生成能力，能够处理各种复杂的文本任务。1.1主要特点架构特点LLM主要基于Transformer架构，Transformer通过自注意力机制（Self-Attention）
大模型面试--大模型（LLMs）基础面 TAICHIFEI 大模型面试语言模型人工智能
大模型（LLMs）基础面1.目前主流的开源模型体系有哪些？目前主流的开源大模型体系有以下几种：1.Transformer系列Transformer模型是深度学习中的一类重要模型，尤其在自然语言处理（NLP）领域。以下是一些主流的Transformer模型：GPT系列GPT-2和GPT-3：由OpenAI开发的生成式预训练变换器模型，用于生成高质量的文本。GPT-Neo和GPT-J：由Eleuthe
【大数据】大数据处理-Lambda架构-Kappa架构 weixin_33884611 大数据系统架构
大数据处理-Lambda架构-Kappa架构elasticsearch-headElasticsearch-sqlclientNLPchina/elasticsearch-sql:UseSQLtoqueryElasticsearch360企业安全V5.6SP1,杨军01,您好!lamda架构_百度搜索Lambda架构vsKappa架构-数据源博客-CSDN博客数据系统架构——Lambdaarchi
使用OpenAI API实现自然语言处理应用 shuoac 自然语言处理人工智能 python
使用OpenAIAPI实现自然语言处理应用技术背景介绍随着人工智能技术的不断发展，自然语言处理（NLP）在各种应用中的地位越来越重要。从自动文本生成、聊天机器人到智能搜索引擎，NLP技术的应用场景非常广泛。而OpenAI提供的API使得开发者可以轻松地将先进的NLP模型集成到他们的应用中。核心原理解析OpenAI的API基于强大的GPT（GenerativePre-trainedTransform
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu