lucky_chaichai

TensorFlow2（版本2.5.0）学习笔记（含keras_bert、W2V）

一、设置CPU/GPU运行环境：
二、tf定义变量与简单操作
【基于tf2做数据处理——Tokenizer】
- 1、使用TF2实现token2id、padding
- 2、基于gensim（版本：3.8.3）
- 3、基于keras_bert、bert4keras，对BERT输入tokenizer
三、基于TF2的模型构建
- 1、基于tf.keras
- - 1.1基于tf.keras.Model(inputs, outputs, name)
  - 1.2基于tf.keras.Sequential( layers=None, name=None)
- 2、基于tf.nn
四、基于TF2 的模型训练、测试与保存
- 1、使用tf.keras中封装好的API
- 2、使用自定义的训练过程：自定义每个batch的循环过程
五、keras_bert
六、TensorFlow2.x的常见异常

一、设置CPU/GPU运行环境：

指定使用CPU：

import tensorflow as tf
tf.debugging.set_log_device_placement (True)     # 设置输出运算所在的设备

cpus = tf.config.list_physical_devices ('CPU')   # 获取当前设备的 CPU 列表
tf.config.set_visible_devices (cpus)     # 设置TensorFlow的可见设备范围为cpu

二、tf定义变量与简单操作

变量。。。

random_float = tf.random.uniform(shape=())  #定义一个随机数（标量）
zero_vector = tf.zeros(shape=(2))  #定义一个有两个元素的零向量
X = tf.constant([[1., 2.], [3., 4.]])  #定义常量
w = tf.Variable(initial_value=[[1.], [2.]])  #定义变量

# 查看/改变矩阵x的形状、类型和值（转化为numpy查看值）
print(X.shape)      # 获取tensor的shape，输出(2, 2)
print(X.dtype)      # 获取tensor的数据类型，输出
print(X.numpy())   # 得到tensor的array形式，输出[[1. 2.][3. 4.]]
ts=tf.constant([1,2,3,4,7,32])
t1 = tf.reshape(ts,[-1,3])) # 改变shape，结果返回新的tensor对象，tf.Tensor([[ 1  2  3] [ 4  7 32]], shape=(2, 3), dtype=int32)
t2 = tf.expand_dims(ts, axis = 1) # 扩张维度，指定的axis维度为1，结果[[1],[2],[3],[4],[7],[32]]

ts_int=tf.convert_to_tensor(10) # 将给定的参数转化为tensor，结果tf.Tensor(10, shape=(), dtype=int32)
eq=tf.math.not_equal([1,1,1,0,0,4], 0) # x，y是否相等情况，返回bool类型的tensor，结果：tf.Tensor([ True  True  True False False  True], shape=(6,), dtype=bool)
cst=tf.cast(eq,dtype=tf.int32) # 将ep中值强制进行类型转换，结果：tf.Tensor([1 1 1 0 0 1], shape=(6,), dtype=int32)

# 简单的矩阵计算
A = tf.constant([[1, 2], [3, 4]])
B = tf.constant([[5, 6], [7, 8]])
print(tf.add(A,B)) #矩阵相加，结果：tf.Tensor([[ 6  8] [10 12]], shape=(2, 2), dtype=int32)
print(tf.matmul(A,B)) #矩阵乘法，结果：tf.Tensor([[19 22] [43 50]], shape=(2, 2), dtype=int32)
print(tf.reduce_sum(A)) #对矩阵所有元素求和，结果：tf.Tensor(10, shape=(), dtype=int32)

concat操作：
两个tensor要concat的那个维度（也就是第二个参数所指的维度）的shape必须一样

初始化器。。。（利用类对参数初始化）

vr=tf.keras.initializers.RandomNormal(mean=0.0, stddev=0.05, seed=None) #正态分布初始化器
vm=tf.keras.initializers.RandomUniform(minval=-0.05, maxval=0.05, seed=None) #均匀正太分布初始化器
vt=tf.keras.initializers.TruncatedNormal(mean=0.0, stddev=0.05, seed=None) #截尾正太分布初始化器
vv=tf.random_normal_initializer(mean=0.0, stddev=0.05, seed=None) #正太分布初始化器
vz=tf.zeros_initializer() #生成初始化为0的张量的初始化器。

【基于tf2做数据处理——Tokenizer】

1、使用TF2实现token2id、padding

后续对结果进行词向量转化的话：
生成的结果后面直接跟tf.keras.layer.Embedding()层，
或者
tf.Variable()初始化向量矩阵，使用tf.nn.embedding_lookup(params, ids, max_norm=None, name=None)

from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences
import jieba
vocab_size = 50
oov_tok = ''
sequence_length=100

sentense='按我的理解，优化过程的第一步其实就是求梯度。这个过程就是根据输入的损失函数，提取其中的变量，进行梯度下降，使整个损失函数达到最小值。'
sentense_words=[[w for w in jieba.cut(sentense) if w not in ['，','。','的']]]

# 对句子中的词生成索引
tokenizer=Tokenizer(num_words=vocab_size, oov_token=oov_tok)
tokenizer.fit_on_texts([sentense_words])
words_index=tokenizer.word_index # 结果类型为dict,{word:word_index}
print('word_index:',words_index) 

# 根据词-索引，将各个句子表示成索引向量（即各个词用其索引表示）
X_train_sequences = tokenizer.texts_to_sequences(sentense_words)
print('X_train_sequences:',X_train_sequences)

# 句子进行padding
X_train_sequences_padding=pad_sequences(sequences=X_train_sequences, 
                                        maxlen=sequence_length,
                                        padding='post', # pre/post,指定在句子前/后填充
                                        truncating='post', # pre/post，指定在句子前/后截断
                                        value=-1) # 指定填充的值，默认是使用0
print('X_train_sequences_padding:',X_train_sequences_padding)

结果输出如下：

2、基于gensim（版本：3.8.3）

【见我的博客：词向量训练实战——Word2vector、Glove、Doc2vector】
进行token2id，方便后续利用word2vector进行embedding

3、基于keras_bert、bert4keras，对BERT输入tokenizer

【见我的博客：知识图谱三元组抽取——python中模型总结实践】
适用于对bert两个外部输入的生成token_id，segment_id。

三、基于TF2的模型构建

tf2中有两种高级封装——keras和Estimator。也可以使用tf自己定义网络结构包括其中的训练参数？？？。
【也可以通过继承 tf.keras.layers.Layer 来自定义自己的layer。方式见该自定义的CRF层】

1、基于tf.keras

模型的构建：tf.keras.Model(inputs, outputs, name) 和 tf.keras.layers
tf.keras.Sequential(layers=None, name=None) 和 tf.keras.layers
模型的损失函数： tf.keras.losses
模型的优化器： tf.keras.optimizer5
模型的评估： tf.keras.metrics
（整理、学习ing）

1.1基于tf.keras.Model(inputs, outputs, name)

方法1：通过继承 tf.keras.Model 这个类来定义自己的模型。
:1）在继承类中，我们需要重写 init()（构造函数，初始化）和 call(input)*（模型调用）两个方法。
2）也可以根据需要增加自定义的方法。
示例：构建CNN神经网络（下述代码没有完整验证过）
【对比2维卷积Conv2D：

tf.keras.layers.Conv1D( # 输入是3维向量[batch, seq, emd], 输出也是3维向量[batch, new_seq, filters]
		filters, # 卷积核数目，决定输出最后一维度大小（列向量个数），有多少个filters就有多少个列向量
		kernel_size, # 卷积核尺寸，其第二维度由 emd 决定
		strides=1, 
		padding='valid',）

】

class CNN(tf.keras.Model):
    def __init__(self):
        super().__init__()
        self.conv1 = tf.keras.layers.Conv2D( # 输入是4维向量[batch, row, col, emd], 输出也是4维向量[batch, n_row, n_col, filters]
            filters=32,             # 卷积层神经元（卷积核）数目，决定输出的最后一维度大小，有多少filters就有多少个[n_row, n_col]矩阵
            kernel_size=[5, 5],     # 感受野大小（卷积核尺寸，对于NLP任务，一般设置为[filter_size, embedding_size]）
            padding='same',         # padding策略（valid 或 same）
            activation=tf.nn.relu   # 激活函数
        )
        self.pool1 = tf.keras.layers.MaxPool2D(pool_size=[2, 2], # 池化窗口大小，对于NLP任务，卷积步长为1时，一般设置为[seq_len-filter_size+1, 1]
        									   strides=2) 
        self.conv2 = tf.keras.layers.Conv2D(
            filters=64,
            kernel_size=[5, 5],
            padding='same',
            activation=tf.nn.relu
        )
        self.pool2 = tf.keras.layers.MaxPool2D(pool_size=[2, 2], strides=2)
        self.flatten = tf.keras.layers.Reshape(target_shape=(7 * 7 * 64,))
        self.dense1 = tf.keras.layers.Dense(units=1024, activation=tf.nn.relu)
        self.dense2 = tf.keras.layers.Dense(units=10)

    def call(self, inputs, training=False): # call中也可以增加一个training参数，对不同过程（训练、测试）进行特殊操作
        x = self.conv1(inputs)                  # [batch_size, 28, 28, 32]
        x = self.pool1(x)                       # [batch_size, 14, 14, 32]
        x = self.conv2(x)                       # [batch_size, 14, 14, 64]
        x = self.pool2(x)                       # [batch_size, 7, 7, 64]
        x = self.flatten(x)                     # [batch_size, 7 * 7 * 64]
        x = self.dense1(x)                      # [batch_size, 1024]
        if training:
      		x = self.dropout(x, training=training)
        x = self.dense2(x)                      # [batch_size, 10]
        output = tf.nn.softmax(x)
        return output
num_epochs = 5
batch_size = 50
learning_rate = 0.001
data_loader = MNISTLoader()
model = CNN()

# 模型训练使用的优化器
optimizer = tf.keras.optimizers.Adam(learning_rate=learning_rate)
# 模型训练
num_batches = int(data_loader.num_train_data // batch_size * num_epochs)
for batch_index in range(num_batches):
    X, y = data_loader.get_batch(batch_size)
    with tf.GradientTape() as tape:
        y_pred = model(X)
        loss = tf.keras.losses.sparse_categorical_crossentropy(y_true=y, y_pred=y_pred)
        loss = tf.reduce_mean(loss)
        print("batch %d: loss %f" % (batch_index, loss.numpy()))
    grads = tape.gradient(loss, model.variables)
    optimizer.apply_gradients(grads_and_vars=zip(grads, model.variables))

# 模型评估
sparse_categorical_accuracy = tf.keras.metrics.SparseCategoricalAccuracy()
num_batches = int(data_loader.num_test_data // batch_size)
for batch_index in range(num_batches):
    start_index, end_index = batch_index * batch_size, (batch_index + 1) * batch_size
    y_pred = model.predict(data_loader.test_data[start_index: end_index])
    sparse_categorical_accuracy.update_state(y_true=data_loader.test_label[start_index: end_index], y_pred=y_pred)
print("test accuracy: %f" % sparse_categorical_accuracy.result())

方法2：基于函数API，从输入开始链式构建网络结构
具体如下（上述网络结构可如下定义）：
注：①tf.keras.Model()接收的输入层必须是tf.keras.Input(shape）/ tf.keras.layers.Input(shape)等生成的tensor
②第一层没有shape时，输出的模型结构Output Shape都是multiple
③tf.keras.layers.Input()接受输入时，不像其他结构层次可以定义好结构后直接跟(x)，该方法可以使用tensor参数，如tf.keras.layers.Input(tensor=my_input)，my_input为上一层的输出。示例参见知识图谱中“三元组”抽取——Python中模型总结实战中的第四部分代码。

inputs = tf.keras.Input(shape=(6,28,64)) # [None, 6, 28, 64]
conv1_x = tf.keras.layers.Conv2D(
    filters=32,             # 卷积层神经元（卷积核）数目
    kernel_size=[2, 2],     # 感受野大小
    padding='same',         # padding策略（valid 或 same）
    activation=tf.nn.relu   # 激活函数
)(inputs)
pool1_x = tf.keras.layers.MaxPool2D(pool_size=[2, 2], strides=2)(conv1_x )
conv2_x = tf.keras.layers.Conv2D(
    filters=64,
    kernel_size=[2, 2],
    padding='same',
    activation=tf.nn.relu
)(pool1_x)
pool2_x = tf.keras.layers.MaxPool2D(pool_size=[2, 2], strides=2)(conv2_x)
flatten_x = tf.keras.layers.Reshape(target_shape=(1 * 7 * 64,))(pool2_x)
dense1_x = tf.keras.layers.Dense(units=1024, activation=tf.nn.relu)(flatten_x)
dense2_x = tf.keras.layers.Dense(units=10)(dense1_x)
model=tf.keras.Model(inputs=inputs, outputs=dense2_x )
print(model.summary())

打印的结果：

1.2基于tf.keras.Sequential( layers=None, name=None)

方法1：以list的方式构建模型层次，将整个list作为tf.keras.Sequential()参数
示例：构建简单的BiLSTM模型

vocab_size=10000
embedding_dim=125

stacked_lstmCell=tf.keras.layers.StackedRNNCells([tf.keras.layers.LSTMCell(embedding_dim) for _ in range(2)])
model = tf.keras.Sequential([
    tf.keras.layers.Embedding(input_dim=vocab_size, # 字典长度（大小）
    						  output_dim=embedding_dim, 
    						  input_length=None,  #Length of input sequences,如果该层后面连接flatten并dense则必须指定input_length。
    						  embeddings_initializer='uniform'), # 输入：[batch_size, input_length],输出：[batch_size, input_length, output_dim]。
    tf.keras.layers.Bidirectional(tf.keras.layers.LSTM(units=embedding_dim), # BiLSTM, units为LSTM每个time_step（sequence_length）输出维度大小；return_sequences=True, 表示return the full sequence，即LSTM中间每一个step神经元计算输出，最终shape[batch, step, lstm_dim]
    							  merge_mode='concat') # merge_mode为双向计算结果的结合方式，可以是'sum', 'mul', 'concat', 'ave', None
    # tf.keras.layers.RNN(stacked_lstmCell), # 多层LSTM
    tf.keras.layers.Dense(embedding_dim, activation='relu'),
    tf.keras.layers.Dense(11, activation='softmax')
])
model.summary()

上述BiLSTM模型结构如下：

多层（2层）LSTM的结构如下：

【上面的LSTM模型，output shape在经过说个time_step（swquence_length）loop之后，变为（time_step，batch_size，hidden_size）】
方法2：先构建tf.keras.Sequential()对象，使用add方法在对象上添加层
（将上述list形式的构建方式进行改写，模型结构完全一致）

vocab_size=10000
embedding_dim=125

model = tf.keras.Sequential()
# 输入：[batch_size, input_length],输出：[batch_size, input_length, output_dim]。
model.add(tf.keras.layers.Embedding(input_dim=vocab_size, #input_dim表明输入的word index最大为vocab_size-1
									output_dim=embedding_dim, 
									input_length=None, #如果该层后面连接flatten并dense则必须指定input_length
									embeddings_initializer='uniform')) 
model.add(tf.keras.layers.Bidirectional(tf.keras.layers.LSTM(units=embedding_dim),merge_mode='concat')) # units为LSTM每个time_step（sequence_length）输出维度大小，merge_mode为双向计算结果的结合方式，可以是'sum', 'mul', 'concat', 'ave', None
model.add(tf.keras.layers.Dense(embedding_dim, activation='relu'))
model.add(tf.keras.layers.Dense(11, activation='softmax'))

model.summary()

上述构建的BiLSTM结构如下：

【区别于上述例子中直接调用keras.layers的Embedding层（其输入shape为[batch, seq_len]，同tf.nn.embedding_lookup的ids参数），也可以自己定义embedding层，以使用外部训练的向量权重矩阵W：】

import tensorflow as tf
import numpy as np
with tf.name_scope('my_embedding_layer') as scope: #命名空间的使用，当执行后该命名空间中的Tensors W, input_ids, embed, 名字会转变为 my_embedding_layer/W, my_embedding_layer/input_ids,  my_embedding_layer/embed
    W=tf.Variable([[1,0,0,0,0,0],[0,1,0,0,0,1],[0,0,1,0,0,2],[0,0,0,1,0,3],[0,0,0,0,1,4]])
    input_ids=tf.Variable([[0,4,2],[1,0,3]])
    embed=tf.nn.embedding_lookup(params=embed_wieght,ids=input_ids)
print(embed)

结果：

2、基于tf.nn

四、基于TF2 的模型训练、测试与保存

1、使用tf.keras中封装好的API

基于API链式构建或者基于tf.keras.Sequential构建的模型，使用基于API的该方法
训练之前要先编译model.compile()，为训练进行配置：

compile(
    optimizer='rmsprop', 
    loss=None,  # 'sparse_categorical_crossentropy'
    metrics=None, 
    loss_weights=None,
    weighted_metrics=None, 
    run_eagerly=None, 
    steps_per_execution=None, **kwargs
)

然后，model.fit()，训练：

fit(
    x=None, 
    y=None, 
    batch_size=None, # 不指定时默认32
    epochs=1,  # 一个epoch就是所有训练数据训练一遍
    verbose='auto',
    callbacks=None, validation_split=0.0, validation_data=None, shuffle=True,
    class_weight=None, sample_weight=None, initial_epoch=0, steps_per_epoch=None,
    validation_steps=None, validation_batch_size=None, validation_freq=1,
    max_queue_size=10, workers=1, use_multiprocessing=False
)

然后，model.predict()，预测：

predict( # 返回numpy array
    x,  # A Numpy array (or array-like), or a list of arrays；A TensorFlow tensor, or a list of tensors，。。。
    batch_size=None, 
    verbose=0, steps=None, callbacks=None, max_queue_size=10,
    workers=1, use_multiprocessing=False
)

最后保存model.save()or加载：

from keras.models import load_model
model.save(
    'my_model.h5',  # 可以保存为Tensorflow SavedModel or a single HDF5 file
    overwrite=True, include_optimizer=True, save_format=None,
    signatures=None, options=None, save_traces=True
)

# returns a compiled model，identical to the previous one
model = load_model('my_model.h5')

2、使用自定义的训练过程：自定义每个batch的循环过程

继承tf.keras.Model类定义的模型需要使用该方法，model(x)传数据
1、loss函数
注意：Sparse前缀的loss函数，其中的label（或y_true）都是label本身，非one-hot编码。
1）tf.keras定义损失函数：

tf.keras.metrics.sparse_categorical_crossentropy(
    y_true, y_pred, from_logits=False, axis=-1
)

使用：

y_true = [1, 2]
y_pred = [[0.05, 0.95, 0], [0.1, 0.8, 0.1]]
loss_m = tf.keras.metrics.sparse_categorical_crossentropy(y_true, y_pred)
loss_l = tf.keras.losses.sparse_categorical_crossentropy(y_true, y_pred)
print('loss_m:',loss_m)
print('loss_l:',loss_l)
print('loss_m_mean:',tf.reduce_mean(loss_m)) # argmax()、reduce_mean()都在tf.math.中,使用时也可以省略math

结果：

另：

tf.keras.losses.SparseCategoricalCrossentropy(
    from_logits=False, reduction=losses_utils.ReductionV2.AUTO, #tf.keras.losses.Reduction.SUM
    name='sparse_categorical_crossentropy'
)

使用
说明：
①Use this crossentropy loss function when there are two or more label classes. We expect labels to be provided as integers. If you want to provide labels using one-hot representation, please use CategoricalCrossentropy loss. There should be # classes floating point values per feature for y_pred and a single floating point value per feature for y_true.
②The shape of y_true is [batch_size] and the shape of y_pred is [batch_size, num_classes].
③return：损失值，float

y_true = [1, 2] # 使用label编码，不可以one-hot形式
y_pred = [[0.05, 0.95, 0], [0.1, 0.8, 0.1]]
# Using 'auto'/'sum_over_batch_size' reduction type.
scce = tf.keras.losses.SparseCategoricalCrossentropy()
scce(y_true, y_pred).numpy()

2）tf.nn定义损失函数：

tf.nn.softmax_cross_entropy_with_logits(
    labels, logits, axis=-1, name=None
)

使用：
说明：
①A common use case is to have logits and labels of shape [batch_size, num_classes], but higher dimensions are supported, with the axis argument specifying the class dimension.
②logits and labels must have the same dtype (either float16, float32, or float64).
③return：A Tensor that contains the softmax cross entropy loss. Its type is the same as logits and its shape is the same as labels except that it does not have the last dimension of labels.

logits = [[4.0, 2.0, 1.0], [0.0, 5.0, 1.0]]
labels = [[1.0, 0.0, 0.0], [0.0, 0.8, 0.2]]
losses=tf.nn.softmax_cross_entropy_with_logits(labels=labels, logits=logits)
lose=tf.reduce_mean(losses)

2、优化器

optimizer = tf.keras.optimizers.Adam(learning_rate=learning_rate)
# 模型训练
num_batches = int(data_loader.num_train_data // batch_size * num_epochs)
for batch_index in range(num_batches):
    X, y = data_loader.get_batch(batch_size)
    with tf.GradientTape() as tape:
        y_pred = model(X)
        loss = tf.keras.losses.sparse_categorical_crossentropy(y_true=y, y_pred=y_pred)
        loss = tf.reduce_mean(loss)
        print("batch %d: loss %f" % (batch_index, loss.numpy()))
    grads = tape.gradient(loss, model.variables)
    optimizer.apply_gradients(grads_and_vars=zip(grads, model.variables))

五、keras_bert

1、模型加载

from keras_bert import load_trained_model_from_checkpoint, Tokenizer 
bert_model = load_trained_model_from_checkpoint(config_path，
												check_point_path,
												seq_len=seq_len,
												output_layer_num=self.layer_nums,
												training=self.training,
												trainable=self.trainable)
self._model = tf.keras.Model(bert_model.inputs, bert_model.output)

2、模型输入
bert模型的输入包括词向量，段向量和位置向量。
（注意模型的输入：当training为False时输入只包含前两项。一般词向量输入词索引，段向量一般是0向量，位置向量对应位置下标由于是固定的，会在模型内部生成，不需要手动再输入一遍）

bert_model.predict() # 当

六、TensorFlow2.x的常见异常

1、TensorFlow版本与numpy版本不兼容报错
异常信息：NotImplementedError: Cannot convert a symbolic Tensor (ner_model/bidirectional/forward_lstm/strided_slice:0) to a numpy array. This error may indicate that you're trying to pass a Tensor to a NumPy call, which is not supported
处理：本人python3.8，TensorFlow为2.3、2.4或2.5时，numpy降到1.19.x（1.18.x也行）

使用tensorflow2_0和LSTM的文本多分类2https://github.com/tongzm/ml-python/blob/master
tf2.0中国社区：https://tf.wiki/
谷歌TensorFlow2官网：https://tensorflow.google.cn/api_docs/python/tf/keras

服务器无对应cuda版本安装pytorch-gpu[自用] 片月斜生梦泽南 pytorch
服务器无对应cuda版本安装pytorch-gpu服务器无对应cuda版本安装pytorch-gpu网址下载非root用户安装tmux查看服务器ubuntu版本conda安装tensorflow-gpu安装1.x版本服务器无对应cuda版本安装pytorch-gpu网址GPU版本的pytorch、pytorchvision的下载链接https://download.pytorch.org/whl/
Ubuntu下安装多版本CUDA及灵活切换全攻略芯作者 D2：ubuntu linux ubuntu
——释放深度学习潜能，告别版本依赖的烦恼！**为什么需要多版本CUDA？在深度学习、科学计算等领域，不同框架（TensorFlow、PyTorch等）对CUDA版本的要求各异。同时升级框架或维护旧项目时，版本冲突频发。多版本CUDA共存+一键切换是高效开发的刚需！本文将手把手教你实现这一能力，并分享独创的“动态软链接+环境隔离”技巧，让版本管理行云流水！环境准备硬件要求NVIDIA显卡（支持CUD
ubuntu22.04从新系统到tensorflow GPU支持澍龑 tensorflow 人工智能
ubuntu22.04CUDA从驱动到tensorflow安装0系统常规设置和软件安装0.1挂载第二硬盘默认Home0.2软件安装0.3安装指定版本的python0.4python虚拟环境设置1直接安装1.1配置信息1.2驱动安装1.3集显显示，独显运算（其它debug用）1.4卸载驱动(备用，未试)日常使用ssh后台运行（断联不中断）0系统常规设置和软件安装0.1挂载第二硬盘默认Homesudo
【Python】Python类型标注革命：Annotated类型深度解析与实战田辛 | 田豆芽 Python python 设计模式类型驱动设计
一、初识Annotated：类型系统的拓展革命作为深耕Python领域多年的开发者，田辛老师在第一次接触typing.Annotated时的感受可以用"惊艳"来形容。这个Python3.9引入的类型构造器，为我们打开了元数据整合的新维度。基本语法结构：fromtypingimportAnnotatedTemperature=Annotated[float,"Celsius"]这里我们创建了一个带有
【零基础学AI】第27讲：注意力机制（Attention） - 机器翻译实战 1989 0基础学AI 人工智能机器翻译自然语言处理 python tensorflow 机器学习神经网络
本节课你将学到理解注意力机制的核心思想掌握注意力计算的数学原理实现基于注意力机制的Seq2Seq模型构建英语到法语的神经翻译系统开始之前环境要求Python3.8+需要安装的包：tensorflow==2.8.0numpy==1.21.0matplotlib==3.4.0pandas==1.3.0前置知识RNN/LSTM原理（第26讲）序列数据处理（第26讲）自然语言处理基础（第14讲）核心概念为
TensorFlow图神经网络(GNN)入门指南 AI天才研究院 AI人工智能与大数据 tensorflow 神经网络人工智能 ai
TensorFlow图神经网络(GNN)入门指南关键词：TensorFlow、图神经网络、GNN、深度学习、图数据、节点嵌入、图卷积网络摘要：本文全面介绍如何使用TensorFlow实现图神经网络(GNN)。我们将从图数据的基本概念开始，深入探讨GNN的核心原理，包括图卷积网络(GCN)、图注意力网络(GAT)等流行架构，并通过TensorFlow代码示例展示如何构建和训练GNN模型。文章还将涵盖
mediapipe流水线分析三江太翁 Android NDK 人工智能 mediapipe android
目标检测Graph一流水线上游输入处理1TfLiteConverterCalculator将输入的数据转换成tensorflowapi支持的TensorTfLiteTensor并初始化相关输入输出节点，该类的业务主要通过interpreterstd::unique_ptrtflite::Interpreterinterpreter_=nullptr;实现类完成数据在cpu/gpu上的推理1.1Tf
JuPyter(IPython) Notebooks中使用pip安装Python的模块 weixin_34218890 开发工具 python 人工智能
问题描述：没有带GPU的电脑，搞深度学习不是耍流氓嘛，我网上看到有个云平台，免费使用了一下，小姐姐很热情。使用过程如下：他们给的接口是Jupyter编辑平台，我就在上面跑了一个小例子。tensorflow和python环境是他们配置好的，不过我的例子中需要导入matplotlib.pylot模块。可是他们没有提供，怎么办呢？网上查了一下啊解决方法：采用如下方法：importpipdefMyPipi
TensorFlow武林志第一卷：入门篇 - 初入江湖第一章：真气初现空中湖 tensorflow武林志 tensorflow 人工智能 python
第一卷：入门篇-初入江湖第一章：真气初现林枫揉了揉酸痛的胳膊，将最后一捆柴火堆放在灶房角落。这是他来到青霄剑宗做杂役的第三个月，每日劈柴挑水的生活让他原本白皙的皮肤变得黝黑粗糙。"喂，新来的！掌门要的热水怎么还没送去？"门外传来管事的呵斥声。"马上就好！"林枫急忙提起铜壶，滚烫的热水溅在他手背上，他却浑然不觉疼痛。自从上月在后山偶然吞服了那枚奇异的朱果后，他对冷热疼痛的感知就变得异常迟钝。穿过曲折
【Python】typing_extensions 库：提供对 Python 类型注解的扩展支持彬彬侠 Python基础 python typing_extensio 类型注解
typing_extensions是一个Python库，提供对Python类型注解的扩展支持，包含在较新Python版本中引入的类型功能（如Literal、TypedDict、Protocol），并将其回溯到旧版本。它是typing标准库的补充，广泛用于需要高级类型注解的场景，如静态类型检查（使用mypy、pyright）、IDE类型提示和现代Python项目。以下是对typing_extensi
Python类的基础与高级用法详解
在Python中，类（Class）是面向对象编程（OOP）的核心概念，用于创建对象的蓝图。它定义了对象的属性和行为，支持代码复用、封装、继承和多态。接下来，从多个维度详细解释类的核心概念：一、类的基本结构classMyClass: #类变量（所有实例共享） class_variable="SharedData" #构造方法（初始化实例属性） def__init__(self,name):
TensorFlow 零基础入门：手把手教你跑通第一个AI模型蓑笠翁001 人工智能人工智能 tensorflow python 机器学习深度学习分类
今天用最直白的语言，带完全零基础的同学走进TensorFlow的世界。不用担心数学公式，先学会"开车"，再学"造车"！1.准备工作：安装TensorFlow就像玩游戏需要先安装游戏客户端一样，我们需要先安装TensorFlow。打开你的电脑（Windows/Mac都行），按下Win+R，输入cmd打开命令提示符，然后输入：pipinstalltensorflow看到"Successfullyins
「日拱一码」017 深度学习常用库——TensorFlow
目录基础操作张量操作：tf.constant用于创建常量张量tf.Variable用于创建可训练的变量张量tf.reshape可改变张量的形状tf.concat可将多个张量沿指定维度拼接tf.split则可将张量沿指定维度分割数学运算：tf.add张量的加运算tf.subtract张量的减运算tf.multiply张量的乘运算tf.divide张量的除运算tf.pow计算张量的幂tf.sqrt计算
【Day 11-N22】Python类（3）——Python的继承性、多继承、方法重写 DES 仿真实践家 14天Python入门学习笔记 python 开发语言笔记
挑战14天学会Python，第11天学习笔记！加油！一、核心概念总览概念英文定义作用典型应用场景继承性Inheritance子类自动获得父类的属性和方法代码复用、建立类层次关系构建类层次结构多继承MultipleInheritance子类同时继承多个父类组合不同功能混合功能组合方法重写MethodOverriding子类重新定义父类方法实现特定行为定制化行为二、继承性（Inheritance）深度
Python class：定义类 Itmastergo python 开发语言
类仅仅充当图纸的作用，本身并不能直接拿来用，而只有根据图纸造出的实际物品（对象）才能直接使用。因此，Python程序中类的使用顺序是这样的：1、创建（定义）类，也就是制作图纸的过程；2、创建类的实例对象（根据图纸造出实际的物品），通过实例对象实现特定的功能。这里先教大家如何创建（定义）一个类，如何使用定义好的类将放到以后进行讲解。Python类的定义Python中定义一个类使用class关键字实现
强化学习【chapter0】-学习路线图明朝百晓生算法人工智能机器学习
前言：主要总结一下西湖大学赵老师的课程【强化学习的数学原理】课程：从零开始到透彻理解（完结）_哔哩哔哩_bilibili1️⃣基础阶段（Ch1-Ch7）：掌握表格型算法，理解TD误差与贝尔曼方程2️⃣进阶阶段（Ch8-Ch9）：动手实现DQN/策略梯度，熟悉PyTorch/TensorFlow3️⃣前沿阶段（Ch10：阅读论文（OpenAISpinningUp/RLlib文档）Chapter1：基
【深度学习pytorch-6】张量与numpy相互转换超华东算法王 DL-pytorch 深度学习 pytorch numpy
张量与Numpy数组之间的互相转换在深度学习中，张量（tensor）和Numpy数组（numpyarray）是两种常见的数据结构。张量通常用于深度学习框架（如PyTorch、TensorFlow等），而Numpy数组在科学计算中被广泛使用。为了便于数据处理和计算，常常需要在它们之间进行转换。下面介绍张量和Numpy数组之间的互相转换。1.PyTorch张量与Numpy数组的互相转换PyTorch提
NumPy 或 PyTorch/TensorFlow 中的张量理解栖霖涧 numpy pytorch tensorflow
(2,2,3)形状的3D数组（或张量）的结构。个人理解：2个2维数组（张量），2维数组（张量）里面有2个1维向量（张量），1维向量（张量）里面有3个元素。注：由于最后一个维度值3代表的是元素个数，左侧括号后的第1个2代表的是第n-1个[（中括号，即n-1维数组）的数量，左侧括号后的第2个2代表的是第n-2个[（中括号，即n-2维数组）的数量。这段文字中，n代表的是数组的维度，这里是3维。维度解析：
下完安装好python后，想查看python的安装位置的几种方法大模型猫叔 python 开发语言爬虫
查看python的路径基于windows系统，按下win+r（也就是命令提示符），输入cmd，进入查看当前的python的版本的话输入python-V1，查看当前下载的python类型和路径则可以输入py-0(加*的是你使用python的默认版本)2，还可以使用命令wherepython查看路径（这样就不会显示你python默认使用的是哪个）小技巧：如果想清除命令行的话可以输入命令cls然后ent
python类的定义与使用菜鸟驿站2020 python
class01.py代码如下classTicket():#类的名称首字母大写#在类里定义的变量称为属性,第一个属性必须是selfdef__init__(self,checi,fstation,tstation,fdate,ftime,ttime,notes):self.checi=checiself.fstation=fstationself.tstation=tstationself.fdate
Tensorflow 回归模型 FLASK + DOCKER 部署至 Ubuntu 虚拟机
准备工作：安装虚拟机，安装ubuntu，安装python3.x、pip和对应版本的tensorflow和其他库文件,安装docker。注意事项：1.windows系统运行的模型文件不能直接运行到虚拟机上，需在虚拟机上重新运行并生成模型文件2.虚拟机网络状态改为桥接Flask代码如下：fromflaskimportFlask,request,jsonifyimportpickleimportnump
yolov算法详解_yolo 目标检测算法个人总结（yolov1） CHAO JIANG yolov算法详解
yolo目标检测算法个人总结目前yolo目标检测有两个版本，分别为v1和v2。因工作需要用yolo算法检测人物，所以这段时间重点看了这两篇论文，并实现了对应的tensorflow代码。这里记录下在论文阅读过程中的一些细节信息，留给自己，同时也希望各位能指出本人理解错误的地方，谢谢！一：yolov1关于yolov1算法的详解在网上已经非常多了，在这里我大概叙述下算法的流程，以及在开发过程中遇到的一些
KANN 是一个独立的轻量级 C 语言库，用于构建和训练中小型人工神经网络，例如多层感知器、卷积神经网络和递归神经网络（包括 LSTM 和 GRU）。它实现了基于图的逆模自动微分，并允许构建具有递归等
一、软件介绍文末提供程序和源码下载KANN是一个独立的轻量级C语言库，用于构建和训练中小型人工神经网络，例如多层感知器、卷积神经网络和递归神经网络（包括LSTM和GRU）。它实现了基于图的逆模自动微分，并允许构建具有递归、共享权重和多个输入/输出/成本的拓扑复杂神经网络。与TensorFlow等主流深度学习框架相比，KANN的可扩展性较低，但它的灵活性接近，代码库要小得多，并且仅依赖于标准C库。与
在浏览器中使用TensorFlow.js 魏铁锤chui tensorflow javascript 人工智能
TensorFlow.js简介介绍光学字符识别(OCR)是指能够从图像或文档中捕获文本元素，并将其转换为机器可读的文本格式的技术。如果您想了解更多关于这个主题的内容，本文是一个很好的介绍。TensorFlow.js是一个库，用于使用JavaScript开发和训练机器学习模型，并将其部署在浏览器中或Node.js上。您可以使用现有模型、转换PythonTensorFlow模型、使用迁移学习用您自己的
Python 单例模式与魔法方法深度剖析：从原理到实践女码农的重启开发语言单例模式
在Python面向对象编程领域，单例模式和魔法方法是极具特色且功能强大的技术。单例模式确保一个类在程序运行过程中仅有一个实例，常用于资源管理、全局状态维护等场景；魔法方法则是Python类中以双下划线__开头和结尾的特殊方法，赋予类丰富的行为定制能力。本文将深入探讨二者的原理、实现方式、应用场景，以及它们之间的紧密联系。一、单例模式：实例唯一性的保障1.1单例模式的核心概念单例模式（Singlet
Pydantic：拯救你的数据结构，让Python类型提示火力全开！（开发者血泪史终结者） syntaxseeker 数据结构 python 开发语言其他
文章目录一、现实毒打：没有Pydantic的日子有多惨？二、Pydantic登场：你的数据守护神！三、动手！秒懂Pydantic魔法四、Pydantic的杀手锏：为什么它这么香？五、实战场景：Pydantic在哪里大放异彩？六、避坑指南&最佳实践（血泪教训！）七、结语：拥抱Pydantic，告别数据焦虑！还在为混乱的JSON数据抓狂？被API返回的诡异字段逼疯？深夜调试时因为一个None值崩溃砸键
深刻解析如何解决在pycharm中导入tensorflow的子模块keras时的报错（导入语法正确） lovingf pycharm python tensorflow keras
只是导入时报错，但代码仍可以运行1.导入方式正确，但pycharm将其标红2.通过查看tensorflow的官方文件，猜测可能是python版本不适配python需为python3.6-3.9，而我的为python3.113.配置python3.9的环境（详情可看我的另一篇文章），但依然报错4.经过仔细分析，觉得可能是pycharm与tensorflow的适配问题，pycharm无法寻找到tens
Python类中cls和self的区别（staticmethod和classmethod的区别） Mr 姚 Python
1、cls和self的区别：self：类的方法的第一个参数，表示一个具体的实例本身。如果类的方法用了修饰符“staticmethod”，则可以无视这个self，这个方法就当成一个普通的函数使用。cls：若类方法用修饰符“classmethod”修饰，则cls作为类方法的第一个参数，表示这个类本身。2、staticmethod和classmethod的区别：一般来说，需要将类实例化后，才能调用类的方
Django 4.x Models App settings 模型应用设置 Mr数据杨 Python Web开发 python django 模型 model 配置
在Django框架中，模型（Model）是用于定义和操作数据库表结构的核心组件。模型通过使用Python类的形式，帮助简化数据库操作，自动生成SQL语句，使得开发者能够专注于业务逻辑的实现，而无需直接编写复杂的SQL代码。Django的ORM（对象关系映射）提供了一种便捷的方式，将Python对象与数据库记录进行映射操作，从而有效地管理数据交互。对于那些想要在项目中使用Django构建数据库应用的
Python 的内置函数 object IMPYLH python 笔记
Python内建函数列表>Python的内置函数objectPython的内置函数object是Python中最基础的类，它是所有类的基类。在Python中，所有的类都直接或间接地继承自object类。object类提供了一些默认的方法和属性，这些方法和属性可以被所有Python对象使用。基本特性继承关系：所有Python类默认都继承自object。例如，定义一个空类时，实际上它已经隐式地继承了o
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key