_森罗万象

bidirectional long short term merory attention network

bidirectional long short term merory attention network (BAN) 针对 smiles 的预测和分类任务，利用了 SMILES Enumeration 数据增强和基于注意力机制的 LSTM，原文：Learning to SMILES: BAN-based strategies to improve latent representation learning from molecules，代码：smiles-biLSTM-attention-network，其中缺少的数据以logD_7.4例，解析 reg 任务，代码从 dataset 开始，因为 reg 开始就建立数据库然后调用 get_data，而 preprocessing 中有很多没有使用的函数。模型框架如下：

文章目录

1.dataset
- 1.1.__init__
- 1.2.get_data
- 1.3.numerical_smiles
2.reg
- 2.1.loadData
- 2.2.make_model
- 2.4.RemoveMask
- 2.5.AttentionWithContext
- 2.3.run & save history
3.总结

1.dataset

import pandas as pd
import numpy as np
from preprocessing import randomize_smile
import re
from copy import deepcopy
regex_pattern=r'Cl|Br|[#%\)\(\+\-1032547698:=@CBFIHONPS\[\]cionps]'

random_size 是数据增强函数，具体实现如下：

def randomize_smile(sml,max_len=100):
    """Function that randomizes a SMILES sequnce. This was adapted from the
    implemetation of E. Bjerrum 2017, SMILES Enumeration as Data Augmentation
    for Neural Network Modeling of Molecules.
    Args:
        sml: SMILES sequnce to randomize.
    Return:
        randomized SMILES sequnce or
        nan if SMILES is not interpretable.
    """
    try:
        m = Chem.MolFromSmiles(sml)
        ans = list(range(m.GetNumAtoms()))
        np.random.shuffle(ans)
        nm = Chem.RenumberAtoms(m, ans)
        smiles = Chem.MolToSmiles(nm, canonical=False)
        i = 0
        while len(smiles)>max_len:
            m = Chem.MolFromSmiles(sml)
            ans = list(range(m.GetNumAtoms()))
            np.random.shuffle(ans)
            nm = Chem.RenumberAtoms(m, ans)
            smiles = Chem.MolToSmiles(nm, canonical=False)
            i = i+1
            if i>5:
                break
        if len(smiles)>max_len:
            return sml
        else:
            return smiles
    except:
        return np.nan

这个函数实际效果是 smiles 长度大于 max_len 的时候返回原 sml，否则返回 shuffle 后的 smiles。不太理解 while 循环的作用

1.1.init

class Dataset(object):  
    def __init__(self, filename,
                 smile_field,
                 label_field,
                 max_len=100,
                 train_augment_times=1,
                 test_augment_times=1,
                 random_state=0):

        df = pd.read_csv(filename, sep='\t')
        df['length'] = df[smile_field].map(lambda x: len(x.replace('Cl', 'X').replace('Br', 'Y')))
        self.df = deepcopy(df[df.length <= max_len])
        self.smile_field = smile_field
        self.label_field = label_field
        self.max_len = max_len
        self.train_augment_times = train_augment_times
        self.test_augment_times = test_augment_times
        self.random_state = random_state
        vocab = np.load('./data/vocab.npy', allow_pickle=True)
        self.vocab =  vocab.item()

调用 dataset 的方式是 dataset = Dataset(‘data/reg/{}.txt’.format(task), ‘SMILES’, ‘Label’, 100, 100, 100, seed)，数据增强次数为超参数，原论文显示达到50次后模型性能无明显提升。由于 github 中缺少数据，这里用logD_7.4代替，需要进行预处理，将数据标签改为’Label’，而且要注意 sep 的设置，我的解决方法是修改为了 “,” ，之后可以正确读入。Length 是 smiles 的长度，这里将 Cl 和 Br 视为1的长度。将 smiles 长度大于 max_len 的全部滤过后，实际之后的 randomize_smile 即返回 shuffle 一次的 smiles。seed 的设置应该是为了结果能够复现。self.df 的内容如下：

from dataset import Dataset
seed=1
task="logD"
dataset = Dataset('data/reg/{}.txt'.format(task), 'SMILES', 'Label', 100, 100, 100, seed)
dataset.df

index	Index	SMILES	Label
0	0	Fc1cc2c(N(C=C(C(O)=O)C2=O)C2CC2)cc1N1CCNCC1	-0.96
1	1	S1(=O)(=O)N(CCN1C)c1cc2c([nH]cc2CCN©C)cc1	-0.92
2	2	OC=1C(=O)C=CN(CCCO)C=1C	-0.9
3	3	Fc1cc2c(N(C=C(C(O)=O)C2=O)c2ccccc2C)cc1N1CCNCC1	-0.83

其中 Index 不要与 index 混淆，index 首字母小写，self.vocab 内容如下：

{0: '', 1: '#', 2: '%', 3: ')', 4: '(', 5: '+', 6: '-', 7: '1', 8: '0', 9: '3', 10: '2', 11: '5', 12: '4', 13: '7', 14: '6', 15: '9', 16: '8', 17: ':', 18: '=', 19: '@', 20: 'C', 21: 'B', 22: 'F', 23: 'I', 24: 'H', 25: 'O', 26: 'N', 27: 'P', 28: 'S', 29: '[', 30: ']', 31: 'c', 32: 'i', 33: 'o', 34: 'n', 35: 'p', 36: 's', 37: 'Cl', 38: 'Br', 39: ''}

1.2.get_data

def get_data(self): data = self.df length_count = data.length.value_counts() train_idx = [] for k, v in length_count.items(): if v >= 3: idx = data[data.length == k].sample(frac=0.8, random_state=self.random_state).index else: idx = data[data.length == k].sample(n=1, random_state=self.random_state).index train_idx.extend(idx) X_train = deepcopy(data[data.index.isin(train_idx)]) X_test = deepcopy(data[~data.index.isin(train_idx)]) # length_count = data.length.value_counts() # test_idx = [] # for k, v in length_count.items(): # if v >= 3: # idx = data[data.length == k].sample(frac=0.5, random_state=random_state).index # else: # idx = data[data.length == k].sample(n=1, random_state=random_state).index # test_idx.extend(idx) # X_test = data[data.index.isin(test_idx)] # X_valid = data[~data.index.isin(test_idx)] if self.train_augment_times>1: train_temp = pd.concat([X_train] * (self.train_augment_times - 1), axis=0) train_temp[self.smile_field] = train_temp[self.smile_field].map(lambda x: randomize_smile(x)) train_set = pd.concat([train_temp, X_train], ignore_index=True) else: train_set = X_train train_set.dropna(inplace=True) train_set = deepcopy(train_set) train_set['length'] = train_set[self.smile_field].map(lambda x: len(x.replace('Cl', 'X').replace('Br', 'Y'))) train_set = train_set[train_set.length <= self.max_len] if self.test_augment_times>1: test_temp = pd.concat([X_test] * (self.test_augment_times - 1), axis=0) test_temp[self.smile_field] = test_temp[self.smile_field].map(lambda x: randomize_smile(x)) test_set = pd.concat([test_temp, X_test], ignore_index=True) # test_set['length'] = test_set[self.smile_field].map(lambda x: len(x.replace('Cl', 'X').replace('Br', 'Y'))) # test_set = test_set[test_set.length <= self.max_len] else: test_set = X_test test_set = deepcopy(test_set) x_train,y_train = self.numerical_smiles(train_set) x_test, y_test = self.numerical_smiles(test_set) print(len(X_train)/len(X_train[self.smile_field].unique())) print(x_test.shape) return x_train,y_train,x_test,y_test

value_counts 计数不同长度的 smiles 各有几个，如果这个长度的数量 >= 3，那么从这些 smiles 中取 80% 的数据，如果数量太少就随机取一个，采样的数据构成训练数据集，其他构成测试数据集。这样做到了依据 smiles 长度的分层采样，避免了可能出现的数据不平衡

数据增强通过复制 self.train_augment_times - 1 次 X_train，然后将它们用 randomize_smile 更新，再把增强后的数据与原数据合并，得到增强次数为 self.train_augment_times 的训练数据，且每个分子对应的标签也配对

排除 randomize_smile 失败的 np.nan，重新计算长度，滤过太长的 smiles，测试集用同样的方法处理，再向量化后返回

1.3.numerical_smiles

def numerical_smiles(self, data): x = np.zeros((len(data), (self.max_len + 2)), dtype='int32') y = np.array(data[self.label_field]).astype('float32') for i,smiles in enumerate(data[self.smile_field].tolist()): smiles = self._char_to_idx(seq = smiles) smiles = self._pad_start_end_token(smiles) x[i,:len(smiles)] = np.array(smiles) return x, y def _pad_start_end_token(self,seq): seq.insert(0, self.vocab['']) seq.append(self.vocab['']) return seq def _char_to_idx(self,seq): char_list = re.findall(regex_pattern, seq) return [self.vocab[char_list[j]] for j in range(len(char_list))]

这里 _char_to_idx 调用出现问题，原因是 self.vocab 中 key 为 int，而不是 char，且没有和词元，做了键值互换和补充两个词元后成功运行，处理 vocab.npy 的代码如下：

vocab = np.load('./data/vocab.npy', allow_pickle=True).item() vocab[0]='' vocab[39]='' vocab=dict(zip(vocab.values(),vocab.keys())) print(vocab) np.save('F:\\vocab.npy', vocab)

在 regex_pattern = r’Cl|Br|[#%)(+-1032547698:=@CBFIHONPS[]cionps]’ 中匹配字符后向量化。x 的维度是 $N\times (max\_len+2)$ ，其中每一行是 smiles 的向量化表示，包括了开始的词元和结束词元向量，pad 的部分是0，y 是标量。示例如下：

data=dataset.get_data() data """ 1.0116686114352391 (22100, 102) (array([[40, 20, 7, ..., 0, 0, 0], [40, 20, 7, ..., 0, 0, 0], [40, 31, 7, ..., 0, 0, 0], ..., [40, 25, 7, ..., 0, 0, 0], [40, 37, 31, ..., 0, 0, 0], [40, 25, 20, ..., 0, 0, 0]], dtype=int32), array([-0.96, -0.92, -0.9 , ..., 1.14, 1.67, 1.53], dtype=float32), array([[40, 20, 4, ..., 0, 0, 0], [40, 20, 26, ..., 0, 0, 0], [40, 33, 7, ..., 0, 0, 0], ..., [40, 25, 7, ..., 0, 0, 0], [40, 25, 18, ..., 0, 0, 0], [40, 25, 7, ..., 0, 0, 0]], dtype=int32), array([-0.67 , -0.2 , 0.4 , ..., -3.34 , 1.81 , 1.415], dtype=float32)) """ x_train,y_train,x_test,y_test=data x_train.shape,y_train.shape,x_test.shape,y_test.shape """ ((86700, 102), (86700,), (22100, 102), (22100,)) """

len(X_train)/len(X_train[self.smile_field].unique()) 略大于1，这是因为 smiles 在 shuffle 的时候返回了同样的字符串

2.reg

os.environ["TF_FORCE_GPU_ALLOW_GROWTH"] = "True" activation = 'relu' dropout_rate = 0.25 os.environ["CUDA_VISIBLE_DEVICES]" = "0"

os.environ[“TF_FORCE_GPU_ALLOW_GROWTH”] = “true” 可以一定程度上解决 tf 的显存溢出问题

2.1.loadData

dataset = Dataset('data/reg/{}.txt'.format(task), 'SMILES', 'Label', 100, 100, 100, seed) test_aug_times = dataset.test_augment_times train_aug_times = dataset.train_augment_times data = dataset.get_data() x_train = data[0].astype('int32') y_train = data[1].astype('float32').reshape(-1, 1) y_mean = y_train.mean() y_max = y_train.max() y_train = (y_train - y_mean) / y_max x_test = data[2].astype('int32') y_test = data[3].astype('float32').reshape(-1, 1) y_test = (y_test - y_mean) / y_max

读取数据并缩小值范围

2.2.make_model

cbk = keras.callbacks.LambdaCallback(on_epoch_end=lambda epoch, logs: myfunc(epoch, logs))

创建回调函数，在一个训练 epoch 结束时调用，实现如下：

def myfunc(epoch, logs): global x_test, y_test, model, ch, test_aug_times, ch1, ch5, ch10, ch20, ch50, ch100 y_pred = model.predict(x_test) y_test1 = y_test.reshape(test_aug_times, -1)[-1:, :].mean(0) y_pred1 = y_pred.reshape(test_aug_times, -1)[-1:, :].mean(0) y_test5 = y_test.reshape(test_aug_times, -1)[-5:, :].mean(0) y_pred5 = y_pred.reshape(test_aug_times, -1)[-5:, :].mean(0) y_test10 = y_test.reshape(test_aug_times, -1)[-10:, :].mean(0) y_pred10 = y_pred.reshape(test_aug_times, -1)[-10:, :].mean(0) y_test20 = y_test.reshape(test_aug_times, -1)[-20:, :].mean(0) y_pred20 = y_pred.reshape(test_aug_times, -1)[-20:, :].mean(0) y_test50 = y_test.reshape(test_aug_times, -1)[-50:, :].mean(0) y_pred50 = y_pred.reshape(test_aug_times, -1)[-50:, :].mean(0) y_test100 = y_test.reshape(test_aug_times, -1).mean(0) y_pred100 = y_pred.reshape(test_aug_times, -1).mean(0) r1 = r2_keras(y_test1, y_pred1) r5 = r2_keras(y_test5, y_pred5) r10 = r2_keras(y_test10, y_pred10) r20 = r2_keras(y_test20, y_pred20) r50 = r2_keras(y_test50, y_pred50) r100 = r2_keras(y_test100, y_pred100) print('\n') print(r1, r5, r10, '\n', r20, r50, r100) print('\n') ch1.append(r1.numpy()) ch5.append(r5.numpy()) ch10.append(r10.numpy()) ch20.append(r20.numpy()) ch50.append(r50.numpy()) ch100.append(r100.numpy()) return r1 def r2_keras(y_true, y_pred): y_true = tf.reshape(y_true, (-1, 1)) y_pred = tf.reshape(y_pred, (-1, 1)) SS_res = tf.reduce_sum(tf.square(y_true - y_pred)) SS_tot = tf.reduce_sum(tf.square(y_true - tf.reduce_mean(y_true))) return (1 - SS_res / (SS_tot + 10e-8))

计算训练时的 square determination coefficient

model = build_model() def build_model(): inp = keras.Input(shape=[102, ], dtype=tf.int32) emb = layers.Embedding(41, 64, mask_zero=True, embeddings_regularizer=keras.regularizers.l2(1e-5), embeddings_constraint=keras.constraints.max_norm(3) )(inp) mask = tf.equal(inp, 0) emb = layers.Masking(mask_value=0.0)(emb) emb = layers.Dropout(dropout_rate)(emb) x = layers.Bidirectional(layers.LSTM(128, return_sequences=True))(emb) x = layers.Dropout(dropout_rate)(x) x = layers.Bidirectional(layers.LSTM(64, return_sequences=True))(x) x = RemoveMask()(x) x = AttentionWithContext(x, mask) x = layers.Dense(256, activation='relu', )(x) x = layers.Dropout(0.25)(x) x = layers.Dense(64, activation='relu' )(x) x = layers.Dropout(0.5)(x) y = layers.Dense(1)(x) model = keras.Model(inputs=inp, outputs=y) learning_rate = tf.keras.optimizers.schedules.ExponentialDecay( 0.005, decay_steps=3000, decay_rate=0.96, staircase=True) optimizer = keras.optimizers.Adam(learning_rate=learning_rate) model.compile(loss='mse', optimizer=optimizer, metrics=[r2_keras]) return model

输入为 (batch_size,102) 的矩阵，layers.Embedding 的参数是 (词汇表大小,输出大小)，经过 Embedding 后每个标量被 Embedding 为 64 维的向量（可以理解为低维 one-hot，但维度更低且包含了更多信息），输出张量大小为 (batch_size,102,64)，词表大小应该是 39？这里不理解为什么设置为 41，mask 是 padding 的部分，layers.Masking 过滤 padding 的部分，避免后面的 LSTM 计算。经过 Dropout 后进入双向 LSTM，输入张量 (batch_size,102,64)，batch_size 个 smiles，每个 smiles 有102个字符，每个字符被编码为长度为64的向量，进入 LSTM 后，每个 smiles 被编码为长度为128的隐变量，应为是双向LSTM，最后前向和后向合并应该是长度为256的隐变量，return_sequences=True 表示输出每个时间步的隐变量，这里时间步为102，因此双向 LSTM 最后输出 (batch_size,102,256) 维的张量，经过 Dropout 后进入双向 LSTM，输出 (batch_size,102,128) 的张量，之后进入 RemoveMask

2.4.RemoveMask

class RemoveMask(keras.layers.Layer): def __init__(self, return_masked=False, no_mask=False, **kwargs): super(RemoveMask, self).__init__(**kwargs) self.supports_masking = True self.no_mask = no_mask def compute_mask(self, inputs, mask=None): return None

RemoveMask 可以将 Embedding 层由于 mask_zero=True 产生的 mask 不在后续层中使用，下面的 AttentionWithContext 使用自定义的 mask

2.5.AttentionWithContext

def AttentionWithContext(x, mask): att = layers.Dense(64, activation=activation)(x) att = layers.Dropout(0.25)(att) att = layers.Dense(1)(att) mask = tf.expand_dims(tf.cast(mask, tf.float32), 2) att = att + mask * (-1e8) att = layers.Softmax(1)(att) context_vector = att * x context_vector = tf.reduce_sum(context_vector, 1) context_vector = layers.Flatten()(context_vector) return context_vector

(batch_size,102,128) 的张量经过两个全连接层后输出为 (batch_size,102,1) 的张量，mask 是 (batch_size,102) 的张量，扩展维度后与 attn 维度一致，将 padding 的部分加负无穷后经过 Softmax 变为0。 (batch_size,102,128) 的 x 与 (batch_size,102,1) 的 attn 经过广播后逐元素相乘，得到 (batch_size,102,128) 的 context_vector。reduce_sum 后，维度为 (batch_size,128)，Flatten 后仍然是 (batch_size,128)，之后进入一些 Dense 和 Dropout，输出(batch_size,1)，即预测值，然后构建模型返回。模型框架如下：

Model: "model" __________________________________________________________________________________________________ Layer (type) Output Shape Param # Connected to ================================================================================================== input_1 (InputLayer) [(None, 102)] 0 [] embedding (Embedding) (None, 102, 64) 2624 ['input_1[0][0]'] masking (Masking) (None, 102, 64) 0 ['embedding[0][0]'] dropout (Dropout) (None, 102, 64) 0 ['masking[0][0]'] bidirectional (Bidirectional) (None, 102, 256) 197632 ['dropout[0][0]'] dropout_1 (Dropout) (None, 102, 256) 0 ['bidirectional[0][0]'] bidirectional_1 (Bidirectional (None, 102, 128) 164352 ['dropout_1[0][0]'] ) remove_mask (RemoveMask) (None, 102, 128) 0 ['bidirectional_1[0][0]'] tf.math.equal (TFOpLambda) (None, 102) 0 ['input_1[0][0]'] dense (Dense) (None, 102, 64) 8256 ['remove_mask[0][0]'] tf.cast (TFOpLambda) (None, 102) 0 ['tf.math.equal[0][0]'] dropout_2 (Dropout) (None, 102, 64) 0 ['dense[0][0]'] tf.expand_dims (TFOpLambda) (None, 102, 1) 0 ['tf.cast[0][0]'] dense_1 (Dense) (None, 102, 1) 65 ['dropout_2[0][0]'] tf.math.multiply (TFOpLambda) (None, 102, 1) 0 ['tf.expand_dims[0][0]'] tf.__operators__.add (TFOpLamb (None, 102, 1) 0 ['dense_1[0][0]', da) 'tf.math.multiply[0][0]'] softmax (Softmax) (None, 102, 1) 0 ['tf.__operators__.add[0][0]'] tf.math.multiply_1 (TFOpLambda (None, 102, 128) 0 ['softmax[0][0]', ) 'remove_mask[0][0]'] tf.math.reduce_sum (TFOpLambda (None, 128) 0 ['tf.math.multiply_1[0][0]'] ) flatten (Flatten) (None, 128) 0 ['tf.math.reduce_sum[0][0]'] dense_2 (Dense) (None, 256) 33024 ['flatten[0][0]'] dropout_3 (Dropout) (None, 256) 0 ['dense_2[0][0]'] dense_3 (Dense) (None, 64) 16448 ['dropout_3[0][0]'] dropout_4 (Dropout) (None, 64) 0 ['dense_3[0][0]'] dense_4 (Dense) (None, 1) 65 ['dropout_4[0][0]'] ================================================================================================== Total params: 422,466 Trainable params: 422,466 Non-trainable params: 0 __________________________________________________________________________________________________

2.3.run & save history

h = model.fit(x_train, y_train, epochs=150, batch_size=512, validation_data=(x_test, y_test), callbacks=[cbk, ]) history = h.history history['r1'] = ch1 history['r5'] = ch5 history['r10'] = ch10 history['r20'] = ch20 history['r50'] = ch50 history['r100'] = ch100 res = pd.DataFrame(history) res.to_csv('result/{}_{}_{}_{}.csv'.format(task, seed, train_aug_times, test_aug_times)) keras.backend.clear_session()

利用 x_test 和 y_test 作为验证集，训练结束后保存训练历史

3.总结

利用数据增强的方法解决训练数据太少的问题，双向 LSTM 聚合信息

AttentionWithContext 的实现不太理解

目标检测领域总结：从传统方法到 Transformer 时代的革新 DoYangTan 目标检测系列目标检测 transformer 人工智能
目标检测领域总结：从传统方法到Transformer时代的革新目标检测是计算机视觉领域的一个核心任务，它的目标是从输入图像中识别并定位出目标物体。随着深度学习的兴起，目标检测方法已经取得了显著的进展。从最早的传统方法到现如今基于Transformer的先进算法，目标检测的发展经历了多个重要的阶段。本文将详细总结目标检测领域的演进，涵盖传统方法、两阶段检测方法、单阶段检测方法和基于Transform
2024MathorCup数学建模之——MathorCup奖杯”获得者经验思路分享美赛数学建模数学建模
一、经验分享1.工具选择：顺手即可。Matlab和Python都是比较主流的选择，二者的应用场合各有不同。Python在数据分析、深度学习方面的优势愈发明显，而Matlab更适合进行物理仿真和数值计算。不过随着Python社区不断发展，其功能也愈发全面与强大，因此我们比较推荐学有余力的情况下可以更早接触Python。2.模型算法：多多益善。不一定要精通所有的算法，但是手上至少要准备一些常用的算法（
AI人工智能软件开发方案：开启智能时代的创新钥匙广州硅基技术官方人工智能
一、引言：AI浪潮下的软件开发新机遇近年来，人工智能（AI）技术的迅猛发展如同一股汹涌澎湃的浪潮，席卷了全球各个领域。从最初的概念提出到如今的广泛应用，AI历经了漫长的发展历程，终于迎来了属于它的黄金时代。回首过去，AI的发展并非一帆风顺，早期由于计算能力和算法的限制，经历了多次起伏。但随着大数据、云计算、机器学习、深度学习等技术的不断突破，AI迎来了爆发式增长。如今，AI已经深入到人们生活和工作
深度学习框架PyTorch——从入门到精通（6.2）自动微分机制 Fansv587 深度学习 pytorch 人工智能经验分享 python 机器学习
本节自动微分机制是上一节自动微分的扩展内容自动微分是如何记录运算历史的保存张量非可微函数的梯度在本地设置禁用梯度计算设置requires_grad梯度模式（GradModes）默认模式（梯度模式）无梯度模式推理模式评估模式（`nn.Module.eval()`）自动求导中的原地操作原地操作的正确性检查多线程自动求导CPU上的并发不确定性计算图保留自动求导节点的线程安全性C++钩子函数不存在线程安全
神经网络中层与层之间的关联 iisugar 神经网络深度学习计算机视觉
目录1.层与层之间的核心关联：数据流动与参数传递1.1数据流动（ForwardPropagation）1.2参数传递（BackwardPropagation）2.常见层与层之间的关联模式2.1典型全连接网络（如手写数字分类）2.2卷积神经网络（CNN，如图像分类）2.3循环神经网络（RNN/LSTM，如文本生成）2.4Transformer（如机器翻译）3.层间关联的核心原则3.1数据传递的“管道
Pytorch深度学习教程_9_nn模块构建神经网络 tRNA做科研深度学习保姆教程深度学习 pytorch 神经网络
欢迎来到《深度学习保姆教程》系列的第九篇！在前面的几篇中，我们已经介绍了Python、numpy及pytorch的基本使用，进行了梯度及神经网络的实践并学习了激活函数和激活函数，在上一个教程中我们学习了优化算法。今天，我们将开始使用pytorch构建我们自己的神经网络。欢迎订阅专栏进行系统学习：深度学习保姆教程_tRNA做科研的博客-CSDN博客目录1.理解nn模块：(1)使用nn.Sequent
Radiance Fields from VGGSfM和Mast3r:两种先进3D重建方法的比较与分析 2401_87458718 3d
VGGSfM和Mast3r:3D场景重建的新方向在计算机视觉和3D重建领域,如何从2D图像重建3D场景一直是一个充满挑战的研究课题。近年来,随着深度学习技术的发展,一些新的方法被提出并取得了显著的进展。本文将重点介绍两种最新的基于深度学习的3D重建方法:VGGSfM和Mast3r,并通过GaussianSplatting技术对它们的性能进行全面比较和分析。VGGSfM:基于视觉几何的深度结构运动恢
基于 PyTorch 的 MNIST 手写数字分类模型欣然～ pytorch 分类人工智能
一、概述本代码使用PyTorch框架构建了一个简单的神经网络模型，用于解决MNIST手写数字分类任务。代码主要包括数据的加载与预处理、神经网络模型的构建、损失函数和优化器的定义、模型的训练、评估以及最终模型的保存等步骤。二、依赖库torch：PyTorch深度学习框架的核心库，提供了张量操作、自动求导等功能。torch.nn：PyTorch的神经网络模块，包含了各种神经网络层、损失函数等。torc
小程序被黑客攻击，如何防御！群联云防护小杜安全问题汇总小程序安全 web 被攻击阿里云 waf
在当今数字化时代，小程序作为连接用户与服务的桥梁，其安全性至关重要。随着小程序生态的日益壮大，也吸引了越来越多的不法分子试图通过各种手段进行攻击，如注入攻击、盗取用户数据、恶意篡改等。为了保护用户隐私和业务安全，开发者必须采取有效的防御措施。本文将深入探讨几种常见的小程序攻击方式及其解决方案，并附带示例代码，以确保您的小程序能够稳健运行。1.SQL注入攻击防范问题描述：攻击者通过在输入字段中插入恶
雷军从 6 楼扔涂有防弹涂层西瓜，西瓜完好无损，这种防弹涂层是什么材质？用在车上效果怎么样？日记成书热门实事材质网络运维
雷军展示的“防弹涂层”是一种基于第四代高分子材料聚脲（Polyurea）的升级技术，其核心特性是通过纳米级交联结构形成弹性防护层，兼具柔韧性与刚性，能够有效吸收冲击能量并抵御尖锐物体的穿刺。以下是关于该涂层材质及在车用场景中的详细分析：一、防弹涂层的材质与技术特性材料本质该涂层属于聚脲材料的升级版本，由异氰酸酯与氨基化合物反应生成。其分子链结构密集交错，形成类似“钢筋网”的防护层，可瞬间形变吸收冲
高效快速教你DeepSeek如何进行本地部署并且可视化对话大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
科技文章：高效快速教你DeepSeek如何进行本地部署并且可视化对话摘要：随着自然语言处理（NLP）技术的进步，DeepSeek作为一款基于深度学习的语义搜索技术，广泛应用于文本理解、对话系统及信息检索等多个领域。本文将探讨如何高效快速地在本地部署DeepSeek，并结合可视化工具实现对话过程的监控与分析。通过详尽的步骤、案例分析与代码示例，帮助开发者更好地理解和应用DeepSeek技术。同时，本
量化交易系统中如何处理机器学习模型的训练和部署？ openwin_top 量化交易系统开发机器学习人工智能量化交易
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位量化交易系统中，机器学习模型的训练和部署需要遵循一套严密的流程，以确保模型的可靠性、性能和安全性。以下是详细描述以及相关的示例：1.数据收集和预处理数据收集在量化交易中，数据是最重要的资产。收集的数
Uni-App 双栏联动滚动组件开发详解 (电梯导航) FFF-X uni-app
本文基于提供的代码实现一个左右联动的滚动组件，以下是详细的代码解析与实现原理说明：{{item}}{{section.title}}{{para}}exportdefault{//组件参数定义props:{leftData:{//左侧导航数据type:Array,default:()=>['章节1','章节2','章节3','章节4','章节5','章节6'],},rightData:{//右侧内
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
深度学习 | pytorch + torchvision + python 版本对应及环境安装 zfgfdgbhs 深度学习 python pytorch
目录一、版本对应二、安装命令（pip）1.版本（1）v2.5.1~v2.0.0（2）v1.13.1~v1.11.0（3）v1.10.1~v1.7.02.安装全过程（1）选择版本（2）安装结果参考文章一、版本对应下表来自pytorch的github官方文档：pytorch/vision:Datasets,TransformsandModelsspecifictoComputerVisionpytor
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
深度学习 Deep Learning 第8章深度学习优化 odoo中国 AI编程人工智能深度学习人工智能优化
深度学习第8章深度学习的优化章节概述本章深入探讨了深度学习中的优化技术，旨在解决模型训练过程中面临的各种挑战。优化是深度学习的核心环节，直接关系到模型的训练效率和最终性能。本章首先介绍了优化在深度学习中的特殊性，然后详细讨论了多种优化算法，包括随机梯度下降（SGD）、动量法、Nesterov动量法、AdaGrad、RMSProp和Adam等。此外，还探讨了参数初始化策略、自适应学习率方法以及二阶优
景联文科技提供高质量文本标注服务，驱动AI技术发展景联文科技科技人工智能
文本标注是指在原始文本数据上添加标签的过程，这些标签可以用来指示特定的实体、关系、事件等信息，以帮助计算机理解和处理这些数据。文本标注是自然语言处理（NLP）领域的一个重要环节，它通过为文本的不同部分提供具体的含义和上下文信息，增强机器学习和深度学习模型对文本内容的理解能力。标注类型情感分析情感极性：确定文本表达的情感倾向，如正面、负面或中立。强度评估：衡量情感的强烈程度，从轻微到极端不等。命名实
深度学习篇---对角矩阵&矩阵的秩&奇异矩阵 Ronin-Lotus 程序代码篇深度学习篇深度学习矩阵人工智能线性代数
文章目录前言一、对角矩阵（DiagonalMatrix）1.1定义1.2特性行列式运算简化1.3应用领域深度学习信号处理量子力学经济学二、矩阵的秩（RankofaMatrix）2.1定义2.2特性满秩降秩影响2.3应用领域深度学习图像压缩推荐系统控制理论三、奇异矩阵（SingularMatrix）3.1定义3.2特性秩不足行列式为零3.3应用领域深度学习正则化损失函数结构工程统计学数值计算四、跨领
DeepSeek、Grok 与 ChatGPT 三巨头：技术架构与应用场景的全方位解析云策量化 Deepseek chatgpt deepseek grok
前言在当今人工智能领域，DeepSeek、Grok和ChatGPT作为语言模型的三巨头，各自凭借独特的技术架构和广泛的应用场景，在自然语言处理领域占据着重要地位。本文将对这三款模型的技术架构和应用场景进行全方位解析，以期为读者提供深入的了解和有价值的参考。一、技术架构（一）DeepSeekDeepSeek是由DeepSeek团队开发的一款大型语言模型，其技术架构基于深度学习中的Transforme
OpenCV 4.2.0与扩展模块安装与应用指南土城三富
本文还有配套的精品资源，点击获取简介：OpenCV4.2.0是一个先进的计算机视觉库，包含了图像处理、计算机视觉和机器学习算法。本压缩包包含OpenCV核心库和扩展模块（opencv_contrib），版本均为4.2.0。该版本引入了性能增强、API优化以及对深度学习框架和硬件加速技术的更新支持。扩展模块提供了额外的实验性算法和功能，有助于研究和开发新算法。指南详细介绍了如何安装和配置这些库，并提
介于YOLOv5的裂缝识别系统程序员～小强 YOLO
介于YOLOv5的裂缝识别系统在现代工业中，裂缝监测是的保障设施安全的重要环节。我们公司的新项目——基于YOLOv5的裂缝识别系统，将为您提供高效、精准的解决方案，助力各类工程项目的质量管理。系统优势我们的裂缝识别系统借助YOLOv5进行深度学习，经过精心训练，拥有强大的图像识别能力。只需简单的步骤，您就能将复杂的裂缝检测转化为轻松的操作，让分析变得更加简单、高效。核心功能图片上传与场景选择用户可
使用Dall-E生成图像：文本到图像的魔力 shuoac 计算机视觉人工智能 python
使用Dall-E生成图像：文本到图像的魔力技术背景介绍Dall-E是OpenAI开发的一个强大的文本到图像生成模型，它能够根据自然语言描述创造出全新的数字图像。这一技术基于深度学习的方法，使得创意与AI图像生成的结合更具可能性。本文将介绍如何调用Dall-EAPI来生成图像，从而使开发者能够将这一技术应用到自己的项目中。核心原理解析Dall-E利用大型语言模型（LLM）从用户提供的文本描述中提取详
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。 985小水博一枚呀深度学习人工智能
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。文章目录【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。1.滑坡灾害早期隐患的概念与特征概念主要特征2.通过光学
给普通人看的深度学习说明书：用快递系统理解AI如何思考嵌入式Jerry Python AI 人工智能深度学习
第一章：理解AI的思维方式（快递版）1.1快递分拣站的故事假设你管理一个快递分拣站：传统方法：手动制定规则（比如根据邮编分拣）机器学习：观察老员工的分拣记录，总结规律深度学习：搭建自动分拣流水线，自主发现隐藏规则1.2神经网络就像智能分拣机传送带（输入层）：接收包裹信息（图片像素/文字等）#就像扫描快递单input_data=[0.2,0.7,0.1]#归一化后的特征数据分拣工人（隐藏层）：每个工
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &

bidirectional long short term merory attention network

文章目录

1.dataset

1.1.init

1.2.get_data

1.3.numerical_smiles

2.reg

2.1.loadData

2.2.make_model

2.4.RemoveMask

2.5.AttentionWithContext

2.3.run & save history

3.总结

你可能感兴趣的:(代码解析,lstm,深度学习,smiles,药物分子)