马鹏森

Accurate prediction of molecular targets using a self-supervised image rep...（代码理解）

GitHub - HongxinXiang/ImageMol: ImageMol is a molecular image-based pre-training deep learning framework for computational drug discovery.

我在windows上下载并测试的

首先是其中每个文件夹中文件的意义：

1. preparing dataset

在第一步“1. preparing dataset”中，由 data.CSV 文件中的smiles列转换成 molecular image（在224文件夹下），并且data.CSV生成 “data_for_pretrain.csv”（只是原来smiles列变成了filename）

也就是说224中的每一张照片对应data.csv / data_for_pretrain.csv的每一行

2. fine-tune

其中计算的逻辑：

我们要使用分类器进行fine-tune，将 224中的图像输入进model，得到维度为“(64,617)”的pred，然后把它与data_for_pretrain.csv中真实的标签 labels(64,617)计算损失，其中64是batch-size，617为每一个图片对应的label的长度（我认为此时fine-tune是一种监督学习，它是利用有标签的数据进行微调，然后预训练模型使通过self-supervise的方式进行“无监督方式”训练模型）【总结来看：是用过把image的信息embedding，然后直接预测label，中间过程并没有生成任何的image...，与使用image进行“OG, OP”不一样，因为“OG, OP”是要生成image的】

# model(image) <==> label 他们之间计算损失
# 化学分子性质预测主要包含对已经预训练好的模型拿来进行finetune，下游任务主要是在模型上添加线性分类器，来预测下游图形标签，然后再以端到端的方式进行微调。（其中label是分子的性质）

Install environment

1. GPU environment

CUDA 10.1

2. create a new conda environment

conda create -n imagemol python=3.7.3

conda activate imagemol

3. download some packages

conda install -c rdkit rdkit

windows:

pip install https://download.pytorch.org/whl/cu101/torch-1.4.0-cp37-cp37m-win_amd64.whl
pip install https://download.pytorch.org/whl/cu101/torchvision-0.5.0-cp37-cp37m-win_amd64.whl

linux:

pip install https://download.pytorch.org/whl/cu101/torch-1.4.0-cp37-cp37m-linux_x86_64.whl
pip install https://download.pytorch.org/whl/cu101/torchvision-0.5.0-cp37-cp37m-linux_x86_64.whl

pip install torch-cluster torch-scatter torch-sparse torch-spline-conv -f https://pytorch-geometric.com/whl/torch-1.4.0%2Bcu101.html

pip install -r requirements.txt

source activate imagemol

注意：这里有一个错误，github上requirements.txt写的 scikit-learn==1.21.2，但是现在最新版本的scikit-learn==1.1.2，并且它还必须python>=3.8
所以这里，我安装的是“ numpy-1.21.6 scikit-learn-1.0.2”

Pretraining

1. preparing dataset

data.CSV文件中的smiles列生成224*224的molecular image（每一行都可以生成一个分子图像）， and data.CSV文件生成“data_for_pretrain.csv”（只是原来的smiles列变成了filename列）

Download pretraining data and put it into ./datasets/pretraining/data/

Preprocess dataset:（这个时间比较长，这里要处理接近一千万份文件，我总共花费了22个小时）

python ./data_process/smiles2img_pretrain.py --dataroot ./datasets/pretraining/ --dataset data

Note: You can find the toy dataset in ./datasets/toy/pretraining/

2. start to pretrain

训练一个预训练模型，从而用于下游任务

Usage:

usage: pretrain.py [-h] [--lr LR] [--wd WD] [--workers WORKERS]
                   [--val_workers VAL_WORKERS] [--epochs EPOCHS]
                   [--start_epoch START_EPOCH] [--batch BATCH]
                   [--momentum MOMENTUM] [--checkpoints CHECKPOINTS]
                   [--seed SEED] [--dataroot DATAROOT] [--dataset DATASET]
                   [--ckpt_dir CKPT_DIR] [--modelname {ResNet18}]
                   [--verbose] [--ngpu NGPU] [--gpu GPU] [--nc NC] [--ndf NDF]
                   [--imageSize IMAGESIZE] [--Jigsaw_lambda JIGSAW_LAMBDA]
                   [--cluster_lambda CLUSTER_LAMBDA]
                   [--constractive_lambda CONSTRACTIVE_LAMBDA]
                   [--matcher_lambda MATCHER_LAMBDA]
                   [--is_recover_training IS_RECOVER_TRAINING]
                   [--cl_mask_type {random_mask,rectangle_mask,mix_mask}]
                   [--cl_mask_shape_h CL_MASK_SHAPE_H]
                   [--cl_mask_shape_w CL_MASK_SHAPE_W]
                   [--cl_mask_ratio CL_MASK_RATIO]

Code to pretrain:

python pretrain.py --ckpt_dir ./ckpts/pretraining/ \
                   --checkpoints 1 \
                   --Jigsaw_lambda 1 \
                   --cluster_lambda 1 \
                   --constractive_lambda 1 \
                   --matcher_lambda 1 \
                   --is_recover_training 1 \
                   --batch 256 \
                   --dataroot ./datasets/pretraining/ \
                   --dataset data \
                   --gpu 0,1,2,3 \
                   --ngpu 4

For testing, you can simply pre-train ImageMol using single GPU on toy dataset:

python pretrain.py --ckpt_dir ./ckpts/pretraining-toy/ \
                   --checkpoints 1 \
                   --Jigsaw_lambda 1 \
                   --cluster_lambda 1 \
                   --constractive_lambda 1 \
                   --matcher_lambda 1 \
                   --is_recover_training 1 \
                   --batch 16 \
                   --dataroot ./datasets/toy/pretraining/ \
                   --dataset data \
                   --gpu 0 \
                   --ngpu 1

运行与结果：

python pretrain.py --ckpt_dir ./ckpts/pretraining-toy/ --checkpoints 1 --Jigsaw_lambda 1 --cluster_lambda 1 --constractive_lambda 1 --matcher_lambda 1 --is_recover_training 1 --batch 16 --dataroot ./datasets/toy/pretraining --dataset data --gpu 0 --ngpu 1

我使用测试训练进行了训练了17个epoch，总共生成了17个预训练模型：


(imagemol) D:\pycharm_workspace\1\ImageMol>python pretrain.py --ckpt_dir ./ckpts/pretraining-toy/ --checkpoints 1 --Jigsaw_lambda 1 --cluster_lambda 1 --constractive_lambda 1 --matcher_lambda 1 --is_recover_training 1 --batch 16 --dataroot ./datasets/toy/pretraining --dataset data --gpu 0 --ngpu 1
ImageMol(
  (embedding_layer): Sequential(
    (0): Conv2d(3, 64, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3), bias=False)
    (1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (2): ReLU(inplace=True)
    (3): MaxPool2d(kernel_size=3, stride=2, padding=1, dilation=1, ceil_mode=False)
    (4): Sequential(
      (0): BasicBlock(
        (conv1): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
        (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (relu): ReLU(inplace=True)
        (conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
        (bn2): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      )
      (1): BasicBlock(
        (conv1): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
        (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (relu): ReLU(inplace=True)
        (conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
        (bn2): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      )
    )
    (5): Sequential(
      (0): BasicBlock(
        (conv1): Conv2d(64, 128, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)
        (bn1): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (relu): ReLU(inplace=True)
        (conv2): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
        (bn2): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (downsample): Sequential(
          (0): Conv2d(64, 128, kernel_size=(1, 1), stride=(2, 2), bias=False)
          (1): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        )
      )
      (1): BasicBlock(
        (conv1): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
        (bn1): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (relu): ReLU(inplace=True)
        (conv2): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
        (bn2): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      )
    )
    (6): Sequential(
      (0): BasicBlock(
        (conv1): Conv2d(128, 256, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)
        (bn1): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (relu): ReLU(inplace=True)
        (conv2): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
        (bn2): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (downsample): Sequential(
          (0): Conv2d(128, 256, kernel_size=(1, 1), stride=(2, 2), bias=False)
          (1): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        )
      )
      (1): BasicBlock(
        (conv1): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
        (bn1): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (relu): ReLU(inplace=True)
        (conv2): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
        (bn2): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      )
    )
    (7): Sequential(
      (0): BasicBlock(
        (conv1): Conv2d(256, 512, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)
        (bn1): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (relu): ReLU(inplace=True)
        (conv2): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
        (bn2): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (downsample): Sequential(
          (0): Conv2d(256, 512, kernel_size=(1, 1), stride=(2, 2), bias=False)
          (1): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        )
      )
      (1): BasicBlock(
        (conv1): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
        (bn1): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (relu): ReLU(inplace=True)
        (conv2): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
        (bn2): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      )
    )
    (8): AdaptiveAvgPool2d(output_size=(1, 1))
  )
  (bn): BatchNorm1d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
  (jigsaw_classifier): Linear(in_features=512, out_features=101, bias=True)
  (class_classifier1): Linear(in_features=512, out_features=100, bias=True)
  (class_classifier2): Linear(in_features=512, out_features=1000, bias=True)
  (class_classifier3): Linear(in_features=512, out_features=10000, bias=True)
)
Matcher(
  (fc): Linear(in_features=512, out_features=2, bias=True)
  (logic): LogSoftmax()
)
generator(
  (projection): Sequential(
    (0): Linear(in_features=512, out_features=128, bias=True)
    (1): BatchNorm1d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (2): LeakyReLU(negative_slope=0.2, inplace=True)
  )
  (netG): Sequential(
    (0): ConvTranspose2d(128, 512, kernel_size=(4, 4), stride=(1, 1), bias=False)
    (1): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (2): ReLU(inplace=True)
    (3): ConvTranspose2d(512, 256, kernel_size=(4, 4), stride=(2, 2), padding=(1, 1), bias=False)
    (4): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (5): ReLU(inplace=True)
    (6): ConvTranspose2d(256, 128, kernel_size=(4, 4), stride=(2, 2), padding=(1, 1), bias=False)
    (7): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (8): ReLU(inplace=True)
    (9): ConvTranspose2d(128, 64, kernel_size=(4, 4), stride=(2, 2), padding=(1, 1), bias=False)
    (10): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (11): ReLU(inplace=True)
    (12): ConvTranspose2d(64, 3, kernel_size=(4, 4), stride=(2, 2), padding=(1, 1), bias=False)
    (13): Tanh()
  )
)
netlocalD(
  (main): Sequential(
    (0): Conv2d(3, 64, kernel_size=(4, 4), stride=(2, 2), padding=(1, 1), bias=False)
    (1): LeakyReLU(negative_slope=0.2, inplace=True)
    (2): Conv2d(64, 128, kernel_size=(4, 4), stride=(2, 2), padding=(1, 1), bias=False)
    (3): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (4): LeakyReLU(negative_slope=0.2, inplace=True)
    (5): Conv2d(128, 256, kernel_size=(4, 4), stride=(2, 2), padding=(1, 1), bias=False)
    (6): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (7): LeakyReLU(negative_slope=0.2, inplace=True)
    (8): Conv2d(256, 512, kernel_size=(4, 4), stride=(2, 2), padding=(1, 1), bias=False)
    (9): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (10): LeakyReLU(negative_slope=0.2, inplace=True)
    (11): Conv2d(512, 1, kernel_size=(4, 4), stride=(1, 1), bias=False)
    (12): Sigmoid()
  )
)
100%|█| 60/60 [02:29<00:00,  2.50s/it, C_loss=0.02, ClsLoss_100=4.36, ClsLoss_1000=7.16, ClsLoss_10000=9.29, ClsTotalLo
100%|████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:19<00:00,  4.79s/it]
Epoch: [1][train]       TotalLoss: 23.96166973114014    JigLoss: 1.9193571281929807     ClsLoss_100: 4.92697454293569  ClsLoss_1000: 7.11983088652293   ClsLoss_10000: 9.33748327891032 ClsTotalLoss(fftotal): 21.384288565317785       AvgConstractiveLoss: 0.1648771699983627 AvgReasonabilityLoss: 0.49314683731645315       AvgRecoverLoss: 5.0754999422313025
Epoch: [1][val] JigsawAcc: 0.82 ClusterAcc100: 0.0      ClusterAcc1000: 0.0     ClusterAcc10000: 0.0    ClusterAcc(avg): 0.0    ConstractiveLoss: 0.004153344817459583  ReasonabilityLoss: 0.013568593263626099 RecoverLoss: 0.2023082345724106
100%|█| 60/60 [01:06<00:00,  1.12s/it, C_loss=0.0138, ClsLoss_100=4.49, ClsLoss_1000=7.29, ClsLoss_10000=8.7, ClsTotalL
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:18<00:00,  4.66s/it]
Epoch: [2][train]       TotalLoss: 21.496857229868567   JigLoss: 1.0841593230764073     ClsLoss_100: 4.781556669871013  ClsLoss_1000: 6.793236716588339ClsLoss_10000: 8.56167837778727  ClsTotalLoss(fftotal): 20.136471748352054       AvgConstractiveLoss: 0.07614539431718487        AvgReasonabilityLoss: 0.20008064570526282       AvgRecoverLoss: 3.5995476151506103
Epoch: [2][val] JigsawAcc: 0.86 ClusterAcc100: 0.04     ClusterAcc1000: 0.0     ClusterAcc10000: 0.0    ClusterAcc(avg): 0.013333333333333334   ConstractiveLoss: 0.0020515684410929683 ReasonabilityLoss: 0.002394016683101654 RecoverLoss: 0.29341010212898255
100%|█| 60/60 [01:06<00:00,  1.11s/it, C_loss=0.0453, ClsLoss_100=4.83, ClsLoss_1000=6.7, ClsLoss_10000=8.39, ClsTotalLoss=19.9, JigLoss=1.68, M_loss=0
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:20<00:00,  5.18s/it]
Epoch: [3][train]       TotalLoss: 20.89204044342041    JigLoss: 1.003493670374155      ClsLoss_100: 4.813545378049215  ClsLoss_1000: 6.738298972447714ClsLoss_10000: 8.154170513153076 ClsTotalLoss(fftotal): 19.706014760335286       AvgConstractiveLoss: 0.04975322242826223        AvgReasonabilityLoss: 0.13277878270794943       AvgRecoverLoss: 3.6251505697766935
Epoch: [3][val] JigsawAcc: 0.86 ClusterAcc100: 0.04     ClusterAcc1000: 0.0     ClusterAcc10000: 0.0    ClusterAcc(avg): 0.013333333333333334   ConstractiveLoss: 0.0015005466900765898 ReasonabilityLoss: 0.01395109474658966  RecoverLoss: 0.20824745893478394
100%|█| 60/60 [01:08<00:00,  1.14s/it, C_loss=0.0533, ClsLoss_100=4.81, ClsLoss_1000=6.56, ClsLoss_10000=8, ClsTotalLoss=19.4, JigLoss=0.897, M_loss=0.
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:19<00:00,  4.94s/it]
Epoch: [4][train]       TotalLoss: 20.512035369873047   JigLoss: 0.9941644340753556     ClsLoss_100: 4.804758842786154  ClsLoss_1000: 6.710355981191003ClsLoss_10000: 7.865747348467508 ClsTotalLoss(fftotal): 19.38086214065552        AvgConstractiveLoss: 0.048341524026667075       AvgReasonabilityLoss: 0.08866713357468446       AvgRecoverLoss: 4.077671728531518
Epoch: [4][val] JigsawAcc: 0.76 ClusterAcc100: 0.0      ClusterAcc1000: 0.0     ClusterAcc10000: 0.0    ClusterAcc(avg): 0.0    ConstractiveLoss: 0.004614624008536339  ReasonabilityLoss: 0.008996209204196932 RecoverLoss: 0.31746475636959076
100%|█| 60/60 [01:07<00:00,  1.12s/it, C_loss=0.07, ClsLoss_100=4.49, ClsLoss_1000=6.72, ClsLoss_10000=7.93, ClsTotalLoss=19.1, JigLoss=3.02, M_loss=1.
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:18<00:00,  4.62s/it]
Epoch: [5][train]       TotalLoss: 20.410388692220042   JigLoss: 1.0800357540448504     ClsLoss_100: 4.7787369966506965 ClsLoss_1000: 6.687890203793843ClsLoss_10000: 7.672290404637656 ClsTotalLoss(fftotal): 19.13891773223877        AvgConstractiveLoss: 0.05595408985391261        AvgReasonabilityLoss: 0.13548127884666128       AvgRecoverLoss: 4.075054861356814
Epoch: [5][val] JigsawAcc: 0.84 ClusterAcc100: 0.0      ClusterAcc1000: 0.0     ClusterAcc10000: 0.0    ClusterAcc(avg): 0.0    ConstractiveLoss: 0.002793522924184799  ReasonabilityLoss: 0.0062981796264648445        RecoverLoss: 0.18601167559623719
100%|█| 60/60 [01:06<00:00,  1.11s/it, C_loss=0.0246, ClsLoss_100=4.8, ClsLoss_1000=7.11, ClsLoss_10000=7.69, ClsTotalLoss=19.6, JigLoss=3.16, M_loss=1
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:21<00:00,  5.27s/it]
Epoch: [6][train]       TotalLoss: 20.339342339833575   JigLoss: 1.1087447846929228     ClsLoss_100: 4.799536720911663  ClsLoss_1000: 6.672529379526773ClsLoss_10000: 7.573689786593119 ClsTotalLoss(fftotal): 19.04575576782228        AvgConstractiveLoss: 0.053185406218593315       AvgReasonabilityLoss: 0.13165633815030256       AvgRecoverLoss: 4.161377739906311
Epoch: [6][val] JigsawAcc: 0.84 ClusterAcc100: 0.04     ClusterAcc1000: 0.0     ClusterAcc10000: 0.0    ClusterAcc(avg): 0.013333333333333334   ConstractiveLoss: 0.0014511872828006744 ReasonabilityLoss: 0.005211712941527367 RecoverLoss: 0.1715515339374542
100%|█| 60/60 [01:07<00:00,  1.13s/it, C_loss=0.0319, ClsLoss_100=4.63, ClsLoss_1000=6.67, ClsLoss_10000=7.54, ClsTotalLoss=18.8, JigLoss=0.878, M_loss
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:22<00:00,  5.57s/it]
Epoch: [7][train]       TotalLoss: 20.192618624369306   JigLoss: 1.0693875233332315     ClsLoss_100: 4.75707601706187   ClsLoss_1000: 6.66301953792572 ClsLoss_10000: 7.496208945910134 ClsTotalLoss(fftotal): 18.916304334004717       AvgConstractiveLoss: 0.047720210254192354       AvgReasonabilityLoss: 0.15920654994746053       AvgRecoverLoss: 4.174393929044406
Epoch: [7][val] JigsawAcc: 0.78 ClusterAcc100: 0.02     ClusterAcc1000: 0.0     ClusterAcc10000: 0.0    ClusterAcc(avg): 0.006666666666666667   ConstractiveLoss: 0.0035598852671682836 ReasonabilityLoss: 0.0006275869905948638        RecoverLoss: 0.431844232082367
100%|█| 60/60 [01:06<00:00,  1.11s/it, C_loss=0.0174, ClsLoss_100=4.66, ClsLoss_1000=6.93, ClsLoss_10000=7.62, ClsTotalLoss=19.2, JigLoss=1.58, M_loss=
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:18<00:00,  4.55s/it]
Epoch: [8][train]       TotalLoss: 19.8997561454773     JigLoss: 0.9543801690141359     ClsLoss_100: 4.7688616196314495 ClsLoss_1000: 6.649607149759929ClsLoss_10000: 7.420435182253519 ClsTotalLoss(fftotal): 18.83890390396117        AvgConstractiveLoss: 0.04308367188399036        AvgReasonabilityLoss: 0.06338832139347991       AvgRecoverLoss: 4.2416440991063915
Epoch: [8][val] JigsawAcc: 0.74 ClusterAcc100: 0.02     ClusterAcc1000: 0.0     ClusterAcc10000: 0.0    ClusterAcc(avg): 0.006666666666666667   ConstractiveLoss: 0.0024805641174316406 ReasonabilityLoss: 0.0048112948238849635        RecoverLoss: 0.25158809542655947
100%|█| 60/60 [01:06<00:00,  1.11s/it, C_loss=0.0381, ClsLoss_100=4.57, ClsLoss_1000=6.51, ClsLoss_10000=7.65, ClsTotalLoss=18.7, JigLoss=0.78, M_loss=
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:18<00:00,  4.75s/it]
Epoch: [9][train]       TotalLoss: 20.007253615061437   JigLoss: 1.0684301803509397     ClsLoss_100: 4.787256534894307  ClsLoss_1000: 6.628996245066327ClsLoss_10000: 7.368737761179607 ClsTotalLoss(fftotal): 18.78499059677124        AvgConstractiveLoss: 0.045559848969181374       AvgReasonabilityLoss: 0.10827299573769171       AvgRecoverLoss: 4.120056470980247
Epoch: [9][val] JigsawAcc: 0.84 ClusterAcc100: 0.02     ClusterAcc1000: 0.0     ClusterAcc10000: 0.0    ClusterAcc(avg): 0.006666666666666667   ConstractiveLoss: 0.002133065667003393  ReasonabilityLoss: 0.0024875566363334657        RecoverLoss: 0.19161114037036897
100%|█| 60/60 [01:07<00:00,  1.12s/it, C_loss=0.0287, ClsLoss_100=4.74, ClsLoss_1000=5.96, ClsLoss_10000=7.37, ClsTotalLoss=18.1, JigLoss=1.38, M_loss=
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:23<00:00,  5.88s/it]
Epoch: [10][train]      TotalLoss: 19.906644948323567   JigLoss: 1.0861985241373382     ClsLoss_100: 4.752160032590231  ClsLoss_1000: 6.603877162933351ClsLoss_10000: 7.332753666241961 ClsTotalLoss(fftotal): 18.688790893554682       AvgConstractiveLoss: 0.04013523093114296        AvgReasonabilityLoss: 0.09152033478021618       AvgRecoverLoss: 4.039306613306204
Epoch: [10][val]        JigsawAcc: 0.82 ClusterAcc100: 0.02     ClusterAcc1000: 0.0     ClusterAcc10000: 0.0    ClusterAcc(avg): 0.006666666666666667  ConstractiveLoss: 0.0020973937958478927  ReasonabilityLoss: 0.0024364076554775236        RecoverLoss: 0.18724668622016907
100%|█| 60/60 [01:08<00:00,  1.14s/it, C_loss=0.0463, ClsLoss_100=4.77, ClsLoss_1000=6.7, ClsLoss_10000=7.51, ClsTotalLoss=19, JigLoss=1.42, M_loss=0.0
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:29<00:00,  7.25s/it]
Epoch: [11][train]      TotalLoss: 19.741016260782875   JigLoss: 0.960937575995922      ClsLoss_100: 4.751010529200236  ClsLoss_1000: 6.601791771252948ClsLoss_10000: 7.31111691792806  ClsTotalLoss(fftotal): 18.663919194539393       AvgConstractiveLoss: 0.040693634655326605       AvgReasonabilityLoss: 0.07546558417379856       AvgRecoverLoss: 4.537612893184026
Epoch: [11][val]        JigsawAcc: 0.82 ClusterAcc100: 0.06     ClusterAcc1000: 0.0     ClusterAcc10000: 0.0    ClusterAcc(avg): 0.02   ConstractiveLoss: 0.00219877889379859   ReasonabilityLoss: 0.00048301540315151217       RecoverLoss: 0.22352851390838624
100%|█| 60/60 [01:07<00:00,  1.13s/it, C_loss=0.0232, ClsLoss_100=4.68, ClsLoss_1000=6.71, ClsLoss_10000=7.56, ClsTotalLoss=19, JigLoss=0.0433, M_loss=
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:20<00:00,  5.13s/it]
Epoch: [12][train]      TotalLoss: 19.715614541371657   JigLoss: 1.000559947391351      ClsLoss_100: 4.731101123491921  ClsLoss_1000: 6.583861041069033ClsLoss_10000: 7.277890539169311 ClsTotalLoss(fftotal): 18.592852783203124       AvgConstractiveLoss: 0.03278368460790566        AvgReasonabilityLoss: 0.08941795468175164       AvgRecoverLoss: 4.371748948221404
Epoch: [12][val]        JigsawAcc: 0.78 ClusterAcc100: 0.02     ClusterAcc1000: 0.0     ClusterAcc10000: 0.0    ClusterAcc(avg): 0.006666666666666667  ConstractiveLoss: 0.001537955142557621   ReasonabilityLoss: 0.009752252995967867 RecoverLoss: 0.18312466382980347
100%|█| 60/60 [01:07<00:00,  1.12s/it, C_loss=0.0647, ClsLoss_100=4.85, ClsLoss_1000=6.72, ClsLoss_10000=7.55, ClsTotalLoss=19.1, JigLoss=0.0258, M_los
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:23<00:00,  5.96s/it]
Epoch: [13][train]      TotalLoss: 19.82162863413493    JigLoss: 1.0898563351792594     ClsLoss_100: 4.738014833132426  ClsLoss_1000: 6.585498579343159ClsLoss_10000: 7.261646850903826 ClsTotalLoss(fftotal): 18.585160191853845       AvgConstractiveLoss: 0.03763424041680991        AvgReasonabilityLoss: 0.10897765451421342       AvgRecoverLoss: 4.363648629685243
Epoch: [13][val]        JigsawAcc: 0.74 ClusterAcc100: 0.0      ClusterAcc1000: 0.0     ClusterAcc10000: 0.0    ClusterAcc(avg): 0.0    ConstractiveLoss: 0.0021116061881184577 ReasonabilityLoss: 0.0005279695987701416        RecoverLoss: 0.21621067449450493
100%|█| 60/60 [01:07<00:00,  1.12s/it, C_loss=0.0384, ClsLoss_100=4.52, ClsLoss_1000=6.62, ClsLoss_10000=7.4, ClsTotalLoss=18.5, JigLoss=0.752, M_loss=
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:18<00:00,  4.57s/it]
Epoch: [14][train]      TotalLoss: 19.565531730651863   JigLoss: 0.9612024967869126     ClsLoss_100: 4.7033114989598594 ClsLoss_1000: 6.577907792727153ClsLoss_10000: 7.236068709691365 ClsTotalLoss(fftotal): 18.51728795369466        AvgConstractiveLoss: 0.040761741731936744       AvgReasonabilityLoss: 0.04627952212467788       AvgRecoverLoss: 4.573408140925071
Epoch: [14][val]        JigsawAcc: 0.84 ClusterAcc100: 0.0      ClusterAcc1000: 0.0     ClusterAcc10000: 0.0    ClusterAcc(avg): 0.0    ConstractiveLoss: 0.0019987770169973373 ReasonabilityLoss: 0.002506262362003326 RecoverLoss: 0.19087217301130294
100%|█| 60/60 [01:07<00:00,  1.13s/it, C_loss=0.00878, ClsLoss_100=4.72, ClsLoss_1000=6.57, ClsLoss_10000=7.43, ClsTotalLoss=18.7, JigLoss=0.0542, M_lo
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:29<00:00,  7.25s/it]
Epoch: [15][train]      TotalLoss: 19.65483560562134    JigLoss: 1.0458930411065623     ClsLoss_100: 4.722701446215311  ClsLoss_1000: 6.552511111895243ClsLoss_10000: 7.212150192260744 ClsTotalLoss(fftotal): 18.48736282984416        AvgConstractiveLoss: 0.045769707330813036       AvgReasonabilityLoss: 0.07581018048028149       AvgRecoverLoss: 4.728145783022047
Epoch: [15][val]        JigsawAcc: 0.82 ClusterAcc100: 0.0      ClusterAcc1000: 0.0     ClusterAcc10000: 0.0    ClusterAcc(avg): 0.0    ConstractiveLoss: 0.0038376058358699085 ReasonabilityLoss: 0.00415668860077858  RecoverLoss: 0.1998233237862587
100%|█| 60/60 [01:14<00:00,  1.24s/it, C_loss=0.00582, ClsLoss_100=4.77, ClsLoss_1000=6.37, ClsLoss_10000=7.25, ClsTotalLoss=18.4, JigLoss=1.37, M_loss
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:20<00:00,  5.13s/it]
Epoch: [16][train]      TotalLoss: 19.632916323343913   JigLoss: 1.0232878476381304     ClsLoss_100: 4.723408063252767  ClsLoss_1000: 6.555336928367613ClsLoss_10000: 7.190120752652486 ClsTotalLoss(fftotal): 18.468865553538002       AvgConstractiveLoss: 0.049930801638402036       AvgReasonabilityLoss: 0.0908320085921635        AvgRecoverLoss: 4.406435360635318
Epoch: [16][val]        JigsawAcc: 0.8  ClusterAcc100: 0.04     ClusterAcc1000: 0.0     ClusterAcc10000: 0.0    ClusterAcc(avg): 0.013333333333333334  ConstractiveLoss: 0.002326355976983905   ReasonabilityLoss: 0.00012519627809524537       RecoverLoss: 0.18016339898109435
100%|█| 60/60 [01:07<00:00,  1.13s/it, C_loss=0.0456, ClsLoss_100=5.02, ClsLoss_1000=6.61, ClsLoss_10000=7.08, ClsTotalLoss=18.7, JigLoss=1.66, M_loss=
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:21<00:00,  5.46s/it]
Epoch: [17][train]      TotalLoss: 19.40125710169475    JigLoss: 0.9150347652534644     ClsLoss_100: 4.6697273492813105 ClsLoss_1000: 6.52956008116404 ClsLoss_10000: 7.167783602078757 ClsTotalLoss(fftotal): 18.367071247100828       AvgConstractiveLoss: 0.0530752846505493 AvgReasonabilityLoss: 0.06607597895587485       AvgRecoverLoss: 4.356251256788772
Epoch: [17][val]        JigsawAcc: 0.84 ClusterAcc100: 0.0      ClusterAcc1000: 0.0     ClusterAcc10000: 0.0    ClusterAcc(avg): 0.0    ConstractiveLoss: 0.003248931393027306  ReasonabilityLoss: 0.01237701490521431  RecoverLoss: 0.20707530111074446
 15%|▏| 9/60 [00:13<01:16,  1.50s/it, C_loss=0.0265, ClsLoss_100=4.53, ClsLoss_1000=6.36, ClsLoss_10000=7.01, ClsTotalLoss=17.9, JigLoss=0.91, M_loss=0

Finetuning

将预训练的模型在下游任务中微调，这里的下游任务是分类任务，（我们的模型将会通过计算分类的可能性 $\tilde{\mathcal{Y}}_{n}^{g t}$ and 真实的标签 $\mathcal{Y}_{n}^{g t}$ 的交叉熵损失来 fine-tuned ）。

1. Download pre-trained ImageMol

You can download pre-trained model and push it into the folder ckpts/

2. Finetune with pre-trained ImageMol

a) You can download molecular property prediciton datasets, CYP450 datasets and SARS-CoV-2 datasets and put it into datasets/finetuning/

b) The usage is as follows:

usage: finetune.py [-h] [--dataset DATASET] [--dataroot DATAROOT] [--gpu GPU]
                   [--workers WORKERS] [--lr LR] [--weight_decay WEIGHT_DECAY]
                   [--momentum MOMENTUM] [--seed SEED] [--runseed RUNSEED]
                   [--split {random,stratified,scaffold,random_scaffold,scaffold_balanced}]
                   [--epochs EPOCHS] [--start_epoch START_EPOCH]
                   [--batch BATCH] [--resume PATH] [--imageSize IMAGESIZE]
                   [--image_model IMAGE_MODEL] [--image_aug]
                   [--task_type {classification,regression}]
                   [--save_finetune_ckpt {0,1}] [--log_dir LOG_DIR]

c) You can run ImageMol by simply using the following code:

python finetune.py --gpu ${gpu_no} \
                   --save_finetune_ckpt ${save_finetune_ckpt} \
                   --log_dir ${log_dir} \
                   --dataroot ${dataroot} \
                   --dataset ${dataset} \
                   --task_type ${task_type} \
                   --resume ${resume} \
                   --image_aug \
                   --lr ${lr} \
                   --batch ${batch} \
                   --epochs ${epoch}

For example:

python finetune.py --gpu 0 \
                   --save_finetune_ckpt 1 \
                   --log_dir ./logs/toxcast \
                   --dataroot ./datasets/finetuning/benchmarks \
                   --dataset toxcast \
                   --task_type classification \
                   --resume ./ckpts/ImageMol.pth.tar \
                   --image_aug \
                   --lr 0.5 \
                   --batch 64 \
                   --epochs 20

Note: You can tune more hyper-parameters during fine-tuning (see b) Usage).

运行与结果：

文档结构为：

这里我运行的命令为：

python finetune.py --gpu 0 --save_finetune_ckpt 1 --log_dir ./logs/toxcast --dataroot ./datasets/finetuning/MPP/classification/ --dataset toxcast --task_type classification --resume ./ckpts/ImageMol.pth.tar --image_aug --lr 0.5 --batch 64 --epochs 20

(imagemol) D:\pycharm_workspace\1\ImageMol>python finetune.py --gpu 0 --save_finetune_ckpt 1 --log_dir ./logs/toxcast --dataroot ./datasets/finetuning/MPP/classification/ --dataset toxcast --task_type classification --resume ./ckpts/ImageMol.pth.tar --image_aug --lr 0.5 --batch 64 --epochs 20
Architecture: ResNet18
eval_metric: rocauc
=> loading checkpoint './ckpts/ImageMol.pth.tar'
resume model info: arch: ResNet18
ResNet(
  (conv1): Conv2d(3, 64, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3), bias=False)
  (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
  (relu): ReLU(inplace=True)
  (maxpool): MaxPool2d(kernel_size=3, stride=2, padding=1, dilation=1, ceil_mode=False)
  (layer1): Sequential(
    (0): BasicBlock(
      (conv1): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    )
    (1): BasicBlock(
      (conv1): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    )
  )
  (layer2): Sequential(
    (0): BasicBlock(
      (conv1): Conv2d(64, 128, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (conv2): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (downsample): Sequential(
        (0): Conv2d(64, 128, kernel_size=(1, 1), stride=(2, 2), bias=False)
        (1): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      )
    )
    (1): BasicBlock(
      (conv1): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (conv2): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    )
  )
  (layer3): Sequential(
    (0): BasicBlock(
      (conv1): Conv2d(128, 256, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (conv2): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (downsample): Sequential(
        (0): Conv2d(128, 256, kernel_size=(1, 1), stride=(2, 2), bias=False)
        (1): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      )
    )
    (1): BasicBlock(
      (conv1): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (conv2): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    )
  )
  (layer4): Sequential(
    (0): BasicBlock(
      (conv1): Conv2d(256, 512, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (conv2): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (downsample): Sequential(
        (0): Conv2d(256, 512, kernel_size=(1, 1), stride=(2, 2), bias=False)
        (1): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      )
    )
    (1): BasicBlock(
      (conv1): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (conv2): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    )
  )
  (avgpool): AdaptiveAvgPool2d(output_size=(1, 1))
  (fc): Linear(in_features=512, out_features=617, bias=True)
)
params: {'total_params': 11493033, 'total_trainable_params': 11493033}
[train epoch 0] loss: 0.243: 100%|███████████████████████████████████████████████████| 108/108 [03:11<00:00,  1.78s/it]
[valid epoch 0] loss: 0.210: 100%|███████████████████████████████████████████████████| 108/108 [00:35<00:00,  3.01it/s]
[valid epoch 0] loss: 0.215: 100%|█████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.10it/s]
Some target is missing! Missing ratio: 0.02 [605/617]
[valid epoch 0] loss: 0.242: 100%|█████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.10it/s]
Some target is missing! Missing ratio: 0.01 [610/617]
{'epoch': 0, 'patience': 0, 'Loss': 0.21016514742815937, 'Train': 0.692967624681878, 'Validation': 0.6699200988533057, 'Test': 0.6675434573214044}
[train epoch 1] loss: 0.208: 100%|███████████████████████████████████████████████████| 108/108 [01:50<00:00,  1.02s/it]
[valid epoch 1] loss: 0.199: 100%|███████████████████████████████████████████████████| 108/108 [00:36<00:00,  2.96it/s]
[valid epoch 1] loss: 0.207: 100%|█████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.14it/s]
Some target is missing! Missing ratio: 0.02 [605/617]
[valid epoch 1] loss: 0.230: 100%|█████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.05it/s]
Some target is missing! Missing ratio: 0.01 [610/617]
{'epoch': 1, 'patience': 0, 'Loss': 0.19889598422580296, 'Train': 0.736537038469584, 'Validation': 0.6994855864691358, 'Test': 0.7106267564003038}
[train epoch 2] loss: 0.205: 100%|███████████████████████████████████████████████████| 108/108 [01:49<00:00,  1.02s/it]
[valid epoch 2] loss: 0.191: 100%|███████████████████████████████████████████████████| 108/108 [00:37<00:00,  2.89it/s]
[valid epoch 2] loss: 0.204: 100%|█████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.03it/s]
Some target is missing! Missing ratio: 0.02 [605/617]
[valid epoch 2] loss: 0.225: 100%|█████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.09it/s]
Some target is missing! Missing ratio: 0.01 [610/617]
{'epoch': 2, 'patience': 0, 'Loss': 0.19094857463130244, 'Train': 0.7681750106520694, 'Validation': 0.713344336728154, 'Test': 0.7183564591204591}
[train epoch 3] loss: 0.197: 100%|███████████████████████████████████████████████████| 108/108 [01:51<00:00,  1.03s/it]
[valid epoch 3] loss: 0.188: 100%|███████████████████████████████████████████████████| 108/108 [00:36<00:00,  3.00it/s]
[valid epoch 3] loss: 0.204: 100%|█████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.13it/s]
Some target is missing! Missing ratio: 0.02 [605/617]
[valid epoch 3] loss: 0.225: 100%|█████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.12it/s]
Some target is missing! Missing ratio: 0.01 [610/617]
{'epoch': 3, 'patience': 0, 'Loss': 0.18818754620022243, 'Train': 0.7921560594726607, 'Validation': 0.7106094323867567, 'Test': 0.7319484429668179}
[train epoch 4] loss: 0.190: 100%|███████████████████████████████████████████████████| 108/108 [01:48<00:00,  1.00s/it]
[valid epoch 4] loss: 0.186: 100%|███████████████████████████████████████████████████| 108/108 [00:36<00:00,  2.96it/s]
[valid epoch 4] loss: 0.207: 100%|█████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.13it/s]
Some target is missing! Missing ratio: 0.02 [605/617]
[valid epoch 4] loss: 0.237: 100%|█████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.15it/s]
Some target is missing! Missing ratio: 0.01 [610/617]
{'epoch': 4, 'patience': 1, 'Loss': 0.18566039756492334, 'Train': 0.8042472190567201, 'Validation': 0.6931130950238147, 'Test': 0.7199134337688832}
[train epoch 5] loss: 0.188: 100%|███████████████████████████████████████████████████| 108/108 [01:52<00:00,  1.04s/it]
[valid epoch 5] loss: 0.430: 100%|███████████████████████████████████████████████████| 108/108 [00:36<00:00,  2.98it/s]
[valid epoch 5] loss: 0.447: 100%|█████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.09it/s]
Some target is missing! Missing ratio: 0.02 [605/617]
[valid epoch 5] loss: 0.464: 100%|█████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.12it/s]
Some target is missing! Missing ratio: 0.01 [610/617]
{'epoch': 5, 'patience': 2, 'Loss': 0.4297037831059209, 'Train': 0.6456776040426601, 'Validation': 0.5981636500016693, 'Test': 0.6110698962504955}
[train epoch 6] loss: 0.183: 100%|███████████████████████████████████████████████████| 108/108 [01:49<00:00,  1.02s/it]
[valid epoch 6] loss: 0.177: 100%|███████████████████████████████████████████████████| 108/108 [00:37<00:00,  2.89it/s]
[valid epoch 6] loss: 0.202: 100%|█████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.07it/s]
Some target is missing! Missing ratio: 0.02 [605/617]
[valid epoch 6] loss: 0.229: 100%|█████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.08it/s]
Some target is missing! Missing ratio: 0.01 [610/617]
{'epoch': 6, 'patience': 3, 'Loss': 0.17700029302526404, 'Train': 0.8396707209323335, 'Validation': 0.7284599584377031, 'Test': 0.7407342942104}
[train epoch 7] loss: 0.178: 100%|███████████████████████████████████████████████████| 108/108 [01:52<00:00,  1.04s/it]
[valid epoch 7] loss: 0.167: 100%|███████████████████████████████████████████████████| 108/108 [00:35<00:00,  3.00it/s]
[valid epoch 7] loss: 0.206: 100%|█████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.04it/s]
Some target is missing! Missing ratio: 0.02 [605/617]
[valid epoch 7] loss: 0.226: 100%|█████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.13it/s]
Some target is missing! Missing ratio: 0.01 [610/617]
{'epoch': 7, 'patience': 0, 'Loss': 0.16746581042254413, 'Train': 0.8556398733428161, 'Validation': 0.731332185707106, 'Test': 0.7492089206757857}
[train epoch 8] loss: 0.175: 100%|███████████████████████████████████████████████████| 108/108 [01:47<00:00,  1.00it/s]
[valid epoch 8] loss: 0.167: 100%|███████████████████████████████████████████████████| 108/108 [00:36<00:00,  2.98it/s]
[valid epoch 8] loss: 0.208: 100%|█████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.10it/s]
Some target is missing! Missing ratio: 0.02 [605/617]
[valid epoch 8] loss: 0.222: 100%|█████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.11it/s]
Some target is missing! Missing ratio: 0.01 [610/617]
{'epoch': 8, 'patience': 0, 'Loss': 0.16673416561550564, 'Train': 0.8644607852261611, 'Validation': 0.7262760021080655, 'Test': 0.7608370643734503}
[train epoch 9] loss: 0.169: 100%|███████████████████████████████████████████████████| 108/108 [01:48<00:00,  1.01s/it]
[valid epoch 9] loss: 0.159: 100%|███████████████████████████████████████████████████| 108/108 [00:35<00:00,  3.03it/s]
[valid epoch 9] loss: 0.210: 100%|█████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.14it/s]
Some target is missing! Missing ratio: 0.02 [605/617]
[valid epoch 9] loss: 0.232: 100%|█████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.08it/s]
Some target is missing! Missing ratio: 0.01 [610/617]
{'epoch': 9, 'patience': 1, 'Loss': 0.15940298857512297, 'Train': 0.8746694145575502, 'Validation': 0.7254201813375953, 'Test': 0.7528834309399343}
[train epoch 10] loss: 0.167: 100%|██████████████████████████████████████████████████| 108/108 [01:48<00:00,  1.01s/it]
[valid epoch 10] loss: 0.163: 100%|██████████████████████████████████████████████████| 108/108 [00:35<00:00,  3.01it/s]
[valid epoch 10] loss: 0.203: 100%|████████████████████████████████████████████████████| 14/14 [00:07<00:00,  1.99it/s]
Some target is missing! Missing ratio: 0.02 [605/617]
[valid epoch 10] loss: 0.225: 100%|████████████████████████████████████████████████████| 14/14 [00:07<00:00,  1.84it/s]
Some target is missing! Missing ratio: 0.01 [610/617]
{'epoch': 10, 'patience': 2, 'Loss': 0.16331072206850406, 'Train': 0.8759709469067016, 'Validation': 0.7251833198910242, 'Test': 0.7444111139117744}
[train epoch 11] loss: 0.164: 100%|██████████████████████████████████████████████████| 108/108 [01:53<00:00,  1.05s/it]
[valid epoch 11] loss: 0.155: 100%|██████████████████████████████████████████████████| 108/108 [00:37<00:00,  2.88it/s]
[valid epoch 11] loss: 0.204: 100%|████████████████████████████████████████████████████| 14/14 [00:07<00:00,  1.98it/s]
Some target is missing! Missing ratio: 0.02 [605/617]
[valid epoch 11] loss: 0.222: 100%|████████████████████████████████████████████████████| 14/14 [00:07<00:00,  1.86it/s]
Some target is missing! Missing ratio: 0.01 [610/617]
{'epoch': 11, 'patience': 3, 'Loss': 0.15538870846783673, 'Train': 0.8912424252365218, 'Validation': 0.7240295542159721, 'Test': 0.753792204644943}
[train epoch 12] loss: 0.160: 100%|██████████████████████████████████████████████████| 108/108 [01:51<00:00,  1.03s/it]
[valid epoch 12] loss: 0.208: 100%|██████████████████████████████████████████████████| 108/108 [00:37<00:00,  2.86it/s]
[valid epoch 12] loss: 0.257: 100%|████████████████████████████████████████████████████| 14/14 [00:07<00:00,  1.98it/s]
Some target is missing! Missing ratio: 0.02 [605/617]
[valid epoch 12] loss: 0.277: 100%|████████████████████████████████████████████████████| 14/14 [00:07<00:00,  1.92it/s]
Some target is missing! Missing ratio: 0.01 [610/617]
{'epoch': 12, 'patience': 4, 'Loss': 0.20842158352887188, 'Train': 0.8415256259318344, 'Validation': 0.6897028119621558, 'Test': 0.7009206570443501}
[train epoch 13] loss: 0.156: 100%|██████████████████████████████████████████████████| 108/108 [01:51<00:00,  1.03s/it]
[valid epoch 13] loss: 0.152: 100%|██████████████████████████████████████████████████| 108/108 [00:35<00:00,  3.01it/s]
[valid epoch 13] loss: 0.209: 100%|████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.11it/s]
Some target is missing! Missing ratio: 0.02 [605/617]
[valid epoch 13] loss: 0.232: 100%|████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.12it/s]
Some target is missing! Missing ratio: 0.01 [610/617]
{'epoch': 13, 'patience': 5, 'Loss': 0.15160143816912616, 'Train': 0.8998601673869299, 'Validation': 0.7268795973894058, 'Test': 0.7505586760702562}
[train epoch 14] loss: 0.155: 100%|██████████████████████████████████████████████████| 108/108 [01:47<00:00,  1.00it/s]
[valid epoch 14] loss: 0.146: 100%|██████████████████████████████████████████████████| 108/108 [00:35<00:00,  3.03it/s]
[valid epoch 14] loss: 0.211: 100%|████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.10it/s]
Some target is missing! Missing ratio: 0.02 [605/617]
[valid epoch 14] loss: 0.237: 100%|████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.11it/s]
Some target is missing! Missing ratio: 0.01 [610/617]
{'epoch': 14, 'patience': 6, 'Loss': 0.1462357309129503, 'Train': 0.9063451701636047, 'Validation': 0.7288304309373426, 'Test': 0.7492306562547975}
[train epoch 15] loss: 0.152: 100%|██████████████████████████████████████████████████| 108/108 [01:47<00:00,  1.00it/s]
[valid epoch 15] loss: 0.143: 100%|██████████████████████████████████████████████████| 108/108 [00:35<00:00,  3.03it/s]
[valid epoch 15] loss: 0.204: 100%|████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.10it/s]
Some target is missing! Missing ratio: 0.02 [605/617]
[valid epoch 15] loss: 0.231: 100%|████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.11it/s]
Some target is missing! Missing ratio: 0.01 [610/617]
{'epoch': 15, 'patience': 7, 'Loss': 0.1434713469611274, 'Train': 0.913865910273068, 'Validation': 0.7261471932487874, 'Test': 0.7458198395498474}
[train epoch 16] loss: 0.149: 100%|██████████████████████████████████████████████████| 108/108 [01:47<00:00,  1.00it/s]
[valid epoch 16] loss: 0.142: 100%|██████████████████████████████████████████████████| 108/108 [00:36<00:00,  2.97it/s]
[valid epoch 16] loss: 0.209: 100%|████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.10it/s]
Some target is missing! Missing ratio: 0.02 [605/617]
[valid epoch 16] loss: 0.232: 100%|████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.09it/s]
Some target is missing! Missing ratio: 0.01 [610/617]
{'epoch': 16, 'patience': 8, 'Loss': 0.14186685173599808, 'Train': 0.919563304190028, 'Validation': 0.7392030101383237, 'Test': 0.7529772831075494}
[train epoch 17] loss: 0.148: 100%|██████████████████████████████████████████████████| 108/108 [01:49<00:00,  1.01s/it]
[valid epoch 17] loss: 0.140: 100%|██████████████████████████████████████████████████| 108/108 [00:36<00:00,  2.94it/s]
[valid epoch 17] loss: 0.207: 100%|████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.01it/s]
Some target is missing! Missing ratio: 0.02 [605/617]
[valid epoch 17] loss: 0.237: 100%|████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.03it/s]
Some target is missing! Missing ratio: 0.01 [610/617]
{'epoch': 17, 'patience': 0, 'Loss': 0.14025064750953956, 'Train': 0.9222371081994448, 'Validation': 0.7333314785222289, 'Test': 0.7468212697003538}
[train epoch 18] loss: 0.146: 100%|██████████████████████████████████████████████████| 108/108 [01:49<00:00,  1.01s/it]
[valid epoch 18] loss: 0.135: 100%|██████████████████████████████████████████████████| 108/108 [00:36<00:00,  2.96it/s]
[valid epoch 18] loss: 0.208: 100%|████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.02it/s]
Some target is missing! Missing ratio: 0.02 [605/617]
[valid epoch 18] loss: 0.238: 100%|████████████████████████████████████████████████████| 14/14 [00:07<00:00,  2.00it/s]
Some target is missing! Missing ratio: 0.01 [610/617]
{'epoch': 18, 'patience': 1, 'Loss': 0.1350550651550293, 'Train': 0.9267112674770283, 'Validation': 0.744386517934743, 'Test': 0.7505391845271615}
[train epoch 19] loss: 0.141: 100%|██████████████████████████████████████████████████| 108/108 [01:50<00:00,  1.02s/it]
[valid epoch 19] loss: 0.132: 100%|██████████████████████████████████████████████████| 108/108 [00:36<00:00,  2.97it/s]
[valid epoch 19] loss: 0.212: 100%|████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.06it/s]
Some target is missing! Missing ratio: 0.02 [605/617]
[valid epoch 19] loss: 0.235: 100%|████████████████████████████████████████████████████| 14/14 [00:06<00:00,  2.11it/s]
Some target is missing! Missing ratio: 0.01 [610/617]
{'epoch': 19, 'patience': 0, 'Loss': 0.13230810342011629, 'Train': 0.9326320968407155, 'Validation': 0.7282062713930527, 'Test': 0.7534077089166729}
final results: highest_valid: 0.744, final_train: 0.927, final_test: 0.751

最后会在logs下生成微调后的模型：

Finetuned models（Finetuned 好的模型）

To ensure the reproducibility of ImageMol, we provided finetuned models for eight datasets, including:

BBBP
Tox21
ClinTox
HIV
BACE
SIDER
MUV
ToxCast

You can evaluate the finetuned model by using the following command:

python evaluate.py --dataroot ${dataroot} \
                   --dataset ${dataset} \
                   --task_type ${task_type} \
                   --resume ${resume} \
                   --batch ${batch}

For example:

python evaluate.py --dataroot ./datasets/finetuning/benchmarks \
                   --dataset toxcast \
                   --task_type classification \
                   --resume ./toxcast.pth \
                   --batch 128

python evaluate.py --dataroot ./datasets/finetuning/MPP/classification --dataset toxcast --task_type classification --resume ./ckpts/toxcast.pth --batch 128

GradCAM Visualization

More about GradCAM heatmap can be found from this link: https://drive.google.com/file/d/1uu3Q6WLz8bJqcDaHEG84o3mFvemHoA2v/view?usp=sharing

To facilitate observation of high-confidence regions in the GradCAM heatmap, we use a confidence to filter out lower-confidence regions, which can be found from this link: https://drive.google.com/file/d/1631kSSiM_FSRBBkfh7PwI5p3LGqYYpMc/view?usp=sharing

run script

We also provide a script to generate GradCAM heatmaps:

usage: main.py [-h] [--image_model IMAGE_MODEL] --resume PATH --img_path
               IMG_PATH --gradcam_save_path GRADCAM_SAVE_PATH
               [--thresh THRESH]

you can run the following script:

python main.py --resume ${resume} \
               --img_path ${img_path} \
               --gradcam_save_path ${gradcam_save_path} \
               --thresh ${thresh}

Process your own dataset

If you want to process your own dataset and obtain molecular images, use the following steps:

Preprocessing smiles: Please use the method preprocess_list(smiles) of this link to process your raw SMILES data;
Transforming smiles to image: Convert canonical smiles to molecular images using dataloader.image_dataloader.Smiles2Img(smis, size=224, savePath=None)

https://github.com/HongxinXiang/ImageMol

你可能感兴趣的:(自监督学习相关,AIDrug,人工智能,深度学习,计算机视觉)

Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
如何解决 NPM proxy，当我们在终端nodejs应用程序时出现代理相关报错
Thisisaproblemrelatedtonetworkconnectivity.npmERR!networkInmostcasesyouarebehindaproxyorhavebadnetworksettings.在使用npminstall下载包的时候总是报以下错误:在控制台或VisualStudioCode终端中运行以下命令：npmconfigrmproxynpmconfigrmhttp
C++ 设计模式：抽象工厂（Abstract Factory）冀晓武 C++设计模式 c++设计模式抽象工厂模式
链接：C++设计模式链接：C++设计模式-工厂方法链接：C++设计模式-原型模式链接：C++设计模式-建造者模式抽象工厂（AbstractFactory）是一种创建型设计模式，它提供一个接口，用于创建一系列相关或相互依赖的对象，而无需指定它们的具体类。抽象工厂模式通常用于创建一组相关的产品对象，例如不同类型的机器人和它们的配件。1.问题分析在某些情况下，我们需要创建一组相关或相互依赖的对象，但我们
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
kube-scheduler 抢占机制分享放大价值 kubernetes源码分析 kubernetes kube-scheduler 抢占
当pod调度失败后，会在PostFilter扩展点执行抢占流程，下面分析相关的代码实现抢占接口//PodNominatorabstractsoperationstomaintainnominatedPods.typePodNominatorinterface{//将pod加入抢占成功的node中AddNominatedPod(pod*PodInfo,nodeNamestring)//将pod从no
Shader面试题100道之（81-100）还是大剑师兰特 #Shader 综合教程100+大剑师 shader面试题 shader教程
Shader面试题（第81-100题）以下是第81到第100道Shader相关的面试题及答案：81.Unity中如何实现屏幕空间的热扭曲效果（HeatDistortion）？热扭曲效果可以通过GrabPass抓取当前屏幕图像，然后在片段着色器中使用噪声或动态UV偏移模拟空气扰动，再结合一个透明通道控制扭曲强度来实现。82.Shader中如何实现物体轮廓高亮（OutlineHighlight）？轮廓
计算机网络技术 CZZDg 计算机网络
目录一.网络概述1.网络的概念2.网络发展是3.网络的四要素4.网络功能5.网络类型6.网络协议与标准7.网络中常见的概念8.网络拓补结构二.网络模型1.分层思想2.OSI七层模型3.TCP/IP五层模型4.数据的封装与解封装过程三.IP地址1.进制转换2.IP地址定义3.IP地址组成成分4.IP地址分类5.地址划分6、相关概念一.网络概述1.网络的概念两个主机通过传输介质和通信协议实现通信和资源
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
react-native android 环境搭建
环境：macjava版本：Java11最重要：一定要一定要一定要react涉及到很多的依赖下载，gradle和react相关的，第一次安装环境时有外网环境会快速很多。安装nodejs安装react-nativenpminstallreact-native-clinpminstallreact-native创建一个新项目react-nativeinitfirstReact替换gradle下载源rep
matlab卷积矩阵绝对值,MATLAB矩阵分析和计算 weixin_39928736 matlab卷积矩阵绝对值
MATLAB矩阵分析和计算编辑锁定讨论上传视频本词条缺少概述图，补充相关内容使词条更完整，还能快速升级，赶紧来编辑吧！《MATLAB矩阵分析和计算》是清华大学出版社出版的一本图书。[1]书名MATLAB矩阵分析和计算作者杜树春出版社清华大学出版社出版时间2019年6月1日定价59元ISBN9787302524816印次1-1印刷日期2019.04.23MATLAB矩阵分析和计算图书内容编辑本书侧重
LVM逻辑卷扩容
目录1.逻辑卷的简介2.逻辑卷的概念3.相关命令4.建立逻辑卷1.逻辑卷的简介1.LVM是逻辑卷管理(LogicalVolumeManager)的简称,它是Linux环境下对磁盘分区进行管理的一种机制,LVM是建立在硬盘和分区之上的一个逻辑层,来提高磁盘分区管理的灵活性。2.LVM最大的特点就是可以对磁盘进行动态管理。使用了LVM管理分区,动态的调整分区的大小,标准分区是做不到的。2.逻辑卷的概念
JavaScript 基础09：Web APIs——日期对象、DOM节点梦想当全栈 JavaScript javascript 前端开发语言
JavaScript基础09：WebAPIs——日期对象、DOM节点进一步学习DOM相关知识，实现可交互的网页特效能够插入、删除和替换元素节点。能够依据元素节点关系查找节点。一、日期对象掌握Date日期对象的使用，动态获取当前计算机的时间。ECMAScript中内置了获取系统时间的对象Date，使用Date时与之前学习的内置对象console和Math不同，它需要借助new关键字才能使用。1.实例
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
C++11中的std::function
文章转载自：http://www.jellythink.com/archives/771看看这段代码先来看看下面这两行代码：std::functiononKeyPressed;std::functiononKeyReleased;这两行代码是从Cocos2d-x中摘出来的，重点是这两行代码的定义啊。std::function这是什么东西？如果你对上述两行代码表示毫无压力，那就不妨再看看本文，就当温
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）其他Query优化相关策略？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？一
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？ ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 机器学习算法深度学习人工智能
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？在大语言模型（LLM）中，最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息，这是由LLM的核心架构（以Transformer为基础）决定的，具体可以从以下角度理解：1.核心机制：自注意力（Self-Attention）的作用现代LLM（如GPT系列、Qwen等）均基于Transformer架构，其核心是自注意力机制。在
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
.NET 程序的强名称签名与安全防护技术干货深盾科技安全
在.NET开发领域，保障程序的安全性和完整性至关重要。强名称签名和有效的安全防护措施是实现这一目标的关键手段。下面将详细介绍.NET程序的强名称签名以及相关的安全防护方法。一、什么是强名称签名强名称签名是.NET框架提供的一种安全机制，其主要作用是唯一标识程序集、验证程序集的完整性以及解决版本冲突问题。它本质上是通过加密技术为程序集创建数字签名，确保程序集在分发和运行过程中的安全性。二、签名文件要
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
python相关内容二湫默 python 开发语言
1.技术面试题（1）详细描述单调栈的工作原理和应用场景答：工作原理：维护一个栈结构，栈中元素保持单调递增或单调递减的顺序。遍历数据时，新元素入栈前，弹出栈顶所有不满足单调关系的元素，再将新元素入栈，确保栈的单调性。应用场景：解决下一个元素更大的问题，如数组中后面一个元素比前面一个入栈的元素大，则需要上一个元素出栈，然后大的那个元素入栈。（2）详细描述单调队列的工作原理和应用场景答：工作原理：维护队
swagger【个人笔记】撰卢笔记 java
文章目录swagger导入mave坐标在配置类(WebMvcConfiguration)中加入knife4j相关配置设置静态资源映射，主要是让拦截器放行swagger常用注解@Api(tags="\[描述这个类的作用]")@ApiModel(description="\[描述这个类的作用]")@ApiModelProPerty("描述这个类的作用")@ApiOperation("\[描述方法的作用
redis中什么是bigkey？会有什么影响？ Vic2334 redis
什么是bigkey？会有什么影响？bigkey是指key对应的value所占的内存空间比较大，例如一个字符串类型的value可以最大存到512MB，一个列表类型的value最多可以存储23-1个元素。如果按照数据结构来细分的话，一般分为字符串类型bigkey和非字符串类型bigkey。字符串类型：体现在单个value值很大，一般认为超过10KB就是bigkey，但这个值和具体的OPS相关。非字符串
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
android去除gps漂移代码,GPS漂移过滤算法扇贝君
GPS漂移过滤算法基本思想：逐点过滤，再经过基础过滤后，进行判断运动状态，静止状态和运动中。如果静止，则使用电子围栏；如果运动，则先过滤大速度，再过滤加速度，然后过滤距离(包括超大距离，和速度相关距离)。对于要过滤的点，采用之前最近的可靠点，进行替换，同时，无效次数+1，如果后面是有效点，则无效次数-1，如果无效次数归0，认为这个点才是真正可靠点(无效次数为正时，都为要被替换的点)。如果遇到不定点
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s