jieshaoxiansen

U-net源码分析（Keras版本）

转载：https://blog.csdn.net/mieleizhi0522/article/details/82217677
源码地址：https://github.com/zhixuhao/unet

首先是论文讲解：地址

源码地址：https://github.com/FENGShuanglang/unet

环境：尽量用python3去运行，因为我用了python2.7,弄了两天都不行，测试输出一直是全灰！

源码文件夹目录：

这里主要讲解data.py, model.py, main.py三个文件（也只要这三个python文件）

先看一下main.py，按照main.py文件的运行顺序去查找每个函数的意义：


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         from model 
         
         
         
         import *
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         from data 
         
         
         
         import *
         
         
         
         #导入这两个文件中的所有函数
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #os.environ[“CUDA_VISIBLE_DEVICES”] = “0”
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         data_gen_args = dict(rotation_range=
         
         
         
         0.2,
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                             width_shift_range=
         
         
         
         0.05,
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                             height_shift_range=
         
         
         
         0.05,
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                             shear_range=
         
         
         
         0.05,
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                             zoom_range=
         
         
         
         0.05,
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                             horizontal_flip=
         
         
         
         True,
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                             fill_mode=
         
         
         
         ‘nearest’)
         
         
         
         #数据增强时的变换方式的字典
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         myGene = trainGenerator(
         
         
         
         2,
         
         
         
         ‘data/membrane/train’,
         
         
         
         ‘image’,
         
         
         
         ‘label’,data_gen_args,save_to_dir = 
         
         
         
         None)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #得到一个生成器，以batch=2的速率无限生成增强后的数据
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         model = unet()
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         model_checkpoint = ModelCheckpoint(
         
         
         
         ‘unet_membrane.hdf5’, monitor=
         
         
         
         ‘loss’,verbose=
         
         
         
         1, save_best_only=
         
         
         
         True)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #回调函数，第一个是保存模型路径，第二个是检测的值，检测Loss是使它最小，第三个是只保存在验证集上性能最好的模型
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         model.fit_generator(myGene,steps_per_epoch=
         
         
         
         300,epochs=
         
         
         
         1,callbacks=[model_checkpoint])
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #steps_per_epoch指的是每个epoch有多少个batch_size，也就是训练集总样本数除以batch_size的值
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #上面一行是利用生成器进行batch_size数量的训练，样本和标签通过myGene传入
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         testGene = testGenerator(
         
         
         
         “data/membrane/test”)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         results = model.predict_generator(testGene,
         
         
         
         30,verbose=
         
         
         
         1)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #30是step,steps: 在停止之前，来自 generator 的总步数 (样本批次)。 可选参数 Sequence：如果未指定，将使用len(generator) 作为步数。
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #上面的返回值是：预测值的 Numpy 数组。
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         saveResult(
         
         
         
         “data/membrane/test”,results)
         
         
         
         #保存结果

data.py文件：


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         from __future__ 
         
         
         
         import print_function
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         from keras.preprocessing.image 
         
         
         
         import ImageDataGenerator
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         import numpy 
         
         
         
         as np 
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         import os
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         import glob
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         import skimage.io 
         
         
         
         as io
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         import skimage.transform 
         
         
         
         as trans
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         Sky = [
         
         
         
         128,
         
         
         
         128,
         
         
         
         128]
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         Building = [
         
         
         
         128,
         
         
         
         0,
         
         
         
         0]
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         Pole = [
         
         
         
         192,
         
         
         
         192,
         
         
         
         128]
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         Road = [
         
         
         
         128,
         
         
         
         64,
         
         
         
         128]
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         Pavement = [
         
         
         
         60,
         
         
         
         40,
         
         
         
         222]
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         Tree = [
         
         
         
         128,
         
         
         
         128,
         
         
         
         0]
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         SignSymbol = [
         
         
         
         192,
         
         
         
         128,
         
         
         
         128]
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         Fence = [
         
         
         
         64,
         
         
         
         64,
         
         
         
         128]
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         Car = [
         
         
         
         64,
         
         
         
         0,
         
         
         
         128]
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         Pedestrian = [
         
         
         
         64,
         
         
         
         64,
         
         
         
         0]
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         Bicyclist = [
         
         
         
         0,
         
         
         
         128,
         
         
         
         192]
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         Unlabelled = [
         
         
         
         0,
         
         
         
         0,
         
         
         
         0]
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         COLOR_DICT = np.array([Sky, Building, Pole, Road, Pavement,
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                                   Tree, SignSymbol, Fence, Car, Pedestrian, Bicyclist, Unlabelled])
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         def adjustData(img,mask,flag_multi_class,num_class):
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         if(flag_multi_class):
         
         
         
         #此程序中不是多类情况，所以不考虑这个
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 img = img / 
         
         
         
         255
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 mask = mask[:,:,:,
         
         
         
         0] 
         
         
         
         if(len(mask.shape) == 
         
         
         
         4) 
         
         
         
         else mask[:,:,
         
         
         
         0]
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #if else的简洁写法，一行表达式，为真时放在前面，不明白mask.shape=4的情况是什么，由于有batch_size，所以mask就有3维[batch_size,wigth,heigh],估计mask[:,:,0]是写错了，应该写成[0,:,:],这样可以得到一片图片，
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 new_mask = np.zeros(mask.shape + (num_class,))
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #np.zeros里面是shape元组，此目的是将数据厚度扩展到num_class层，以在层的方向实现one-hot结构
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
                
         
         
         
         for i 
         
         
         
         in range(num_class):
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
                    
         
         
         
         #for one pixel in the image, find the class in mask and convert it into one-hot vector
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
                    
         
         
         
         #index = np.where(mask == i)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
                    
         
         
         
         #index_mask = (index[0],index[1],index[2],np.zeros(len(index[0]),dtype = np.int64) + i) if (len(mask.shape) == 4) else (index[0],index[1],np.zeros(len(index[0]),dtype = np.int64) + i)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
                    
         
         
         
         #new_mask[index_mask] = 1
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                     new_mask[mask == i,i] = 
         
         
         
         1
         
         
         
         #将平面的mask的每类，都单独变成一层，
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 new_mask = np.reshape(new_mask,(new_mask.shape[
         
         
         
         0],new_mask.shape[
         
         
         
         1]*new_mask.shape[
         
         
         
         2],new_mask.shape[
         
         
         
         3])) 
         
         
         
         if flag_multi_class 
         
         
         
         else np.reshape(new_mask,(new_mask.shape[
         
         
         
         0]*new_mask.shape[
         
         
         
         1],new_mask.shape[
         
         
         
         2]))
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 mask = new_mask
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         elif(np.max(img) > 
         
         
         
         1):
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 img = img / 
         
         
         
         255
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 mask = mask /
         
         
         
         255
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 mask[mask > 
         
         
         
         0.5] = 
         
         
         
         1
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 mask[mask <= 
         
         
         
         0.5] = 
         
         
         
         0
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         return (img,mask)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #上面这个函数主要是对训练集的数据和标签的像素值进行归一化
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         def trainGenerator(batch_size,train_path,image_folder,mask_folder,aug_dict,image_color_mode = "grayscale",
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                             mask_color_mode = "grayscale",image_save_prefix  = "image",mask_save_prefix  = "mask",
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                             flag_multi_class = False,num_class = 2,save_to_dir = None,target_size = (256,256),seed = 1):
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         '''
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             can generate image and mask at the same time
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             use the same seed for image_datagen and mask_datagen to ensure the transformation for image and mask is the same
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             if you want to visualize the results of generator, set save_to_dir = "your path"
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             '''
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             image_datagen = ImageDataGenerator(**aug_dict)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             mask_datagen = ImageDataGenerator(**aug_dict)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             image_generator = image_datagen.flow_from_directory(
         
         
         
         #https://blog.csdn.net/nima1994/article/details/80626239
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 train_path,
         
         
         
         #训练数据文件夹路径
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 classes = [image_folder],
         
         
         
         #类别文件夹,对哪一个类进行增强
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 class_mode = 
         
         
         
         None,
         
         
         
         #不返回标签
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 color_mode = image_color_mode,
         
         
         
         #灰度，单通道模式
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 target_size = target_size,
         
         
         
         #转换后的目标图片大小
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 batch_size = batch_size,
         
         
         
         #每次产生的（进行转换的）图片张数
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 save_to_dir = save_to_dir,
         
         
         
         #保存的图片路径
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 save_prefix  = image_save_prefix,
         
         
         
         #生成图片的前缀，仅当提供save_to_dir时有效
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 seed = seed)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             mask_generator = mask_datagen.flow_from_directory(
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 train_path,
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 classes = [mask_folder],
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 class_mode = 
         
         
         
         None,
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 color_mode = mask_color_mode,
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 target_size = target_size,
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 batch_size = batch_size,
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 save_to_dir = save_to_dir,
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 save_prefix  = mask_save_prefix,
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 seed = seed)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             train_generator = zip(image_generator, mask_generator)
         
         
         
         #组合成一个生成器
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         for (img,mask) 
         
         
         
         in train_generator:
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #由于batch是2，所以一次返回两张，即img是一个2张灰度图片的数组，[2,256,256]
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 img,mask = adjustData(img,mask,flag_multi_class,num_class)
         
         
         
         #返回的img依旧是[2,256,256]
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
                
         
         
         
         yield (img,mask)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #每次分别产出两张图片和标签，不懂yield的请看https://blog.csdn.net/mieleizhi0522/article/details/82142856
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #上面这个函数主要是产生一个数据增强的图片生成器，方便后面使用这个生成器不断生成图片
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         def testGenerator(test_path,num_image = 30,target_size = (256,256),flag_multi_class = False,as_gray = True):
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         for i 
         
         
         
         in range(num_image):
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 img = io.imread(os.path.join(test_path,
         
         
         
         "%d.png"%i),as_gray = as_gray)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 img = img / 
         
         
         
         255
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 img = trans.resize(img,target_size)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 img = np.reshape(img,img.shape+(
         
         
         
         1,)) 
         
         
         
         if (
         
         
         
         not flag_multi_class) 
         
         
         
         else img
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 img = np.reshape(img,(
         
         
         
         1,)+img.shape)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #将测试图片扩展一个维度，与训练时的输入[2,256,256]保持一致
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
                
         
         
         
         yield img
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #上面这个函数主要是对测试图片进行规范，使其尺寸和维度上和训练图片保持一致
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         def geneTrainNpy(image_path,mask_path,flag_multi_class = False,num_class = 2,image_prefix = "image",mask_prefix = "mask",image_as_gray = True,mask_as_gray = True):
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             image_name_arr = glob.glob(os.path.join(image_path,
         
         
         
         "%s*.png"%image_prefix))
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #相当于文件搜索，搜索某路径下与字符匹配的文件https://blog.csdn.net/u010472607/article/details/76857493/
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             image_arr = []
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             mask_arr = []
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         for index,item 
         
         
         
         in enumerate(image_name_arr):
         
         
         
         #enumerate是枚举，输出[(0,item0),(1,item1),(2,item2)]
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 img = io.imread(item,as_gray = image_as_gray)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 img = np.reshape(img,img.shape + (
         
         
         
         1,)) 
         
         
         
         if image_as_gray 
         
         
         
         else img
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 mask = io.imread(item.replace(image_path,mask_path).replace(image_prefix,mask_prefix),as_gray = mask_as_gray)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #重新在mask_path文件夹下搜索带有mask字符的图片（标签图片）
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 mask = np.reshape(mask,mask.shape + (
         
         
         
         1,)) 
         
         
         
         if mask_as_gray 
         
         
         
         else mask
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 img,mask = adjustData(img,mask,flag_multi_class,num_class)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 image_arr.append(img)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 mask_arr.append(mask)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             image_arr = np.array(image_arr)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             mask_arr = np.array(mask_arr)
         
         
         
         #转换成array
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         return image_arr,mask_arr
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #该函数主要是分别在训练集文件夹下和标签文件夹下搜索图片，然后扩展一个维度后以array的形式返回，是为了在没用数据增强时的读取文件夹内自带的数据
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         def labelVisualize(num_class,color_dict,img):
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             img = img[:,:,
         
         
         
         0] 
         
         
         
         if len(img.shape) == 
         
         
         
         3 
         
         
         
         else img
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             img_out = np.zeros(img.shape + (
         
         
         
         3,))
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #变成RGB空间，因为其他颜色只能再RGB空间才会显示
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         for i 
         
         
         
         in range(num_class):
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 img_out[img == i,:] = color_dict[i]
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #为不同类别涂上不同的颜色，color_dict[i]是与类别数有关的颜色，img_out[img == i,:]是img_out在img中等于i类的位置上的点
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         return img_out / 
         
         
         
         255
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #上面函数是给出测试后的输出之后，为输出涂上不同的颜色，多类情况下才起作用，两类的话无用
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         def saveResult(save_path,npyfile,flag_multi_class = False,num_class = 2):
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         for i,item 
         
         
         
         in enumerate(npyfile):
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 img = labelVisualize(num_class,COLOR_DICT,item) 
         
         
         
         if flag_multi_class 
         
         
         
         else item[:,:,
         
         
         
         0]
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #多类的话就图成彩色，非多类（两类）的话就是黑白色
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 io.imsave(os.path.join(save_path,
         
         
         
         "%d_predict.png"%i),img)

这里要说明一下，由于在预测的时候模型是直接输出的，下面模型的输出是在一个sigmoid函数之后的输出，也就是输出的数值是在0-1之间的，但是在这里直接就把这个0-1之间的数进行保存成图片了，这里有两个疑点：

1.为什么可以直接将在0-1的浮点数直接保存成图片？

是因为在skimage模块中，如果图片数据是float的话，那么值应该是0到1或者-1到1的浮点数，

2.为什么直接保存而不进行mask二值图像的产生？

这是因为输出数据值已经很两极分化了，也即是有的很接近于0，有的很接近于1了，中间的数值很少，所以就直接输出也没有关系，相当于输出的是灰度图，如果你感觉非要产生二值化图像，可以修改成下面代码：


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         def saveResult(save_path,npyfile,flag_multi_class = False,num_class = 2):
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         for i,item 
         
         
         
         in enumerate(npyfile):
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
                
         
         
         
         if flag_multi_class:
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                     img = labelVisualize(num_class,COLOR_DICT,item)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         #多类的话就图成彩色，非多类（两类）的话就是黑白色
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
                
         
         
         
         else:
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                     img=item[:,:,
         
         
         
         0]
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                     print(np.max(img),np.min(img))
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                     img[img>
         
         
         
         0.5]=
         
         
         
         1
         
         
         
         #此时1是浮点数，下面的0也是
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                     img[img<=
         
         
         
         0.5]=
         
         
         
         0
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                     print(np.max(img),np.min(img))
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
                 io.imsave(os.path.join(save_path,
         
         
         
         "%d_predict.png"%i),img)

下面是model.py：


     
     
     
     
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         import numpy 
         
         
         
         as np 
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         import os
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         import skimage.io 
         
         
         
         as io
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         import skimage.transform 
         
         
         
         as trans
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         import numpy 
         
         
         
         as np
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         from keras.models 
         
         
         
         import *
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         from keras.layers 
         
         
         
         import *
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         from keras.optimizers 
         
         
         
         import *
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         from keras.callbacks 
         
         
         
         import ModelCheckpoint, LearningRateScheduler
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         from keras 
         
         
         
         import backend 
         
         
         
         as keras
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
         def unet(pretrained_weights = None,input_size = (256,256,1)):
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             inputs = Input(input_size)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             conv1 = Conv2D(
         
         
         
         64, 
         
         
         
         3, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(inputs)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             conv1 = Conv2D(
         
         
         
         64, 
         
         
         
         3, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(conv1)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             pool1 = MaxPooling2D(pool_size=(
         
         
         
         2, 
         
         
         
         2))(conv1)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             conv2 = Conv2D(
         
         
         
         128, 
         
         
         
         3, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(pool1)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             conv2 = Conv2D(
         
         
         
         128, 
         
         
         
         3, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(conv2)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             pool2 = MaxPooling2D(pool_size=(
         
         
         
         2, 
         
         
         
         2))(conv2)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             conv3 = Conv2D(
         
         
         
         256, 
         
         
         
         3, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(pool2)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             conv3 = Conv2D(
         
         
         
         256, 
         
         
         
         3, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(conv3)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             pool3 = MaxPooling2D(pool_size=(
         
         
         
         2, 
         
         
         
         2))(conv3)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             conv4 = Conv2D(
         
         
         
         512, 
         
         
         
         3, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(pool3)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             conv4 = Conv2D(
         
         
         
         512, 
         
         
         
         3, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(conv4)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             drop4 = Dropout(
         
         
         
         0.5)(conv4)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             pool4 = MaxPooling2D(pool_size=(
         
         
         
         2, 
         
         
         
         2))(drop4)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             conv5 = Conv2D(
         
         
         
         1024, 
         
         
         
         3, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(pool4)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             conv5 = Conv2D(
         
         
         
         1024, 
         
         
         
         3, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(conv5)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             drop5 = Dropout(
         
         
         
         0.5)(conv5)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             up6 = Conv2D(
         
         
         
         512, 
         
         
         
         2, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(UpSampling2D(size = (
         
         
         
         2,
         
         
         
         2))(drop5))
         
         
         
         #上采样之后再进行卷积，相当于转置卷积操作！
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             merge6 = concatenate([drop4,up6],axis=
         
         
         
         3)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             conv6 = Conv2D(
         
         
         
         512, 
         
         
         
         3, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(merge6)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             conv6 = Conv2D(
         
         
         
         512, 
         
         
         
         3, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(conv6)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             up7 = Conv2D(
         
         
         
         256, 
         
         
         
         2, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(UpSampling2D(size = (
         
         
         
         2,
         
         
         
         2))(conv6))
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             merge7 = concatenate([conv3,up7],axis = 
         
         
         
         3)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             conv7 = Conv2D(
         
         
         
         256, 
         
         
         
         3, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(merge7)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             conv7 = Conv2D(
         
         
         
         256, 
         
         
         
         3, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(conv7)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             up8 = Conv2D(
         
         
         
         128, 
         
         
         
         2, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(UpSampling2D(size = (
         
         
         
         2,
         
         
         
         2))(conv7))
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             merge8 = concatenate([conv2,up8],axis = 
         
         
         
         3)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             conv8 = Conv2D(
         
         
         
         128, 
         
         
         
         3, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(merge8)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             conv8 = Conv2D(
         
         
         
         128, 
         
         
         
         3, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(conv8)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             up9 = Conv2D(
         
         
         
         64, 
         
         
         
         2, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(UpSampling2D(size = (
         
         
         
         2,
         
         
         
         2))(conv8))
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             merge9 = concatenate([conv1,up9],axis = 
         
         
         
         3)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             conv9 = Conv2D(
         
         
         
         64, 
         
         
         
         3, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(merge9)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             conv9 = Conv2D(
         
         
         
         64, 
         
         
         
         3, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(conv9)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             conv9 = Conv2D(
         
         
         
         2, 
         
         
         
         3, activation = 
         
         
         
         'relu', padding = 
         
         
         
         'same', kernel_initializer = 
         
         
         
         'he_normal')(conv9)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             conv10 = Conv2D(
         
         
         
         1, 
         
         
         
         1, activation = 
         
         
         
         'sigmoid')(conv9)
         
         
         
         #我怀疑这个sigmoid激活函数是多余的，因为在后面的loss中用到的就是二进制交叉熵，包含了sigmoid
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             model = Model(input = inputs, output = conv10)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
             model.compile(optimizer = Adam(lr = 
         
         
         
         1e-4), loss = 
         
         
         
         'binary_crossentropy', metrics = [
         
         
         
         'accuracy'])
         
         
         
         #模型执行之前必须要编译https://keras-cn.readthedocs.io/en/latest/getting_started/sequential_model/
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         #利用二进制交叉熵，也就是sigmoid交叉熵，metrics一般选用准确率，它会使准确率往高处发展
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         #model.summary()
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         if(pretrained_weights):
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
        
         
         
         
              model.load_weights(pretrained_weights)
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
         
        
        
        
        
       
       
       
       
      
      
      
      
       
       
       
       
        
        
        
        
       
       
       
       
       
       
       
       
        
        
        
            
         
         
         
         return model

到此结束：

看看测试的结果：

1.你会发现测试的输出是256*256，但是输入是512*512，这是因为在输入的时候被resize了，统一resize成256*256.

2.还有一个就是这个模型没有按照论文中的模型来创建，具体区别就是每次卷积的时候这里采用的是padding=same,而论文中是没有进行pad的，也就是这里的输入尺寸和输出尺寸是一样大的，而论文中是输入大于输出。具体请看

如果大家有爱好深度学习，爱好人工智能，还有YOLO，可以加下我创建的群825524664（深度学习交流），仅供学习交流，没有广告，谢谢大家捧场！

python模块triton安装教程 2401_85863780 1024程序员节 triton whl
Triton是一个用于高性能计算的开源库，特别适用于深度学习和科学计算。通过预编译的whl文件安装Triton可以简化安装过程，尤其是在编译时可能会遇到依赖问题的情况下。以下是详细的安装步骤：安装前准备：Python环境：确保已经安装了Python，并且Python版本与whl文件兼容。pip：确保已经安装了pip，这是Python的包管理器，用来安装外部库。下载whl文件：从可靠的来源下载适用于
【机器学习】逻辑回归(LogisticRegression)原理与实战 GentleCP 机器学习(深度学习)逻辑回归 logistic regression 原理与实战机器学习
文章目录前言一、什么是逻辑回归1.1逻辑回归基础概念1.2逻辑回归核心概念二、逻辑回归Demo2.1数据准备2.2创建逻辑回归分类器2.3分类器预测三、逻辑回归实战3.1数据准备3.2数据划分与模型创建3.3预测数据评估模型四、参数选择五、总结六、参考资料本文属于我的机器学习/深度学习系列文章，点此查看系列文章目录前言本文主要通过文字和代码样例讲述逻辑回归的原理（包含逻辑回归的基础概念与推导）和实
磨人小妖精-tensorflow之removed in a future version 凯旋的铁铁磨人的小妖精 python tensorflow
TensorFlow1.14版本TensorFlow使用五个不同级别的日志消息。按照上升的顺序，它们是DEBUG，INFO，WARN，ERROR和FATAL。当您在任何这些级别配置日志记录时，TensorFlow将输出与该级别相对应的所有日志消息以及所有级别的严重级别。例如，如果设置了ERROR的日志记录级别，则会收到包含ERROR和FATAL消息的日志输出，如果设置了一个DEBUG级别，则会从所
《深度Q网络优化：突破高维连续状态空间的束缚》人工智能深度学习
在人工智能的发展历程中，深度Q网络（DQN）作为强化学习与深度学习融合的关键成果，为解决复杂决策问题开辟了新路径。但当面对高维连续状态空间时，DQN会出现训练不稳定、收敛速度慢等问题，严重限制了其应用范围。如何优化DQN以适应高维连续状态空间，成为当下研究的热点。深度Q网络基础回顾深度Q网络结合了深度学习强大的特征提取能力与Q学习的决策优化思想。在传统强化学习中，Q学习通过Q表记录每个状态-动作对
智享AI直播三代系统，开启「机器人比人更会带货」时代！缘分开始t621238 人工智能机器人
智享AI直播三代系统，开启「机器人比人更会带货」时代！在当今数字化浪潮汹涌的时代，直播行业作为电商领域的重要驱动力，正经历着前所未有的变革。近日，智享AI直播三代系统的横空出世，宛如一颗重磅炸弹，在直播行业掀起了惊涛骇浪，正式开启了「机器人比人更会带货」的全新时代。一、技术革新，颠覆传统直播模式智享AI直播三代系统的诞生，标志着直播行业进入了智能化的新纪元。它融合了先进的人工智能技术，包括深度学习
自学黑客（网络安全），一般人我劝你还是算了吧网安周星星 web安全安全 windows 网络网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包文章讲述了自学网络安全时常见的误区，如先学编程、过度追求深度学习以及收集过多资料，并提供了前期学习的硬件、软件选择建议，强调了基础编程知识和英文能力的重要性。文中给出了详细的学习路线，包括基础操作入门、实战操作以及参加CTF和HVV等竞赛来提升技能，并推荐了一系列相关书籍和学习资源。一、自学网络安全学习的误区和陷阱1.不要试图先成为一
DQN的原理和代码实现 SmallerFL NLP&机器学习 DQN 强化学习深度学习
文章目录1.概述2.DQN的训练步骤2.1初始化2.2训练循环2.3终止条件2.4评估3.代码示例1.概述深度Q网络（DeepQ-Network,DQN）是强化学习中的一种重要算法，由GoogleDeepMind于2013年提出。DQN结合了Q学习和深度学习，通过使用神经网络来近似Q值函数，解决了传统Q学习在高维状态空间中的问题。2.DQN的训练步骤2.1初始化环境：定义环境（例如，Atari游戏
深度学习基础知识 namelijink 深度学习人工智能
cuda简介：CUDA（ComputeUnifiedDeviceArchitecture）是由NVIDIA开发的一种并行计算平台和应用程序编程接口（API）。它允许开发人员利用NVIDIA的GPU（图形处理器）来加速各种计算任务，包括科学计算、机器学习、深度学习、数据分析等。NVIDIA是一个全球领先的计算技术公司，专注于设计和制造高性能计算设备。除了生产强大的GPU，NVIDIA还提供与其GPU
【python语言应用】最新全流程Python编程、机器学习与深度学习实践技术应用（帮助你快速了解和入门 Python）赵钰老师 python 机器学习深度学习 python 机器学习深度学习数据分析人工智能
近年来，人工智能领域的飞速发展极大地改变了各个行业的面貌。当前最新的技术动态，如大型语言模型和深度学习技术的发展，展示了深度学习和机器学习技术的强大潜力，成为推动创新和提升竞争力的关键。特别是PyTorch，凭借其灵活性和高效性，成为科研人员和工程师的首选工具。理解和掌握深度学习的基础知识，深入了解其与经典机器学习算法的区别与联系，并系统掌握包括迁移学习、循环神经网络（RNN）、长短时记忆网络（L
【Python深入浅出㊸】解锁Python3中的TensorFlow：开启深度学习之旅奔跑吧邓邓子 Python深入浅出 python 深度学习 tensorflow
目录一、TensorFlow简介1.1定义与背景1.2特点二、Python3与TensorFlow的关系2.1版本对应2.2为何选择Python3三、安装TensorFlow3.1安装步骤3.2验证安装四、TensorFlow基本概念与使用方法4.1计算图（Graph）4.2会话（Session）4.3张量（Tensor）4.4变量（Variable）4.5占位符（Placeholder）五、Te
keras实现TCN网络层谦虚且进步深度学习预测 keras 人工智能深度学习
keras实现TCN网络层，keras3.0可用。fromkeras.layersimportLambda,Dense,Layer,Conv1DimporttensorflowastfclassTCNCell(Layer):"""sumary_line:Chinese:让输入的时间序列[bs,seql,dim]提升kernel_size倍的感受野English:Doublethereceptive
【Java】已解决：java.util.concurrent.ExecutionException 屿小夏 java 开发语言 android
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
c++加载TensorRT调用深度学习模型方法 feibaoqq 深度学习深度学习 YOLO
使用TensorRT来调用训练好的模型并输出结果是一个高效的推理过程，特别是在需要低延迟和高吞吐量的应用场景中。以下是一个基本的步骤指南，展示了如何在C++中使用TensorRT进行推理。步骤1：准备环境安装TensorRT：确保你已经安装了NVIDIATensorRT库。准备模型：确保你的训练好的模型已经转换为TensorRT支持的格式，通常是一个.engine文件。你可以使用onnx-tens
点云从入门到精通技术详解100篇-基于 CBCT 与口内扫描数据的牙齿点云配准格图素书深度学习计算机视觉数学建模人工智能
目录前言国内外研究现状传统牙齿配准点云配准2牙齿数据的深度学习点云配准基础2.1牙齿数据获取方法2.1.1口腔印模2.1.2辐射成像2.1.3口内扫描2.2深度学习网络2.2.1全连接神经网络2.2.2卷积神经网络2.2.3孪生神经网络2.3点云数据配准基础2.3.1点云数据格式2.3.2点云旋转表达2.3.3传统点云配准方法3基于PCRNet的PCR-SA牙齿点云配准3.1CBCT-IOS牙齿配
Python深度学习代做目标检测NLP计算机视觉强化学习 matlabgoodboy 计算机视觉 python 深度学习
了解您的需求，您似乎在寻找关于Python深度学习领域的代做服务，特别是在目标检测、自然语言处理（NLP）、计算机视觉以及强化学习方面。以下是一些关于这些领域的概述以及寻找相关服务的建议。1.Python深度学习代做概述目标检测：目标检测是计算机视觉中的一个重要任务，旨在识别图像或视频中的特定对象，并确定它们的位置。Python中的深度学习框架（如TensorFlow、PyTorch）和计算机视觉
基于深度学习YOLOv5的活体人脸检测系统（Python+PySide6界面+训练代码）深度学习&目标检测实战项目深度学习 YOLO python 人工智能目标跟踪计算机视觉开发语言
一、前言随着人工智能技术的快速发展，计算机视觉（ComputerVision）已广泛应用于各种实际场景中，特别是在安全、金融、医疗等领域。人脸识别作为计算机视觉的一个重要应用，已经成为很多身份验证、安防监控、智能门禁等系统的核心技术。近年来，随着深度学习的突破，YOLO（YouOnlyLookOnce）系列算法因其高效、准确、实时的特点，广泛应用于物体检测任务。在实际的人脸识别应用中，活体人脸检测
【深度学习】计算机视觉（CV）-目标检测-SSD（Single Shot MultiBox Detector）—— 单次检测多框检测器 IT古董深度学习人工智能计算机视觉深度学习目标检测
SSD（SingleShotMultiBoxDetector）——单次检测多框检测器1️⃣什么是SSD？SSD(SingleShotMultiBoxDetector)是一种用于目标检测（ObjectDetection）的深度学习模型，由WeiLiu等人在2016年提出。它采用单阶段（SingleStage）方法，能够直接从图像中检测多个对象，并输出类别和边界框，比传统的两阶段方法（如FasterR
【深度学习】YOLO-World: Real-Time Open-Vocabulary Object Detection，目标检测 XD742971636 深度学习机器学习深度学习 YOLO 目标检测
介绍一个酷炫的目标检测方式：论文：https://arxiv.org/abs/2401.17270代码：https://github.com/AILab-CVC/YOLO-World文章目录摘要Introduction第2章相关工作2.1传统目标检测2.2开放词汇目标检测第3章方法3.1预训练公式：区域-文本对3.2模型架构3.3可重参数化的视觉-语言路径聚合网络（RepVL-PAN）3.4预训练
PyTorch入门实战：从零搭建你的第一个神经网络不打滑的西瓜皮机器学习深度学习人工智能神经网络 python pytorch pycharm
目录一、PyTorch简介：为什么选择它？二、环境搭建：5分钟快速安装三、核心概念：张量与自动求导1.张量（Tensor）：深度学习的数据基石2.自动求导（Autograd）：神经网络训练的核心四、实战：手写数字识别（MNIST）1.数据集加载与预处理2.构建卷积神经网络（CNN）3.训练与评估五、下一步学习建议一、PyTorch简介：为什么选择它？PyTorch是当前最热门的深度学习框架之一，由
关于pip Install与conda install ClaNNEd@ Deep Learning pip conda
conda解决依赖的问题很弱，环境包多了以后经常要解决依赖几分钟到十几分钟。我个人感觉比较好的实践是conda创建虚拟环境，装torch/tensorflow等比较难装的包，基础环境配好以后，后面装包一律用pip。conda，pip，anaconda，miniconda的区别网页https://www.quora.com/What-is-the-comparison-among-conda-vs-
超火的Deepseek的MOE架构是什么? 魔王阿卡纳兹大模型知识札记架构 DeepSeek MoE 大模型
DeepSeek的MOE（MixtureofExperts，混合专家）架构是一种基于专家模型（MixtureofExperts）的深度学习框架，旨在通过动态选择和激活部分专家模块来提高计算效率和模型性能。以下是对其核心特点和工作原理的详细介绍：1.核心概念与架构MOE架构的基本思想是将模型划分为多个“专家”模块，每个专家专注于处理特定类型的任务或数据特征。在推理时，通过门控机制（GatingMec
使用神经架构搜索（Neural Architecture Search, NAS）自动化设计高效深度学习模型的技术详解瑕疵热点资讯
博客主页：瑕疵的CSDN主页Gitee主页：瑕疵的gitee主页⏩文章专栏：《热点资讯》使用神经架构搜索（NeuralArchitectureSearch,NAS）自动化设计高效深度学习模型的技术详解使用神经架构搜索（NeuralArchitectureSearch,NAS）自动化设计高效深度学习模型的技术详解使用神经架构搜索（NeuralArchitectureSearch,NAS）自动化设计高
目标检测代码示例（基于Python和OpenCV） matlab_python22 计算机视觉
引言目标检测是计算机视觉领域中的一个核心任务，其目标是在图像或视频中定位和识别特定对象。随着技术的发展，目标检测算法不断演进，从传统的基于手工特征的方法到现代的深度学习方法，再到基于Transformer的架构，目标检测技术已经取得了显著的进步。本文将总结和对比几种主要的目标检测算法，探讨它们的优势、劣势和适用场景。1.目标检测算法分类1.1单阶段检测（One-Stage）与双阶段检测（Two-S
基于深度学习YOLOv8的海洋动物检测系统（Python+PySide6界面+训练代码）深度学习&目标检测实战项目深度学习 YOLO python 目标检测人工智能开发语言
引言近年来，计算机视觉技术在各行各业中得到了广泛的应用，特别是在智能监控、自动驾驶、医疗诊断等领域。深度学习，尤其是卷积神经网络（CNN）的出现，极大地提高了计算机处理图像和视频的能力。在这一领域，YOLO（YouOnlyLookOnce）系列模型以其高效且准确的目标检测能力，成为了当下最为流行的深度学习模型之一。在海洋生物保护、海洋环境监测等应用中，快速识别和检测海洋动物种类对于科学研究和保护工
基于YOLOv5深度学习的木材表面缺陷检测系统：UI界面 + YOLOv5 + 数据集详细教程深度学习&目标检测实战项目 YOLO 深度学习 ui YOLOv5 人工智能计算机视觉
随着工业自动化的发展，木材加工行业对产品质量的要求日益提高。木材表面缺陷的检测是确保产品质量的重要环节。传统的人工检测方式不仅费时费力，而且容易受到人为因素的影响。基于深度学习的目标检测技术，尤其是YOLOv5，凭借其优越的实时性和准确性，成为木材表面缺陷检测的有效工具。本博客将详细介绍如何构建一个基于YOLOv5的木材表面缺陷检测系统，包括数据集准备、模型训练、UI界面开发及完整代码实现。目录目
动手学深度学习笔记|3.2线性回归的从零开始实现（附课后习题答案） lusterku 动手学深度学习深度学习笔记线性回归
动手学深度学习笔记|3.2线性回归的从零开始实现（附课后习题答案）线性回归的从零开始实现生成数据集读取数据集初始化模型参数定义模型定义损失函数定义优化算法训练练习1.如果我们将权重初始化为零，会发生什么。算法仍然有效吗？2.计算二阶导数时可能会遇到什么问题？这些问题可以如何解决？3.为什么在`squared_loss`函数中需要使用`reshape`函数？4.尝试使用不同的学习率，观察损失函数值下
发文新思路！双通道CNN的惊人突破，准确率接近100%！沃恩智慧深度学习人工智能 cnn 人工智能神经网络
双通道CNN作为一种创新的卷积神经网络架构，正引领深度学习领域的新趋势。其核心优势在于并行卷积层设计，能够同时处理更多特征信息，从而显著提升模型的特征表示能力和识别精度。这种架构不仅提高了计算效率，还有效降低了过拟合风险，使其在复杂视觉任务中表现卓越。例如，最新的研究提出了一种名为DDTransUNet的混合网络，结合了Transformer和CNN的优势，通过双分支编码器和双重注意力机制，有效解
基于华为自研NPU Ascend 910的TensorFlow 1.x训练脚本迁移和使能混合精度记录 Tianyi Li 1997 华为云 tensorflow 华为人工智能深度学习 python
简介基于TesorFlow1.x以Sess.run形式搭建入门级——手写数字分类网络，并迁移到华为自研NPUAscend910，同时使能混合精度。硬件介绍华为自研NPUAscend910，即昇腾910AI处理器（简称NPU），根据官方介绍，是在2019年发布的人工智能（AI）专用的神经网络处理器，其算力高达256T，最新款算力高达310T，是业界主流芯片算力的2倍。当前业界大多数训练脚本基于Ten
超级实用！一个基于python的简化版深度学习框架，包括深度学习神经网络的设计和深度学习模型的设计，适用于中小型项目的开发和实现大懒猫软件深度学习 python 神经网络 numpy pytorch 人工智能
一、运用Python技术开发深度学习框架需要具备的基础知识总结开发一个基于Python的深度学习框架是一个复杂的任务，需要具备多方面的基础知识。以下是一些关键领域的总结，帮助你更好地准备和理解开发深度学习框架所需的知识。1.Python编程基础语法和数据结构：掌握Python的基本语法、数据类型（如列表、字典、元组等）和控制流（如循环、条件语句等）。函数和模块：理解函数的定义和使用，以及如何组织代
详解AI作画算法原理 Jimaks 后端 AI python ai作画 python 人工智能
在艺术与科技的交汇处，AI作画正以惊人的创造力刷新着我们对美的认知。这一领域融合了深度学习、计算机视觉和生成模型的前沿技术，让机器能够“想象”并创作出令人惊叹的图像。本文将深入浅出地探讨AI作画的核心算法原理，分析常见问题与易错点，并通过一个简单的代码示例，带领大家一窥AI艺术创作的奥秘。一、核心概念与原理1.生成对抗网络（GANs）GANs是AI作画中最著名的算法之一，由IanGoodfello
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">

U-net源码分析（Keras版本）

你可能感兴趣的:(深度学习,tensorflow)