AI Studio

『医学影像』基于Unet模型实现脊柱CT定位（中）

基于Unet模型实现脊柱CT定位（中）

目前AIstudio已经有许多基于Unet的分割项目，本项目在主要介绍分割网络的另外的应用场景，希望对大家的研究有所启发。

在项目『医学影像』基于Unet+++实现脊柱MRI定位（上）中，笔者初步探索了基于分割网络实现锥体定位的可行性。

但医疗数据种类繁多，并且成像原理各不相同,与此相关的数据集非常稀缺。此外，之前的项目仅仅探索了在侧面视图的情况下的可行性。

本项目将根据论文《Automatic L3 slice detection in 3D CT images using fully-convolutional networks》开源的CT多视图数据集进行研究。

展示了在CT数据中的定位可行性，探索了定位CT开源数据集的使用，对比在CT数据的侧面视图与正面视图中锥体定位的精度。

0. 研究动机

在医学领域，经常需要分析患某种疾病后身体脂肪含量的变化，一般通过选择某个锥体的截面来估计全身的脂肪含量。

常规的方法是通过手动从几百张影像中选择需要的切片（一般为L3），这种方法即耗时又枯燥，稍不注意还容易出错。

直接从CT图像中提取测量值非常方便，因为CT经常作为癌症分期和疾病评估的一部分获得。

目前计算肌细胞减少测量值的工作流程如下：

手动提取L3切片；这涉及到逐层滚动3D图像，直到找到L3层。
半自动分割软件（例如：Slice-O-Matic或ImageJ），包括手动细化，然后用于分割骨骼肌和脂肪组织。

此过程每幅图像需要5到10分钟，并且在大型数据集上运行会变得非常耗时

切片选择相关的研究大部分都是在3D数据上对所有的锥体进行标注，但是仅仅对单一锥体进行定位不需要其他的锥体的具体位置，而且3D数据的训练和推理需要更多的时间。

因此，目前的一个解决方案是通过将三维数据映射使用MLP映射到二维，然后使用深度学习进行定位。

由于CT影像数据的丰富性，我们可以通过MLP数据同时获得正面视图和侧面视图来进行定位。

论文《Automatic L3 slice detection in 3D CT images using fully-convolutional networks》

在过去几年中，对第三腰椎（L3）处提取的单个CT切片的分析已经引起了临床上的极大兴趣，特别是在量化肌减少（肌肉丧失）方面。

该文章提出了一种在三维CT图像中自动检测L3切片的有效方法。适用于具有各种视场、遮挡和切片厚度的图像。

首先，通过最大强度投影（MIP）将三维CT图像转换为二维图像，从而降低了问题的维数。

然后将MIP图像用作2D全卷积网络的输入，以2D置信图的形式预测L3切片的位置。

1. 项目介绍

计算机断层扫描(CT)成像广泛用于研究身体成分，即肌肉和脂肪组织的比例，应用于营养或化疗剂量设计等领域。

特别是，来自固定位置的轴向CT切片通常用于身体成分分析。然而，如果手动进行，从数百张切片中手动选择是非常繁琐的操作。

本项目将3D CT体积作为输入。体积通过最大强度投影（MIP）转换为2D图像，并进行进一步后处理。

将2D MIP图像用作网络的输入。根据网络，输出是1D或2D置信图。

置信图中的最大概率位置用作L3位置的预测，允许从CT体积中提取横向切片。

最终实现目标锥体的快速自动识别。

2. 数据集介绍

数据集来自论文公开数据集，作者从多个公开可用的数据集中收集了1070个CT图像组成的不同数据集。

癌症影像档案（TCIA）中获得3组：头颈部、卵巢、结肠；肝肿瘤数据集来自LiTS分割挑战；卵巢癌数据集来自伦敦哈默史密斯医院（HH）。

所有1070个3D CT图像都经过预处理，其中每个3D图像都会生成一组由正面图像和受限矢状图像组成的图像。

对归一化为1x1mm的图像进行注释。MIP图像由2名注释员注释：一名具有7年经验的放射科医生和一名具有5年CT图像工作经验的注释员。

对于每个图像集，注释器都会看到正面和受限矢状MIP并排显示，注释器单击L3切片的位置。

主要标志物被选为椎弓根的中间，与横突的顶部边缘对齐。

3. 代码实现

3.1 数据集预处理

本项目读取原论文数据集，其正面视图及侧面视图的尺寸最大为 700*1161，L3锥体位置为第90-slice 到第860-slice，空间差异较大。

对数据进行进一步处理。将空间分辨率统一为1mm，hu值截取为【100，1500】，图像两边各mask35%以去除无关信息干扰，并截取512*512尺寸的数据作为最终数据集。

具体代码处理如下：

经过处理后剩余979个数据集。

import numpy as np
from scipy.ndimage import zoom

def normalise_zero_one(image, eps=1e-8):
    image = image.astype(np.float32)
    ret = (image - np.min(image))
    ret /= (np.max(image) - np.min(image) + eps)
    return ret

def reduce_hu_intensity_range(img, minv=100, maxv=1500):
    img = np.clip(img, minv, maxv)
    img = 255 * normalise_zero_one(img)
    return img

def normalise_spacing_and_preprocess(images, images_sagittal, slice_locations, spacings, new_spacing=1):
    images_norm = []
    images_s_norm = []
    slice_loc_norm = []
    for image, image_s, loc, s in zip(images, images_sagittal, slice_locations, spacings):
        img = zoom(image, [s[2] / new_spacing, s[0] / new_spacing])
        img_s = zoom(image_s, [s[2] / new_spacing, s[0] / new_spacing])
        images_norm.append(reduce_hu_intensity_range(img))
        images_s_norm.append(reduce_hu_intensity_range(img_s))
        slice_loc_norm.append(int(loc * s[2] / new_spacing))

    return np.array(images_norm), np.array(images_s_norm), np.array(slice_loc_norm)

def resize_img(img_0,img_1,loc_,min_h_w=512):
    assert min_h_w% 2 == 0, '要求限制范围取值为偶数'
    img_0_out,img_1_out,loc_out = [],[],[]

    for i in range(len(img_0)):
        img_f = img_0[i]
        img_s = img_1[i]
        loc = loc_[i]
        if loc>min_h_w:
            continue
        else:
            ## 处理高度
            h,w = img_f.shape
            # 处理高度
            if h>min_h_w:
                img_f = img_f[:min_h_w,:]
                img_s = img_s[:min_h_w,:]
            else:
                img_f_ = np.zeros((min_h_w,w))
                img_s_ = np.zeros((min_h_w,w))
                img_f_[:h,:] = img_f
                img_s_[:h,:] = img_s
                img_f = img_f_
                img_s = img_s_  
            # 处理宽度
            if w>min_h_w:
                mid_w = int(w*0.5)
                img_f = img_f[:,mid_w-min_h_w//2:mid_w+min_h_w//2]
                img_s = img_s[:,mid_w-min_h_w//2:mid_w+min_h_w//2]
            else:
                img_f_ = np.zeros((min_h_w,min_h_w))
                img_s_ = np.zeros((min_h_w,min_h_w))
                s_ind = int(0.5*(min_h_w-w))
                
                img_f_[:,s_ind:s_ind+w] = img_f
                img_s_[:,s_ind:s_ind+w] = img_s
                img_f = img_f_
                img_s = img_s_  
        
        # MASK 掉一部分
        s_m = 0.35 
        img_f[:,:int(s_m*img_f.shape[1])] = 0
        img_f[:,int((1-s_m)*img_f.shape[1]):] = 0

        img_0_out.append(img_f)
        img_1_out.append(img_s)
        loc_out.append(loc)
    
    return img_0_out,img_1_out,loc_out

def generateTrainData(path = "data/data145717/l3_dataset.npz"):

    data=np.load(path,allow_pickle=True)
    images = data['images_f']
    images_sagittal = data['images_s']
    ydata = data['ydata']
    names = data['names']
    spacings = data['spacings']
    data.close()
    slice_locations = np.zeros_like(names, dtype=np.float)
    n = len(ydata.item())
    for k, v in ydata.item().items():
        slice_locations += v
    slice_locations /= n

    images_frontal, images_sagittal, slice_locations = normalise_spacing_and_preprocess(images, images_sagittal,slice_locations, spacings, new_spacing=1)

    images_frontal, images_sagittal, slice_locations = resize_img(images_frontal,images_sagittal,slice_locations)

    return images_frontal, images_sagittal, slice_locations
    
images_frontal, images_sagittal, slice_locations = generateTrainData()

/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/ipykernel_launcher.py:26: VisibleDeprecationWarning: Creating an ndarray from ragged nested sequences (which is a list-or-tuple of lists-or-tuples-or ndarrays with different lengths or shapes) is deprecated. If you meant to do this, you must specify 'dtype=object' when creating the ndarray

len(images_frontal)

3.2 定义数据集读取类

本项目将原始数据集按照80%训练，20%验证进行划分。

对读取数据集进行展示。

# 定义数据读取类
import paddle
from paddle.io import Dataset
import numpy as np
from scipy.ndimage import zoom
import paddle.vision.transforms as T

# 重写数据读取类
class MRILocationDataset(Dataset):
    def __init__(self,images_frontal, images_sagittal, slice_locations,mode = 'train',transform =None,k_fold=1):
        # 数据读取

        self.images_frontal_list = list(images_frontal)
        self.images_sagittal_list = list(images_sagittal)
        self.slice_locations_list = list(slice_locations)

        self.mode = mode
        
        # 选择前80%训练，后20%测试
        scale_s = int(0.2*(k_fold-1)*len(self.slice_locations_list))
        scale_e = int(0.2*k_fold*len(self.slice_locations_list))
    
        self.transforms = transform
        if self.mode == 'train':
            self.images_frontal_list  = self.images_frontal_list[:scale_s]+self.images_frontal_list[scale_e:]
            self.images_sagittal_list = self.images_sagittal_list[:scale_s]+self.images_sagittal_list[scale_e:]
            self.slice_locations_list = self.slice_locations_list[:scale_s]+self.slice_locations_list[scale_e:]

        else:
            self.images_frontal_list  = self.images_frontal_list[scale_s:scale_e]
            self.images_sagittal_list = self.images_sagittal_list[scale_s:scale_e]
            self.slice_locations_list = self.slice_locations_list[scale_s:scale_e]

        # one-hot 编码 并转为 tensor    
        # self.slice_locations_tensor = paddle.nn.functional.one_hot(paddle.to_tensor(slice_locations-np.min(slice_locations), dtype='int64'), num_classes=np.max(slice_locations-np.min(slice_locations))+1)


    def __getitem__(self, index):

        images_frontal = self.images_frontal_list[index]
        images_sagittal = self.images_sagittal_list[index]
        slice_locations = self.slice_locations_list[index]
        #slice_locations = self.slice_locations_tensor[index]
        
        images_frontal = np.expand_dims(images_frontal, axis=0)
        images_sagittal = np.expand_dims(images_sagittal, axis=0)
        
        images_frontal = images_frontal.repeat(3,axis=0)
        images_sagittal = images_sagittal.repeat(3,axis=0)
        
        wid_label = 3
        label = np.zeros((1,images_frontal.shape[1],images_frontal.shape[2]))
        label[:,slice_locations-wid_label:slice_locations+wid_label,int(images_frontal.shape[2]*0.35):int(images_frontal.shape[2]*0.7)] = 255
        
        return images_frontal/255 ,images_sagittal/255 ,slice_locations,label/255

    def __len__(self):
        return len(self.slice_locations_list)

from PIL import Image
import matplotlib.pyplot as plt

%matplotlib inline
%config InlineBackend.figure_format = 'retina'

dataset = MRILocationDataset(images_frontal, images_sagittal, slice_locations,mode='train',k_fold=2)
print('=============train dataset=============')
for item in dataset:
    images_frontal_ ,images_sagittal_,slice_locations_,label= item
    print(slice_locations_,images_frontal_.shape,images_sagittal_.shape,label.shape)
    break
images_frontal_ = np.squeeze(images_frontal_[0,:,:])
images_sagittal_ = np.squeeze(images_sagittal_[0,:,:])
label = np.squeeze(label)

imga = Image.fromarray(images_frontal_*255)
imgb = Image.fromarray(images_sagittal_*255)
imgc = Image.fromarray(label*255)


plt.figure(figsize=(6, 2))
plt.subplot(1,3,1),plt.xticks([]),plt.yticks([]),plt.imshow(imga)
plt.subplot(1,3,2),plt.xticks([]),plt.yticks([]),plt.imshow(imgb)
plt.subplot(1,3,3),plt.xticks([]),plt.yticks([]),plt.imshow(imgc)

plt.show()

/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/matplotlib/__init__.py:107: DeprecationWarning: Using or importing the ABCs from 'collections' instead of from 'collections.abc' is deprecated, and in 3.8 it will stop working
  from collections import MutableMapping
/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/matplotlib/rcsetup.py:20: DeprecationWarning: Using or importing the ABCs from 'collections' instead of from 'collections.abc' is deprecated, and in 3.8 it will stop working
  from collections import Iterable, Mapping
/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/matplotlib/colors.py:53: DeprecationWarning: Using or importing the ABCs from 'collections' instead of from 'collections.abc' is deprecated, and in 3.8 it will stop working
  from collections import Sized
/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/matplotlib_inline/config.py:68: DeprecationWarning: InlineBackend._figure_format_changed is deprecated in traitlets 4.1: use @observe and @unobserve instead.
  def _figure_format_changed(self, name, old, new):
/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/matplotlib/cbook/__init__.py:2349: DeprecationWarning: Using or importing the ABCs from 'collections' instead of from 'collections.abc' is deprecated, and in 3.8 it will stop working
  if isinstance(obj, collections.Iterator):
/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/matplotlib/cbook/__init__.py:2366: DeprecationWarning: Using or importing the ABCs from 'collections' instead of from 'collections.abc' is deprecated, and in 3.8 it will stop working
  return list(data) if isinstance(data, collections.MappingView) else data


=============train dataset=============
160 (3, 512, 512) (3, 512, 512) (1, 512, 512)

3.3 定义模型

本项目基于Unet网络完成实验。

import paddle
import paddle.nn as nn
import paddle.nn.functional as F

class DoubleConv(nn.Layer):
    def __init__(self,in_ch,out_ch):
        super(DoubleConv,self).__init__()
        self.conv = nn.Sequential(
                nn.Conv2D(in_ch,out_ch,3,padding=1),#in_ch、out_ch是通道数
                nn.BatchNorm2D(out_ch),
                nn.ReLU(),
                nn.Conv2D(out_ch,out_ch,3,padding=1),
                nn.BatchNorm2D(out_ch),
                nn.ReLU()  
            )
    def forward(self,x):
        return self.conv(x)
 
 
class UNet(nn.Layer):
    def __init__(self,in_ch=3,num_classes=1):
        super(UNet,self).__init__()
        self.conv1 = DoubleConv(in_ch,64)
        self.pool1 = nn.MaxPool2D(2)#每次把图像尺寸缩小一半
        self.conv2 = DoubleConv(64,128)
        self.pool2 = nn.MaxPool2D(2)
        self.conv3 = DoubleConv(128,256)
        self.pool3 = nn.MaxPool2D(2)
        self.conv4 = DoubleConv(256,512)
        self.pool4 = nn.MaxPool2D(2)
        self.conv5 = DoubleConv(512,1024)
        #逆卷积
        self.up6 = nn.Conv2DTranspose(1024,512,2,stride=2)
        self.conv6 = DoubleConv(1024,512)
        self.up7 = nn.Conv2DTranspose(512,256,2,stride=2)
        self.conv7 = DoubleConv(512,256)
        self.up8 = nn.Conv2DTranspose(256,128,2,stride=2)
        self.conv8 = DoubleConv(256,128)
        self.up9 = nn.Conv2DTranspose(128,64,2,stride=2)
        self.conv9 = DoubleConv(128,64)
        
        self.conv10 = nn.Conv2D(64,num_classes,1)
        
        self.conv11 = nn.Conv2D(in_channels=num_classes,out_channels=num_classes,kernel_size=(1,512),stride=1)

    def forward(self,x):
        c1 = self.conv1(x)
        p1 = self.pool1(c1)
        c2 = self.conv2(p1)
        p2 = self.pool2(c2)
        c3 = self.conv3(p2)
        p3 = self.pool3(c3)
        c4 = self.conv4(p3)
        p4 = self.pool4(c4)
        c5 = self.conv5(p4)
        up_6 = self.up6(c5)
        merge6 = paddle.concat([up_6,c4],axis=1)#按维数1（列）拼接,列增加
        c6 = self.conv6(merge6)
        up_7 = self.up7(c6)
        merge7 = paddle.concat([up_7,c3],axis=1)
        c7 = self.conv7(merge7)
        up_8 = self.up8(c7)
        merge8 = paddle.concat([up_8,c2],axis=1)

        c8 = self.conv8(merge8)
        up_9 = self.up9(c8)
        merge9 = paddle.concat([up_9,c1],axis=1)
        c9 = self.conv9(merge9)
        c10 = self.conv10(c9)
        #c11 = F.sigmoid(self.conv11(c10))#化成(0~1)区间
        return c10

if __name__ == '__main__':
    unet = UNet(num_classes=1)
    model = paddle.Model(unet)
    model.summary((2,3, 512, 512))

W1005 14:08:51.387312   575 gpu_resources.cc:61] Please NOTE: device: 0, GPU Compute Capability: 7.0, Driver API Version: 11.2, Runtime API Version: 11.2
W1005 14:08:51.391311   575 gpu_resources.cc:91] device: 0, cuDNN Version: 8.2.


-----------------------------------------------------------------------------
  Layer (type)        Input Shape          Output Shape         Param #    
=============================================================================
    Conv2D-1       [[2, 3, 512, 512]]   [2, 64, 512, 512]        1,792     
  BatchNorm2D-1   [[2, 64, 512, 512]]   [2, 64, 512, 512]         256      
     ReLU-1       [[2, 64, 512, 512]]   [2, 64, 512, 512]          0       
    Conv2D-2      [[2, 64, 512, 512]]   [2, 64, 512, 512]       36,928     
  BatchNorm2D-2   [[2, 64, 512, 512]]   [2, 64, 512, 512]         256      
     ReLU-2       [[2, 64, 512, 512]]   [2, 64, 512, 512]          0       
  DoubleConv-1     [[2, 3, 512, 512]]   [2, 64, 512, 512]          0       
   MaxPool2D-1    [[2, 64, 512, 512]]   [2, 64, 256, 256]          0       
    Conv2D-3      [[2, 64, 256, 256]]   [2, 128, 256, 256]      73,856     
  BatchNorm2D-3   [[2, 128, 256, 256]]  [2, 128, 256, 256]        512      
     ReLU-3       [[2, 128, 256, 256]]  [2, 128, 256, 256]         0       
    Conv2D-4      [[2, 128, 256, 256]]  [2, 128, 256, 256]      147,584    
  BatchNorm2D-4   [[2, 128, 256, 256]]  [2, 128, 256, 256]        512      
     ReLU-4       [[2, 128, 256, 256]]  [2, 128, 256, 256]         0       
  DoubleConv-2    [[2, 64, 256, 256]]   [2, 128, 256, 256]         0       
   MaxPool2D-2    [[2, 128, 256, 256]]  [2, 128, 128, 128]         0       
    Conv2D-5      [[2, 128, 128, 128]]  [2, 256, 128, 128]      295,168    
  BatchNorm2D-5   [[2, 256, 128, 128]]  [2, 256, 128, 128]       1,024     
     ReLU-5       [[2, 256, 128, 128]]  [2, 256, 128, 128]         0       
    Conv2D-6      [[2, 256, 128, 128]]  [2, 256, 128, 128]      590,080    
  BatchNorm2D-6   [[2, 256, 128, 128]]  [2, 256, 128, 128]       1,024     
     ReLU-6       [[2, 256, 128, 128]]  [2, 256, 128, 128]         0       
  DoubleConv-3    [[2, 128, 128, 128]]  [2, 256, 128, 128]         0       
   MaxPool2D-3    [[2, 256, 128, 128]]   [2, 256, 64, 64]          0       
    Conv2D-7       [[2, 256, 64, 64]]    [2, 512, 64, 64]      1,180,160   
  BatchNorm2D-7    [[2, 512, 64, 64]]    [2, 512, 64, 64]        2,048     
     ReLU-7        [[2, 512, 64, 64]]    [2, 512, 64, 64]          0       
    Conv2D-8       [[2, 512, 64, 64]]    [2, 512, 64, 64]      2,359,808   
  BatchNorm2D-8    [[2, 512, 64, 64]]    [2, 512, 64, 64]        2,048     
     ReLU-8        [[2, 512, 64, 64]]    [2, 512, 64, 64]          0       
  DoubleConv-4     [[2, 256, 64, 64]]    [2, 512, 64, 64]          0       
   MaxPool2D-4     [[2, 512, 64, 64]]    [2, 512, 32, 32]          0       
    Conv2D-9       [[2, 512, 32, 32]]   [2, 1024, 32, 32]      4,719,616   
  BatchNorm2D-9   [[2, 1024, 32, 32]]   [2, 1024, 32, 32]        4,096     
     ReLU-9       [[2, 1024, 32, 32]]   [2, 1024, 32, 32]          0       
    Conv2D-10     [[2, 1024, 32, 32]]   [2, 1024, 32, 32]      9,438,208   
 BatchNorm2D-10   [[2, 1024, 32, 32]]   [2, 1024, 32, 32]        4,096     
     ReLU-10      [[2, 1024, 32, 32]]   [2, 1024, 32, 32]          0       
  DoubleConv-5     [[2, 512, 32, 32]]   [2, 1024, 32, 32]          0       
Conv2DTranspose-1 [[2, 1024, 32, 32]]    [2, 512, 64, 64]      2,097,664   
    Conv2D-11     [[2, 1024, 64, 64]]    [2, 512, 64, 64]      4,719,104   
 BatchNorm2D-11    [[2, 512, 64, 64]]    [2, 512, 64, 64]        2,048     
     ReLU-11       [[2, 512, 64, 64]]    [2, 512, 64, 64]          0       
    Conv2D-12      [[2, 512, 64, 64]]    [2, 512, 64, 64]      2,359,808   
 BatchNorm2D-12    [[2, 512, 64, 64]]    [2, 512, 64, 64]        2,048     
     ReLU-12       [[2, 512, 64, 64]]    [2, 512, 64, 64]          0       
  DoubleConv-6    [[2, 1024, 64, 64]]    [2, 512, 64, 64]          0       
Conv2DTranspose-2  [[2, 512, 64, 64]]   [2, 256, 128, 128]      524,544    
    Conv2D-13     [[2, 512, 128, 128]]  [2, 256, 128, 128]     1,179,904   
 BatchNorm2D-13   [[2, 256, 128, 128]]  [2, 256, 128, 128]       1,024     
     ReLU-13      [[2, 256, 128, 128]]  [2, 256, 128, 128]         0       
    Conv2D-14     [[2, 256, 128, 128]]  [2, 256, 128, 128]      590,080    
 BatchNorm2D-14   [[2, 256, 128, 128]]  [2, 256, 128, 128]       1,024     
     ReLU-14      [[2, 256, 128, 128]]  [2, 256, 128, 128]         0       
  DoubleConv-7    [[2, 512, 128, 128]]  [2, 256, 128, 128]         0       
Conv2DTranspose-3 [[2, 256, 128, 128]]  [2, 128, 256, 256]      131,200    
    Conv2D-15     [[2, 256, 256, 256]]  [2, 128, 256, 256]      295,040    
 BatchNorm2D-15   [[2, 128, 256, 256]]  [2, 128, 256, 256]        512      
     ReLU-15      [[2, 128, 256, 256]]  [2, 128, 256, 256]         0       
    Conv2D-16     [[2, 128, 256, 256]]  [2, 128, 256, 256]      147,584    
 BatchNorm2D-16   [[2, 128, 256, 256]]  [2, 128, 256, 256]        512      
     ReLU-16      [[2, 128, 256, 256]]  [2, 128, 256, 256]         0       
  DoubleConv-8    [[2, 256, 256, 256]]  [2, 128, 256, 256]         0       
Conv2DTranspose-4 [[2, 128, 256, 256]]  [2, 64, 512, 512]       32,832     
    Conv2D-17     [[2, 128, 512, 512]]  [2, 64, 512, 512]       73,792     
 BatchNorm2D-17   [[2, 64, 512, 512]]   [2, 64, 512, 512]         256      
     ReLU-17      [[2, 64, 512, 512]]   [2, 64, 512, 512]          0       
    Conv2D-18     [[2, 64, 512, 512]]   [2, 64, 512, 512]       36,928     
 BatchNorm2D-18   [[2, 64, 512, 512]]   [2, 64, 512, 512]         256      
     ReLU-18      [[2, 64, 512, 512]]   [2, 64, 512, 512]          0       
  DoubleConv-9    [[2, 128, 512, 512]]  [2, 64, 512, 512]          0       
    Conv2D-19     [[2, 64, 512, 512]]    [2, 1, 512, 512]         65       
=============================================================================
Total params: 31,055,297
Trainable params: 31,031,745
Non-trainable params: 23,552
-----------------------------------------------------------------------------
Input size (MB): 6.00
Forward/backward pass size (MB): 7436.00
Params size (MB): 118.47
Estimated Total Size (MB): 7560.47
-----------------------------------------------------------------------------

3.4 模型训练

# 初始化权重
import paddle
import paddle.nn as nn 
from paddle.nn.initializer import KaimingNormal,Constant

def weight_init(module):
    for n,m in module.named_children():
        if isinstance(m,nn.Conv2D):
            KaimingNormal()(m.weight,m.weight.block)
            if m.bias is not None:
                Constant(0)(m.bias)
        if isinstance(m,nn.Conv1D):
            KaimingNormal()(m.weight,m.weight.block)
            if m.bias is not None:
                Constant(0)(m.bias)

import pandas as pd
import os
import numpy as np
from tqdm import tqdm

# 创建文件夹 
for item in ['log','saveModel']:
    make_folder = os.path.join('work',item)
    if  not os.path.exists(make_folder):
        os.mkdir(make_folder)

EPOCH_NUM = 30  # 设置外层循环次数
BATCH_SIZE = 8  # 设置batch大小

# 定义网络结构


# 五折交叉验证
#for K in range(5):
K=5 #K+1
# unet3p / unet / u2net / attunet / unet2p
# 每次实例化模型
model = UNet(num_classes=1)

model_name = 'unet'
for item in ['log','saveModel']:
    make_folder = os.path.join('work',item,model_name)
    if  not os.path.exists(make_folder):
        os.mkdir(make_folder)

# 定义优化算法，使用随机梯度下降SGD，学习率设置为0.01
scheduler = paddle.optimizer.lr.StepDecay(learning_rate=0.01, step_size=30, gamma=0.1, verbose=False)
optimizer = paddle.optimizer.Adam(learning_rate=scheduler, parameters=model.parameters())

# 定义数据读取
train_dataset = MRILocationDataset(images_frontal, images_sagittal, slice_locations,mode='train',k_fold=K)
# 使用paddle.io.DataLoader 定义DataLoader对象用于加载Python生成器产生的数据，
data_loader = paddle.io.DataLoader(train_dataset, batch_size=BATCH_SIZE, shuffle=False,num_workers=4)

loss_BCEloss = paddle.nn.BCELoss()
result = pd.DataFrame()
model.train()
model.apply(weight_init)

# 定义外层循环
for epoch_id in range(EPOCH_NUM):
    # 定义内层循环
    LOSS = {}
    for iter_id, data in enumerate(tqdm(data_loader())):
        images_frontal_ ,images_sagittal_,slice_locations_,label = data # x 为数据 ，y 为标签
        # 将numpy数据转为飞桨动态图tensor形式
        x = paddle.to_tensor(images_frontal_,dtype='float32')
        y = paddle.to_tensor(images_sagittal_,dtype='float32')
        label = paddle.to_tensor(label,dtype='float32')

        # 前向计算
        predicts = model(y)
        # 计算损失
        loss = loss_BCEloss(paddle.nn.functional.sigmoid(predicts), label)

        # 清除梯度
        optimizer.clear_grad()
        # 反向传播
        loss.backward()
        # 最小化loss,更新参数
        optimizer.step()
        LOSS[iter_id] = loss.item()

    scheduler.step()

    info_loss = {'Epoch':epoch_id+1,'Loss':np.around(sum(LOSS.values())/len(LOSS), 5)}
    result = result.append(info_loss,ignore_index=True)

    print("第{}/5次交叉验证,epoch: {}, loss is: {}".format(K,epoch_id+1, loss.item()))

# 保存模型参数，文件名为 模型.pdparams
paddle.save(model.state_dict(), os.path.join('work/saveModel',model_name,model_name + '_{}.pdparams'.format(K)))
result.to_csv( os.path.join('work/log',model_name,model_name + '_{}.csv'.format(K)),index=False)
print('模型保存成功，模型参数保存在:',model_name,'_{}.pdparams中'.format(K))

3.5 模型测试

import paddle
import pandas as pd
import os

# 模型验证
BATCH_SIZE = 8
# 单次验证记录
Error_mean,Error_std= [],[]
# 全局验证记录
MODEL_Mean,MODEL_Std = [],[]

# 清理缓存
print("开始测试")
result = pd.DataFrame()
#for K in range(5):
K=5 #K+1
# 定义模型
model_name = 'unet'
model =  UNet(num_classes=1)
# 用于加载之前的训练过的模型参数

para_state_dict = paddle.load(os.path.join('work/saveModel',model_name,model_name + '_{}.pdparams'.format(K)))
model.set_dict(para_state_dict)
model.eval()

test_dataset =  MRILocationDataset(images_frontal, images_sagittal, slice_locations,mode='test',k_fold=K)
test_data_loader = paddle.io.DataLoader(test_dataset, batch_size=BATCH_SIZE, shuffle=False,num_workers=4)
with paddle.no_grad():
    for iter_id, data in enumerate(test_data_loader()):
        x, y,loc,label_ = data # x 为数据 ，y 为标签
        # 将numpy数据转为飞桨动态图tensor形式
        x = paddle.to_tensor(x,dtype='float32')
        y = paddle.to_tensor(y,dtype='float32')
        label_ = paddle.to_tensor(label_,dtype='float32')

        predicts = model(y)
        predicts = paddle.nn.functional.sigmoid(predicts)
        for i in range(predicts.shape[0]):
            predict = predicts[i,:,:,:].cpu().numpy()
            label = label_[i,:,:,:].cpu().numpy()
            inputs = y[i,1,:,:].cpu().numpy()

            predict = np.squeeze(predict)
            label = np.squeeze(label)
            inputs = np.squeeze(inputs)

            #当要保存的图片为灰度图像时，灰度图像的 numpy 尺度是 [1, h, w]。需要将 [1, h, w] 改变为 [h, w]
            plt.figure(figsize=(6, 18))
            plt.subplot(1,3,1),plt.xticks([]),plt.yticks([]),plt.imshow(predict,cmap='gray')
            plt.subplot(1,3,2),plt.xticks([]),plt.yticks([]),plt.imshow(label,cmap='gray')
            plt.subplot(1,3,3),plt.xticks([]),plt.yticks([]),plt.imshow(inputs,cmap='gray')
            plt.show()
            
            index_predict= np.argmax(np.max(predict,1))+3
            index_label = np.argmax(np.max(label,1))
            print('真实位置：',index_label,'预测位置：',index_predict)
            Error_mean.append(np.abs(index_label-index_predict))
            Error_std.append(index_label-index_predict)
        break

print("第{}个模型测试集平均定位误差为：{:.2f}，定位误差标准差为：{:.2f}".format(K,np.mean(Error_mean),np.std(Error_std)))
MODEL_Mean.append(np.mean(Error_mean))
MODEL_Std.append(np.std(Error_std))
info_loss = {'K折交叉验证':K,'定位误差均值':np.mean(Error_mean),'定位误差标准差':np.std(Error_std)}
result = result.append(info_loss,ignore_index=True)

# 加入K折的最终验证结果
info_loss = {'K折交叉验证':'ALL','定位误差均值':np.mean(MODEL_Mean),'定位误差标准差':np.mean(MODEL_Std)}
result = result.append(info_loss,ignore_index=True)
result.to_csv( os.path.join('work/log',model_name,model_name + '_all.csv'),index=False,encoding='utf-8-sig')

print('-----------------------------------------')
print('模型{}五折交叉验证平均误差为：{:.2f}，误差标准差为：{:.2f}'.format(model_name,np.mean(MODEL_Mean),np.mean(MODEL_Std)))
print('-----------------------------------------')
np.mean(MODEL_Mean),'定位误差标准差':np.mean(MODEL_Std)}
result = result.append(info_loss,ignore_index=True)
result.to_csv( os.path.join('work/log',model_name,model_name + '_all.csv'),index=False,encoding='utf-8-sig')

print('-----------------------------------------')
print('模型{}五折交叉验证平均误差为：{:.2f}，误差标准差为：{:.2f}'.format(model_name,np.mean(MODEL_Mean),np.mean(MODEL_Std)))
print('-----------------------------------------')

开始测试


/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/matplotlib/image.py:425: DeprecationWarning: np.asscalar(a) is deprecated since NumPy v1.16, use a.item() instead
  a_min = np.asscalar(a_min.astype(scaled_dtype))
/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/matplotlib/image.py:426: DeprecationWarning: np.asscalar(a) is deprecated since NumPy v1.16, use a.item() instead
  a_max = np.asscalar(a_max.astype(scaled_dtype))

真实位置： 182 预测位置： 189

真实位置： 222 预测位置： 233

真实位置： 134 预测位置： 141

真实位置： 347 预测位置： 353

真实位置： 369 预测位置： 346

真实位置： 202 预测位置： 207

真实位置： 214 预测位置： 217
真实位置： 337 预测位置： 343
第5个模型测试集平均定位误差为：8.50，定位误差标准差为：9.96
-----------------------------------------
模型unet五折交叉验证平均误差为：8.50，误差标准差为：9.96
-----------------------------------------

4 项目总结

L3锥体定位	正面视图	侧面视图
误差 mm	41	25
标准差 mm	120	67

结论：侧面视图的定位精度要优于正面视图

本项目基于Unet算法实现了锥体的自动定位，更加深入的探讨了模型应用场景。
该项目启发对深度学习对于影像特征不明显的任务（不同于肿瘤的影像学特征明显，锥体定位要人工数），深度学习也能起到效果。
本项目对比了CT数据正面视图及侧面视图的定位精度，其中预处理是自动定位不可忽略的操作。
本项探索了开源数据数据正面视图及侧面视图的定位实验，后续可以在该模型中进一步改进。

此文章为搬运
原项目链接

你可能感兴趣的:(人工智能,深度学习)

高通 QCS8550 大模型性能深度解析：从算力基准到场景实测的全维度 Benchmark 伊利丹~怒风 Qualcomm 人工智能 AI编程 python arm 自然语言处理
前言在人工智能技术狂飙突进的时代，大模型正以前所未有的速度重塑各行业生态，从智能客服到多模态交互，从边缘推理到端侧部署，其应用场景不断拓展。而这一切革新的背后，离不开底层硬件的强力支撑。高通QCS8550作为面向下一代智能设备的旗舰级计算平台，凭借高达48TOPS的AI算力与先进的第七代高通AI引擎，在大模型性能表现上极具竞争力。其异构多核架构不仅能高效处理复杂的神经网络计算，还通过软硬件协同优化
从零开始理解零样本学习：AI人工智能必学技术 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、人工智能、机器学习、知识迁移、语义嵌入摘要：本文旨在全面深入地介绍零样本学习这一在人工智能领域具有重要意义的技术。首先阐述零样本学习的背景和基本概念，通过详细的解释和直观的示意图让读者建立起对零样本学习的初步认识。接着深入剖析其核心算法原理，结合Python代码进行详细说明，同时引入相关数学模型和公式并举例阐释。通过项目实战部分，带领
卷积神经网络（Convolutional Neural Network, CNN）不想秃头的程序神经网络语音识别人工智能深度学习网络卷积神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专门用于处理图像、视频等网格数据的深度学习模型。它通过卷积层自动提取数据的特征，并利用空间共享权重和池化层减少参数量和计算复杂度，成为计算机视觉领域的核心技术。以下是CNN的详细介绍：一、核心思想CNN的核心目标是从图像中自动学习层次化特征，并通过空间共享权重和平移不变性减少参数量和计算成本。其关键组件包括：卷积层（
ResNet（Residual Network）不想秃头的程序神经网络语音识别人工智能深度学习网络残差网络神经网络
ResNet（ResidualNetwork）是深度学习中一种经典的卷积神经网络（CNN）架构，由微软研究院的KaimingHe等人在2015年提出。它通过引入残差连接（SkipConnection）解决了深度神经网络中的梯度消失问题，使得网络可以训练极深的模型（如上百层），并在图像分类、目标检测、语义分割等任务中取得了突破性成果。以下是ResNet的详细介绍：一、核心思想ResNet的核心创新是
P25：LSTM实现糖尿病探索与预测 ?Agony lstm 人工智能 rnn
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、相关技术1.LSTM基本概念LSTM（长短期记忆网络）是RNN（循环神经网络）的一种变体，它通过引入特殊的结构来解决传统RNN中的梯度消失和梯度爆炸问题，特别适合处理序列数据。结构组成：遗忘门：决定丢弃哪些信息，通过sigmoid函数输出0-1之间的值，表示保留或遗忘的程度。输入门：决定更新哪些信息，同样通过sigmoid函数控制更新
Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
[Python]-基础篇1- 从零开始的Python入门指南踏雪无痕老爷子 Python python 开发语言
无论你是尚未接触编程的新手，还是想从其他语言转向Python的开发者，这篇文章都是你的入门课。一、Python是什么？Python是一种解释型、高级、通用型编程语言，以简洁明了、简单易用着称。它可以应用于网站开发、自动化脚本、数据分析、人工智能、系统操作等多种场景。二、如何安装Python步骤：访问Python官方网站选择目前最新的Python3.x版本下载Windows用户请务必勾选“AddPy
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
潜入思维的海洋：SoftCoT++如何让语言模型更聪明步子哥智能涌现语言模型人工智能自然语言处理
在人工智能的浩瀚星空下，大型语言模型（LLMs）如同一颗颗璀璨的恒星，照亮了从文本生成到复杂推理的广阔领域。然而，这些模型在推理任务中往往像是在迷雾中航行——尽管它们能抵达目的地，却常常因为固定的思维路径而错过更优的航线。2025年5月，一篇题为《SoftCoT++:Test-TimeScalingwithSoftChain-of-ThoughtReasoning》的论文如同一盏明灯，照亮了如何让
BI+AI实战：我们如何用3秒完成车企供应链推演 qq_43696218 人工智能
一、BI+AI引领财务分析新纪元在财务数据分析领域，奥威BI+AI正以革命性的姿态颠覆传统。当金蝶、用友等工具仍深陷报表泥潭时，奥威BI+AI通过深度融合商业智能（BI）与人工智能（AI），实现了从滞后报表到实时洞察的飞跃。这不仅极大地提升了财务分析的效率，更为企业的战略决策提供了前所未有的精准支持。二、BI+AI的核心技术优势‌实时动态分析‌o奥威BI+AI摒弃了静态数据集，依托原始科目余额表实
DeepSeek-V3 通俗详解：从诞生到优势，以及与 GPT-4o 的对比码事漫谈 AI ai
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站1.DeepSeek的前世今生1.1什么是DeepSeek？DeepSeek是一家专注于人工智能技术研发的公司，致力于打造高性能、低成本的AI模型。它的目标是让AI技术更加普惠，让更多人能够用上强大的AI工具。1.2DeepSeek-V3的诞生DeepSeek-V3是DeepSeek公司推出的最新一代A
企业级AI开发利器：Spring AI框架深度解析与实战_spring ai实战 AI大模型-海文人工智能 spring python 算法开发语言 java 机器学习
企业级AI开发利器：SpringAI框架深度解析与实战一、前言：Java生态的AI新纪元在人工智能技术爆发式发展的今天，Java开发者面临着一个新的挑战：如何将大语言模型（LLMs）和生成式AI（GenAI）无缝融入企业级应用。传统的Java生态缺乏统一的AI集成方案，开发者往往需要为不同AI供应商（如OpenAI、阿里云、HuggingFace）编写大量重复的接口适配代码，这不仅增加了开发成本，
图扑软件智慧云展厅，开启数字化展馆新模式智慧园区可视化 5g 人工智能大数据安全云计算
随着疫情的影响以及新兴技术的不断发展，展会的发展形式也逐渐从线下转向线上。通过“云”上启动、云端互动、双线共频的形式开展。通过应用大数据、人工智能、沉浸式交互等多重技术手段，构建数据共享、信息互通、精准匹配的高精度“云展厅”，突破时空壁垒限制。图扑软件运用HT强大的渲染功能，数字孪生“云展位”，1:1复现实际展厅内部独特的结构造型和建筑特色。也可以第一人称视角漫游，模拟用户在展厅内的参观场景，在保
转行要趁早！网络安全行业人才缺口大，企业招聘需求正旺！
网络安全行业具有人才缺口大、岗位选择多、薪资待遇好、学历要求不高等优势，对于想要转行的人员来说，是一个非常不错的选择。人才缺口大网络安全攻防技术手段日新月异，特别是现在人工智能技术飞速发展，网络安全形势复杂严峻，人才重要性凸显。教育部《网络安全人才实战能力白皮书》数据显示，到2027年，我国网络安全人员缺口将达327万。近期发布的《2024年网络安全产业人才发展报告》中提到，沿用ISC2的人才缺口
【机器学习与数据挖掘实战 | 医疗】案例18：基于Apriori算法的中医证型关联规则分析 Francek Chen 机器学习与数据挖掘实战机器学习数据挖掘 Apriori python 关联规则人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈机器学习与数据挖掘实战⌋⌋⌋机器学习是人工智能的一个分支，专注于让计算机系统通过数据学习和改进。它利用统计和计算方法，使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联和异常的过程，旨在提取有价值的信息和知识。机器学习为数据挖掘提供了强大的分析工具，而数据挖掘则是机器学习应用的重要领域，两者相辅相成，共同推动
【Python深度学习】零基础掌握Pytorch Pooling layers nn.MaxPool方法 Mr数据杨 Python 深度学习 python 深度学习 pytorch
在深度学习的世界中，MaxPooling是一种关键的操作，用于降低数据的维度并保留重要特征。这就像是从一堆照片中挑选出最能代表某个场景的那张。PyTorch提供了多种MaxPooling层，包括nn.MaxPool1d、nn.MaxPool2d和nn.MaxPool3d，它们分别适用于不同维度的数据处理。如果处理的是声音信号（一维数据），就会用到nn.MaxPool1d。而处理图像（二维数据）时，
误差的回响：反向传播算法与神经网络的惊天逆转田园Coder 人工智能科普人工智能科普
当专家系统在20世纪80年代初期大放异彩，成为人工智能实用化的耀眼明星时，另一股曾经被宣判“死刑”的力量——连接主义（神经网络）——正在寒冬的冻土下悄然涌动，孕育着一场惊天动地的复苏。马文·明斯基和西摩·帕尔特在1969年《感知机》专著中那精准而冷酷的理论批判，如同沉重的封印，将多层神经网络的研究禁锢了近二十年。他们指出的核心死结——缺乏有效算法来训练具有隐藏层的网络——仿佛一道无法逾越的天堑。单
【Html实现“心形日出”（附效果+源代码）】| JavaScript面试题：解释一下异步编程中的回调函数、Promise和Async/Await的概念。它们有什么区别？追光者♂ html5 css3 心形日出前端特效 JS面试题 Promise Async/Await
风会带走你曾经存在过的证明。——虞姬作者主页：追光者♂个人简介：[1]计算机专业硕士研究生[2]2023年城市之星领跑者TOP1(哈尔滨)[3]2022年度博客之星人工智能领域TOP4[4]阿里云社区特邀专家博主[5]CSDN-人工智能领域优质创作者无限进步，一起追光！！！
阅读笔记(2) 单层网络:回归 a2507283885 笔记
阅读笔记(2)单层网络:回归该笔记是DataWhale组队学习计划（共度AI新圣经：深度学习基础与概念）的Task02以下内容为个人理解，可能存在不准确或疏漏之处，请以教材为主。1.从泛函视角来看线性回归还记得线性代数里学过的“基”这个概念吗？一组基向量是一组线性无关的向量，它们通过线性组合可以张成一个向量空间。也就是说，这个空间里的任意一个向量，都可以表示成这组基的线性组合。函数其实也可以看作是
青少年编程与数学 01-012 通用应用软件简介 15 人工智能助手明月看潮生编程与数学第01阶段青少年编程人工智能应用软件编程与数学
青少年编程与数学01-012通用应用软件简介15人工智能助手一、什么是人工智能助手二、人工智能助手的产生和发展（一）早期探索阶段（二）技术突破阶段（三）广泛应用阶段三、人工智能助手的主要功能（一）信息查询（二）日程管理（三）设备控制（四）知识问答四、人工智能助手的商业模式（一）广告收入（二）增值服务（三）数据服务（四）硬件销售五、DeepSeek（一）基本情况（二）技术水平（三）产品功能（四）市场
虚拟空间中的AI协作与任务 AI天才研究院 ChatGPT AI大模型企业级应用开发实战 AI人工智能与大数据大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
虚拟空间与AI概述在当今信息化和数字化的时代，虚拟空间（VirtualSpace）已成为人们生活和工作的重要一部分。虚拟空间是一种通过计算机技术构建的虚拟环境，它能够模拟和增强现实世界中的各种交互和体验。而人工智能（AI）作为计算机科学的一个分支，通过模拟人类的认知能力来实现自动化和智能化的决策。虚拟空间与AI的结合，不仅为人类带来了全新的交互方式，也为各行业的发展注入了强大的动力。虚拟空间的定义
AI Agent: AI的下一个风口智能体在元宇宙里的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AIAgent:AI的下一个风口智能体在元宇宙里的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AIAgent,元宇宙,虚拟角色,智能交互,人工智能,虚拟世界,智能体架构,交互式应用1.背景介绍1.1问题的由来随着虚拟现实(VR)、增强现实(AR)和区块链技术的不断发展，元宇宙(Metaverse)的概念逐渐兴起。元宇宙是一个由虚拟世界
攻击者利用热门AI发动黑帽SEO攻击，通过污染搜索结果传播窃密木马 FreeBuf- 人工智能
伪装成AI主题网站的恶意页面|图片来源：ZscalerZscaler威胁实验室研究人员发现一起精心策划的恶意软件攻击活动，攻击者利用ChatGPT和LumaAI等人工智能(AI)工具的热度，通过黑帽SEO（搜索引擎优化）技术劫持搜索引擎结果，诱导用户落入恶意软件陷阱。Zscaler警告称："这些攻击背后的威胁行为者正在利用ChatGPT和LumaAI等AI工具的热度。"这些欺诈活动至少从2025年
Python/Java/Php/C#/Go/C/C++这几个主力语言，谁到底真的不行 dotNET跨平台 java c#开发语言
1.前言阿里最近又进行了史诗级的大裁员，IT行业肉眼可见的持续性衰退与没落。当潮水退却，才能看出谁在裸泳。作为当今计算机编程界的几大主力语言，谁才真正的裸泳者呢？2.描述1.Python:Python作为一款解释性的动态语言，它很早就诞生了。它的第一个发行版1991年出世，比Java还要早四年。可惜命运不济，一直没有大的作为。到了2014年人工智能的风口悄然兴起，Python一路高歌猛进。到了20
【深度学习解惑】如果用RNN实现情感分析或文本分类，你会如何设计数据输入？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 分类人工智能机器学习神经网络
以下是用RNN实现情感分析/文本分类时数据输入设计的完整技术方案：1.引言与背景介绍情感分析/文本分类是NLP的核心任务，目标是将文本映射到预定义类别（如正面/负面情感）。RNN因其处理序列数据的天然优势成为主流方案。核心挑战在于如何将非结构化的文本数据转换为适合RNN处理的数值化序列输入。2.原理解释文本到向量的转换流程：原始文本分词建立词汇表词索引映射词嵌入层序列向量关键数学表示：词嵌入表示：
Pytorch模型安卓部署 python&java pytorch 人工智能 python
Pytorch是一种流行的深度学习框架，用于算法开发，而Android是一种广泛应用的操作系统，多应用于移动设备当中。目前多数的研究都是在于算法上，个人觉得把算法落地是一件很有意思的事情，因此本人准备分享一些模型落地的文章(后续可能分享微信小程序部署，PyQt部署以及exe打包，ncnn部署，tensorRT部署，MNN部署)。本篇文章主要分享Pytorch的Android端部署。看这篇文章的读者
人工智能-基础篇-5-建模方式（判别式模型和生成式模型）
机器学习包括了多种建模方式，其中判别式建模（DiscriminativeModel）和生成式建模是最常见的两种。这两种建模方式都可以通过深度学习技术来实现，并用于创建不同类型的模型。简单来说：想要创建一个模型，依赖需求需要合适的建模方式来创建这个模型。通常建模方式主要分为两大类。一类是判别式模型，针对输入数据给出特定的输出。如：判断一张图片是猫还是狗，直接学习“猫”和“狗”的特征差异（如耳朵形状、
PyTorch教程：LSTM语言模型的动态量化技术解析怀灏其Prudent
PyTorch教程：LSTM语言模型的动态量化技术解析tutorialsPyTorchtutorials.项目地址:https://gitcode.com/gh_mirrors/tuto/tutorials前言在深度学习模型部署过程中，模型大小和推理速度是两个至关重要的考量因素。PyTorch提供的动态量化技术能够在不显著影响模型准确率的前提下，有效减小模型体积并提升推理速度。本文将深入解析如何对
【机器学习】数学基础——张量（傻瓜篇）一叶千舟深度学习【理论】机器学习人工智能
目录前言一、张量的定义1.标量（0维张量）2.向量（1维张量）3.矩阵（2维张量）4.高阶张量（≥3维张量）二、张量的数学表示2.1张量表示法示例三、张量的运算3.1常见张量运算四、张量在深度学习中的应用4.1PyTorch示例：张量在神经网络中的运用五、总结：张量的多维世界延伸阅读前言在机器学习、深度学习以及物理学中，张量是一个至关重要的概念。无论是在人工智能领域的神经网络中，还是在高等数学、物
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa