AI Studio

UNet地表建筑物识别-手动实现跟我学

此文章为搬运
原项目链接

【AI达人特训营第二期】UNet地表建筑物识别

1.项目介绍

目标：需要利用航拍影像数据完成地表建筑物识别，将地表航拍图像素划分为有建筑物和无建筑物两类。实例图片如下：

用途：通过航拍影像数据，可以监测全国各地，特别是风景区、水资源保护区、耕地区域等建筑物变迁、规划等，本项目对于监管部分具有重要的辅助作用。

难点：地表建筑物识别是分类还是检测问题？选择使用什么模型？

初衷：为什么不选择PaddleSeg or PaddleRS，对于新手来说，难度较大。难以理解参数怎么设置，为什么这么设置。背后是怎么实现的？射雕英雄传中洪七公教郭靖降龙十八掌，看起来就是很普通的一掌。但是其中千变万化，对于新手还是太难理解了。PaddleSeg就有点这意思。

2.数据分析

(1)数据集来源

本数据集使用航拍数据（Inria Aerial Image Labeling），链接为https://aistudio.baidu.com/aistudio/datasetdetail/177948

(2)数据集移动与解压缩

# 重命名，移动
!unzip -oq -d /home/aistudio/data/data177948/ /home/aistudio/data/data177948/地表建筑物识别.zip
!mv /home/aistudio/data/data177948/地表建筑物识别 /home/aistudio/data/data177948/dataset
# 解压数据集
!unzip -oq -d /home/aistudio/data/data177948/dataset/ /home/aistudio/data/data177948/dataset/train.zip
!unzip -oq -d /home/aistudio/data/data177948/dataset/ /home/aistudio/data/data177948/dataset/train_mask.csv.zip
!unzip -oq -d /home/aistudio/data/data177948/dataset/ /home/aistudio/data/data177948/dataset/test_a.zip

(3)数据集概况

数据集包括训练集和测试集。其中训练集中有30000张图像，带标签的图像有24796张。下面的模型就是基于这样带标签的图像训练出来的。注意：利用训练集中的全部数据训练时，会出现“Found inf or nan, current scale is: 0.0, decrease to: 0.0*0.5”类似的提示。

测试集有2500张图像，其中的标签没有提供，即没有mask。因此根据测试集无法得出评价指标。（利用pandas读取train_mask.csv文件后，发现数据表中没有列名字，因此在下面read_csv()函数中写了names=[‘name’, ‘mask’]的参数，作用就是给数据表两列起名字。）获取数据集数量的代码如下：

import pandas as pd
import os

data_path = "/home/aistudio/data/data177948/dataset/"
df = pd.read_csv(os.path.join(data_path,'train_mask.csv'), sep='\t', names=['name', 'mask'])
# 原训练集中图像数量
print(len(df))
# 删除无标签数据后训练集的图像数量
df2=df.dropna()
print(len(df2))
# 测试集中图像数量
df3 = pd.read_csv(os.path.join(data_path,'test_a_samplesubmit.csv'), sep='\t', names=['name', 'mask'])
print(len(df3))

由于直接在原始训练集删除无标签数据的工作量比较大，因此考虑直接对train_mask.csv进行处理，删除mask为Nan的记录。在train_mask.csv`中删除无标签数据的代码如下：

import pandas as pd
import os

data_path = "/home/aistudio/data/data177948/dataset/"
df = pd.read_csv(os.path.join(data_path,'train_mask.csv'), sep='\t', names=['name', 'mask'])

df = df.dropna() # 删除无标签的记录（删除行）

df = df.reset_index(drop=True) # 删除行之后df中的记录下标不连续，要重置下标

如果不修改train_mask.csv文件，直接在训练集中删除无标签图像的代码如下：

import pandas as pd
import os
import pdb
data_path = "/home/aistudio/data/data177948/dataset/"

df = pd.read_csv(os.path.join(data_path,'train_mask.csv'), sep='\t', names=['name', 'mask'])
# print(len(df))
# print(df.shape[0])
# print(df.shape[1])
df.head()
total = 0
for idx in range(len(df)):
    df['mask'] = df['mask'].fillna('') # .fillna(): 填充NaN的值为空
    # rle mask length
    df['rle_len'] = df['mask'].map(len) # .map(): 特定列中的每一个元素应用一个函数len
    # image/mask path
    df['image_path'] = df['name'].apply(lambda x: os.path.join(data_path, 'train', str(x))) 
    # empty mask
    df['empty'] = (df.rle_len==0)
    img_paths = df['image_path'].tolist() # image

    if df['empty'].iloc[idx]:
        if df.iloc[idx]['name'] in img_paths[idx]:
            os.remove(img_paths[idx])
            total += 1
            print('image--%d--deleted successfully, total=%d'%(idx,total))

(4)图像文件名获取

前面的数据分析可知，从train_mask.csv文件中读取的数据有两列（图像名字name、图像mask)，但是没有给出图像的路径。因此，需要自己写出图像的路径，代码如下：

df['image_path'] = df['name'].apply(lambda x: os.path.join(data_path, 'train', str(x)))

(5)训练集划分

由于训练集的图像数量不多，本项目采用交叉验证方法将原始训练数据分割为训练集和验证集，完成模型的训练。代码如下：

kf = KFold(n_splits=CFG.n_fold, shuffle=True, random_state=CFG.seed)
# 初始化，在df数据表中创建名字为fold的列
df.loc[:,'fold'] = -1
# 将df中数据利用fold进行标志
for fold, (train_idx, val_idx) in enumerate(kf.split(X=df)):
    df.loc[val_idx, 'fold'] = fold

(6)图像读取与显示

利用opencv读取图像，代码如下：

# 读取第1张图片
img = cv2.imread('/home/aistudio/data/data177948/dataset/train/'+ df['name'].iloc[0])
# opencv读取的图像的通道顺序是BGR,用cv2.cvtColor()转换成RGB
img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB)
# 读取之后，显示图像，代码如下：
plt.figure(figsize=(9,9))
plt.imshow(img)
plt.show()

(6)mask读取、显示

由于train_mask.csv中提供的mask是rle编码，需要将rle编码转换为图像（rle是行程长度编码）。编码、解码、显示代码如下：

# 1.将图片编码为rle格式
def rle_encode(im):
    '''
    im: numpy array, 1 - mask, 0 - background
    Returns run length as string formated
    '''
    pixels = im.flatten(order = 'F')
    pixels = np.concatenate([[0], pixels, [0]])
    runs = np.where(pixels[1:] != pixels[:-1])[0] + 1
    runs[1::2] -= runs[::2]
    return ' '.join(str(x) for x in runs)

# 2.将rle格式进行解码为图片
def rle_decode(mask_rle, shape=(512, 512)):
    '''
    mask_rle: run-length as string formated (start length)
    shape: (height,width) of array to return 
    Returns numpy array, 1 - mask, 0 - background
    '''
    s = mask_rle.split()
    starts, lengths = [np.asarray(x, dtype=int) for x in (s[0:][::2], s[1:][::2])]
    starts -= 1
    ends = starts + lengths
    img = np.zeros(shape[0]*shape[1], dtype=np.uint8)
    for lo, hi in zip(starts, ends):
        img[lo:hi] = 1
    return img.reshape(shape, order='F')

# 3.调用rle_decode()函数可以得到mask的图像，代码如下：
mask = rle_decode(df['mask'].iloc[1])
mask2 = np.array(mask) # 将mask转换为矩阵，mask为单通道
masks = np.stack((mask2,mask2,mask2), axis=2).astype('float32') # 将mask叠加为三通道，[h, w, c]

# 4.mask的显示代码如下：
plt.figure(figsize=(15,10))
plt.imshow(mask)
plt.show()

3.问题分析与模型搭建

本项目的任务是判断一幅图像中是否存在建筑物。从整体上判断一幅图像中是否存在建筑物，这是个识别问题。一种思路将整幅图像作为一个特征进行分类，很显然难度是比较大的。结合标签的特点，可以把整幅图像的分类转换为单个像素的分类。即一幅图像中像素的二分类问题。判断一幅图像中某个像素点是否建筑的构成部分，分别用1和0表示。

对于二分类问题，loss函数选择二值交叉熵损失函数。更多的知识可以百度下。

像素级别的二分类问题在计算机视觉领域中称为图像分割，准确的来说，属于语义分割，属于同一类的像素都要被归为一类，即从像素级别来理解图像。本项目采用经典的U-Net网络完成模型搭建，U-Net网络代码如下（值得注意的是U-Net最后一层的输出并没有经过激活函数）：

######################################
### U-Net ###
######################################
class Encoder(nn.Layer):#下采样：两层卷积，两层归一化，最后池化。
    def __init__(self, num_channels, num_filters):
        super(Encoder,self).__init__()#继承父类的初始化
        self.conv1 = nn.Conv2D(in_channels=num_channels,
                              out_channels=num_filters,
                              kernel_size=3,#3x3卷积核，步长为1，填充为1，不改变图片尺寸[H W]
                              stride=1,
                              padding=1)
        self.bn1   = nn.BatchNorm(num_filters,act="relu")#归一化，并使用了激活函数
        
        self.conv2 = nn.Conv2D(in_channels=num_filters,
                              out_channels=num_filters,
                              kernel_size=3,
                              stride=1,
                              padding=1)
        self.bn2   = nn.BatchNorm(num_filters,act="relu")
        
        self.pool  = nn.MaxPool2D(kernel_size=2,stride=2,padding="SAME")#池化层，图片尺寸减半[H/2 W/2]
        
    def forward(self,inputs):
        x = self.conv1(inputs)
        x = self.bn1(x)
        x = self.conv2(x)
        x = self.bn2(x)
        x_conv = x           #两个输出，灰色 ->
        x_pool = self.pool(x)#两个输出，红色 | 
        return x_conv, x_pool
      
class Decoder(nn.Layer):#上采样：一层反卷积，两层卷积层，两层归一化
    def __init__(self, num_channels, num_filters):
        super(Decoder,self).__init__()
        self.up = nn.Conv2DTranspose(in_channels=num_channels,
                                    out_channels=num_filters,
                                    kernel_size=2,
                                    stride=2,
                                    padding=0)#图片尺寸变大一倍[2*H 2*W]

        self.conv1 = nn.Conv2D(in_channels=num_filters*2,
                              out_channels=num_filters,
                              kernel_size=3,
                              stride=1,
                              padding=1)
        self.bn1   = nn.BatchNorm(num_filters,act="relu")
        
        self.conv2 = nn.Conv2D(in_channels=num_filters,
                              out_channels=num_filters,
                              kernel_size=3,
                              stride=1,
                              padding=1)
        self.bn2   = nn.BatchNorm(num_filters,act="relu")
        
    def forward(self,input_conv,input_pool):
        x = self.up(input_pool)
        h_diff = (input_conv.shape[2]-x.shape[2])
        w_diff = (input_conv.shape[3]-x.shape[3])
        pad = nn.Pad2D(padding=[h_diff//2, h_diff-h_diff//2, w_diff//2, w_diff-w_diff//2])
        x = pad(x)                                #以下采样保存的feature map为基准，填充上采样的feature map尺寸
        x = paddle.concat(x=[input_conv,x],axis=1)#考虑上下文信息，in_channels扩大两倍
        x = self.conv1(x)
        x = self.bn1(x)
        x = self.conv2(x)
        x = self.bn2(x)
        return x
    
class UNet(nn.Layer):
    def __init__(self,num_classes=59):
        super(UNet,self).__init__()
        self.down1 = Encoder(num_channels=  3, num_filters=64) #下采样
        self.down2 = Encoder(num_channels= 64, num_filters=128)
        self.down3 = Encoder(num_channels=128, num_filters=256)
        self.down4 = Encoder(num_channels=256, num_filters=512)
        
        self.mid_conv1 = nn.Conv2D(512,1024,1)                 #中间层
        self.mid_bn1   = nn.BatchNorm(1024,act="relu")
        self.mid_conv2 = nn.Conv2D(1024,1024,1)
        self.mid_bn2   = nn.BatchNorm(1024,act="relu")

        self.up4 = Decoder(1024,512)                           #上采样
        self.up3 = Decoder(512,256)
        self.up2 = Decoder(256,128)
        self.up1 = Decoder(128,64)
        
        self.last_conv = nn.Conv2D(64,num_classes,1)           #1x1卷积，softmax做分类
        
    def forward(self,inputs):
        x1, x = self.down1(inputs)
        x2, x = self.down2(x)
        x3, x = self.down3(x)
        x4, x = self.down4(x)
        
        x = self.mid_conv1(x)
        x = self.mid_bn1(x)
        x = self.mid_conv2(x)
        x = self.mid_bn2(x)
        
        x = self.up4(x4, x)
        x = self.up3(x3, x)
        x = self.up2(x2, x)
        x = self.up1(x1, x)
        
        x = self.last_conv(x)
        
        return x

4.评估指标

本项目使用Dice coefficient来衡量选手结果与真实标签的差异性，Dice coefficient可以按像素差异性来比较结果的差异性。Dice coefficient的具体计算方式如下：

$\frac{2 * |X \cap Y|}{|X| + |Y|}$

其中X是预测结果，Y为真实标签的结果。当X与Y完全相同时Dice coefficient为1，排行榜使用所有测试集图片的平均Dice coefficient来衡量，分数值越大越好。

5.模型训练

(1)知识准备

GPU使用

import paddle
# 获取GPU
device = paddle.device.get_device()
print(device)
# 设置GPU
device = paddle.device.set_device()
print(device)

额外安装的包

PaddleSeg，作用：使用PaddleSeg的DiceLoss函数（注意：在后面的训练本项目写了DiceLoss的代码，但是实际上并没有计算DiceLoss，也就是说本项目中没有使用PaddleSeg）。PaddleSeg需要自己先下载，然后上传后加压缩安装，代码如下：

# 解压缩，重命名
!unzip -o -d /home/aistudio/ /home/aistudio/PaddleSeg-release-2.6.zip > /dev/null
!mv /home/aistudio/PaddleSeg-release-2.6 /home/aistudio/PaddleSeg
# 安装
!pip install -e /home/aistudio/PaddleSeg > /dev/null

#更新sys.path，代码如下：

# 因为`sys.path`可能没有及时更新，这里选择手动加载
import sys
sys.path.append('/home/aistudio/PaddleSeg')

skimage，作用：调用color.label2rgb()函数，显示图像时用

(2)完整训练过程

###############################3
# 加载各种包
# 常规包，不需要额外安装
import sys
sys.path.append('/home/aistudio/PaddleSeg')
import os
import pdb
import random
import numpy as np
import pandas as pd
from sklearn.model_selection import KFold # Sklearn
import time
import cv2
from tqdm import tqdm
%matplotlib inline
from matplotlib import pyplot as plt
from skimage import color#label2rgb
# paddle相关包，不需要额外安装
import paddle
from paddle.io import Dataset
from paddle.io import DataLoader
from paddle import nn
from paddle.vision import transforms as A
# paddleSeg包
import paddleseg
#####################################
# 设置随机种子，保证训练结果可重复

#random.seed(SEED)
#np.random.seed(SEED)
#paddle.seed(SEED)
def set_seed(seed=42):
    ##### why 42? The Answer to the Ultimate Question of Life, the Universe, and Everything is 42.
    random.seed(seed) # python
    np.random.seed(seed) # numpy
    paddle.seed # pytorch

# mask转换为图片或图片转换为mask

# 将图片编码为rle格式
def rle_encode(im):
    '''
    im: numpy array, 1 - mask, 0 - background
    Returns run length as string formated
    '''
    pixels = im.flatten(order = 'F')
    pixels = np.concatenate([[0], pixels, [0]])
    runs = np.where(pixels[1:] != pixels[:-1])[0] + 1
    runs[1::2] -= runs[::2]
    return ' '.join(str(x) for x in runs)

# 将rle格式进行解码为图片
def rle_decode(mask_rle, shape=(512, 512)):
    '''
    mask_rle: run-length as string formated (start length)
    shape: (height,width) of array to return 
    Returns numpy array, 1 - mask, 0 - background
    '''
    s = mask_rle.split()
    starts, lengths = [np.asarray(x, dtype=int) for x in (s[0:][::2], s[1:][::2])]
    starts -= 1
    ends = starts + lengths
    img = np.zeros(shape[0]*shape[1], dtype=np.uint8)
    for lo, hi in zip(starts, ends):
        img[lo:hi] = 1
    return img.reshape(shape, order='F')

# 数据变换：本项目中没有使用数据变换，除了Resize操作。

def build_transforms(CFG):
    data_transforms = {
        "train": A.Compose([
            A.Resize((CFG.img_size,CFG.img_size)), #把数据长宽像素调成224*224
            #ColorJitter(0.4, 0.4, 0.4, 0.4),
            #A.RandomHorizontalFlip(0.5),
            #A.RandomRotation((-5,5)),        
            #A.Normalize(mean=[127.5, 127.5, 127.5], std=[127.5, 127.5, 127.5], data_format='HWC'), #标准化
            #A.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225], data_format='HWC') #标准化
            #Transpose(), #原始数据形状维度是HWC格式，经过Transpose，转换为CHW格式
            ]),     
        "valid_test": A.Compose([
            #A.Normalize(mean=[127.5, 127.5, 127.5], std=[127.5, 127.5, 127.5], data_format='HWC')
            #A.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225], data_format='HWC') #标准化
            A.Resize((CFG.img_size,CFG.img_size)), #把数据长宽像素调成224*224
            ])
        }
    return data_transforms

# 数据读取

class build_dataset(Dataset):
    def __init__(self, df, label=True, transforms=None):
        self.df = df
        self.label = label
        self.img_paths = df['image_path'].tolist() # image
        self.masks = df['mask'].tolist()
        #self.ids = df['id'].tolist()

        # if 'mask_path' in df.columns:
        #     self.mask_paths  = df['mask_path'].tolist() # mask
        # else:
        #     self.mask_paths = None

        self.transforms = transforms

    def __len__(self):
        return len(self.df)
    
    def __getitem__(self, index):
        #pdb.set_trace()
        #### load id
        #id       = self.ids[index]
        #### load image
        img_path  = self.img_paths[index]
        
        image = cv2.cvtColor(cv2.imread(img_path), cv2.COLOR_BGR2RGB).astype(np.float32)/255
        #image = cv2.resize(image, (CFG.img_size, CFG.img_size),interpolation=cv2.INTER_LINEAR)
        #mask  = cv2.resize(mask, dsize=(CFG.img_size, CFG.img_size),interpolation=cv2.INTER_LINEAR)
        
        if self.label: # train
            #### load mask
            mask = self.masks[index]  # self.df['mask'].iloc[index]
            mask = rle_decode(mask)
            mask = np.array(mask).astype('float32')
            
            if self.transforms:
                image = self.transforms(image)
                mask = self.transforms(mask)
                #image, mask = self.transforms(image, mask)
            #pdb.set_trace()
            image = np.transpose(image, (2, 0, 1)) # [h, w, c] => [c, h, w]
            mask = mask.reshape((CFG.img_size, CFG.img_size, 1))
            mask = np.transpose(mask, (2, 0, 1)) # [h, w, c] => [c, h, w]
            return paddle.to_tensor(image), paddle.to_tensor(mask)
        else:  # test
            ### augmentations
            if self.transforms:
                image = self.transforms(image)
            image = np.transpose(image, (2, 0, 1)) # [h, w, c] => [c, h, w]
            return paddle.to_tensor(image)       

def build_dataloader(df, fold, data_transforms, CFG):
    train_df = df.query("fold!=@fold").reset_index(drop=True)
    valid_df = df.query("fold==@fold").reset_index(drop=True)
    #pdb.set_trace()
    train_dataset = build_dataset(train_df, label=True, transforms=data_transforms['train'])
    valid_dataset = build_dataset(valid_df, label=True, transforms=data_transforms['valid_test'])
    train_loader = DataLoader(train_dataset, batch_size=CFG.train_bs, num_workers=CFG.num_worker, 
                              shuffle=True, use_shared_memory=False, drop_last=False)
    valid_loader = DataLoader(valid_dataset, batch_size=CFG.valid_bs, num_workers=CFG.num_worker, 
                              shuffle=False, use_shared_memory=False)
    return train_loader, valid_loader

# 构建模型

######################################
### model ###
######################################
class Encoder(nn.Layer):#下采样：两层卷积，两层归一化，最后池化。
    def __init__(self, num_channels, num_filters):
        super(Encoder,self).__init__()#继承父类的初始化
        self.conv1 = nn.Conv2D(in_channels=num_channels,
                              out_channels=num_filters,
                              kernel_size=3,#3x3卷积核，步长为1，填充为1，不改变图片尺寸[H W]
                              stride=1,
                              padding=1)
        self.bn1   = nn.BatchNorm(num_filters,act="relu")#归一化，并使用了激活函数
        
        self.conv2 = nn.Conv2D(in_channels=num_filters,
                              out_channels=num_filters,
                              kernel_size=3,
                              stride=1,
                              padding=1)
        self.bn2   = nn.BatchNorm(num_filters,act="relu")
        
        self.pool  = nn.MaxPool2D(kernel_size=2,stride=2,padding="SAME")#池化层，图片尺寸减半[H/2 W/2]
        
    def forward(self,inputs):
        x = self.conv1(inputs)
        x = self.bn1(x)
        x = self.conv2(x)
        x = self.bn2(x)
        x_conv = x           #两个输出，灰色 ->
        x_pool = self.pool(x)#两个输出，红色 | 
        return x_conv, x_pool
    
    
class Decoder(nn.Layer):#上采样：一层反卷积，两层卷积层，两层归一化
    def __init__(self, num_channels, num_filters):
        super(Decoder,self).__init__()
        self.up = nn.Conv2DTranspose(in_channels=num_channels,
                                    out_channels=num_filters,
                                    kernel_size=2,
                                    stride=2,
                                    padding=0)#图片尺寸变大一倍[2*H 2*W]

        self.conv1 = nn.Conv2D(in_channels=num_filters*2,
                              out_channels=num_filters,
                              kernel_size=3,
                              stride=1,
                              padding=1)
        self.bn1   = nn.BatchNorm(num_filters,act="relu")
        
        self.conv2 = nn.Conv2D(in_channels=num_filters,
                              out_channels=num_filters,
                              kernel_size=3,
                              stride=1,
                              padding=1)
        self.bn2   = nn.BatchNorm(num_filters,act="relu")
        
    def forward(self,input_conv,input_pool):
        x = self.up(input_pool)
        h_diff = (input_conv.shape[2]-x.shape[2])
        w_diff = (input_conv.shape[3]-x.shape[3])
        pad = nn.Pad2D(padding=[h_diff//2, h_diff-h_diff//2, w_diff//2, w_diff-w_diff//2])
        x = pad(x)                                #以下采样保存的feature map为基准，填充上采样的feature map尺寸
        x = paddle.concat(x=[input_conv,x],axis=1)#考虑上下文信息，in_channels扩大两倍
        x = self.conv1(x)
        x = self.bn1(x)
        x = self.conv2(x)
        x = self.bn2(x)
        return x
    
class UNet(nn.Layer):
    def __init__(self,num_classes=59):
        super(UNet,self).__init__()
        self.down1 = Encoder(num_channels=  3, num_filters=64) #下采样
        self.down2 = Encoder(num_channels= 64, num_filters=128)
        self.down3 = Encoder(num_channels=128, num_filters=256)
        self.down4 = Encoder(num_channels=256, num_filters=512)
        
        self.mid_conv1 = nn.Conv2D(512,1024,1)                 #中间层
        self.mid_bn1   = nn.BatchNorm(1024,act="relu")
        self.mid_conv2 = nn.Conv2D(1024,1024,1)
        self.mid_bn2   = nn.BatchNorm(1024,act="relu")

        self.up4 = Decoder(1024,512)                           #上采样
        self.up3 = Decoder(512,256)
        self.up2 = Decoder(256,128)
        self.up1 = Decoder(128,64)
        
        self.last_conv = nn.Conv2D(64,num_classes,1)           #1x1卷积，softmax做分类
        
    def forward(self,inputs):
        x1, x = self.down1(inputs)
        x2, x = self.down2(x)
        x3, x = self.down3(x)
        x4, x = self.down4(x)
        
        x = self.mid_conv1(x)
        x = self.mid_bn1(x)
        x = self.mid_conv2(x)
        x = self.mid_bn2(x)
        
        x = self.up4(x4, x)
        x = self.up3(x3, x)
        x = self.up2(x2, x)
        x = self.up1(x1, x)
        
        x = self.last_conv(x)
        
        return x
def build_model(CFG, test_flag=False):
    if test_flag:
        pretrain_weights = None
    else:
        pretrain_weights = "imagenet"

    model = UNet(CFG.num_classes)

    #model.to(CFG.device)
    return model

# - 构建loss函数

def build_loss():
    BCELoss = paddle.nn.BCEWithLogitsLoss()
    DiceLoss    = paddleseg.models.losses.DiceLoss()
    return {"BCELoss":BCELoss, "DiceLoss":DiceLoss}

# - 构建评价指标

def dice_coef(y_true, y_pred, thr=0.5, dim=(2,3), epsilon=0.001):
    y_true = y_true.astype(np.float32)
    y_pred = (y_pred>thr).astype(np.float32)
    inter = paddle.sum((y_true*y_pred), axis=dim)
    den = paddle.sum(y_true, axis=dim) + paddle.sum(y_pred, axis=dim)
    dice = paddle.mean((2*inter+epsilon)/(den+epsilon), axis=(1,0))
    return dice

def iou_coef(y_true, y_pred, thr=0.5, dim=(2,3), epsilon=0.001):
    y_true = y_true.astype(np.float32)
    y_pred = (y_pred>thr).astype(np.float32)
    inter = paddle.sum((y_true*y_pred), axis=dim)
    union = paddle.sum((y_true + y_pred - y_true*y_pred), axis=dim)
    iou = paddle.mean((inter+epsilon)/(union+epsilon), axis=(1,0))
    return iou

# - 构建训练、验证与测试函数

def train_one_epoch(model, train_loader, optimizer, losses_dict, CFG, log, epoch):
    model.train()
    scaler = paddle.amp.GradScaler() 
    losses_all, bce_all, dice_all = 0, 0, 0
    log.write('---------epoch---%d---start----------' %epoch)
    log.write('\n')  
    pbar = tqdm(enumerate(train_loader), total=len(train_loader), desc='Train ')
    for _, (images, masks) in pbar:
        # batch: dict_keys(['index', 'id', 'organ', 'image', 'mask'])
        #optimizer.zero_grad()
        optimizer.clear_grad()
        #pdb.set_trace()
        with paddle.amp.auto_cast(enable=True):
            y_preds = model(images) # [b, c, w, h]
            # pdb.set_trace()
            # preds   = paddle.nn.Sigmoid()(y_preds)
            # pred = preds[0]
            # img = images[0]
            # mask = masks[0]
            # show_masked_img(img, pred, mask, title='')
            #visualizationShowFusion(images, y_preds, masks, "show", input_chennels=3, show=True)
            #pdb.set_trace()
            bce_loss = losses_dict["BCELoss"](y_preds, masks)
            # dice_loss = losses_dict["DiceLoss"](y_preds, masks)
            losses = bce_loss # + dice_loss
        
        scaler.scale(losses).backward()
        scaler.step(optimizer)
        scaler.update()
        
        losses_all += losses.item() / images.shape[0]
        bce_all += bce_loss.item() / images.shape[0]
        # dice_all += dice_loss.item() / images.shape[0]
        dice_all += 0
    #pdb.set_trace()
    current_lr = optimizer.get_lr()
    #current_lr = paddle.optimizer.get_lr()
    log.write('%0.5f  %d    | %+5.3f %5.3f |' % (\
                             current_lr, epoch, bce_all, dice_all))
    #log.write('\n')
    print("lr: {:.4f}".format(current_lr), flush=True)
    print("loss: {:.3f}, bce_all: {:.3f}, dice_all: {:.3f}".format(losses_all, bce_all, dice_all), flush=True)
@paddle.no_grad()
def valid_one_epoch(model, valid_loader, CFG, log):
    model.eval()
    val_scores = []
    # pdb.set_trace()
    pbar = tqdm(enumerate(valid_loader), total=len(valid_loader), desc='Valid ')
    for _, (images, masks) in pbar:
       
        y_preds = model(images) 
        y_preds   = paddle.nn.Sigmoid()(y_preds) # [b, c, w, h]
        
        # pred = y_preds[0]
        # img = images[0]
        # mask = masks[0]
        # show_masked_img(img, pred, mask, title='')
        val_dice = dice_coef(masks, y_preds).cpu().detach().numpy()
        val_jaccard = iou_coef(masks, y_preds).cpu().detach().numpy()
        val_scores.append([val_dice, val_jaccard])
        
    val_scores  = np.mean(val_scores, axis=0)
    val_dice, val_jaccard = val_scores
    #val_dice = val_scores[0].astype(np.float32)
    #val_jaccard = val_scores[1].astype(np.float32)
    log.write('| %+5.3f %5.3f |' % (val_dice[0], val_jaccard[0]))
    log.write('\n')
    print("val_dice: {:.4f}, val_jaccard: {:.4f}".format(val_dice[0], val_jaccard[0]), flush=True)
    
    return images, y_preds, masks, val_dice, val_jaccard

@paddle.no_grad()
def test_one_epoch(ckpt_paths, test_loader, CFG):
    pred_strings = []
    pred_ids = []
    pred_classes = []
    
    pbar = tqdm(enumerate(test_loader), total=len(test_loader), desc='Test: ')
    for _, (images) in pbar:

        size = images.shape
        masks = paddle.zeros((size[0], CFG.num_classes, size[2], size[3]), dtype=paddle.float32) # [b, c, w, h]
        ############################################
        ##### >>>>>>> cross validation infer <<<<<<
        ############################################
        for fold in range(0, CFG.fold):
            model = build_model(CFG, test_flag=True)
            optimizer = paddle.optimizer.AdamW(learning_rate=CFG.lr, parameters=model.parameters(), weight_decay=CFG.wd)#, apply_decay_param_fun=lambda x: x in CFG.decay_params)
            save_path_model = f"{CFG.ckpt_path}/best_fold_model{fold}.pdmodel"
            save_path_opt = f"{CFG.ckpt_path}/best_fold_opt{fold}.pdmodel"
            model.set_state_dict(paddle.load(save_path_model))
            optimizer.set_state_dict(paddle.load(save_path_opt))
            model.eval()
            y_preds = model(images) # [b, c, w, h]
            y_preds   = paddle.nn.Sigmoid()(y_preds) # [b, c, w, h]
            masks += y_preds/len(CFG.fold)
            
            val_dice_test = dice_coef(masks, y_preds)
            val_dice = dice_coef(masks, y_preds).cpu().detach().numpy()
            val_jaccard = iou_coef(masks, y_preds).cpu().detach().numpy()
        
        masks = (masks>CFG.thr).cpu().detach().numpy() # [n, c, h, w]

    return images, masks

# - 显示图像分割结果函数

def plot_img(img, pred, mask='', img_path='', label=True, title =''):
    if label:
        #rescalse mask to 0-1 range regardless of min and max value
        img = np.transpose(img, (1,2,0))
        pred = np.transpose(pred, (1,2,0))
        pred = (pred - pred.min())/(pred.max()-pred.min())
        pred = np.nan_to_num(pred)
        pred = paddle.to_tensor(pred)
        pred = paddle.round(pred)
        pred = pred.reshape(img.shape[:2])

        mask = np.transpose(mask, (1,2,0))
        mask = (mask - mask.min())/(mask.max()-mask.min())
        mask = np.nan_to_num(mask)
        mask = paddle.to_tensor(mask)
        mask = paddle.round(mask)
        mask = mask.reshape(img.shape[:2])
        
        fig, ax = plt.subplots(1, 5, figsize=(15, 3))
        fig.suptitle(title, fontsize=16)
        img, pred, mask = img.numpy(), pred.numpy(), mask.numpy()
        
        ax[0].imshow(mask); ax[0].set_title('Mask')
        ax[1].imshow(pred); ax[1].set_title('Pred')
        ax[2].imshow(img); ax[2].set_title('Image')
        ax[3].imshow(color.label2rgb(mask, img, bg_label=0, bg_color=(1.,1.,1.), alpha=0.25))
        ax[3].set_title('Masked Image')
        ax[4].imshow(color.label2rgb(pred, img, bg_label=0, bg_color=(1.,1.,1.), alpha=0.25))
        ax[4].set_title('Preded Image')
        plt.savefig(img_path, bbox_inches='tight')
        #plt.show()
    else:
        #rescalse mask to 0-1 range regardless of min and max value
        img = np.transpose(img, (1,2,0))
        pred = np.transpose(pred, (1,2,0))
        pred = (pred - pred.min())/(pred.max() - pred.min())
        pred = np.nan_to_num(pred)
        pred = paddle.to_tensor(pred)
        pred = paddle.round(pred)
        pred = pred.reshape(img.shape[:2])
      
        fig, ax = plt.subplots(1, 3, figsize=(9, 3))
        fig.suptitle(title, fontsize=16)
        img, pred = img.numpy(), pred.numpy()
        
        ax[0].imshow(pred); ax[0].set_title('Pred')
        ax[1].imshow(img); ax[1].set_title('Image')
        ax[2].imshow(color.label2rgb(pred, img, bg_label=0, bg_color=(1.,1.,1.), alpha=0.25))
        ax[2].set_title('Preded Image')
        plt.savefig(img_path, bbox_inches='tight')
        #plt.show()

# - 定义保存训练结果的类

class Logger(object):
    def __init__(self):
        self.terminal = sys.stdout  #stdout
        self.file = None

    def open(self, file, mode=None):
        if mode is None: mode ='w'
        self.file = open(file, mode)

    def write(self, message, is_terminal=1, is_file=1 ):
        if '\r' in message: is_file=0

        if is_terminal == 1:
            self.terminal.write(message)
            self.terminal.flush()
            #time.sleep(1)

        if is_file == 1:
            self.file.write(message)
            self.file.flush()

    def flush(self):
        # this flush method is needed for python 3 compatibility.
        # this handles the flush command by doing nothing.
        # you might want to specify some extra behavior here.
        pass

# - 主程序

if __name__ == '__main__':
    ###############################################################
    ##### >>>>>>> config <<<<<<
    ###############################################################
    class CFG:
        # step1: hyper-parameter
        seed = 42 
        device = paddle.device.set_device('gpu:0')
        num_worker = 0 # 0 if debug. 16 if train by "htop" check
        data_path = "/home/aistudio/data/data177948/dataset/"
        ckpt_path = "/home/aistudio/work/ckpt_nonan" # for submit
        # step2: data
        n_fold = 4
        img_size = 224
        train_bs = 4
        valid_bs = train_bs * 2

        # step3: model
        #backbone = 'resnet18'
        num_classes = 1
        # step4: optimizer
        epoch = 5
        lr = 1e-5 # learning_rate 
        wd = 1e-6  # weight_decay
        #lr_drop = 8
        # step5: infer
        thr = 0.3
        resume = False


    set_seed(CFG.seed)
    #pdb.set_trace()
    if not os.path.exists(CFG.ckpt_path):
        os.makedirs(CFG.ckpt_path)
    ########### 训练与验证阶段 
    train_val_flag = True
    if train_val_flag:
        ###############################################################
        ##### 第0步: 数据预处理
        ###############################################################
        df = pd.read_csv(os.path.join(CFG.data_path,'train_mask.csv'), sep='\t', names=['name', 'mask'])
        # print('before:%d'%len(df))
        df = df.dropna()
        df = df.reset_index(drop=True)
        df['image_path'] = df['name'].apply(lambda x: os.path.join(CFG.data_path, 'train', str(x))) 

        ###############################################################
        ##### 第1步：交叉验证训练设置
        ###############################################################
        kf = KFold(n_splits=CFG.n_fold, shuffle=True, random_state=CFG.seed)   
        df.loc[:,'fold'] = -1

        for fold, (train_idx, val_idx) in enumerate(kf.split(X=df)):
            df.loc[val_idx, 'fold'] = fold

        log = Logger()
        log.open(f"{CFG.ckpt_path}/log_train.txt",mode='a')
        ## start training here! ##############################################
        log.write('** start training here! **\n')
        log.write('                      |-------- -- VALID ----------|---- TRAIN/BATCH ---------\n')
        log.write('rate    epoch |    val_dice,   val_jaccard |     bce_loss,  dice_all, time          \n')
        log.write('---------------------------------- ------------------------------------------------------\n')
        
        start_fold = 0
        if CFG.resume:
            path_checkpoint = os.path.join(CFG.ckpt_path,'checkpoint.pth')
            checkpoint = torch.load(path_checkpoint)
            start_fold = checkpoint['fold']  # 返回到当前的fold。
        
        for fold in range(start_fold, CFG.n_fold):
            log.write('---------fold---%d------------' %fold) 
            ###############################################################
            ##### 第2步：获取数据、建立模型、优化器、损失函数
            ###############################################################
            #data_transforms = {'train':train_augment, 'valid_test': valid_augment}
            #pdb.set_trace()
            data_transforms = build_transforms(CFG) 
            train_loader, valid_loader = build_dataloader(df, fold, data_transforms, CFG) # dataset & dtaloader
            
            model = build_model(CFG) # model
            #scheduler = paddle.optimizer.lr.StepDecay(learning_rate=0.01, step_size=30, gamma=0.1, verbose=False)
            optimizer = paddle.optimizer.AdamW(learning_rate=CFG.lr, parameters=model.parameters(), weight_decay=CFG.wd)#, apply_decay_param_fun=lambda x: x in CFG.decay_params)
            #optimizer = paddle.optimizer.Adam(learning_rate=scheduler, parameters=model.parameters())
            losses_dict = build_loss() # loss
            
            start_epoch = 0
            if CFG.resume:
                # path_checkpoint = os.path.join(CFG.ckpt_path,'checkpoint.pth')
                # checkpoint = torch.load(path_checkpoint)
                # start_fold = checkpoint['fold'] - 1  # 返回到当前的fold。fold的起始下标为fold=start_fold+1。
                start_epoch = checkpoint['epoch'] + 1   # 返回下一个epoch下标。如果保存成功的话，说明当前的epoch的训练是没有问题的。
                model.set_dict(checkpoint['model'])
                optimizer.set_dict(checkpoint['optimizer'])
                
            best_val_dice = 0
            best_epoch = 0

            for epoch in range(start_epoch, CFG.epoch):
                start_time = time.time()
                ###############################################################
                ##### 第3步：训练和交叉验证
                ###############################################################
                train_one_epoch(model, train_loader, optimizer, losses_dict, CFG, log, epoch)
                #lr_scheduler.step()
                images, y_preds, masks, val_dice, val_jaccard = valid_one_epoch(model, valid_loader, CFG, log)
                
                ###############################################################
                ##### 第4步：保存模型参数
                ###############################################################
                is_best = (val_dice > best_val_dice)
                best_val_dice = max(best_val_dice, val_dice)
                if is_best:
                    save_path_model = f"{CFG.ckpt_path}/best_fold_model{fold}.pdmodel"
                    save_path_opt = f"{CFG.ckpt_path}/best_fold_opt{fold}.pdmodel"
                    save_path_checkpoint = f"{CFG.ckpt_path}/checkpoint.pdmodel"
                    checkpoint = {
                        'fold':fold,
                        'epoch':epoch,
                        'model':model.state_dict(),
                        'optimizer':optimizer.state_dict()}
                    if os.path.isfile(save_path_model):
                        os.remove(save_path_model)
                    if os.path.isfile(save_path_opt):
                        os.remove(save_path_opt) 
                    #保存模型的参数
                    paddle.save(model.state_dict(), save_path_model)
                    #保存优化器的参数
                    paddle.save(optimizer.state_dict(), save_path_opt)
                    #保存继续训练的模型和参数
                    paddle.save(checkpoint, save_path_checkpoint)
                # 在每个epoch中，显示最后一个batch的图像分割结果
                for idx in range(images.shape[0]):
                    img = images[idx]
                    pred = y_preds[idx]
                    mask = masks[idx]
                    img_path = f"{CFG.ckpt_path}/{fold}_{epoch}_{idx}.png"
                    plot_img(img, pred, mask, img_path, label=True, title='')
                
                epoch_time = time.time() - start_time
                
                log.write('%d  %5.3f %5.3f' % (\
                             epoch, epoch_time, best_val_dice[0]))
                log.write('\n')
                log.write('---------epoch---%d--- end----------' %epoch)  
                log.write('\n')
                print("epoch:{}, time:{:.2f}s, best:{:.2f}\n".format(epoch, epoch_time, best_val_dice[0]))
                
    ######## 测试阶段       
    test_flag = True
    if test_flag:
        set_seed(CFG.seed)
        ###############################################################
        ##### 第0步：数据预处理
        ###############################################################
        test_df = pd.read_csv(os.path.join(CFG.data_path,'test_a_samplesubmit.csv'), sep='\t', names=['name', 'mask'])
        test_df['image_path'] = test_df['name'].apply(lambda x: os.path.join(CFG.data_path, 'test_a', str(x))) 

        data_transforms = build_transforms(CFG)
        test_dataset = build_dataset(test_df, label=False, transforms=data_transforms['valid_test'], cfg=CFG)
        test_loader = DataLoader(test_dataset, batch_size=CFG.train_bs, num_workers=CFG.num_worker, shuffle=True, use_shared_memory=False, drop_last=False)
        ###############################################################
        ##### 第1步：推理
        ###############################################################
        images, y_preds = test_one_epoch(CFG.ckpt_path, test_loader, CFG)
        for idx in range(images.shape[0]):
            img = images[idx]
            pred = y_preds[idx]
            img_path = f"{CFG.ckpt_path}/test_{idx}.png"
            plot_img(img, pred, mask='', img_path=img_path, label=False, title='')

(3)训练结果

验证集的分割结果：

输出的Loss值和Dice系数：

** start training here! **
                      |-------- -- VALID ----------|---- TRAIN/BATCH ---------
rate    epoch |    val_dice,   val_jaccard |     bce_loss,  dice_all, time          
---------------------------------- ------------------------------------------------------
---------fold---0------------
W1209 10:17:34.537297  3759 gpu_resources.cc:61] Please NOTE: device: 0, GPU Compute Capability: 7.0, Driver API Version: 11.2, Runtime API Version: 11.2
W1209 10:17:34.542306  3759 gpu_resources.cc:91] device: 0, cuDNN Version: 8.2.
---------epoch---0---start----------
Train : 100%|██████████| 4650/4650 [06:04<00:00, 12.77it/s]
0.00001  0    | +428.851 0.000 |lr: 0.0000
loss: 428.851, bce_all: 428.851, dice_all: 0.000


Valid :   0%|          | 0/775 [00:00

【技术解密】本地部署 DeepSeek-V3：完整指南海棠AI实验室 “智元启示录“-AI发展的深度思考与未来展望人工智能深度学习 DeepSeek
目录引言运行环境需求下载与安装推理部署总结参考资源引言随着人工智能的快速发展，开源大模型正逐步改变着技术生态。DeepSeek-V3作为最新的开源大模型之一，不仅提供了强大的推理能力，同时也支持本地部署，使开发者可以灵活地进行自定义优化。本文将详细介绍如何在本地部署DeepSeek-V3，涵盖系统要求、安装步骤、模型转换及不同推理框架的应用。1.运行环境需求1.1硬件要求✅NVIDIAGPU（支持
人工智能伦理与可持续发展 CarlowZJ 人工智能
前言人工智能（AI）技术正在深刻地改变我们的生活和工作方式。从自动驾驶汽车到智能医疗系统，从个性化推荐到自动化决策，AI的应用无处不在。然而，随着技术的快速发展，其伦理和社会影响也引发了广泛的关注。人工智能伦理不仅涉及技术本身的公平性、透明性和安全性，还涉及到更广泛的社会、经济和环境影响。本文将探讨人工智能伦理的核心问题，并从可持续发展的角度提出应对策略。一、人工智能伦理的核心问题1.1数据隐私与
【python爬虫实战】——基于全国各城市快递网点的数据采集小L工程师 python爬虫实战爬虫网络爬虫 python selenium 开发语言数据分析数据可视化
一、项目背景随着电子商务的快速发展，快递行业成为了现代物流的重要组成部分。快递网点的分布和服务质量直接影响到用户的物流体验。为了更好地了解快递网点的分布情况、服务范围以及联系方式等信息，本项目通过爬虫技术从公开的快递信息网站上采集相关数据。‘>本文章中所有内容仅供学习交流使用，不用于其他任何目的，严禁用于商业用途和非法用途，否则由此产生的一切后果均与作者无关！二、项目目的和意义本项目的主要目的是通
学习Web3.0需要具备哪些基础知识？ alankuo 人工智能人工智能
学习Web3.0需要具备以下基础知识：一、计算机科学基础1.编程知识-了解至少一种编程语言，如Python、JavaScript等。这将有助于理解Web3.0应用程序的开发和智能合约的编写。-熟悉编程概念，如变量、数据类型、控制结构、函数等。2.数据结构和算法-掌握常见的数据结构，如数组、链表、栈、队列、树、图等，以及它们的操作和应用。-了解基本的算法，如排序、搜索、递归等，以及它们的时间和空间复
LLM-PowerHouse: 一站式大型语言模型定制训练与推理指南 Nifc666 语言模型人工智能自然语言处理 whisper langchain gpt 开源软件
LLM-PowerHouse:解锁大型语言模型的潜力在人工智能和自然语言处理领域,大型语言模型(LargeLanguageModels,LLMs)正在掀起一场革命。随着GPT、BERT等模型的出现,LLMs展现出了惊人的能力,可以执行各种复杂的语言任务。然而,如何有效地训练和使用这些强大的模型仍然是一个挑战。针对这一需求,GitHub上的LLM-PowerHouse项目应运而生,为开发者、研究人员
PyTorch中，将`DataLoader`加载的数据高效传输到GPU 大霸王龙 pytorch 人工智能 python
一、数据加载到GPU的核心步骤数据预处理与张量转换若原始数据为NumPy数组或Python列表，需先转换为PyTorch张量：X_tensor=torch.from_numpy(X).float()#转换为浮点张量y_tensor=torch.from_numpy(y).long()#分类任务常用长整型显式指定设备：通过.to(device)将数据移至GPU（需提前定义device对象）：devi
【sklearn 01】人工智能概述 @金色海岸人工智能 sklearn python
一、人工智能，机器学习，深度学习人工智能指由人类制造出的具有智能的机器。这是一个非常大的范围，长远目标是让机器实现人工智能，但目前我们仍处在非常初始的阶段，甚至不能称为智能机器学习是指通过数据训练出能完成一定功能的模型，是实现人工智能的手段之一，也是目前最主流的人工智能实现方法深度学习则是机器学习的分支，超过8层的神经网络模型就叫深度学习，深度即层数。深度学习目前在语音、图像等领域取得很好的效果
cmd运行python脚本找不到包_命令行执行python模块时提示包找不到的问题 weixin_39788960
庄稼人不是专职python开发的道友，虽然与python相识已多年，可惜相识不相知，只是偶尔借助pydev写一些简单的小工具。多年来，一直困惑于这样一个问题：同样的工程，同样的代码，使用pydev可以运行任意一个python脚本，而使用命令行运行却不行？命令行下(或者双击执行)总是提示“ImportError:Nomodulenamedxxx”？pydev究竟做了什么魔术呢？长话短说，以上面工程为
Python报错：moduleNotFoundError:No module named ‘exceptions‘ 南浔Pyer 报错解决 Python编程
报错如下：使用pipinstalldocx安装模块docx后，发现不能正常使用，并报错：fromexceptionsimportPendingDeprecationWarningModuleNotFoundError:Nomodulenamed'exceptions'解决方法卸载原来安装的docxpipuninstalldocx安装python-docx模块即可pipinstallpython-d
Python如何设置工作目录飞起来fly呀 Python python 开发语言
在Python编程中，正确设置工作目录是文件系统操作的关键步骤之一。工作目录影响到相对路径的解析，确保程序能正确访问所需的文件和资源。为方便大家理解和使用，这里详细介绍如何在Python中利用os模块设置工作目录，并以此实现更灵活的文件操作。使用os模块设置工作目录Python的os模块提供了操作系统相关的功能，包括目录和文件操作。你可以用这个模块来更改当前的工作目录，以匹配你项目的需要。1.设置
【人工智能】【Python】在Scikit-Learn中使用决策树算法（ID3和CART） SmallBambooCode 机器学习人工智能 python 算法 scikit-learn 决策树机器学习 ai
importnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.treeimportDecisionTreeClassifier,plot_tree#加载数据集iris=load_iri
Python 3.14版本的彩蛋
使用3.14版本的Python创建一个虚拟环境，会看到在虚拟环境的bin目录中，不仅有python3、python3.14等常规文件，竟然还存在一个特殊的文件thon。/tmp/venv/bin$lltotal72...-rwxr-xr-x1useruser290BMar510:57pip3.14*lrwxr-xr-x1useruser10BMar510:57python@->python.exe
差异中寻找共识：浅析中美欧AIGC服务商的标识义务人工智能
2025年1月7日，西藏日喀则地震中一张被广泛传播的图片“被压在废墟下的小男孩”被证明是AI合成图片，[1]这随即引发了社会对于人工智能生成物（ArtificialIntelligenceGeneratedContent，以下简称“AIGC”）的广泛讨论。随着AI大模型生成逼真图像、音频与视频的能力日益增强，人类作品与AIGC之间的界限愈发模糊。如不加以管控，则会产生“真相侵蚀”（TruthDec
迷雾渐开：美国AIGC可版权性剖析及案例梳理人工智能
当地时间2025年1月29日，美国版权局（U.S.CopyrightOffice,USCO）发布了版权和人工智能相关法律和政策报告的第二部分——《版权和人工智能：可版权性》（以下简称“《USCO可版权性报告》”）[1]，旨在探讨人工智能生成内容（AIGC）的可版权性问题。该报告明确指出，美国版权局认为现有的版权法足以解决AIGC问题，因此无需制定新的立法。具体而言，该报告在此前美国版权局于2023
智能体平台架构深度剖析：从底层到应用的全链路解析人工智能
在当今人工智能飞速发展的时代，智能体平台作为承载和驱动智能应用的关键基础设施，其架构设计至关重要。一个优秀的智能体平台架构，能够高效整合各类资源，实现智能体的灵活构建与稳定运行，为多样化的应用场景提供强大支持。稳固根基：基础资源层与并行平台层基础资源层是整个智能体平台的基石。其中，GPU和服务器构成了强大的计算硬件支撑，确保平台能够应对复杂的计算任务。而数据与OSS（对象存储服务）则如同智能体的“
美国首例AI训练数据版权案：从汤森路透诉罗斯案看AI训练数据的“合理使用” 人工智能
随着人工智能（AI）技术的快速发展和广泛应用，复杂的版权问题也随之而来。2025年2月11日，美国特拉华州联邦地区法院对汤森路透（ThomsonReuters）诉罗斯（Ross）案作出部分简易判决，认定被告罗斯公司未经授权使用受版权保护的作品训练AI法律检索工具的行为构成版权侵权，且不属于合理使用。[1]这是美国首个就AI训练数据作出实质性判决的案件。本文将重点分析其合理使用论述中对于“转换性目的
【Python】执行脚本的时，如何指定运行根目录，而不是指定脚本的父级目录 jwensh #Python python
author:jwensh&gptdate:2024.09.23python执行脚本的时，如何指定运行根目录，而不是指定脚本的父级目录prompt：python执行脚本的时候，如何指定他的运行根目录，而不是指定脚本的父级目录在执行Python脚本时，如果你想指定一个自定义的运行根目录，而不是默认的脚本所在目录，可以使用以下几种方式：1.通过os.chdir()修改当前工作目录在脚本中使用os.ch
python系列：解决：ModuleNotFoundError: No module named ‘exceptions’ 坦笑&&life #python python 开发语言
解决：ModuleNotFoundError:Nomodulenamed‘exceptions’解决：ModuleNotFoundError:Nomodulenamed‘exceptions’背景报错问题报错位置代码报错原因解决方法其他解决办法注意：此时有以下几种解决办法：1.升级代码或模块以支持Python3。2.如果你必须使用Python2，请确保你的代码或模块与Python2兼容。3.如果你
使用Python Flask构建Web应用程序代码快速拳 python flask 前端 Python
Flask是一个轻量级的PythonWeb框架，它提供了构建Web应用程序所需的基本功能。它简单易用，非常适合小型项目和原型开发。本文将介绍如何使用Flask构建一个简单的Web应用程序，并提供相应的源代码。首先，我们需要安装Flask。可以使用以下命令使用pip安装Flask：pipinstallflask一旦安装完成，我们就可以开始构建我们的Web应用程序了。首先，创建一个Python文件，命
2024年一文1800字从0到1使用Python Flask实战构建Web应用(1) 2401_84564025 程序员 python flask 前端
现在我也找了很多测试的朋友，做了一个分享技术的交流群，共享了很多我们收集的技术文档和视频教程。如果你不想再体验自学时找不到资源，没人解答问题，坚持几天便放弃的感受可以加入我们一起交流。而且还有很多在自动化，性能，安全，测试开发等等方面有一定建树的技术大牛分享他们的经验，还会分享很多直播讲座和技术沙龙可以免费学习！划重点！开源的！！！qq群号：110685036第三部分：运行Flask应用在app.
【人工智能基础2】Tramsformer架构、自然语言处理基础、计算机视觉总结 roman_日积跬步-终至千里人工智能习题人工智能自然语言处理计算机视觉
文章目录七、Transformer架构1.替代LSTM的原因2.Transformer架构：编码器-解码器架构3.Transformer架构原理八、自然语言处理基础1.语言模型基本概念2.向量语义3.预训练语言模型的基本原理与方法4.DeepSeek基本原理九、计算机视觉七、Transformer架构1.替代LSTM的原因处理极长序列时，效率下降：虽然LSTM设计的初衷是解决长期依赖问题，即让模型
【python web】一文掌握 Flask 的基础用法数据知道 python 前端 flask
文章目录一、Flask介绍1.1安装Flask二、Flask的基本使用2.1创建第一个Flask应用2.2路由与视图函数2.3请求与响应2.4响应对象2.5模板渲染2.6模板继承2.7静态文件管理2.8Blueprint蓝图2.9错误处理三、Flask扩展与插件四、部署Flask应用五、总结Flask是一个轻量级的PythonWeb框架，因其简单易用、灵活性高而受到广泛欢迎。本文将全面介绍Flas
python绘制密度散点图龟速前进 anaconda 可视化 python
头大，外行人做个图咋这么难，趋势线还没有研究出来怎么加上去，哎importmatplotlib.pyplotaspltfromscipy.statsimportgaussian_kdefrommpl_toolkits.axes_grid1importmake_axes_locatableimportnumpyasnpimportpandasaspdfromdbfreadimportDBFdata=
python colorama_Python colorama 模块使用说明 weixin_39682697 python colorama
1Colorama模块说明在上篇博客我们了解了prettytable的使用,如下：https://www.cndba.cn/cndba/dave/article/3564使用prettytable模块之后，输出的内容格式看上去会非常整齐，但如果我们想要对部分内容重点显示，那么可以使用两种方法：1)直接使用Python控制输出颜色2)使用colorama模块Colorama是一个python专门用来
python colorama模块失效怎么办_python – 由于模块colorama,无法使用aws CLI 金牛远望号 python colorama模块失效怎么办
我已经安装了AWSCLI,并尝试在MacOSSierra上使用它.它抱怨没有模块colorama：$awsTraceback(mostrecentcalllast):File"/usr/local/bin/aws",line19,inimportawscli.clidriverFile"/Library/Python/2.7/site-packages/awscli/clidriver.py",l
怎么做一个AI产品经理？ AI筑梦师 AI产品经理人工智能产品经理
AI产品经理全面进化：在人工智能迅猛发展的时代，产品经理的角色正经历前所未有的转型。从传统的需求捕捉者到技术与商业紧密结合的创新推动者，AI产品经理肩负着将前沿AI技术转化为解决用户痛点的产品的重要任务。随着大数据、云计算和大模型技术的不断成熟，产品经理不仅需要具备敏锐的市场洞察，还必须深刻理解AI技术本质，跨界整合技术、数据与业务优势，从而推动产品的持续创新与落地。本文将全面解析AI产品经理的角
数据可视化：python画散点图scatter 西红柿爱吃小番茄 python python 数据可视化 matplotlib
数据可视化：python画散点图scatter我想遍历一幅图的所有像素的h分量的值，然后用散点图表示出来。观察这幅图的h分量的值得变化范围。scatter函数的原型matplotlib.pyplot.scatter(x,y,s=20,c='b',marker='o',cmap=None,norm=None,vmin=None,vmax=None,linewidths=None,vert=None,
Python Colorama 库详解：终端输出美化的神器萧鼎 python基础到进阶教程 python
PythonColorama库详解：终端输出美化的神器在开发命令行工具或调试程序时，我们可能会希望通过颜色来区分重要信息，比如警告、错误、提示等。而Colorama是一个简单易用的Python库，可以帮助我们轻松地为终端输出添加颜色，提升用户体验。1.Colorama是什么？Colorama是一个Python库，用于在终端中实现跨平台的彩色文本输出。它主要提供以下功能：为文本添加前景色、背景色。控
Python之colorama PlutoZuo Python python 开发语言
Python之colorama文章目录Python之colorama1.安装Colorama库2.导入Colorama库3.初始化Colorama4.设置文本颜色和样式5.自定义颜色和样式Colorama是一个Python库，用于在控制台（终端）上输出彩色文本。它提供了一些方便的函数和类，用于在命令行界面中添加颜色和样式。以下是一些使用Colorama库的详细示例：1.安装Colorama库首先，
【AI】使用Python实现机器学习小项目教程丶2136 AI 人工智能 python 机器学习
引言在本教程中，我们将带领您使用Python编程语言实现一个经典的机器学习项目——鸢尾花（Iris）分类。通过这个项目，您将掌握机器学习的基本流程，包括数据加载、预处理、模型训练、评估和优化等步骤。论文AIGC检测，降AIGC检测，AI降重，三连私信免费获取：ReduceAIGC9折券！DetectAIGC立减2元券！AI降重9折券！目录引言一、项目背景与目标二、开发环境准备2.1所需工具2.2环
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本