飞桨PaddlePaddle之图像分割7日打卡营学习笔记-语义分割初探

之前上课的时候不太懂,回头再整理一下笔记,再看一下视频,思路就清晰许多了。
朱老师和伍老师讲的都很棒,特别朱老师手敲代码,对写phthon有一定的启发。

学习笔记的地址:
https://aistudio.baidu.com/aistudio/projectdetail/1152968

学习笔记

图像分割的类型
图像分割
图像语义分割:给每个pixel分类
图像实例分割:给每个框里的object分mask
图像全景分割:背景pixel分类+框里mask
视频目标分割:即VOS,通常会给定目标mask,求特定目标的mask
视频实例分割:即VIS,根据目标检测的框,求目标的mask

ground truth,在有监督学习中,数据是有标注的,以(x, t)的形式出现,其中x是输入数据,t是标注.正确的t标注是ground truth, 错误的标记则不是。(也有人将所有标注数据都叫做ground truth)

图像分割的应用场景
根据不同的任务和数据类型
1、人像分割(头发分割、人脸分割、背景分割)
2、自动驾驶(行人、车辆分割,图道线检测)
3、医学图像(病理、CT、MRI)
4、工作质检测、分拣机器人

语义分割算法的根本目的:像素及分类
计算loss,希望Ground truth和Prediction越接近越好

语义分割算法的基本流程:
-输入:图像(RGB) ————会想到cv2.imread, dataloader, batch_size
-算法:深度学习模型 ————会想到FCN, Deeplab, U-Net, RestNet, VGG
-输出:分类结果(与输入大小一致的单通道图)
-训练过程:
-输入:image + label
-前向:out = model(image)
-计算损失: loss = loss_func(out, label)
-反向:loss.backward()
-更新权重:optimizer.minimize(loss)

语义分割性能指标
mIoU:交并比,交集比去并集
mACC:Prediction和Ground Truth对应位置的“分类”准确率,每个像素

为什么有mACCb了,还要mIoU?
以视频的车的照片为例,如果没有识别出车,全都预测成马路,单看像素的话,准确率也挺高。
但是分割的目的是认为汽车也很重要,mean一下车的比重就比较大。

你可能感兴趣的:(深度学习,人工智能,机器学习,计算机视觉)