遥感影像语义分割过程记录

遥感影像语义分割过程记录

遥感影像语义分割

步骤包括前期原始影像,提取样本,制作标签,转换成tensor数据集,选择模型(deeplab),数据喂入训练,新的影像预测。

原始影像

遥感影像语义分割过程记录_第1张图片

样本获取

主要采用gdal库,在原始影像中随机生成坐标点采用固定尺寸进行裁剪。代码如下:

import gdal
import random

def clip_raster(in_put,out_put,xsize=300,ysize=300):
    # 读取要切的原图
    in_ds = gdal.Open(in_put)
    # print("open tif file succeed")

    # 读取原图中的每个波段
    in_band1 = in_ds.GetRasterBand(1)
    in_band2 = in_ds.GetRasterBand(2)
    in_band3 = in_ds.GetRasterBand(3)

    im_width = in_ds.RasterXSize  # 栅格矩阵的列数
    im_height = in_ds.RasterYSize  # 栅格矩阵的行数
    # 定义切图的起始点坐标(相比原点的横坐标和纵坐标偏移量)
    offset_x = random.randint(0,im_width-xsize)  # 这里是随机取点,可根据自己的实际需要设置
    offset_y = random.randint(0,im_height-ysize)

    # 定义切图的大小(矩形框)
    block_xsize = xsize  # 行
    block_ysize = ysize  # 列

    # 从每个波段中切需要的矩形框内的数据(注意读取的矩形框不能超过原图大小)
    out_band1 = in_band1.ReadAsArray(offset_x, offset_y, block_xsize, block_ysize)
    out_band2 = in_band2.ReadAsArray(offset_x, offset_y, block_xsize, block_ysize)
    out_band3 = in_band3.ReadAsArray(offset_x, offset_y, block_xsize, block_ysize)

    # 获取Tif的驱动,为创建切出来的图文件做准备
    gtif_driver = gdal.GetDriverByName("GTiff")

    # 创建切出来的要存的文件(3代表3个不都按,最后一个参数为数据类型,跟原文件一致)
    out_ds = gtif_driver.Create(out_put, block_xsize, block_ysize, 3, in_band1.DataType)
    # print("create new tif file succeed")

    # 获取原图的原点坐标信息
    ori_transform = in_ds.GetGeoTransform()
    if ori_transform:
        print (ori_transform)
        print("Origin = ({}, {})".format(ori_transform[0], ori_transform[3]))
        print("Pixel Size = ({}, {})".format(ori_transform[1], ori_transform[5]))

    # 读取原图仿射变换参数值
    top_left_x = ori_transform[0]  # 左上角x坐标
    w_e_pixel_resolution = ori_transform[1] # 东西方向像素分辨率
    top_left_y = ori_transform[3] # 左上角y坐标
    n_s_pixel_resolution = ori_transform[5] # 南北方向像素分辨率

    # 根据反射变换参数计算新图的原点坐标
    top_left_x = top_left_x + offset_x * w_e_pixel_resolution
    top_left_y = top_left_y + offset_y * n_s_pixel_resolution

    # 将计算后的值组装为一个元组,以方便设置
    dst_transform = (top_left_x, ori_transform[1], ori_transform[2], top_left_y, ori_transform[4], ori_transform[5])

    # 设置裁剪出来图的原点坐标
    out_ds.SetGeoTransform(dst_transform)

    # 设置SRS属性(投影信息)
    out_ds.SetProjection(in_ds.GetProjection())

    # 写入目标文件
    out_ds.GetRasterBand(1).WriteArray(out_band1)
    out_ds.GetRasterBand(2).WriteArray(out_band2)
    out_ds.GetRasterBand(3).WriteArray(out_band3)

    # 将缓存写入磁盘
    out_ds.FlushCache()
    print("FlushCache succeed")

    # 计算统计值
    # for i in range(1, 3):
    #     out_ds.GetRasterBand(i).ComputeStatistics(False)
    # print("ComputeStatistics succeed")

if __name__ == "__main__":
    # 生成100张图
    in_put = "。。。。。\\TL_2020_10M_02_Clip1.tif"

    for i in range(100):
        out_put = '。。。。。\\clip'+str(i)+".tif"
        clip_raster(in_put,out_put)

    print("End!")

将所有随机裁剪的结果加载至arcgis中如下:
遥感影像语义分割过程记录_第2张图片

样本制作

1、labelme 制作样本

labelme是很常见的用来制作样本的工具,但是目前不能处理.tif格式的影像,如果使用这个工具需要将图像转jpg或者png,我们希望不通过转换格式来制作样本,因此采用下面方法。

2、arcgis 制作样本

简单来说就是创建一个shp文件,画出我们分类的实体,并在属性表中标记类别,然后在工具箱里的【Conversion Tools】->【To Raster】->【Feature to Raster】将shp转换为栅格文件,特别需要注意的是,需要在环境设置里的处理范围设置为与原影像一致。

主要参考: https://zhuanlan.zhihu.com/p/163353715?utm_source=qq

样本读入tensorflow

目前仍然存在问题,无法读取tif格式。
遥感影像语义分割过程记录_第3张图片
原始的方法是通过tf.gfile.FastGFile实现对图片的读取read成二进制格式。如下为其中一部分二进制。
在这里插入图片描述
t2
修改后的方法是采用gdal读取数据,然后转换为numpy数组,再用np的方法直接转换为二进制。如下。
遥感影像语义分割过程记录_第4张图片
t1
但问题是对应的二进制文件却与之前的不同。

因此,先使用tif转png\jpg的方式。

tif转png

1、直接将gdal读取的tif转换成np数组,再用PIL读取。

import numpy as np
from PIL import Image
import gdal

tif = gdal.Open("C:\\Users\\94320\\Desktop\\image\\clip.tif")
print("打开tif:",tif)

# print(label2)
cols = tif.RasterXSize  # 栅格矩阵的列数
rows = tif.RasterYSize  # 栅格矩阵的行数
im_bands = tif.RasterCount  # 波段数
label2 = tif.ReadAsArray(0, 0, cols,rows)
data=np.empty([rows,cols,3],dtype = float)

###########################
# 直接将gdal读取的tif转换成np数组,再用PIL读取。
###########################
for i in range(im_bands):
    band=tif.GetRasterBand(i+1)
    data1 = band.ReadAsArray()
    data1 = data1
    print("data1", data1)
    data[:, :, i]=data1
print(Image.fromarray(np.uint8(data))) # 将16位的数值直接用np.uint8转换成8位的

Image.fromarray(np.uint8(data)).save("C:\\Users\\94320\\Desktop\\image\\tiff.png")

得到的结果如图所示:显示不符合实际情况。
遥感影像语义分割过程记录_第5张图片

2、以百分比截断进行拉伸

import numpy as np
from PIL import Image
import gdal

def tif2png(input_tif,output_dir):
    cols = input_tif.RasterXSize  # 栅格矩阵的列数
    rows = input_tif.RasterYSize  # 栅格矩阵的行数
    im_bands = input_tif.RasterCount  # 波段数
    data=np.empty([rows,cols,3],dtype = float)

    out = np.zeros_like(data, dtype=np.uint8) # 创建一个空的图
    for i in range(im_bands):
        band = input_tif.GetRasterBand(i + 1)
        data1 = band.ReadAsArray()
        data[:, :, i] = data1

        #  这里以百分比截断进行拉伸
        a = 0
        b = 255
        c = np.percentile(data[:, :,i], 0.7)
        d = np.percentile(data[:, :,i], 99.9)
        t = a + (data[:, :,i] - 1) * (b - a) / (d - c)
        t[t < a] = a
        t[t > b] = b
        out[:, :,i] = t
    outImg=Image.fromarray(np.uint8(out))
    outImg.save(output_dir)

tif = gdal.Open("C:\\Users\\94320\\Desktop\\image\\clip.tif")
output_dir = "C:\\Users\\94320\\Desktop\\image\\tiff1.png"
print("打开tif:",tif)

tif2png(tif,output_dir)

结果如下:与原tif直观差异不大。
遥感影像语义分割过程记录_第6张图片
稍作修整,批量处理

import numpy as np
from PIL import Image
import gdal
import os

def tif2png(input_dir,output_dir):
    input_tif = gdal.Open(input_dir)
    cols = input_tif.RasterXSize  # 栅格矩阵的列数
    rows = input_tif.RasterYSize  # 栅格矩阵的行数
    im_bands = input_tif.RasterCount  # 波段数
    data=np.empty([rows,cols,3],dtype = float)

    out = np.zeros_like(data, dtype=np.uint8) # 创建一个空的图
    for i in range(im_bands):
        band = input_tif.GetRasterBand(i + 1)
        data1 = band.ReadAsArray()
        data[:, :, i] = data1

        #  这里以百分比截断进行拉伸
        a = 0
        b = 255
        c = np.percentile(data[:, :,i], 0.7)
        d = np.percentile(data[:, :,i], 99.9)
        t = a + (data[:, :,i] - 1) * (b - a) / (d - c)
        t[t < a] = a
        t[t > b] = b
        out[:, :,i] = t
    outImg=Image.fromarray(np.uint8(out))
    outImg.save(output_dir)

if __name__ == "__main__":
    tif_path = "C:\\Users\\94320\\Desktop\\image\\"  # 输入tif文件夹路径
    output_dir = "C:\\Users\\94320\\Desktop\\image_jpg\\"  # 输出png文件夹路径
    tif = os.listdir(tif_path)
    for i, img in enumerate(tif):
        img_name = os.path.join(tif_path, img)
        save_file = os.path.join(output_dir, img.strip('.tif') + '.png')
        tif2png(img_name,save_file)

你可能感兴趣的:(遥感影像分割记录)