第二章 python-pcl、open3d读取、显示pcd、bin等格式点云数据

第二章 python-pcl、open3d读取、显示pcd、bin格式点云数据

文章目录

    • 第二章 python-pcl、open3d读取、显示pcd、bin格式点云数据
  • 前言
  • 环境
  • 一、点云数据类型
    • 1.基于python-pcl 读取显示pcd、bin格式文件
    • 2.基于open3d 读取显示pcd格式文件
    • 3.解析pcap格式点云文件并通过python-pcl显示
  • 总结


前言

点云数据实际上就是许多组点的集合,每个点由{x,y,z}组成。当然理论上的只包含有3D坐标。
实际激光雷达获取的点云数据还会包含强度、反射率等等。但我们一般只用提取{x,y,z}来处理即可。

点云数据相比于其他传感器数据的核心优势就是在于 精准的深度信息。可惜获取具体的坐标信息。

环境

因为涉及到深度学习的应用,所以运用的整体环境是基于 python 使用pycharm编辑。
主要涉及库 python-pcl open3D mayavi numpy 等等用来处理点云数据并显示。

实际上点云的核心处理库应该是PCL 类似于图像处理中的Opencv 。后面也会有扩展。

一、点云数据类型

基于激光雷达录制的点云文件具有多种格式,如pcd、npy、ply、bin、pcap、lvx等等。
而读取点云数据也有多个库,python-pcl open3D mayavi numpy。
这里主要使用 python-pcl 和 open3D 两个核心库。

1.基于python-pcl 读取显示pcd、bin格式文件

代码如下(示例):

import numpy as np
import pcl.pcl_visualization
pt = pcl.load("D://code-python//Data//lidar//2094.799809520.pcd")

#转为数组 形如 24000 x 3 
points = pt.to_array()

#但是pcl显示是要 N*4 所以要扩展一列 取一列插入数组使 N*3 变为 N*4
x = points[:,0]
points = np.insert(points,3,x,axis=1)

# 这里对第四列进行赋值,它代表颜色值,根据你自己的需要赋值即可;
points[:, 3] = 255

# PointCloud_PointXYZRGB 需要点云数据是N*4,分别表示x,y,z,RGB ,其中RGB 用一个整数表示颜色;
color_cloud = pcl.PointCloud_PointXYZRGB(points)
visual = pcl.pcl_visualization.CloudViewing()

#窗口名 
visual.ShowColorCloud(color_cloud, b'sta')

flag = True
while flag:
    flag != visual.WasStopped()

这里就可以成功显示 颜色是根据自己设置
第二章 python-pcl、open3d读取、显示pcd、bin等格式点云数据_第1张图片
下面基于 numpy 读取bin格式点云文件

import pcl.pcl_visualization
import numpy as np

# lidar_path 指定一个kitti 数据的点云bin文件就行了
#bin文件为2进制文件
lidar_path = r'D:/code-python/Data/lidar/000000.bin'

# reshape成 N*4
points = np.fromfile(lidar_path, dtype=np.float32).reshape(-1, 4)  


# 在这里对第四列进行赋值,它代表颜色值,根据你自己的需要赋值即可;
points[:,3] = 255

# PointCloud_PointXYZRGB 需要点云数据是N*4,分别表示x,y,z,RGB ,其中RGB 用一个整数表示颜色;
color_cloud = pcl.PointCloud_PointXYZRGB(points)
visual = pcl.pcl_visualization.CloudViewing()
visual.ShowColorCloud(color_cloud, b'cloud')
flag = True
while flag:
    flag != visual.WasStopped()

2.基于open3d 读取显示pcd格式文件

代码如下(示例):

import open3d as o3d
import numpy as np

point = o3d.io.read_point_cloud("D:/code-python/Data/lidar/000000.pcd")

o3d.visualization.draw_geometries([point])

#open3d显示的时候有个bug 要把python  pycharm设置为高性能  系统显示里 图形设置

第二章 python-pcl、open3d读取、显示pcd、bin等格式点云数据_第2张图片
效果相对于 python-pcl的显示还是差一点,不过也挺不错。同时是可以调的,它也是一个成熟的3D处理库。有许多内置的处理函数。

3.解析pcap格式点云文件并通过python-pcl显示

这里参考一位大佬的代码:
作者:lonlon ago
https://zhuanlan.zhihu.com/p/158621756
代码如下:


# -*- coding: UTF-8 -*-
import dpkt
import collections  # 有序字典需要的模块
import time
import numpy as np
import struct

# 安装了pcl , 可以使用它来进行可视化
import pcl.pcl_visualization
viewer = pcl.pcl_visualization.PCLVisualizering()#初始化一个对象
viewer.SetBackgroundColor(0, 0, 0) #颜色
viewer.AddCoordinateSystem()
viewer.InitCameraParameters()

# vlp 16 的参数
'''
https://blog.csdn.net/qq_34911636/article/details/89946329#commentBox
激光雷达每一帧的数据长度固定为1248字节,其中分别为前42字节的前数据包标识、12组数据包、4字节时间戳和最后两字节雷达型号参数。
12组数据包中前两字节为数据包的开始标识(0xFFEE)、接下去两字节为的旋转角度(当前角度)值和连续32*2字节的距离值+1字节的激光反射强度值)字节的距离信息,
其中32*3字节分别为雷达两次获取探测信息,每个数据包开头所携带的旋转角度是指当前数据包前16*3字节对应的角度,而后16*3字节对应的旋转角度激光雷达没有直接给出,
需要通过计算前后两次旋转角度然后求取平均值获得。
1248 = 42 + 12*(2 + 2 + 32*(2+1)) + 4 + 2 =1248

雷达扫描频率为10Hz,每秒数据包在480帧左右,即每次扫描会产生48个左右的数据包,需要将分散的数据包数据合并称为一次扫描的点云数据
75个udp包产生一圈数据 vlp格式解析那篇文章 下面评论没理解 为什么是75 75*384*10 = 288000 
若按照这样理解 角分辨率按照0.1360/0.1 = 3600 一圈转3600次 一次16个点 = 57600 10hz 1s 10圈 即 57600*10 = 576000 反正
有点乱
'''
DISTANCE_RESOLUTION = 0.002   # 距离数值分辨率 2mm转换为单位米
udp_package_num = 1
line_per_udp = 12        # 每个UDP 有多少列
point_per_udp_line = 32  # 每个UDP 的每列包含有多少个点
point_num_per_udp = point_per_udp_line * line_per_udp  # 32*12=384

thetas_lines = [-15, 1, -13, 3, -11, 5, -9, 7, -7, 9, -5, 11, -3, 13, -1, 15] #垂直角度w代表值
thetas_point = thetas_lines * 2 * line_per_udp * udp_package_num   #感觉是嵌套列表 列表乘以一个数字 [[x],[x],[x]...]
thetas_point = np.radians(thetas_point) #角度从度转为弧度 thetas_point为输入的角度 它返回一个数组, 其中包含输入数组中给定度数的等效弧度角。
thetas_point_cos = np.cos(thetas_point)  #cos弧度
thetas_point_sin = np.sin(thetas_point)  #sin弧度


data_fmt = '<' + (('H' + 'H' + 'HB' * point_per_udp_line) * line_per_udp + 'IH') * udp_package_num
base_range = np.array(range(2, point_per_udp_line*2+1, 2))  # 32, 距离值的基础索引
#range (start,stop,step) range(2,65,2) 32个数
angle_base_range = np.array([1])
d_range = []
r_range = []
angle_range = []
k = 0
data_gap = 2 + 2*point_per_udp_line  # 每一列的长度 其实是2字节标识 2字节旋转角度 32*(2字节距离,1字节反射强度)点 这里貌似只计算旋转角度+距离66

for i in range(udp_package_num):
    for j in range(line_per_udp):
        d_range.append(base_range + k * data_gap + i * 2)  # 66 是 HH + HB*32  d.range 列表增加,多个列表嵌套
        r_range.append(base_range + k * data_gap + i * 2 + 1)
        angle_range.append(angle_base_range + k * data_gap + i * 2)
        k += 1
d_range = np.hstack(d_range)  # 多个array组成的列表
r_range = np.hstack(r_range)
angle_range = np.hstack(angle_range)

# 水平角度插值,如果有角度跳变会怎么样?  针对从360跳变到20的这部分拟合的并不是很好,误差很大;已经改正
x_index = np.arange(point_num_per_udp)
xp_index = np.arange(0, point_num_per_udp, point_per_udp_line) # array([  0,  32,  64,  96, 128, 160, 192, 224, 256, 288, 320, 352])




def unpack_udp(data):

    data_tuple = struct.unpack(data_fmt, data)  # 原始格式是元祖,要转array,元祖不能索引
    data_unpack = np.array(data_tuple, dtype=np.int64)  # np.array会多耗时15毫秒  todo 这里为什么会报错?? 可能是时间戳的数值太大了

    distances = data_unpack[d_range]  # 115200
    refs = data_unpack[r_range] / 255
    angles = data_unpack[angle_range]
    angles = np.radians(angles / 100).astype(np.float32)  # 除以100再弧度值
    # 第一种处理角度的方式
    # angles = np.tile(angles, (32, 1)).flatten('F')  # 因为angle只有1个,数据有32个,需要复制32
    # 第二种方式
    angles_interp = np.interp(x_index, xp_index, angles).astype(np.float32)
    if angles[0] > angles[-1]:  # 出现了角度的转折点
        # replace_angle = np.linspace(0,20,32) # 针对从360跳变到20 的角度替换
        change_index = np.argmax(angles)
        replace_index = change_index * 32 + 1
        interp_num_2 = int(angles[change_index+1]*32/40)  # 每个UDP数据包之间的角度间隔为 40,每个包有32条线;
        interp_num_1 = 32 - interp_num_2
        replace_angle_1 = np.linspace(angles[change_index], 35999, interp_num_1)  # 针对从360跳变到 20 的角度替换
        replace_angle_2 = np.linspace(0, angles[change_index+1],   interp_num_2)  # 针对从360跳变到 20 的角度替换
        angles_interp[replace_index:(replace_index+interp_num_1)] = replace_angle_1
        angles_interp[(replace_index+interp_num_1):(replace_index+32)] = replace_angle_2


    distances = distances * DISTANCE_RESOLUTION
    x = distances * thetas_point_cos * np.sin(angles_interp)
    y = distances * thetas_point_cos * np.cos(angles_interp)
    z = distances * thetas_point_sin
    raw_points = np.stack((x, y, z), axis=1).astype(np.float32)
    # raw_points = np.stack((distances, angles_interp, refs, ), axis=1)   # 也可以只要原始数据

    print(type(x))
    print(len(x)) #384一组 每个udp384一组
    #print(x)


    return raw_points






def main(file_path):
    # f = open(file_path)          # 此写法为python2之下,
    f = open(file_path, mode='rb') #python3
    try:
        pcap = dpkt.pcap.Reader(f)  # 先按.pcap格式解析,若解析不了,则按pcapng格式解析
    except:
        print("it is not pcap ... format, pcapng format...")
        pcap = dpkt.pcapng.Reader(f)
        # 接下来就可以对pcap做进一步解析了,记住在使用结束后最好使用f.close()关掉打开的文件,虽然程序运行结束后,
        # 系统会自己关掉,但是养成好习惯是必不可少的。当前变量pcap中是按照“间戳:单包”的格式存储着各个单包
    # 将时间戳和包数据分开,一层一层解析,其中ts是时间戳,buf存放对应的包
    all_pcap_data = collections.OrderedDict()  # 有序字典
    # all_pcap_data_hex = collections.OrderedDict()  # 有序字典,存十六进制形式
    cir_point = []
    i = 1
    for (ts, buf) in pcap:
        try:
            eth = dpkt.ethernet.Ethernet(buf)  # 解包,物理层
            if not isinstance(eth.data, dpkt.ip.IP):  # 解包,网络层,判断网络层是否存在,
                continue
            ip = eth.data
            # if not isinstance(ip.data, dpkt.tcp.TCP):  # 解包,判断传输层协议是否是TCP,即当你只需要TCP时,可用来过滤
            #     continue
            if not isinstance(ip.data, dpkt.udp.UDP):#解包,判断传输层协议是否是UDP
                continue
            transf_data = ip.data  # 传输层负载数据,基本上分析流量的人都是分析这部分数据,即应用层负载流量
            if not len(transf_data.data):  # 如果应用层负载长度为0,即该包为单纯的tcp包,没有负载,则丢弃
                continue

            if len( transf_data.data) != 1206:  # 长度过滤   todo 为什么会有512字节的数据
                continue

            all_pcap_data[ts] = transf_data.data  # 将时间戳与应用层负载按字典形式有序放入字典中,方便后续分析.
            points = unpack_udp(transf_data.data)
            if i % 76 != 0:  # vlp16 每75个UDP数据包形成一圈数据
                cir_point.append(points)
            else:
                cir_udp = np.vstack(cir_point)
                print(cir_udp.shape)            # 最后需要的一圈完整的点云数据 只包含了28000余个xyz坐标
                cloud_all = pcl.PointCloud(cir_udp[:, 0:3].astype(np.float32))   # 可视化
                viewer.AddPointCloud(cloud_all)
                viewer.SpinOnce(100)
                viewer.RemoveAllPointClouds(0)
                cir_point = []

            i += 1
        except Exception as err:
            print( "[error] %s" % err)
    f.close()






if __name__ == '__main__':
    #file_path="D:xxxxxx.pcap"
    file_path = "2020-10-21-10-13-57_Velodyne-VLP-16-Data.pcap"
    main(file_path)

这里其实都是数据格式解析,要知道怎么样的数据格式,用什么方式能够更好的解析。
当然好的工具使用起来也是很舒服,感谢开发这些库的大佬们。


总结

本文仅仅简单介绍了基于python的不同类型点云数据读取、显示方法,这些都比较简单。
ubuntu下一般都是录制bag 文件,并通过rviz显示,后续可以扩展一下。

你可能感兴趣的:(激光雷达-点云目标识别,计算机视觉,python,自动驾驶)