鸿_H

kitti之ros可视化_学习笔记--第8课：tracking资料下载及2d侦测框绘制

环境：ubuntu16.04，ros-kinetic，python2，vscode，opencv，rviz

概要：这节课笔记，新增展示的是，介绍的是下载绘制2号相机所需要的tracking资料，并使用tracking资料，先给图片中一个货车绘制一个浅蓝色的2d侦测框，最后统一给每张图片根据物体类型不同绘制不同颜色2d侦测框。

资料准备及预处理可参考博客，https://blog.csdn.net/qq_45701501/article/details/116447770

0、tracking资料下载和一些注意问题

1）tracking资料简单作用：加载人工加注资料用以提供给机器学习，如自动驾驶的物体侦测训练

1）tracking资料下载：http://www.cvlibs.net/datasets/kitti/eval_tracking.php
资料名称：Download training labels of tracking data set (9 MB)
填写邮箱，系统发送邮件，官方会发送下载链接到你邮箱，这里是个人之前获取下载链接：https://s3.eu-central-1.amazonaws.com/avg-kitti/data_tracking_label_2.zip

资料保存位置参考：压缩包-解压-放到kitti数据集的RawData同级目录中，如：

training就是下载压缩包，解压后的文件夹。

2）这个tracking资料只是包含2号相机，如果前面小伙伴选了其他相机的，注意把相机设置为2号，才能使用这个资料，具体说明可以看链接：

https://github.com/pratikac/kitti/blob/master/readme.tracking.txt

3）使用jupyter notebook工具
安装指令：sudo pip install jupyter notebook
使用时，终端输入：jupyter notebook

在网页中生成一个界面，进入所在包src文件中，按钮新建一个python2.0文件。

注意，网页使用读取资料时候，终端一定要求保持打开状态。填写路径时，最好采用的pwd指令获取

1、源码及解析

1）jupyter notebook预测试2d侦测框：

以下代码，均直接放到jupyter notebook里面，点击run即可。注意，不同模块，放到不同的栏中。

1-1）单张图片某一个车子的2d侦测框绘制

import pandas as pd
import numpy as np
#数据单位
COLUMN_NAMES=['frame', 'track_id', 'type', 'truncated', 'occluded', 'alpha', 'bbox_left', 'bbox_top','bbox_right', 'bbox_bottom', 'height', 'width', 'length', 'pos_x', 'pos_y', 'pos_z', 'rot_y']
#读取tracking资料并处理
df=pd.read_csv('/home/ylh/data/kitti/training/label_02/0000.txt',header=None,sep=' ')
df.columns=COLUMN_NAMES#给读取的数据添加单位
df.head()

#查找原始数据'Truck','Van','Tram'类型汽车，都更改类型为'Car'，得到表1
df.loc[df.type.isin(['Truck','Van','Tram']),'type']='Car'
#对表1,查找'Car','Pedestrian','Cyclist'三种类型物体，得到表2
df=df[df.type.isin(['Car','Pedestrian','Cyclist'])]

#表2,对2号资料，注意不是id为2，进行读取所示类型的资料，并以阵列形式展示
#df.loc[2,['bbox_left','bbox_top','bbox_right','bbox_bottom']]
#将阵列显示的数据，保存到box的numpy数组里面
box=np.array(df.loc[2,['bbox_left','bbox_top','bbox_right','bbox_bottom']])

import cv2

#读取图片
image = cv2.imread('/home/ylh/data/kitti/RawData/2011_09_26/2011_09_26_drive_0005_sync/image_02/data/0000000000.png')

#这里展示的给图片中一个货车绘制浅蓝色的框框
#由于像素只有整数，所以需要对box数组元素进行int类型转换;根据坐标值，绘制左上角点
top_left=int(box[0]),int(box[1])
#根据坐标值，绘制右下角的点
bottom_right=int(box[2]),int(box[3])

#指定图片，根据左上角点和右下角点绘制框框，(255,255,0)表示框框的颜色,2表示框线的宽度
cv2.rectangle(image,top_left,bottom_right,(255,255,0),2)
cv2.imshow('image',image)#显示图片
cv2.waitKey(0)#设置图片显示，避免一显示就消失情况
cv2.destroyAllWindows()#最后销毁该图片窗口

效果：

1-2）单张图片多个物体的2d侦测框绘制

import pandas as pd
import numpy as np
COLUMN_NAMES=['frame', 'track_id', 'type', 'truncated', 'occluded', 'alpha', 'bbox_left', 'bbox_top','bbox_right', 'bbox_bottom', 'height', 'width', 'length', 'pos_x', 'pos_y', 'pos_z', 'rot_y']
df=pd.read_csv('/home/ylh/data/kitti/training/label_02/0000.txt',header=None,sep=' ')
df.columns=COLUMN_NAMES
df.head()

df.loc[df.type.isin(['Truck','Van','Tram']),'type']='Car'#将这三种车子，统一定义为Car
df=df[df.type.isin(['Car','Pedestrian','Cyclist'])]#只是获取数据集中类型为指定的数据，注意car为重定义类型

#box=np.array(df.loc[2,['bbox_left','bbox_top','bbox_right','bbox_bottom']])#把2号资料四个边坐标保存到numpy阵列里面

import cv2

image = cv2.imread('/home/ylh/data/kitti/RawData/2011_09_26/2011_09_26_drive_0005_sync/image_02/data/0000000000.png')#读取图片

boxes = np.array(df[df.frame==0][['bbox_left','bbox_top','bbox_right','bbox_bottom']])#获取第0帧图片中的box们对应的四边坐标

for box in boxes:#给每个box绘制图线
    top_left=int(box[0]),int(box[1])#box的左上角点，像素为整数，所以需要转换int类型
    bottom_right=int(box[2]),int(box[3])#box的右下角点
    cv2.rectangle(image,top_left,bottom_right,(255,255,0),2)#绘制框框，依次指定图片、左上角点、右下角点、颜色、线粗细
    
cv2.imshow('image',image)#显示框框
cv2.waitKey(0)#避免框框一显示就消失，也就是一直显示
cv2.destroyAllWindows()#结束就销毁所有窗口

效果：

1-3) 单张图片多个物体的2d侦测框根据类型而异颜色框框绘制

DETECTION_COLOR_DICT = {'Car':(255,255,0),'Pedestrian':(0,226,255),'Cyclist':(141,40,255)}#颜色字典
import pandas as pd
import numpy as np
COLUMN_NAMES=['frame', 'track_id', 'type', 'truncated', 'occluded', 'alpha', 'bbox_left', 'bbox_top','bbox_right', 'bbox_bottom', 'height', 'width', 'length', 'pos_x', 'pos_y', 'pos_z', 'rot_y']
df=pd.read_csv('/home/ylh/data/kitti/training/label_02/0000.txt',header=None,sep=' ')
df.columns=COLUMN_NAMES
df.head()

df.loc[df.type.isin(['Truck','Van','Tram']),'type']='Car'#将这三种车子，统一定义为Car
df=df[df.type.isin(['Car','Pedestrian','Cyclist'])]#只是获取数据集中类型为指定的数据，注意car为重定义类型

#box=np.array(df.loc[2,['bbox_left','bbox_top','bbox_right','bbox_bottom']])#把2号资料四个边坐标保存到numpy阵列里面

import cv2

image = cv2.imread('/home/ylh/data/kitti/RawData/2011_09_26/2011_09_26_drive_0005_sync/image_02/data/0000000000.png')#读取图片

boxes = np.array(df[df.frame==0][['bbox_left','bbox_top','bbox_right','bbox_bottom']])#获取第0帧图片中的box们对应的四边坐标
types=np.array(df[df.frame==0]['type'])#读取图片中的种类类型并保存到tpyes数组中

#zip(types,boxes)[0]#两个数组的第一笔资料合并在一起
#for box in boxes:#给每个box绘制图线

for typ,box in zip(types,boxes):#给对应类型每个box绘制对应颜色图线
    top_left=int(box[0]),int(box[1])#box的左上角点，像素为整数，所以需要转换int类型
    bottom_right=int(box[2]),int(box[3])#box的右下角点
    cv2.rectangle(image,top_left,bottom_right,DETECTION_COLOR_DICT[typ],2)#绘制框框，依次指定图片、左上角点、右下角点、根据类型不同给的颜色（bgr）、线粗细
    
cv2.imshow('image',image)#显示框框
cv2.waitKey(0)#避免框框一显示就消失，也就是一直显示
cv2.destroyAllWindows()#结束就销毁所有窗口

效果：

当然，这里统一读取的是0000000000.png图片，如果想看其他图片效果的，可以根据图片资料集，更改路径上图片名称即可，这里不再展示。

2）连续帧图片，多个物体2d侦测框在rviz效果

通过jupyter notebook的预测试，下面将上述的代码移植到下面三个文件中，目的在rviz显示连续帧不同类型不同颜色侦测框显示。

对于读取数据文件，data_utils.py：

#!/usr/bin/env python
# -*- coding:utf8 -*-

import cv2
import numpy as np
import os
import pandas as pd #用于读取imu资料

IMU_COLUMN_NAMES = ['lat','lon','alt','roll','pitch','yaw','vn','ve','vf','vl','vu',
                    'ax','ay','az','af','al','au','wx','wy','wz','wf','wl','wu',
                    'posacc','velacc','navstat','numsats','posmode','velmode','orimode'
                    ]#根据kitti数据集中的名称进行定义的，个人理解是对照c里面的宏定义

TRACKING_COLUMN_NAMES=['frame', 'track_id', 'type', 'truncated', 'occluded', 'alpha', 
                'bbox_left', 'bbox_top','bbox_right', 'bbox_bottom', 'height', 
                'width', 'length', 'pos_x', 'pos_y', 'pos_z', 'rot_y']#tracking数据单位


#读取图片路径函数
def read_camera(path):
    return cv2.imread(path)

#读取点云路径函数
def read_point_cloud(path):
    return np.fromfile(path,dtype=np.float32).reshape(-1,4)

#读取imu资料
def read_imu(path):
    df=pd.read_csv(path,header=None,sep=' ')#读取数据
    df.columns=IMU_COLUMN_NAMES#给数据赋予单位
    return df

#读取trackiing资料
def read_tracking(path):
    df=pd.read_csv(path,header=None,sep=' ')#读取tracking资料
    df.columns=TRACKING_COLUMN_NAMES#给资料数据添加单位
    df.loc[df.type.isin(['Truck','Van','Tram']),'type']='Car'#将这三种车子，统一定义为Car
    df=df[df.type.isin(['Car','Pedestrian','Cyclist'])]#只是获取数据集中类型为指定的数据，注意car为重定义类型
    return df#返回读取的资料

对于发布函数定义文件，publish_utils.py：

#!/usr/bin/env python
# -*- coding:utf8 -*-

import rospy
from std_msgs.msg import Header
from visualization_msgs.msg import Marker,MarkerArray#Marker绘制相机视野指示线模块,MarkerArray解决Marker带来发布的不同步问题
from sensor_msgs.msg import Image,PointCloud2,Imu,NavSatFix
from geometry_msgs.msg import Point#Point来自ros包定义，所以需要定义;若不清楚，则需要到ros官网上面查看具体那个包
import sensor_msgs.point_cloud2 as pcl2
from cv_bridge import CvBridge
import numpy as np
import tf
import cv2

FRAME_ID='map'
DETECTION_COLOR_DICT = {'Car':(255,255,0),'Pedestrian':(0,226,255),'Cyclist':(141,40,255)}#颜色字典

#发布图片函数
def publish_camera(cam_pub,bridge,image,boxes,types):#增加参数boxes、types
    #绘制框框到图片中
    for typ,box in zip(types,boxes):#给对应类型每个box绘制对应颜色图线
        top_left=int(box[0]),int(box[1])#box的左上角点，像素为整数，所以需要转换int类型
        bottom_right=int(box[2]),int(box[3])#box的右下角点
        #绘制框框，依次指定图片、左上角点、右下角点、根据类型不同给的颜色（bgr）、线粗细
        cv2.rectangle(image,top_left,bottom_right,DETECTION_COLOR_DICT[typ],2)
    cam_pub.publish(bridge.cv2_to_imgmsg(image,"bgr8"))

#发布点云函数
def publish_point_cloud(pcl_pub,point_clond):
    header=Header()
    header.stamp=rospy.Time.now()
    header.frame_id=FRAME_ID
    pcl_pub.publish(pcl2.create_cloud_xyz32(header,point_clond[:,:3]))

#发布相机视野以及车子模型marker函数
def publish_ego_car(ego_car_pub):
#publish left and right 45 degree FOV lines and ego car model mesh
    
    marker_array=MarkerArray()#解决marker发布不同步问题

    marker=Marker()
    marker.header.frame_id=FRAME_ID
    marker.header.stamp=rospy.Time.now()

    marker.id=0#每个marker只能有一个id，有重复的id，只会显示一个
    marker.action=Marker.ADD#表示添加marker
    marker.lifetime=rospy.Duration()#lifetime表示marker在画面中显示的时长;Duration()函数，不给任何参数时，表示一直存在
    marker.type=Marker.LINE_STRIP#所发布marker的类型

    #设定指示线颜色
    marker.color.r=0.0
    marker.color.g=1.0
    marker.color.b=0.0
    marker.color.a=1.0#透明度，1表示完全不透明
    marker.scale.x=0.2#大小，这里表示线的粗细

    #根据激光点云的坐标系来定义2号相机的视野范围
    marker.points=[]
    marker.points.append(Point(10,-10,0))#Point,属于ros的资料包里面的定义，所以需要导入
    marker.points.append(Point(0,0,0))
    marker.points.append(Point(10,10,0))

    marker_array.markers.append(marker)#将指示线marker放到MarkerArray中

    #发布车子外形函数
    mesh_marker=Marker()
    mesh_marker.header.frame_id=FRAME_ID
    mesh_marker.header.stamp=rospy.Time.now()

    mesh_marker.id=-1#id只能设置整数，不能设置带有小数的
    mesh_marker.lifetime=rospy.Duration()
    mesh_marker.type=Marker.MESH_RESOURCE#这里的MESH_RESOURCE表示导入的是3d模型
    mesh_marker.mesh_resource="package://kitti_tutorial/Audi R8/Models/Audi R8.dae"#下载的dae模型存在问题，只是显示部分

    #设定模型位置
    mesh_marker.pose.position.x=0.0
    mesh_marker.pose.position.y=0.0
    mesh_marker.pose.position.z=-1.73#这里负数，是因为以激光雷达坐标系而定义的，1.73是根据官方发布的位置定义所取的

    #设计车子模型的旋转量
    q=tf.transformations.quaternion_from_euler(0,0,np.pi/2)#(np.pi/2,0,np.pi)这里根据下载的车子模型进行调整
    mesh_marker.pose.orientation.x=q[0]
    mesh_marker.pose.orientation.y=q[1]
    mesh_marker.pose.orientation.z=q[2]
    mesh_marker.pose.orientation.w=q[3]

    #设置车子模型的颜色
    mesh_marker.color.r=1.0
    mesh_marker.color.g=1.0
    mesh_marker.color.b=1.0
    mesh_marker.color.a=1.0

    #设置车子模型的大小
    mesh_marker.scale.x=0.6
    mesh_marker.scale.y=0.6
    mesh_marker.scale.z=0.6

    marker_array.markers.append(mesh_marker)#将车子marker放到MarkerArray中

    ego_car_pub.publish(marker_array)

#发布imu资料函数
def publish_imu(imu_pub,imu_data):
    imu=Imu()#ros,imu 进行google可以查看文档说明
    imu.header.frame_id=FRAME_ID
    imu.header.stamp=rospy.Time.now()

    #旋转角度、加速度，角速度
    q=tf.transformations.quaternion_from_euler(float(imu_data.roll),float(imu_data.pitch),float(imu_data.yaw))#(np.pi/2,0,np.pi)这里根据下载的车子模型进行调整
    imu.orientation.x=q[0]#以下四个表示旋转角，将读取的数据转为四元数表示
    imu.orientation.y=q[1]
    imu.orientation.z=q[2]
    imu.orientation.w=q[3]
    imu.linear_acceleration.x=imu_data.af#根据雷达坐标系，确定x方向线性加速度
    imu.linear_acceleration.y=imu_data.al#根据雷达坐标系，确定y方向线性加速度
    imu.linear_acceleration.z=imu_data.au#根据雷达坐标系，确定z方向线性加速度
    imu.angular_velocity.x=imu_data.wf#这三个表示不同方向的角速度
    imu.angular_velocity.y=imu_data.wl
    imu.angular_velocity.z=imu_data.wu

    imu_pub.publish(imu)

#发布gps资料函数
def publish_gps(gps_pub,imu_data):
    gps=NavSatFix()#ros里面对于gps资料识别包
    gps.header.frame_id=FRAME_ID
    gps.header.stamp=rospy.Time.now()

    gps.latitude=imu_data.lat#纬度
    gps.longitude=imu_data.lon#经度
    gps.altitude=imu_data.alt#海拔

    gps_pub.publish(gps)

对于执行文件，p11_kitti.py：

#!/usr/bin/env python
# -*- coding:utf8 -*-

from data_utils import *
from publish_utils import *

DATA_PATH='/home/ylh/data/kitti/RawData/2011_09_26/2011_09_26_drive_0005_sync'

if __name__=='__main__':
    frame = 0
    rospy.init_node('kitti_node',anonymous=True)
    cam_pub=rospy.Publisher('kitti_cam',Image,queue_size=10)#建立发布图片topic
    pcl_pub=rospy.Publisher('kitti_point_cloud',PointCloud2,queue_size=10)#建立发布点云topic
    #ego_pub=rospy.Publisher('kitti_ego_car',Marker,queue_size=10)#建立发布指示线marker的topic
    ego_pub=rospy.Publisher('kitti_ego_car',MarkerArray,queue_size=10)#MarkerArray方式发布
    #model_pub=rospy.Publisher('kitti_car_model',Marker,queue_size=10)#建立发布车子模型的marker的topic
    imu_pub=rospy.Publisher('kitti_imu',Imu,queue_size=10)#建立发布imu资料的topic
    gps_pub=rospy.Publisher('kitti_gps',NavSatFix,queue_size=10)#建立发布gps资料的topic，NavSatFix,ros里面固定卫星侦测

    bridge=CvBridge()

    rate=rospy.Rate(10)

    #读取tracking资料
    df_tracking=read_tracking('/home/ylh/data/kitti/training/label_02/0000.txt')


    while not rospy.is_shutdown():
        #将tracking资料的绘制框框所需资料筛选并处理
        boxes = np.array(df_tracking[df_tracking.frame==frame][['bbox_left','bbox_top','bbox_right','bbox_bottom']])#获取tracking资料第frame帧图片中的box们对应的四边坐标
        types=np.array(df_tracking[df_tracking.frame==frame]['type'])#读取tracking资料第frame帧图片中的物体种类类型并保存到tpyes数组中
        #读取图片
        image=read_camera(os.path.join(DATA_PATH,'image_02/data/%010d.png'%frame))
        
        #发布图片
        #publish_camera(cam_pub,bridge,image)
        publish_camera(cam_pub,bridge,image,boxes,types)#增加参数boxes,types，为了给图片指定类型绘制框框     
        
        #读取点云
        point_clond=read_point_cloud(os.path.join(DATA_PATH,'velodyne_points/data/%010d.bin'%frame))

        #发布点云
        publish_point_cloud(pcl_pub,point_clond)

        #发布指示线marker;由于不需要读取资料，所以直接发布即可
        #当采用markerarray发布方式，则车子和指示线都放在这个topic
        #进行发布即可。故下面的发布车子模型marker可以删除。这样子，可以解决不同marker发布不同步问题
        publish_ego_car(ego_pub)

        #发布车子模型marker;由于不需要读取资料，所以直接发布即可
        #publish_car_model(model_pub)

        #读取imu资料，这里也包含了gps资料了
        imu_data=read_imu(os.path.join(DATA_PATH,'oxts/data/%010d.txt'%frame))

        #发布imu资料
        publish_imu(imu_pub,imu_data)

        #发布gps资料
        publish_gps(gps_pub,imu_data)
        
        #发布
        rospy.loginfo("published")
        rate.sleep()
        frame+=1
        frame%=154

2、效果展示

包创建、源文件保存位置，运行编译，rviz添加新topic，这里不再罗嗦了，有不了解的，可以参考这系列之前博客内容。

那么，启动rviz，可以发现，播放视频里面，有了连续的2d侦测框框，而且，根据物体类型不同，框框显示不同颜色。具体效果如图中左下方。

3、一些想法

1）文件编写时候，一定要注意文件路径的编写正确性，个人建议终端使用pwd指令获取最有保障。

2）在读取tracking资料时候，发现只是读取traning文件夹里面的0000.txt，个人感觉这是因为这一个文件已经包含绘制框框所需要的全部信息了，觉得后面有时间可以查一下或者测试一下。

至此，kitti数据集中图片资料，根据不同类型绘制不同颜色侦测框，发布到ros中，在rviz显示任务完成～

#####################
学习课程来源up主，AI葵：
https://www.youtube.com/watch?v=TBdcwwr5Wyk

致谢AI葵老师
不积硅步，无以至千里
好记性不如烂笔头
感觉有点收获的话，麻烦大大们点赞收藏哈

以numpy或Torch的格式存储的公开数据集以科技求富强多模态聚类学习数据库 python 大数据 database
现有的以numpy或Torch的格式存储的公开数据集1.**MNIST**2.**CIFAR-10/CIFAR-100**3.**ImageNet**4.**COCO(CommonObjectsinContext)**5.**PascalVOC**6.**Fashion-MNIST**7.**BostonHousing**8.**Iris**9.**KITTI**10.**CelebA**11.*
SUDS复现 ashore_xsl 数码相机
1、环境配置根据下述要求：选择如下配置：记得切换安装源：运行下述代码克隆代码库： gitclonehttps://github.com/hturki/suds.git配置环境： condaenvcreate-fenvironment.yml激活环境： condaenvcreate-fenvironment.ym编译环境： pythonsetup.pyinstall2、数据准备（针对于KITTI数据
yolo-开源数据集coco kitti voc weixin_33862188
1、kitti数据集（参考博客：https://blog.csdn.net/jesse_mx/article/details/65634482https://blog.csdn.net/baolinq/article/details/78939192）（1）下载数据集和标签，下载第1个图片集Downloadleftcolorimagesofobjectdataset(12GB)和标注文件Downl
使用KITTI跑LIOSAM并完成EVO评价半熟芝士味 SLAM ubuntu slam c++
一、kitti转ROSbag1.1下载kitti数据集其中kitti中的十个序列对应的rawdata关系如下：00:2011_10_03_drive_002701:2011_10_03_drive_004202:2011_10_03_drive_003403:2011_09_26_drive_006704:2011_09_30_drive_001605:2011_09_30_drive_00180
Carla Simulator自动驾驶模拟器使用教程 zttsm 自动驾驶人工智能机器学习
前言：我想验证SLAM代码的效果，所以需要构建一个能提供自己和周围动车的位姿/轨迹和语义分割、bbx的真实值的复杂动态环境（最好能超过目前KITTI-Tracking序列的动态复杂度），所以要能设置CARLA世界中动车的密度、速度、与自己的相对距离、相对方向，和自己的速度；并能记录双目RGB和实例分割、轨迹、BBX。目录1.CARLA简介2.安装Carla客户端3.基础API的使用3.1clien
点云从入门到精通技术详解100篇-基于激光雷达点云的三维目标检测格图素书目标检测人工智能计算机视觉
目录前言图像目标检测算法研究现状点云目标检测算法研究现状基于投影图的方法基于体素的方法基于点云的多模态融合方法2地面点云滤波及神经网络2.1目标检测数据集及采集设备2.1.1KITTI数据集2.1.2车载激光雷达2.2地面点云滤波算法2.2.1RANSAC算法2.2.2CSF算法本文篇幅较长，分为上下两篇，下篇详见基于激光雷达点云的三维目标检测（续）前言近几年来，在计算机视觉领域，利用深度学习卷积
论文阅读《Semantic Stereo Matching with Pyramid Cost Volumes》 cunese0088 深度学习
SSPCV-Net（语义立体匹配网络）目的：进一步捕捉视差的细节主要模块：数据集：SceneFlow,KITTI2012,KITTI2015,Cityscape(比较泛化能力)-------------------------------------------------------------------------------------------------------Concatevo
【光流】——liteflownet论文与代码浅读农夫山泉2号光流计算机视觉深度学习人工智能光流 liteflownet
光流，liteflownetcode:mmflowCVPR20181.前言FlowNet2是最先进的光流估计卷积神经网络(CNN)，需要超过160M的参数来实现精确的流量估计。在本文中，我们提出了一种替代网络，它在Sintel和KITTI基准测试上优于FlowNet2，同时在模型尺寸上要小30倍，在运行速度上要快1.36倍。这是通过深入研究当前框架中可能被遗漏的架构细节而实现的：（1）我们通过轻量
unable to launch什么意思_激光SLAM | IMLS-SLAM：基于scan-to-model方法的大场景3D激光SLAM... weixin_39559097 unable to launch什么意思
论文题目：IMLS-SLAM:scan-to-modelmatchingbasedon3DdataIMSL-SLAM和IMSL-SLAM++是kitti数据集上仅次于LOAM的激光SLAM系统，虽然它有一个最大的缺点，就是不实时，而且时间确实非常慢（1.3s），但是作者也给出了这种不实时的原因，是可以改进的。更重要的是，论文里以IMLS曲面为基础进行的scan-to-model匹配方法是值得借鉴的
kitti数据集【图片、点云、IMU、GPS】话题发布（kitti2bag方式+python源码方式） liiiuzy ROS学习 python
kitti数据集传感器话题发布一、前期准备工作kitti数据集转bag安装vscode新建工作环境安装opencv-python二、发布图片三、发布点云数据四、整理前两次的代码五、添加汽车图片和摄像头视角常规写法优化写法六、发布IMU七、发布GPS一、前期准备工作kitti数据集转bag如果只是想把kitti数据集转成bag，直接用kiiti2bag指令就可以完成，教程在下面链接中。后文是详细的代
立体匹配常用数据集整理 Scurry﹉人工智能深度学习计算机视觉
文章目录前言一、常用数据集1.SceneFlow数据集2.KITTI数据集3.Middlebury数据集二、关于自己构建数据集训练的一些问题前言本文主要对立体匹配算法常用的公开数据集进行整理，包括数据集的简要介绍和下载链接，以及自己构建数据集训练的一些问题。一、常用数据集1.SceneFlow数据集Sceneflow数据集是CVPR2016提出的，其目的就是构建一个大规模的合成数据集，用来训练深度
基于Kitti数据集实现MMDetection3D点云物体检测训练 Xian-HHappy 技术知识点 kitti三维点云无人驾驶 MMDetection3D 人工智能计算机视觉目标检测
DataBall助力快速掌握数据集的信息和使用方式，会员享有百种数据集，持续增加中。需要更多数据资源和技术解决方案，知识星球：“DataBall-X数据球(free)”贵在坚持！-----------------------------------------------------------------------------------------------MMDetection3D环境安
colmap 已知pose 重建 kitti数据尝试鹿米lincent 知识深度学习自动驾驶计算机视觉
FrequentlyAskedQuestions—COLMAP3.7documentationCOLMAP已知相机内外参数重建稀疏/稠密模型-thronsbird-博客园Colmap根据相机内外参数重建稀疏模型_m0_47677188的博客-CSDN博客_colmap命令行准备images.txt现利用colmap的script提取database中的id-name对应关系colmap/scrip
Pyramid Stereo Matching Network Songger
https://s3.eu-central-1.amazonaws.com/avg-kitti/data_scene_flow.zipThisrepositorycontainsthecode(inPyTorch)for"PyramidStereoMatchingNetwork"paper(CVPR2018)byJia-RenChangandYong-ShengChen.Citation@inpr
PSM-Net根据Stereo图像生成depth图像振华OPPO ORB-SLAM2 深度学习人工智能 slam psm-net 深度图像
一、新建文件夹在KITTI数据集下新建depth_0目录二、激活anaconda环境condaactivatept14py37三、修改submission.py文件3.1KITTI数据集路径parser.add_argument('--datapath',default='/home/njust/KITTI_DataSet/00/',help='selectmodel')3.2深度图像输出路径sa
Ubuntu20.04更新Cmake版本详解 loveCC_orange Linux 自动驾驶 c++驱动开发 ubuntu linux
最近在跑一个融合惯导定位的slam框架ins_eskf_kitti，在框架的安装过程中，需要对从GitHub上克隆下来的glog进行编译。其命令如下：glog：gitclonehttps://github.com/google/glog.gitcdglogmkdirbuildcdbuildcmake..make其中在执行到cmake的时候出现了报错。提醒说是cmake版本较低，需要cmake-3.
使用 KITTI数据集训练YOLOX a flying bird 计算机视觉计算机视觉
1.现在KITTI集后，首先将数据集转换为COCO数据集格式。kitti_vis.pyimportosfrompathlibimportPathimportnumpyasnpimportcv2defanno_vis(img,anno_list):forannoinanno_list:points=np.array(anno[4:8],dtype=np.float32)cv2.rectangle(i
Ubuntu22.04安装OpenPcDet训练kitti数据集(nuscenes-mini数据集） RickySam python ubuntu
0.前言因为想要接触KITTI数据集和Nuscenes数据集，有相关项目需要配置OpenPcDet，而原服务器因系统重装为Ubuntu22.04版本，该版本较高故重新配置环境是需要参考各种渠道，在此将这些参考汇总，也方便自己以后再配置可以清晰一点。本文综合了多篇文章。1.环境配置默认已安装好NVIDIA驱动1.1安装cuda和cudnn1.1.1前置工作首先查看自己的显卡信息nvidia-smi+
【PMF代码复现及可视化】ICCV 2021 基于视觉感知的多传感器融合点云语义分割努力弹琴的大风天融合语义分割算法PMF 人工智能计算机视觉
前言本文在Ubuntu18.04下，使用python3.6pytorch1.8.2+torchvision0.9.2环境运行。电脑配置：NVIDIAGeForceRTX3060。显卡不是特别好，运行训练代码花费4天11个小时。数据集非常大，原始数据集按照数据集格式和架构配置完成165.2GB左右，生成semantic-kitti-fov数据集28.1G。如果没有足够的空间，不建议跑这个论文项目。考
【Deeplabv3+】Ubutu18.04中使用pytorch复现Deeplabv3+第三步)-----CityscapesScripts生成自己的标签努力弹琴的大风天 Deeplabv3+复现 pytorch 人工智能 python 深度学习
本文是在前面两篇文章的基础上，讲解如何更改训练数据集颜色，需要与前面两篇文章连起来看。本文用于修改cityscapes数据集的标签颜色与Semankitti数据集的标签一致，对修改后的数据集进行训练。需要下载两个开发工具包和一个数据集，分别是cityscapesScripts-master、semantic-kitti-api-master和cityscapes数据集：cityscapesScri
TrackR-CNN测试结果感觉不对劲啊朱朱呀笔记 MOTS #tensorflow tensorflow 深度学习神经网络
pythonmain.pyconfigs/conv3d_sep2"{\"task\":\"forward_tracking\",\"dataset\":\"KITTI_segtrack_feed\",\"load_epoch_no\":5,\"batch_size\":5,\"export_detections\":true,\"do_tracking\":false,\"video_tags_t
cd /content/drive/MyDrive fayetdd 深度学习 pytorch
cd/content/drive/MyDrive/GD-MAEpythonsetup.pydevelop--usercdpcdet/ops/dcnrm-rfbuild/pythonsetup.pydevelop--userpythontrain.py--cfg_file./cfgs/kitti_models/pointpillar.yamlWaymoDataset—MMDetection3D1.3
Stereo Matching (Kitti Benchmark) 国民英雄ququ
Kitti的stereomatchingbenchmark有2012和2015两个版本。在2012的版本中，groundtruth是利用ICP从先后五帧的点云中求得相对pose，和积累得到的点云，利用camera的参数信息反投回图像，再人为的移除镜面反射的区域得到。在和其他benchmark，比方说middleburry的stereo数据集的比较过程中发现，一些基于localpatch的方法在mi
语义分割数据集 TechMasterPlus 图像分割人工智能
KITTI（KarlsruheInstituteofTechnologyandToyotaTechnologicalInstitute）数据集是一个用于计算机视觉和自动驾驶研究的公开数据集。该数据集主要关注移动机器人和计算机视觉方向的应用，提供了大量的传感器数据和标注信息。以下是对KITTI数据集的一些主要特点和描述：数据类型：KITTI数据集提供了多种传感器数据，包括激光雷达（LiDAR）扫描、
【AI】大模型训练的常用图像数据集 giszz 学习笔记人工智能人工智能
目录一、常用的数据集1.1ImageNet1.2PASCALVOC1.3MSCOCO1.4KITTI1.5LabelMe二、一些垂直领域的数据集如鱼类2.1FishSpeciesDataset2.2Large-scaleFishDatasetsforClassificationandSegmentation2.3FishMarketDataset2.4fish4knowledge三、找数据集和基本
KITTI2012、ETH3D数据集下载代码写着写着就会了 ubuntu linux
KITTI2012/2015双目立体匹配(stereomatching)数据集百度云下载_kitti2015数据集百度云-CSDN博客Datasets-ETH3D
Ubuntu 解压 zip、z01、z02等文件方法幸福回头系统相关 linux
首先，最近下载了KITTI数据集，其中点云和图像的数据是zip、z01、z02等格式的，需要先将这些压缩包合并后再解压，具体方法如下：文件名:data_object_image_2.zip，data_object_image_2.z01，data_object_image_2.z02解压命令：先用zip将其中的文件进行合并，然后再解压，可以获得所有文件。zip-s0data_object_imag
使用 Open3D 的 3D LiDAR 可视化：用于自动驾驶的 2D KITTI 深度框架-含数据集+源码 TD程序员深度学习开发实践系列自动驾驶人工智能机器学习深度学习神经网络 3d
3DLiDAR传感器（或）3维光探测和测距是一种先进的发光仪器，能够像我们人类一样在3维空间中感知现实世界。这项技术尤其彻底改变了地球观测、环境监测、侦察以及现在的自动驾驶领域。它提供准确和详细数据的能力有助于增进我们对环境和自然资源的理解和管理。在这篇权威研究文章中，我们将全面关注3DLiDAR传感器数据的可视化，并尝试深入了解自动驾驶的3D点云表示系统。请继续关注本文的高潮部分——展示3D点云
轨迹评估工具使用：evo安装以及学习 sugardisk 学习计算机视觉
evo是一款用于视觉里程计和slam问题的轨迹评估工具。核心功能是能够绘制相机的轨迹，或评估估计轨迹与真值的误差。支持多种数据集的轨迹格式（TUM、KITTI、EuRoCMAV、ROS的bag），同时支持这些数据格式之间进行相互转换。在此仅对其基本功能做简要介绍。evo工具github地址一、安装在终端使用安装命令即可：注：需要安装一下相关的依赖sudoaptinstallpython-pippi
基于MMDet3D的pointpillars和centernet推理（mmdet3d v1.0 rc）一只糊涂虫儿 3d pytorch 深度学习
文章目录mmdetection3D学习文档安装环境方法一方法二（我没用）验证通过点云样例程序来验证数据预处理KITTI数据集预处理NuScenes数据集预处理使用已有模型在标准数据集上进行推理和训练在标准数据集上训练预定义模型在KITTI数据集上训练pointpillars准备数据集训练在NuScenes数据集上训练pointpillars准备数据集训练centerpoint实现mmdetecti
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s

kitti之ros可视化_学习笔记--第8课：tracking资料下载及2d侦测框绘制

0、tracking资料下载和一些注意问题

1、源码及解析

2、效果展示

3、一些想法

你可能感兴趣的:(kitti)