'十月'

3D目标检测VoexlNet

3D目标检测VoexlNet 模型构建

博客参考：论文阅读：VoxelNet（3D-detection）+代码复现_手写代码3ddetection_Little_sky_jty的博客-CSDN博客

Voxelnet 模型构建
1,init方法初始化模型，包括多级体素特征编码模块，3D卷积特征提取模块，RPN检测头回归分类模块
2，forward方法训练模型，传入参数：
    sparse_features(k,t,7)体素特征，来源于数据集构建模块，k个体素，每个体素t个点，每个点7个特征信息(x,y,z,r,x',y,'z')
    coords(k,3)：所有体素位置信息
    1,通过SVFE对于体素特征进行编码，编码过程聚合各个单独点与所在体素局部信息，最后进行最大池化，代表每个体素特征信息(k,128)
    2,稀疏特征浓密化，也就是对于每个位置的体素，赋予其特征信息，构成(b,c,d,h,w)张量
    3,使用3D卷积对于深度方向进行压缩，并减少通道数(b,64,2,400,352)
    4,合并通道和深度方向，此时可看做2维图像进行2D卷积处理(b,(64x2),400,352),
       处理过程常用的特征金字塔构建形式，拓展通道数，减少尺寸，最后上采样聚合多层特征图得到全局特征，
       使用全局特征进行分类预测(b,2,400,352)这里1x1卷积核图像尺寸不变
       使用全局信息进行回归判断(b,2*7,400,452)也是1x1卷积图像尺寸不变

1 Featurelearninglayer

网络的输入是 batch×N×4 ，batchxNx4batch×N×4的数据格式，即是batch（代码中设置为1，即每次值输入一个Bin文件）,一个bin文件中的点云数量N、每个点云的维度(x,y,z,r)。
我们知道该层的处理是首先分区，输入点云经过裁剪后的D×W×H=4×80×70.4，实际上的范围可以在config.py文件中看到：

	# classes
    class_list = ['Car', 'Van']

    # batch size
    N=2

    # maxiumum number of points per voxel
    T=35

    # 每个体素网格尺寸voxel size
    vd = 0.4
    vh = 0.2
    vw = 0.2

    # points cloud range
    xrange = (0, 70.4)
    yrange = (-40, 40)
    zrange = (-3, 1)
    
    D×W×H=4×80×70.4每个bin文件分成了
    其中xrange(0-70.4)
    yrange(-40-40)
    zrange(-3 - 1)
    cfg.W = 70.2/0.2=352 x轴方向352个格子
    cfg.H = 80/0.2=400 y方向400个格子
    cfg.D = 4/0.2=20 z方向20个格子
    每个格子中最大包含点的个数为35
    处理后为K个空体素则处理后表示为 （K，35,4）
    融合局部信息局部voxel的点云的均值，再通过残差的方式加入到每个点的信息中 （K，35,7）

X轴：(0,70.4)；Y轴：(−40,40)；然后经过partion，代码中把每一个voxel的最大的点云量设置为T=35；所以我们假设一共有k个非空的体素，经过这样处理后我们将点云表示为K×T×4。

接下来就是对全局信息和局部信息的综合。通过求每一个局部voxel的点云的均值，再通过残差的方式加入到每个点的信息中，即会增加三个局部信息的维度：K × T × 7 。

SVEF对体素特征进行处理

FCN

一个简单的FCN层
普通FCN是(12,30) -> (12,30) * (30,128) == (12,128)改变通道的作用，
也可以拉伸二维成1位 (12,5) - (1，12*5,) * （60，80） ==（1,80）映射到分类个数

这里应用在VoxelNet中，SVFE中的VFE模块，提取体素特征，改变通道数
处理[b,k,t,7]体素特征到[b,k,t,128]

思路流程就是，分清楚那个是通道，是需要变化的，那些是不需要变化的
对于不需要变化的给他乘成kt的形式，（kt , 7） * (7,128)==(kt , 128)
再进行一个还原 (kt , 128) .view(k,t,128)即可。

VFE

简单而言，体素特征编码就是将(k,t,7)->(k,t,32)但是转化过程中不仅仅使用FCN改变通道数，这样直接改变获取的还是各个点的单独点特征信息，没有与局部特征信息融合。

这里提出的融合策略是，首先将(k,t,7)->(k,t,16)通过fcn得到每个点16个特征，之后获取每个体素中所有点16个特征中每一位最大值，一个16位，比如第一个特征，在35个点中取最大的，第二个特征在35个点取最大的。维度变化叫(k,t,16) -> (k,16)。获得的这16个特征就相当于35个点中16个位置上最明显的16个特征，这个点能够代表这35个点，把这个点重复35次，之后与之前每个点16个单独特征cat起来，相当于对于35个点自己存在的16个单独特征的基础上添加局部特征，(k,16)->(k,1,16)->(k,t,16)。up(k,t,16) cat down(k,t,16) = (k,t,32)。

SVFE

使用多次VFE操作对于当前点云集合进行特征提取以及融合单个点和局部体素特征信息。同时在每次融合的过程中会使用mask对于那些点特征没0大进行忽略。(k,t,7)->(k,t,32)->(k,t,128)->(k,t,128)->(k,128)。最后使用了一个max来获取这个体素的全局信息，以一个包含128特征的点代表这个体素。


class FCN(nn.Module):
    def __init__(self,cin,cout):
        super(FCN, self).__init__()
        self.cout = cout
        self.cin = cin
        self.linear = nn.Linear(cin,cout)
        self.bn = nn.BatchNorm1d(cout)

    def forward(self,x):
        k,t,_ = x.shape
        x = self.linear(x.view(k*t,-1))#(3,4,7) ->(12,7) * (7,128) ->(12,128)
        x = self.bn(x)
        x = F.relu(x)
        return x.view(k,t,-1) #(12,128) ->(3,4,128)
    
    
#(k,16)->(k,1,16)->(k,t,16)。up(k,t,16) cat down(k,t,16) = (k,t,32)
class VFE(nn.Module):
    def __init__(self,cin,cout):
        super(VFE, self).__init__()
        #这里是对2求余确保能够整除
        assert cout % 2 == 0
        self.unit = cout//2
        #这里我们的线性层已经进行了处理，(3,4,7)->(3,4,32)改变通道数了直接
        self.linear = FCN(cin,self.unit)
        self.relu = nn.ReLU()
        self.bn = nn.BatchNorm1d(self.unit)

    def forward(self,x,mask):
        k,t,d = x.size()
        #up(k,t,16)所以这里直接放原始数据就好
        up = self.linear(x)
        #(k,t,16) -> (k,16)->(k,1,16)->(k,t,16)获取t个点的每一位特征中最大值共16位，重复t次
        down = torch.max(up,1)[0].unsqueeze(1).repeat(1,cfg.T,1)
        #up(k,t,16) cat down(k,t,16) = (k,t,32)融合t个点一半单独特征一半局部特征
        pwcf = torch.concat((up,down),dim=2)
        # mask = [k,t] [3,35]->[3,35,cout] mask选择特征值大于0的点
        mask = mask.unsqueeze(2).repeat(1,1,self.unit*2)
        pwcf = pwcf * mask.float()
        #mask = mask.unsqueeze(2).repeat(1,1,self.unit*2)
        #pwcf = pwcf*mask.float()
        return pwcf

# 第一步1 堆叠体素特征编码吗 Stacked Voxel Feature Encoding
#网络输入形式 batch×N×4
#D×W×H=4×80×70.4每个bin文件分成了   其中xrange(0-70.4)  yrange(-40-40) zrange(-3 - 1)
#每个体素网格尺寸 vd = 0.4 vh = 0.2，vw = 0.2  70.2/0.2=352 80/0.2=400 4/0.2=20
class SVFE(nn.Module):

    def __init__(self):
        super(SVFE, self).__init__()
        #[B, K, T, 7]；在生成大小为[B, K, T, 128]经过两个VFE层
        self.vfe_1 = VFE(7,32)
        self.vfe_2 = VFE(32,128)
        self.fcn = FCN(128,128)
    def forward(self, x):
        #torch.ne 判断元素不相等[b,k,t,7]就是判断该体素包含点云的点不为空嘛
        mask = torch.ne(torch.max(x,2)[0], 0)
        x = self.vfe_1(x, mask)
        x = self.vfe_2(x, mask)
        x = self.fcn(x)
        # element-wise max pooling
        x = torch.max(x,1)[0]
        return x

VEF的具体实现如图所示：其思想就是从体素特征中获得各个点的特征，之后进行一个特征聚合，如同残差操作将聚合后的局部信息与原始点特征信息结合起来。

离散信息聚合成浓密信息

        def voxel_indexing(self, sparse_features, coords):
        '''
        #vwfs:体素特征编码(k,128),k个体素，每个包含128特征  voxel_coords:所有点在空间中对应的体素位置(k,4)，k个体素位置和其归属bt
        :param sparse_features: 体素特征编码(k,128)
        :param coords: 在空间中对应的体素位置(k,4)  (n,(bt_id,x,y,z))-->(1,2,200,150)这里一共四个参数，每个体素归属的batch和x,y,z坐标位置
        :return:带有位置信息以及特征信息的（两个batch）样本的体素特征信息(b,C,Z,Y,X)
        '''
        # 128
        dim = sparse_features.shape[-1]
        #D×W×H=4×80×70.4每个bin文件分成了
        #(特征维度, batchsize, 深度, 高度, 宽度)
        #(128, 2, 10, 400, 352) 2代表一个batch有两个样本，要区分不同样本，sparse_features是一个batch所有体素特征
        #初始化浓密特征，目的将每个体素信息和特征信息组合起来(128,bt归属,z,w,h,w)
        dense_feature = Variable(torch.zeros(dim, cfg.N, cfg.D, cfg.H, cfg.W).cuda())
        #dense_feature[:, coords[:,0], coords[:,1], coords[:,2], coords[:,3]]= sparse_features
        #dense_feature[128 , (k个)b , (k个)z, (k个)y, (k个)x] = [128 ,k]给以每个具体包含位置信息的体素添加其特征信息
        #比如我k=1时,代表第一个体素
        # dense_feature(128,coords[1,0] -- 第1个体素bt归属,coords[1,1]-- 第1个体素z,coords[1,2]，coords[1,3])
        #给予每个对应位置的体素，对应的128维度的特征信息
        dense_feature[:, coords[:, 0], coords[:, 1], coords[:, 2], coords[:, 3]] = sparse_features.transpose(0,1)
        #[128,2,10,400,352]->[2,128,10,400,352] (C,B,D,W,H) −> (B,C,D,H,W)
        return dense_feature.transpose(0, 1)

总结一下这一层，这里做的操作就是对每一个voxel的特征进行提取，但是为了不操作空的呢，就只对非空的进行提取；同时VFE层采用了局部和全局坐标结合的方式特取特征；同时又为了解决有的voxel的点不足T个，所有最后采用最大池化表示了一个voxel的特征。

2 CLM 3D特征提取

# Convolutional Middle Layer
#(B,C,D,H,W) : [1,128,10,400,352]
#(B,D,H,W,C)−>(B,C,D,H,W)
#[2,128,10,400,352]
class CML(nn.Module):
    def __init__(self):
        super(CML, self).__init__()
        #[1,128,10,400,352]->[1,64,5,400,352]
        self.conv3d_1 = Conv3d(128, 64, 3, s=(2, 1, 1), p=(1, 1, 1))
        #[1,64,10,400,352]->[1,64,3,400,352]
        self.conv3d_2 = Conv3d(64, 64, 3, s=(1, 1, 1), p=(0, 1, 1))
        #[1,64,4,400,352]->[1,64,2,400,352]
        self.conv3d_3 = Conv3d(64, 64, 3, s=(2, 1, 1), p=(1, 1, 1))

    def forward(self, x):
        x = self.conv3d_1(x)
        x = self.conv3d_2(x)
        x = self.conv3d_3(x)
        return x

3 RPN产生预测回归结果

# Region Proposal Network
#(2,128,400,352)
class RPN(nn.Module):
    def __init__(self):
        super(RPN, self).__init__()
        #第一次下采样，通道数不变，卷积核3，步长为2，宽高减小一半 h/2 w/2
        self.block_1 = [Conv2d(128, 128, 3, 2, 1)]
        #再来三次，通道不变，宽高不变
        self.block_1 += [Conv2d(128, 128, 3, 1, 1) for _ in range(3)]
        self.block_1 = nn.Sequential(*self.block_1)
        #第二次下采样，通道不变，积核3，步长为2，宽高减小一半h/2 w/2
        #再来五次，通道不变，宽高不变
        self.block_2 = [Conv2d(128, 128, 3, 2, 1)]
        self.block_2 += [Conv2d(128, 128, 3, 1, 1) for _ in range(5)]
        self.block_2 = nn.Sequential(*self.block_2)
        #第三次下采样，通道128->256，卷积核3，步长2,尺寸减半
        self.block_3 = [Conv2d(128, 256, 3, 2, 1)]
        #重复5次，通道不变，尺寸不变
        self.block_3 += [nn.Conv2d(256, 256, 3, 1, 1) for _ in range(5)]
        self.block_3 = nn.Sequential(*self.block_3)
        #利用进行上采样为聚合做准备，通道数统一到256，上采样4倍，2倍，1倍，尺寸统一到w/2
        self.deconv_1 = nn.Sequential(nn.ConvTranspose2d(256, 256, 4, 4, 0),nn.BatchNorm2d(256))
        self.deconv_2 = nn.Sequential(nn.ConvTranspose2d(128, 256, 2, 2, 0),nn.BatchNorm2d(256))
        self.deconv_3 = nn.Sequential(nn.ConvTranspose2d(128, 256, 1, 1, 0),nn.BatchNorm2d(256))
        #检测头，一边是分类，一边是回归 分类到2类，回归到2*7
        self.score_head = Conv2d(768, cfg.anchors_per_position, 1, 1, 0, activation=False, batch_norm=False)
        self.reg_head = Conv2d(768, 7 * cfg.anchors_per_position, 1, 1, 0, activation=False, batch_norm=False)

    def forward(self,x):
        x = self.block_1(x)
        x_skip_1 = x
        x = self.block_2(x)
        x_skip_2 = x
        x = self.block_3(x)
        x_0 = self.deconv_1(x)
        x_1 = self.deconv_2(x_skip_2)
        x_2 = self.deconv_3(x_skip_1)
        x = torch.cat((x_0,x_1,x_2),1)
        return self.score_head(x),self.reg_head(x)

完整模型构建代码

import torch.nn as nn
import torch.nn.functional as F
import torch
from torch.autograd import Variable
from config import config as cfg

import torch.utils.data as data

# conv2d + bn + relu
from data.kitti import KittiDataset, detection_collate


class Conv2d(nn.Module):

    def __init__(self,in_channels,out_channels,k,s,p, activation=True, batch_norm=True):
        super(Conv2d, self).__init__()
        self.conv = nn.Conv2d(in_channels,out_channels,kernel_size=k,stride=s,padding=p)
        if batch_norm:
            self.bn = nn.BatchNorm2d(out_channels)
        else:
            self.bn = None
        self.activation = activation
    def forward(self,x):
        x = self.conv(x)
        if self.bn is not None:
            x=self.bn(x)
        if self.activation:
            return F.relu(x,inplace=True)
        else:
            return x

# conv3d + bn + relu
class Conv3d(nn.Module):

    def __init__(self, in_channels, out_channels, k, s, p, batch_norm=True):
        super(Conv3d, self).__init__()
        self.conv = nn.Conv3d(in_channels, out_channels, kernel_size=k, stride=s, padding=p)
        if batch_norm:
            self.bn = nn.BatchNorm3d(out_channels)
        else:
            self.bn = None

    def forward(self, x):
        x = self.conv(x)
        if self.bn is not None:
            x = self.bn(x)

        return F.relu(x, inplace=True)

# Fully Connected Network
class FCN(nn.Module):

    def __init__(self,cin,cout):
        super(FCN, self).__init__()
        self.cout = cout
        self.linear = nn.Linear(cin, cout)
        self.bn = nn.BatchNorm1d(cout)

    def forward(self,x):
        # KK is the stacked k across batch
        kk, t, _ = x.shape
        x = self.linear(x.view(kk*t,-1))
        x = F.relu(self.bn(x))
        return x.view(kk,t,-1)

# Voxel Feature Encoding layer
#1 SVFE调用VFE模块，处理[b,k,t,7]体素特征到[b,k,t,128]
class VFE(nn.Module):

    def __init__(self,cin,cout):
        super(VFE, self).__init__()
        assert cout % 2 == 0
        #注意这里只学习输出通道的一半维度
        self.units = cout // 2
        self.fcn = FCN(cin,self.units)

    def forward(self, x, mask):
        # point-wise feauture
        #使用全连接层获取每个点的特征，此时通道数为16
        pwf = self.fcn(x)
        #locally aggregated feature
        #进行聚合获取区域局部特征，聚合16个通道的最大值，最为局部信息，重复16次
        laf = torch.max(pwf,1)[0].unsqueeze(1).repeat(1,cfg.T,1)
        # point-wise concat feature
        #点特征与局部特征堆叠 16+16=32组合成输出通道要求
        pwcf = torch.cat((pwf,laf),dim=2)
        # apply mask mask = [k,t] [3,35]->[3,35,cout]
        mask = mask.unsqueeze(2).repeat(1, 1, self.units * 2)
        pwcf = pwcf * mask.float()

        return pwcf

# 第一步1 堆叠体素特征编码吗 Stacked Voxel Feature Encoding
#D×W×H=4×80×70.4每个bin文件分成了   其中xrange(0-70.4)  yrange(-40-40) zrange(-3 - 1)
#每个体素网格尺寸 vd = 0.4 vh = 0.2，vw = 0.2  70.2/0.2=352 80/0.2=400 4/0.2=20
class SVFE(nn.Module):

    def __init__(self):
        super(SVFE, self).__init__()
        #[ K, T, 7]；在生成大小为[K, T, 128]经过两个VFE层
        #完成每个单个体素特征编码的工作，一般点单独特征加上一半体素局部特征
        self.vfe_1 = VFE(7,32)
        self.vfe_2 = VFE(32,128)
        self.fcn = FCN(128,128)
    def forward(self, x):
        #torch.ne 判断元素不相等[k,t,7]就是判断该体素包含的特征不为0.
        # 也就是将一个体素中那些点最大特征值特征没0大的点进行忽略[3,35]
        #这里7个特征是(x,y,z,r,x',y',z') '代表的是各个点的相对位置
        #忽略最大值小于0的点(k,t)
        mask = torch.ne(torch.max(x,2)[0], 0)
        #[k,t,7]->[k,t,32]
        x = self.vfe_1(x, mask)
        #[k,t,32]->[k,t,128]
        x = self.vfe_2(x, mask)
        x = self.fcn(x)
        # element-wise max pooling
        # 对于一个体素中所有点进行maxpollig选一个点代表这个体素
        # [k,128]这个点包含了这个体素所有点的单独信息和完整体素的局部信息，相当于CNN中升通道降尺寸的操作
        x = torch.max(x,1)[0]
        return x

# Convolutional Middle Layer
#(B,C,D,H,W) : [1,128,10,400,352]
#(B,D,H,W,C)−>(B,C,D,H,W)
#[2,128,10,400,352]
class CML(nn.Module):
    def __init__(self):
        super(CML, self).__init__()
        #[1,128,10,400,352]->[1,64,5,400,352]
        self.conv3d_1 = Conv3d(128, 64, 3, s=(2, 1, 1), p=(1, 1, 1))
        #[1,64,10,400,352]->[1,64,3,400,352]
        self.conv3d_2 = Conv3d(64, 64, 3, s=(1, 1, 1), p=(0, 1, 1))
        #[1,64,4,400,352]->[1,64,2,400,352]
        self.conv3d_3 = Conv3d(64, 64, 3, s=(2, 1, 1), p=(1, 1, 1))

    def forward(self, x):
        x = self.conv3d_1(x)
        x = self.conv3d_2(x)
        x = self.conv3d_3(x)
        return x

# Region Proposal Network
#(2,128,400,352)
class RPN(nn.Module):
    def __init__(self):
        super(RPN, self).__init__()
        #第一次下采样，通道数不变，卷积核3，步长为2，宽高减小一半 h/2 w/2
        self.block_1 = [Conv2d(128, 128, 3, 2, 1)]
        #再来三次，通道不变，宽高不变
        self.block_1 += [Conv2d(128, 128, 3, 1, 1) for _ in range(3)]
        self.block_1 = nn.Sequential(*self.block_1)
        #第二次下采样，通道不变，积核3，步长为2，宽高减小一半h/2 w/2
        #再来五次，通道不变，宽高不变
        self.block_2 = [Conv2d(128, 128, 3, 2, 1)]
        self.block_2 += [Conv2d(128, 128, 3, 1, 1) for _ in range(5)]
        self.block_2 = nn.Sequential(*self.block_2)
        #第三次下采样，通道128->256，卷积核3，步长2,尺寸减半
        self.block_3 = [Conv2d(128, 256, 3, 2, 1)]
        #重复5次，通道不变，尺寸不变
        self.block_3 += [nn.Conv2d(256, 256, 3, 1, 1) for _ in range(5)]
        self.block_3 = nn.Sequential(*self.block_3)
        #利用进行上采样为聚合做准备，通道数统一到256，上采样4倍，2倍，1倍，尺寸统一到w/2
        self.deconv_1 = nn.Sequential(nn.ConvTranspose2d(256, 256, 4, 4, 0),nn.BatchNorm2d(256))
        self.deconv_2 = nn.Sequential(nn.ConvTranspose2d(128, 256, 2, 2, 0),nn.BatchNorm2d(256))
        self.deconv_3 = nn.Sequential(nn.ConvTranspose2d(128, 256, 1, 1, 0),nn.BatchNorm2d(256))
        #检测头，一边是分类，一边是回归 分类到2类，回归到2*7
        self.score_head = Conv2d(768, cfg.anchors_per_position, 1, 1, 0, activation=False, batch_norm=False)
        self.reg_head = Conv2d(768, 7 * cfg.anchors_per_position, 1, 1, 0, activation=False, batch_norm=False)

    def forward(self,x):
        x = self.block_1(x)
        x_skip_1 = x
        x = self.block_2(x)
        x_skip_2 = x
        x = self.block_3(x)
        x_0 = self.deconv_1(x)
        x_1 = self.deconv_2(x_skip_2)
        x_2 = self.deconv_3(x_skip_1)
        x = torch.cat((x_0,x_1,x_2),1)
        return self.score_head(x),self.reg_head(x)

    '''
    Voxelnet 模型构建
    1,init方法初始化模型，包括多级体素特征编码模块，3D卷积特征提取模块，RPN检测头回归分类模块
    2，forward方法训练模型，传入参数：
        sparse_features(k,t,7)体素特征，来源于数据集构建模块，k个体素，每个体素t个点，每个点7个特征信息(x,y,z,r,x',y,'z')
        coords(k,3)：所有体素位置信息
        1,通过SVFE对于体素特征进行编码，编码过程聚合各个单独点与所在体素局部信息，最后进行最大池化，代表每个体素特征信息(k,128)
        2,稀疏特征浓密化，也就是对于每个位置的体素，赋予其特征信息，构成(b,c,d,h,w)张量
        3,使用3D卷积对于深度方向进行压缩，并减少通道数(b,64,2,400,352)
        4,合并通道和深度方向，此时可看做2维图像进行2D卷积处理(b,(64x2),400,352),
           处理过程常用的特征金字塔构建形式，拓展通道数，减少尺寸，最后上采样聚合多层特征图得到全局特征，
           使用全局特征进行分类预测(b,2,400,352)这里1x1卷积核图像尺寸不变
           使用全局信息进行回归判断(b,2*7,400,452)也是1x1卷积图像尺寸不变
    '''
class VoxelNet(nn.Module):

    def __init__(self):
        super(VoxelNet, self).__init__()
        #堆叠体素特征
        self.svfe = SVFE()
        #3D卷积特征提取
        self.cml = CML()
        #检测头
        self.rpn = RPN()

    #作用就是组合所有体素的特征和位置信息
    def voxel_indexing(self, sparse_features, coords):
        '''
        #vwfs:体素特征编码(k,128),k个体素，每个包含128特征  voxel_coords:所有点在空间中对应的体素位置(k,4)，k个体素位置和其归属bt
        :param sparse_features: 体素特征编码(k,128)
        :param coords: 在空间中对应的体素位置(k,4)  (n,(bt_id,x,y,z))-->(1,2,200,150)这里一共四个参数，每个体素归属的batch和x,y,z坐标位置
        :return:带有位置信息以及特征信息的（两个batch）样本的体素特征信息(b,C,Z,Y,X)
        '''
        # 128
        dim = sparse_features.shape[-1]
        #D×W×H=4×80×70.4每个bin文件分成了
        #(特征维度, batchsize, 深度, 高度, 宽度)
        #(128, 2, 10, 400, 352) 2代表一个batch有两个样本，要区分不同样本，sparse_features是一个batch所有体素特征
        #初始化浓密特征，目的将每个体素信息和特征信息组合起来(128,bt归属,z,w,h,w)
        dense_feature = Variable(torch.zeros(dim, cfg.N, cfg.D, cfg.H, cfg.W).cuda())
        #dense_feature[:, coords[:,0], coords[:,1], coords[:,2], coords[:,3]]= sparse_features
        #dense_feature[128 , (k个)b , (k个)z, (k个)y, (k个)x] = [128 ,k]给以每个具体包含位置信息的体素添加其特征信息
        #比如我k=1时,代表第一个体素
        # dense_feature(128,coords[1,0] -- 第1个体素bt归属,coords[1,1]-- 第1个体素z,coords[1,2]，coords[1,3])
        #给予每个对应位置的体素，对应的128维度的特征信息
        dense_feature[:, coords[:, 0], coords[:, 1], coords[:, 2], coords[:, 3]] = sparse_features.transpose(0,1)
        #[128,2,10,400,352]->[2,128,10,400,352] (C,B,D,W,H) −> (B,C,D,H,W)
        return dense_feature.transpose(0, 1)

    def forward(self, voxel_features, voxel_coords):
        #这里是在数据集中getitem得到数据，也就是一个样本的点云数据，没有batch,直接是一个场景样本包含的数据
        #(3186,35,7) 一共3186个体素，每个体素35以下的点，每个点7个特征（x,y,z,r,x',y',z'）
        # feature learning network
        #(k,128)
        vwfs = self.svfe(voxel_features)
        #vwfs:体素特征编码(k,128)  voxel_coords:所有点对应的体素坐标(n,3)
        vwfs = self.voxel_indexing(vwfs,voxel_coords)

        # convolutional middle network
        #[1,64,2,400,352]
        cml_out = self.cml(vwfs)

        # region proposal network
        #将深度维度和特征维度融合，相当于拉到一个平面，输出分数和边界回归结果
        # merge the depth and feature dim into one, output probability score map and regression map
        # cml_out.view(cfg.N,-1,cfg.H, cfg.W) = (2,128(2x64),400,352)
        psm,rm = self.rpn(cml_out.view(cfg.N,-1,cfg.H,cfg.W))
        #probability score map , regression map
        return psm, rm


def main():
    #[b,k,t,7]这里t要是35才行一个体素35个点，一个点32个特征

    root_path = "D:/python/data/mkitti"
    dataset = KittiDataset(cfg=cfg, root=root_path, set='train')
    data_loader = data.DataLoader(dataset, batch_size=cfg.N, num_workers=0, collate_fn=detection_collate, shuffle=True, \
                                  pin_memory=False)
    batch_iterator = None
    epoch_size = len(dataset) // cfg.N
    net = VoxelNet()
    net.cuda()
    for iteration in range(5):
            if (not batch_iterator) or (iteration % epoch_size == 0):
                # create batch iterator
                batch_iterator = iter(data_loader)

            voxel_features, voxel_coords, pos_equal_one, neg_equal_one, targets, images, calibs, ids = next(batch_iterator)
            voxel_features = Variable(torch.cuda.FloatTensor(voxel_features))#(8874,35,7)
            pos_equal_one = Variable(torch.cuda.FloatTensor(pos_equal_one))#(2,200,176,2)
            neg_equal_one = Variable(torch.cuda.FloatTensor(neg_equal_one))#(2,200,176,2)
            targets = Variable(torch.cuda.FloatTensor(targets))#(2,200,176,14)
            psm, rm = net(voxel_features, voxel_coords)
            print(psm.size())
            print(rm.size())
    # x = torch.randn(3,cfg.T,7)
    # x_coords = torch.arange(12).reshape(3,4)

    # vef = VFE(7,32)
    # y = vef(x)
    # fcn = FCN(7,32)
    # y = fcn(x)
    #print(y.size())
    #torch.Size([3, 35, 32])


if __name__ == '__main__':
    main()

VoxelNet 数据集处理

'''
数据集 __getitem__(self, i)方法：
    1,取得该图像对应的各个数据路径地址
    2,加载映射文件，calib字典，包括内参P，转置矩阵R，外参Tr
    3,加载标签文件得到所有目标边界框坐标(n,8,3) 点云数据Lidar(n,4)
    4,读入图像，数据增强加过滤
    5,处理点云得到(k,t,7)k个体素，每个t个点云，每个点云(x,y,z,t,x',y',z') , (k,3)，k个点云的所在位置
    6,构建标签
'''

重点去看体素化和体素特征构建。

完整模型构建代码

from __future__ import division
import os
import os.path
import torch.utils.data as data
import utils
from utils import box3d_corner_to_center_batch, anchors_center_to_corner, corner_to_standup_box2d_batch
from data_aug import aug_data
from box_overlaps import bbox_overlaps
import numpy as np
import cv2
from config import config as cfg
os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"


#点云数据一共16列
#第1列 目标类比别（type），共有8种类别
#第2列 截断程度（truncated），表示处于边缘目标的截断程度，取值范围为0~1
#第3列 遮挡程度（occlude），取值为（0，1，2，3）。0表示完全可见
#第4列 观测角度（alpha）,取值范围为（-pi, pi）
#第5-8列 二维检测框（bbox），目标二维矩形框坐标，分别对应left、top、right、bottom，即左上（xy）和右下的坐标（xy）。
#第9-11列 三维物体的尺寸（dimensions），分别对应高度、宽度、长度，以米为单位。
#第12-14列 中心坐标（location），三维物体中心在相机坐标系下的位置坐标（x，y，z），单位为米。
#第15列  旋转角（rotation_y），取值范围为（-pi, pi）。
#第16列 置信度分数（score），仅在测试评估的时候才需要用到。置信度越高，表示目标越存在的概率越大。

#./KITTI
#D:\python\data\mkitti
#D:/python/data/mkitti

#dataset=KittiDataset(cfg=cfg,root='./data/KITTI',set='train')
'''
数据集 __getitem__(self, i)方法：
    1,取得该图像对应的各个数据路径地址
    2,加载映射文件，calib字典，包括内参P，转置矩阵R，外参Tr
    3,加载标签文件得到所有目标边界框坐标(n,8,3) 点云数据Lidar(n,4)
    4,读入图像，数据增强加过滤
    5,处理点云得到(k,t,7)k个体素，每个t个点云，每个点云(x,y,z,t,x',y',z') , (k,3)，k个点云的所在位置
    6,构建标签
'''
class KittiDataset(data.Dataset):

    def __init__(self, cfg, root='D:/python/data/mkitti',set='train',type='velodyne_train'):
        '''
        :param cfg:配置文件 cinfig.py
        :param root:数据集根目录
        :param set:训练还是测试
        :param type:数据形式，雷达点云
        '''
        self.type = type
        self.root = root
        #训练集目录D:/python/data/mkitti/training
        self.data_path = os.path.join(root, 'training')
        #预处理后雷达数据路径
        self.lidar_path = os.path.join(self.data_path, "crop/")
        #图像数据路径
        self.image_path = os.path.join(self.data_path, "image_2/")
        #雷达映射图像文件路径
        self.calib_path = os.path.join(self.data_path, "calib/")
        #标签文件路径
        self.label_path = os.path.join(self.data_path, "label_2/")
        #每个文件夹名
        with open(os.path.join(self.data_path, '%s.txt' % set)) as f:
            self.file_list = f.read().splitlines()

        self.T = cfg.T
        self.M = cfg.M
        # voxel size 0.4 0.2 0.2
        self.vd = cfg.vd
        self.vh = cfg.vh
        self.vw = cfg.vw
        # points cloud range
        self.xrange = cfg.xrange
        self.yrange = cfg.yrange
        self.zrange = cfg.zrange
        #锚框xyzwlhr的形式中心长宽高（7044,7）
        self.anchors = cfg.anchors.reshape(-1,7)
        #特征图(200,176)
        self.feature_map_shape = (int(cfg.H / 2), int(cfg.W / 2))
        #anchors_per_position 2
        self.anchors_per_position = cfg.anchors_per_position
        self.pos_threshold = cfg.pos_threshold
        self.neg_threshold = cfg.neg_threshold

    def cal_target(self, gt_box3d):
        # Input:
        #   labels: (N,)
        #   feature_map_shape: (w, l)特征图尺寸
        #   anchors: (w, l, 2, 7)
        # Output:
        #   pos_equal_one (w, l, 2) 正样本
        #   neg_equal_one (w, l, 2) 负样本
        #   targets (w, l, 14) 偏移量 xyz取相对偏移 whl取log偏移
        # attention: cal IoU on birdview在鸟瞰图上计算iou
        #feature_map_shape(200,176)
        anchors_d = np.sqrt(self.anchors[:, 4] ** 2 + self.anchors[:, 5] ** 2)
        #正样本(200,176,2)
        pos_equal_one = np.zeros((*self.feature_map_shape, 2))
        #负样本(200,176,2)
        neg_equal_one = np.zeros((*self.feature_map_shape, 2))
        targets = np.zeros((*self.feature_map_shape, 14))
        #标签坐标变化，<边角坐标表示>-----------<中心长宽高表示>成xyzhqlr gt_box3d(-1,8,3)  ，
        # (N, 8, 3) -> (N, 7)相当于二维边界框 顶点坐标 转 中心长宽 表示
        gt_xyzhwlr = box3d_corner_to_center_batch(gt_box3d)
        #对于每个锚框，将锚框 <中心长宽高> --------  <边角坐标> 表示（n,4,2）
        anchors_corner = anchors_center_to_corner(self.anchors)
        #锚框<边角坐标表示>转化<二维鸟瞰图>表示(n,4)
        anchors_standup_2d = corner_to_standup_box2d_batch(anchors_corner)
        # 标签<边角坐标表示>  ------- <二维鸟瞰图表示>(4,4)
        gt_standup_2d = corner_to_standup_box2d_batch(gt_box3d)
        #计算鸟瞰图锚框 与 标签鸟瞰图边角框 iou(n,4)与(4,4)->(n,4)
        iou = bbox_overlaps(
            np.ascontiguousarray(anchors_standup_2d).astype(np.float32),
            np.ascontiguousarray(gt_standup_2d).astype(np.float32),
        )
        #选择iou最大的锚框作为后候选锚框去预测该目标,得到索引id_highest(4)  id_highest_gt(4)
        id_highest = np.argmax(iou.T, axis=1)  # the maximum anchor's ID
        id_highest_gt = np.arange(iou.T.shape[0])
        #选择最大iou的锚框和包含目标的
        mask = iou.T[id_highest_gt, id_highest] > 0
        id_highest, id_highest_gt = id_highest[mask], id_highest_gt[mask]
        # find anchor iou > cfg.XXX_POS_IOU
        #选取较大iou锚框中阈值大于正样本阈值的 0.6作为正样本
        id_pos, id_pos_gt = np.where(iou > self.pos_threshold)
        # find anchor iou < cfg.XXX_NEG_IOU 小于负样本阈值的作为负样本0.45
        id_neg = np.where(np.sum(iou < self.neg_threshold,
                                 axis=1) == iou.shape[1])[0]
        #正样本索引
        id_pos = np.concatenate([id_pos, id_highest])
        id_pos_gt = np.concatenate([id_pos_gt, id_highest_gt])
        # TODO: uniquify the array in a more scientific way
        id_pos, index = np.unique(id_pos, return_index=True)
        id_pos_gt = id_pos_gt[index]
        id_neg.sort()
        # cal the target and set the equal one
        index_x, index_y, index_z = np.unravel_index(
            id_pos, (*self.feature_map_shape, self.anchors_per_position))
        #正样本点
        pos_equal_one[index_x, index_y, index_z] = 1
        # ATTENTION: index_z should be np.array
        #  targets (w, l, 14)   self.anchors中心长宽高
        #  xyz: (gt-an)/d = 相对偏移 wlh:求的log(gt_w / an_w)
        targets[index_x, index_y, np.array(index_z) * 7] = \
            (gt_xyzhwlr[id_pos_gt, 0] - self.anchors[id_pos, 0]) / anchors_d[id_pos]
        targets[index_x, index_y, np.array(index_z) * 7 + 1] = \
            (gt_xyzhwlr[id_pos_gt, 1] - self.anchors[id_pos, 1]) / anchors_d[id_pos]
        targets[index_x, index_y, np.array(index_z) * 7 + 2] = \
            (gt_xyzhwlr[id_pos_gt, 2] - self.anchors[id_pos, 2]) / self.anchors[id_pos, 3]
        targets[index_x, index_y, np.array(index_z) * 7 + 3] = np.log(
            gt_xyzhwlr[id_pos_gt, 3] / self.anchors[id_pos, 3])
        targets[index_x, index_y, np.array(index_z) * 7 + 4] = np.log(
            gt_xyzhwlr[id_pos_gt, 4] / self.anchors[id_pos, 4])
        targets[index_x, index_y, np.array(index_z) * 7 + 5] = np.log(
            gt_xyzhwlr[id_pos_gt, 5] / self.anchors[id_pos, 5])
        targets[index_x, index_y, np.array(index_z) * 7 + 6] = (
                gt_xyzhwlr[id_pos_gt, 6] - self.anchors[id_pos, 6])
        index_x, index_y, index_z = np.unravel_index(
            id_neg, (*self.feature_map_shape, self.anchors_per_position))
        neg_equal_one[index_x, index_y, index_z] = 1
        # to avoid a box be pos/neg in the same time
        # 避免一次预测框同时是正样本和负样本
        index_x, index_y, index_z = np.unravel_index(
            id_highest, (*self.feature_map_shape, self.anchors_per_position))
        neg_equal_one[index_x, index_y, index_z] = 0

        return pos_equal_one, neg_equal_one, targets
    #点云数据体素化
    '''
    1.随机打乱点云数据顺序
    2.得到候选体素块，使用所有的点云点减去原点坐标得到长度，除以单位距离(x-minx / vw)得到各个点具体所在的体素块
    3.通过unique得到voxel_coords(3186,3)体素和位置,inv_ind(18102)每个点对应的体素索引,voxel_counts(3186)体素数量，且该体素包含的点的个数
    '''
    def preprocess(self, lidar):

        # shuffling the points随机打乱顺序
        np.random.shuffle(lidar)
        #体素化， x-minx / vw  归到某体素上
        #每个点对应到空间中某个体素上，比如10,400,352个体素
        #这个点属于 5,200,120 空间位置的体素
        #(n,3)n个点，每个点对应体素坐标(18102,3)->(3186,3)共构成3186个体素
        #这里的候选体素已经排除了没有点的体素，各个点对应的体素位置，但是有的体素只包含一个点(稀疏体素)
        voxel_coords = ((lidar[:, :3] - np.array([self.xrange[0], self.yrange[0], self.zrange[0]])) / (
                        self.vw, self.vh, self.vd)).astype(np.int32)
        """"
        这里可以对稀疏体素进行一个处理，判断体素包含点的数目，小于阈值则忽略该体素
        """
        # convert to  (D, H, W)   (x,y,z) -> (z,y,x)
        voxel_coords = voxel_coords[:,[2,1,0]]
        # 沿着0轴进行unique,也就是对于所有点进行unique(1,2,3) (1,2,3)这样在排除一个
        #voxel_coords(3186,3)体素和位置,
        # inv_ind(18102)每个点对应的体素索引,
        # voxel_counts(3186)体素数量，且该体素包含的点的个数
        voxel_coords, inv_ind, voxel_counts = np.unique(voxel_coords, axis=0, \
                                                  return_inverse=True, return_counts=True)

        voxel_features = []
        #voxel_coords_keep = []
        #对于每一个体素
        for i in range(len(voxel_coords)):
            # maxiumum number of points per voxel
            #T = 35
            voxel = np.zeros((self.T, 7), dtype=np.float32)
            pts = lidar[inv_ind == i]#在第i个体素中的点
            #如果当前体素包含的点数目大于35
            if voxel_counts[i] > self.T:
                #体素去取前35个点
                pts = pts[:self.T, :]
                #设置该体素包含点数为35
                voxel_counts[i] = self.T
            #如果当前体素包含的点太少属于稀疏体素，忽略该体素
            '''自己改的东西，在所有体素中删除该体素，并且在体素特征中不记录该体素'''

            voxel[:pts.shape[0], :] = np.concatenate((pts, pts[:, :3] - np.mean(pts[:, :3], 0)), axis=1)
            # 得到体素特征(3186,35,7) 一共3186个体素，每个体素35以下的点，每个点7个特征（x,y,z,r,x',y',z'）
            voxel_features.append(voxel)
            # augment the points点数据增强组成7维数据，（x,y,z,r,x',y',z'）该点原始坐标加上该点对于所在体素所有点均值中心偏移
        return np.array(voxel_features), voxel_coords

    def preprocess_densevoxel(self, lidar):

        # shuffling the points随机打乱顺序
        np.random.shuffle(lidar)
        #体素化， x-minx / vw  归到某体素上
        #每个点对应到空间中某个体素上，比如10,400,352个体素
        #这个点属于 5,200,120 空间位置的体素
        #(n,3)n个点，每个点对应体素坐标(18102,3)->(3186,3)共构成3186个体素
        #这里的候选体素已经排除了没有点的体素，各个点对应的体素位置，但是有的体素只包含一个点(稀疏体素)
        voxel_coords = ((lidar[:, :3] - np.array([self.xrange[0], self.yrange[0], self.zrange[0]])) / (
                        self.vw, self.vh, self.vd)).astype(np.int32)
        """"
        这里可以对稀疏体素进行一个处理，判断体素包含点的数目，小于阈值则忽略该体素
        """
        # convert to  (D, H, W)   (x,y,z) -> (z,y,x)
        voxel_coords = voxel_coords[:,[2,1,0]]
        # 沿着0轴进行unique,也就是对于所有点进行unique(1,2,3) (1,2,3)这样在排除一个
        #voxel_coords(3186,3)体素和位置,
        # inv_ind(18102)每个点对应的体素索引,
        # voxel_counts(3186)体素数量，且该体素包含的点的个数
        voxel_coords, inv_ind, voxel_counts = np.unique(voxel_coords, axis=0, \
                                                  return_inverse=True, return_counts=True)

        voxel_features = []
        voxel_coords_keep = []
        #对于每一个体素
        for i in range(len(voxel_coords)):
            # maxiumum number of points per voxel
            #T = 35
            voxel = np.zeros((self.T, 7), dtype=np.float32)
            pts = lidar[inv_ind == i]#在第i个体素中的点
            #如果当前体素包含的点数目大于35
            if voxel_counts[i] > self.T:
                #体素去取前35个点
                pts = pts[:self.T, :]
                #设置该体素包含点数为35
                voxel_counts[i] = self.T
            #如果当前体素包含的点太少属于稀疏体素，忽略该体素
            '''自己改的东西，在所有体素中删除该体素，并且在体素特征中不记录该体素'''
            if voxel_counts[i]>self.M:
                voxel[:pts.shape[0], :] = np.concatenate((pts, pts[:, :3] - np.mean(pts[:, :3], 0)), axis=1)
                # 得到体素特征(3186,35,7) 一共3186个体素，每个体素35以下的点，每个点7个特征（x,y,z,r,x',y',z'）
                voxel_features.append(voxel)
                voxel_coords_keep.append(voxel_coords[i])
            # augment the points点数据增强组成7维数据，（x,y,z,r,x',y',z'）该点原始坐标加上该点对于所在体素所有点均值中心偏移

        return np.array(voxel_features), np.array(voxel_coords_keep)

    def __getitem__(self, i):
        '''
        :param i: 样本索引
        :return:
        voxel_features, 点云voxelize体素化(8874,35,7)
        voxel_coords, 体素候选点(8874,4)
        pos_equal_one (w, l, 2) 正样本#(2,200,176,2)
        neg_equal_one (w, l, 2) 负样本(2,200,176,2)
        targets (w, l, 14) 偏移量 xyz取相对偏移 whl取log偏移(2,200,176,14)
        image, 样本对于图片
        calib, 样本点云映射图像文件
        self.file_list[i]：样本名称000000
        '''
        #取得该图像对应的各个数据路径地址
        lidar_file = self.lidar_path + '/' + self.file_list[i] + '.bin'
        calib_file = self.calib_path + '/' + self.file_list[i] + '.txt'
        label_file = self.label_path + '/' + self.file_list[i] + '.txt'
        image_file = self.image_path + '/' + self.file_list[i] + '.png'
        #加载映射文件，calib字典，包括内参P，转置矩阵R，外参Tr
        calib = utils.load_kitti_calib(calib_file)
        Tr = calib['Tr_velo2cam']
        #加载标签得到所有目标边界框坐标(n,8,3) n个目标的8个边界点的3个世界坐标      Lidar(n,4)
        gt_box3d = utils.load_kitti_label(label_file, Tr)
        lidar = np.fromfile(lidar_file, dtype=np.float32).reshape(-1, 4)

        #对于训练集数据
        if self.type == 'velodyne_train':
            #读入该样本图像
            image = cv2.imread(image_file)

            # data augmentation进行数据增强
            lidar, gt_box3d = aug_data(lidar, gt_box3d)

            # specify a range选择在规定范围内的点
            lidar, gt_box3d = utils.get_filtered_lidar(lidar, gt_box3d)

            # voxelize体素化voxel_features(4005,35,7) voxel_coords(4005,3)
            voxel_features, voxel_coords = self.preprocess_densevoxel(lidar)#(739,3)
            #voxel_features, voxel_coords = self.preprocess(lidar)#(3372,3)
            # bounding-box encoding边界框编码
            #   pos_equal_one (w, l, 2) 正样本
            #   neg_equal_one (w, l, 2) 负样本
            #   targets (w, l, 14) 偏移量 xyz取相对偏移 whl取log偏移
            pos_equal_one, neg_equal_one, targets = self.cal_target(gt_box3d)

            return voxel_features, voxel_coords, pos_equal_one, neg_equal_one, targets, image, calib, self.file_list[i]

        elif self.type == 'velodyne_test':
            NotImplemented

        else:
            raise ValueError('the type invalid')


    def __len__(self):
        return len(self.file_list)

def detection_collate(batch):
    voxel_features = []
    voxel_coords = []
    pos_equal_one = []
    neg_equal_one = []
    targets = []

    images = []
    calibs = []
    ids = []
    #链接一个batch中所有样本target信息，包括
    for i, sample in enumerate(batch):
        #体素特征(n,35,7)
        voxel_features.append(sample[0])
        #所有体素(n,3)，进行了一下填充
        #填充内容使得各个体素添加了一个batch归属信息
        #如 (3,4,7)的一个体素->(1,3,4,7)属于第一个batch
        voxel_coords.append(
            np.pad(sample[1], ((0, 0), (1, 0)),
                mode='constant', constant_values=i))
        #正负样本(w,l,2)
        pos_equal_one.append(sample[2])
        neg_equal_one.append(sample[3])
        #标签(w,l,14)
        targets.append(sample[4])
        #图像，calibs，样本名称000009,这3是list
        images.append(sample[5])
        calibs.append(sample[6])
        ids.append(sample[7])
    return np.concatenate(voxel_features), \
           np.concatenate(voxel_coords), \
           np.array(pos_equal_one),\
           np.array(neg_equal_one),\
           np.array(targets),\
           images, calibs, ids

if __name__ == '__main__':
    import torch

    root_path = "D:/python/data/mkitti"
    # IMG_ROOT = root_path + "training/image_2/"
    # PC_ROOT = root_path + "training/velodyne/"
    # CALIB_ROOT = root_path + "training/calib/"
    # PC_CROP_ROOT = root_path + "training/crop/"

    # lidar_path = os.path.join(root_path, "crop/")
    # image_path = os.path.join(root_path, "image_2/")
    # calib_path = os.path.join(root_path, "calib/")
    # label_path = os.path.join(root_path, "label_2/")

    #D:\python\data\modelnet40_normal_resampled
    # path = r"D:\python\data\modelnet40_normal_resampled"
    dataset = KittiDataset(cfg=cfg, root=root_path, set='train')
    data_loader = data.DataLoader(dataset, batch_size=cfg.N, num_workers=0, collate_fn=detection_collate, shuffle=True, \
                                  pin_memory=False)
    i=0
    # return np.concatenate(voxel_features), \
    #        np.concatenate(voxel_coords), \
    #        np.array(pos_equal_one),\
    #        np.array(neg_equal_one),\
    #        np.array(targets),\
    #        images, calibs, ids
    for voxel_features, voxel_coords, pos_equal_one,neg_equal_one,targets,images,calibs,ids in data_loader:
        print(voxel_features.shape)
        print(voxel_coords.shape)
        print(pos_equal_one.shape)
        print(neg_equal_one.shape)
        print(targets.shape)
        print(images[0].shape)
        print(len(calibs))
        print(len(ids))
        # (8581, 35, 7)
        # (8581, 3)
        # (2, 200, 176, 2)
        # (2, 200, 176, 2)
        # (2, 200, 176, 14)
        # (375, 1242, 3)
        # 2
        # 2
        # 0 - ----------------------------
        print(i,"-----------------------------")
        # print(len(images))
        # print(len(calibs))
        # print(len(ids))
        #torch.Size([12, 1024, 3])
        #torch.Size([12])
        i +=1
        if i==3:
            break

你可能感兴趣的:(目标检测,3d,计算机视觉)

PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
【目标检测】机场内部目标检测数据集4106张YOLO+VOC格式
数据集格式：VOC格式+YOLO格式压缩包内含：3个文件夹，分别存储图片、xml、txt文件JPEGImages文件夹中jpg图片总计：4106Annotations文件夹中xml文件总计：4106labels文件夹中txt文件总计：4106标签种类数：7标签名称:["Ground_vehicles","Horizontal_sign","Runaway_limit","Taxiway","Ver
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
Android 系统默认代码，如何屏蔽相册分享功能
Android系统默认代码，如何屏蔽相册分享功能开发云-一站式云服务平台diff--gita/packages/apps/Gallery2/src/com/android/gallery3d/app/GalleryActionBar.javab/packages/apps/Gallery2/src/com/android/gallery3d/app/GalleryActionBar.javaind
使用NVIDIA NeRF将2D图像转换为逼真的3D模型（Python） ByteWhiz 3d python 计算机视觉 Python
使用NVIDIANeRF将2D图像转换为逼真的3D模型（Python）NeuralRadianceFields（NeRF）是一种强大的方法，可以将2D图像转换为逼真的3D模型。它使用神经网络来建模场景的辐射场，并通过渲染多个视角的图像来重建3D模型。在本文中，我们将使用Python和NVIDIANeRF库来实现这一过程。首先，我们需要安装所需的库。我们可以通过以下命令使用pip安装NVIDIANe
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
目标检测中的NMS算法详解
好的，我们来详细解释一下目标检测中非极大值抑制（Non-MaximumSuppression,NMS）的相关概念和计算过程。1.为什么需要NMS？问题：目标检测模型（如FasterR-CNN,YOLO,SSD等）在推理时，对于同一个目标物体，通常会预测出多个重叠的、不同置信度（confidencescore）的候选边界框（BoundingBoxes）。直接输出所有这些框会导致：结果冗余：同一个物体
fps透视基础-d3d绘制-绘制文字-绘制方框-绘制连线程序员陈子青逆向工程 DirectX fps透视画方框画文字
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓#include#include#pragmacomment(lib,"d3d9.lib")#pragmacomment(lib,"d3dx9.lib")staticLPDIRECT3D9g_pD3D=NULL;staticD3DPRESENT_PARAMETERSg_d3dpp={};staticLPDIRECT3DDEVICE9g_pd3dDevice=NUL
任鸟飞FPS类型游戏绘制,骨骼,u3d,UE4和游戏安全,反外挂研究 (三) 任鸟飞逆向~ FPS C语言网络安全 3d 游戏 ue4
书接上文,我们非矩阵的方式绘制是没有那么的精确的在学习矩阵之前,我们先来了解下绘制的几种方法绘制的几种方法和反外挂建议第一种hookd3d/opengl优点:不闪,代码简单缺点:非常容易被检测第二种窗口上自行绘制,但是会闪优缺点适中第三种自建透明窗口,覆盖游戏窗口,透明窗口上绘制优点:稳定确定:代码复杂,会闪反外挂:无非就是针对外挂使用的函数进行检测深入学习矩阵对象的世界坐标列向量xyzw(w为了
资源分享-FPS, 矩阵, 骨骼, 绘制, 自瞄, U3D, UE4逆向辅助实战视频教程小零羊矩阵 3d ue4
文章底部获取资源教程概述本视频教程专为游戏开发者和安全研究人员设计，涵盖FPS游戏设计、矩阵运算、骨骼绘制、自瞄算法、U3D和UE4逆向辅助等实战内容。通过102节详细视频教程，您将掌握从基础到高级的游戏开发与安全防护技能。教程内容1.FPS类型游戏的设计研究和游戏安全,反外挂研究2.二维向量和平面距离3.atan2和tan4.三维向量和空间距离5.补充向量乘法6.矩阵和矩阵的运算7.矩阵的特性8
Python 取证学习指南第二版（一）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/46c71d4b3d6fceaba506eebc55284aa5译者：飞龙协议：CCBY-NC-SA4.0前言在编写《学习Python取证》一书时，我们有一个目标：以一种方式教授Python在取证中的应用，使得没有编程经验的读者可以立即跟随并开发出可以用于案件工作中的实用代码。但这并不意味着本书仅适合Python新手；在整个过程中，我们会逐步让读者
Python 取证学习指南第二版（三）
原文：annas-archive.org/md5/46c71d4b3d6fceaba506eebc55284aa5译者：飞龙协议：CCBY-NC-SA4.0第七章：模糊哈希哈希是DFIR中最常见的处理过程之一。这个过程允许我们总结文件内容，并分配一个代表文件内容的独特且可重复的签名。我们通常使用MD5、SHA1和SHA256等算法对文件和内容进行哈希。这些哈希算法非常有价值，因为我们可以用它们进行
shell脚本实现Hive库表迁移 docsz hive Linux shell
1、获取hive所有库的建表语句#获取hive所有库的建表语句#!/bin/bashmkdir-p~/hive/tables/tablesDDL#获取库名hive-e"showdatabases;">~/hive/databases.txtsed-i'1,3d'~/hive/databases.txtsed-i'$d'~/hive/databases.txtcat~/hive/databases.
【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔（四） Superstarimage 文献随笔材质神经网络人工智能扩散模型
AnevaluationofSVBRDFPredictionfromGenerativeImageModelsforAppearanceModelingof3DScenes输入3D场景的几何和一张参考图像，通过扩散模型和SVBRDF预测器获取多视角的材质maps，这些maps最终合并成场景的纹理地图集，并支持在任意视角、任意光照条件下进行重新渲染。样例图如下：在当前时代的技术背景下，生成与几何匹配
从原理到实战：ISP（图像信号处理器）深度解析与应用指南
从原理到实战：ISP（图像信号处理器）深度解析与应用指南摘要本文系统解析ISP（ImageSignalProcessor，图像信号处理器）的核心功能，详细拆解其工作流程（RAW处理→黑电平校正→AWB→3DNR→Defog→Gamma），深入解读关键参数（吞吐量、WDR类型、低照度性能）的技术意义，并详解寄存器表与在线调试工具的配置方法。通过表格对比、分点解析等方式，从基础原理到工程实践，覆盖IS
YOLOv11 技术详解：架构优化与性能提升代码老y YOLO 架构目标跟踪
YOLOv11是目标检测领域中一个备受瞩目的新版本，它在保持实时性的同时，显著提升了检测的准确性和效率。本文将深入探讨YOLOv11的架构改进、性能优化以及它在不同应用场景中的表现。一、架构改进（一）C3K2块YOLOv11引入了C3K2块，这是对之前版本中CSP（CrossStagePartial）块的增强。C3K2块使用不同的核大小（例如3x3或5x5）和通道分离策略来优化更复杂特征的提取。这
OpenCV图片操作100例：从入门到精通指南（1）总有刁民想爱朕ha opencv 计算机视觉人工智能
OpenCV图片操作100例：从入门到精通指南本文整理了100个OpenCV实用技巧，涵盖图像处理各个领域，助你轻松掌握计算机视觉核心技能！一、入门必备：基础操作1.图像读写与显示importcv2#读取图像（BGR格式）img=cv2.imread('image.jpg')#显示图像cv2.imshow('示例图片',img)cv2.waitKey(0)#按任意键退出cv2.destroyAll
OpenCV图片操作100例：从入门到精通指南（3）总有刁民想爱朕ha opencv 人工智能计算机视觉
高效学习路径：1️⃣分阶段学习：入门：1-20例（基础操作）进阶：21-50例（图像处理）高级：51-100例（计算机视觉）2️⃣项目驱动学习：证件照背景替换（1-15例）停车场车位检测（30-45例）视频运动追踪（70-85例）3️⃣性能优化技巧：#使用UMat加速图像处理umat_img=cv2.UMat(img)processed=cv2.GaussianBlur(umat_img,(5,5
YOLO11 目标检测从安装到实战
前言YOLO（YouOnlyLookOnce）系列是目标检测领域的经典算法，凭借速度快、精度高的特点被广泛应用。最新的YOLO11在模型结构和性能上进一步优化，本文将从环境搭建到实战应用，详细讲解YOLO11的使用方法，适合新手快速上手。一、环境准备1.系统要求操作系统：Windows10/11、Ubuntu20.04+、欧拉系统等硬件：CPU可运行，GPU（NVIDIA）可加速（推荐，需支持CU
OpenCV入门到精通：AI视觉处理的完整指南 AI云原生与云计算技术学院人工智能 opencv 计算机视觉 ai
OpenCV入门到精通：AI视觉处理的完整指南关键词：OpenCV、计算机视觉、图像预处理、目标检测、AI视觉应用摘要：本文是一份面向AI视觉爱好者的OpenCV完整学习指南。从OpenCV的核心概念讲起，结合生活案例、代码示例和项目实战，逐步拆解图像读取/显示、灰度化、边缘检测、目标检测等关键技术。无论你是想入门计算机视觉的新手，还是希望用OpenCV解决实际问题的开发者，都能通过本文掌握从理论
CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
OpenCV入门到精通：从基础到实战的全面指南
摘要：本文旨在为初学者和有一定经验的开发者提供OpenCV从入门到精通的全面指南。文章首先介绍了OpenCV的基本概念和安装方法，然后深入讲解了图像处理基础、特征检测与匹配、视频处理与分析等核心内容，最后通过实战案例展示了OpenCV在计算机视觉任务中的应用。关键词：OpenCV；图像处理；特征检测；视频分析；实战案例引言OpenCV（OpenSourceComputerVisionLibrary
目前主流图像分类模型的详细对比分析 @comefly 闲聊 linux 运维服务器
以下是目前主流图像分类模型的详细对比分析，结合性能、架构特点及应用场景进行整理：一、主流模型架构分类与定量对比模型名称架构类型核心特点ImageNetTop-1准确率参数量（百万）计算效率典型应用场景ResNetCNN残差连接解决梯度消失，支持超深网络（如ResNet-152）76.1%25.6中等通用分类、目标检测ViTTransformer将图像分割为patches，用标准Transforme
使用python的open3d库读取Bin格式点云并可视化
Python有很多库都可以处理点云，比如Python-PCL、Open3D等等。Python-PCL库已经很久没有维护了，而且安装极其麻烦！Open3D是由intel发布的3D点云可视化库，点云可视化和渲染都很方便，重要的是安装方便！！！1.安装PythonOpen3D环境：Ubuntu16.04pipinstallopen3d==0.9.0.0注意：open3d0.9.0.0只支持python2
目标检测之数据增强
数据翻转，需要把bbox相应的坐标值也进行交换代码：importrandomfromtorchvision.transformsimportfunctionalasFclassCompose(object):"""组合多个transform函数"""def__init__(self,transforms):self.transforms=transformsdef__call__(self,ima
window显示驱动开发—XR 格式的强制转换功能程序员王马 windows图形显示驱动开发 xr
DXGI_FORMAT_R10G10B10_XR_BIAS_A2_UNORM格式是DXGI_FORMAT_R10G10B10A2_TYPELESS系列的成员。因此，应用程序可以通过API级别的“视图”概念将DXGI_FORMAT_R10G10B10_XR_BIAS_A2_UNORM格式强制转换为该系列的任何其他成员。此过程是应用程序呈现到资源的预期方式。具体而言，Direct3D运行时只能通过驱动
模型实战（21）之 C++ - tensorRT部署yolov8-det 目标检测明月醉窗台 #深度学习实战例程人工智能 c++YOLO 目标检测计算机视觉人工智能
C++-tensorRT部署yolov8-det目标检测python环境下如何直接调用推理模型转换并导出：pt->onnx->.engineC++tensorrt部署检测模型不写废话了，直接上具体实现过程+all代码1.Python环境下推理直接命令行推理，巨简单yolodetectpredictmodel=yolov8n.ptsource='https
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR