fung-hwang

点云3d检测SA-SSD

C. He, H. Zeng, J. Huang, X. -S. Hua and L. Zhang, “Structure Aware Single-Stage 3D Object Detection From Point Cloud,” 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2020, pp. 11870-11879, doi: 10.1109/CVPR42600.2020.01189.

源码：https://github.com/skyhehe123/SA-SSD

论文解读

创新点：辅助网络auxiliary net和检测头部分PS Warp(part-sensitive warping)

auxiliary net

点级监督辅助网络，引导骨干 CNN 不同阶段的中间特征学习点云细粒度结构特征。仅应用于训练阶段，不会额外增加推理成本。
○ 目的：协助 backbone提取的特征了解三维点云的结构信息。
○ 提出原因：backbone 从点云提取的下采样卷积特征丢失了结构细节，而这些细节对生成准确的对象定位至关重要。

前景分割
引导 backbone CNN 在对象边界学习更多的判别模式表示。特别地，利用 sigmoid 函数预测每个点前景/背景概率。focal loss 优化分割任务。从而更精确检测对象边界.

然而，即使边界点被正确检测出，由于特征图的稀疏性，边界框的尺度和形状仍存在歧义。故而，为进一步提高定位精度，作者采用另一个辅助任务学习每个对象点相对对象中心的相对位置。
中心点预测
对象点和对象中心的相对位置关系。帮助尺度和形状确定，实现更精确的定位。

PSWarp

通过特征映射上的空间转换操作，解决预测边界框和置信度映射之间的非对齐，减少NMS后处理中预测边界框和相应置信度不一致问题。

mmdet

mmdetection是面向目标检测的代码集成库，也是一个工程性很强的开源框架，对调参和搭建网络都非常友好。SA-SSD代码是在mmdetection平台上开发。

mmdetection初认识：https://www.dazhuanlan.com/disen123/topics/1078289
github主页

编译mmdet某些库

points_op、 iou3d、pointnet2 编译C++/CUDA模块链接库points_op_cpu.so、iou3d_cuda.so、pointnet2_cuda.so：

python setup.py build_ext --inplace

遇见错误：

FAILED: /home/hf/program/SA-SSD-master/mmdet/ops/points_op/build/temp.linux-x86_64-3.7/src/points_op.o
/home/hf/program/SA-SSD-master/mmdet/ops/points_op/src/points_op.cpp:15:29: error: ‘AT_CHECK’ was not declared in this scope; did you mean ‘CHECK’?

参考方法：修改源文件points_op.cpp、interpolate.cpp、iou3d.cpp.
编译iou3d。Cuda version和GPU compute capability冲突。==》修改 cuda、torch 版本
编译pointnet2。
fatal error: THC/THC.h，error: ‘THCState’ does not name a type ==》注释对应语句
error: ‘getCurrentCUDAStream’ is not a member of ‘at::cuda’ ==》添加#include

数据准备

python tools/create_data.py

生成.pkl文件、gt_databse目录、velodyne_reduced目录。

数据解读

.pkl 文件
pickle.load()读取。list类型存放，每个元素以字典形式存放，内容如下：
image_2文件
mmcv.imread读取，颜色类型color格式、通道bgr，返回数据类型array。
transform：(mean, std)标准化，toRGB，size padding to [384, 1248] (32的倍数)
label_2文件：
.txt 文件，open读取。每行内容如下：
mmdet.datasets.kitti_utils.Object3d 存取label，格式如下：
calib文件：
mmdet.datasets.kitti_utils.Calibration处理:
- open 读取.txt文件，内容如下：
- 校准矩阵、相机参数
  
  ‘’’ Calibration matrices and utils
  3d XYZ in label.txt are in rect camera coord.
  2d box xy are in image2 coord
  Points in lidar.bin are in Velodyne coord.
  y_image2 = P^2_rect * x_rect
  y_image2 = P^2_rect * R0_rect * Tr_velo_to_cam * x_velo
  x_ref = Tr_velo_to_cam * x_velo
  x_rect = R0_rect * x_ref
  P^2_rect = [f^2_u, 0, c^2_u, -f^2_u b^2_x;
  0, f^2_v, c^2_v, -f^2_v b^2_y;
  0, 0, 1, 0]
  = K * [1|t]
  image2 coord:
  ----> x-axis (u)
  |
  |
  v y-axis (v)
  velodyne coord:
  front x, left y, up z
  rect/ref camera coord:
  right x, down y, front z
  Ref (KITTI paper): http://www.cvlibs.net/publications/Geiger2013IJRR.pdf
  TODO(rqi): do matrix multiplication only once for each projection.
  ‘’’
  
  从P2获取rect camera coord到image_2 coord投影矩阵3X4
  从P3获取rect camera coord到image_3 coord投影矩阵3X4
  从Tr_velo_to_cam获取velodyne coord到 reference camera coord刚性变换3X4
  从R0_rect获取reference camera coord到 rect camera coord旋转3X3
gt_bboxes：label文件获取的box3d, [x, y, z, w, l, h, ry]。前三项为相机坐标location，中间三项分别为3d bbox的width、length、height，最后一项为相机坐标系中绕Y轴的角度[-pi, pi]。
3d bbox，rect相机到点云坐标系转换
更新gt_bboxes[:,:3]：
rect相机坐标系转reference相机坐标系：pts_3d_rect @ np.linalg.inv(calib.R0).T
reference坐标系转点云坐标系：pts_3d_ref @ calib.C2V.T
velodyne_reduced文件：
.bin文件，存储点云（正视图）。numpy加载文件，并reshape(-1, 4). 数据如下：
PointAugmentor
gt_database文件.bin 中读取box3d_lidar。

训练集：

self.augmentor.noise_per_object_(gt_bboxes, points, num_try=100) # 随机噪声，gt_bboxes增强
gt_bboxes, points = self.augmentor.random_flip(gt_bboxes, points) # 点随机翻转
gt_bboxes, points = self.augmentor.global_rotation(gt_bboxes, points) # 点随机旋转
gt_bboxes, points = self.augmentor.global_scaling(gt_bboxes, points) # 点随机缩放

Point2Voxel
点转体素。
voxels, coordinates, num_points = self.generator.generate(points)

训练数据元素：

训练train

def forward_train(self, img, img_meta, **kwargs):
        batch_size = len(img_meta)
        ret = self.merge_second_batch(kwargs)
        vx = self.backbone(ret['voxels'], ret['num_points'])
        x, conv6, point_misc = self.neck(vx, ret['coordinates'], batch_size, is_test=False)

        losses = dict()
        aux_loss = self.neck.aux_loss(*point_misc, gt_bboxes=ret['gt_bboxes'])
        losses.update(aux_loss)

        # RPN forward and loss
        if self.with_rpn:
            rpn_outs = self.rpn_head(x)
            rpn_loss_inputs = rpn_outs + (ret['gt_bboxes'], ret['gt_labels'], ret['gt_types'],\
                            ret['anchors'], ret['anchors_mask'], self.train_cfg.rpn)
            rpn_losses = self.rpn_head.loss(*rpn_loss_inputs)
            losses.update(rpn_losses)
            guided_anchors, _ = self.rpn_head.get_guided_anchors(*rpn_outs, ret['anchors'],\
                        ret['anchors_mask'], ret['gt_bboxes'], ret['gt_labels'], thr=self.train_cfg.rpn.anchor_thr)
        else:
            raise NotImplementedError

        # bbox head forward and loss
        if self.extra_head:
            bbox_score = self.extra_head(conv6, guided_anchors)
            refine_loss_inputs = (bbox_score, ret['gt_bboxes'], ret['gt_labels'], guided_anchors, self.train_cfg.extra)
            refine_losses = self.extra_head.loss(*refine_loss_inputs)
            losses.update(refine_losses)

        return losses

输入数据kwargs：
批次单个数据合并批数据ret：

backbone

处理体素数据ret[‘voxels’]，size：[n, 5, 4]，调用SimpleVoxel简化体素，返回points_mean，size：[n，4]。sum+mean:

points_mean = features[:, :, :self.num_input_features].sum(dim=1, keepdim=False) 
								/ num_voxels.type_as(features).view(-1, 1)

neck

处理backbone体素（均值）、坐标点，调用SpMiddleFHD。

其中主干网络为VxNet，体素特征维度变化：[70142, 4]–>[70142, 16]–>[106542,32]–>[63797,64]–>[27599,64]，提取深层特征out、和中间层多尺度特征middle(3种尺度）;
全卷积网络部分采用BEVNet（8个conv2d+bn+relu）处理深层特征out，其维度变化为：[4, 320, 200, 176]–>[4, 256, 200, 176]，返回处理后特征x、和第7层特征conv6。

辅助网络：依次处理中间多尺度层middle，并返回每个尺度在backbone体素上的特征 $p_0$ 、 $p_1$ 、 $p_2$ 。
其大小如下：

tensor2points 结合offset和voxel_size分别处理中间层多尺度特征middle[i]的坐标，返回特征vx_feat和坐标vx_nxyz.

def tensor2points(tensor, offset=(0., -40., -3.), voxel_size=(.05, .05, .1)):
    indices = tensor.indices.float()
    offset = torch.Tensor(offset).to(indices.device)
    voxel_size = torch.Tensor(voxel_size).to(indices.device)
    indices[:, 1:] = indices[:, [3, 2, 1]] * voxel_size + offset + .5 * voxel_size
    return tensor.features, indices

nearest_neighbor_interpolate 处理backbone简化的体素points_mean(unknown)和上一步的vx_nxyz(known)、vx_feat(known_feats)，返回输入体素3邻域的特征p。

def nearest_neighbor_interpolate(unknown, known, known_feats):
    """
    :param pts: (n, 4) tensor of the bxyz positions of the unknown features
    :param ctr: (m, 4) tensor of the bxyz positions of the known features
    :param ctr_feats: (m, C) tensor of features to be propigated
    :return:
        new_features: (n, C) tensor of the features of the unknown features
    """
    dist, idx = pointnet2_utils.three_nn(unknown, known) # find the three nearest neighbors of unknown in known,compute l2-distance, and return idx
    dist_recip = 1.0 / (dist + 1e-8)
    norm = torch.sum(dist_recip, dim=1, keepdim=True) # [n,3], do sum(col), return [n,1]
    weight = dist_recip / norm
    interpolated_feats = pointnet2_utils.three_interpolate(known_feats, idx, weight) # [unknown.shape[0], known_feats.shape[1]]

    return interpolated_feats

Linear(in_features=160, out_features=64, bias=False)全连接点云体素3邻域多尺度特征torch.cat([p0, p1, p2], dim=-1)，返回pointwise
Linear(in_features=64, out_features=1, bias=False)分类，返回point_cls
Linear(in_features=64, out_features=3, bias=False)回归，返回point_reg

neck 部分返回：x, conv6, point_misc。分别表示BEVNet深层特征x和第7层卷积特征conv6，(points_mean, point_cls, point_reg).

loss

gt_bboxes: (M, 7) , [x, y, z, h, w, l, ry]。从label_2文件获取，依次表示相机坐标(x, y, z)，目标维度(h, w, l)，目标在相机坐标系中绕Y轴角度ry。

测试test

1. data
VoxelGenerator:
point_cloud_range：x：[0, 70.4]，y：[-40, 40]，z:[-3, 1] .
voxel_size：[0.05, 0.05, 0.1].
grid_size：[1408.0, 1600.0, 40.0]

grid_size = (point_cloud_range[3:] - point_cloud_range[:3]) / voxel_size

image–transform:

scale=1，不翻转，padding to [384, 1248]

点云points_to_voxel:

def points_to_voxel(points,voxel_size,coors_range,
                     max_points=35,
                     reverse_index=True,
                     max_voxels=20000):
    """convert kitti points(N, >=3) to voxels. This version calculate
    everything in one loop. now it takes only 4.2ms(complete point cloud)
    with jit and 3.2ghz cpu.(don't calculate other features)
    Note: this function in ubuntu seems faster than windows 10.

    Args:
        points: [N, ndim] float tensor. points[:, :3] contain xyz points and
            points[:, 3:] contain other information such as reflectivity.
        voxel_size: [3] list/tuple or array, float. xyz, indicate voxel size
        coors_range: [6] list/tuple or array, float. indicate voxel range.
            format: xyzxyz, minmax
        max_points: int. indicate maximum points contained in a voxel.
        reverse_index: boolean. indicate whether return reversed coordinates.
            if points has xyz format and reverse_index is True, output
            coordinates will be zyx format, but points in features always
            xyz format.
        max_voxels: int. indicate maximum voxels this function create.
            for second, 20000 is a good choice. you should shuffle points
            before call this function because max_voxels may drop some points.

    Returns:
        voxels: [M, max_points, ndim] float tensor. only contain points.
        coordinates: [M, 3] int32 tensor.
        num_points_per_voxel: [M] int32 tensor.
    """
    if not isinstance(voxel_size, np.ndarray):
        voxel_size = np.array(voxel_size, dtype=points.dtype)
    if not isinstance(coors_range, np.ndarray):
        coors_range = np.array(coors_range, dtype=points.dtype)
    voxelmap_shape = (coors_range[3:] - coors_range[:3]) / voxel_size
    voxelmap_shape = tuple(np.round(voxelmap_shape).astype(np.int32).tolist())
    if reverse_index:
        voxelmap_shape = voxelmap_shape[::-1]
    # don't create large array in jit(nopython=True) code.
    num_points_per_voxel = np.zeros(shape=(max_voxels, ), dtype=np.int32)
    coor_to_voxelidx = -np.ones(shape=voxelmap_shape, dtype=np.int32)
    voxels = np.zeros(
        shape=(max_voxels, max_points, points.shape[-1]), dtype=points.dtype)
    coors = np.zeros(shape=(max_voxels, 3), dtype=np.int32)
    if reverse_index:
        voxel_num = _points_to_voxel_reverse_kernel(
            points, voxel_size, coors_range, num_points_per_voxel,
            coor_to_voxelidx, voxels, coors, max_points, max_voxels)
    else:
        voxel_num = _points_to_voxel_kernel(
            points, voxel_size, coors_range, num_points_per_voxel,
            coor_to_voxelidx, voxels, coors, max_points, max_voxels)

    coors = coors[:voxel_num]
    voxels = voxels[:voxel_num]
    num_points_per_voxel = num_points_per_voxel[:voxel_num]
    return voxels, coors, num_points_per_voxel

2. model预测

dimensions ---- 3d目标的长宽高
location ---- 3d框中心点位置
rotation_y ---- 3d框yaw角度

boxes3d转bev_boxes：

def boxes3d_to_bev_torch(boxes3d):
    """
    :param boxes3d: (N, 7) [x, y, z, h, w, l, ry]
    :return:
        boxes_bev: (N, 5) [x1, y1, x2, y2, ry]
    """
    boxes_bev = boxes3d.new(torch.Size((boxes3d.shape[0], 5)))

    cu, cv = boxes3d[:, 0], boxes3d[:, 1] # x,y
    half_l, half_w = boxes3d[:, 3] / 2, boxes3d[:, 4] / 2 # h/2, w/2
    boxes_bev[:, 0], boxes_bev[:, 1] = cu - half_l, cv - half_w
    boxes_bev[:, 2], boxes_bev[:, 3] = cu + half_l, cv + half_w
    boxes_bev[:, 4] = boxes3d[:, 6]
    return boxes_bev

部分模块解析
测试github提供的预训练模型【epoch_50.pth】，更改模型加载权参代码，其检测结果依然为none。？？？？

def load_params_from_file(model, filename, to_cpu=False):
    if not os.path.isfile(filename):
        raise FileNotFoundError

    print('==> Loading parameters from checkpoint %s to %s' % (filename, 'CPU' if to_cpu else 'GPU'))
    loc_type = torch.device('cpu') if to_cpu else None
    checkpoint = torch.load(filename, map_location=loc_type)
    model_state_disk = checkpoint['state_dict'] #  model_state  state_dict

    if 'version' in checkpoint:
        print('==> Checkpoint trained from version: %s' % checkpoint['version'])

    update_model_state = {}
    for key, val in model_state_disk.items():

        # changed key for pretrained model. @2022.8.2
        new_key = 'module.' + key  
    
        if new_key in model.state_dict() and model.state_dict()[new_key].shape == model_state_disk[key].shape:
            update_model_state[new_key] = val
        elif new_key in model.state_dict() and model.state_dict()[new_key].shape != val.shape:
            # with different spconv versions, we need to adapt weight shapes for spconv blocks.
            # adapt spconv weights from version 1.x to version 2.x if you used weights from spconv 1.x
            val_native = val.transpose(-1, -2)  # (k1, k2, k3, c_in, c_out) to (k1, k2, k3, c_out, c_in)
            if val_native.shape == model.state_dict()[new_key].shape:
                val = val_native.contiguous()
            else:
                assert val.shape.__len__() == 5, 'currently only spconv 3D is supported'
                val_implicit = val.permute(4, 0, 1, 2, 3)  # (k1, k2, k3, c_in, c_out) to (c_out, k1, k2, k3, c_in)
                if val_implicit.shape == model.state_dict()[new_key].shape:
                    val = val_implicit.contiguous()
            update_model_state[new_key] = val

        if key in model.state_dict() and model.state_dict()[key].shape == model_state_disk[key].shape:
            update_model_state[key] = val
            # logger.info('Update weight %s: %s' % (key, str(val.shape)))

    update_model_state['module.neck.point_fc.weight'] = model_state_disk['neck.backbone.point_fc.weight']  # [email protected]
    update_model_state['module.neck.point_cls.weight'] = model_state_disk['neck.backbone.point_cls.weight']  # [email protected]
    update_model_state['module.neck.point_reg.weight'] = model_state_disk['neck.backbone.point_reg.weight']  # [email protected]

    state_dict = model.state_dict()
    state_dict.update(update_model_state)
    model.load_state_dict(state_dict)

    for key in state_dict:
        if key not in update_model_state:
            print('Not updated weight %s: %s' % (key, str(state_dict[key].shape)))

    print('==> Done (loaded %d/%d)' % (len(update_model_state), len(model.state_dict())))

3. 评估
PR曲线定性分析，AP定量分析。从AP_bbox2d、AP_bev、AP_3d、AOS(平均方向相似度–检测目标旋转角度准确率，衡量检测结果与GT方向相似性)

长尾形分布论文速览三十篇【60-89】木木阳 Long-tailed 人工智能
长尾形分布速览（60-89）这些研究展示了LLMs在长尾数据分布、持续学习、异常检测、联邦学习、对比学习、知识图谱、推荐系统、多目标跟踪、标签修复、对象检测、医疗生物医学以及其他应用中的广泛应用。通过优化和创新，LLMs在这些领域展现了卓越的性能，并为解决长尾问题提供了有效的工具和方法。1.长尾持续学习与对抗学习长尾持续学习(Paper60):通过优化器状态重用来减少遗忘，提高在长尾任务中的持续学
Matplotlib 报错 AttributeError: module ‘backend_interagg‘ has no attribute ‘FigureCanvas‘
解决办法一在代码开始的部分添加引用importmatplotlibmatplotlib.use('TkAgg')解决办法二降低matplotlib的版本，3.5.0版本及以下的都可以pipinstallmatplotlib==3.5.0官方文档指出：如果没有显式设置后端，Matplotlib会根据系统上可用的内容以及是否已运行GUI事件循环自动检测可用的后端。选择以下列表中第一个可用的后端：Mac
I2C子系统面试指南：基础原理、经典问答与答题技巧全解析嵌入式Jerry Linux+内核面试职场和发展 linux 服务器运维单片机 java
I2C子系统面试指南：基础原理、经典问答与答题技巧全解析关于本篇博文，B站视屏讲解链接，点击进入深度学习一、引言：为什么要深入掌握I2C子系统？在嵌入式、驱动开发、BSP移植、甚至AIoT行业，I2C几乎是绕不开的“基础功”。不管你是应聘Linux驱动开发、嵌入式软件工程师、SoC底层支持，还是BSP/系统调试，I2C的核心架构和调试经验都是面试高频关注点。掌握I2C子系统，关键不止是能写驱动，更
Java分布式存储炼金术：故障检测与自愈的魔法阵墨夶 Java学习资料1 java 分布式开发语言
一、环境搭建：魔法阵的基础1.1依赖库与工具“准备炼金材料：框架、锁、断路器！”org.ap
C#与MR的量子级交互：用代码构建会呼吸的混合现实界面，让UI消失在空气中！墨夶 C#学习资料 c#mr 交互
一、混合现实革命：MR界面设计的三大颠覆性原则1.1传统UI的终结与MR的崛起空间即界面：物理空间成为交互载体，告别屏幕束缚手势即语言：自然手势取代鼠标键盘，交互效率提升300%数据可视化革命：3D全息投影让抽象数据具象化案例：某汽车厂商用MR界面将发动机数据投影在真实引擎上，维修效率提升65%1.2C#在MR开发中的核心优势特性C#实现其他语言对比空间计算Unity+ARFoundation提供
KANN 是一个独立的轻量级 C 语言库，用于构建和训练中小型人工神经网络，例如多层感知器、卷积神经网络和递归神经网络（包括 LSTM 和 GRU）。它实现了基于图的逆模自动微分，并允许构建具有递归等
一、软件介绍文末提供程序和源码下载KANN是一个独立的轻量级C语言库，用于构建和训练中小型人工神经网络，例如多层感知器、卷积神经网络和递归神经网络（包括LSTM和GRU）。它实现了基于图的逆模自动微分，并允许构建具有递归、共享权重和多个输入/输出/成本的拓扑复杂神经网络。与TensorFlow等主流深度学习框架相比，KANN的可扩展性较低，但它的灵活性接近，代码库要小得多，并且仅依赖于标准C库。与
无需多卡集群，单卡运行扩散模型的技术突破与实践源客z stablediffusion
近年来，扩散模型（DiffusionModels）在图像、视频、3D生成等领域取得巨大进展。然而，传统扩散模型往往依赖多卡集群（如8×A100）进行高效训练与推理，这使得个人开发者和中小团队的应用受限。幸运的是，随着模型架构优化、量化技术、推理加速方案的发展，越来越多的开源扩散模型可以在单张消费级显卡（如RTX4090、T4、A6000）上运行，并且性能接近或超越原生大规模模型。本文整理了当前可在
AttnRNN：参数更少，却断档碾压LSTM/GRU的新RNN wq舞s 人工智能 python 深度学习 deep learning ai 科技 pytorch
研究者与发布者为:CSDNwq舞s，知乎wqwsgithubwqws突破性进展！新型注意力RNN（AttnRNN）在长序列任务中全面超越传统RNN模型在深度学习领域，循环神经网络（RNN）及其变体GRU和LSTM长期以来一直是处理序列数据的首选架构。然而，它们在长序列任务中始终存在信息遗忘和梯度消失等问题。今天，我很高兴地宣布一种全新的RNN架构——AttnRNN，它在多个长序列基准测试中全面超越
C语言教学大变革！DeepSeek如何改变高职院校编程课堂？武汉唯众智创 c语言开发语言程序设计 Deepseek
一、引言在当今数字化转型的浪潮中，程序设计与分析能力已成为高职教育中不可或缺的核心竞争力。作为编程语言的基础，C语言不仅训练学生的计算思维，还培养其算法实现能力。然而，当前高职院校的C语言教学面临诸多挑战，如实践环节薄弱、学生创新能力不足等。DeepSeek等新一代智能编码支持系统的出现，为这一现状带来了转机。该系统融合了深度神经网络与语义解析技术，能够智能生成代码、优化缺陷检测、解构程序逻辑，并
AI人工智能领域深度学习的跨模态检索技术 AI学长带你学AI AI人工智能与大数据应用开发 AI应用开发高级指南人工智能深度学习 ai
AI人工智能领域深度学习的跨模态检索技术关键词：跨模态检索、深度学习、多模态学习、特征提取、相似度计算、注意力机制、Transformer摘要：本文深入探讨了AI领域中基于深度学习的跨模态检索技术。我们将从基础概念出发，详细分析跨模态检索的核心算法原理、数学模型和实际应用。文章包含完整的Python实现示例，展示如何构建一个跨模态检索系统，并讨论当前的技术挑战和未来发展方向。通过本文，读者将全面理
工业缺陷检测深度学习方法综述 2301_80355452 深度学习人工智能
其被广泛地应用于无人质检、智能巡检、质量控制等各种生产与运维场景中.一.工业缺陷检测的背景与特点工业缺陷检测面临着诸多难点:缺陷样本匮乏、缺陷的可视性低、形状不规则、类型未知等,直接使用异常检测方法难以满足工业缺陷检测的任务需求.二.介绍工业缺陷检测问题的定义,分析研究难点与挑战异常：点异常、上下文异常和集群异常。点异常：又称为离群值(outliers)[9],描述数值上偏离正常样本的独立数据。与
matlab 渐进三角网(PTD)地面滤波(基础版) 点云侠 matlab点云工具箱 matlab 开发语言算法 c++计算机视觉
目录一、算法原理1、PTD算法2、实现流程二、代码实现三、结果展示1、原始点云2、滤波结果代码是按照算法原理的复现，效率极低，只适合学习和理解算法。一、算法原理1、PTD算法渐进三角网地面滤波算法（ProgressiveTINDensification,PTD）是一种广泛应用于机载LiDAR点云数据处理的滤波方法，旨在从复杂场景中精确分离地面点，以生成数字高程模型（DEM）。2、实现流程 P
脑机新手指南（三）：新手小白入门 BCI-从认识到初体验（上）
一、引言脑机接口（Brain-ComputerInterface，简称BCI）作为一项前沿科技，正逐渐改变我们对大脑与外部设备交互方式的认知。本教程旨在为完全不了解BCI的新手提供一个全面且系统的入门指南，帮助大家开启在BCI领域的学习之旅。二、认识BCIBCI的定义BCI是一种能够实现大脑与外部设备直接通信的技术。它通过检测大脑活动产生的电信号、磁信号或其他生理信号，并将这些信号转化为计算机能够
Python程序设计第6章：函数和函数式编程若北辰 Python程序设计 python 开发语言
Python程序设计Python是全球范围内最受欢迎的编程语言之一，学好Python将对个人职业生涯产生很大的助力，Python在机器学习、深度学习、数据挖掘等领域应用极为广泛。在数据科学家/数据分析师、人工智能工程师、网络安全工程师、软件工程师/全栈工程师、自动化测试工程师等岗位，年入50万，很普遍，学好Python，高薪就业不是问题，因此推出Python程序设计系列文章：Python程序设计第
AI人工智能与OpenCV：实现智能图像编辑功能 AI智能探索者 AI Agent 智能体开发实战人工智能 opencv 计算机视觉 ai
AI人工智能与OpenCV：实现智能图像编辑功能关键词：人工智能、OpenCV、图像处理、计算机视觉、深度学习、智能编辑、图像增强摘要：本文深入探讨如何结合人工智能(AI)和OpenCV实现智能图像编辑功能。我们将从基础概念出发，详细介绍核心算法原理，展示实际代码实现，并分析典型应用场景。文章将涵盖从传统图像处理技术到深度学习方法的演进，重点讲解如何利用OpenCV和AI模型实现自动化的图像增强、
ubuntu安装配置fail2ban 你都会上树？ Linux ubuntu linux 运维
Fail2Ban概述Fail2Ban是一种用于防止暴力破解攻击的安全工具，它通过监控系统的日志文件（如/var/log/auth.log）来检测异常的登录尝试，并自动将可疑的IP地址加入黑名单，从而阻止其进一步的访问请求。Fail2Ban的工作原理日志监控：Fail2Ban持续监控指定的日志文件，寻找失败的登录尝试记录。规则匹配：根据预设的规则（如连续失败的次数和时间间隔），Fail2Ban识别出
人工智能-基础篇-2-什么是机器学习？（ML，监督学习，半监督学习，零监督学习，强化学习，深度学习，机器学习步骤等） weisian151 人工智能人工智能机器学习学习
1、什么是机器学习？机器学习（MachineLearning,ML）是人工智能的一个分支，是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析等数学理论。其核心目标是让计算机通过分析数据，自动学习规律并构建模型，从而对未知数据进行预测或决策，而无需依赖显式的程序指令。基本思想：通过数据驱动的方式，使系统能够从经验（数据）中改进性能，形成对数据模式的抽象化表达。基本概念：模型：模型是对现实世界现
MFC小例子说明千里修行 MFC Windows
目录一.枚举窗口EnumDialog1.枚举方式2.查找窗口3.检测当前应用程序是否存在二.按钮激活ButtonActive1.原理2.实现三.星形查看器AsterPassword1.原理2.实现四.图片浏览器ImageExplore1.原理2.实现五.模拟键鼠消息MouseKeboardClick1.原理2.实现六.屏幕放大镜ScreenMagnify1.原理2.实现七.屏幕截图功能SCreen
Vulkan 学习(18)---- 使用 ValidationLayer 小猪佩奇TONY Vulkan 学习学习 mfc c++
目录ValidationLayer简介启用ValidationLayerEnableValidationLayer检查扩展支持创建回调函数注册回调函数AndroidValidationLayerValidationLayer简介VulkanAPI的设计是按照最小化驱动程序的开销进行的，所以默认情况下VulkanAPI提供的错误检测的功能非常有限，很多基本的错误都没有被Vulkan显式进行处理，遇到
【blender】bpy操作：选择对象和激活对象九河_ 散装知识点 blender
这是一个非常重要且容易混淆的问题，Blender中“激活对象（activeobject）”与“选中对象（selectedobjects）”是两个不同的概念，尤其在脚本和操作（如编辑模式、UV操作）中有重大区别。1.区别说明名称含义可有多个？用途选中对象(obj.select_get()==True)在3D视图中高亮黄色（或橙色）的对象✅多个常用于批量操作、移动、删除等激活对象(bpy.contex
贝叶斯网络与深度学习的结合：图像识别和分类 AI天才研究院 AI人工智能与大数据计算 AI大模型企业级应用开发实战自然语言处理人工智能语言模型编程实践开发语言架构设计
本文我将为您撰写一篇关于"贝叶斯网络与深度学习的结合：图像识别和分类"的技术博客文章。这篇文章将深入探讨贝叶斯网络和深度学习在图像识别和分类领域的结合应用。我会遵循您提供的要求和结构模板,确保文章内容全面、深入且易于理解。让我们开始吧。贝叶斯网络与深度学习的结合：图像识别和分类关键词：贝叶斯网络、深度学习、图像识别、图像分类、概率推理、卷积神经网络、不确定性建模文章目录贝叶斯网络与深度学习的结合：
Halcon 初步了解科学的发展-只不过是读大自然写的代码图形编程 c#视觉处理 Halcon
1.Halcon概述Halcon是德国MVTec公司开发的一套完善的机器视觉算法包，也是一款功能强大的视觉处理软件，为工业自动化领域提供了全面的解决方案。它拥有应用广泛的机器视觉集成开发环境，提供了一套丰富的图像处理和机器视觉算法，可以在各种工业应用中进行图像分析、目标检测、测量、定位、识别等任务。Halcon的核心功能包括图像处理、特征提取与匹配、3D视觉、深度学习、条码识别、OCR识别以及视觉
Three.js 中文Typeface文件字体大全 | 如何利用Github获取中文Typeface文件 CHENJIAMIAN PRO javascript github 开发语言
TextGeometry和TextBufferGeometry是用于生成3D文本的有效工具。在使用这些工具时，我们需要指定一个包含字体信息的JSON文件，称为typeface.json。Github搜索结果通过在GitHub上搜索TextBufferGeometry的相关内容，我找到了以下一些字体文件。Codesearchresults楷体字体楷体(KaiTiRegular)楷体字体端正美观，非常
如何在pytorch中使用tqdm：优雅实现训练进度监控 Ven% 简单入门pytorch pytorch 人工智能 python
文章目录为什么需要进度条？tqdm简介基础用法示例深度学习中的实战应用1.数据加载进度监控2.训练循环增强版3.验证阶段集成高级技巧与最佳实践1.自定义进度条样式2.嵌套进度条（多任务）3.分布式训练支持4.与日志系统集成性能优化建议完整训练流程示例常见问题解决方案总结掌握训练进度监控是深度学习工程师的基本功。本文将带你从零开始，深入探索如何用tqdm为深度学习训练添加专业级进度条。为什么需要进度
【Python】Hydra 用法详解行码棋 #Python python 开发语言
Hydra官方文档Hydra（Python配置管理工具）1.引言在机器学习、深度学习和软件开发中，管理复杂的配置是一个常见的挑战。Hydra是一个强大的Python库，允许开发者轻松地管理和组织配置文件，支持动态参数覆盖、多层次配置和可组合配置等特性。2.安装HydraHydra可以通过pip直接安装：pipinstallhydra-core安装完成后，你可以使用hydra进行配置管理。3.基础用
onnx模型部署 python_深度学习模型转换与部署那些事(含ONNX格式详细分析) weixin_39759270 onnx模型部署 python
背景深度学习模型在训练完成之后，部署并应用在生产环境的这一步至关重要，毕竟训练出来的模型不能只接受一些公开数据集和榜单的检验，还需要在真正的业务场景下创造价值，不能只是为了PR而躺在实验机器上在现有条件下，一般涉及到模型的部署就要涉及到模型的转换，而转换的过程也是随着对应平台的不同而不同，一般工程师接触到的平台分为GPU云平台、手机和其他嵌入式设备对于GPU云平台来说，在上面部署本应该是最轻松的事
用户实体行为分析与数据异常访问联防方案 KKKlucifer 时序数据库
一、用户实体行为分析（UEBA）技术概述1.1定义与概念用户实体行为分析（UEBA）是一种高级网络安全方法，它利用机器学习和行为分析技术，对用户、设备、应用程序等实体在网络环境中的行为进行深入分析，以检测出异常行为和潜在的安全威胁。UEBA的核心在于通过建立行为基线，识别出偏离正常行为模式的活动，从而发现那些传统安全工具难以检测到的高级、隐藏和内部威胁。1.2工作原理UEBA系统通过收集来自多个数
从零开始理解Transformer模型：架构与应用淮橘√ transformer 深度学习人工智能
引言近年来，Transformer模型席卷了自然语言处理（NLP）领域，成为了深度学习中的明星架构。从Google提出的《AttentionisAllYouNeed》论文到ChatGPT、BERT等模型的广泛应用，Transformer以其强大的性能和灵活性改变了我们对序列建模的认知。本文将从零开始，深入浅出地解析Transformer的架构原理、核心组件以及实际应用场景，并提供一个简单的代码示例
Autodesk 3ds Max 2025专业级硬件配置指南：释放三维创作潜能渲吧-云渲染 3d
Autodesk3dsMax2025软件受以下64位操作系统支持，并且至少需要具有以下64位硬件的系统：软件操作系统Microsoft®Windows®10版本1809或更高版本。Microsoft®Windows®11有关支持信息，请参见Autodesk的产品支持生命周期。浏览器Autodesk建议使用以下Web浏览器的最新版本来访问联机补充内容：Microsoft®EdgeGoogleChro
Panda3D实战：从入门到精通 KENYCHEN奉孝 python实践大全 python 开发语言 c++
Panda3D基础实例创建一个简单的Panda3D场景，加载一个模型并显示：fromdirect.showbase.ShowBaseimportShowBaseclassMyApp(ShowBase):def__init__(self):ShowBase.__init__(self)self.scene=self.loader.loadModel("models/environment")self
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement