麒麒哈尔

【代码阅读】PointRCNN网络可视化，代码详解

数据准备

统计gt_box

作者使用generate_gt_database.py生成储存了数据集所有Car的gt box的信息的文件，包括每个gt box的：

sample_id：gt box所对应的文件名
cls_type：gt box的cls type
gt_box3d：gt box的3D信息
points：gt box中包含的点云
intensity：gt box中包含的电云的强度
obj：这个gt box对应object所有的信息，例如center，size，angle，occlusion，level等

dataset

首先定义kitti_dataset，定义通用接口，初始化data的寻找路径等

# lib/datasets/kitti_dataset.py
class KittiDataset(torch_data.Dataset):
    def __init__(self, root_dir, split='train'):
        self.split = split
        is_test = self.split == 'test'
        self.imageset_dir = os.path.join(root_dir, 'KITTI', 'object', 'testing' if is_test else 'training')

        split_dir = os.path.join(root_dir, 'KITTI', 'ImageSets', split + '.txt')
        self.image_idx_list = [x.strip() for x in open(split_dir).readlines()]
        self.num_sample = self.image_idx_list.__len__()

        self.image_dir = os.path.join(self.imageset_dir, 'image_2')
        self.lidar_dir = os.path.join(self.imageset_dir, 'velodyne')
        self.calib_dir = os.path.join(self.imageset_dir, 'calib')
        self.label_dir = os.path.join(self.imageset_dir, 'label_2')
        self.plane_dir = os.path.join(self.imageset_dir, 'planes')

    def get_image(self, idx):

    def get_image_shape(self, idx):

    def get_lidar(self, idx):

    def get_calib(self, idx):

    def get_label(self, idx):

    def get_road_plane(self, idx):

    def __len__(self):

    def __getitem__(self, item):

然后定义PointRCNN特殊的dataset，主要是完成提取数据，数据增广等操作。这里主要看准备用于训练rpn的数据。其实代码中的注释已经写的非常好了，这里就直接写一下都做了些什么：

读取calib，image_shape，pts

# lib/datasets/kitti_rcnn_dataset.py
    def get_rpn_sample(self, index):
        sample_id = int(self.sample_id_list[index])
        if sample_id < 10000:
            calib = self.get_calib(sample_id)
            # img = self.get_image(sample_id)
            img_shape = self.get_image_shape(sample_id)
            pts_lidar = self.get_lidar(sample_id)

            # get valid point (projected points should be in image)
            # 将pts转换到cam0坐标系内
            pts_rect = calib.lidar_to_rect(pts_lidar[:, 0:3])
            pts_intensity = pts_lidar[:, 3]
        else:
            calib = self.get_calib(sample_id % 10000)
            # img = self.get_image(sample_id % 10000)
            img_shape = self.get_image_shape(sample_id % 10000)

            pts_file = os.path.join(self.aug_pts_dir, '%06d.bin' % sample_id)
            assert os.path.exists(pts_file), '%s' % pts_file
            aug_pts = np.fromfile(pts_file, dtype=np.float32).reshape(-1, 4)
            pts_rect, pts_intensity = aug_pts[:, 0:3], aug_pts[:, 3]
		
		# 将pts_rect投影到cam2的图像坐标系，pts_imgs为（u，v）坐标
        pts_img, pts_rect_depth = calib.rect_to_img(pts_rect)
        # 将pts_imgs在图像外的去掉，将pts_rect在给定边界外的去掉，得到保留点的flag。图像的外的点通过(u,v)不在图像内获得，pts_rect的点根据cfg获得，x∈[-40,40],y∈[-1,3],z∈[0,70.1]
        pts_valid_flag = self.get_valid_flag(pts_rect, pts_img, pts_rect_depth, img_shape)

        pts_rect = pts_rect[pts_valid_flag][:, 0:3]
        pts_intensity = pts_intensity[pts_valid_flag]

        if cfg.GT_AUG_ENABLED and self.mode == 'TRAIN':
            # all labels for checking overlapping
            # 去掉是‘DonotCare’的obj
            all_gt_obj_list = self.filtrate_dc_objects(self.get_label(sample_id))
            all_gt_boxes3d = kitti_utils.objs_to_boxes3d(all_gt_obj_list)  # Nx7 （x,y,z,h,w,l,ry)

            gt_aug_flag = False
            if np.random.rand() < cfg.GT_AUG_APPLY_PROB:
                # augment one scene
                # 添加其他场景中的obj到这个场景。
                # gt_aug_flag是True代表加入了新的obj
                # pts_rect, pts_intensity都是加入了新的点之后的点云和强度（if gt_aug_flag）
                # extra_gt_boxes3d, extra_gt_obj_list是新加入的（if gt_aug_flag）
                gt_aug_flag, pts_rect, pts_intensity, extra_gt_boxes3d, extra_gt_obj_list = \
                    self.apply_gt_aug_to_one_scene(sample_id, pts_rect, pts_intensity, all_gt_boxes3d)

        # generate inputs
        # 将点降采样或者补充成16384个
        if self.mode == 'TRAIN' or self.random_select:
            if self.npoints < len(pts_rect):
                pts_depth = pts_rect[:, 2]
                pts_near_flag = pts_depth < 40.0
                far_idxs_choice = np.where(pts_near_flag == 0)[0]
                near_idxs = np.where(pts_near_flag == 1)[0]
                near_idxs_choice = np.random.choice(near_idxs, self.npoints - len(far_idxs_choice), replace=False)

                choice = np.concatenate((near_idxs_choice, far_idxs_choice), axis=0) \
                    if len(far_idxs_choice) > 0 else near_idxs_choice
                np.random.shuffle(choice)
            else:
                choice = np.arange(0, len(pts_rect), dtype=np.int32)
                if self.npoints > len(pts_rect):
                    extra_choice = np.random.choice(choice, self.npoints - len(pts_rect), replace=False)
                    choice = np.concatenate((choice, extra_choice), axis=0)
                np.random.shuffle(choice)

            ret_pts_rect = pts_rect[choice, :]
            ret_pts_intensity = pts_intensity[choice] - 0.5  # translate intensity to [-0.5, 0.5]
        else:
            ret_pts_rect = pts_rect
            ret_pts_intensity = pts_intensity - 0.5

        pts_features = [ret_pts_intensity.reshape(-1, 1)]
        ret_pts_features = np.concatenate(pts_features, axis=1) if pts_features.__len__() > 1 else pts_features[0]

        sample_info = {'sample_id': sample_id, 'random_select': self.random_select}

        if self.mode == 'TEST':
            if cfg.RPN.USE_INTENSITY:
                pts_input = np.concatenate((ret_pts_rect, ret_pts_features), axis=1)  # (N, C)
            else:
                pts_input = ret_pts_rect
            sample_info['pts_input'] = pts_input
            sample_info['pts_rect'] = ret_pts_rect
            sample_info['pts_features'] = ret_pts_features
            return sample_info

        gt_obj_list = self.filtrate_objects(self.get_label(sample_id))
        if cfg.GT_AUG_ENABLED and self.mode == 'TRAIN' and gt_aug_flag:
            gt_obj_list.extend(extra_gt_obj_list)
        gt_boxes3d = kitti_utils.objs_to_boxes3d(gt_obj_list)

        gt_alpha = np.zeros((gt_obj_list.__len__()), dtype=np.float32)
        for k, obj in enumerate(gt_obj_list):
            gt_alpha[k] = obj.alpha

        # data augmentation
        aug_pts_rect = ret_pts_rect.copy()
        aug_gt_boxes3d = gt_boxes3d.copy()
        if cfg.AUG_DATA and self.mode == 'TRAIN':
        	# rotation，scale，flip
            aug_pts_rect, aug_gt_boxes3d, aug_method = self.data_augmentation(aug_pts_rect, aug_gt_boxes3d, gt_alpha,
                                                                              sample_id)
            sample_info['aug_method'] = aug_method

        # prepare input
        if cfg.RPN.USE_INTENSITY:
            pts_input = np.concatenate((aug_pts_rect, ret_pts_features), axis=1)  # (N, C)
        else:
            pts_input = aug_pts_rect

        if cfg.RPN.FIXED:
            sample_info['pts_input'] = pts_input
            sample_info['pts_rect'] = aug_pts_rect
            sample_info['pts_features'] = ret_pts_features
            sample_info['gt_boxes3d'] = aug_gt_boxes3d
            return sample_info

        # generate training labels
        rpn_cls_label, rpn_reg_label = self.generate_rpn_training_labels(aug_pts_rect, aug_gt_boxes3d)
        sample_info['pts_input'] = pts_input
        sample_info['pts_rect'] = aug_pts_rect
        sample_info['pts_features'] = ret_pts_features
        sample_info['rpn_cls_label'] = rpn_cls_label
        sample_info['rpn_reg_label'] = rpn_reg_label
        sample_info['gt_boxes3d'] = aug_gt_boxes3d
        return sample_info

PointRCNN

PointRCNN是CVPR2019中3D目标检测的文章。3D目标检测是一个计算机视觉中比较新的任务，其他的文献综述可以参考我的另外一篇博客3D Object Detection 3D目标检测综述
该文章使用two-stage方式，利用PointNet++作为主干网络，先完成segmentation任务，判断每个三维点的label。对分为前景的每个点，使用feature生成框。然后对框进行roi crop，进行框的优化。该论文网络复杂，代码量巨大，真是佩服论文作者的代码功底，自愧不如。本文着重对网络结构的理解。代码来源是文章作者给出的代码，用的是pytorch，github传送门
接下来，我将先对运算过程进行可视化，然后再列出部分本篇论文我注意到的点。

PointRCNN网络结构

由于PointRCNN使用PointNet++作为主干网络，所以对PointNet++的具体网络结构不是很了解的同学可以参考我的另一篇博客PointNet++具体实现详解，其中也是着重对网络结构的理解。先看PointRCNN的网络结构的可视化：

图1 RPN结构

图2 RCNN.ProposalTargetLayer结构

图3 RCNN的分类和回归部分

图的解释
- 虚线大框：一个虚线框代表一个完整的子网络，对应代码中的一个class
- 红色小框：每个子网络的名称
- 蓝色小块：大多数一个蓝色小块代表一个tensor，蓝色小框的第一行为tensor的名称，第二行为tensor的尺寸。少量未标注尺寸的为一个子网络
- 橘色小块：一个子网络的输出
- 箭头：一种操作，没有标的大部分为resize或者permutation操作，也有concatenate操作

RPN
- RPN.BackBone
  - 输入：点云（batch，number of points，number of channels）
  - 输出：xyz，每个点的 feature，每个点的分类结果 rpn_cls，每个点对框的回归结果 rpn_reg
  - 三维点云xyz经过主干网络得到point-wise的特征feature
  - feature经过分类头和回归头得到point-wise的分类结果rpn_cls和回归结果rpn_reg，分类头和回归头由Conv1d组成
- cls_rpn经过sigmoid变换到[0, 1]之间，表示该点为车的score，score大于阈值thres的点被认为是属于车的点，从而构造seg_mask，用于构造RCNN的输入
- 通过每个点的三维信息xyz计算点距离原点的深度信息depth，用于RCNN的输入
- RPN.ProposalLayer
  - 输入：rpn_reg，rpn_cls
  - 输出：roi
  - 将rpn_reg分解，并与三维点xyz和anchor计算proposals
  - 使用Distance Proposal 减小proposal的数量。Distance Proposal：
    - 用雷达点的y坐标以40为界分为两块区域，[0, 40] 和 [40, 80]
    - 按照rpn_cls（代表是box的置信度）进行排序，[0, 40]的区域选取6300个框，[40, 80]选取2700个框
    - 将框转为BEV，然后使用nms，两个区域分别选取前358和154个框（nms后如果框的数量少于这两个值就全部选取，用0补足到512个框）
- 输出每个batch的512个框roi

RCNN
- RCNN.ProposalTargetLayer
  - 输入：roi，gt_boxes，xyz，seg_mask，depth，feature
  - 输出：采样过后的roi，roi_iou，对应的roi_gt_boxes，roi中包括的pts_sample和feature_sample，batch_cls_mask，reg_valid_mask
  - 使用RoISample再次采样RoI，RoISample：
    - 计算所有roi与真值之间的IoU，并按照IoU分为fg（前景），easy bg（简单背景）和 hard bg（困难背景），中sample数64个，fg最多32个，剩余的由bg补充，其中hard bg占比0.8。
    - 然后对roi做augmentation，更新roi和对应的IoU
  - 将xyz，seg_mask，depth和feature进行concatenate，得到pts_feature
  - 对pts_feature进行RoIPooling，每个RoI中取512个点，得到pooled_feature，并得到不包含点的RoI的flag
  - 将pooled_feature中的坐标和feature分离，然后做roi的augmentation，并将坐标系转到roi中心，更新roi中点的三维坐标和gt_box的坐标
  - 计算batch_cls_mask，reg_valid_mask用于计算loss，batch_cls_mask统计roi不为hard bg且其中包含点的mask，作为cls_label在计算loss中使用；reg_valid_mask统计roi属于fg的mask
- pts_sample和feature_sample重组，提取直接由三维点云获得的信息xyz_feature（包括xyz，seg_mask和depth），然后使用xyz_up_layer进行特征提取，与rpn得到的feature进行concatenate，然后使用merged_down_layer进行merge，得到merged_feature
- 将merged_feature送入3个PointNet++中提出的SA层中，得到高级特征
- 然后使用分类头和回归头进行预测

训练过程

PointRCNN是two-stage结构的网络，所以训练过程也是先训练RPN，再训练RCNN。

RPN
- label：在通过dataloader构建训练数据的同时，构建label
  - cls_label：将gt_box内的点置1，gt_box之外extended_gt_box之内的点置-1（表示忽略）
  - reg_label：计算gt_box之内的点的reg量
- loss：SigmoidFocalLoss + Full-bin Loss（CrossEntropyLoss + SmoothL1Loss）
RCNN
- label：
  - cls_label：在RCNN.ProposalTargetLayer中的batch_cls_mask为label
  - reg_label：使用RCNN.ProposalTargetLayer中的roi_gt_boxes计算
- loss：SigmoidFocalLoss + Full-bin Loss（CrossEntropyLoss + SmoothL1Loss）

思考

文章使用two-stage的方法，在proposal的过程中，每个个三维点都回归一个proposal，使得理论上所有的box都能够被找到
文章使用bin based回归方式，而且是在所有回归的地方都使用bin based的方式，提高了网络的收敛速度和准确率。
文章使用PointNet++作为主干框架，使得不需要在体素化阶段损失信息
其他3D物体检测的文章可以参考我的另一篇博客另外一篇博客3D Object Detection 3D目标检测综述

Github开源库Xpopup代码阅读月亮下的小草屋 github开源库代码阅读 android
前言很久没写点东西了，在家闲着考了个驾照，花了一个半月，中国的驾考真的是没眼看，刚拿到驾照当天就被疫情封闭在家，直接封了一个多月，人都麻了，再来一次估计直接过年了，最近刚开始干点活。Xpopup是我非常喜欢的一个Github开源库，一直在用，我在Xpopup2.x版本的时候看过一遍它的代码，现在已经更新到3.x版本了，这两天也没啥事，又重新看了一遍，Xpopup的代码还是很容易阅读的，有兴趣的话可
tensorflow Serving架构详解和代码示例 lloyd_chou 算法 ml 机器翻译智慧城市边缘计算人工智能
本文介绍tensorflowServing的原理和代码实现,并提供简要的代码阅读指导.如何serve一个模型具体的步骤可以参考官方文档.主要包括两个部分：1.导出模型1.启动服务需要说明的是导出模型部分.如果要把我们训练的模型拿来提供服务,除了模型本身外,还需要一些额外的信息,比如模型的名称,输入、输出对应的tensor信息,方法名,这些东西可以让TFS进行请求数据的格式检查以及目标模型查找.这就
lldp协议代码阅读_AXIStream代码详解 weixin_39986060 lldp协议代码阅读
AXI-Stream代码详解AXI4-Stream跟AXI4的区别在于AXI4-Stream没有ADDR接口，这样就不涉及读写数据的概念了，只有简单的发送与接收说法，减少了延时，允许无限制的数据突发传输规模。AXI4-Stream的核心思想在于流式处理数据。图4‑58AXI-StreamInterface全局信号1.ACLK全局时钟信号，在上升沿时对信号采样。所有的输入信号都通过上升沿采集，所有的
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-VOC.yaml 红色的山茶花 YOLO 笔记深度学习
VOC.yamlultralytics\cfg\datasets\VOC.yaml目录VOC.yaml1.YAML文件内容2.所需的库和模块3.defconvert_label(path,lb_path,year,image_id):4.Download5.Convert1.YAML文件内容#UltralyticsAGPL-3.0License-https://ultralytics.com/li
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-model.py 红色的山茶花 YOLO 笔记深度学习
model.pyultralytics\models\yolo\model.py目录model.py1.所需的库和模块2.classYOLO(Model):3.classYOLOWorld(Model):1.所需的库和模块#UltralyticsAGPL-3.0License-https://ultralytics.com/licensefrompathlibimportPathfromultra
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-converter.py 红色的山茶花 YOLO 笔记深度学习
converter.pyultralytics\data\converter.py目录converter.py1.所需的库和模块2.defcoco91_to_coco80_class():3.defcoco80_to_coco91_class():4.defconvert_coco(labels_dir="../coco/annotations/",save_dir="coco_converted
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-metrics.py 红色的山茶花 YOLO 笔记深度学习
metrics.pyultralytics\utils\metrics.py目录metrics.py1.所需的库和模块2.defbbox_ioa(box1,box2,iou=False,eps=1e-7):3.defbox_iou(box1,box2,eps=1e-7):4.defbbox_iou(box1,box2,xywh=True,GIoU=False,DIoU=False,CIoU=Fal
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-tasks.py 红色的山茶花 YOLO 笔记深度学习
tasks.pyultralytics\nn\tasks.py目录tasks.py1.所需的库和模块2.classBaseModel(nn.Module):3.classDetectionModel(BaseModel):4.classOBBModel(DetectionModel):5.classSegmentationModel(DetectionModel):6.classPoseModel
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-ops.py 红色的山茶花 YOLO 笔记深度学习
ops.pyultralytics\models\utils\ops.py目录ops.py1.所需的库和模块2.classHungarianMatcher(nn.Module):3.defget_cdn_group(batch,num_classes,num_queries,class_embed,num_dn=100,cls_noise_ratio=0.5,box_noise_scale=1.0
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-results.py 红色的山茶花 YOLO 笔记深度学习
results.pyultralytics\engine\results.py目录results.py1.所需的库和模块2.classBaseTensor(SimpleClass):3.classResults(SimpleClass):4.classBoxes(BaseTensor):5.classMasks(BaseTensor):6.classKeypoints(BaseTensor):7.
实战讲解，原来是用 SpringBoot 实现策略模式可以这么简单 java小浩 java spring boot 开发语言
一、介绍一说起策略设计模式，相比大家都不陌生，在实际的业务开发中，合理的使用设计模式来编程，可以让代码阅读起来层次感更强，同时扩展性也会得到提升！最近看同事的代码时候，学到了一个小技巧，在某些场景下合理的使用策略模式还是非常有用的，在此分享一下给大家。二、代码实践在介绍SpringBoot中如何实现策略设计模式之前，我们先简单的回顾一下策略模式的设计思路。以编写一个简单的程序计算器，代码如下！首先
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-validator.py 红色的山茶花 YOLO 笔记深度学习
validator.pyultralytics\engine\validator.py目录validator.py1.所需的库和模块2.classBaseValidator:1.所需的库和模块#UltralyticsAGPL-3.0License-https://ultralytics.com/license#检查模型在数据集的测试或验证分割上的准确性。#用法-格式：#$yolomode=valm
java 代码走查_代码走查如何保证软件质量 weixin_40006965 java 代码走查
目的代码走查的好处非常多，第一个是让新同学快速熟悉代码并了解系统。第二个是做资损防控的事前检查，在事前规避引发线上故障。第三个是通过一起讨论和审查，加强团队代码阅读和编写能力，让大家编写出优秀的代码。代码走查的优点非常多，但是最核心的还是希望通过代码走查提前发现问题并解决问题。所以基于以上目的，代码走查不是为了找到代码写的差的程序员加以批评，不是为了找到差的代码，而是一起发现问题共同成长，所以对于
[开发杂项][编辑器][代码阅读]ctags&vim xcy6666 杂集编辑器 vim linux
~/.ctagsctags--recurse=yes--exclude=.gitgeneratetagsforvimcaddconfigat~/$cat~/.tags--recurse=yes--exclude=.git--exclude=BUILD--exclude=.svn--exclude=*.js--exclude=vendor/*--exclude=node_modules/*--exc
论文代码阅读及部分复现：Revisiting Deep Learning Models for Tabular Data thorn_r 论文阅读深度学习人工智能
论文地址：https://arxiv.org/pdf/2106.11959.pdf项目地址：GitHub-yandex-research/rtdl-revisiting-models:(NeurIPS2021)RevisitingDeepLearningModelsforTabularData相关数据：https://www.dropbox.com/s/o53umyg6mn3zhxy/2024年2
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-patches.py 红色的山茶花 YOLO 笔记深度学习
patches.pyultralytics\utils\patches.py目录patches.py1.所需的库和模块2.defimread(filename:str,flags:int=cv2.IMREAD_COLOR):3.defimwrite(filename:str,img:np.ndarray,params=None):4.defimshow(winname:str,mat:np.nda
再学Blazor——扩展方法 blazor
上篇提到Blazor组件的高级写法，是采用扩展方法对HTML元素和组件进行扩展，以便于书写组件结构和代码阅读。本篇主要介绍扩展方法实现的思路。什么是扩展方法要扩展哪个类扩展方法的实现1.什么是扩展方法若要对一个C#类型添加新方法，一是修改源码，二是派生类，三是扩展方法。前两者不是万能的，第一种我们不一定有源码，第二种类型不一定能继承，只有第三种是万能的方法，在项目中新建一个扩展类型即可对任何类型进
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-ops.py 红色的山茶花 YOLO 笔记深度学习
ops.pyultralytics\utils\ops.py目录ops.py1.所需的库和模块2.classProfile(contextlib.ContextDecorator):3.defsegment2box(segment,width=640,height=640):4.defscale_boxes(img1_shape,boxes,img0_shape,ratio_pad=None,pa
Jetpack Compose学习(2)——文本(Text)的使用 l软件定制开发工作室 Android教程 android jetpack
本篇涉及到Kotlin和DSL特性的使用若不了解的话可能会造成代码阅读困难,阅读前确保你有上述基础知识!!!目录基础使用单行文本多样式文本长按可选择可点击文本点击文本跳转链接基础使用@Preview(showBackground=true)@ComposablefuntextDemo(){ComposeDemoTheme{Column(){//基础使用Text(text="Helloworld")
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-dist.py 红色的山茶花 YOLO 笔记深度学习
dist.pyultralytics\utils\dist.py目录dist.py1.所需的库和模块2.deffind_free_network_port()->int:3.defgenerate_ddp_file(trainer):4.defgenerate_ddp_command(world_size,trainer):5.defddp_cleanup(trainer,file):1.所需的库
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-instance.py 红色的山茶花 YOLO 笔记深度学习
instance.pyultralytics\utils\instance.py目录instance.py1.所需的库和模块2.def_ntuple(n):3.classBboxes:4.classInstances:1.所需的库和模块#UltralyticsAGPL-3.0License-https://ultralytics.com/licensefromcollectionsimportab
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-errors.py 红色的山茶花 YOLO 笔记深度学习
errors.pyultralytics\utils\errors.py目录errors.py1.所需的库和模块2.classHUBModelError(Exception):1.所需的库和模块#UltralyticsAGPL-3.0License-https://ultralytics.com/licensefromultralytics.utilsimportemojis2.classHUBM
YOLOv8-ultralytics-8.2.103部分代码阅读笔记-trainer.py 红色的山茶花 YOLO 笔记
trainer.pyultralytics\engine\trainer.py目录trainer.py1.所需的库和模块2.classBaseTrainer:1.所需的库和模块#UltralyticsYOLO,AGPL-3.0license"""Trainamodelonadataset.Usage:$yolomode=trainmodel=yolov8n.ptdata=coco8.yamlimg
YOLOv8-ultralytics-8.2.103部分代码阅读笔记-utils.py 红色的山茶花 YOLO 笔记
utils.pyultralytics\data\utils.py目录utils.py1.所需的库和模块2.defimg2label_paths(img_paths):3.defget_hash(paths):4.defexif_size(img:Image.Image):5.defverify_image(args):6.defverify_image_label(args):7.defpoly
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-files.py 红色的山茶花 YOLO 笔记深度学习
files.pyultralytics\utils\files.py目录files.py1.所需的库和模块2.classWorkingDirectory(contextlib.ContextDecorator):3.defspaces_in_path(path):4.defincrement_path(path,exist_ok=False,sep="",mkdir=False):5.deffil
深度学习框架PyTorch原理与实践 AI天才研究院 AI实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.简介2.背景介绍3.基本概念和术语3.1PyTorch简介3.2PyTorch的特点1）自动求导机制2）GPU加速3）模型部署4）数据管道5）代码阅读友好4.核心算法原理4.1神经网络结构4.2神经网络层4.3激活函数5.实际案例——MNIST手写数字识别数据准备模型定义训练测试整体代码1.简介Deeplearning(DL)hasbeenanincreas
YOLOv10-1.1部分代码阅读笔记-tasks.py 红色的山茶花 YOLO 笔记深度学习
tasks.pyultralytics\nn\tasks.py目录tasks.py1.所需的库和模块2.classBaseModel(nn.Module):3.classDetectionModel(BaseModel):4.classOBBModel(DetectionModel):5.classSegmentationModel(DetectionModel):6.classPoseModel
YOLOv10-1.1部分代码阅读笔记-checks.py 红色的山茶花 YOLO 笔记深度学习
checks.pyultralytics\utils\checks.py目录checks.py1.所需的库和模块2.defparse_requirements(file_path=ROOT.parent/"requirements.txt",package=""):3.defparse_version(version="0.0.0")->tuple:4.defis_ascii(s)->bool:5
YOLOv10-1.1部分代码阅读笔记-loss.py 红色的山茶花 YOLO 笔记深度学习
loss.pyultralytics\utils\loss.py目录loss.py1.所需的库和模块2.classVarifocalLoss(nn.Module):3.classFocalLoss(nn.Module):4.classBboxLoss(nn.Module):5.classRotatedBboxLoss(BboxLoss):6.classKeypointLoss(nn.Module)
YOLOv9-0.1部分代码阅读笔记-common.py 红色的山茶花笔记
common.pymodels\common.py目录common.py1.所需的库和模块2.defautopad(k,p=None,d=1):3.classConv(nn.Module):4.classAConv(nn.Module):5.classADown(nn.Module):6.classRepConvN(nn.Module):7.classSP(nn.Module):8.classMP
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》