FSALICEALEX

mmdetection中的mmdet.datasets

1.collate

用来拼接batch中的数据。与标准的pytorch中的default_collate不同，这里的collate返回的是一个列表，每个列表中的元素是一个minibatch，应该是为了用于多个gpu，每个gpu上运行一个minibatch。
collate支持对于DataContainer数据类型的操作，
对于meta data，直接拼成minibatch，返回
对于图像，先pad成同样大小，再拼成minibatch，返回
对于bbox，直接拼接，返回。
一般来说，distributed为FALSE，进而使用**_non_dist_train**，进而build_dataloader的dist参数为FALSE，
所以build_dataloader中sampler和batch_size等是这么定义的：

    else:
        sampler = GroupSampler(dataset, imgs_per_gpu) if shuffle else None
        batch_size = num_gpus * imgs_per_gpu
        num_workers = num_gpus * workers_per_gpu

def collate(batch, samples_per_gpu=1):
    """Puts each data field into a tensor/DataContainer with outer dimension
    batch size.

    Extend default_collate to add support for
    :type:`~mmcv.parallel.DataContainer`. There are 3 cases.

    1. cpu_only = True, e.g., meta data
    2. cpu_only = False, stack = True, e.g., images tensors
    3. cpu_only = False, stack = False, e.g., gt bboxes
    """

    if not isinstance(batch, collections.Sequence):
        raise TypeError("{} is not supported.".format(batch.dtype))

    if isinstance(batch[0], DataContainer):
        assert len(batch) % samples_per_gpu == 0
        stacked = []
        if batch[0].cpu_only:
        # 如果是cpu_only，说明是meta data，数据类型不固定，例如字符串。
        # 那么将data一个一个的append进stacked中，每个mini_batch的大小为samples_per_gpu
        # stacked = [[d1, d2, d3], [d4, d5, d6], [...], ...]，由于batch % samples_per_gpu == 0，每个mini_batch中个数相同。
        # stacked被装进一个DataContainer返回。
            for i in range(0, len(batch), samples_per_gpu):
                stacked.append(
                    [sample.data for sample in batch[i:i + samples_per_gpu]])
            return DataContainer(
                stacked, batch[0].stack, batch[0].padding_value, cpu_only=True)
        # 如果是stack，且不是cpu，说明是图像，是Tensor。
        # 那么首先对图像进行pad，使得图像的形状一样，之后使用标准的default_collate，将每一个mini_batch中的图像进行拼接
        elif batch[0].stack:
            for i in range(0, len(batch), samples_per_gpu):
                assert isinstance(batch[i].data, torch.Tensor)
                # pad用来给图像进行pad，添加边框，边框的值为batch[0]padding_value。
                # pad的目的是让所有图像的大小一致
                if batch[i].pad_dims is not None:
                    # ndim为图像的维度(指标的个数)
                    ndim = batch[i].dim()
                    assert ndim > batch[i].pad_dims
                    max_shape = [0 for _ in range(batch[i].pad_dims)]
                    for dim in range(1, batch[i].pad_dims + 1):
                        max_shape[dim - 1] = batch[i].size(-dim)
                    # pad_dims取值在[None, 1, 2, 3]内
                    # max_shape最终得到的是batch[i]的size的倒序，如原本为3 * 255 * 255，则max_shape = [255, 255, 3]
                    for sample in batch[i:i + samples_per_gpu]:
                        for dim in range(0, ndim - batch[i].pad_dims):
                            assert batch[i].size(dim) == sample.size(dim)
                        for dim in range(1, batch[i].pad_dims + 1):
                            max_shape[dim - 1] = max(max_shape[dim - 1],
                                                     sample.size(-dim))
                    # max_shape与其他sample比较，取shape的max。
                    padded_samples = []
                    for sample in batch[i:i + samples_per_gpu]:
                        pad = [0 for _ in range(batch[i].pad_dims * 2)]
                        # pad的大小为pad_dims的2倍，2指的是在该维度的前后进行pad。
                        for dim in range(1, batch[i].pad_dims + 1):
                            pad[2 * dim -
                                1] = max_shape[dim - 1] - sample.size(-dim)
                        # 目的是进行pad之后所有图像的大小一致。
                        padded_samples.append(
                            F.pad(
                                sample.data, pad, value=sample.padding_value))
                    stacked.append(default_collate(padded_samples))
                elif batch[i].pad_dims is None:
                    stacked.append(
                        default_collate([
                            sample.data
                            for sample in batch[i:i + samples_per_gpu]
                        ]))
               
                else:
                    raise ValueError(
                        'pad_dims should be either None or integers (1-3)')
        # 这种情况对应bbox，这个时候直接取出来（是一个列表），分割成成samples_per_gpu大小的mini batch，直接返回
        else:
            for i in range(0, len(batch), samples_per_gpu):
                stacked.append(
                    [sample.data for sample in batch[i:i + samples_per_gpu]])
        return DataContainer(stacked, batch[0].stack, batch[0].padding_value)
    # 有可能出现递归操作，这些与default_collate一致
    elif isinstance(batch[0], collections.Sequence):
        transposed = zip(*batch)
        return [collate(samples, samples_per_gpu) for samples in transposed]
    elif isinstance(batch[0], collections.Mapping):
        return {
            key: collate([d[key] for d in batch], samples_per_gpu)
            for key in batch[0]
        }
    # 对于其他操作使用default_collate
    else:
        return default_collate(batch)

pytorch自带的default_collate解释如下：

def default_collate(batch):
    r"""Puts each data field into a tensor with outer dimension batch size"""
    elem = batch[0]
    elem_type = type(elem)
    # 如果元素是Tensor，首先查看类型是否为Tensor，如果是Tensor，则查看get_worker_info()是否为空。
    # torch.utils.data.get_worker_info()的作用是返回工作进程中的各种有用信息（包括工作者ID，数据集副本，初始种子等）
    # 如果get_worker_info不为空，说明在另外的进程中，这个时候，首先numel获得所需内存大小，用_new_shared创建一块新的内存，用new创建一个在该内存上的Tensor
    # 最终，使用stack直接拼接起来。
    # Creates a new storage in shared memory with the same data type
    if isinstance(elem, torch.Tensor):
        out = None
        if torch.utils.data.get_worker_info() is not None:
            # If we're in a background process, concatenate directly into a
            # shared memory tensor to avoid an extra copy
            numel = sum([x.numel() for x in batch])
            storage = elem.storage()._new_shared(numel)
            out = elem.new(storage)
        return torch.stack(batch, 0, out=out)
	# 如果元素是numpy中的类型，并且是ndarray，则变成Tensor之后，再递归调用自身进行gather
    elif elem_type.__module__ == 'numpy' and elem_type.__name__ != 'str_' \
            and elem_type.__name__ != 'string_':
        elem = batch[0]
        if elem_type.__name__ == 'ndarray':
            # array of string classes and object
            if np_str_obj_array_pattern.search(elem.dtype.str) is not None:
                raise TypeError(default_collate_err_msg_format.format(elem.dtype))

            return default_collate([torch.as_tensor(b) for b in batch])
        elif elem.shape == ():  # scalars
            return torch.as_tensor(batch)
    # 如果元素是标量，直接初始化为Tensor
    elif isinstance(elem, float):
        return torch.tensor(batch, dtype=torch.float64)
    elif isinstance(elem, int_classes):
        return torch.tensor(batch)
    # 如果元素是字符串，直接返回
    elif isinstance(elem, string_classes):
        return batch
    # 如果元素是字典，对字典中的每个value递归进行gather
    # 如[{'a': [1, 2]}, {'a': [3, 4]}]，collate之后变成{'a': [1, 2, 3, 4]}
    elif isinstance(elem, container_abcs.Mapping):
        return {key: default_collate([d[key] for d in batch]) for key in elem}
   # 如果元素是元组的话，
    elif isinstance(elem, tuple) and hasattr(elem, '_fields'):  # namedtuple
        return elem_type(*(default_collate(samples) for samples in zip(*batch)))
   # 如果元素是序列的话，先用zip将batch中对应位置的元素集合到一起形成新元素，之后对新元素进行递归的gather操作
    elif isinstance(elem, container_abcs.Sequence):
        transposed = zip(*batch)
        return [default_collate(samples) for samples in transposed]

    raise TypeError(default_collate_err_msg_format.format(elem_type))

举一个例子：
batch = [{‘name’: ‘a’, ‘bbox’: [[[1, 2], [3, 4]]]},
{‘name’: ‘b’, ‘bbox’: [[[5, 6], [7, 8]]]}
则首先batch的元素是dict，因此先集合成{‘name’: [‘a’, ‘b’], ‘bbox’: [[[[1, 2], [3, 4]]], [[[5, 6], [7, 8]]]]}
再对每个value进行collate，字符串序列保持不变，bbox则stack到一起。
更一般的例子：
如果每个elem是一个树形结构，则default_collate会递归的调用，将每棵树对应的部分（string，Tensor等）使用collate拼接起来。

2. sampler

就如collate一开始所说，一般dist=False, 因此采用GroupSampler。
其有一些属性。
dataset：数据集
samples_per_gpu：每张gpu的样本个数
flag：长宽比是否大于1的0, 1序列，将data分为了两组。在customdataset中定义
group_sizes：上面划分的两组的组内个数
num_samples：对groups_sizes中的每个数先除以samples_per_gpu，取整再乘上去，再共同相加。得到的是总体数目（可被sample_per_gpu整除）。
GroupSampler的作用是给出一个index，这个index是总体dataset成员的index，能够随机取出dataset中的元素。在dataloader的初始化过程中，sampler就被转化为了iter，固定了下来。

class GroupSampler(Sampler):
    def __init__(self, dataset, samples_per_gpu=1):
        assert hasattr(dataset, 'flag')
        self.dataset = dataset
        self.samples_per_gpu = samples_per_gpu
        self.flag = dataset.flag.astype(np.int64)
        self.group_sizes = np.bincount(self.flag)
        self.num_samples = 0
        for i, size in enumerate(self.group_sizes):
            self.num_samples += int(np.ceil(
                size / self.samples_per_gpu)) * self.samples_per_gpu

    def __iter__(self):
        indices = []
        for i, size in enumerate(self.group_sizes):
            if size == 0:
                continue
            # 获得下标indice
            indice = np.where(self.flag == i)[0]
            assert len(indice) == size
            # 随机打乱
            np.random.shuffle(indice)
            num_extra = int(np.ceil(size / self.samples_per_gpu)
                            ) * self.samples_per_gpu - len(indice)
            # 拼接上一些元素（从indice尾部往后数），使得indice的个数被samples_per_gpu整除
            indice = np.concatenate([indice, indice[:num_extra]])
            indices.append(indice)
        # indices里头两个group的数量都能被samples_per_gpu整除
        indices = np.concatenate(indices)
        # 重新打乱indices（将另个group混合在一起），相邻两个为一组打乱（之所以两个为一组猜测是为了减少计算时间）
        indices = [
            indices[i * self.samples_per_gpu:(i + 1) * self.samples_per_gpu]
            for i in np.random.permutation(
                range(len(indices) // self.samples_per_gpu))
        ]
        indices = np.concatenate(indices)
        indices = indices.astype(np.int64).tolist()
        assert len(indices) == self.num_samples
        return iter(indices)

    def __len__(self):
        return self.num_samples

3. DataSets

基础类CustomDataset，继承自pytorch的DataSets类。
data的数据结构为：

Annotation format:
[
    {
        'filename': 'a.jpg',
        'width': 1280,
        'height': 720,
        'ann': {
            'bboxes':  (n, 4),
            'labels':  (n, ),
            'bboxes_ignore':  (k, 4),
            'labels_ignore':  (k, 4) (optional field)
        }
    },
    ...
]

__init__部分出现的属性：

img_infos：图片的信息，通过cocoapi读入
proposals：None
ImageTransform：用来对图像、mask进行尺度变化、翻转、正规化。
BboxTransform：根据图像尺寸rescale bbox，翻转。
img_ids：出现在CocoDataset类中，为self.coco.getImgIds()

4. 数据流

4.1. ruuer.train从data_loader中读出data_batch

data_batch是一个dict，

其中
img_meta的data为包含两个元素的list，元素是包含另个元素的list，每个元素是一个dict，包含了如下信息：
img的data为包含两个元素的list，元素是231216*800的Tensor
gt_bboxes的data为包含两个元素的list，每个元素是一个list，其中有两个Tensor，大小为n * 4
gt_labels的data为包含两个元素的list，每个元素是一个list，其中有两个Tensor，大小为n

4.2.data_batch经由batch_processor进入model

def batch_processor(model, data, train_mode):
    losses = model(**data)
    loss, log_vars = parse_losses(losses)

    outputs = dict(
        loss=loss, log_vars=log_vars, num_samples=len(data['img'].data))

    return outputs

pytorch并行的参考资料：
https://blog.csdn.net/zzlyw/article/details/78769012
https://blog.csdn.net/weixin_40087578/article/details/87186613，以下过程参考这张图：

4.3. data进入DataParallel（Pytorch的）

由于model外层套着DataParallel类，因此先使用DataParallel类的forward。

4.3. data进入MMDataParallel（继承自DataParallel（Pytorch的））

由于model外层套着MMDataParallel类，因此先使用MMDataParallel类的forward。以下为MMDataParallel的forward，与DataParallel的forward相同。

    def forward(self, *inputs, **kwargs):
        if not self.device_ids:
            return self.module(*inputs, **kwargs)

        for t in chain(self.module.parameters(), self.module.buffers()):
            if t.device != self.src_device_obj:
                raise RuntimeError("module must have its parameters and buffers "
                                   "on device {} (device_ids[0]) but found one of "
                                   "them on device: {}".format(self.src_device_obj, t.device))

        inputs, kwargs = self.scatter(inputs, kwargs, self.device_ids)
        if len(self.device_ids) == 1:
            return self.module(*inputs[0], **kwargs[0])
        replicas = self.replicate(self.module, self.device_ids[:len(inputs)])
        outputs = self.parallel_apply(replicas, inputs, kwargs)
        return self.gather(outputs, self.output_device)

data转换为inputs，kwargs，交由scatter来分散到不同的GPU上。

4.4. inputs, kwargs传入scatter（mmcv重写了该函数）

scatter(MMDataParallel的成员函数)->scatter_kwargs（依然是mmcv重写）->scatter函数（mmcv中，在scatter_gather.py中）-> Scatter静态类的forward函数（mmcv中）->scatter函数（mmcv中，在_functions,py中）
第一个scatter函数，其中定义了一个函数scatter_map，对于dict，它通过map将scatter_map递归的作用于其中的元素，并进行了一些操作，最终得到了一个列表，列表中有len(target_gpus)个数个元素，每个元素对应于一个GPU。
总的来说，作用是获得不同设备上的data。

def scatter(inputs, target_gpus, dim=0):
    """Scatter inputs to target gpus.

    The only difference from original :func:`scatter` is to add support for
    :type:`~mmcv.parallel.DataContainer`.
    """

    def scatter_map(obj):
        if isinstance(obj, torch.Tensor):
            return OrigScatter.apply(target_gpus, None, dim, obj)
        if isinstance(obj, DataContainer):
            if obj.cpu_only:
                return obj.data
            else:
                return Scatter.forward(target_gpus, obj.data)
        if isinstance(obj, tuple) and len(obj) > 0:
            return list(zip(*map(scatter_map, obj)))
        if isinstance(obj, list) and len(obj) > 0:
            out = list(map(list, zip(*map(scatter_map, obj))))
            return out
        if isinstance(obj, dict) and len(obj) > 0:
            out = list(map(type(obj), zip(*map(scatter_map, obj.items()))))
            return out
        return [obj for targets in target_gpus]

    # After scatter_map is called, a scatter_map cell will exist. This cell
    # has a reference to the actual function scatter_map, which has references
    # to a closure that has a reference to the scatter_map cell (because the
    # fn is recursive). To avoid this reference cycle, we set the function to
    # None, clearing the cell
    try:
        return scatter_map(inputs)
    finally:
        scatter_map = None

4.5. 上面流程中最后的scatter函数（分配gpu，返回整体）

上面流程中最后的scatter函数如下：

def scatter(input, devices, streams=None):
    """Scatters tensor across multiple GPUs.
    """
    if streams is None:
        streams = [None] * len(devices)

    if isinstance(input, list):
        chunk_size = (len(input) - 1) // len(devices) + 1
        outputs = [
            scatter(input[i], [devices[i // chunk_size]],
                    [streams[i // chunk_size]]) for i in range(len(input))
        ]
        return outputs
    elif isinstance(input, torch.Tensor):
        output = input.contiguous()
        # TODO: copy to a pinned buffer first (if copying from CPU)
        stream = streams[0] if output.numel() > 0 else None
        with torch.cuda.device(devices[0]), torch.cuda.stream(stream):
            output = output.cuda(devices[0], non_blocking=True)
        return output
    else:
        raise Exception('Unknown type {}.'.format(type(input)))

其作用是通过递归的方式来将数据分散到各个设备上。
例子：
input = [tensor([[1, 2], [3, 4]]), tensor([[5, 6], [7, 8]])]
devices = [0, 1]
scatter检测到是列表，递归调用：
第一次input[0] = tensor([[1, 2], [3, 4]]), devices=[0]，检测到是Tensor，通过 output = output.cuda(devices[0], non_blocking=True)来分配到cuda:0上，并返回对象
第二次同理，分配到cuda:1上，返回对象
scatter返回列表，元素与之前相同，但是设备已经不一样了，一个在0上，一个在1上。

4.6前. self.module传入replicate（pytorch中）中，获得各个gpu上的模型

对应于DataParallel类的forward中的

        replicas = self.replicate(self.module, self.device_ids[:len(inputs)])

得到的replicas 是一个列表，包含多个gpu上的模型

4.6. inputs, kwargs（列表）传入parallel_apply函数

大致思路就是上面那张图，将kwargs_tup的各个元素分配到modules的各个元素上，运行。最后还存在一个汇总的步骤，就不写了。

def parallel_apply(modules, inputs, kwargs_tup=None, devices=None):
    r"""Applies each `module` in :attr:`modules` in parallel on arguments
    contained in :attr:`inputs` (positional) and :attr:`kwargs_tup` (keyword)
    on each of :attr:`devices`.

    Args:
        modules (Module): modules to be parallelized
        inputs (tensor): inputs to the modules
        devices (list of int or torch.device): CUDA devices

    :attr:`modules`, :attr:`inputs`, :attr:`kwargs_tup` (if given), and
    :attr:`devices` (if given) should all have same length. Moreover, each
    element of :attr:`inputs` can either be a single object as the only argument
    to a module, or a collection of positional arguments.
    """
    assert len(modules) == len(inputs)
    if kwargs_tup is not None:
        assert len(modules) == len(kwargs_tup)
    else:
        kwargs_tup = ({},) * len(modules)
    if devices is not None:
        assert len(modules) == len(devices)
    else:
        devices = [None] * len(modules)
    devices = list(map(lambda x: _get_device_index(x, True), devices))
    lock = threading.Lock()
    results = {}
    grad_enabled = torch.is_grad_enabled()

    def _worker(i, module, input, kwargs, device=None):
        torch.set_grad_enabled(grad_enabled)
        if device is None:
            device = get_a_var(input).get_device()
        try:
            with torch.cuda.device(device):
                # this also avoids accidental slicing of `input` if it is a Tensor
                if not isinstance(input, (list, tuple)):
                    input = (input,)
                output = module(*input, **kwargs)
            with lock:
                results[i] = output
        except Exception:
            with lock:
                results[i] = ExceptionWrapper(
                    where="in replica {} on device {}".format(i, device))

    if len(modules) > 1:
        threads = [threading.Thread(target=_worker,
                                    args=(i, module, input, kwargs, device))
                   for i, (module, input, kwargs, device) in
                   enumerate(zip(modules, inputs, kwargs_tup, devices))]

        for thread in threads:
            thread.start()
        for thread in threads:
            thread.join()
    else:
        _worker(0, modules[0], inputs[0], kwargs_tup[0], devices[0])

    outputs = []
    for i in range(len(inputs)):
        output = results[i]
        if isinstance(output, ExceptionWrapper):
            output.reraise()
        outputs.append(output)
    return outputs

量化交易系统中如何处理机器学习模型的训练和部署？ openwin_top 量化交易系统开发机器学习人工智能量化交易
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位量化交易系统中，机器学习模型的训练和部署需要遵循一套严密的流程，以确保模型的可靠性、性能和安全性。以下是详细描述以及相关的示例：1.数据收集和预处理数据收集在量化交易中，数据是最重要的资产。收集的数
Uni-App 双栏联动滚动组件开发详解 (电梯导航) FFF-X uni-app
本文基于提供的代码实现一个左右联动的滚动组件，以下是详细的代码解析与实现原理说明：{{item}}{{section.title}}{{para}}exportdefault{//组件参数定义props:{leftData:{//左侧导航数据type:Array,default:()=>['章节1','章节2','章节3','章节4','章节5','章节6'],},rightData:{//右侧内
使用Python下载抖音短视频：完整教程与代码解析 cnh6070 短视频 python 音视频开发语言
抖音作为全球领先的短视频平台，拥有海量的优质内容。然而，抖音官方并未提供直接下载视频的功能，这给一些用户带来了不便。幸运的是，通过Python编程，我们可以实现抖音视频的下载。本文将详细介绍如何使用Python下载抖音短视频，并解析一个完整的代码示例。一、准备工作在开始之前，你需要确保已经安装了Python环境，并且安装了以下必要的Python库：requests：用于发送网络请求，获取网页内容或
IsaacLab最新2025教程(3)-搭建训练场景 Calm_dw 机器人人工智能 AI编程 python visual studio code 深度学习
前言本文将详细介绍如何使用IsaacLab进行场景搭建与物理仿真，为后续的训练打下基础。文章以IsaacLab官方tutorial为基础，从环境搭建开始，逐步实现一个包含多种物体的仿真场景，并分享开发过程中的经验。官方连接：Tutorials—IsaacLabDocumentation开发环境IsaacLab/IsaacSim4.5.0(Ubuntu22.04)代码解析这篇文章包含了前三个tuto
每日一题——二叉树的深度 tt555555555555 面经 C语言算法题算法数据结构
二叉树的最大深度问题描述示例方法一：递归法代码实现代码解析方法二：层次遍历（广度优先搜索）代码实现代码解析总结问题描述给定一个二叉树的根节点root，返回其最大深度。二叉树的最大深度是指从根节点到最远叶子节点的最长路径上的节点数。示例示例1输入：root=[3,9,20,null,null,15,7]输出：3解释：从根节点到最远叶子节点的最长路径为3->20->15或3->20->7，路径长度为3
Java开发者必看！零成本集成DeepSeek-R1打造AI办公神器，源码级实战教程让你效率翻倍！ Leaton Lee java 人工智能开发语言
目录开篇互动一、为什么是DeepSeek-R1？它凭什么碾压传统AI工具？二、手把手部署DeepSeek-R1本地环境（附避坑指南）步骤1：Docker一键部署步骤2：下载模型步骤3：验证部署三、Java整合DeepSeek-R1：从理论到实战1.添加HTTP客户端依赖（以SpringBoot为例）2.封装AI工具类（核心代码解析）3.实战场景1：自动生成周报（附Prompt技巧）四、高阶玩法：A
一段注释。 dont__cry c语言
以下是添加了详细注释后的代码解析，方便你更好地理解这段ARM宏汇编代码的功能和逻辑：;********************(C)COPYRIGHT2011STMicroelectronics********************;*FileName:startup_stm32f10x_hd.s;*Author:MCDApplicationTeam;*Version:V3.5.0;*Date:
用 C++ 打造综合管理系统：功能实现与代码解析他是只猫 C++教程 c++算法学习开发语言
文章目录系统功能概述设计与实现可逆素数模块计算数字总和模块各位数字之和排序模块字符串中的最大整数模块字符串解压模块输出指定图形模块计算学生信息操作之最高分模块字符串反转模块菜单界面与主函数总结完整代码在C++编程学习过程中，将所学知识应用到实际项目里是提升编程能力的有效途径。今天，我们就来构建一个综合管理系统，这个系统集成了多个实用功能模块，能帮助我们解决不同类别的问题。通过这个项目，我们不仅能巩
Hadoop MapReduce 词频统计（WordCount）代码解析教程我不是少爷. Java基础 hadoop mapreduce 大数据
一、概述这是一个基于HadoopMapReduce框架实现的经典词频统计程序。程序会统计输入文本中每个单词出现的次数，并将结果输出到HDFS文件系统。二、代码结构packagecom.bigdata.wc;//Hadoop核心类库导入importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.Path;//数据类型定义
STM32 MY1690语音芯片实现智能时间播报系统 | 零基础入门STM32第七十一步触角01010001 STM32入门教程（100步）stm32 嵌入式硬件单片机驱动开发物联网
主题内容教学目的/扩展视频MP3播放芯片电路原理，跳线设置，手册分析，驱动程序与调用。了解指令表。师从洋桃电子，杜洋老师文章目录一、系统架构与核心组件1.1硬件拓扑图1.2核心组件说明二、语音播报原理分析2.1语音文件命名规范2.2播报指令协议三、两种播报方式对比3.1无语法播报（机械式）3.2有语法播报（智能优化）四、核心代码解析4.1时间读取与显示4.2智能播报算法五、系统扩展方案5.1多语言
(每日一题) 力扣 2418. 按身高排序誓约酱每日一题 leetcode java 算法 c++运维 linux c语言
文章目录LeetCode2418.按身高排序｜双解法对比与下标排序的精妙设计问题描述解法思路分析方法一：Pair打包法（直接排序）方法二：下标排序法（当前实现）关键代码解析索引初始化优化自定义排序规则结果重构复杂度对比表性能实测数据扩展应用多条件排序实现总结LeetCode2418.按身高排序｜双解法对比与下标排序的精妙设计问题描述给定两个等长数组names（姓名数组）和heights（身高数组）
LeetCode 3280 将日期转换为二进制表示雾月55 leetcode 算法职场和发展数据结构 java
【算法实战】日期转二进制：两种解法的思路与优化（附代码解析）一、问题描述给定一个yyyy-mm-dd格式的日期字符串，要求将年、月、日分别转为无前导零的二进制，并保持year-month-day格式。示例：输入2025-03-15，输出11111101001-11-1111（2025→11111101001，3→11，15→1111）。二、解法一：直接分割转换（新手友好）思路分析分割日期：按-拆分
探秘C# .NET Core Health Checks：从零打造全方位应用健康监测系统——实战代码解析与深度注释墨瑾轩一起学学C#【一】c#.netcore 开发语言
在C#中，.NETCoreHealthChecks提供了一种标准化的方式来监控应用程序及其依赖项的运行状态。这种健康检查机制允许开发人员轻松地集成各种自定义检查，确保系统的健康状况，并通过HTTP接口对外暴露检查结果，便于监控工具或服务发现组件进行自动化监控。以下我们将详细阐述如何在.NETCore中实现健康检查，并附带代码示例及详尽注释。1.安装HealthChecksNuGet包首先，需要在项
【华为OD机考真题】- 小明能到达的最大坐标值(C&D卷)（Java） bug菌¹ 华为od c语言 java 华为OD机考真题华为OD 小明能到达的最大坐标值
本文收录于「2025华为OD机试真题(Java版)」专栏，手把手带你零基础教学华为OD机试。本题集提供最优题解思路，解题步骤，代码解析，复杂度分析及最优题解源码等，支持多语言题解，助你轻松拿捏OD机考，一举上岸！安利大家关注&&收藏&&订阅！题库正在疯狂收录中，up！up！up！！提醒：拒绝一切代考/替考，违法必究！本人所写题库均搜集于互联网。订阅福利：一次订阅，可永久免费阅读，提供在线答疑解
使用 Dify 创建自然语言生成 Word 文档的应用（详细指南） engchina LINUX python 人工智能 Agent Dify
使用Dify创建自然语言生成Word文档的应用（详细指南）一、开发核心API1.1API功能规划1.2环境准备安装依赖库项目目录结构1.3核心代码解析（`app.py`）1.3.1初始化配置1.3.2关键功能模块1.4API接口说明1.4.1转换接口`/convert`1.4.2下载接口`/download/`1.5启动服务1.6测试二、创建Dify工具2.1工作流设计步骤步骤1：创建新工作流步骤
java list遍历添加元素_Java List集合方法及遍历过程代码解析清净平常心 java list遍历添加元素
集合元素框架publicclassListDemo02{publicstaticvoidmain(String[]args){//创建集合对象Listlist=newArrayList();//添加元素list.add("hello");list.add("world");list.add("java");//输出集合对象System.out.println(list);//[hello,worl
[YOLO专题-22]：YOLO V5 - ultralytics代码解析-超参数详解文火冰糖的硅基工坊人工智能-YOLO专题目标检测计算机视觉深度学习 YOLO 超参数
作者主页(文火冰糖的硅基工坊)：文火冰糖（王文兵）的博客_文火冰糖的硅基工坊_CSDN博客本文网址：https://blog.csdn.net/HiWangWenBing/article/details/122372614目录前言：第1章超参数配置文件的基本信息1.1超参数配置文件的路径路径1.2超参数配置文件1.3如何指定超参数配置文件第2章超参数内容详解前言：YOLOV5除了通过用户命令行参数
从零到一：Transformer模型的原理与实战之旅樽酒ﻬق AI transformer 深度学习人工智能
目录从零到一：Transformer模型的原理与实战之旅1.Transformer原理简介1.1什么是Transformer？1.2自注意力机制的核心1.3Transformer的结构2.实战：构建Transformer模型2.1任务目标2.2环境准备2.3数据准备2.4模型构建2.5模型训练3.推理实战：完整示例与输出结果3.1完整推理代码3.2代码解析4.原理与代码的结合4.1自注意力机制的实
设计无锁的并发数据结构_第七章_《C++并发编程实战》笔记郭涤生 #并发线程 c/c++数据结构 c++
设计无锁的并发数据结构1.核心概念与难点1.1无锁（Lock-Free）条件1.2原子操作的重要性1.3内存顺序（MemoryOrder）1.4ABA问题2.代码解析：无锁栈的实现（简化）3.多选题目4.设计题目5.多选题答案6.设计题参考答案1.核心概念与难点1.1无锁（Lock-Free）条件定义：一种并发算法的实现方式，保证无限执行进程中至少有一个线程能推进操作（系统整体进步）。关键特性：无
Java高级特性深度解析：构造方法、继承关系与动态代理小志开发 java
一、构造方法的深度探索1.1反射调用私有构造方法//获取私有构造方法示例ClassuserClass=User.class;ConstructorprivateCons=userClass.getDeclaredConstructor();privateCons.setAccessible(true);//突破访问限制Useruser=privateCons.newInstance();代码解析：
【C++ 系列文章基础 01 -- std::string 与 fmt::format】主公讲 ARM #C++系列文章 c++开发语言 C++
文章目录Overview1.C++中的std::string简介2.fmt::format格式化函数简介3.示例代码解析4.应用场景与优势2.std::string与fmt::format简介std::stringfmt::format3.代码解析3.1格式化字符串生成3.2调用函数cmd_handler3.3返回id_code4.代码整体流程与应用场景5.总结Overview下面将详细介绍C++
造价算量审图多元化融合软件开发实战：技术架构与核心代码解析夏末之花架构
——从BIM模型解析到AI智能审图的完整实现路径1.技术架构设计该软件需融合以下模块：BIM/CAD模型解析引擎（支持Revit/DWG文件一键导入）智能算量核心算法（基于规则引擎与机器学习）协同审图平台（多人实时标注与版本控制）AI辅助决策系统（材料价格预测、工程量误差检测）技术栈推荐：前端：Three.js（3D模型渲染）+React（协同界面）后端：Python（算量算法）+Java（业务逻
STM32常见外设的驱动示例和代码解析 HH予嵌入式驱动工程项目开发 stm32
以下是针对STM32常见外设的驱动示例和代码解析，基于HAL库实现，适用于大多数STM32系列（如F1/F4/H7等），可根据具体型号调整引脚和时钟配置。1.GPIO驱动应用场景：控制LED、按键检测、继电器开关等。示例代码：//初始化LED（推挽输出）voidLED_Init(void){GPIO_InitTypeDefGPIO_Struct={
【CPP】协程阿猿收手吧！遣返回家的C家家服务器数据库 c++开发语言
文章目录**C++20协程的基础概念：**1.**什么是协程？**2.**协程的三个核心概念：**3.**协程与线程的对比：**协程句柄**`coroutine_handle`的作用：**⚙️**`coroutine_handle`的定义与用法：****基本定义：****协程句柄的基本使用：****输出：**⚙️**协程句柄的核心操作：****总结：**⚙️**C++协程的语法：****代码解析：
http 服务器概念详细介绍还是鼠鼠 node.js node.js web javascript 前端 vscode http
目录Node.jsHTTP服务器概念详细介绍1.http模块概述2.创建HTTP服务器3.示例代码服务器端代码（JavaScript）4.代码解析5.运行服务器6.运行结果7.进一步扩展8.总结在Node.js中，http模块是一个非常重要的核心模块，它允许我们创建HTTP服务器，并能处理客户端发起的HTTP请求。通过这个模块，我们可以构建一个能够接收、处理并返回响应的Web服务器。下面将详细介绍
spyder python下载_Spyder Python软件-Spyder Python下载-最火手机站黄sir好 spyder python下载
SpyderPython软件是一款使用用Python编写的强大的编程环境。应用于Python，由科学家、技术人员、数据分析家设计，由科学家、技术人员、数据分析家设计。综合开发工具的高级编辑、分析、调试、概要分析功能和科学包装的数据搜索、交互执行、深度检查和精巧的可视化功能被独特地结合在一起。SpyderPython下载就在最火软件站!SpyderPython软件功能编辑功能/类浏览器、代码解析工具
【UI自动化框架设计思路】runner：如何运行框架小怪兽长大啦 UI自动化测试技术分享 ui 自动化运维
一、简介**功能：**自动化测试的运行器，负责整合UI识别与UI操作、读取配置文件并执行测试用例步骤。参数：config_pth：配置文件的路径（字符串类型）。说明：Runner类是整个自动化测试流程的核心入口点，通过加载配置文件并结合UI操作类，执行测试用例的步骤。它将配置管理、UI操作和测试执行整合为一个完整的自动化测试流程。二、代码解析1.init方法**功能：**初始化Runner类，加载
大模型GPT辅助学习解释代码-HttpSession 监听器 ahauedu 前沿技术与趋势 gpt
本文主题大模型解释代码。最近在接触旧项目代码是往往没有注释，或者是注释和代码对应不上，这样对于了解业务逻辑，以及后期的改造开发造成了很大的困扰。尽然大模型这么强大，我们尝试下用大模型来解释代码。以下是大模型对项目代码中的HttpSession监听器的代码解释，很高效的方式，可以借鉴。代码解析这段代码定义了WebHttpSessionListener类，它是一个HttpSession监听器，用于监听
用MATLAB打造浪漫3D粒子心脏：代码解析与动态可视爱玩三国杀的界徐盛 matlab 3d 开发语言
一、效果预览本文我们将用MATLAB实现一个令人惊艳的3D动态可视化效果：旋转的粒子心脏悬浮在星空背景中，粉紫色的心形粒子群与不同层次的旋转星辰交相辉映。这个效果结合了三维曲面生成、粒子系统、坐标变换等多项技术，最终呈现出一个充满科技感的动态艺术作品。二、代码解析2.1颜色配置模块col=@(n)repmat([255,158,196]./255,[n,1])+repmat([-39,-81,-5
打造你的专属时钟应用：用Python和Tkinter实现实时时间显示 LIY若依 python tensorflow 开发语言
这个项目展示了如何使用Python的tkinter库创建一个简单的数字时钟。通过逐步解析代码片段，我们了解了每个部分的功能和实现方式。说明这个代码展示了如何使用tkinter库创建一个简单的数字时钟，并每秒更新一次显示的时间。依赖库tkinter：Python的标准GUI库，无需额外安装。time：Python的标准库，无需额外安装。代码解析1.导入库和创建主窗口importtkinterastk
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =