红色的山茶花

YOLOv10-1.1部分代码阅读笔记-base.py

base.py

ultralytics\data\base.py

base.py

1.所需的库和模块

2.class BaseDataset(Dataset):

1.所需的库和模块

# Ultralytics YOLO , AGPL-3.0 license

import glob
import math
import os
import random
from copy import deepcopy
from multiprocessing.pool import ThreadPool
from pathlib import Path
from typing import Optional

import cv2
import numpy as np
import psutil
from torch.utils.data import Dataset

from ultralytics.utils import DEFAULT_CFG, LOCAL_RANK, LOGGER, NUM_THREADS, TQDM
from .utils import HELP_URL, IMG_FORMATS

2.class BaseDataset(Dataset):

# 这段代码定义了一个名为 BaseDataset 的类，它是用于图像处理和数据增强的基础数据集类。这个类继承自 PyTorch 的 Dataset 类，并提供了一系列方法来加载、处理和转换图像数据。
# 定义了一个名为 BaseDataset 的类，继承自 PyTorch 的 Dataset 类。
class BaseDataset(Dataset):
    # 用于加载和处理图像数据的基本数据集类。
    """
    Base dataset class for loading and processing image data.

    Args:
        img_path (str): Path to the folder containing images.
        imgsz (int, optional): Image size. Defaults to 640.
        cache (bool, optional): Cache images to RAM or disk during training. Defaults to False.
        augment (bool, optional): If True, data augmentation is applied. Defaults to True.
        hyp (dict, optional): Hyperparameters to apply data augmentation. Defaults to None.
        prefix (str, optional): Prefix to print in log messages. Defaults to ''.
        rect (bool, optional): If True, rectangular training is used. Defaults to False.
        batch_size (int, optional): Size of batches. Defaults to None.
        stride (int, optional): Stride. Defaults to 32.
        pad (float, optional): Padding. Defaults to 0.0.
        single_cls (bool, optional): If True, single class training is used. Defaults to False.
        classes (list): List of included classes. Default is None.
        fraction (float): Fraction of dataset to utilize. Default is 1.0 (use all data).

    Attributes:
        im_files (list): List of image file paths.
        labels (list): List of label data dictionaries.
        ni (int): Number of images in the dataset.
        ims (list): List of loaded images.
        npy_files (list): List of numpy file paths.
        transforms (callable): Image transformation function.
    """

    # 这段代码定义了 BaseDataset 类的构造函数 __init__ ，用于初始化一个用于图像处理和数据增强的基础数据集类。
    # 定义了类的构造函数，接受多个参数，用于配置数据集的行为。
    # 1.img_path ：图像文件路径。
    # 2.imgsz ：目标图像尺寸，默认为 640。
    # 3.cache ：是否缓存图像，可以是 "ram" 或 "disk"。
    # 4.augment ：是否进行数据增强，默认为 True 。
    # 5.hyp ：超参数配置，默认为 DEFAULT_CFG 。
    # 6.prefix ：日志前缀，默认为空字符串。
    # 7.rect ：是否使用矩形训练，默认为 False 。
    # 8.batch_size ：批量大小，默认为 16。
    # 9.stride ：模型的步长，默认为 32。
    # 10.pad ：填充比例，默认为 0.5。
    # 11.single_cls ：是否为单类别训练，默认为 False 。
    # 12.classes ：包含的类别列表，默认为 None 。
    # 13.fraction ：数据集的使用比例，默认为 1.0。
    def __init__(
        self,
        img_path,
        imgsz=640,
        cache=False,
        augment=True,
        hyp=DEFAULT_CFG,
        prefix="",
        rect=False,
        batch_size=16,
        stride=32,
        pad=0.5,
        single_cls=False,
        classes=None,
        fraction=1.0,
    ):
        # 使用给定的配置和选项初始化 BaseDataset。
        """Initialize BaseDataset with given configuration and options."""
        # 调用父类 Dataset 的构造函数，确保父类的初始化方法被正确调用。
        super().__init__()
        # 将传入的 img_path 参数值赋给类的实例变量 self.img_path ，用于 存储图像文件的路径 。
        self.img_path = img_path
        # 将传入的 imgsz 参数值赋给类的实例变量 self.imgsz ，用于 指定目标图像的尺寸 。
        self.imgsz = imgsz
        # 将传入的 augment 参数值赋给类的实例变量 self.augment ，用于控制 是否进行数据增强 。
        self.augment = augment
        # 将传入的 single_cls 参数值赋给类的实例变量 self.single_cls ，用于控制 是否为单类别训练 。
        self.single_cls = single_cls
        # 将传入的 prefix 参数值赋给类的实例变量 self.prefix ，用于 存储日志前缀 。
        self.prefix = prefix
        # 将传入的 fraction 参数值赋给类的实例变量 self.fraction ，用于 指定数据集的使用比例 。
        self.fraction = fraction
        # 调用 get_img_files 方法，传入 self.img_path ，获取 图像文件的路径列表 ，并赋值给 self.im_files 。
        self.im_files = self.get_img_files(self.img_path)
        # 调用 get_labels 方法，获取 标签数据 ，并赋值给 self.labels 。
        self.labels = self.get_labels()
        # 调用 update_labels 方法，传入 classes 参数，更新标签数据。如果 classes 不为 None ，则 只保留指定的类别 。如果 single_cls 为 True ，则将 所有类别的标签设置为 0 。
        self.update_labels(include_class=classes)  # single_cls and include_class
        # 计算 标签数据的长度 ，即 图像的数量 ，并赋值给 self.ni 。
        self.ni = len(self.labels)  # number of images
        # 将传入的 rect 参数值赋给类的实例变量 self.rect ，用于控制 是否使用矩形训练 。
        self.rect = rect
        # 将传入的 batch_size 参数值赋给类的实例变量 self.batch_size ，用于 指定批量大小 。
        self.batch_size = batch_size
        # 将传入的 stride 参数值赋给类的实例变量 self.stride ，用于 指定模型的步长 。
        self.stride = stride
        # 将传入的 pad 参数值赋给类的实例变量 self.pad ，用于 指定填充比例 。
        self.pad = pad
        # 如果 self.rect 为 True ，则。
        if self.rect:
            #  断言 self.batch_size 不为 None ，确保批量大小已设置。
            assert self.batch_size is not None
            # 调用 set_rectangle 方法，设置矩形训练的图像形状。
            self.set_rectangle()

        # Buffer thread for mosaic images    马赛克图像的缓冲线程。
        # 初始化一个空列表，用于存储 mosaic 图像的索引 。缓冲区的大小等于批量大小。
        self.buffer = []  # buffer size = batch size
        # 计算 最大缓冲区长度 。如果 self.augment 为 True ，则最大缓冲区长度为 self.ni 、 self.batch_size * 8 和 1000 中的最小值。如果 self.augment 为 False ，则最大缓冲区长度为 0 。
        self.max_buffer_length = min((self.ni, self.batch_size * 8, 1000)) if self.augment else 0

        # Cache images    缓存图片。
        # 检查是否将图像缓存到 RAM 中。如果 cache 为 "ram" 且 check_cache_ram 返回 False ，则将 cache 设置为 False 。
        if cache == "ram" and not self.check_cache_ram():
            cache = False
        # self.ims ：初始化一个列表，用于 存储缓存的图像 ，长度为 self.ni ，初始值为 None 。
        # self.im_hw0 ：初始化一个列表，用于 存储图像的原始高度和宽度 ，长度为 self.ni ，初始值为 None 。
        # self.im_hw ：初始化一个列表，用于 存储图像调整后的高度和宽度 ，长度为 self.ni ，初始值为 None 。
        self.ims, self.im_hw0, self.im_hw = [None] * self.ni, [None] * self.ni, [None] * self.ni

        # path.with_suffix(suffix)
        # with_suffix 是 Python pathlib 模块中 Path 类的一个方法，它用于修改路径对象的后缀（扩展名）。
        # path ： Path 类的实例。
        # suffix ：要设置的新后缀。如果为空字符串，则移除路径的当前后缀。
        # 返回值 ：
        # 返回一个新的 Path 对象，其后缀被修改为指定的 suffix 。
        # 方法功能 ：
        # 如果原始路径没有后缀， with_suffix 方法会将指定的后缀追加到路径的末尾。
        # 如果原始路径已经有后缀， with_suffix 方法会替换为指定的新后缀。
        # 如果指定的 suffix 是空字符串， with_suffix 方法会移除路径的当前后缀。
        # 注意事项 ：
        # with_suffix 方法不会修改原始的 Path 对象，而是返回一个新的 Path 对象。
        # 这个方法在处理文件扩展名时非常有用，尤其是在你需要动态更改文件类型或处理不同格式的文件时。

        # 生成一个列表，包含 每个图像文件对应的 .npy 文件路径 。
        self.npy_files = [Path(f).with_suffix(".npy") for f in self.im_files]
        # 如果 cache 为 True ，则调用 cache_images 方法缓存图像。
        if cache:
            self.cache_images(cache)

        # Transforms    变换。
        # 调用 build_transforms 方法，传入超参数 hyp ，初始化数据增强转换。这个方法应该返回一个数据增强转换的组合，用于在数据加载时应用。
        self.transforms = self.build_transforms(hyp=hyp)
    # BaseDataset 类的构造函数 __init__ 用于初始化一个用于图像处理和数据增强的基础数据集类。它接受多个参数来配置数据集的行为，包括图像路径、目标尺寸、缓存设置、数据增强、超参数配置、日志前缀、矩形训练、批量大小、步长、填充比例、单类别训练、类别列表和数据集使用比例。构造函数中初始化了多个实例变量，并调用了多个方法来加载图像文件、标签，更新标签，设置矩形训练，初始化缓冲区和缓存，以及初始化数据增强转换。这个类为图像分类、目标检测等任务提供了一个灵活且强大的数据处理框架。

    # 这段代码定义了 BaseDataset 类中的 get_img_files 方法，用于读取图像文件路径，支持从目录和文件中读取路径，并进行筛选和排序。
    # 定义了 get_img_files 方法，传入 1.img_path 参数，用于读取图像文件路径。
    def get_img_files(self, img_path):
        # 读取图像文件。
        """Read image files."""
        try:
            # 初始化一个空列表 f ，用于 存储图像文件路径 。
            f = []  # image files
            # 如果 img_path 是一个列表，则遍历列表中的每个路径。 如果 img_path 是一个单一路径，则将其转换为列表并遍历。
            for p in img_path if isinstance(img_path, list) else [img_path]:
                # 使用 Path 类将路径转换为操作系统无关的路径对象。
                p = Path(p)  # os-agnostic
                # 如果 p 是一个目录，则使用 glob.glob 递归地查找目录下的所有文件，并将路径添加到列表 f 中。
                if p.is_dir():  # dir
                    f += glob.glob(str(p / "**" / "*.*"), recursive=True)
                    # F = list(p.rglob('*.*'))  # pathlib
                # 检查路径 p 是否是一个文件。如果是文件，则进入这个分支。
                elif p.is_file():  # file
                    # 使用 with open(p) as t 打开文件 p ，并将其内容读取到变量 t 中。
                    with open(p) as t:
                        # 读取文件内容，去除首尾空白字符，然后按行分割，返回一个 包含每行内容的列表 。
                        t = t.read().strip().splitlines()
                        # 转换为全局路径。 p.parent 获取文件 p 的父目录路径。 str(p.parent) + os.sep 将父目录路径转换为字符串，并添加操作系统的路径分隔符，确保路径的正确性。
                        parent = str(p.parent) + os.sep
                        # 处理每行路径。使用列表推导式处理文件 t 中的每一行路径 x 。如果路径 x 以 ./ 开头，则将其替换为父目录路径 parent ，将相对路径转换为绝对路径。 如果路径 x 不以 ./ 开头，则保持不变。 将处理后的路径列表添加到 f 中。
                        f += [x.replace("./", parent) if x.startswith("./") else x for x in t]  # local to global path
                        # 注释掉的 pathlib 版本。这行代码是注释掉的，使用 pathlib 库的版本。它使用 p.parent / x.lstrip(os.sep) 将相对路径 x 转换为绝对路径。 x.lstrip(os.sep) 去除路径 x 开头的路径分隔符，确保路径的正确性。 p.parent / x.lstrip(os.sep) 将相对路径 x 转换为绝对路径，并添加到列表 F 中。
                        # F += [p.parent / x.lstrip(os.sep) for x in t]  # local to global path (pathlib)
                # 如果 p 既不是目录也不是文件，则抛出 FileNotFoundError 异常。
                else:
                    raise FileNotFoundError(f"{self.prefix}{p} does not exist")    # {self.prefix}{p} 不存在。
            # 使用列表推导式筛选出扩展名在 IMG_FORMATS 中的文件路径，并将路径中的斜杠统一为操作系统的默认斜杠。 对筛选后的文件路径进行排序。
            im_files = sorted(x.replace("/", os.sep) for x in f if x.split(".")[-1].lower() in IMG_FORMATS)
            # self.img_files = sorted([x for x in f if x.suffix[1:].lower() in IMG_FORMATS])  # pathlib
            # 使用 assert 语句确保至少有一个图像文件被找到，否则抛出异常。
            assert im_files, f"{self.prefix}No images found in {img_path}"    # {self.prefix}在{img_path}中未找到任何图像。
        # 捕获并处理任何异常，如果发生异常则抛出 FileNotFoundError 。
        except Exception as e:
            raise FileNotFoundError(f"{self.prefix}Error loading data from {img_path}\n{HELP_URL}") from e    # {self.prefix}从 {img_path} 加载数据时出错\n{HELP_URL}。
        # 检查 self.fraction 是否小于 1。如果小于 1，则表示只使用数据集的一部分图像。
        if self.fraction < 1:
            # im_files = im_files[: round(len(im_files) * self.fraction)]
            # 计算 要选择的图像数量 num_elements_to_select ，通过将图像文件列表 im_files 的长度乘以 self.fraction ，然后四舍五入到最近的整数。 len(im_files) 获取图像文件列表的长度。 self.fraction 是数据集的使用比例，范围在 0 到 1 之间。
            num_elements_to_select = round(len(im_files) * self.fraction)

            # random.sample(population, k)
            # random.sample 是 Python 标准库 random 模块中的一个函数，它用于从一个序列中随机选择指定数量的不重复元素，并返回一个新列表。
            # population ：一个序列，表示可供选择的元素集合。
            # k ：一个整数，表示需要随机选择的元素数量。
            # 返回值 ：
            # 返回一个新列表，包含从 population 中随机选择的 k 个不重复元素。
            # 功能 ：
            # random.sample 函数可以确保从 population 中选择的 k 个元素是唯一的，不会有重复。如果 population 中的元素数量小于 k ，则抛出 ValueError 。
            # 注意事项 ：
            # population 必须是一个序列，例如列表、元组或字符串。
            # k 的值不能大于 population 中元素的数量，否则会抛出 ValueError 。
            # 每次调用 random.sample 都会生成一个新的随机选择的列表，因为随机数生成器的状态在每次调用时都会改变。

            # 使用 random.sample 方法从 im_files 中随机选择 num_elements_to_select 个图像文件。 random.sample 方法返回一个新列表，包含从原始列表中随机选择的指定数量的元素，且不重复。
            im_files = random.sample(im_files, num_elements_to_select)
        # 返回筛选和处理后的图像文件路径列表。
        return im_files
    # get_img_files 方法用于读取图像文件路径，支持从目录和文件中读取路径，并进行筛选和排序。如果指定了数据集使用比例 self.fraction ，则从图像文件列表中随机选择指定比例的文件路径。这个方法为数据加载和处理提供了灵活性，确保只有有效的图像文件被加载。

    # 这段代码定义了 BaseDataset 类中的 update_labels 方法，用于更新数据集的标签信息，以仅包含指定的类别。
    # 定义了 update_labels 方法，接受一个可选的参数。
    # 1.include_class ：该参数是一个列表，包含需要保留的类别。
    def update_labels(self, include_class: Optional[list]):
        # 更新标签以仅包含这些类（可选）。
        """Update labels to include only these classes (optional)."""
        # 初始化类别数组。将 include_class 转换为 NumPy 数组，并将其形状重塑为 (1, -1) ，即一个行向量。这有助于后续的比较操作。
        include_class_array = np.array(include_class).reshape(1, -1)
        # 遍历标签。遍历 self.labels 列表中的每个标签字典。
        for i in range(len(self.labels)):
            # 检查是否需要过滤类别。如果 include_class 不为 None ，则进行类别过滤。
            if include_class is not None:
                # 获取标签信息。从当前标签字典中提取 类别 、 边界框 、 分割掩码 和 关键点 信息。
                cls = self.labels[i]["cls"]
                bboxes = self.labels[i]["bboxes"]
                segments = self.labels[i]["segments"]
                keypoints = self.labels[i]["keypoints"]
                # 过滤类别。使用 == 操作符比较 cls 和 include_class_array ，生成一个布尔数组。 使用 any(1) 沿着行方向（即每个类别）进行逻辑或操作，生成一个布尔数组 j ，表示每个边界框是否属于指定的类别。
                j = (cls == include_class_array).any(1)
                # 更新标签信息。
                # 使用布尔数组 j 过滤 cls 和 bboxes ，只保留 属于指定类别的 边界框 和 类别标签 。
                self.labels[i]["cls"] = cls[j]
                self.labels[i]["bboxes"] = bboxes[j]
                # 如果存在分割掩码 segments ，则使用布尔数组 j 过滤 segments ，只保留 属于指定类别的 分割掩码 。
                if segments:
                    # 这行代码是 update_labels 方法中的一部分，用于更新标签字典中的 segments 字段，以仅包含属于指定类别的分割掩码。
                    # enumerate(j) ：遍历布尔数组 j ，返回每个元素的索引 si 和值 idx 。
                    # if idx ：仅选择 idx 为 True 的索引 si 。
                    # segments[si] ：根据索引 si 从 segments 列表中选择对应的分割掩码。
                    # 最终，列表推导式返回一个新列表，包含所有属于指定类别的分割掩码。
                    # 这行代码通过列表推导式和布尔数组 j ，从 segments 列表中筛选出属于指定类别的分割掩码，并更新标签字典中的 segments 字段。这样可以确保标签信息与训练需求一致，特别是在多类别数据集中只保留特定类别的分割掩码时非常有用。
                    self.labels[i]["segments"] = [segments[si] for si, idx in enumerate(j) if idx]
                # 如果存在关键点 keypoints ，则使用布尔数组 j 过滤 keypoints ，只保留属于指定类别的关键点。
                if keypoints is not None:
                    self.labels[i]["keypoints"] = keypoints[j]
            # 处理单类别训练。如果 self.single_cls 为 True ，则将所有类别标签设置为 0，表示单类别训练。
            if self.single_cls:
                self.labels[i]["cls"][:, 0] = 0
    # update_labels 方法用于更新数据集的标签信息，以仅包含指定的类别。如果 include_class 不为 None ，则过滤掉不属于指定类别的标签信息。如果 self.single_cls 为 True ，则将所有类别标签设置为 0，适用于单类别训练。这个方法确保数据集的标签信息与训练需求一致，提高了数据处理的灵活性和适应性。

    # 这段代码定义了 BaseDataset 类中的 load_image 方法，用于从数据集索引 i 加载一张图像，并返回图像及其调整后的尺寸。
    # 定义了 load_image 方法，接受两个参数。
    # 1.i ：图像的索引。
    # 2.rect_mode ：布尔值，表示是否保持图像的宽高比进行调整，默认为 True 。
    def load_image(self, i, rect_mode=True):
        # 从数据集索引“i”加载 1 个图像，返回（im，调整大小的 hw）。
        """Loads 1 image from dataset index 'i', returns (im, resized hw)."""
        # 初始化变量。
        # im ：从 self.ims 列表中获取第 i 个 图像的缓存数据 。
        # f ：从 self.im_files 列表中获取第 i 个 图像文件的路径 。
        # fn ：从 self.npy_files 列表中获取第 i 个图像的 .npy 文件路径。
        im, f, fn = self.ims[i], self.im_files[i], self.npy_files[i]
        # 这段代码是 load_image 方法中的一部分，用于处理图像加载逻辑。具体来说，它检查图像是否已缓存到 RAM 中，如果没有缓存，则尝试从 .npy 文件或原始图像文件中加载图像。
        # 检查图像 im 是否为 None ，表示图像未缓存到 RAM 中。如果是 None ，则需要从文件中加载图像。
        if im is None:  # not cached in RAM
            # 从 .npy 文件加载图像。
            # 检查 .npy 文件是否存在。
            if fn.exists():  # load npy
                # 尝试从 .npy 文件中加载图像。
                try:
                    im = np.load(fn)
                # 捕获加载过程中可能发生的任何异常。
                except Exception as e:
                    # 记录警告信息，提示 .npy 文件损坏，并记录错误原因。
                    LOGGER.warning(f"{self.prefix}WARNING ⚠️ Removing corrupt *.npy image file {fn} due to: {e}")    # {self.prefix}警告 ⚠️ 删除损坏的 *.npy 图像文件 {fn}，原因是：{e}。
                    # 删除损坏的 .npy 文件， missing_ok=True 表示如果文件不存在也不抛出异常。
                    Path(fn).unlink(missing_ok=True)
                    # 使用 OpenCV 从原始图像文件 f 读取图像。
                    im = cv2.imread(f)  # BGR
            # 从原始图像文件加载图像。
            # 如果 .npy 文件不存在，则直接使用 OpenCV 从原始图像文件 f 读取图像。
            else:  # read image
                im = cv2.imread(f)  # BGR
            # 检查图像是否加载成功。
            # 检查图像是否成功加载。如果 im 为 None ，表示图像文件未找到或无法读取。
            if im is None:
                # 抛出 FileNotFoundError 异常，提示图像文件未找到。
                raise FileNotFoundError(f"Image Not Found {f}")    # 未找到图片 {f} 。
        # 这段代码处理了图像加载的逻辑，确保图像可以从 .npy 文件或原始图像文件中正确加载。如果 .npy 文件损坏或不存在，会尝试从原始图像文件中加载图像。如果图像文件也不存在或无法读取，会抛出 FileNotFoundError 异常。通过这种方式，代码确保了图像加载的健壮性，避免了因文件损坏或缺失导致的程序错误。

            # 这段代码是 load_image 方法中的一部分，用于调整图像尺寸。具体来说，它根据 rect_mode 参数的值，决定是保持图像的宽高比进行调整，还是将图像拉伸到目标尺寸。
            # 从图像 im 的形状中提取原始高度 h0 和宽度 w0 。
            h0, w0 = im.shape[:2]  # orig hw
            # 保持宽高比调整图像尺寸。
            # rect_mode ：布尔值，表示是否保持图像的宽高比进行调整。
            if rect_mode:  # resize long side to imgsz while maintaining aspect ratio
                # 计算调整比例 r ，即目标尺寸 self.imgsz 与图像的长边（高度或宽度）的比值。
                r = self.imgsz / max(h0, w0)  # ratio
                # 如果调整比例 r 不等于 1，表示需要调整图像尺寸。
                if r != 1:  # if sizes are not equal
                    # 计算调整后的宽度 w 和高度 h ，确保调整后的尺寸不超过目标尺寸 self.imgsz 。
                    w, h = (min(math.ceil(w0 * r), self.imgsz), min(math.ceil(h0 * r), self.imgsz))
                    # 使用 OpenCV 的 resize 方法调整图像尺寸，插值方法为 cv2.INTER_LINEAR ，适用于双线性插值。
                    im = cv2.resize(im, (w, h), interpolation=cv2.INTER_LINEAR)
            # 拉伸图像到目标尺寸。
            # 如果图像的原始尺寸不是目标尺寸 self.imgsz x self.imgsz ，则将图像拉伸到目标尺寸。
            elif not (h0 == w0 == self.imgsz):  # resize by stretching image to square imgsz
                # 使用 OpenCV 的 resize 方法将图像拉伸到目标尺寸 self.imgsz x self.imgsz ，插值方法为 cv2.INTER_LINEAR 。
                im = cv2.resize(im, (self.imgsz, self.imgsz), interpolation=cv2.INTER_LINEAR)
            # 这段代码根据 rect_mode 参数的值，决定如何调整图像尺寸。如果 rect_mode 为 True ，则保持图像的宽高比，将长边调整到目标尺寸 self.imgsz 。 如果 rect_mode 为 False ，则将图像拉伸到目标尺寸 self.imgsz x self.imgsz 。通过这种方式，可以灵活地处理不同尺寸的图像，确保图像在训练或推理时具有统一的输入尺寸。这对于许多计算机视觉任务（如目标检测和图像分类）是非常重要的。

            # 这段代码是 load_image 方法中的一部分，用于处理图像缓存和缓冲区管理。具体来说，它在启用数据增强时将图像及其相关信息缓存到内存中，并管理一个缓冲区以限制缓存的图像数量。
            # Add to buffer if training with augmentations
            # 检查是否启用数据增强。如果 self.augment 为 True ，则执行缓存操作。
            if self.augment:
                # 缓存图像及其相关信息。
                # self.ims[i] ：缓存 加载的图像 im 。
                # self.im_hw0[i] ：缓存 图像的原始尺寸 (h0, w0) 。
                # self.im_hw[i] ：缓存 图像调整后的尺寸 im.shape[:2] 。
                self.ims[i], self.im_hw0[i], self.im_hw[i] = im, (h0, w0), im.shape[:2]  # im, hw_original, hw_resized
                # 将图像索引添加到缓冲区。将图像索引 i 添加到缓冲区 self.buffer 中。
                self.buffer.append(i)
                # 管理缓冲区长度。
                # 如果缓冲区长度达到最大值 self.max_buffer_length ，则移除最早添加的图像索引及其缓存数据。
                if len(self.buffer) >= self.max_buffer_length:
                    # 从缓冲区中移除最早添加的图像索引 j 。
                    j = self.buffer.pop(0)
                    # 将移除的图像索引 j 对应的缓存数据设置为 None ，释放内存。
                    self.ims[j], self.im_hw0[j], self.im_hw[j] = None, None, None

            # 返回图像和尺寸信息。返回 加载的图像 im 、 原始尺寸 (h0, w0) 和 调整后的尺寸 im.shape[:2] 。
            return im, (h0, w0), im.shape[:2]

        # 返回缓存的图像和尺寸信息。如果图像已缓存到 RAM 中，直接返回缓存的图像和尺寸信息。
        return self.ims[i], self.im_hw0[i], self.im_hw[i]
        # 这段代码在启用数据增强时，将图像及其相关信息缓存到内存中，并管理一个缓冲区以限制缓存的图像数量。通过这种方式，可以确保在数据增强训练过程中，图像可以快速加载和访问，同时避免内存溢出。缓冲区的管理确保了缓存的图像数量不会超过预设的最大值，从而平衡了内存使用和加载速度。
    # load_image 方法用于从数据集索引 i 加载一张图像，并根据 rect_mode 参数调整图像尺寸。如果图像未缓存到 RAM 中，方法会从 .npy 文件或原始图像文件中加载图像，并进行必要的尺寸调整。加载的图像和尺寸信息会被缓存到 RAM 中，以便后续快速访问。这个方法确保图像可以被快速加载，特别是在使用数据增强时，可以显著提高训练速度。

    # 这段代码定义了 BaseDataset 类中的 cache_images 方法，用于将图像缓存到内存（RAM）或磁盘（disk）。
    # 定义了 cache_images 方法，接受一个参数。
    # 1.cache ：用于指定缓存方式，可以是 "ram" 或 "disk"。
    def cache_images(self, cache):
        # 将图像缓存到内存或磁盘。
        """Cache images to memory or disk."""
        # 初始化变量。
        # b 初始化为 0，用于 累计缓存图像所需的字节数 。
        # gb 初始化为 1 << 30 ，即 1 GB 的字节数。
        b, gb = 0, 1 << 30  # bytes of cached images, bytes per gigabytes
        # 选择缓存函数。如果 cache 为 "disk"，则选择 self.cache_images_to_disk 方法。 否则，选择 self.load_image 方法。
        fcn = self.cache_images_to_disk if cache == "disk" else self.load_image
        # 使用线程池缓存图像。
        #  使用 ThreadPool 创建一个线程池，线程数为 NUM_THREADS 。
        with ThreadPool(NUM_THREADS) as pool:

            # pool.imap(func, iterable, chunksize=None)
            # imap() 方法用于将一个可迭代的输入序列分块分配到线程池中的线程进行处理，并将结果返回一个迭代器。这个方法特别适用于需要顺序处理输入和输出的场景。
            # 参数 ：
            # func ：一个函数，它将被调用并传入 iterable 中的每个项目。
            # iterable ：一个可迭代对象，其元素将被传递给 func 函数。
            # chunksize ：（可选）一个整数，指定了每个任务传递给 func 的项目数量。默认值为 1，意味着每个任务只包含一个项目。如果设置为大于 1 的值，那么 func 将接收到一个包含多个项目的列表。
            # 返回值 :
            # 返回一个 Iterator ，它生成每个输入元素经过 func 处理后的结果。
            # 特点 :
            # 结果的顺序与输入序列的顺序相同。
            # 如果任何一个任务因为异常而终止， imap() 会立即抛出异常。
            # 它允许主线程在子线程完成工作之前继续执行，而不是等待所有任务完成。
            # ThreadPool.imap() 是处理 I/O 密集型任务或者需要顺序处理结果的并发任务的有用工具。与之相对的是 imap_unordered() ，它同样返回一个迭代器，但是结果的顺序可能与输入序列不同，适用于不在乎结果顺序的场景。

            # 使用 pool.imap 并行调用 fcn 方法，传入图像索引 range(self.ni) 。
            results = pool.imap(fcn, range(self.ni))
            # 使用 TQDM 创建一个进度条，显示缓存进度。
            # class TQDM(tqdm_original):
            # -> TQDM 类用于创建一个进度条，可以显示任务的进度。
            # -> def __init__(self, *args, **kwargs):
            pbar = TQDM(enumerate(results), total=self.ni, disable=LOCAL_RANK > 0)
            # 处理缓存结果。
            # 遍历进度条中的每个结果 i, x 。
            # 在 cache_images 方法中的 for i, x in pbar: 循环中， x 是从 results 迭代器中获取的每个元素，这个迭代器是由 pool.imap(fcn, range(self.ni)) 生成的。 fcn 是根据 cache 参数选择的函数，可以是 self.cache_images_to_disk 或 self.load_image 。因此， x 的内容取决于 fcn 的返回值。
            # 当 cache == "disk" 时如果 cache 为 "disk"，则 fcn 是 self.cache_images_to_disk 。这个方法通常会将图像保存为 .npy 文件，并返回一个表示操作成功与否的值（例如 True 或 None ）。在这种情况下， x 通常不包含有用的信息，因为主要操作是将图像保存到磁盘。
            # 当 cache == "ram" 时如果 cache 为 "ram"，则 fcn 是 self.load_image 。这个方法会加载图像并返回一个包含图像数据、原始尺寸和调整后尺寸的元组。在这种情况下， x 包含以下内容 ：
            # 图像数据 ：加载的图像，通常是一个 NumPy 数组。
            # 原始尺寸 ：图像的原始高度和宽度，通常是一个元组 (h0, w0) 。
            # 调整后尺寸 ：图像调整后的高度和宽度，通常是一个元组 (h, w) 。
            for i, x in pbar:
                # 如果 cache 为 "disk"，则累加 .npy 文件的大小。
                if cache == "disk":
                    b += self.npy_files[i].stat().st_size
                # 如果 cache 为 "ram"，则将 图像 、 原始尺寸 和 调整后的尺寸 存储到 self.ims 、 self.im_hw0 和 self.im_hw 中，并累加图像的字节数。
                else:  # 'ram'
                    self.ims[i], self.im_hw0[i], self.im_hw[i] = x  # im, hw_orig, hw_resized = load_image(self, i)
                    b += self.ims[i].nbytes
                # 更新进度条的描述，显示当前已缓存的图像大小。
                pbar.desc = f"{self.prefix}Caching images ({b / gb:.1f}GB {cache})"    # {self.prefix}缓存图像（{b/gb:.1f}GB{cache}）。
            # 关闭进度条。
            pbar.close()
    # cache_images 方法通过并行处理将图像缓存到内存或磁盘。根据 cache 参数的不同，选择不同的缓存方法。使用 ThreadPool 和 TQDM 提高缓存效率并显示进度。这个方法确保图像可以被快速加载，特别是在使用数据增强时，可以显著提高训练速度。通过累加缓存图像的字节数，可以实时显示缓存进度和已使用的内存大小。

    # 这段代码定义了 BaseDataset 类中的 cache_images_to_disk 方法，用于将图像保存为 .npy 文件，以便更快地加载。
    # 定义了 cache_images_to_disk 方法，接受一个参数。
    # 1.i ：表示图像的索引。
    def cache_images_to_disk(self, i):
        # 将图像保存为 *.npy 文件以便更快地加载。
        """Saves an image as an *.npy file for faster loading."""
        # 获取 .npy 文件路径。
        # 从 self.npy_files 列表中获取第 i 个图像的 .npy 文件路径。 self.npy_files 是在构造函数中生成的，包含每个图像文件对应的 .npy 文件路径。
        f = self.npy_files[i]
        # 检查文件是否存在。检查 .npy 文件是否已存在。如果文件已存在，则不进行任何操作，避免重复保存。
        if not f.exists():
            # 保存图像为 .npy 文件。
            # f.as_posix() ：将 Path 对象转换为 POSIX 风格的字符串路径。
            # cv2.imread(self.im_files[i]) ：使用 OpenCV 读取第 i 个图像文件。
            # np.save(f.as_posix(), ...) ：将读取的图像数据保存为 .npy 文件。
            # allow_pickle=False ：禁用 pickle 序列化，提高文件的兼容性和安全性。
            np.save(f.as_posix(), cv2.imread(self.im_files[i]), allow_pickle=False)
    # cache_images_to_disk 方法用于将图像保存为 .npy 文件，以便更快地加载。这个方法检查目标 .npy 文件是否存在，如果不存在，则从原始图像文件中读取图像数据并保存为 .npy 文件。通过这种方式，可以显著提高图像加载速度，特别是在频繁读取图像数据时。 .npy 文件格式是 NumPy 的二进制文件格式，专门用于存储数组数据，读写速度比常规图像文件格式更快。

    # 这段代码定义了 BaseDataset 类中的 check_cache_ram 方法，用于检查将图像缓存到 RAM 中所需的内存是否足够。
    # 定义了 check_cache_ram 方法，接受一个可选参数。
    # 1.safety_margin ：默认值为 0.5，表示安全边际，用于确保有足够的内存余量。
    def check_cache_ram(self, safety_margin=0.5):
        # 检查图像缓存要求与可用内存。
        """Check image caching requirements vs available memory."""
        # 初始化变量。 b 初始化为 0，用于 累计缓存图像所需的字节数 。 gb 初始化为 1 << 30 ，即 1 GB 的字节数。
        b, gb = 0, 1 << 30  # bytes of cached images, bytes per gigabytes
        # 采样图像。 n 设置为 self.ni 和 30 中的较小值，表示从数据集中随机选择 30 张图像进行采样，以估计缓存所有图像所需的内存。
        n = min(self.ni, 30)  # extrapolate from 30 random images
        # 计算所需内存。
        # 遍历 n 次，每次随机选择一张图像 im 。
        for _ in range(n):
            im = cv2.imread(random.choice(self.im_files))  # sample image
            # im.shape[0] 和 im.shape[1] 分别表示图像的高度和宽度。 ratio 计算 目标尺寸 self.imgsz 与图像的最大边长的比值。
            ratio = self.imgsz / max(im.shape[0], im.shape[1])  # max(h, w)  # ratio
            # im.nbytes 计算图像的字节数。
            # b += im.nbytes * ratio**2 累加调整尺寸后的图像所需的字节数。
            b += im.nbytes * ratio**2
        # 计算总所需内存。 mem_required 计算缓存整个数据集所需的总内存（以 GB 为单位），考虑了安全边际 safety_margin 。
        mem_required = b * self.ni / n * (1 + safety_margin)  # GB required to cache dataset into RAM

        # psutil.virtual_memory()
        # psutil.virtual_memory() 是一个函数，属于 psutil 库，用于获取系统虚拟内存（RAM）的使用情况。
        # 参数 ：无参数。
        # 返回值 ：
        # 该函数返回一个命名元组（ psutil._common.smem ），其中包含了以下属性 ：
        # total ：总物理内存大小，单位为字节。
        # available ：可供分配的内存大小，单位为字节，这个值是系统认为可用的内存，包括缓存和缓冲区占用的内存。
        # percent ：已使用内存的百分比。
        # used ：已使用的内存大小，单位为字节。
        # free ：空闲的内存大小，单位为字节。
        # active ：当前正在使用或最近使用的内存，单位为字节。
        # inactive ：标记为未使用的内存，单位为字节。
        # buffers ：缓存数据，如文件系统元数据，单位为字节。
        # cached ：缓存数据，单位为字节。
        # shared ：可由多个进程共享的内存，单位为字节。
        # slab ：用于内核数据结构的内存，单位为字节。

        # 获取系统内存信息。使用 psutil.virtual_memory() 获取 系统的虚拟内存信息 。
        mem = psutil.virtual_memory()
        # 检查内存是否足够。 cache 设置为 True 如果 mem_required 小于可用内存 mem.available ，否则设置为 False 。
        cache = mem_required < mem.available  # to cache or not to cache, that is the question
        # 日志输出。
        # 如果 cache 为 False ，则输出日志信息，显示所需内存、可用内存和总内存，以及是否缓存图像的决定。
        if not cache:
            LOGGER.info(
                f'{self.prefix}{mem_required / gb:.1f}GB RAM required to cache images '    # {self.prefix}{mem_required / gb:.1f}GB RAM 需要缓存图像，
                f'with {int(safety_margin * 100)}% safety margin but only '    # 安全裕度为 {int(safety_margin * 100)}%，
                f'{mem.available / gb:.1f}/{mem.total / gb:.1f}GB available, '    # 但只有 {mem.available / gb:.1f}/{mem.total / gb:.1f}GB 可用，
                f"{'caching images ✅' if cache else 'not caching images ⚠️'}"    # {'caching images ✅' if cache else 'not caching images ⚠️'}。
            )
        # 返回 cache ，表示是否可以将图像缓存到 RAM 中。
        return cache
    # check_cache_ram 方法通过采样数据集中的图像，估计将整个数据集缓存到 RAM 中所需的内存，并与系统可用内存进行比较。如果可用内存足够，则返回 True ，表示可以缓存图像；否则返回 False ，表示不缓存图像。这个方法确保在缓存图像时不会超出系统内存限制，从而避免内存不足的问题。

    # 这段代码定义了 BaseDataset 类中的 set_rectangle 方法，用于设置 YOLO 检测中边界框的形状为矩形。这种方法通过调整图像的尺寸，使得每个批次中的图像具有相同的宽高比，从而提高训练效率。
    # 定义了 set_rectangle 方法，用于设置 YOLO 检测中边界框的形状为矩形。
    def set_rectangle(self):
        # 将 YOLO 检测的边界框形状设置为矩形。
        """Sets the shape of bounding boxes for YOLO detections as rectangles."""
        # 计算批次索引。
        # np.arange(self.ni) 生成一个从 0 到 self.ni - 1 的数组。 np.floor(np.arange(self.ni) / self.batch_size) 计算 每个图像所属的批次索引 。
        bi = np.floor(np.arange(self.ni) / self.batch_size).astype(int)  # batch index
        # 计算 总的批次数量 nb 。
        nb = bi[-1] + 1  # number of batches

        # 计算宽高比。
        # 从每个标签字典中提取 图像的形状 （ 高度 和 宽度 ），并存储在数组 s 中。
        s = np.array([x.pop("shape") for x in self.labels])  # hw
        # 计算每个图像的宽高比。
        ar = s[:, 0] / s[:, 1]  # aspect ratio
        # 获取 按宽高比排序的索引 。
        irect = ar.argsort()
        # 根据排序索引重新排列 图像文件路径 和 标签 。
        self.im_files = [self.im_files[i] for i in irect]
        self.labels = [self.labels[i] for i in irect]
        # 重新排列 宽高比数组 。
        ar = ar[irect]

        # 设置训练图像形状。
        # Set training image shapes
        # 初始化 shapes 列表，每个元素为 [1, 1] ，表示每个批次的图像形状。
        shapes = [[1, 1]] * nb
        # 遍历每个批次， nb 是总的批次数量。
        for i in range(nb):
            # 获取当前批次的宽高比。
            # bi == i 生成一个布尔数组，表示哪些图像属于当前批次 i 。
            # ar[bi == i] 从宽高比数组 ar 中提取 当前批次的宽高比 ，存储在 ari 中。
            ari = ar[bi == i]
            # 计算最小和最大宽高比。
            # ari.min() 计算当前批次中 图像的最小宽高比 ，存储在 mini 中。
            # ari.max() 计算当前批次中 图像的最大宽高比 ，存储在 maxi 中。
            mini, maxi = ari.min(), ari.max()
            # 调整图像形状。
            # 如果最大宽高比 maxi 小于 1。
            if maxi < 1:
                # 表示当前批次中的所有图像都比目标尺寸宽，因此将图像的高度设置为 maxi ，宽度设置为 1。这样可以确保图像在高度方向上被适当缩放，而宽度方向上保持不变。
                shapes[i] = [maxi, 1]
            # 如果最小宽高比 mini 大于 1。
            elif mini > 1:
                # 表示当前批次中的所有图像都比目标尺寸高，因此将图像的宽度设置为 1 / mini ，高度设置为 1。这样可以确保图像在宽度方向上被适当缩放，而高度方向上保持不变。
                shapes[i] = [1, 1 / mini]

        # 计算批次形状。
        # np.array(shapes) * self.imgsz / self.stride + self.pad 计算 每个批次的图像形状 ，考虑目标尺寸、步长和填充。
        # np.ceil(...).astype(int) 将计算结果向上取整并转换为整数。
        # * self.stride 确保图像形状是步长的倍数。
        # self.batch_shapes 存储 每个批次的图像形状 。
        self.batch_shapes = np.ceil(np.array(shapes) * self.imgsz / self.stride + self.pad).astype(int) * self.stride
        # 存储 每个图像所属的批次索引 。
        self.batch = bi  # batch index of image
    # set_rectangle 方法通过调整图像的尺寸，使得每个批次中的图像具有相同的宽高比，从而提高训练效率。这种方法特别适用于 YOLO 检测任务，因为它可以减少图像尺寸不一致带来的计算开销。通过按宽高比排序和调整图像形状，可以确保每个批次的图像在训练时具有相同的输入尺寸，从而提高训练速度和效率。

    # 这段代码定义了 BaseDataset 类中的 __getitem__ 方法，该方法是 PyTorch Dataset 类的一个特殊方法，用于在数据加载器（DataLoader）中索引数据集时返回单个数据项。
    # 定义了 __getitem__ 方法，接受一个参数。
    # 1.index ：表示数据集中的索引位置。
    def __getitem__(self, index):
        # 返回给定索引的转换标签信息。
        """Returns transformed label information for given index."""
        # 返回转换后的图像和标签。
        # self.get_image_and_label(index) ：调用 get_image_and_label 方法，传入索引 index ，获取图像和标签信息。
        # self.transforms(...) ：将获取的图像和标签信息传递给 self.transforms ，这是一个数据增强和预处理的转换流程，返回转换后的图像和标签。
        # return ... ：返回转换后的图像和标签信息。
        return self.transforms(self.get_image_and_label(index))
    # __getitem__ 方法在数据加载器中索引数据集时被调用，返回经过数据增强和预处理的图像和标签信息。这个方法确保每次索引数据集时，都能获取到经过适当处理的数据，适用于训练和验证过程。通过调用 get_image_and_label 方法获取原始图像和标签，再通过 self.transforms 进行转换，可以灵活地应用各种数据增强和预处理策略。

    # 这段代码定义了 BaseDataset 类中的 get_image_and_label 方法，用于获取并处理指定索引 index 处的图像和标签信息。
    # 定义了 get_image_and_label 方法，接受一个参数。
    # 1.index ：表示数据集中的索引位置。
    def get_image_and_label(self, index):
        # 从数据集获取并返回标签信息。
        """Get and return label information from the dataset."""
        # 深拷贝标签信息。使用 deepcopy 从 self.labels 列表中获取第 index 个标签的深拷贝。深拷贝确保返回的标签信息不会受到原始数据的修改影响。
        label = deepcopy(self.labels[index])  # requires deepcopy() https://github.com/ultralytics/ultralytics/pull/1948
        # 移除不必要的字段。从标签字典中移除 shape 字段，该字段在矩形训练模式下使用，但在返回标签信息时不需要。
        label.pop("shape", None)  # shape is for rect, remove it
        # 加载图像和尺寸信息。
        # 调用 self.load_image(index) 方法，加载第 index 个图像及其原始尺寸和调整后的尺寸。
        # 将 加载的图像 、 原始尺寸 和 调整后的尺寸 分别赋值给标签字典中的 img 、 ori_shape 和 resized_shape 字段。
        label["img"], label["ori_shape"], label["resized_shape"] = self.load_image(index)
        # 计算缩放比例。计算图像调整后的高度和宽度与原始高度和宽度的比值，存储在 ratio_pad 字段中。这在评估时用于将预测结果转换回原始图像尺寸。
        label["ratio_pad"] = (
            label["resized_shape"][0] / label["ori_shape"][0],
            label["resized_shape"][1] / label["ori_shape"][1],
        )  # for evaluation
        # 处理矩形训练模式。
        # 如果启用了矩形训练模式 ( self.rect 为 True )，则从 self.batch_shapes 中获取第 index 个图像的矩形形状，并存储在 rect_shape 字段中。
        if self.rect:
            label["rect_shape"] = self.batch_shapes[self.batch[index]]
        # 更新标签信息。调用 self.update_labels_info(label) 方法，更新标签信息。这个方法可以由子类重写，以进行特定的标签处理。
        # 返回更新后的标签信息。
        return self.update_labels_info(label)
    # get_image_and_label 方法用于获取并处理指定索引 index 处的图像和标签信息。它加载图像，计算必要的尺寸信息和缩放比例，并根据矩形训练模式进行处理。最后，它调用 update_labels_info 方法更新标签信息，确保返回的标签信息适用于后续的训练或评估过程。通过这种方式，可以灵活地处理不同格式的标签信息，提高数据处理的通用性和灵活性。

    # 这段代码定义了 BaseDataset 类中的 __len__ 方法，该方法是 Python 的特殊方法，用于返回数据集的长度。
    # 定义了 __len__ 方法，这个方法在调用 len(dataset) 时被自动调用，其中 dataset 是 BaseDataset 类的实例。
    def __len__(self):
        # 返回数据集的标签列表的长度。
        """Returns the length of the labels list for the dataset."""
        # 返回数据集长度。
        # len(self.labels) ：计算 self.labels 列表的长度，即数据集中的标签数量。
        # return ... ：返回计算得到的长度。
        return len(self.labels)
    # __len__ 方法返回数据集的长度，即数据集中的图像和标签对的数量。这个方法在使用 PyTorch 的 DataLoader 时非常有用，因为 DataLoader 会调用 __len__ 方法来确定数据集的大小，从而正确地分批加载数据。通过返回 self.labels 的长度，可以确保数据加载器知道数据集中有多少个样本。

    # 这段代码定义了 BaseDataset 类中的 update_labels_info 方法，该方法用于更新和自定义标签信息的格式。这个方法是一个占位符，具体实现需要在子类中根据实际需求进行定制。
    # 定义了 update_labels_info 方法，接受一个参数。
    # 1.label ：表示当前的标签信息字典。
    def update_labels_info(self, label):
        # 在此自定义您的标签格式。
        """Custom your label format here."""
        # 返回标签信息。直接返回传入的 label 字典，不进行任何修改。 这个方法的目的是提供一个钩子（hook），允许子类在需要时重写该方法，以自定义标签信息的格式。
        return label
    # update_labels_info 方法是一个抽象方法，用于更新和自定义标签信息的格式。默认实现中，它直接返回传入的标签信息字典，不进行任何修改。子类可以根据具体需求重写这个方法，以实现特定的标签处理逻辑。例如，可能需要将标签信息从一种格式转换为另一种格式，或者添加额外的字段。通过这种方式， BaseDataset 类提供了灵活性，允许用户根据不同的任务需求自定义数据处理流程。

    # 这段代码定义了 BaseDataset 类中的 build_transforms 方法，但该方法的具体实现被留空，并抛出了 NotImplementedError 异常。这表明 build_transforms 方法是一个抽象方法，需要在子类中具体实现。
    # 定义了 build_transforms 方法，接受一个可选参数。
    # hyp ：该参数通常是一个包含超参数的字典，用于配置数据增强的参数。
    def build_transforms(self, hyp=None):
        # 用户可以在此处自定义增强。
        """
        Users can customize augmentations here.

        Example:
            ```python
            if self.augment:
                # Training transforms
                return Compose([])
            else:
                # Val transforms
                return Compose([])
            ```
        """
        # 抛出 NotImplementedError 异常，表示该方法在当前类中没有具体实现。子类必须实现这个方法，以提供具体的转换逻辑。
        raise NotImplementedError
    # build_transforms 方法是一个抽象方法，用于构建和返回数据增强的转换流程。子类需要根据具体的任务需求实现这个方法，以生成适用于训练或验证的数据增强转换。例如，不同的任务可能需要不同的数据增强策略，如随机裁剪、旋转、颜色变换等。通过在子类中实现 build_transforms 方法，可以灵活地配置和应用这些数据增强策略。

    # 这段代码定义了 BaseDataset 类中的 get_labels 方法，但该方法的具体实现被留空，并抛出了 NotImplementedError 异常。这表明 get_labels 方法是一个抽象方法，需要在子类中具体实现。
    # 定义了 get_labels 方法，该方法用于加载和返回数据集的标签信息。
    def get_labels(self):
        # 用户可以在此处自定义自己的格式。
        """
        Users can customize their own format here.

        Note:
            Ensure output is a dictionary with the following keys:
            ```python
            dict(
                im_file=im_file,
                shape=shape,  # format: (height, width)
                cls=cls,
                bboxes=bboxes, # xywh
                segments=segments,  # xy
                keypoints=keypoints, # xy
                normalized=True, # or False
                bbox_format="xyxy",  # or xywh, ltwh
            )
            ```
        """
        # 抛出 NotImplementedError 异常，表示该方法在当前类中没有具体实现。子类必须实现这个方法，以提供具体的标签加载逻辑。
        raise NotImplementedError
    # get_labels 方法是一个抽象方法，用于加载数据集的标签信息。子类必须实现这个方法，以确保数据集的标签可以被正确加载和处理。这种设计模式允许 BaseDataset 类提供一个通用的框架，而具体的实现细节则由子类根据不同的数据集格式和需求来完成。例如，不同的数据集可能有不同的标签文件格式（如 JSON、XML、TXT 等），子类可以通过实现 get_labels 方法来处理这些不同的格式。
# BaseDataset 类是一个基础的数据集类，用于图像处理和数据增强。它继承自 PyTorch 的 Dataset 类，提供了加载、处理和转换图像数据的功能。该类支持多种配置选项，包括图像路径、目标尺寸、缓存设置、数据增强、超参数配置、日志前缀、矩形训练、批量大小、步长、填充比例、单类别训练、类别列表和数据集使用比例。通过灵活配置这些参数， BaseDataset 类可以适应不同的训练需求，包括单类别训练、数据增强、矩形训练等。它还提供了方法来加载图像文件、更新标签信息、缓存图像到内存或磁盘，并构建数据增强转换流程。这个类为图像分类、目标检测等任务提供了一个灵活且强大的数据处理框架。

你可能感兴趣的:(YOLO,笔记,深度学习)

DPDK（25.03）零基础配置笔记 _Chipen DPDK 计算机网络
DPDK零基础配置笔记DPDK（DataPlaneDevelopmentKit，数据面开发工具包）是一个高性能数据包处理库，主要用于绕过Linux内核网络协议栈，直接在用户空间对网卡收发的数据进行操作，以此实现极高的数据吞吐。DPDK的核心价值是：使用轮询+巨页内存+用户态驱动，提升网络收发性能。适用场景：高频交易、软件路由器、防火墙、负载均衡器等对网络性能要求极高的系统。基本数据简要解释igb_
【机器学习】探索未来科技的前沿：人工智能、机器学习与大模型 AIGC零基础入门小白 AI大模型大模型教程人工智能机器学习科技 AI大模型 AIGC AI教程大模型教程
文章目录引言一、人工智能：从概念到现实1.1人工智能的定义1.2人工智能的发展历史1.3人工智能的分类1.4人工智能的应用二、机器学习：人工智能的核心技术2.1机器学习的定义2.2机器学习的分类2.3机器学习的实现原理2.4机器学习的应用2.5机器学习的示例代码2.6解释代码三、大模型：推动AI前沿发展的关键技术3.1大模型的定义3.2大模型的发展历程3.3深度学习与神经网络3.4大模型的优势与挑
基于YOLOv8的火灾智能检测系统设计与实现斟的是酒中桃深度学习人工智能 pyqt yolo
在各类安全事故中，火灾因其突发性强、破坏力大，一直是威胁人们生命财产安全的重大隐患。传统的火灾检测方式多依赖烟雾传感器、温度传感器等，存在响应滞后、易受环境干扰等问题。随着深度学习技术的飞速发展，基于计算机视觉的火灾检测方法凭借其实时性强、检测范围广等优势，逐渐成为研究热点。本文将简单介绍一款基于深度学习的火灾智能检测系统的设计与实现过程。一、系统整体设计本火灾智能检测系统旨在通过深度学习技术实现
人工智能入门指南：从基础概念到实际应用
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。https://www.captainbed.cn/north文章目录1.**人工智能的基本概念**1.1什么是人工智能？1.2人工智能的分类2.**人工智能的核心技术**2.1机器学习（MachineLearning）2.1.1机器学习的类型2.1.2机器学习流程2.2深度学习（DeepLearni
【k8s学习】Kubernetes新手学习，4小时视频笔记总结伊丽莎白2015
【学习视频地址】KubernetesTutorialforBeginnersFULLCOURSEin4Hours视频不一定打得开，不过我笔记也很详细了。【笔记内容】1-【k8s学习】Kubernetes学习——核心组件和架构2-【k8s学习】minikube、kubectl、yaml配置文件的介绍3-【k8s学习】在minikube上布署MongoDB和MongoExpress4-【k8s学习】k
Datawhale X 魔塔 Ai夏令营 --深度学习基础
一、局部极小值与全局极小值全局极小值：在损失函数的整个定义域内，损失值最小的点。这是我们在训练深度学习模型时希望找到的点，因为它代表着模型的最佳性能。局部极小值：在损失函数的一个局部区域内，损失值达到最小，但在整个函数定义域内可能不是最小的。当优化算法陷入局部极小值时，它可能会误以为已经找到了全局最优解，从而停止搜索。局部极小值的检测两种直观的方法来检测局部极小值：可视化方法：对于低维问题，我们可
20190320 沐沐_2557
【今日回顾】001结营流程海报002十二期最后一张晚安海报（想哭）003复盘完成，今天在群里各种吹水【运营经验】大家的默契和信任度都有了，聊天更深入，家人，朋友，这种感觉真好【见识|感悟】没有了打卡的压力，管理组和学员们都皮了起来，今天一天太欢乐了【每日一夸】永艾，这小姑娘就是宝藏【明日计划】001继续我的课程笔记002研究时间管理003和乐乐做下一期初步规划004期待小伙伴运营学院的表现
2021-01-12 丛培国
【日精进打卡第1092天】【知～学习】《六项精进》0遍共61遍《大学》0遍共60遍【读书】1、《清单革命》1902、《马云内部讲话》1383、《利润的秘密》4、《我的第一本思维导图》5、《老板轻松管财务》6、《总经理财务一本通》OK7、《经营者养成笔记》8、《第一次当经理》OK9、《可复制的领导力》OK10、《论语与算盘》OK【经典名言】【行～实践】一、修身：1、俯卧撑50二、齐家：三、建功：｛积
沟通圣经读书笔记敏佳读书
听的技巧1.准备好去听。我们应该多思考对方要说的是什么，少想自己要说什么。2.感兴趣。3.心胸开阔。4.听出重点。5.批判性倾听。6.避免分心。7.做笔记。8.协助说话者。（轻轻点头，专心看着说话者，说了解，真的，嗯？重复对方刚说过的最后几个字。表示你理解对方的意思了）9.回应。10.不插话。
pytorch的学习笔记 wyn20001128 算法
一cuda 2006年，NVIDIA公司发布了CUDA(ComputeUnifiedDeviceArchitecture)，是一种新的操作GPU计算的硬件和软件架构，是建立在NVIDIA的GPUs上的一个通用并行计算平台和编程模型，它提供了GPU编程的简易接口，基于CUDA编程可以构建基于GPU计算的应用程序。 CPU是用于负责逻辑性比较强的计算，GPU专注于执行高度线程化的并行处理任务。所以
深度学习模块实践手册（第十二期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
56、Ghost模块论文《GhostNet:MoreFeaturesfromCheapOperations》1、作用：Ghost模块是一种轻量级的特征提取模块，旨在通过廉价操作生成更多特征图，减少计算量的同时保持模型性能。传统卷积神经网络在生成特征图时存在大量冗余计算，Ghost模块通过将特征图生成过程分解为两个步骤，有效减少了计算复杂度，特别适合移动端和嵌入式设备部署。2、机制Ghost模块的机
DETR革命：目标检测的Transformer时代加油吧zkf 目标检测 YOLO python 开发语言人工智能图像处理
《DETR从0到1：目标检测Transformer的崛起》为什么会有DETR？在深度学习目标检测发展史上，2014~2019年几乎被基于卷积神经网络（CNN）的检测器统治：两阶段：FasterR-CNN、MaskR-CNN单阶段：YOLO、SSD、RetinaNet这些检测器虽然效果强大，但背后依赖：✅Anchor（先验框）✅NMS（非极大值抑制）✅特征金字塔、手工设计问题：结构复杂、调参困难、不
随记50 林金秀
今天，说三件事！1.有点颓！看了淘宝好几个小时，只为了买衣服，现心中已有底。先对手头上的衣服进行断舍离，该淘汰的淘汰掉，留的就拍照+编辑加到云笔记里，方便日后的穿搭。其实，对衣服穿搭，我一直认为：衣贵洁。同时，我很随便穿，只要不裸奔就行。可去正式场合，我发现自己没衣服穿。既然，我已打算重新打造自己，那就从形象管理开始，形象管理就从选衣服开始吧！2.拼爹时候昨天，幼儿园发放了一份宣传海报，宣传一所民
读书笔记煙花笑
穿越人海拥抱你苑子文苑子豪60个笔记插图千万不要停下脚步，否则世界就会忘了你。这世界是很美好，但也足够忍。一直咬牙不放弃的你，真是太辛苦了。前言：一切看似末日的，终将被证明只是过程一切看似末日的，终将被证明只是过程灯火通明，车辆川流不息，纵横的高架桥两侧有高耸的大厦，华丽的商场里陈列着琳琅满目的奢侈品。巨大的车流声在耳边倏忽而过，青春年少时的那些小勇敢和小执着带着轰隆的响声，从心底往外翻涌。我想每
深度学习模块实践手册（第十一期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
46、缩放点积注意力模块论文《AttentionIsAllYouNeed》1、作用：缩放点积注意力（ScaledDot-ProductAttention）是Transformer模型的核心组件，旨在解决序列建模中长距离依赖关系捕捉的问题。传统的循环神经网络（RNN）在处理长序列时存在梯度消失或爆炸的问题，且并行性较差。该模块通过计算查询（Query）、键（Key）和值（Value）之间的相似度，实
# TF Eager Execution 阅读笔记 tsiic
TFEagerExecution阅读笔记@[TensonFlow]看了半天不知道Eager是啥，这哪能看下去。所以Google了一下，在知乎发现如下解释：......就开启了Eager模式，这时，TensorFlow会从原先的声明式（declarative）编程形式变成命令式（imperative）编程形式。当写下语句"c=tf.matmul(a,b)"后（以及其他任何tf开头的函数），就会直接执
STM32F407学习笔记——HC-SR04模块（基本测距应用） duoduo study 单片机 stm32
STM32F407学习笔记——HC-SR04模块（基本测距应用）一、基本原理：定义stm32的GPIO，给予Trig高电平（大于10us即可这里给予的是20us），再拉低发送超声波，超声波在碰到障碍物时返回被超声波模块接受，Echo输出高电平，通过定时器得出Echo高电平持续时间即可计算与障碍物之间的距离。二、代码功能：通过stm32控制超声波模块将测得的距离反馈在串口上。三、接线：Trig——P
正点原子stm32F407学习笔记7——看门狗实验蜗牛先森i stm32单片机 stm32 学习笔记
一、什么是看门狗在由单片机构成的微型计算机系统中，由于单片机的工作常常会受到来自外界电磁场的干扰，造成程序的跑飞，而陷入死循环，程序的正常运行被打断，由单片机控制的系统无法继续工作，会造成整个系统的陷入停滞状态，发生不可预料的后果，所以出于对单片机运行状态进行实时监测的考虑，便产生了一种专门用于监测单片机程序运行状态的模块或者芯片，俗称“看门狗”(watchdog)。就是在程序执行异常情况下系统复
Apache Kafka 学习笔记
一、Kafka简介1.1Kafka是什么？Kafka是一个高吞吐、可扩展、分布式的消息发布-订阅系统，主要用于：日志收集与处理流式数据处理事件驱动架构实时分析管道最初由LinkedIn开发，后捐赠给Apache基金会。1.2Kafka的核心特性特性描述高吞吐每秒百万级消息处理能力，依赖顺序写磁盘、批量处理分布式支持水平扩展，多个Broker组成集群持久化消息写入磁盘（通过segmentfiles+
算法分析--时间复杂度 _不会dp不改名_ 杂项算法
1.声明内容是我抄得别人的，自己拿来做笔记看一下。2.复杂度记号OOO:大O符号，也是最常用的，它表示的是小于等于，上界，也就是最差情况下的时间复杂度。Ω\OmegaΩ:大欧米伽，它表示的是大于等于，下界，也就是最好情况下的时间复杂度。Θ\ThetaΘ:大西塔，它表示的是确界，就是等于。ooo:小O符号，表示小于。ω\omegaω:小omega,表示大于。抄了三个数学定义第一个是渐进上界f(n)=
基于NanoDet的健身姿势纠正系统开发 YOLO实战营人工智能 NanoDet 深度学习计算机视觉 ui
1.引言在现代健身行业中，正确的运动姿势至关重要，不仅能提升训练效果，还能预防运动损伤。尤其是在进行一些高强度的力量训练时，如深蹲、俯卧撑等，错误的姿势可能导致肌肉不平衡或关节损伤。传统的健身姿势纠正方式依赖教练的人工指导，但随着人工智能技术的发展，使用计算机视觉和深度学习技术来进行姿势纠正，逐渐成为一种高效且可扩展的解决方案。本文将详细介绍如何基于NanoDet（一个轻量化目标检测模型）开发一个
大模型算法工程师技术路线全解析：从基础到资深的能力跃迁 Mr.小海大模型算法数据挖掘人工智能机器学习深度学习机器翻译 web3
文章目录大模型算法工程师技术路线全解析：从基础到资深的能力跃迁一、基础阶段（0-2年经验）：构建核心知识体系与工程入门数学与机器学习基础编程与深度学习框架NLP与Transformer入门二、进阶阶段（2-4年经验）：深化模型技术与工程落地能力大模型预训练与微调技术预训练原理：数据与任务的协同设计微调工具：参数高效适配与工程优化对齐实践：价值观优化与实证效果分布式训练与框架工具并行策略：多维度协同
mysql笔记17视图程宇寒 mysql笔记视图
mysql笔记17视图一、含义mysql5.1版本出现的新特性，本身是一个虚拟表，它的数据来自于表，通过执行时动态生成。好处：1、简化sql语句2、提高了sql的重用性3、保护基表的数据，提高了安全性二、创建createview视图名as查询语句;三、修改方式一：createorreplaceview视图名as查询语句;方式二：alterview视图名as查询语句四、删除dropview视图1，视
【Java笔记】七大排序赶飞机偏偏下雨 Java java 数据结构笔记
目录1.直接插入排序2.希尔排序3.选择排序4.堆排序(重要)5.冒泡排序6.快速排序（重要）6.1Hoare法6.1.1Hoare法优化6.2挖坑法（重点）6.3快速排序的非递归写法7.归并排序海量数据的排序问题8.总结1.直接插入排序时间复杂度：最坏情况：O(n2)最坏情况：O(n)空间复杂度：O(1)稳定性：稳定如果一个排序本身就是稳定的排序那么他可以被实现为不稳定的排序但是如果一个排序本身
设计模式学习笔记06-Decorator模式百恼神烦
本文主要是看了《设计模式》做的笔记和思考，在此分享仅代表个人观点，如有不对的地方欢迎批评和指正。基础当出现需要多个组件组成新的部件，同时不想增加类的数量（即不希望通过继承解决），可以考虑使用Decorator（装饰）模式。该模式下，通过不断地将部件放置到修饰物中，形成新的对象，并且修饰物可以负责将行为（职责）依次向内传递至部件，UML图如下：Decorator模式-UML.png使用时是将部件放入
回顾2023 星空梦想plus 学习轨迹总结
今年的思考我仔细回忆了下，今年我做了哪些事情呢，忙忙碌碌一整年，除了搬砖还是搬砖，记录了许多笔记，但知识点都碎了，对自己的提升很有限，随着时间的推移，很多灵感都以及消逝，对我这个记性不好的人来说，尤为致命且严重的，接下来的时间，我会打算在过年前，将零碎的知识花时间归总一下，将知识完善，巩固起来今年的成果1.对相机模块更加熟悉且得心应手，很多需求，问题都能凭借经验能够很快的分析，归类，流转，进行处理
rollup学习--02.常用插件学习小q
这篇笔记总结rollup打包常用的插件常用插件我们在使用插件时可以在plugin汇总中查找：传送门和传送门，另外一些没列举的需要大家自行的去查阅啦，下面我聚几个常用的plugin。node模块的引入rollup因为是及与es规范的，所以在引入node模块时需要对应的插件。这里需要安装@rollup/plugin-node-resolve和@rollup/plugin-commonjs两个插件。ya
mtk调试-camera
仅当做个人学习笔记使用，防丢失。原文链接：https://blog.csdn.net/qq_58703058/article/details/132994554Device：1、修改imgsensor相关（ProjectConfig.mk文件）device/mediateksample/{platform}/ProjectConfig.mk此文件用于将相关模块加入编译。2、在头文件中添加senso
人该怎样活着呢11？ gjf05_05 笔记
人该怎样活着呢？/*人为了开心而活着。（20200524）*/【0】人一定是自由的，不自由的人只是一个宠物而已。【比如学生，花钱还被动】（20200520）（a学生是花钱打工，毕业后打工还钱20200523b尽信老师不如无师（20200523））一、我的世界观：实践出真知二、我的人生观（我的信仰）知识改变命运！（20200507）三、我的价值观身心健康和读书笔记还有和平！【1】关于身体健康方面：a
【深度学习-Day 36】CNN的开山鼻祖：从LeNet-5到AlexNet的架构演进之路吴师兄大模型深度学习入门到精通 python pytorch 开发语言人工智能 CNN 深度学习大模型
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &