Enzo 想砸电脑

Pascal Voc 2007 & 2012

1、简介

PASCAL 全称：Pattern Analysis, Statical Modeling and Computational Learning

PASCAL VOC（The PASCAL Visual Object Classes ）是一个经典的计算机视觉数据集，由牛津大学、马里兰大学和微软剑桥研究院的研究人员创建的。该数据集于2005年首次发布，从那时起就被用于训练和评估目标检测算法。

PASCAL VOC 从 2005年开始举办挑战赛，每年的内容都有所不同，主要包括：

图像分类（Classification ）
目标检测（Detection）
目标分割（Segmentation）
人体布局（Human Layout）
动作识别（Action Classification）

我们知道在 ImageNet挑战赛上涌现了一大批优秀的分类模型，而PASCAL挑战赛上则是涌现了一大批优秀的目标检测和分割模型，这项挑战赛已于2012年停止举办了，但是研究者仍然可以在其服务器上提交预测结果以评估模型的性能。

虽然近期的目标检测或分割模型更倾向于使用MS COCO数据集，但是这丝毫不影响 PASCAL VOC数据集的重要性，毕竟PASCAL对于目标检测或分割类型来说属于先驱者的地位。对于现在的研究者来说比较重要的两个年份的数据集是 PASCAL VOC 2007 与 PASCAL VOC 2012，这两个数据集频频在现在的一些检测或分割类的论文当中出现。

2、官网地址

官网地址：http://host.robots.ox.ac.uk/pascal/VOC/
官方文档： http://host.robots.ox.ac.uk/pascal/VOC/pubs/everingham10.pdf

3、数据集下载

1）下载方式一：点击下方链接直接下载

Pascal VOC 2007

训练集和验证集下载地址： training/validation data (450MB tar file)
测试集（图像 + 标注）下载地址： annotated test data (430MB tar file)
测试集（仅标注文件）下载地址： annotation only (12MB tar file, no images)

Pascal VOC 2012

训练集和验证集下载地址： training/validation data (2GB tar file)
测试集标注未公开

2）下载方式二：从官网下载

a、Pascal VOC 2007 数据集
点击链接进入 Pascal VOC 2007 主页： http://host.robots.ox.ac.uk/pascal/VOC/voc2007
在页面中找到如下下载链接，点击进行下载

b、Pascal VOC 2012 数据集
点击链接进入 Pascal VOC 2012 主页： http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
在页面中找到如下下载链接，点击进行下载

4、数据集的发展与 20个类别

1）数据集的发展

对于分类和检测来说，下图所示为数据集的发展历程，相同颜色的代表相同的数据集：

05年、06年、07年、08年数据集，为互斥的，独立的、完全不相同的数据集
09年开始，所有数据集由前几年的部分图像和新图像组成
09年的数据集 = 07年部分图像 + 08年部分图像 + 09年新图像
10、11 年的数据集，均是在前一年的数据集上进行扩充
12 年的数据集和 11年的数据集一样

虽然 Pascal VOC 2012 和 2007 版本的数据集存在一些共享的部分，但是它们的图像和标注文件在细节上还是有所不同的，因此在使用数据集时需要注意版本和文件的正确匹配。

2）20个类别

对于图像分类任务和目标检测任务，数据集有 20个类别（4大类）

}
    "aeroplane": 1,
    "bicycle": 2,
    "bird": 3,
    "boat": 4,
    "bottle": 5,
    "bus": 6,
    "car": 7,
    "cat": 8,
    "chair": 9,
    "cow": 10,
    "diningtable": 11,
    "dog": 12,
    "horse": 13,
    "motorbike": 14,
    "person": 15,
    "pottedplant": 16,
    "sheep": 17,
    "sofa": 18,
    "train": 19,
    "tvmonitor": 20
}

5、数据分布与统计

1）Pascal VOC 2007

$\quad \quad$ 官方地址

2）Pascal VOC 2012

$\quad \quad$ 官方地址

6、数据集的使用

目前广大研究者们普遍使用的是 VOC2007和VOC2012数据集。
论文中针对 VOC2007和VOC2012 的具体用法有以下几种：

只用VOC2007的trainval 训练，使用VOC2007的test测试
只用VOC2012的trainval 训练，使用VOC2012的test测试，这种用法很少使用，因为大家都会结合VOC2007使用
使用 VOC2007 的 train+val 和 VOC2012的 train+val 训练，然后使用 VOC2007的test测试，这个用法是论文中经常看到的 07+12 ，研究者可以自己测试在VOC2007上的结果，因为VOC2007的test是公开的。
使用 VOC2007 的 train+val+test 和 VOC2012的 train+val训练，然后使用 VOC2012的test测试，这个用法是论文中经常看到的 07++12 ，这种方法需提交到VOC官方服务器上评估结果，因为VOC2012 test没有公布。
先在 MS COCO 的 trainval 上预训练，再使用 VOC2007 的 train+val、 VOC2012的 train+val 微调训练，然后使用 VOC2007的test测试，这个用法是论文中经常看到的 07+12+COCO 。
先在 MS COCO 的 trainval 上预训练，再使用 VOC2007 的 train+val+test 、 VOC2012的 train+val 微调训练，然后使用 VOC2012的test测试，这个用法是论文中经常看到的 07++12+COCO，这种方法需提交到VOC官方服务器上评估结果，因为VOC2012 test没有公布。

7、数据集结构

1）Pascal VOC 2007

.
└── VOCdevkit
    └── VOC2007
        ├── Annotations                 标注文件（图像分类、目标检测、人体布局)
        │   ├── 000005.xml
        │   ├── 000007.xml
        │   ├── 000009.xml
        │   └── ... (共 5011个标注文件)
        ├── ImageSets                   数据集分割信息 （训练集、验证集、训练集+验证集）
        │   ├── Layout                  用于人体布局图像信息
        │   │   ├── train.txt
        │   │   ├── trainval.txt
        │   │   └── val.txt
        │   ├── Main                    用于图像分类和目标检测图像信息
        │   │   ├── train.txt          
        │   │   ├── trainval.txt       
        │   │   ├── val.txt            
        │   │   └── ... (共63个文件)
        │   └── Segmentation            用于语义分割和实例分割图像信息
        │       ├── train.txt
        │       ├── trainval.txt
        │       └── val.txt
        ├── JPEGImages                  所有原图像
        │   ├── 000005.jpg
        │   ├── 000007.jpg
        │   ├── 000009.jpg
        │   └── ... (共5011张图像)
        ├── SegmentationClass           语义分割标注图像
        │   ├── 000032.png
        │   ├── 000033.png
        │   ├── 000039.png
        │   └── ... (共422张图像)
        └── SegmentationObject          实例分割标注图像
            ├── 000032.png
            ├── 000033.png
            ├── 000039.png
            └── ... (共422张图像)

2）Pascal VOC 2012

.
└── VOCdevkit
    └── VOC2012
        ├── Annotations                  标注文件（图像分类、目标检测、人体布局)
        │   ├── 2007_000027.xml
        │   ├── 2007_000032.xml
        │   ├── 2007_000033.xml
        │   ├── 2007_000039.xml
        │   └── ...(共17125张图像)
        ├── ImageSets                     数据集分割信息 （训练集、验证集、训练集+验证集）
        │   ├── Action                      用于动作识别
        │   │   ├── train.txt                2296张图像
        │   │   ├── trainval.txt             4588张图像
        │   │   ├── val.txt                  2292张图像
        │   │   └── ...
        │   ├── Layout                      用于人体布局
        │   │   ├── train.txt                4425张图像
        │   │   ├── trainval.txt             850张图像
        │   │   └── val.txt                  425张图像
        │   ├── Main                        用于图像分类和目标检测  
        │   │   ├── train.txt                5717张图像 
        │   │   ├── train_val.txt            11540张图像
        │   │   └── trainval.txt             5823张图像 
        │   └── Segmentation                用于语义分割和实例分割 
        │       ├── train.txt                 1464张图像
        │       ├── trainval.txt              2913张图像
        │       └── val.txt                   1449张图像
        ├── JPEGImages                     所有原图像
        │   ├── 2007_000027.jpg
        │   ├── 2007_000032.jpg
        │   ├── 2007_000033.jpg
        │   ├── 2007_000039.jpg
        │   └── ...(共17125张图像)
        ├── SegmentationClass              语义分割标注图像
        │   ├── 2007_000032.png
        │   ├── 2007_000033.png 
        │   ├── 2007_000039.png
        │   ├── 2007_000042.png
        │   └── ...（共2913张图像）
        └── SegmentationObject             实例分割标注图像
            ├── 2007_000032.png
            ├── 2007_000033.png
            ├── 2007_000039.png
            ├── 2007_000042.png
            └── ...（共2913张图像）

3）2007 和 2012 数据结构的区别

1、Pascal VOC 2012 的数据集因为是在前几年的数据集上进行扩增，所以文件名中包含年份，而 Pascal VOC 2007 的文件名中不包含
- Pascal VOC 2007 的标注文件名和图像文件名类似为： 000005.xml、 000005.jpg
- Pascal VOC 2012 的标注文件名和图像文件名类似为： 2007_000027.xml、 2007_000039.png
2、Pascal VOC 2012 的 ImageSets 中包括 Action 文件：用于动作识别任务的数据集划分，而 Pascal VOC 2007 的 ImageSets 文件中不包含，因为动作识别任务（Action Classification）是2010年才有的。
3、.xml 的标注文件内容有所不同，比如： 12版本中有的图像标注是有动作信息

8、标注文件结构

（1）目标检测标注文件 Annotation

<annotation>
        <folder>VOC2007folder>
        <filename>000001.jpgfilename>
        <source>
                <database>The VOC2007 Databasedatabase>
                <annotation>PASCAL VOC2007annotation>
                <image>flickrimage>
                <flickrid>341012865flickrid>
        source>
        <owner>
                <flickrid>Fried Camelsflickrid>
                <name>Jinky the Fruit Batname>
        owner>
        <size>
                <width>353width>
                <height>500height>
                <depth>3depth>
        size>
        <segmented>0segmented>
        <object>
                <name>dogname>
                <pose>Leftpose>
                <truncated>1truncated>
                <difficult>0difficult>
                <bndbox>
                        <xmin>48xmin>
                        <ymin>240ymin>
                        <xmax>195xmax>
                        <ymax>371ymax>
                bndbox>
        object>
        <object>
                <name>personname>
                <pose>Leftpose>
                <truncated>1truncated>
                <difficult>0difficult>
                <bndbox>
                        <xmin>8xmin>
                        <ymin>12ymin>
                        <xmax>352xmax>
                        <ymax>498ymax>
                bndbox>
        object>
annotation>

annotation：标注文件的根节点，包含了整个标注信息
folder：图像所在的文件夹名称
filename：图像的文件名
source：图像来源
owner：图像拥有者
size：图像的尺寸信息，包括宽度、高度、深度。
segmented：是否被分割标注过：值为 0，未被过分割；值为 1，被分割标注。
object：图像中的一个物体，其中的信息包括：
- name：物体的类别名称， 20个类别
- bndbox：物体的边界框信息，包括左上角和右下角的坐标
  - xmin：边界框左上角的 x 坐标
  - ymin：边界框左上角的 y 坐标
  - xmax：边界框右下角的 x 坐标
  - ymax：边界框右下角的 y 坐标
- difficult：标记物体是否难以识别的标志，0 表示容易识别，1 表示难以识别
- truncated：标记物体是否被截断：0 表示未被截断，1 表示被截断（比如在图片之外，或者被遮挡超过15%）
pose：标记物体的姿态，例如正面、侧面等

（2）语义分割标注图像 SegmentationClass

背景部分的标注像素值为 0
边界部分的标注像素值为 255
难以分割的区域，例如有重叠物体或遮挡的区域，标注像素值为255
被分割出的object 内部，标注像素值为其类别索引。比如，被分割的飞机部分的像素值为飞机类别索引值 1

}
    "aeroplane": 1,
    "bicycle": 2,
    "bird": 3,
    "boat": 4,
    "bottle": 5,
    "bus": 6,
    "car": 7,
    "cat": 8,
    "chair": 9,
    "cow": 10,
    "diningtable": 11,
    "dog": 12,
    "horse": 13,
    "motorbike": 14,
    "person": 15,
    "pottedplant": 16,
    "sheep": 17,
    "sofa": 18,
    "train": 19,
    "tvmonitor": 20
}

（3）实例分割标注图像 SegmentationObject

背景部分的标注像素值为 0
边界部分的标注像素值为 255
难以分割的区域，例如有重叠物体或遮挡的区域，标注像素值为255
被分割出的 object 内部，使用物体实例的 ID 来标识它。物体实例的 ID ：为该物体在 .xml 标注文件中的 index 。比如，在 .xml 标注文件中，排位第2个的 object，ID = 2，在标注图像中，该 object 的像素值，就为2

（4）人体布局 Human Layout

< /part> 标签框起来的部分，就是人体布局的标签

<annotation>
    <folder>VOC2012folder>
    <filename>2007_000027.jpgfilename>
    <source>
       <database>The VOC2007 Databasedatabase>
       <annotation>PASCAL VOC2007annotation>
       <image>flickrimage>
    source>
    <size>
       <width>486width>
       <height>500height>
       <depth>3depth>
    size>
    <segmented>0segmented>
    <object>
       <name>personname>
       <pose>Unspecifiedpose>
       <truncated>0truncated>
       <difficult>0difficult>
       <bndbox>
          <xmin>174xmin>
          <ymin>101ymin>
          <xmax>349xmax>
          <ymax>351ymax>
       bndbox>
       <part>
          <name>headname>
          <bndbox>
             <xmin>169xmin>
             <ymin>104ymin>
             <xmax>209xmax>
             <ymax>146ymax>
          bndbox>
       part>
       <part>
          <name>handname>
          <bndbox>
             <xmin>278xmin>
             <ymin>210ymin>
             <xmax>297xmax>
             <ymax>233ymax>
          bndbox>
       part>
       <part>                    
          <name>footname>      
          <bndbox>               
             <xmin>273xmin>    
             <ymin>333ymin>    
             <xmax>297xmax>    
             <ymax>354ymax>    
          bndbox>              
       part>                   
       <part>
          <name>footname>
          <bndbox>
             <xmin>319xmin>
             <ymin>307ymin>
             <xmax>340xmax>
             <ymax>326ymax>
          bndbox>
       part>
    object>
annotation>

（5）动作识别 Action Classification

< /actions> 标签框起来的部分，就是动作识别的标签

<annotation>
    <filename>2011_003279.jpgfilename>
    <folder>VOC2011folder>
    <object>
       <name>personname>
       <actions>                                     
          <jumping>0jumping>                       
          <other>0other>                           
          <phoning>0phoning>                       
          <playinginstrument>0playinginstrument>   
          <reading>0reading>                       
          <ridingbike>0ridingbike>                 
          <ridinghorse>0ridinghorse>               
          <running>0running>                       
          <takingphoto>0takingphoto>               
          <usingcomputer>0usingcomputer>           
          <walking>1walking>                       
       actions>                                    
       <bndbox>
          <xmax>188xmax>
          <xmin>109xmin>
          <ymax>500ymax>
          <ymin>307ymin>
       bndbox>
       <difficult>0difficult>
       <pose>Unspecifiedpose>
       <point>
          <x>153x>
          <y>374y>
       point>
    object>
    <segmented>0segmented>
    <size>
       <depth>3depth>
       <height>500height>
       <width>367width>
    size>
    <source>
       <annotation>PASCAL VOC2011annotation>
       <database>The VOC2011 Databasedatabase>
       <image>flickrimage>
    source>
annotation>

9、数据集解析 - 目标检测任务

将数据集转换为 yolo 格式， YOLO 数据格式介绍： YOLO 数据集格式

import xml.etree.ElementTree as ET
import os


# voc的20个类别
classes = ['aeroplane', 'bicycle', 'bird', 'boat', 'bottle', 'bus', 'car', 'cat', 'chair', 'cow', 'diningtable',
           'dog', 'horse', 'motorbike', 'person', 'pottedplant', 'sheep', 'sofa', 'train', 'tvmonitor']


def convert(size, bbox):
    x = (bbox[0] + bbox[1]) / 2.0
    y = (bbox[2] + bbox[3]) / 2.0
    w = bbox[1] - bbox[0]
    h = bbox[3] - bbox[2]
    x = x / size[0]
    w = w / size[0]
    y = y / size[1]
    h = h / size[1]
    return (x, y, w, h)


def convert_annotation(xml_file, save_file):

    # 保存yolo格式 的label 的 .txt 文件地址
    save_file = open(save_file, 'w')

    tree = ET.parse(xml_file)
    size = tree.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)

    for obj in tree.findall('object'):
        difficult = obj.find('difficult').text
        cls = obj.find('name').text
        if cls not in classes or int(difficult) == 1:
            continue
        cls_id = classes.index(cls) + 1   # 类别索引从1开始，类别0是背景
        bbox = obj.find('bndbox')
        b = (float(bbox.find('xmin').text),
             float(bbox.find('xmax').text),
             float(bbox.find('ymin').text),
             float(bbox.find('ymax').text))
        bb = convert((w, h), b)
        save_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')
    save_file.close()


if __name__ == "__main__":
    # 数据集根目录地址
    data_root = "/Users/enzo/Documents/GitHub/dataset/VOCdevkit/VOC2007"

    # 标注文件地址
    annotation = os.path.join(data_root, 'Annotations')

    # yolo格式的文件保存地址
    save_root = './labels'
    if not os.path.exists(save_root):
        os.makedirs(save_root)

    for train_val in ["train", "val"]:
        if not os.path.exists(os.path.join(save_root, train_val)):
            os.makedirs(os.path.join(save_root, train_val))

        # 数据集划分的 .txt 文件地址
        txt_file = os.path.join(data_root, 'ImageSets/Main', train_val+'.txt')

        with open(txt_file, 'r') as f:
            lines = f.readlines()
        file_names = [line.strip() for line in lines if len(line.strip())>0]

        for file_name in file_names:
            xml_file = os.path.join(annotation, file_name+'.xml')
            save_file = os.path.join(save_root, train_val, file_name+'.txt')
            convert_annotation(xml_file, save_file)

10、Reference

https://arleyzhang.github.io/articles/1dc20586/

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
走向以教育叙事为载体的教育叙事研究 666小飞鱼
今天我读了吴松超老师的《给教师的68条建写作建议》中的第23条《如何通过教育叙事走向研究》，吴老师在文中与我们分享了一个德育案例，这是一个反面的案例，意在告知我们在处理问题时，不能就考虑的点太窄，思考要全面。走向教育叙事研究，教师要有敏锐的“感知力”，这个感知力来自于背后专业知识的支撑，思维能力以及广阔的视野和见识等。所以对于同一件事处理方法不同，这个就是教师背后“敏锐力”的不同造成的，也就是说是
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
钢筋长度超限检测检数据集VOC+YOLO格式215张1类别 futureflsl 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：215标注数量(xml文件个数)：215标注数量(txt文件个数)：215标注类别数：1标注类别名称:["iron"]每个类别标注的框数：iron框数=215总框数：215使用标注工具：labelImg标注规则：对类别进
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
厉国刚：新闻学与传播学到底有何区别微观大道
厉国刚：新闻学与传播学到底有何区别头几天，有人在知乎上问我：新闻学与传播学到底有何区别。他是一位想要跨专业考研的学生，对新闻传播学学科可谓了解甚少，甚至一头雾水，想要让我帮他解释解释。在研究生学硕层面，新闻传播学是一级学科，分成新闻学、传播学这两个二级学科。有些高校，还自设了广告学、出版发行学等其他二级学科，但从官方角度，新闻传播学一级学科下，正统的就是那两个二级学科。招生时，一般会按一级学科招，
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
2022-08-28 蔚蓝一片晴
初三暑假培训收获点滴从8月25至8月27日三天两晚的培训结束了，回到家中，该静下心来整理一下触动心灵的收获，成为成长的积淀。1.在优秀团队中快速成长与提升，做一名反思成长型教师一名专业型教师的教学指导包括了教学原理知识、案例知识、策略知识。面对教学中的遇到的有趣的情形、问题会去研究其理，寻找更好的教法学法对策。从新手到成熟型教师，再走向专业型教师，需要的是觉醒与反思，多进行案例研究，从案例中观察、
为什么瘦子很难增胖？我的狗毛毛
我是个标准的瘦子，168，100斤。用一句通俗的话来讲，我连马甲线都瘦出来了（体脂含量比较低）。但是我反而很羡慕那些比较丰满的女人，我的理想是再增重十五斤，练成前凸后翘的魔鬼身材。为此我开始纠正自己不规律的作息，吃高热量的食物，减少运动量，能坐着绝不站着，能躺着绝不坐着。但是结果却没有丝毫变化。我一直很苦恼，直到最近在网上看到一个视频，英国的某个研究机构做了一个实验，想要知道瘦子能否在高热量的食物
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
现代汉语粗糙版文学史与经典学习搬运工
第十六章文学史与经典文学史的兴起在西方,虽然从亚里士多德开始,在人类的著述中已经可以找到文学史概念与写作方式的萌芽,但是,人们一般认为17世纪后期到18世纪是现代文学史写作真正开始的时期。长达百年波及整个欧洲的“古今之争”孕育出文学研究的历史意识,现代意义上的文学史观念在这场影响深远的论争中初见端倪。从18世纪晚期到19世纪初,由于席勒、弗·施莱格尔和赫尔德等人的介入,文学史研究逐渐变得复杂和成熟
android 更改窗口的层次,浮窗开发之窗口层级 Ms.Bu android 更改窗口的层次
最近在项目中遇到了这样的需求：需要在特定的其他应用之上悬浮自己的UI交互(拖动、输入等复杂的UI交互)，和九游的浮窗类似，不过我们的比九游的体验更好，我们越过了很多授权的限制。浮窗效果很多人都知道如何去实现一个简单的浮窗，但是却很少有人去深入的研究背后的流程机制，由于项目中浮窗交互比较复杂，遇到了些坑查看了很多资料，故总结浮窗涉及到的知识点：窗口层级关系(浮窗是如何“浮”的)？浮窗有哪些限制，如何
Python多线程实现大规模数据集高效转移 sand&wich 网络 python 服务器
背景在处理大规模数据集时，通常需要在不同存储设备、不同服务器或文件夹之间高效地传输数据。如果采用单线程传输方式，当数据量非常大时，整个过程会非常耗时。因此，通过多线程并行处理可以大幅提升数据传输效率。本文将分享一个基于Python多线程实现的高效数据传输工具，通过遍历源文件夹中的所有文件，将它们移动到目标文件夹。工具和库这个数据集转移工具主要依赖于以下Python标准库：os：用于文件系统操作，如
COCO 格式的数据集转化为 YOLO 格式的数据集 QYQY77 YOLO python
"""--json_path输入的json文件路径--save_path保存的文件夹名字，默认为当前目录下的labels。"""importosimportjsonfromtqdmimporttqdmimportargparseparser=argparse.ArgumentParser()parser.add_argument('--json_path',default='./instances
绝招曝光！3小时高效利用ChatGPT写出精彩论文 kkai人工智能 chatgpt 人工智能 ai 学习媒体
在这份指南中，我将深入解析如何利用ChatGPT4.0的高级功能，指导整个学术研究和写作过程。从初步探索研究主题，到撰写结构严谨的学术论文，我将一步步展示如何在每个环节中有效运用ChatGPT。如果您还未使用PLUS版本，可以参考相关教程。**初步探索与主题的确定**起初，我处于庞大的知识领域中，寻找一个可深入研究的领域。ChatGPT如同灯塔，通过深入分析最新研究趋势和领域热点，帮助我在广阔的学
yolov5＞onnx＞ncnn＞apk 图像处理大大大大大牛啊 opencv实战代码讲解 yolo onnx ncnn 安卓
一.yolov5pt模型转onnx条件：colabnotebookyolov51.安装环境!pipinstallonnx>=1.7.0#forONNXexport!pipinstallcoremltools==4.0#forCoreMLexport!pipinstallonnx-simplifier2.修改common.py在classFocus下面
自动写论文的网站推荐这5款实用类工具小猪包333 写论文人工智能深度学习计算机视觉 AI写作
在当今学术研究和写作领域，AI论文写作工具的出现极大地提高了写作效率和质量。这些工具不仅能够帮助研究人员快速生成论文草稿，还能进行内容优化、查重和排版等操作。以下是五款实用类工具推荐，特别是千笔-AIPassPaper。1.千笔-AIPassPaper千笔-AIPassPaper是一款功能强大且全面的AI论文写作助手，用户只需输入基本的研究需求和关键词，便能迅速生成一篇完整的论文。该工具利用先进的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI论文写作推荐哪个好？分享5款AI论文写作带数据图表网站小猪包333 写论文人工智能深度学习计算机视觉
在当今学术研究和写作领域，AI论文写作工具的出现极大地提高了写作效率和质量。这些工具不仅能够帮助研究人员快速生成论文草稿，还能进行内容优化、查重和排版等操作。以下是五款推荐的AI论文写作工具，包括千笔-AIPassPaper。千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文写作助手，旨在帮助用户快速生成高质量的论文内容。AI论文，免费大纲，10分钟3万字https:
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
6.0 践行打卡 D47 星月格格
去努力改变1.运动步行13000+8分钟腿部拉伸2.阅读《墨菲定律》第三章第三节:霍桑效应～适度发泄，才能轻装上阵“霍桑效应”这一概念，源自于1924年一个1933年间以哈佛大学心理专家乔治·埃尔顿·梅奥教授为首进行的一系列工厂工人的谈话实验研究。“霍桑效应”告诉我们，在工作，生活中总会产生数不清的情绪反应，其中很大一部分是负面的负面情绪的积累会影响人的精神和心情，不仅仅会影响个人健康，还会破坏人
干货|自我介绍这三个坑，99%的概率你踩过！夏麦生命的魔术师
自我介绍——每个人都需要的一张名片。图片源自网络从2018年到现在，在做演讲俱乐部的2年时间里，我在演讲活动现场听过1000+人的自我介绍，自我介绍做得超棒的人真不多！最近，我花了近几个月时间，仔细研究了500+人线上场景的自我介绍，发现优秀的自我介绍也不多！为什么做一张优秀的自我介绍就这么难呢？这个问题，在我帮几十个人打造了自我介绍的过程一直困扰着我。经过了几个月的时间思考与实践，终于发现三个—
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring

Pascal Voc 2007 & 2012

1、简介

2、 官网地址

3、数据集下载

1）下载方式一 ：点击下方 链接直接下载

2）下载方式二 ： 从官网下载

4、数据集的发展 与 20个类别

1）数据集的发展

2）20个类别

5、数据分布与统计

1）Pascal VOC 2007

2）Pascal VOC 2012

6、数据集的使用

7、数据集结构

1）Pascal VOC 2007

2）Pascal VOC 2012

3）2007 和 2012 数据结构的区别

8、标注文件结构

（1）目标检测 标注文件 Annotation

（2）语义分割标注图像 SegmentationClass

（3）实例分割标注图像 SegmentationObject

（4）人体布局 Human Layout

（5）动作识别 Action Classification

9、数据集解析 - 目标检测任务

10、Reference

你可能感兴趣的:(#,数据集研究,计算机视觉,深度学习,YOLO)

2、官网地址

1）下载方式一：点击下方链接直接下载

2）下载方式二：从官网下载

4、数据集的发展与 20个类别

（1）目标检测标注文件 Annotation