HIT_Vanni

图像处理及深度学习开源数据集大全（四万字呕心沥血整理）

13大类 150个图像处理和深度学习开源数据集

1. 目标检测（detection）
2. 人脸（face）
3. 文本识别（textg recongition）
4. 图像分类（image classification）
5. 缺陷检测（defect detection）
6. 医学影像（medical image）
7. 图像分割（image segmentation）
8. 图像去雾（images defogging）
9. 关键点检测（key point detection）
10. 动作识别（action recognition）
11. 姿态估计（pose estimation）
12. 自动驾驶（automatic drive）
13. RGB-T

本文整理了150 余个深度学习和图像处理领域的开源数据集，包括：目标检测、人脸识别、文本识别、图像分类、缺陷检测、医学影像、图像分割、图像去雾、关键点检测、动作识别、姿态估计、自动驾驶、RGBT共13个方向。

1. 目标检测（detection）

T-LESS数据集
类型：目标检测
数量：39000
数据集下载地址：http://cmp.felk.cvut.cz/t-less/
说明：
T-LESS 是被用于无纹理对象检测和 6D 姿态估计的 RGB-D 数据集，其被用于无纹理刚体对象 6D 姿态的估计。
这套数据集拥有 30 个不同行业的对象，由于没有明显的纹理、可辨别的颜色和反射特性，因此物体在形状和尺寸上表现出对称性和相似性。
该数据集还包括利用三个同步传感器捕获的训练图像，数据源包括结构光、RGB-D 传感器和高分辨率相机，每个传感器有大约 39k 的训练图像以及 10k 的测试图像。
H²O 行人交互检测数据集
类型：目标检测
数量：10300
数据集下载地址：https://kalisteo.cea.fr/wp-content/uploads/2021/12/README_H2O.html
说明：
H²O由V-COCO数据集中的10301张图像组成，其中添加了3635张图像，这些图像主要包含人与人之间的互动。所有的H²O图像都用一种新的动词分类法进行了注释，包括人与物和人与人之间的互动。该分类法由51个动词组成，分为5类。
SpotGarbage垃圾识别数据集
类型：目标检测
数量：2560
数据集下载地址：https://github.com/spotgarbage/spotgarbage-GINI
说明：
图像中的垃圾（GINI）数据集是SpotGarbage引入的一个数据集，包含2561张图像，956张图像包含垃圾，其余的是在各种视觉属性方面与垃圾非常相似的非垃圾图像。
NAO自然界对抗样本数据集
类型：目标检测
数量：7934
数据集下载地址：https://arxiv.org/pdf/2111.04204v1.pdf
说明：
NAO包含7934张图像和9943个对象，这些图像未经修改，代表了真实世界的场景，但会导致最先进的检测模型以高置信度错误分类。与标准MSCOCO验证集相比，在NAO上评估时，EfficientDet-D7的平均精度（mAP）下降了74.5%。
Labelme 图像数据集
类型：目标检测
数量：1000
数据集下载地址：https://www.cvmart.net/dataSets/labelme2.csail.mit.edu
说明：
Labelme Dataset 是用于目标识别的图像数据集，涵盖 1000 多个完全注释和 2000 个部分注释的图像，其中部分注释图像可以被用于训练标记算法，测试集拥有来自于世界不同地方拍摄的图像，这可以保证图片在续联和测试之间会有较大的差异。
印度车辆数据集
类型：目标检测
数量：
数据集下载地址：https://www.kaggle.com/datasets/dataclusterlabs/indian-vehicle-dataset
说明：
该数据集包括小众印度车辆的图像，如Autorikshaw、Tempo、卡车等。该数据集由用于分类和目标检测的小众印度车辆图像组成。据观察，这些小众车辆（如autorickshaw、tempo、trucks等）上几乎没有可用的数据集。这些图像是在白天、晚上和晚上的不同天气条件下拍摄的。该数据集具有各种各样的照明、距离、视点等变化。该数据集代表了一组非常具有挑战性的利基类车辆图像。该数据集可用于驾驶员辅助系统、自动驾驶等的图像识别和目标检测。
Seeing 3D chairs椅子检测模型
类型：目标检测
数量：1000
数据集下载地址：https://www.di.ens.fr/willow/research/seeing3Dchairs/
说明：
椅子数据集包含大约1000个不同三维椅子模型的渲染图像。
SUN09场景理解数据集
类型：目标检测
数量：12000
数据集下载地址：http://people.csail.mit.edu/myungjin/HContext.html
说明：
SUN09数据集包含12000个带注释的图像，其中包含200多个对象类别。它由自然、室内和室外图像组成。每个图像平均包含7个不同的注释对象，每个对象的平均占用率为图像大小的5%。对象类别的频率遵循幂律分布。发布者使用 397 个采样良好的类别进行场景识别，并以此搭配最先进的算法建立新的性能界限。
Unsplash图片检索数据集
类型：目标检测
数量：
数据集下载地址：https://unsplash.com/data
说明：
使用迄今为止公开共享的全球最大的开放检索信息数据集。是由250000多名摄影师和数以千计的应用程序、用途和上下文的数十亿次搜索创建的，包含了数十亿次照片搜索的信息和对应的照片信息。由于Unsplash数据集中包含广泛的意图和语义，它为研究和学习提供了新的机会。
HICO-DET人物交互检测数据集
类型：目标检测
数量：47776
数据集下载地址：https://soda-2d.github.io/download.html
说明：
HICO-DET是一个用于检测图像中人-物交互（HOI）的数据集。它包含47776幅图像（列车组38118幅，测试组9658幅），600个HOI类别，由80个宾语类别和117个动词类别构成。HICO-DET提供了超过150k个带注释的人类对象对。V-COCO提供了10346张图像（2533张用于培训，2867张用于验证，4946张用于测试）和16199人的实例。
上海科技大学人群统计数据集
类型：目标检测
数量：1198
数据集下载地址：https://github.com/desenzhou/ShanghaiTechDataset
说明：
上海科技数据集是一个大规模的人群统计数据集。它由1198张带注释的群组图像组成。
数据集分为两部分，A部分包含482张图像，B部分包含716张图像。A部分分为训练和测试子集，分别由300和182张图像组成。B部分分为400和316张图像组成的序列和测试子集。群组图像中的每个人都有一个靠近头部中心的点进行注释。总的来说，该数据集由33065名带注释的人组成。A部分的图像是从互联网上收集的，而B部分的图像是在上海繁忙的街道上收集的。
DOTA航拍图像数据集
类型：目标检测
数量：1793658
数据集下载地址：https://captain-whu.github.io/DOTA/dataset.html
说明：
DOTA是用于航空图像中目标检测的大型数据集。它可以用于开发和评估航空图像中的目标探测器。这些图像是从不同的传感器和平台收集的。每个图像的大小在800×800到20000×20000像素之间，包含显示各种比例、方向和形状的对象。DOTA图像中的实例由航空图像解释专家通过任意（8 d.o.f.）四边形进行注释。
DOTA-v1.0包含15个常见类别、2806个图像和188282个实例。DOTA-v1.0中训练集、验证集和测试集的比例分别为1/2、1/6和1/3。
DOTA-v2.0收集更多谷歌地球、GF-2卫星和航空图像。DOTA-v2.0中有18个常见类别、11268个图像和1793658个实例。
生活垃圾数据集
类型：目标检测
数量：9000
数据集下载地址：https://www.kaggle.com/datasets/dataclusterlabs/domestic-trash-garbage-dataset
说明：
该数据集是一组极具挑战性的原始垃圾/垃圾图像，共有9000多张，这些图像来自2000多个城市和农村地区。
图像是在各种照明条件、天气、室内和室外条件下拍摄的。该数据集可用于制作垃圾/垃圾检测模型、环保替代建议、碳足迹生成等。
火焰和烟雾图像数据集
类型：目标检测
数量：7000
数据集下载地址：https://www.kaggle.com/datasets/dataclusterlabs/fire-and-smoke-dataset
说明：
该数据集由早期火灾和烟雾的图像数据集组成。数据集由在真实场景中使用手机拍摄的早期火灾和烟雾图像组成。大约有7000张图像数据。图像是在各种照明条件（室内和室外场景）、天气等条件下拍摄的。该数据集非常适合早期火灾和烟雾探测。
数据集可用于火灾和烟雾识别、检测、早期火灾和烟雾、异常检测等。数据集还包括典型的家庭场景，如垃圾焚烧、纸塑焚烧、田间作物焚烧、家庭烹饪等。
全球小麦检测数据集
类型：目标检测
数量：4700
数据集下载地址：https://www.kaggle.com/c/global-wheat-detection/data
说明：
检测小麦穗是一项重要任务，可以估计相关性状，包括穗种群密度和穗特征，如卫生状况、大小、成熟阶段和芒的存在。
本数据集包含 4,700 张高分辨率 RGB 图像和 190,000 个标记的小麦头，这些小麦头采集自世界各地不同生长阶段的不同基因型的多个国家。
坑洼检测数据集
类型：目标检测
数量：700
数据集下载地址：https://www.kaggle.com/datasets/chitholian/annotated-potholes-dataset
说明：
本数据集汇总了700个在坑洼处带有3K +注释的图像，用于从道路图像中检测坑洼，检测道路地形和坑洼。
Linkopings交通标志数据集
类型：目标检测
数量：20000
数据集下载地址：http://www.cvl.isy.liu.se/research/datasets/traffic-signs-dataset/
说明：
通过记录超过 350 公里的瑞典高速公路和城市道路的序列，创建了一个数据集。
一个 1.3 兆像素的彩色摄像机，一个点灰色变色龙，被放置在一辆汽车的仪表板上，从前窗向外看。摄像头略微指向右侧，以便尽可能多地覆盖相关标志。该镜头的焦距为 6.5 毫米，视野约为 41 度。高速公路上的典型速度标志大约为 90 cm 宽，如果要在大约 30 m 的距离处检测到它们，则对应于大约 50 像素的大小。总共记录了超过 20 000 帧，其中每五帧被手动标记。每个标志的标签包含标志类型（人行横道、指定车道右侧、禁止站立或停车、优先道路、让路、50 公里/小时或 30 公里/小时）、能见度状态（遮挡、模糊或可见）和道路状态（是否标志是在正在行驶的道路上或在小路上）。
防护装备-头盔和背心检测
类型：目标检测
数量：
数据集下载地址：https://github.com/ciber-lab/pictor-ppe
说明：
包含 774 个人群图像和 698 个网络挖掘图像。人群和网络挖掘的图像分别包含 2,496 和 2,230 个工人实例。
水下垃圾检测数据集
类型：目标检测
数量：5700
数据集下载地址：https://conservancy.umn.edu/handle/11299/214366
说明：
该数据来自 J-EDI 海洋垃圾数据集。构成该数据集的视频在质量、深度、场景中的对象和使用的相机方面差异很大。它们包含许多不同类型的海洋垃圾的图像，这些图像是从现实世界环境中捕获的，提供了处于不同衰减、遮挡和过度生长状态的各种物体。此外，水的清晰度和光的质量因视频而异。这些视频经过处理以提取 5,700 张图像，这些图像构成了该数据集，所有图像都在垃圾实例、植物和动物等生物对象以及 ROV 上标有边界框。
小目标检测数据集
类型：目标检测
数量：800
数据集下载地址：http://visal.cs.cityu.edu.hk/downloads/smallobjects/
说明：
从Internet（例如YouTube或Google）上的图像/视频收集的四个小物体数据集，包括4种类型的图像，可用于小物体目标检测的研究。
数据集包含四类：
fly：飞行数据集，包含600个视频帧，平均每帧86±39个物体（648×72 @ 30 fps）。32张图像用于训练（1：6：187），50张图像用于测试（301：6：600）。
honeybee：蜜蜂数据集，包含118张图像，每张图像平均有28±6个蜜蜂（640×480）。数据集被平均分配用于训练和测试集。仅前32张图像用于训练。
seagull：海鸥数据集，包含三个高分辨率图像（624×964），每个图像平均有866±107个海鸥。第一张图片用于训练，其余图片用于测试。
fish：鱼数据集，包含387帧视频数据，平均每帧56±9条鱼（300×410 @ 30 fps）。32张图像进行训练（1：3：94），65张图像进行测试（193：3：387）。
AI-TOD航空图像数据集
类型：目标检测
数量：28000
数据集下载地址：https://github.com/jwwangchn/AI-TOD
说明：
AI-TOD 在 28,036 张航拍图像中包含 8 个类别的 700,621 个对象实例。与现有航拍图像中的目标检测数据集相比，AI-TOD 中目标的平均大小约为 12.8 像素，远小于其他数据集。
iSAID航空图像大规模数据集
类型：目标检测
数量：2800
数据集下载地址：https://captain-whu.github.io/iSAID/dataset.html
说明：
iSAID 是第一个用于航空图像实例分割的基准数据集。这个大规模和密集注释的数据集包含 2,806 张高分辨率图像的 15 个类别的 655,451 个对象实例。
TinyPerson数据集
类型：目标检测
数量：1600
数据集下载地址：https://github.com/ucas-vg/PointTinyBenchmark/tree/master/dataset
说明：
在 TinyPerson 中有 1610 个标记图像和 759 个未标记图像（两者主要来自同一视频集），总共有 72651 个注释。
Deepscores 数据集
类型：目标检测
数量：1600
数据集下载地址：https://tuggeluk.github.io/deepscores/
说明：
DeepScores 包含高质量的乐谱图像，分为 300 0 000 张书面音乐，其中包含不同形状和大小的符号。
拥有近一亿个小对象，这使得我们的数据集不仅独一无二，而且是最大的公共数据集。DeepScores 带有用于对象分类、检测和语义分割的基本事实。因此，DeepScores 总体上对计算机视觉提出了相关挑战，超出了光学音乐识别 (OMR) 研究的范围。
密集行人检测数据集
类型：目标检测
数量：13,382
数据集下载地址：http://www.cbsr.ia.ac.cn/users/sfzhang/WiderPerson/
说明：
WiderPerson 数据集是野外行人检测基准数据集，其图像选自广泛的场景，不再局限于交通场景。我们选择了 13,382 张图像并标记了大约 400K 带有各种遮挡的注释。我们随机选择 8000/1000/4382 图像作为训练、验证和测试子集。与 CityPersons 和 WIDER FACE 数据集类似，我们不发布测试图像的边界框基本事实。
加州理工学院行人检测数据集
类型：目标检测
数量：13,382
数据集下载地址：http://www.vision.caltech.edu/Image_Datasets/CaltechPedestrians/
说明：
加州理工学院行人数据集由大约 10 小时的 640x480 30Hz 视频组成，该视频取自在城市环境中通过常规交通行驶的车辆。注释了大约 250,000 帧（在 137 个大约分钟长的片段中），总共 350,000 个边界框和 2300 个独特的行人。注释包括边界框和详细的遮挡标签之间的时间对应关系。
NWPU VHR-10卫星图像数据集
类型：目标检测
数量：800
数据集下载地址：http://www.escience.cn/people/gongcheng/NWPU-VHR-10.html
说明：
NWPU VHR-10 Dataset 是一个用于空间物体检测的 10 级地理遥感数据集，其拥有 650 张包含目标的图像和 150 张背景图像，共计 800 张，目标种类包括飞机、舰船、油罐、棒球场、网球场、篮球场、田径场、港口、桥梁和汽车共计 10 个类别。
Inria 航空影像数据集
类型：目标检测
数量：800
数据集下载地址：https://project.inria.fr/aerialimagelabeling/
说明：
Inria 航空影像标注解决了遥感中的一个核心主题：航空影像的自动像素级标注。
数据集覆盖面积 810 平方公里（405 平方公里用于训练，405 平方公里用于测试）
空间分辨率为 0.3 m 的航空正射校正彩色图像
这些图像涵盖了不同的城市住区，从人口稠密的地区到高山城镇。
RSOD遥感图像数据集
类型：目标检测
数量：800
数据集下载地址：https://github.com/RSIA-LIESMARS-WHU/RSOD-Dataset-
说明：
一个开放的遥感图像目标检测数据集。数据集包括飞机、油箱、游乐场和立交桥。此数据集的格式为PASCAL VOC。数据集包括4个文件，每个文件用于一种对象。
飞机数据集，446张图片中有4993架飞机。
操场，189张图片中的191个操场。
天桥，176张图片中的180座天桥。
油箱，165张图片中的1586个油箱。
EDS 数据集
类型：目标检测
数量：14219
数据集下载地址： https://github.com/DIG-Beihang/PSN
说明：
EDS 数据集针对由机器硬件参数引起的难以察觉的域间偏移问题研究，包含了来自 3 台不同 X 光机器的 14219 张图片, 其中 10 类物品, 共计 31655 个目标实例，均由专业标注人员进行标注。
多显著性对象数据集
类型：目标检测
数量：1224
数据集下载地址：https://www.kaggle.com/datasets/jessicali9530/mso-dataset
说明：
本数据集共有 1224 张图像来自四个公共图像数据集：COCO、VOC07、ImageNet 和 SUN。Amazon Mechanic Turk 工作人员将每个图像标记为包含 0、1、2、3 或 4 个以上的显着对象。可以在imgIdx.mat中找到此标签信息以及边界框注释，一个存储图像信息的matlab结构数组。MSO 数据集是 SOS 数据集测试集的子集。波士顿大学的团队删除了一些显着对象严重重叠或者对于标记指定数量的显着对象不明确的图像。因此，在来自 SOS 测试集的 1380 张图像中，只剩下 1224 张图像。MSO 数据集中超过一半的图像包含零个显着对象或多个显着对象。这旨在提供更真实的设置来评估显着对象检测方法。
足球和板球数据集
类型：目标检测
数量：
数据集下载地址：https://www.kaggle.com/datasets/mlwhiz/detection-footballvscricketball
说明：
该数据集包含YOLO格式的足球和板球的注释图像，为Open Image Dataset 的一个子集。
交通摄像头检测数据集
类型：目标检测
数量：
数据集下载地址：https://www.kaggle.com/datasets/ryankraus/traffic-camera-object-detection
说明：
该数据集是来自伊利诺伊州芝加哥市交通摄像头的增强随机屏幕截图的集合。在数据中，所有车辆都被标记在一个名为的类别中 car。标签由边界框组成，并以 YOLOv5 PyTorch 格式存储。
船只类型数据集
类型：目标检测
数量：1500
数据集下载地址：https://www.kaggle.com/datasets/clorichel/boat-types-recognition
说明：
大约 1,500 张不同大小的船图片，但按不同类型分类：浮标、游轮、渡船、货船、贡多拉、充气船、皮划艇、纸船、帆船。
火星/月球陨石坑探测数据集
类型：目标检测
数量：
数据集下载地址：https://www.kaggle.com/datasets/lincolnzh/martianlunar-crater-detection-dataset
说明：
数据集主要包含图像数据和标签。
图像数据：可能包含陨石坑的火星和月球表面图像。数据源混杂。对于火星图像，图像主要来自 ASU 和 USGS；目前所有月球图像都来自美国宇航局月球勘测轨道器任务。所有图像均使用 RoboFlow 进行预处理。
标签：每个图像都有其关联的 YOLOv5 文本格式的标签文件。标注工作由我们自己完成，主要用于物体检测。
无人机检测数据集
类型：目标检测
数量：1962
数据集下载地址：https://www.kaggle.com/datasets/nelyg8002000/uav-detection-dataset-images
说明：
该数据集包含 1962 个 jpg 无人机图像，可以用于图像分类。
优点：所有图像都经过清理、裁剪、重复删除、劣质质量删除等。
缺点：图片为不同的尺寸。
COCO2017数据集
类型：目标检测
数量：158000
数据集下载地址：https://github.com/cocodataset/cocoapi
说明：
COCO是微软团队提供的一个可以用来进行图像识别的大型图像数据集，用于对象检测、分割、人员关键点检测、素材分割和字幕生成。
CoCo数据集一共有五种标注类型：目标检测，关键点检测，素材分割，全景分割，图像说明
COCO2017是2017年发布的COCO数据集的一个版本，共 80 小类，主要用于在2017年后持有的物体检测任务、关键点检测任务和全景分割任务。

2. 人脸（face）

GENKI 人脸图像数据集
类型：人脸
数量：15000
数据集下载地址：https://inc.ucsd.edu/mplab/398.php
说明：
GENKI数据集是由加利福尼亚大学的机器概念实验室收集。该数据集包含GENKI-R2009a,GENKI-4K,GENKI-SZSL三个部分。GENKI-R2009a包含11159个图像，GENKI-4K包含4000个图像，分为“笑”和“不笑”两种，每个图片的人脸的尺度大小，姿势，光照变化，头的转动等都不一样，专门用于做笑脸识别。GENKI-SZSL包含3500个图像，这些图像包括广泛的背景，光照条件，地理位置，个人身份和种族等。
哥伦比亚大学公众人物脸部数据库
类型：人脸
数量：58,797
数据集下载地址：https://www.cs.columbia.edu/CAVE/databases/pubfig/
说明：
PubFig Dataset 是一个大型人脸数据集，主要用于人脸识别和身份鉴定，其涵盖互联网上 200 人的 58,797 张图像，不同于大多数现有面部数据集，这些图像是在主体完全不受控制的情况下拍摄的，因此不同图像中姿势、光照、表情、场景、相机、成像条件和参数存在较大差异，该数据集类似于 UMass-Amherst 创建的 LFW 数据集。
CelebA 人脸数据集
类型：人脸
数量：200000
数据集下载地址：http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html
说明：
CelebFaces Attributes Dataset (CelebA) 是一个大规模的人脸属性数据集，包含超过 20 万张名人图像，每张都有 40 个属性注释。该数据集中的图像涵盖了较大的姿势变化和杂乱的背景。CelebA 种类多、数量多、注释丰富，包括10,177 个身份，202,599 张人脸图像，以及5 个地标位置，每张图像 40 个二进制属性注释。
该数据集可用作以下计算机视觉任务的训练和测试集：人脸属性识别、人脸识别、人脸检测、地标（或人脸部分）定位以及人脸编辑与合成。
美国国防部人脸库
类型：人脸
数量：10000
数据集下载地址：https://www.nist.gov/itl/products-and-services/color-feret-database
说明：
为促进人脸识别算法的研究和实用化，美国国防部的Counterdrug Technology Transfer Program(CTTP)发起了一个人脸识别技术(Face Recognition Technology 简称FERET)工程，它包括了一个通用人脸库以及通用测试标准。到1997年，它已经包含了1000多人的10000多张照片，每个人包括了不同表情，光照，姿态和年龄的照片。
MTFL人脸识别数据集
类型：人脸
数量：12995
数据集下载地址：http://mmlab.ie.cuhk.edu.hk/projects/TCDCN.html
说明：
该数据集包含 12,995 张人脸图像，这些图像用 (1) 五个面部标志，(2) 性别、微笑、戴眼镜和头部姿势的属性进行了注释。
BioID人脸数据集
类型：人脸
数量：1521
数据集下载地址：https://www.bioid.com/facedb/
说明：
这个数据集包含了1521幅分辨率为384x286像素的灰度图像。每一幅图像来自于23个不同的测试人员的正面角度的人脸。为了便于做比较，这个数据集也包含了对人脸图像对应的手工标注的人眼位置文件。
PersonID人脸识别数据集
类型：人脸
数量：
数据集下载地址：https://cvhci.anthropomatik.kit.edu/~baeuml/publications/semi-supervised-learning-with-constraints-for-person-identification-in-multimedia-data/
说明：
该数据集所选用的人脸照片均来自于两部比较知名的电视剧，《吸血鬼猎人巴菲》和《生活大爆炸》。
CMU PIE人脸库
类型：人脸
数量：40000
数据集下载地址：http://vasc.ri.cmu.edu/idb/html/face/index.html
说明：
CMU PIE人脸库建立于2000年11月，它包括来自68个人的40000张照片，其中包括了每个人的13种姿态条件，43种光照条件和4种表情下的照片，现有的多姿态人脸识别的文献基本上都是在CMU PIE人脸库上测试的。
Youtube视频人脸数据集
类型：人脸
数量：3425
数据集下载地址：http://www.cs.tau.ac.il/~wolf/ytfaces/
说明：
该数据集包含 1,595 个不同人的 3,425 个视频。所有视频都是从 YouTube 下载的。每个主题平均有 2.15 个视频可用。最短剪辑时长为 48 帧，最长剪辑为 6070 帧，视频剪辑的平均长度为 181.3 帧。在这个数据集下，算法需要判断两段视频里面是不是同一个人。
CASIA 人脸图像数据集
类型：人脸
数量：2500
数据集下载地址：http://biometrics.idealtest.org/dbDetailForUser.do?id=9#/
说明：
CASIA 人脸图像数据库版本 5.0（或 CASIA-FaceV5）包含 500 个对象的 2,500 个彩色人脸图像。CASIA-FaceV5 的面部图像是使用罗技 USB 摄像头在一个会话中捕获的。CASIA-FaceV5的志愿者包括研究生、工人、服务员等。所有人脸图像均为16位彩色BMP文件，图像分辨率为640*480。典型的类内变化包括照明、姿势、表情、眼镜、成像距离等。
Caltech人脸数据库
类型：人脸
数量：10,524
数据集下载地址：http://www.vision.caltech.edu/Image_Datasets/Caltech_10K_WebFaces/#Description
说明：
该数据集包含通过在谷歌图片搜索中输入常见的名字从网络上收集的人的图像。每个正面的眼睛、鼻子和嘴巴中心的坐标在地面实况文件中提供。此信息可用于对齐和裁剪人脸或作为人脸检测算法的基本事实。该数据集有 10,524 个不同分辨率和不同设置的人脸，例如肖像图像、人群等。侧面或非常低分辨率的面孔未标记。
RMFD口罩遮挡人脸数据集
类型：人脸
数量：90000
数据集下载地址：https://github.com/X-zhangyang/Real-World-Masked-Face-Dataset
说明：
RMFRD目前是世界上最大的真实口罩遮挡人脸数据集。
提出了三种类型的口罩遮挡人脸数据集，包括口罩遮挡人脸检测数据集（MFDD），真实口罩遮挡人脸识别数据集（RMFRD）和模拟口罩遮挡人脸识别数据集（SMFRD）。
这些数据集可供工业界和学术界免费使用，基于这些数据集，可以开发口罩遮挡人脸的各种应用。
(1) 真实口罩人脸识别数据集：从网络爬取样本，经过整理、清洗和标注后，含525人的5千张口罩人脸、9万正常人脸。
(2) 模拟口罩人脸识别数据集：给公开数据集中的人脸戴上口罩，得到1万人、50万张人脸的模拟口罩人脸数据集。
(3)真实口罩人脸验证数据集，包括426个人的4015张人脸图像，组合成3589对相同身份和3589对不同身份的人脸样本对（口罩人脸/正常人脸）。
IMDB-WIKI人脸数据集
类型：人脸
数量：524230
数据集下载地址：https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/
说明：
IMDB-WIKI 500k+ 是一个包含名人人脸图像、年龄、性别的数据集，图像和年龄、性别信息从 IMDB 和 WiKi 网站抓取，总计 524230 张名人人脸图像及对应的年龄和性别。其中，获取自 IMDB 的 460723 张，获取自 WiKi 的 62328 张。
WiderFace人脸检测数据集
类型：人脸
数量：32203
数据集下载地址：http://shuoyang1213.me/WIDERFACE/
说明：
WIDER FACE数据集是人脸检测的一个benchmark数据集，包含32203图像，以及393,703个标注人脸，其中，158,989个标注人脸位于训练集，39,496个位于验证集。每一个子集都包含3个级别的检测难度：Easy，Medium，Hard。这些人脸在尺度，姿态，光照、表情、遮挡方面都有很大的变化范围。WIDER FACE选择的图像主要来源于公开数据集WIDER。制作者来自于香港中文大学，他们选择了WIDER的61个事件类别，对于每个类别，随机选择40%10%50%作为训练、验证、测试集。
LFW 人像图像数据集
类型：人脸
数量：1680
数据集下载地址：http://vis-www.cs.umass.edu/lfw/#explore
说明：
该数据集是用于研究无约束面部识别问题的面部照片数据库。数据集包含从网络收集的13000多张图像。每张脸都贴上了所画的人的名字，图片中的1680人在数据集中有两个或更多不同的照片。

3. 文本识别（textg recongition）

53.文档影印和内容数据
类型：文本识别
数量：
数据集下载地址： http://www.mediateam.oulu.fi/downloads/MTDB/
说明：
MediaTeam Oulu Document 数据集是一个文档扫描图像和文档内容数据集，包含 500篇 1975年之前的文档信息。
54. CASIA手写数据集
类型：文本识别
数量：56,469
数据集下载地址：http://www.nlpr.ia.ac.cn/databases/handwriting/Touching_Characters_Databases.html
说明：
CASIA-HWDB-T包括56,469个二字或多字触摸字符串，其中1,818个字符串有多个触摸字符。作者还将接触字符串划分为 50,157 个全中文字符串、2,788 个全数字字符串、328 个全字母字符串和 3,196 个混合字符字符串。所有的字符串都标注了字符类、触摸点的位置以及字符串高度和平均笔画宽度等辅助值
55. Twitter地理定位信息数据集
类型：文本识别
数量：115,886
数据集下载地址：https://archive.org/details/twitter_cikm_2010
说明：
该数据集是与学术项目协调使用的公共推特更新的集合，用于研究与推特相关的地理定位数据。训练集包含 115,886 个 Twitter 用户和来自用户的 3,844,612 个更新。用户的所有位置都在美国以城市级粒度进行自我标记。测试集包含 5,136 个 Twitter 用户和来自用户的 5,156,047 条推文。用户的所有位置都是从他们的智能手机以“UT：纬度，经度”的形式上传的
56. 专利短语数据集
类型：文本识别
数量：
数据集下载地址：该数据集是为美国专利短语到短语匹配竞赛提供的。它通过提供context列中每个代码的含义来添加附加信息
说明：
该数据集是为美国专利短语到短语匹配竞赛提供的。它通过提供context列中每个代码的含义来添加附加信息
57. 电影元数据
类型：文本识别
数量：700000
数据集下载地址：https://www.kaggle.com/datasets/akshaypawar7/millions-of-movies
说明：
这些文件包含 TMDB 数据集中列出的超过 700,000 部电影的元数据。数据集每天更新以确保更新电影数据集。数据点包括演员、工作人员、情节关键词、预算、收入、海报、发布日期、语言、制作公司、国家、TMDB 投票计数和投票平均值、评论、推荐。
58. Olist 电子商务公共数据集
类型：文本识别
数量：100000
数据集下载地址：https://www.kaggle.com/datasets/olistbr/brazilian-ecommerce
说明：
这是在Olist Store下订单的巴西电子商务公共数据集。该数据集包含 2016 年至 2018 年在巴西多个市场进行的 10 万份订单的信息。它的功能允许从多个维度查看订单：从订单状态、价格、付款和货运绩效到客户位置、产品属性，最后是客户撰写的评论。这是真实的商业数据，已匿名，评论文本中对公司和合作伙伴的引用已替换为《权力的游戏》大家族的名称。
59. Top1000的Github存储库数据集
类型：文本识别
数量：
数据集下载地址：https://www.kaggle.com/datasets/anshulmehtakaggl/top-1000-github-repositories-for-multiple-domains
说明：
关于 Github 上的 1000 个最受欢迎的关键字存储库的详尽数据

4. 图像分类（image classification）

MNIST 手写数字图像数据集
类型：分类
数量：70000
数据集下载地址： http://yann.lecun.com/exdb/mnist/
说明：
MNIST数据集是一个手写阿拉伯数字图像识别数据集，图片分辨率为 20x20 灰度图图片，包含‘0 - 9’ 十组手写手写阿拉伯数字的图片。其中，训练样本 60000 ，测试样本 10000，数据为图片的像素点值，作者已经对数据集进行了压缩。
GTSRB德国交通标志数据集
类型：分类
数量：50000
数据集下载地址：https://benchmark.ini.rub.de/gtsrb_news.html
说明：
德国交通标志基准测试是在 2011 年国际神经网络联合会议 (IJCNN) 上举办的多类单图像分类挑战赛。
该数据集收集了超过 50,000 个交通标志图像的全面、逼真的数据集。它反映了由于距离、照明、天气条件、部分遮挡和旋转而导致的标志视觉外观的强烈变化。
该数据集包含 43 个类别频率不平衡的类别。参与者必须对两个测试集进行分类，每个测试集超过 12,500 张图像。
Winegrape检测数据集
类型：分类
数量：300
数据集下载地址：https://github.com/thsant/wgisd
说明：
WGISD是为了提供图像和注释来研究对象检测和实例分割，用于葡萄栽培中基于图像的监测和现场机器人技术。它提供了来自五种不同葡萄品种的实地实例。这些实例显示了葡萄姿势、光照和焦点的变化，包括遗传和物候变化，如形状、颜色和紧实度。可能的用途包括放宽实例分割问题：分类（图像中是否有葡萄？）、语义分割（图像中的“葡萄像素”是什么？）、对象检测（图像中的葡萄在哪里？）、和计数（每个簇有多少浆果？）。
VOC2005车辆数据集
类型：图像分类
数量：
数据集下载地址：http://host.robots.ox.ac.uk/pascal/VOC/voc2005/index.html
说明：
该数据集中含有自行车、摩托车、汽车、货车的图像数据，可用于CNN模型以实现车辆识别和车辆分类，其中自行车、摩托车、汽车数据来自2005 PASCAL视觉类挑战赛（VOC2005）所使用的数据的筛选处理结果，货车图片来自网络收集，后期通过筛选处理得到。在本数据中，训练数据集与测试数据集占比约为5:1。
宠物图像数据集
类型：图像分类
数量：7350
数据集下载地址：https://www.robots.ox.ac.uk/~vgg/data/pets/
说明：
一个包含 37 个类别的宠物数据集，每个类别大约有 200 张图像。这些图像在比例、姿势和照明方面有很大的变化。所有图像都有相关的品种、头部 ROI 和像素级三元图分割的地面实况注释。
猫咪数据集
类型：图像分类
数量：9000
数据集下载地址： https://www.kaggle.com/datasets/crawford/cat-dataset
说明：
CAT 数据集包括超过 9,000 张猫图像。对于每张图像，猫的头部都有九个点的注释，眼睛两个，嘴巴一个，耳朵六个。
斯坦福狗狗数据集
类型：图像分类
数量：20,580
数据集下载地址： http://vision.stanford.edu/aditya86/ImageNetDogs/
说明：
斯坦福狗数据集包含来自世界各地的 120 种狗的图像。该数据集是使用 ImageNet 中的图像和注释构建的，用于细粒度图像分类任务。
该数据集的内容：类别数：120，图片数量：20,580，注释：类标签、边界框
Stanford 汽车图片数据
类型：图像分类
数量：16,185
数据集下载地址： ai.stanford.edu/~jkrause/cars/car_dataset.html
说明：
Cars 数据集包含 196 类汽车的 16,185 张图像。数据分为 8,144 个训练图像和 8,041 个测试图像，其中每个类别大致按 50-50 分割。课程通常在品牌、型号、年份级别，例如 2012 Tesla Model S 或 2012 BMW M3 coupe。
花卉数据集
类型：图像分类
数量：4242
数据集下载地址：https://www.kaggle.com/datasets/alxmamaev/flowers-recognition
说明：
该数据集包含 4242 张花卉图像。数据收集基于数据flicr、google images、yandex images。此数据集可用于从照片中识别植物。数据图片会分为五类：洋甘菊、郁金香、玫瑰、向日葵、蒲公英。每个种类大约有800张照片。照片分辨率不高，约为 320x240 像素。照片不会缩小到单一尺寸，它们有不同的比例。
综合汽车数据集
类型：图像分类
数量：136726
数据集下载地址：https://www.kaggle.com/datasets/renancostaalencar/compcars
说明：
该数据集是被CVPR 2015 论文“用于细粒度分类和验证的大规模汽车数据集”所使用的。综合汽车 (CompCars) 数据集包含来自两个场景的数据，包括来自网络自然和监视自然的图像。 web-nature 数据包含 163 个汽车制造商和 1,716 个汽车型号。总共有 136,726 张拍摄整车的图像和 27,618 张拍摄汽车零件的图像。完整的汽车图像标有边界框和视点。每个车型都标有五个属性，包括最大速度、排量、门数、座位数和汽车类型。监控性质的数据包含在前视图中捕获的 50,000 张汽车图像。
室内场景识别
类型：图像分类
数量：15620
数据集下载地址：https://www.kaggle.com/datasets/itsahmad/indoor-scenes-cvpr-2019
说明：
该数据集是麻省理工学院提供的原始数据。室内场景识别是高层次视觉中一个具有挑战性的开放性问题。大多数适用于室外场景的场景识别模型在室内领域表现不佳。主要困难在于，虽然一些室内场景（例如走廊）可以通过全局空间属性很好地表征，但其他的（例如书店）可以通过它们包含的对象更好地表征。
该数据库包含 67 个室内类别，共 15620 张图像。图片的数量因类别而异，但每个类别至少有 100 张图片。所有图片均为jpg格式。
90种动物图像数据集
类型：图像分类
数量：5400
数据集下载地址：https://www.kaggle.com/datasets/iamsouravbanerjee/animal-image-dataset-90-different-animals
说明：
在这个数据集中有 90 个不同类别的 5400 张动物图像。此数据集是从 Google 图片创建的。所有照片将按照其所属类别存放于各自的文件夹下。动物类别包括：羚羊，獾，蝙蝠，熊，蜜蜂，甲虫，野牛，公猪，蝴蝶，猫，毛虫，黑猩猩等。该数据集中的图像大小不固定，需要后续的处理。
标注鱼类数据集
类型：图像分类
数量：
数据集下载地址：https://swfscdata.nmfs.noaa.gov/labeled-fishes-in-the-wild/
说明：
野生图像数据集中的标记鱼类由 NOAA Fisheries（国家海洋渔业服务局）提供，以鼓励对无约束水下图像的自动图像分析算法进行开发、测试和性能评估。
该数据集包括鱼类、无脊椎动物和海床的图像，这些图像是使用部署在远程操作车辆 (ROV) 上的摄像系统收集的，用于渔业调查。
衣服数据集
类型：图像分类
数量：5000
数据集下载地址：https://www.kaggle.com/datasets/agrigorev/clothing-dataset-full
说明：
衣服数据集总共收集了 20 种衣服的 5,000 张图像。该数据集是根据公共领域许可 (CC0) 发布的。
数据集包含 20 个类，包括T 恤（1011 件），长袖（699 件），裤子（692 件），鞋子（431 件）衬衫（378 件），连衣裙（357 件），外套（312 件），短裤（308 件），帽子（171 件），裙子（155 件），西装外套（109 件）等。
用特殊标志“孩子”标记了儿童服装的图像：是童装（476 项），不是童装（4927 项）。
商标数据集
类型：图像分类
数量：167,140
数据集下载地址：https://github.com/msn199959/Logo-2k-plus-Dataset
说明：
构建了一个大规模的 logo 数据集 Logo-2K+，它涵盖了来自真实世界 logo 图像的各种 logo 类别。我们生成的徽标数据集包含 167,140 张图像，具有 10 个根类别和 2,341 个类别。
飞机数据集
类型：图像分类
数量：10000
数据集下载地址：https://www.kaggle.com/datasets/seryouxblaster764/fgvc-aircraft
说明：
数据集包含 10,000 张飞机图像，数据分为 3334 个训练图像、3333 个验证图像和 3333 个测试图像。飞机模型按四级层次结构组织。四个层次，从细到粗，分别是：
型号，例如波音 737-76J。由于某些模型在视觉上几乎无法区分，因此在评估中不使用此级别。
变体，例如波音 737-700。一个变体将所有在视觉上无法区分的模型折叠成一个类。该数据集包含 100 个不同的变体。
家庭，例如波音 737。该数据集包含 70 个不同的家族。
制造商，例如波音。该数据集包含 41 个不同的制造商。
Office-Home数据
类型：图像分类
数量：15500
数据集下载地址：https://www.hemanthdv.org/officeHomeDataset.html
说明：
Office-Home 是一个用于域适应的基准数据集，它包含 4 个域，每个域由 65 个类别组成。这四个领域是：艺术——素描、绘画、装饰等形式的艺术形象；剪贴画——剪贴画图像的集合；产品——没有背景的物体图像；和真实世界——用普通相机拍摄的物体图像。它包含 15,500 张图像，平均每个类大约 70 张图像，一个类最多 99 张图像
食物图像数据集
类型：图像分类
数量：10000
数据集下载地址：https://www.kaggle.com/datasets/kmader/food41
说明：
该数据集包含完整 food-101 数据的许多不同子集。为了给图像分析制作一个比 CIFAR10 或 MNIST 更简单的训练集，该数据包括图像的大规模缩小版本，以实现快速测试。数据已被重新格式化为 HDF5，特别是 Keras HDF5Matrix，这样可以轻松读取它们。
加州理工学院相机陷阱数据集
类型：分类
数量：243100
数据集下载地址：https://beerys.github.io/CaltechCameraTraps/
说明：
该数据集包含来自美国西南部 140 个摄像头位置的 243,100 张图像，带有 21 个动物类别的标签（加上空白），主要是在物种级别（例如，最常见的标签是负鼠、浣熊和土狼），以及大约 66,000 个边界框注释。大约 70% 的图像被标记为空。
SVHN 街景门牌号数据集
类型：图像识别
数量：600,000
数据集下载地址：http://ufldl.stanford.edu/housenumbers/
说明：
SVHN 是一个真实世界的图像数据集，用于开发机器学习和对象识别算法，对数据预处理和格式化的要求最低。它可以被视为与MNIST风格相似（例如，图像是经过裁剪的小数字），但包含一个数量级的更多标记数据（超过 600,000 个数字图像），并且来自一个更难、未解决的现实世界问题（识别自然场景图像中的数字和数字）。SVHN 是从谷歌街景图像中的门牌号获得的。
3D MNIST 数字识别图像数据
类型：图像识别
数量：
数据集下载地址：https://www.kaggle.com/datasets/daavoo/3d-mnist
说明：
该数据集的目的是提供一种简单的方法来开始处理 3D 计算机视觉问题，例如 3D 形状识别。
该数据集包含从MNIST数据集的原始图像生成的3D点云，为使用2D数据集（图像）的人们带来熟悉的3D介绍。
CBCL 街道场景数据
类型：图像识别
数量：
数据集下载地址：http://cbcl.mit.edu/software-datasets/streetscenes/
说明：
StreetScenes Challenge Framework 是用于对象检测的图像、注释、软件和性能测量的集合。每张图像都是从马萨诸塞州波士顿及其周边地区的 DSC-F717 相机拍摄的。然后用围绕 9 个对象类别的每个示例的多边形手动标记每个图像，包括 [汽车、行人、自行车、建筑物、树木、天空、道路、人行道和商店]。这些图像的标记是在仔细检查下完成的，以确保对象总是以相同的方式标记，关于遮挡和其他常见的图像变换。

5. 缺陷检测（defect detection）

AITEX数据集
类型：缺陷检测
数量：245
数据集下载地址：https://www.aitex.es/afid/
说明：
该数据库由七个不同织物结构的245张4096 x 256像素图像组成。数据库中有140个无缺陷图像，每种类型的织物20个，除此之外，有105幅纺织行业中常见的不同类型的织物缺陷（12种缺陷）图像。图像的大尺寸允许用户使用不同的窗口尺寸，从而增加了样本数量。
Internet上的数据库还包含所有具有缺陷的图像的分割mask，使得白色像素表示缺陷区域，其余像素为黑色。
天池铝型材表面缺陷数据集
类型：缺陷检测
数量：10000
数据集下载地址：https://tianchi.aliyun.com/competition/entrance/231682/information
说明：
数据集里有1万份来自实际生产中有瑕疵的铝型材监测影像数据，每个影像包含一个或多种瑕疵。供机器学习的样图会明确标识影像中所包含的瑕疵类型。
图片分成单瑕疵图片、多瑕疵图片以及无瑕疵图片：单瑕疵图片指所含瑕疵类型只有一种的图片，但图片中可能出现多处相同类型的瑕疵；多瑕疵图片指所含瑕疵类型多于一种的图片；无瑕疵图片指瑕疵可忽略不计的图片，这些图片不需要标注。
Kylberg 纹理数据集
类型：缺陷检测
数量：20000
数据集下载地址：https://www.cb.uu.se/~gustaf/texture/
说明：
在布匹生产过程中，由于各方面因素的影响，会产生污渍、破洞、毛粒等瑕疵，为保证产品质量，需要对布匹进行瑕疵检测。
布匹疵点检验是纺织行业生产和质量管理的重要环节，目前人工检测易受主观因素影响，缺乏一致性；并且检测人员在强光下长时间工作对视力影响极大。由于布匹疵点种类繁多、形态变化多样、观察识别难道大，导致布匹疵点智能检测是困扰行业多年的技术瓶颈。
数据集包括 28个纹理类，每类160个独特纹理面片。数据包括包括素色布和花色布两类，其中，素色布数据约8000张；花色布数据约12000张。
本数据涵盖了纺织业中布匹的各类重要瑕疵，每张图片含一个或多种瑕疵。
东北大学带钢表面缺陷数据集
类型：缺陷检测
数量：1800
数据集下载地址：http://faculty.neu.edu.cn/songkechen/zh_CN/zdylm/263270/list/
说明：
数据集收集了夹杂、划痕、压入氧化皮、裂纹、麻点和斑块6种缺陷，每种缺陷300张，图像尺寸为200×200。
数据集包括分类和目标检测两部分，不过目标检测的标注中有少量错误，需要注意。
谢韦尔钢铁公司带钢缺陷数据集
类型：缺陷检测
数量：18000
数据集下载地址：https://www.kaggle.com/c/severstal-steel-defect-detection/data
说明：
该数据集中提供了四种类型的带钢表面缺陷。训练集共有12568张，测试集5506张。图像尺寸为1600×256。
UCI 带钢缺陷数据集
类型：缺陷检测
数量：
数据集下载地址：https://archive.ics.uci.edu/ml/datasets/Steel+Plates+Faults
说明：
该数据集包含了7种带钢缺陷类型：装饰、Z划痕、K划痕、污渍、肮脏、颠簸、其他故障。
这个数据集不是图像数据，而是带钢缺陷的28种特征数据，可用于机器学习项目。
DAGM 2007数据集
类型：缺陷检测
数量：1000
数据集下载地址：https://hci.iwr.uni-heidelberg.de/content/weakly-supervised-learning-industrial-optical-inspection
说明：
该数据集用于统计纹理表面缺陷检测，为较弱监督的训练数据。
包含十个数据集，前六个为训练数据集，后四个为测试数据集。每个数据集均包含以灰度8位PNG格式保存的1000个“无缺陷”图像和150个“有缺陷”图像，每个数据集由不同的纹理模型和缺陷模型生成。“无缺陷”图像显示的背景纹理没有缺陷，“无缺陷”图像的背景纹理上恰好有一个标记的缺陷。所有数据集已随机分为大小相等的训练和测试子数据集。弱标签以椭圆形表示，大致表示缺陷区域。
磁瓦缺陷数据集
类型：缺陷检测
数量：
数据集下载地址：https://gitcode.net/mirrors/abin24/Magnetic-tile-defect-datasets.?utm_source=csdn_github_accelerator
说明：
中国科学院自动所一个课题组收集的数据集，是“Saliency of magnetic tile surface defects”这篇论文的数据集。收集了6种常见磁瓦缺陷的图像，并做了语义分割的标注。
RSDDs铁轨表面缺陷数据集
类型：缺陷检测
数量：200
数据集下载地址：http://icn.bjtu.edu.cn/Visint/resources/RSDDs.aspx
说明：
RSDDs数据集包含两种类型的数据集：第一种是从快车道捕获的I型RSDDs数据集，其中包含67个具有挑战性的图像。第二个是从普通/重型运输轨道捕获的II型RSDDs数据集，其中包含128个具有挑战性的图像。
两个数据集的每幅图像至少包含一个缺陷，并且背景复杂且噪声很大。
RSDDs数据集中的这些缺陷已由一些专业的人类观察员在轨道表面检查领域进行了标记。
印刷电路板（PCB）瑕疵数据集
类型：缺陷检测
数量：1386
数据集下载地址：https://robotics.pkusz.edu.cn/resources/dataset/
说明：
这是一个公共的合成PCB数据集，由北京大学发布，其中包含1386张图像以及6种缺陷（缺失孔，鼠咬坏，开路，短路，杂散，伪铜），用于检测，分类和配准任务。

6. 医学影像（medical image）

COVID-19 胸部CT图像增强GAN数据集
类型：医学影像
数量：742
数据集下载地址：https://www.kaggle.com/datasets/mloey1/covid19-chest-ct-image-augmentation-gan-dataset?resource=download-directory
说明：
新冠肺炎胸部CT扫描数字图像。共有742个CT图像和2个类别（COVID/NonCOVID）。
3D-IRCADB脏器分割数据集
类型：医学影像
数量：20
数据集下载地址：https://www.ircad.fr/research/data-sets/liver-segmentation-3d-ircadb-01/
说明：
3D-IRCADb-01 数据库由 10 名女性和 10 名男性 75% 的肝肿瘤患者的 3D CT 扫描组成。 20个文件夹对应20个不同的患者，可以单独下载也可以联合下载。下表提供了图像信息，例如肝脏大小（宽度、深度、高度）或根据 Couninaud 分割的肿瘤位置。它还表明肝脏分割软件可能遇到的主要困难是由于与邻近器官的接触、肝脏的非典型形状或密度，甚至图像中的伪影。
Kumar肿瘤数据集
类型：医学影像
数量：
数据集下载地址：https://monuseg.grand-challenge.org/Data/
说明：
这一数据集是通过仔细注释几名患有不同器官肿瘤并在多家医院被诊断出的患者的组织图像获得的。该数据集是通过从TCGA存档下载以 40 倍放大倍率捕获的 H&E 染色组织图像创建的。H&E 染色是增强组织切片对比度的常规方案，通常用于肿瘤评估（分级、分期等）。考虑到多个器官和患者的细胞核外观的多样性，以及多家医院采用的丰富染色方案，训练数据集将能够开发出开箱即用的稳健且可推广的细胞核分割技术。
FASCICLE 小腿肌肉超声数据集
类型：医学影像
数量：812
数据集下载地址：https://kalisteo.cea.fr/index.php/fallmud/
说明：
FAscicle 小腿肌肉超声数据集是一个由 812 幅小腿肌肉超声图像组成的数据集，用于分析肌肉弱点并预防受伤。该数据集在文章 AW-Net：B 型超声图像上的自动肌肉结构分析以预防伤害中进行了介绍。它结合了由 Ryan Cunningham 等人发表的两篇文章“使用卷积、残差和反卷积神经网络从 B 模式超声图像中估计全区域骨骼肌纤维方向”提供的数据集。
PanNuke癌组织细胞数据集
类型：医学影像
数量：
数据集下载地址：https://jgamper.github.io/PanNukeDataset/
说明：
半自动生成的细胞核实例分割和分类数据集，包含 19 种不同组织类型的详尽细胞核标签。该数据集由 481 个视野组成，其中 312 个视野是从多个数据源的 20K 多个不同放大倍率的整张幻灯片图像中随机采样的。该数据集总共包含 205,343 个标记的核，每个核都有一个实例分割掩码。在 pannuke 上训练的模型可以帮助整个幻灯片图像组织类型分割，并推广到新组织。PanNuke 演示了首批成功半自动生成的数据集之一。
淋巴结切片的组织病理学数据集
类型：医学影像
数量：327680
数据集下载地址：https://github.com/basveeling/pcam
说明：
PatchCamelyon 是一个新的且具有挑战性的图像分类数据集。它由从淋巴结切片的组织病理学扫描中提取的 327.680 张彩色图像 (96 x 96px) 组成。每个图像都带有一个二进制标签，表示存在转移组织。
森尼布鲁克心脏数据集
类型：医学影像
数量：45
数据集下载地址：http://www.cardiacatlas.org/studies/sunnybrook-cardiac-data/
说明：
Sunnybrook心脏数据 (SCD)，也称为2009 年心脏 MR 左心室分割挑战数据，由 45 幅来自混合患者和病理的电影 MRI 图像组成：健康、肥大、心力衰竭伴梗死和心力衰竭无梗死。
血细胞图像数据集
类型：医学影像
数量：12500
数据集下载地址：https://github.com/Shenggan/BCCD_Dataset
说明：
该数据集包含 12,500 张带有细胞类型标签 (CSV) 的增强血细胞图像 (JPEG)。4 种不同细胞类型中的每一种都有大约 3,000 张图像，这些图像被分组到 4 个不同的文件夹中（根据细胞类型）。细胞类型是嗜酸性粒细胞、淋巴细胞、单核细胞和中性粒细胞。该数据集附带一个额外的数据集，其中包含原始 410 幅图像（预增强）以及两个额外的子类型标签（WBC 与 WBC），以及这 410 幅图像中每个单元格的边界框（JPEG + XML 元数据）。
脑肿瘤 MRI 数据集
类型：医学影像
数量：7000
数据集下载地址：https://www.kaggle.com/datasets/masoudnickparvar/brain-tumor-mri-dataset
说明：
该数据集包含7022张人脑 MRI 图像，分为 4 类：胶质瘤-脑膜瘤-无肿瘤和垂体。注意这个数据集中的图像大小是不同的。可以在预处理并去除多余的边距后将图像调整为所需的大小。
身体部位X射线图像数据集
类型：医学影像
数量：
数据集下载地址：https://www.kaggle.com/datasets/ibombonato/xray-body-images-in-png-unifesp-competion
说明：
本数据集收集了来自身体各部位的X光图片。
多分类问题。自动识别图像中的身体部位，从而可以创建更多数据集和部署管道。
眼病深度学习数据集
类型：医学影像
数量：
数据集下载地址：https://www.kaggle.com/datasets/bongsang/eye-disease-deep-learning-dataset
说明：
本数据集包含712张片状角膜溃疡的眼部染色图像。
该数据集的标签由 3 个类别、5 个类型和 5 个等级组成。可以是75个多标签。
膝关节 X 射线图像数据集
类型：医学影像
数量：1650
数据集下载地址：https://www.kaggle.com/datasets/tommyngx/digital-knee-xray
说明：
该数据集包括从知名医院和诊断中心收集的 1650 张膝关节电子 X 射线图像。X 射线图像是使用 PROTEC PRS 500E X 射线机获取的。原始图像是 8 位灰度图像。每个 X 射线膝关节 X 射线图像均由 2 位医学专家根据 Kellgren 和 Lawrence 等级手动注释/标记。

7. 图像分割（image segmentation）

高密度人群及移动物体视频数据集
类型：图像分割
数量：
数据集下载地址：https://www.cvmart.net/dataSets/detail/Unknown
说明：
Crowd Segmentation Dataset 是一个高密度人群和移动物体视频数据，视频来自BBC Motion Gallery 和 Getty Images 网站。
DAVIS 视频分割数据集
类型：图像分割
数量：
数据集下载地址：https://davischallenge.org/
说明：
Densely Annotated Video Segmentation 是一个高清视频中的物体分割数据集，包括 50个视频序列，3455个帧标注，视频采集自高清 1080p 格式。

8. 图像去雾（images defogging）

D-HAZY
类型：图像去雾
数量：1400
数据集下载地址：http://ancuti.meo.etc.upt.ro/D_Hazzy_ICIP2016/
说明：
D-HAZY，建立在Middelbury 和NYU深度数据集上，这些数据集提供各种场景的图像及其相应的深度图。包含1400多对图像的数据集，其中包括同一场景的地面真实参考图像和模糊图像。
RESIDE
类型：图像去雾
数量：
数据集下载地址：https://sites.google.com/view/reside-dehaze-datasets
说明：
RESIDE数据集包括合成和真实世界的模糊图像，称为REalistic Single Image Dehazing，RESIDE突出显示了各种数据源和图像内容，并分为五个子集，每个子集用于不同的训练或评估目的。提供了各种各样的去雾算法评估标准，从完整参考度量，无参考度量，到主观评估和任务驱动评估。
Middlebury Stereo双目立体匹配测试数据集
类型：图像去雾
数量：
数据集下载地址：https://vision.middlebury.edu/stereo/data/
说明：
数据集包括11个场景，在许多不同的照明条件和曝光（包括移动设备的闪光灯和“手电筒”照明）下，从1-3个不同的观看方向成像。
NH-HAZE
类型：图像去雾
数量：
数据集下载地址：https://data.vision.ee.ethz.ch/cvl/ntire20/nh-haze/
说明：
这是一个非均匀的真实数据集，具有成对的真实雾度和相应的无雾度图像。这是第一个非齐次图像去模糊数据集，包含55个室外场景。在场景中引入了非均匀雾，使用专业雾发生器模拟雾场景的真实条件。
DENSE-HAZE
类型：图像去雾
数量：
数据集下载地址：https://data.vision.ee.ethz.ch/cvl/ntire19//dense-haze/
说明：
以浓密均匀的朦胧场景为特征，包含33对真实的朦胧图像和各种室外场景的相应无霾图像。通过引入由专业雾霾机器生成的真实雾霾来记录雾霾场景。朦胧和无朦胧的对应场景包含在相同照明参数下捕获的相同视觉内容。

9. 关键点检测（key point detection）

手部姿势关键点检测数据集
类型：关键点检测
数量：
数据集下载地址：http://www.rovit.ua.es/dataset/mhpdataset/#citation
说明：
数据集由序列构成。在每个序列中，您都可以找到组成它的帧。一个帧由4个彩色图像、4组投影在每个图像平面中的2D关节、4个边界框、1组Leap Motion Controller提供的3D点和4组重新投影到每个相机坐标帧的3D点组成
动物姿势数据集
类型：关键点检测
数量：4000
数据集下载地址：https://github.com/switchablenorms/DeepFashion2
说明：
该数据集提供了五个类别的动物姿势注释：狗、猫、牛、马、羊，在4,000 多张图像中总共有6,000多个实例。此外，该数据集还包含其他7 个动物类别的边界框注释。在论文中查找详细信息。
该数据集一共标注了 20 个关键点：两只眼睛、喉咙、鼻子、马肩隆、两个耳根、尾根、四个肘部、四个膝盖、四个爪子。
电影人物关节关键点数据集
类型：关键点检测
数量：5000
数据集下载地址：https://bensapp.github.io/flic-dataset.html
说明：
本文从流行的好莱坞电影中自动收集了5003个图像数据集。这些图像是通过在30部电影的每10帧上运行一个最先进的人检测器获得的
MPIIGaze数据集
类型：关键点检测
数量：213659
数据集下载地址：https://www.mpi-inf.mpg.de/departments/computer-vision-and-machine-learning/research/gaze-based-human-computer-interaction/appearance-based-gaze-estimation-in-the-wild
说明：
数据集包含我们在三个多月的日常笔记本电脑使用过程中从15名参与者收集的213659张图像。在外观和照明方面，我们的数据集比现有的数据集变化更大。
人体足部关键点数据集
类型：关键点检测
数量：
数据集下载地址：https://cmu-perceptual-computing-lab.github.io/foot_keypoint_dataset/
说明：
MPII 数据集标注了脚踝、膝盖、臀部、肩膀、肘部、手腕、颈部、躯干和头顶，而 COCO 还包括一些面部关键点。对于这两个数据集，足部注释仅限于脚踝位置。COCO 数据集中的一小部分脚实例使用 Clickworker 平台进行标记。它分为来自 COCO 训练集的 14K 注释和来自验证集的 545 个注释。
人群姿态数据集
类型：关键点检测
数量：
数据集下载地址：https://github.com/Jeff-sjtu/CrowdPose
说明：
多人姿态估计是许多计算机视觉任务的基础。然而，以前很少有方法研究拥挤场景中的姿态估计问题，而在许多场景中，这仍然是一个具有挑战性和不可避免的问题。

10. 动作识别（action recognition）

HMDB人类动作视频数据集
类型：动作识别
数量：6849
数据集下载地址： https://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/
说明：
由布朗大学发布的人类动作视频数据集，该数据集视频多数来源于电影，还有一部分来自公共数据库以及YouTube等网络视频库。数据库包含有6849段样本，分为51类，每类至少包含有101段样本。
操作类别可以分为五种类型：一般面部动作，物体操纵的面部动作，一般身体动作，身体动作与物体相互作用，人体互动的身体动作。
UCF50动作识别数据集
类型：动作识别
数量：
数据集下载地址： https://www.crcv.ucf.edu/data/UCF50.php
说明：
UCF50 是一个由中佛罗里达大学发布的动作识别数据集，由来自 youtube 的真实视频组成，包含 50 个动作类别，如棒球投球、篮球投篮、卧推、骑自行车、骑自行车、台球、蛙泳、挺举、跳水、击鼓等。对于所有 50 个类别，视频分为 25 组，其中每组由超过 4 个动作剪辑。同一组中的视频片段可能具有一些共同的特征，例如同一个人、相似背景、相似视点等。
SBU Kinect 交互数据集
类型：动作识别
数量：
数据集下载地址： https://www3.cs.stonybrook.edu/~kyun/research/kinect_interaction/index.html
说明：
SBU Kinect Interaction 创建了一个描述两个人交互的复杂人类活动数据集，包括同步视频、深度和运动捕获数据。此外，在通过支持向量机（SVM）实时检测交互活动的背景下，我们使用数据集评估通常用于索引和检索运动捕捉数据的各种特征。
FineDiving 跳水数据集
类型：动作识别
数量：
数据集下载地址： https://finediving.ivg-research.xyz/
说明：
收集了奥运会、世界杯、世锦赛以及欧锦赛的跳水项目比赛视频。每个比赛视频都提供了丰富的内容，包括所有运动员的跳水记录、不同视角的慢速回放等。
ALOV300++跟踪数据集
类型：目标跟踪
数量：
数据集下载地址：https://aimagelab.ing.unimore.it/dsm/
说明：
ALOV++，Amsterdam Library of Ordinary Videos for tracking 是一个物体追踪视频数据，旨在对不同的光线、通透度、泛着条件、背景杂乱程度、焦距下的相似物体的追踪

11. 姿态估计（pose estimation）

MPII人体模型数据集
类型：姿态估计
数量：10000
数据集下载地址：https://humanshape.mpi-inf.mpg.de/
说明：
该数据集包含通过在Google Image Search中键入常见的名字从web上收集的人们的图像。每个正面的眼睛、鼻子和嘴巴中心的坐标都在地面真相文件中提供。此信息可用于对齐和裁剪人脸，或作为人脸检测算法的基本事实。该数据集有10524张不同分辨率和不同设置的人脸，例如肖像图像、人群等。侧面人脸或非常低分辨率的人脸没有标签。
MPII人类姿态数据集
类型：姿态估计
数量：40000
数据集下载地址：http://human-pose.mpi-inf.mpg.de/#overview
说明：
MPII 人体姿态数据集是用于评估人体关节姿势估计的最先进基准。该数据集包括大约 25,000 张图像，其中包含超过 40,000 个带有注释身体关节的人。这些图像是使用已建立的人类日常活动分类法系统收集的。总的来说，数据集涵盖了 410 项人类活动，每个图像都提供了一个活动标签。每张图像都是从 YouTube 视频中提取的，并提供前后未注释的帧。此外，测试集有更丰富的注释，包括身体部位遮挡和 3D 躯干和头部方向。
KTH 多视图足球数据集
类型：姿态估计
数量：771
数据集下载地址：https://www.csc.kth.se/~vahidk/football_data.html
说明：
收集了一个带有注释关节的足球运动员数据集，可用于多视图重建。数据集包括：
771张足球运动员的照片
在 257 个时间实例中从 3 个视图中获取的图像
14 个带注释的身体关节
宾夕法尼亚动作数据集
类型：姿态估计
数量：2326
数据集下载地址：http://dreamdragon.github.io/PennAction/
说明：
Penn Action Dataset（宾夕法尼亚大学）包含 15 个不同动作的 2326 个视频序列以及每个序列的人类联合注释。
BBC姿态数据集
类型：姿态估计
数量：20
数据集下载地址：https://www.robots.ox.ac.uk/~vgg/data/pose/index.html#bbcpose
说明：
BBC Pose 包含 20 个视频（每个视频长度为 0.5 小时至 1.5 小时），由 BBC 录制，并配有手语翻译。这 20 个视频分为 10 个用于训练的视频、5 个用于验证的视频和 5 个用于测试的视频。
Poser 数据集
类型：姿态估计
数量：1927
数据集下载地址：https://arxiv.org/abs/1701.01218
说明：
Poser 数据集是用于姿态估计的数据集，由 1927 个训练图像和 418 个测试图像组成。这些图像是综合生成的，并调整为单峰预测。这些图像是使用 Poser 软件包生成的。
野外 3D 姿势数据集
类型：姿态估计
数量：
数据集下载地址：https://virtualhumans.mpi-inf.mpg.de/3DPW/
说明：
野外第一个具有准确 3D 姿势用于评估的数据集，包含从移动摄像头拍摄的视频片段的技术。
数据集包括：60 个视频序列，2D 姿势注释，3D 姿势，序列中每一帧的相机姿势，3D 身体扫描和 3D 人物模型，18 个不同服装款式的 3D 模型。
V-COCO数据集
类型：姿态估计
数量：10346
数据集下载地址： GitHub - s-gupta/v-coco: Hooks for VCOCO
说明：
V-COCO是一个基于 COCO 的数据集，用于人机交互检测。V-COCO 提供 10,346 张图像（2,533 张用于训练，2,867 张用于验证，4,946 张用于测试）和 16,199 个人物实例。每个人都有 29 个动作类别的注释，并且没有包括对象在内的交互标签。
宜家 ASM 数据集
类型：姿态估计
数量：371
数据集下载地址： IKEA Assembly Dataset (ikeaasm.github.io)
说明：
宜家 ASM 数据集是装配任务的多模式和多视图视频数据集，可对人类活动进行丰富的分析和理解。它包含 371 个家具组件样本及其真实注释。每个样本包括 3 个 RGB 视图、一个深度流、原子动作、人体姿势、对象片段、对象跟踪和外部相机校准。
5个装配环境，4种家具类型，3种家具颜色（白色、黑色和橡木色），48个独特的汇编程序，1： 3女性：男性比例，每个部件有3个RGB视图，每个组件1个深度流，33个动作类（动词-对象对）
立体人体姿势估计数据集
类型：姿态估计
数量：630
数据集下载地址： Page not found – Aplicaciones de la Visión Artificial (uco.es)
说明：
这是一个立体图像对数据集，适用于上身人的立体人体姿态估计。SHPED 由 630 个立体图像对（即 1260 个图像）组成，分为 42 个视频片段，每个片段 15 帧。这些剪辑是从 26 个立体视频中提取的，这些视频是从 YouTube 获得的。此外，SHPED 包含 1470 条火柴人上身注释，对应于 49 个人根据这些条件：直立位置、所有上身部分几乎可见以及身体的非侧面视点。
132 AIST++ 舞蹈动作数据集
类型：姿态估计
数量：1010万
数据集下载地址： https://google.github.io/aistplusplus_dataset/factsfigures.html
说明：
AIST++ 舞蹈动作数据集是从 AIST 舞蹈视频数据库构建的。对于多视图视频，设计了一个精心设计的管道来估计相机参数、3D 人体关键点和 3D 人体舞蹈动作序列：
它为 1010 万张图像提供 3D 人体关键点注释和相机参数，涵盖 9 个视图中的 30 个不同主题。这些属性使其成为具有 3D 人体关键点注释的最大和最丰富的现有数据集。它还包含 1,408 个 3D 人类舞蹈动作序列，表示为关节旋转以及根轨迹。舞蹈动作平均分布在 10 种舞蹈流派中，有数百种编舞。运动持续时间从 7.4 秒不等。至 48.0 秒。所有的舞蹈动作都有相应的音乐。
HiEve数据集
类型：姿态估计
数量：
数据集下载地址： Human in Events
说明：
该数据集专注于在各种人群和复杂事件中进行非常具有挑战性和现实性的以人为中心的分析任务，包括地铁上下车、碰撞、战斗和地震逃生。并且具有大规模和密集注释的标签，涵盖了以人为中心的分析中的广泛任务。
该数据集具有大规模且注释密集的标签，涵盖了以人为中心的分析中的广泛任务。
我们的HiEve数据集包括当前最大数量的姿势（>1M）、最大数量的复杂事件动作标签（>56k）以及最大数量的长期轨迹（平均轨迹长度>480）。

12. 自动驾驶（automatic drive）

CrackForest数据集
类型：自动驾驶
数量：
数据集下载地址：https://github.com/cuilimeng/CrackForest
说明：
CrackForest数据集是一个带注释的道路裂缝图像数据库，可以大致反映城市路面状况。
KITTI 道路数据集
类型：自动驾驶
数量：600
数据集下载地址： https://www.cvlibs.net/datasets/kitti/eval_road.php
说明：
道路和车道估计基准包括289次培训和290幅测试图像。我们在鸟瞰空间中评估道路和车道的估计性能。它包含不同类别的道路场景：城市无标记、城市标记、城市多条标记车道以及以上三者的结合。地面实况是通过手动注释图像生成的，可用于两种不同的道路地形类型：道路-道路区域，即所有车道的组成，以及车道-自我车道，即车辆当前行驶的车道。地面实况仅用于训练图像。
KITTI-2015立体声数据集
类型：自动驾驶
数量：400
数据集下载地址： https://www.cvlibs.net/datasets/kitti/eval_scene_flow.php?benchmark=stereo
说明：
stero 2015 基准测试包含 200 个训练场景和 200 个测试场景（每个场景 4 幅彩色图像，以无损 png 格式保存）。与stereo 2012 和flow 2012 基准测试相比，它包含动态场景，在半自动过程中为其建立了真值。该数据集是通过在卡尔斯鲁厄中等规模城市、农村地区和高速公路上行驶而捕获的。每张图像最多可以看到 15 辆汽车和 30 名行人。
KITTI-2015光流数据集
类型：自动驾驶
数量：400
数据集下载地址：http://www.cvlibs.net/datasets/kitti/eval_scene_flow.php?benchmark=flow
说明：
Flow 2015 基准测试包含 200 个训练场景和 200 个测试场景（每个场景 4 幅彩色图像，以无损 png 格式保存）。与stereo 2012 和flow 2012 基准测试相比，它包含动态场景，在半自动过程中为其建立了真值。该数据集是通过在卡尔斯鲁厄中等规模城市、农村地区和高速公路上行驶而捕获的。每张图像最多可以看到 15 辆汽车和 30 名行人。
KITTI-2015场景流数据集
类型：自动驾驶
数量：400
数据集下载地址：http://www.cvlibs.net/datasets/kitti/eval_scene_flow.php
说明：
Sceneflow 2015 基准测试包含 200 个训练场景和 200 个测试场景（每个场景 4 幅彩色图像，以无损 png 格式保存）。与stereo 2012 和flow 2012 基准测试相比，它包含动态场景，在半自动过程中为其建立了真值。该数据集是通过在卡尔斯鲁厄中等规模城市、农村地区和高速公路上行驶而捕获的。每张图像最多可以看到 15 辆汽车和 30 名行人。
KITTI深度数据集
类型：自动驾驶
数量：93000
数据集下载地址：http://www.cvlibs.net/datasets/kitti/eval_depth_all.php
说明：
KITTI-depth 包含超过 93,000 个深度图以及相应的原始 LiDaR 扫描和 RGB 图像。鉴于大量的训练数据，该数据集应允许训练复杂的深度学习模型，以完成深度补全和单幅图像深度预测的任务。此外，该数据集提供了带有未发布深度图的手动选择图像，作为这两个具有挑战性的任务的基准。
城市景观图像对数据集
类型：自动驾驶
数量：2975
数据集下载地址：https://www.kaggle.com/datasets/dansbecker/cityscapes-image-pairs
说明：
城市景观数据（数据集主页）包含从德国驾驶的车辆中拍摄的标记视频。此版本是作为 Pix2Pix 论文的一部分创建的已处理子样本。数据集包含来自原始视频的静止图像，语义分割标签与原始图像一起显示在图像中。这是语义分割任务的最佳数据集之一。
该数据集有 2975 个训练图像文件和 500 个验证图像文件。每个图像文件为 256x512 像素，每个文件是与图像左半部分的原始照片以及右半部分的标记图像（语义分割的输出）的合成。
自动驾驶汽车语义分割数据集
类型：自动驾驶
数量：5000
数据集下载地址：https://www.kaggle.com/datasets/kumaresanmanickavelu/lyft-udacity-challenge
说明：
该数据集提供通过 CARLA 自动驾驶汽车模拟器捕获的数据图像和标记语义分割。这些数据是作为 Lyft Udacity Challenge 的一部分生成的。该数据集可用于训练 ML 算法以识别图像中汽车、道路等的语义分割。
数据有5组1000张图片和对应的标签。
道路自动驾驶汽车数据集
类型：自动驾驶
数量：
数据集下载地址：https://www.kaggle.com/datasets/ananduthaman/self-driving-car-on-indian-roads
说明：
该数据集为自动驾驶车辆提供了易于使用的训练数据。提供驾驶视频中每一帧对应的转向角、加速度、刹车和档位。这段视频是使用安装在汽车挡风玻璃上的摄像头录制的，该汽车沿着印度喀拉拉邦的道路行驶。
驾驶模拟器车道检测数据集
类型：自动驾驶
数量：
数据集下载地址：https://www.kaggle.com/datasets/thomasfermi/lane-detection-for-carla-driving-simulator
说明：
该数据集由 Carla 驾驶模拟器生成的图像组成。训练图像是由安装在模拟车辆中的行车记录仪捕获的图像。标签图像是分割掩码。标签图像将每个像素分类为：左侧车道边界的和右侧车道边界。与该数据集相关的挑战是训练一个能够准确预测验证数据集的分割掩码的模型。
雷达场景数据集
类型：自动驾驶
数量：
数据集下载地址：https://www.kaggle.com/datasets/aleksandrdubrovin/the-radarscenes-data-set
说明：
RadarScenes 数据集包含来自四个汽车雷达传感器的记录，这些传感器安装在一辆测量车辆上。添加了来自一台前置纪实相机的图像。它于 2016 年至 2018 年在德国乌尔姆录制。该数据集的长度超过 4 小时，除了来自雷达传感器的点云数据外，还提供了 12 个不同类别的逐点语义注释。除了逐点类标签外，跟踪 ID 还附加到动态对象的每个单独检测，以便可以随时间跟踪各个对象。
LiDAR 2D深度图像数据集
类型：自动驾驶
数量：
数据集下载地址：https://www.kaggle.com/datasets/ahmedfawzyelaraby/kitti-lidar-based-2d-depth-images
说明：
该数据集包含 2D 深度图像，如下图所示。像 KITTI 数据集中的 360 度 LiDAR 框架在传感器本身周围呈圆柱形。该数据集中的 2D 深度图像可以表示为您在 LiDAR 框架的圆柱体上进行了切割并将其拉直以位于 2D 平面中。这些 2D 深度图像的像素代表反射物体与 LiDAR 传感器的距离。 2D 深度图像的垂直分辨率（在我们的例子中为 64）表示用于扫描周围环境的 LiDAR 传感器的激光束数量。这些 2D 深度图像代表相应 LiDAR 帧的相同场景，但格式更易于处理，可用于分割、检测、识别等任务，并且可以利用计算机视觉关于 2D 图像的大量文献。
昼夜行人序列数据集
类型：自动驾驶
数量：7000
数据集下载地址：http://adas.cvc.uab.es/elektra/enigma-portfolio/cvc-14-visible-fir-day-night-pedestrian-sequence-dataset/
说明：
数据集由两组序列组成。这些序列被命名为白天和夜晚集，指的是它们被获取的一天中的时刻，Visible和 FIR 取决于用户记录序列的相机。白天训练 3695 个 imegas，晚上训练 3390 个图像，每个序列大约有 1500 个强制性行人注释。用于测试两个序列的约 700 张图像，白天约有 2000 名行人，夜间约有 1500 名行人
RSCD自动驾驶路面图像分类数据集
类型：自动驾驶
数量：1000000
数据集下载地址：https://github.com/ztsrxh/RSCD-Road_Surface_Classification_Dataset
说明：
实车采集、手工标注并发布了该路面图像分类数据集（RSCD），提供路面附着水平、不平度及材质的全状态详细标注信息，共包含约100万张图片。覆盖了不同季节、天气、路况及材质状态下的约 700 公里的道路。
为实现精细化的路面状态感知，将原始图片的路面区域裁剪成360*240大小的图像块，并进行手动标注。
148.nuScence
类型：自动驾驶
数量：1,166,187
数据集下载地址：https://www.nuscenes.org/nuscenes
说明：
2019年3月，发布了包含所有1000个场景的完整nuScenes数据集。完整的数据集包括大约1.4M个相机图像、390k个激光雷达扫描、1.4M个雷达扫描和1.4M个对象边界框（40k个关键帧）。其他功能（地图图层、原始传感器数据等）即将推出。我们还将组织nuScenes 3D检测挑战，作为2019年CVPR自动驾驶研讨会的一部分。
nuScenes数据集受到了开创性的KITTI数据集的启发。nuScenes是第一个提供自动驾驶车辆整个传感器套件（6个摄像头、1个激光雷达、5个雷达、GPS、IMU）数据的大型数据集。与KITTI相比，nuScenes包含7倍以上的对象注释。
尽管之前发布的大多数数据集中于基于摄像机的目标检测（Cityscapes、Mapillary Vistas、Apolloscapes和Berkeley Deep Drive），nuScenes的目标是查看整个传感器套件。
2020年7月，我们发布了nuScenes激光雷达。在nuScenes lidarseg中，使用32个可能的语义标签（即激光雷达语义分割）之一从nuScene中的关键帧注释每个激光雷达点。因此，nuScenes lidarseg在40000个点云和1000个场景中包含14亿个注释点（850个场景用于培训和验证，150个场景用于测试）。

13. RGB-T

HFUT-Lytro数据集
类型：RGBT
数量：
数据集下载地址：https://dl.acm.org/doi/10.1145/3107956
说明：15000
由255个光场组成，每个光场图像生成的图像范围从53到64个，其中跨越了多个显著性检测挑战，如遮挡、杂乱背景和外观变化。
DUTLF-V2
类型：RGBT
数量：4200
数据集下载地址：https://github.com/OIPLab-DUT/DUTLF-V2
说明：
由于具有强大的三维信息捕捉能力，光场数据为显著性检测算法提供了更为有力的支持。
多功能数据集，其中包含了102类目标、共4202个样本，可以有效支持基于RGB、RGB-D和光场数据的显著性检测算法。
ReDWeb-S
类型：RGBT
数量：3200
数据集下载地址：https://github.com/nnizhang/SMAC
说明：
它共有 3179 张图像，具有各种真实世界场景和高质量的深度图。我们将数据集分成包含 2179 个 RGB-D 图像对的训练集和包含剩余 1000 个图像对的测试集。

你可能感兴趣的:(人工智能)

【Cursor】揭秘Cursor：如何免费无限使用这款AI编程神器？ ChatGPT-千鑫人工智能 AI编程
在当今科技飞速发展的时代，人工智能编程工具层出不穷，其中Cursor凭借其卓越的功能和用户友好的体验，迅速在国际市场上引发了广泛关注。最近，该公司成功获得了OpenAI的6000万美元投资，进一步验证了其潜力和市场价值。那么，Cursor究竟具备怎样的强大能力？又该如何实现免费无限制使用呢？本文将为您揭开Cursor的神秘面纱，并提供详细的使用指南，助您轻松上手！Cursor的强大功能Cursor
【人工智能】人工智能的10大算法详解（优缺点+实际案例） ChatGPT-千鑫人工智能人工智能算法 gpt-3 AI编程 gpt codemoss能用AI
人工智能（AI）是现代科技的重要领域，其中的算法是实现智能的核心。本文将介绍10种常见的人工智能算法，包括它们的原理、训练方法、优缺点及适用场景。1.线性回归（LinearRegression）模型原理线性回归用于建立自变量（特征）与因变量（目标）之间的线性关系。其目标是寻找最佳拟合直线，使得预测值与实际值之间的误差最小化。模型训练通过最小二乘法来最小化预测值与真实值之间的误差，得到线性回归方程的
Cursor 一只爱笑的小燕子 ChatGPT html5 java 开发语言
一、什么是Cursor官网：Cursor|BuildFastCursor是一个开源的AI编程编辑器。开源地址https://github.com/pricing目前在国内是可以不需要其他东西，可以直接访问的。而且目「下面是官方的介绍：」Cursor是一个为AI编程而做的编辑器。它还处于早期阶段，但现在Cursor可以帮助你做一些事情。编写：使用Copilot更聪明的人工智能生成10-100行代码比
基于深度学习的人脸表情识别系统：YOLOv5 + YOLOv8 + YOLOv10 + UI界面 + 数据集 2025年数学建模美赛深度学习 YOLO ui 分类人工智能
引言随着人工智能的飞速发展，深度学习技术已广泛应用于各个领域，尤其是在计算机视觉领域。人脸识别和表情识别是其中的一个重要应用，能够在多种场景下提供重要的信息，例如安全监控、情感分析、智能客服、健康监测等。在人脸表情识别任务中，准确识别人脸的情感状态（如高兴、愤怒、悲伤等）是一个极具挑战性的任务。随着YOLO系列算法的不断进步，YOLOv5、YOLOv8和YOLOv10的推出大大提高了目标检测的精度
基于YOLOv8深度学习的人脸年龄检测识别系统 2025年数学建模美赛 YOLO 深度学习人工智能 ui 数据挖掘分类
引言随着人工智能和计算机视觉的飞速发展，人脸分析技术在年龄检测领域取得了显著进展。人脸年龄检测系统在安全监控、广告推荐、健康监测等领域有广泛应用。本文将基于YOLOv8目标检测模型和UI界面，开发一个完整的人脸年龄检测识别系统。我们将详细介绍项目的技术实现、数据集构建、模型训练以及UI设计，并附上完整代码。目录引言系统架构设计数据准备公开人脸年龄数据集数据标注格式数据目录结构模型训练YOLOv8环
《鸿蒙Next旅游应用：人工智能赋能个性化与智能导览新体验》人工智能深度学习
随着鸿蒙Next的推出，旅游应用迎来了全新的发展机遇，借助人工智能技术能为用户带来更出色的个性化推荐和智能导览服务。鸿蒙Next与人工智能融合优势鸿蒙Next拥有强大的分布式能力和原生智能体验。其能打破设备界限，实现多设备协同，让用户在手机、平板、智能手表等设备上无缝使用旅游应用。同时，依托华为强大的AI技术和自研的“盘古”大模型，为旅游应用提供了强大的智能支持。个性化推荐实现方式用户数据收集与分
《解锁鸿蒙系统AI与第三方应用集成的无限可能》人工智能深度学习
在当今科技飞速发展的时代，鸿蒙系统与人工智能技术的深度融合为应用开发带来了前所未有的机遇和挑战。如何让鸿蒙系统中的人工智能服务与第三方应用实现更好的集成，成为了开发者们关注的焦点。利用鸿蒙系统内置的人工智能服务鸿蒙系统提供了丰富的人工智能服务，如语音助手、视觉识别、自然语言处理等。开发者可以直接调用这些服务，无需从头开始研发。例如，在开发一款阅读类应用时，可以调用自然语言处理服务实现智能朗读功能，
《软硬协同优化，解锁鸿蒙系统AI应用性能新高度》深度学习人工智能
在当今数字化时代，鸿蒙系统与人工智能的融合正逐渐成为科技领域的热门话题。如何通过软件和硬件协同优化，进一步提升鸿蒙系统中AI应用的整体性能，成为了开发者和技术爱好者们关注的焦点。鸿蒙系统与AI应用的融合现状鸿蒙系统以其独特的微内核架构和分布式特性，为AI应用提供了良好的运行环境。目前，鸿蒙系统中的AI应用已经涵盖了语音助手、图像识别、智能推荐等多个领域，为用户带来了更加智能、便捷的体验。然而，随着
《解锁数据新动能：数据标注工具与AI模型训练平台的无缝对接热潮》人工智能深度学习
在当今人工智能飞速发展的时代，数据已然成为驱动其进步的核心燃料。而数据标注工具与人工智能模型训练平台的集成，实现数据的无缝流转，正逐渐成为行业内的关键热点，犹如为人工智能的发展装上了强劲的双引擎。为何集成如此关键数据标注是为数据赋予标签，使其能被人工智能模型理解和学习的过程。训练平台则是利用这些标注好的数据来构建和优化模型。两者若相互独立运作，数据在不同系统间的传输会面临格式不兼容、接口不匹配等难
第81期 | GPTSecurity周报 aigc网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.大语言模型与代码安
《数据质量：人工智能模型的成败关键》人工智能深度学习
在当今人工智能飞速发展的时代，数据质量对人工智能模型的影响至关重要，它直接关系到模型的性能、准确性和可靠性。以下是对这一问题的详细探讨。影响模型的准确性数据准确性的作用：准确的数据是模型准确输出的基础。如果数据中存在错误、偏差或噪声，模型就会学习到这些错误信息，从而导致预测结果不准确。例如在医疗诊断模型中，若患者的症状数据记录错误，模型可能会给出错误的诊断建议。数据完整性的影响：不完整的数据会使模
第83期 | GPTSecurity周报 aigcgpts
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.混乱中建立秩序：人
AI大模型应用架构（ALLMA）白皮书解读百度_开发者中心人工智能大模型数据库自然语言处理
随着人工智能技术的不断发展，AI大模型成为推动生产、生活方式变革，助推产业智能化转型升级，驱动数字经济高质量发展等社会经济发展方面的新引擎。为了全面展示AI大模型的发展全貌，为各界提供新思路，本文将对AI大模型应用架构（ALLMA）白皮书进行解读。一、AI大模型应用架构（ALLMA）的内涵AI大模型应用架构（ALLMA）是一种基于深度学习的人工智能应用架构，旨在通过大规模无标注数据预训练、指令微调
Python人工智能气象岁月如歌，青春不败气象学 python 人工智能开发语言
Python是功能强大、免费、开源，实现面向对象的编程语言，在数据处理、科学计算、数学建模、数据挖掘和数据可视化方面具备优异的性能，这些优势使得Python在气象、海洋、地理、气候、水文和生态等地学领域的科研和工程项目中得到广泛应用。可以预见未来Python将成为的主流编程语言之一。一：Python和科学计算基础1.1Python安装1.1.1Python在气象中的应用1.1.2Anaconda解
ChatGPT 网络配置问题解决方案 IPdodo全球网络服务 chatgpt 网络
随着人工智能技术的飞速发展，基于GPT架构的聊天机器人，如ChatGPT，已经在多个领域获得了广泛应用。其强大的自然语言处理能力为用户带来了便捷的交互体验。然而，在实际使用过程中，尤其是在部署和访问时，用户可能会遇到网络配置方面的一些问题，这些问题往往会影响ChatGPT的响应速度、稳定性甚至是可用性。一、ChatGPT网络配置问题的常见原因1.网络连接不稳定网络连接的稳定性是影响ChatGPT使
【机器学习实战入门项目】基于机器学习的鸢尾花分类项目精通代码大仙数据挖掘 python 深度学习机器学习分类人工智能大数据数据挖掘算法 python
基于机器学习的鸢尾花分类项目介绍：本项目利用机器学习模型对鸢尾花进行分类。鸢尾花数据集是一个著名的机器学习数据集，包含三种类别的花朵：Setosa、Versicolor和Virginica，每种类别由四个特征描述：萼片长度、萼片宽度、花瓣长度和花瓣宽度。什么是机器学习？机器学习是关于从数据中学习预测或提取知识的过程。它是人工智能的一个子领域。机器学习算法基于样本数据（即训练数据）构建模型，并根据训
10 大中文医学数据集汇总：涵盖神农中医药、中医药古籍、医学推理、医学问答……
医疗人工智能的快速发展离不开高质量数据集的支持。从疾病诊断到药物研发，再到个性化医疗，数据集在推动机器视觉、大模型等应用于医学领域中发挥着不可或缺的作用。医学数据集的形式多样，涵盖了不同维度和领域的数据资源。例如，在疾病诊断领域，像RJUA-QA这样的问答数据集推动了复杂医学知识的自动化应用；而在中医药领域，神农中医药数据集整合了传统中医药文献、临床案例和药方数据。针对于此，本文整理了医学领域的1
谷歌 AI Agent 白皮书：2025 年，智能体时代已来人工智能googleagent
谷歌在2024年底发布了AIAgent（AI智能体）白皮书，表明人工智能在商业中将扮演更积极和独立的角色的未来，并详细阐述了智能体的概念、架构、运作方式以及相关技术，为智能体的开发和应用提供了理论框架和实践指导。AI4AI社区为大家对白皮书内容进行了整理，简单概括回顾核心内容，欢迎点击文章底部“阅读原文”获取完整版白皮书。智能体时代已来人类擅长处理复杂的模式识别任务。然而，我们往往需要借助工具——
AI Agent：一场智能革命的开始 TechubNews 人工智能
在当今科技日新月异的时代，AI（人工智能）技术正以前所未有的速度改变着我们的生活和工作方式。其中，AIAgent作为AI领域的一个新兴分支，正逐渐展现出其巨大的潜力和价值。本文将深入探讨AIAgent的发展现状、核心优势以及未来的发展方向，带您领略这一前沿技术的无限魅力。一、AIAgent的发展现状：技术突破与广泛应用近年来，随着大数据、云计算和机器学习等技术的飞速发展，AIAgent的技术水平得
不得不了解的高效AI办公工具API 程序员
AI办公，即人工智能在办公领域的应用，是指利用人工智能技术来提高工作效率、优化工作流程、增强决策支持等。AI公文写作:AI公文写作API服务通过智能算法，根据用户需求快速生成标准化的公文文本，如报告、通知、请示等，提高工作效率。TaskadeAPI：TaskadeAPI可以帮助开发人员将Taskade集成到他们的自定义应用程序和工具中，以实现更高效、更协同的团队协作。PDF.aiAPI：PDF.a
第79期 | GPTSecurity周报 aigcgpts
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.TrojanWhi
人工智能下的MASS服务架构从零开始学习人工智能人工智能架构
人工智能下的MASS服务架构1.MaaS（ModelasaService）概述MaaS（ModelasaService，模型即服务）是一种新型的人工智能服务模式，通过将复杂的AI模型封装为标准化服务，降低了模型的开发和部署门槛，帮助企业快速实现业务场景的智能化升级。2.MaaS的起源与概念MaaS的概念最早由美国数据科学家DJ·帕蒂尔在2012年提出，即“将机器学习算法打包成可重复使用的服务，使企
十大人工智能公司雪兽软件科技前沿人工智能
人工智能（AI）是我们这个时代最具变革性和颠覆性的技术之一，它从最初由少数研究人员和科技巨头涉足的相对小众的领域，发展成为一个价值数十亿美元的产业，吸引着全球各地的投资和人才。随着人工智能的潜力不断激发全球企业家、投资者和企业的想象力，一批新型公司应运而生，它们致力于突破这项技术的边界。在此，我们来探究一下截至2024年5月15日按市值排名前十的人工智能公司，这些公司正在助力塑造人工智能的未来。1
什么是通用人工智能？雪兽软件科技前沿人工智能
通用人工智能（AGI）被定义为机器的智能，使它们能够像人类一样理解、学习和执行智力任务。AGI模仿人类的思维和行为来解决任何复杂的问题。本文解释了AGI的基本原理、涉及的主要挑战以及AGI进步的十大趋势。什么是通用人工智能?通用人工智能（AGI）是机器的智能，使它们能够像人类一样理解、学习和执行智力任务。有了AGI，机器可以模仿人类的思维和行为来解决任何复杂的问题。这些机器被设计为具有全面的知识和
自动驾驶系列—解析自动驾驶汽车的“大脑”：电子电气架构详解与选型指南学步_技术自动驾驶自动驾驶汽车架构 EEA
欢迎来到我的技术小筑，一个专为技术探索者打造的交流空间。在这里，我们不仅分享代码的智慧，还探讨技术的深度与广度。无论您是资深开发者还是技术新手，这里都有一片属于您的天空。让我们在知识的海洋中一起航行，共同成长，探索技术的无限可能。探索专栏：学步_技术的首页——持续学习，不断进步，让学习成为我们共同的习惯，让总结成为我们前进的动力。技术导航：人工智能：深入探讨人工智能领域核心技术。自动驾驶：分享自动
【专题】AI市场趋势洞察（2024年）报告汇总PDF洞察（附原数据表）数据挖掘深度学习人工智能算法
原文链接：https://tecdat.cn/?p=38023当今时代，科技的浪潮汹涌澎湃，人工智能（AI）作为其中的核心力量，正深刻地改变着我们的生活方式和消费模式。在主流电商平台上，AI产品展现出多样化的销售态势。AI大家电虽规模最大，却面临销售额同比下降的挑战；AI手机凭借丰富功能实现销售额大幅增长；AI笔记本电脑则以惊人增速异军突起。而在智能家居领域，AI同样扮演着至关重要的角色。文末49
人工智能入门需要看那些书？人邮异步社区人工智能
对于想要入门人工智能的读者，以下是一些值得推荐的书籍：1、《人工智能：现代方法》（第4版）（上下册）作者：[美]斯图尔特·罗素（StuartRussell）[美]彼得·诺维格（PeterNorvig）著内容：系统性总结人工智能的方方面面，国际人工智能领域专家斯图尔特·罗素撰写人工智能百科书，时隔十年重磅更新，被全球全球1500多所学校采用的经典教材。全书分7个部分，共28章，理论部分介绍了人工智能
为什么要训练最懂您企业的AI助理？
随着人工智能技术的蓬勃发展，企业级AI助理已成为提升工作效率、优化客户服务体验的重要利器。这些智慧化的系统，通过模拟人类的认知功能，能够轻松应对复杂的数据分析、自动化繁琐的日常任务，甚至为企业决策提供有力支持。拥有一款懂您的企业AI助理，意味着您能够以更智能、更高效的方式推动企业前行。一、构建高度整合与个人化体验为了让AI机器人真正懂您的企业，我们首先要实现高度整合。通过连接企业资料库、应用程序、
2024年开发语言热度排名码上飞扬开发语言
随着技术的不断发展和变化，编程语言的热度也在不断演变。2024年即将到来，我们有必要回顾和展望当前和未来的开发语言市场。本文将基于多个因素，包括行业需求、社区支持、流行度以及新兴趋势，对2024年的开发语言热度进行排名和分析。1.Python：持续的热潮热度原因Python近年来一直在编程语言中占据着重要的地位，预计到2024年仍将保持其热度。主要原因包括：数据科学与人工智能：Python是数据科
开源人工智能模型框架：探索与实践 CodeJourney. 人工智能能源
摘要本文深入探讨了开源人工智能模型框架，旨在为研究人员、开发者及相关从业者提供全面的理解与参考。通过对多个主流开源框架，如TensorFlow、PyTorch、Keras、Detectron2、OpenCV、HuggingFaceTransformers、AllenNLP、MindSpore和Fastai的详细分析，阐述其特点、应用场景、优势与不足，并结合具体示例说明其使用方法，同时配以相关架构图
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl