AbnerAI

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）

数据集下载汇总链接：https://www.cvmart.net/dataSets

数据集将会不断更新，欢迎大家持续关注！

小目标检测

AI-TOD航空图像数据集

数据集下载地址：http://m6z.cn/5MjlYk

AI-TOD 在 28,036 张航拍图像中包含 8 个类别的 700,621 个对象实例。与现有航拍图像中的目标检测数据集相比，AI-TOD 中目标的平均大小约为 12.8 像素，远小于其他数据集。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第1张图片

iSAID航空图像大规模数据集

数据集下载地址：http://m6z.cn/6nUrYe

现有的 Earth Vision 数据集要么适用于语义分割，要么适用于对象检测。iSAID 是第一个用于航空图像实例分割的基准数据集。这个大规模和密集注释的数据集包含 2,806 张高分辨率图像的 15 个类别的 655,451 个对象实例。iSAID 的显着特征如下：(a) 大量具有高空间分辨率的图像，(b) 十五个重要且常见的类别，(c) 每个类别的大量实例，(d) 每个类别的大量标记实例图像，这可能有助于学习上下文信息，(e) 巨大的对象尺度变化，通常在同一图像内包含小、中和大对象，(f) 图像内具有不同方向的对象的不平衡和不均匀分布，描绘真实-生活空中条件，（g）几个小尺寸物体，外观模糊，只能通过上下文推理来解决，（h）由专业注释者执行的精确实例级注释，由符合良好规范的专家注释者交叉检查和验证定义的指导方针。

图片

TinyPerson数据集

数据集下载地址：http://m6z.cn/6vqF3T

在 TinyPerson 中有 1610 个标记图像和 759 个未标记图像（两者主要来自同一视频集），总共有 72651 个注释。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第3张图片

Deepscores 数据集

数据集下载地址：http://m6z.cn/5xgYdY

DeepScores 数据集的目标是推进小物体识别的最新技术，并将物体识别问题置于场景理解的背景下。DeepScores 包含高质量的乐谱图像，分为 300 0 000 张书面音乐，其中包含不同形状和大小的符号。拥有近一亿个小对象，这使得我们的数据集不仅独一无二，而且是最大的公共数据集。DeepScores 带有用于对象分类、检测和语义分割的基本事实。因此，DeepScores 总体上对计算机视觉提出了相关挑战，超出了光学音乐识别 (OMR) 研究的范围。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第4张图片

密集行人检测数据集

数据集下载地址：http://m6z.cn/6nUs1C

WiderPerson 数据集是野外行人检测基准数据集，其图像选自广泛的场景，不再局限于交通场景。我们选择了 13,382 张图像并标记了大约 400K 带有各种遮挡的注释。我们随机选择 8000/1000/4382 图像作为训练、验证和测试子集。与 CityPersons 和 WIDER FACE 数据集类似，我们不发布测试图像的边界框基本事实。用户需要提交最终的预测文件，我们将进行评估。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第5张图片

加州理工学院行人检测数据集

数据集下载地址：http://m6z.cn/5N3Yk7

加州理工学院行人数据集由大约 10 小时的 640x480 30Hz 视频组成，该视频取自在城市环境中通过常规交通行驶的车辆。注释了大约 250,000 帧（在 137 个大约分钟长的片段中），总共 350,000 个边界框和 2300 个独特的行人。注释包括边界框和详细的遮挡标签之间的时间对应关系。

NWPU VHR-10卫星图像数据集

数据集下载地址：http://m6z.cn/5UAbEW

NWPU VHR-10 Dataset 是一个用于空间物体检测的 10 级地理遥感数据集，其拥有 650 张包含目标的图像和 150 张背景图像，共计 800 张，目标种类包括飞机、舰船、油罐、棒球场、网球场、篮球场、田径场、港口、桥梁和汽车共计 10 个类别。

该数据集由西北工业大学于 2014 年发布，相关论文有《Multi-class geospatial object detection and geographic imageclassification based on collection of part detectors》、《A survey on objectdetection in optical remote sensing images》和《Learningrotation-invariant convolutional neural networks for object detection in VHRoptical remote sensing images》。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第6张图片

Inria 航空影像数据集

数据集下载地址：http://m6z.cn/6nUs6s

Inria 航空影像标注解决了遥感中的一个核心主题：航空影像的自动像素级标注（论文链接）。

数据集特点：

覆盖面积 810 平方公里（405 平方公里用于训练，405 平方公里用于测试）

空间分辨率为 0.3 m 的航空正射校正彩色图像

两个语义类的地面实况数据：构建和非构建（仅针对训练子集公开披露）

这些图像涵盖了不同的城市住区，从人口稠密的地区（例如，旧金山的金融区）到高山城镇（例如，奥地利蒂罗尔的 Lienz）。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第7张图片

RSOD遥感图像数据集

数据集下载地址：http://m6z.cn/5EN96H

它是一个开放的遥感图像目标检测数据集。数据集包括飞机、油箱、游乐场和立交桥。此数据集的格式为PASCAL VOC。数据集包括4个文件，每个文件用于一种对象。

飞机数据集，446张图片中有4993架飞机。

操场，189张图片中的191个操场。

天桥，176张图片中的180座天桥。

油箱，165张图片中的1586个油箱。

小目标检测数据集

数据集下载地址：http://m6z.cn/616t6R

从Internet（例如YouTube或Google）上的图像/视频收集的四个小物体数据集，包括4种类型的图像，可用于小物体目标检测的研究。

数据集包含四类：

fly：飞行数据集，包含600个视频帧，平均每帧86±39个物体（648×72 @ 30 fps）。32张图像用于训练（1：6：187），50张图像用于测试（301：6：600）。

honeybee：蜜蜂数据集，包含118张图像，每张图像平均有28±6个蜜蜂（640×480）。数据集被平均分配用于训练和测试集。仅前32张图像用于训练。

seagull：海鸥数据集，包含三个高分辨率图像（624×964），每个图像平均有866±107个海鸥。第一张图片用于训练，其余图片用于测试。

fish：鱼数据集，包含387帧视频数据，平均每帧56±9条鱼（300×410 @ 30 fps）。32张图像进行训练（1：3：94），65张图像进行测试（193：3：387）。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第8张图片

目标检测开源数据集

COCO2017数据集

COCO2017是2017年发布的COCO数据集的一个版本，主要用于COCO在2017年后持有的物体检测任务、关键点检测任务和全景分割任务。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第9张图片

火焰和烟雾图像数据集

数据集链接：http://m6z.cn/6fzn0f

该数据集由早期火灾和烟雾的图像数据集组成。数据集由在真实场景中使用手机拍摄的早期火灾和烟雾图像组成。大约有7000张图像数据。图像是在各种照明条件（室内和室外场景）、天气等条件下拍摄的。该数据集非常适合早期火灾和烟雾探测。数据集可用于火灾和烟雾识别、检测、早期火灾和烟雾、异常检测等。数据集还包括典型的家庭场景，如垃圾焚烧、纸塑焚烧、田间作物焚烧、家庭烹饪等。本文仅含100张左右。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第10张图片

DOTA航拍图像数据集

数据集链接：http://m6z.cn/6vIKlJ

DOTA是用于航空图像中目标检测的大型数据集。它可以用于开发和评估航空图像中的目标探测器。这些图像是从不同的传感器和平台收集的。每个图像的大小在800×800到20000×20000像素之间，包含显示各种比例、方向和形状的对象。DOTA图像中的实例由航空图像解释专家通过任意（8 d.o.f.）四边形进行注释。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第11张图片

AITEX数据集

数据集链接：http://m6z.cn/5DdJL1

该数据库由七个不同织物结构的245张4096 x 256像素图像组成。数据库中有140个无缺陷图像，每种类型的织物20个，除此之外，有105幅纺织行业中常见的不同类型的织物缺陷（12种缺陷）图像。图像的大尺寸允许用户使用不同的窗口尺寸，从而增加了样本数量。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第12张图片

T-LESS数据集

数据集链接：http://m6z.cn/5wnucm

该数据集采集的目标为工业应用、纹理很少的目标，同时缺乏区别性的颜色，且目标具有对称性和互相关性，数据集由三个同步的传感器获得，一个结构光传感器，一个RGBD sensor，一个高分辨率RGBsensor，从每个传感器分别获得了3.9w训练集和1w测试集，此外为每个目标创建了2个3D model,一个是CAD手工制作的另一个是半自动重建的。训练集图片的背景大多是黑色的，而测试集的图片背景很多变，会包含不同光照、遮挡等等变换（之所以这么做作者说是为了使任务更具有挑战性）。

同时作者解释了本数据集的优势在于：1.大量跟工业相关的目标；2.训练集都是在可控的环境下抓取的；3.测试集有大量变换的视角；4.图片是由同步和校准的sensor抓取的；5.准确的6D pose标签；6.每个目标有两种3D模型；

H²O 行人交互检测数据集

数据集链接：http://m6z.cn/6fzmQf

H²O由V-COCO数据集中的10301张图像组成，其中添加了3635张图像，这些图像主要包含人与人之间的互动。所有的H²O图像都用一种新的动词分类法进行了注释，包括人与物和人与人之间的互动。该分类法由51个动词组成，分为5类：

描述主语一般姿势的动词

与主语移动方式有关的动词

与宾语互动的动词

描述人与人之间互动的动词

涉及力量或暴力的互动动词

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第13张图片

SpotGarbage垃圾识别数据集

数据集链接：http://m6z.cn/5ZMmRG

图像中的垃圾（GINI）数据集是SpotGarbage引入的一个数据集，包含2561张图像，956张图像包含垃圾，其余的是在各种视觉属性方面与垃圾非常相似的非垃圾图像。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第14张图片

NAO自然界对抗样本数据集

数据集链接：http://m6z.cn/5KJWJA

NAO包含7934张图像和9943个对象，这些图像未经修改，代表了真实世界的场景，但会导致最先进的检测模型以高置信度错误分类。与标准MSCOCO验证集相比，在NAO上评估时，EfficientDet-D7的平均精度（mAP）下降了74.5%。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第15张图片

Labelme 图像数据集

数据集链接：http://m6z.cn/5Sg9NX

Labelme Dataset 是用于目标识别的图像数据集，涵盖 1000 多个完全注释和 2000 个部分注释的图像，其中部分注释图像可以被用于训练标记算法，测试集拥有来自于世界不同地方拍摄的图像，这可以保证图片在续联和测试之间会有较大的差异。该数据集由麻省理工学院 –计算机科学和人工智能实验室于 2007 年发布，相关论文有《LabelMe: a database and web-based tool for image annotation》。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第16张图片

印度车辆数据集

数据集链接：http://m6z.cn/6uxAIx

该数据集包括小众印度车辆的图像，如Autorikshaw、Tempo、卡车等。该数据集由用于分类和目标检测的小众印度车辆图像组成。据观察，这些小众车辆（如autorickshaw、tempo、trucks等）上几乎没有可用的数据集。这些图像是在白天、晚上和晚上的不同天气条件下拍摄的。该数据集具有各种各样的照明、距离、视点等变化。该数据集代表了一组非常具有挑战性的利基类车辆图像。该数据集可用于驾驶员辅助系统、自动驾驶等的图像识别和目标检测。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第17张图片

Seeing 3D chairs椅子检测模型

数据集链接：http://m6z.cn/5DdK0v

椅子数据集包含大约1000个不同三维椅子模型的渲染图像。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第18张图片

SUN09场景理解数据集

数据集链接：http://m6z.cn/60wX8r

SUN09数据集包含12000个带注释的图像，其中包含200多个对象类别。它由自然、室内和室外图像组成。每个图像平均包含7个不同的注释对象，每个对象的平均占用率为图像大小的5%。对象类别的频率遵循幂律分布。发布者使用 397 个采样良好的类别进行场景识别，并以此搭配最先进的算法建立新的性能界限。

该数据集由普林斯顿视觉与机器人实验室于 2014 年发布，相关论文有《SUN Database: Large-scale Scene Recognition from Abbey to Zoo》、《SUN Database: Exploring a Large Collection of Scene Categories》。

Unsplash图片检索数据集

数据集链接：http://m6z.cn/5wnuoM

使用迄今为止公开共享的全球最大的开放检索信息数据集。Unsplash数据集由250000多名贡献摄影师创建，并包含了数十亿次照片搜索的信息和对应的照片信息。由于Unsplash数据集中包含广泛的意图和语义，它为研究和学习提供了新的机会。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第19张图片

HICO-DET人物交互检测数据集

数据集链接：http://m6z.cn/5DdK6D

HICO-DET是一个用于检测图像中人-物交互（HOI）的数据集。它包含47776幅图像（列车组38118幅，测试组9658幅），600个HOI类别，由80个宾语类别和117个动词类别构成。HICO-DET提供了超过150k个带注释的人类对象对。V-COCO提供了10346张图像（2533张用于培训，2867张用于验证，4946张用于测试）和16199人的实例。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第20张图片

上海科技大学人群统计数据集

数据集链接：http://m6z.cn/5Sgafn

上海科技数据集是一个大规模的人群统计数据集。它由1198张带注释的群组图像组成。数据集分为两部分，A部分包含482张图像，B部分包含716张图像。A部分分为训练和测试子集，分别由300和182张图像组成。B部分分为400和316张图像组成的序列和测试子集。群组图像中的每个人都有一个靠近头部中心的点进行注释。总的来说，该数据集由33065名带注释的人组成。A部分的图像是从互联网上收集的，而B部分的图像是在上海繁忙的街道上收集的。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第21张图片

生活垃圾数据集

数据集链接：http://m6z.cn/6n5Adu

大约9000多张独特的图片。该数据集由印度国内常见垃圾对象的图像组成。图像是在各种照明条件、天气、室内和室外条件下拍摄的。该数据集可用于制作垃圾/垃圾检测模型、环保替代建议、碳足迹生成等。

RMFD口罩遮挡人脸数据集

数据集下载地址：http://m6z.cn/61z9Fv

当前大多数高级人脸识别方法都是基于深度学习而设计的，深度学习取决于大量人脸样本。但是，目前尚没有公开可用的口罩遮挡人脸识别数据集。为此，这项工作提出了三种类型的口罩遮挡人脸数据集，包括口罩遮挡人脸检测数据集（MFDD），真实口罩遮挡人脸识别数据集（RMFRD）和模拟口罩遮挡人脸识别数据集（SMFRD）。基于这些数据集，可以开发口罩遮挡人脸的各种应用。本项目开发的多粒度口罩遮挡人脸识别模型可达到95％的准确性，超过了行业报告的结果。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第22张图片

GTSRB德国交通标志数据集

数据集下载地址：http://m6z.cn/5wJJLA

德国交通标志基准测试是在 2011 年国际神经网络联合会议 (IJCNN) 上举办的多类单图像分类挑战赛。我们诚邀相关领域的研究人员参与：该比赛旨在参与者无需特殊领域知识。我们的基准测试具有以下属性：

单图像、多类分类问题

40多个分类

总共超过 50,000 张图片

逼真的大型数据库

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第23张图片

VOC2005车辆数据集

数据集下载地址：http://m6z.cn/5U2X4u

该数据集中含有自行车、摩托车、汽车、货车的图像数据，可用于CNN模型以实现车辆识别和车辆分类，其中自行车、摩托车、汽车数据来自2005 PASCAL视觉类挑战赛（VOC2005）所使用的数据的筛选处理结果，货车图片来自网络收集，后期通过筛选处理得到。在本数据中，训练数据集与测试数据集占比约为5:1。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第24张图片

Winegrape检测数据集

数据集下载地址：http://m6z.cn/5TikF9

WGISD（Wine Grape Instance Segmentation Dataset）是为了提供图像和注释来研究对象检测和实例分割，用于葡萄栽培中基于图像的监测和现场机器人技术。它提供了来自五种不同葡萄品种的实地实例。这些实例显示了葡萄姿势、光照和焦点的变化，包括遗传和物候变化，如形状、颜色和紧实度。可能的用途包括放宽实例分割问题：分类（图像中是否有葡萄？）、语义分割（图像中的“葡萄像素”是什么？）、对象检测（图像中的葡萄在哪里？）、和计数（每个簇有多少浆果？）。

全球小麦检测数据集

数据集下载地址：http://m6z.cn/5wJK64

检测小麦穗是一项重要任务，可以估计相关性状，包括穗种群密度和穗特征，如卫生状况、大小、成熟阶段和芒的存在。本数据集包含 4,700 张高分辨率 RGB 图像和 190,000 个标记的小麦头，这些小麦头采集自世界各地不同生长阶段的不同基因型的多个国家。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第25张图片

Linkopings交通标志数据集

数据集下载地址：http://m6z.cn/68ldS0

通过记录超过 350 公里的瑞典高速公路和城市道路的序列，创建了一个数据集。一个 1.3 兆像素的彩色摄像机，一个点灰色变色龙，被放置在一辆汽车的仪表板上，从前窗向外看。摄像头略微指向右侧，以便尽可能多地覆盖相关标志。该镜头的焦距为 6.5 毫米，视野约为 41 度。高速公路上的典型速度标志大约为 90 cm 宽，如果要在大约 30 m 的距离处检测到它们，则对应于大约 50 像素的大小。总共记录了超过 20 000 帧，其中每五帧被手动标记。每个标志的标签包含标志类型（人行横道、指定车道右侧、禁止站立或停车、优先道路、让路、50 公里/小时或 30 公里/小时）、能见度状态（遮挡、模糊或可见）和道路状态（是否标志是在正在行驶的道路上或在小路上）。

防护装备-头盔和背心检测

数据集下载地址：http://m6z.cn/61zarT

包含 774 个众包图像和 698 个网络挖掘图像。众包和网络挖掘的图像分别包含 2,496 和 2,230 个工人实例。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第26张图片

加州理工学院相机陷阱数据集

数据集链接：https://beerys.github.io/CaltechCameraTraps/

该数据集包含来自美国西南部 140 个摄像头位置的 243,100 张图像，带有 21 个动物类别的标签（加上空白），主要是在物种级别（例如，最常见的标签是负鼠、浣熊和土狼），以及大约 66,000 个边界框注释。大约 70% 的图像被标记为空。

水下垃圾检测数据集

数据集下载地址：http://m6z.cn/6nnDQK

该数据来自 J-EDI 海洋垃圾数据集。构成该数据集的视频在质量、深度、场景中的对象和使用的相机方面差异很大。它们包含许多不同类型的海洋垃圾的图像，这些图像是从现实世界环境中捕获的，提供了处于不同衰减、遮挡和过度生长状态的各种物体。此外，水的清晰度和光的质量因视频而异。这些视频经过处理以提取 5,700 张图像，这些图像构成了该数据集，所有图像都在垃圾实例、植物和动物等生物对象以及 ROV 上标有边界框。

医学影像

3D-IRCADB 脏器分割数据集

数据集链接：http://m6z.cn/6x5OSn

3D-IRCADb-01 数据库由 10 名女性和 10 名男性 75% 的肝肿瘤患者的 3D CT 扫描组成。20个文件夹对应20个不同的患者，可以单独下载也可以联合下载。下表提供了图像信息，例如肝脏大小（宽度、深度、高度）或根据 Couninaud 分割的肿瘤位置。它还表明肝脏分割软件可能遇到的主要困难是由于与邻近器官的接触、肝脏的非典型形状或密度，甚至图像中的伪影。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第28张图片

FASCICLE 小腿肌肉超声数据集

数据集链接：http://m6z.cn/631rex

FAscicle 小腿肌肉超声数据集是一个由 812 幅小腿肌肉超声图像组成的数据集，用于分析肌肉弱点并预防受伤。该数据集在文章 AW-Net：B 型超声图像上的自动肌肉结构分析以预防伤害中进行了介绍。它结合了由 Ryan Cunningham 等人发表的两篇文章“使用卷积、残差和反卷积神经网络从 B 模式超声图像中估计全区域骨骼肌纤维方向”提供的数据集。和 Neil Cronin 发表的“使用深度学习对肌肉骨骼超声图像进行自动分析”，并附有补充注释。

该 zip 文件包含两个数据集，分别分为两个由其作者命名的文件夹。每个数据集的每个图像都有一个匹配的分束分割掩码和一个可按名称识别的腱膜分割掩码。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第29张图片

肿瘤数据集

数据集链接：http://m6z.cn/5zCyGj

这一数据集是通过仔细注释几名患有不同器官肿瘤并在多家医院被诊断出的患者的组织图像获得的。该数据集是通过从TCGA存档下载以 40 倍放大倍率捕获的 H&E 染色组织图像创建的。H&E 染色是增强组织切片对比度的常规方案，通常用于肿瘤评估（分级、分期等）。考虑到多个器官和患者的细胞核外观的多样性，以及多家医院采用的丰富染色方案，训练数据集将能够开发出开箱即用的稳健且可推广的细胞核分割技术。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第30张图片

结直肠腺癌组织学图像数据集

数据集链接：http://m6z.cn/6axBLk

该数据集包含 100 张 H&E 染色的结直肠腺癌组织学图像。出于检测目的，在中心/周围共标记了 29,756 个原子核。其中，有 22,444 个细胞核也具有相关的类别标签，即上皮细胞、炎症细胞、成纤维细胞和其他细胞核。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第31张图片

淋巴结切片的组织病理学数据集

数据集链接：http://m6z.cn/6axBNq

本数据集由从淋巴结切片的组织病理学扫描中提取的 327.680 张彩色图像 (96 x 96px) 组成。每个图像都带有一个二进制标签，表示存在转移组织。PCam 为机器学习模型提供了新的基准：大于 CIFAR10，小于 imagenet，可在单个 GPU 上训练。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第32张图片

m2caiSeg腹腔镜图像数据集

数据集链接：http://m6z.cn/5yW8q0

m2caiSeg是根据真实世界外科手术的内窥镜视频源创建的。数据由 307 张图像组成，每张图像都针对场景中存在的器官和不同的手术器械进行了注释。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第33张图片

血细胞图像数据集

数据集下载地址：http://m6z.cn/5zdTDb

该数据集包含 12,500 张带有细胞类型标签 (CSV) 的增强血细胞图像 (JPEG)。4 种不同细胞类型中的每一种都有大约 3,000 张图像，这些图像被分组到 4 个不同的文件夹中（根据细胞类型）。细胞类型是嗜酸性粒细胞、淋巴细胞、单核细胞和中性粒细胞。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第34张图片

脑肿瘤 MRI 数据集

数据集下载地址：http://m6z.cn/63iHcV

该数据集包含7022张人脑 MRI 图像，分为 4 类：胶质瘤-脑膜瘤-无肿瘤和垂体。注意这个数据集中的图像大小是不同的。您可以在预处理并去除多余的边距后将图像调整为所需的大小。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第35张图片

糖尿病性黄斑水肿的OCT图像数据集

数据集下载地址：http://m6z.cn/6xn7cp

使用杜克企业数据统一内容浏览器搜索引擎追溯识别杜克眼科中心医学视网膜实践中的患者，并使用与他们就诊相关的 DME (ICD-9 362.07) 计费代码。然后，一名眼科医生使用标准 Spectralis（Heidelberg Engineering，Heidelberg，Germany）61 线体积扫描协议确定了 6 名临床成像的患者，这些患者具有严重的 DME 病理学和不同的图像质量。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第36张图片

身体部位X射线图像数据集

数据集下载地址：http://m6z.cn/5yth1K

本数据集收集了来自身体各部位的X光图片

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第37张图片

眼病深度学习数据集

数据集下载地址：http://m6z.cn/5yth3m

712张片状角膜溃疡的眼部染色图像

皮肤病数据集

数据集下载地址：http://m6z.cn/6pQW7A

23类皮肤病的图像数据，图像总数约为 19,500 张，其中大约 15,500 张已在训练集中分割，其余在测试集中分割。

心脏病发作分析和预测数据集

数据集下载地址：http://m6z.cn/6ikH8v

本数据集含有303名心脏病患者的数据。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第38张图片

膝关节 X 射线图像数据集

数据集下载地址：http://m6z.cn/6aOU5G

该数据集包括从知名医院和诊断中心收集的 1650 张膝关节电子 X 射线图像。X 射线图像是使用 PROTEC PRS 500E X 射线机获取的。原始图像是 8 位灰度图像。每个 X 射线膝关节 X 射线图像均由 2 位医学专家根据 Kellgren 和 Lawrence 等级手动注释/标记。

关键点检测

手部姿势关键点检测数据集

数据集下载链接：http://u3v.cn/6d3lZV

数据集由序列构成。在每个序列中，您都可以找到组成它的帧。一个帧由4个彩色图像、4组投影在每个图像平面中的2D关节、4个边界框、1组Leap Motion Controller提供的3D点和4组重新投影到每个相机坐标帧的3D点组成。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第40张图片

动物姿势数据集

数据集下载链接：http://u3v.cn/6kDLfr

该数据集提供了五个类别的动物姿势注释：狗、猫、牛、马、羊，在4,000 多张图像中总共有6,000多个实例。此外，该数据集还包含其他7 个动物类别的边界框注释。在论文中查找详细信息。

一共标注了 20 个关键点：两只眼睛、喉咙、鼻子、马肩隆、两个耳根、尾根、四个肘部、四个膝盖、四个爪子。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第41张图片

电影人物关节关键点数据集

数据集下载链接：http://u3v.cn/5tW5zx

该数据集从流行的好莱坞电影中自动收集了5003个图像数据。这些图像是通过在30部电影的每10帧上运行一个最先进的人检测器获得的。然后，被高度自信地检测到的人（大约2万名候选人）被送往众包市场亚马逊机械土耳其公司（Amazon Mechanical Turk），以获得地面真实标签。每幅图片都由五名特克斯人以0.01美元的价格标注，以标注10个上身关节。在每个图像中取五个标记的中位数，以对离群值注释保持稳健。

MPIIGaze Dataset

数据集下载链接：http://u3v.cn/5BsiEe

MPIIGaze数据集包含在三个多月的日常笔记本电脑使用过程中从15名参与者收集的213659张图像。在外观和照明方面，数据集比现有的数据集变化更大。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第42张图片

人体足部关键点数据集

数据集下载链接：http://u3v.cn/5IYvIV

现有的人体姿势数据集包含有限的身体部位类型。MPII 数据集标注了脚踝、膝盖、臀部、肩膀、肘部、手腕、颈部、躯干和头顶，而 COCO 还包括一些面部关键点。对于这两个数据集，足部注释仅限于脚踝位置。然而，图形应用程序（例如头像重定向或 3D 人体形状重建）需要足部关键点，例如大脚趾和脚跟。在没有足部信息的情况下，这些方法会遇到诸如糖果包装效果、地板穿透和足部滑冰等问题。为了解决这些问题，COCO 数据集中的一小部分脚实例使用 Clickworker 平台进行标记。它分为来自 COCO 训练集的 14K 注释和来自验证集的 545 个注释。总共标记了 6 个英尺关键点。考虑足部关键点的 3D 坐标而不是表面位置。例如，对于确切的脚趾位置，数据集标记了指甲和皮肤连接之间的区域，并且还通过标记脚趾的中心而不是表面来考虑深度。

人群姿态数据集

数据集下载链接：http://u3v.cn/65x8MQ

多人姿态估计是许多计算机视觉任务的基础，近年来取得了重大进展。然而，以前很少有方法研究拥挤场景中的姿态估计问题，而在许多场景中，这仍然是一个具有挑战性和不可避免的问题。此外，目前的基准无法对此类案件进行适当评估。在本文中，我们提出了一种新的有效方法来解决人群中的姿势估计问题，并提出了一个新的数据集来更好地评估算法。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第43张图片

图像去噪

PolyU数据集

数据集下载地址：https://sourl.cn/rMsdE8

大多数以前的图像去噪方法都集中在加性高斯白噪声（AWGN）上。然而，随着计算机视觉技术的进步，现实世界中的噪声图像去噪问题也随之而来。为了在实现并发真实世界图像去噪数据集的同时促进对该问题的研究，作者们构建了一个新的基准数据集，其中包含不同自然场景的综合真实世界噪声图像。这些图像是由不同的相机在不同的相机设置下拍摄的。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第44张图片

FMD（荧光显微镜去噪）数据集

数据集下载地址：https://sourl.cn/Wyqrui

荧光显微镜使现代生物学取得了巨大的发展。由于其固有的微弱信号，荧光显微镜不仅比摄影噪声大得多，而且还呈现出泊松-高斯噪声，其中泊松噪声或散粒噪声是主要的噪声源。为了获得干净的荧光显微镜图像，非常需要有专门设计用于对荧光显微镜图像进行降噪的有效降噪算法和数据集。虽然存在这样的算法，但没有这样的数据集可用。在本文中，我们通过构建专用于泊松-高斯去噪的数据集 - 荧光显微镜去噪 (FMD) 数据集来填补这一空白。该数据集由 12,000 个真实荧光显微镜图像组成，这些图像使用商业共焦、双光子、宽视野显微镜和代表性生物样本，如细胞、斑马鱼和小鼠脑组织。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第45张图片

SIDD智能手机图像去噪数据集

数据集下载地址：https://sourl.cn/jdpJZ6

该数据集包含以下智能手机在不同光照条件下拍摄的 160 对噪声/真实图像：

GP: Google Pixel

IP: iPhone 7

S6: Samsung Galaxy S6

Edge N6: Motorola Nexus 6

G4: LG G4

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第46张图片

SIDD-small数据集

数据集下载地址：https://sourl.cn/kaYGxd

一个小型版本的数据集，它由代表 160 个场景实例的160 个图像对（噪声和ground-truth）组成。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第47张图片

Super Resolution Benchmarks

数据集下载地址：https://sourl.cn/Bp6QZs

来自于AIM 2022 压缩图像和视频超分辨率挑战赛”中的前 5 名解决方案工作：Swin2SR: SwinV2 Transformer for Compressed Image Super-Resolution and Restoration

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第48张图片

工业检测数据集

坑洼检测数据集

数据集下载地址：http://m6z.cn/5wJJTa

本数据集汇总了700个在坑洼处带有3K +注释的图像，用于从道路图像中检测坑洼，检测道路地形和坑洼。

天池铝型材表面缺陷数据集

数据集下载地址：http://m6z.cn/61EksR

大赛数据集里有1万份来自实际生产中有瑕疵的铝型材监测影像数据，每个影像包含一个或多种瑕疵。供机器学习的样图会明确标识影像中所包含的瑕疵类型。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第49张图片

Kylberg 纹理数据集

数据集下载地址：http://m6z.cn/61Ekw5

在布匹的实际生产过程中，由于各方面因素的影响，会产生污渍、破洞、毛粒等瑕疵，为保证产品质量，需要对布匹进行瑕疵检测。布匹疵点检验是纺织行业生产和质量管理的重要环节，目前人工检测易受主观因素影响，缺乏一致性；并且检测人员在强光下长时间工作对视力影响极大。由于布匹疵点种类繁多、形态变化多样、观察识别难道大，导致布匹疵点智能检测是困扰行业多年的技术瓶颈。本数据涵盖了纺织业中布匹的各类重要瑕疵，每张图片含一个或多种瑕疵。数据包括包括素色布和花色布两类，其中，素色布数据约8000张；花色布数据约12000张。

东北大学带钢表面缺陷数据集

数据集下载地址：http://m6z.cn/5U87us

数据集收集了夹杂、划痕、压入氧化皮、裂纹、麻点和斑块6种缺陷，每种缺陷300张，图像尺寸为200×200。数据集包括分类和目标检测两部分，不过目标检测的标注中有少量错误，需要注意。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第50张图片

Severstal 带钢缺陷数据集

数据集下载地址：http://m6z.cn/61EkBp

该数据集中提供了四种类型的带钢表面缺陷。训练集共有12568张，测试集5506张。图像尺寸为1600×256。

UCI 带钢缺陷数据集

数据集下载地址：http://m6z.cn/61EkUh

该数据集包含了7种带钢缺陷类型。这个数据集不是图像数据，而是带钢缺陷的28种特征数据，可用于机器学习项目。钢板故障的7种类型：装饰、Z_划痕、K_划痕、污渍、肮脏、颠簸、其他故障。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第51张图片

DAGM 2007数据集

数据集下载地址：http://m6z.cn/5F5eQV

该数据集主要针对纹理背景上的杂项缺陷，为较弱监督的训练数据。包含十个数据集，前六个为训练数据集，后四个为测试数据集。每个数据集均包含以灰度8位PNG格式保存的1000个“无缺陷”图像和150个“有缺陷”图像，每个数据集由不同的纹理模型和缺陷模型生成。“无缺陷”图像显示的背景纹理没有缺陷，“无缺陷”图像的背景纹理上恰好有一个标记的缺陷。所有数据集已随机分为大小相等的训练和测试子数据集。弱标签以椭圆形表示，大致表示缺陷区域。

磁瓦缺陷数据集

数据集下载地址：http://m6z.cn/5F5eSd

中国科学院自动所一个课题组收集的数据集，是“Saliency of magnetic tile surface defects”这篇论文的数据集。收集了6种常见磁瓦缺陷的图像，并做了语义分割的标注。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第52张图片

RSDDs铁轨表面缺陷数据集

数据集下载地址：http://m6z.cn/61EkKL

RSDDs数据集包含两种类型的数据集：第一种是从快车道捕获的I型RSDDs数据集，其中包含67个具有挑战性的图像。第二个是从普通/重型运输轨道捕获的II型RSDDs数据集，其中包含128个具有挑战性的图像。

两个数据集的每幅图像至少包含一个缺陷，并且背景复杂且噪声很大。

RSDDs数据集中的这些缺陷已由一些专业的人类观察员在轨道表面检查领域进行了标记。

KTH-TIPS 纹理图像数据集

数据集下载地址：http://m6z.cn/61EkMH

KTH-TIPS 是一个纹理图像数据集，在不同的光照、角度和尺度下拍摄的不同材质表面纹理图片。类型包括砂纸、铝箔、发泡胶、海绵、灯芯绒、亚麻、棉、黑面包、橙皮和饼干共10类。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第53张图片

印刷电路板（PCB）瑕疵数据集

数据集下载地址：http://m6z.cn/5U87Ji

这是一个公共的合成PCB数据集，由北京大学发布，其中包含1386张图像以及6种缺陷（缺失孔，鼠咬坏，开路，短路，杂散，伪铜），用于检测，分类和配准任务。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第54张图片

MIO-TCD车辆分类数据集

数据集下载链接：http://suo.nz/2wf2fh

该数据集包含总共 786,702 张图像，其中分类数据集中有 648,959 张图像，定位数据集中有 137,743 张图像，这些图像是在一天中的不同时间和一年中的不同时期由部署在加拿大和美国的数千个交通摄像头采集的。这些图像已被选中以涵盖广泛的挑战，并且代表了当今在城市交通场景中捕获的典型视觉数据。每个运动物体都经过近200人的仔细识别，可以对各种算法进行定量比较和排名。该数据集旨在提供严格的基准测试工具，用于训练和测试现有算法和新算法，用于交通场景中移动车辆的分类和定位。数据集分为两部分：“分类挑战数据集”和“定位挑战数据集”。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第55张图片

时尚产品图片数据集

数据集下载链接：http://suo.nz/2DKP2W

每个产品都由类似42431的ID标识。可以在styles.csv中找到所有产品的映射，从images/42431.jpg获取该产品的图像，并从styles/42431.json获取完整的元数据。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第56张图片

水稻病害数据集

数据集下载链接：http://suo.nz/2KB4Fj

用于检测不同的水稻病害，2K+ 图像主要涵盖 3 种疾病——褐斑病、Hispa 和叶瘟病。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第57张图片

火灾检测数据集

数据集下载链接：http://suo.nz/2S7hIo

检测图像中是否存在火灾，含有来自不同场景的 500 多张图像。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第58张图片

天气和日光类型分类数据集

数据集下载链接：http://suo.nz/2ZziE3

用于图像分类的多类天气数据集 (MWD) 是题为“使用异构集成方法从静态图像进行多类天气识别”的研究论文，中使用的一个有价值的数据集。该数据集通过提取用于识别不同天气条件的各种特征，为室外天气分析提供了一个平台。1000 多张图像，具有 5 种以上的不同类别——日出、雨天、多云、傍晚、夜晚等。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第59张图片

安全帽佩戴数据集

数据集下载链接：http://suo.nz/2M6i3r

该数据集中有 5000 张图像和 5000 个注释。原始数据集包含三个类别（人、头部和头盔），共有 2501 个标签。此外，原始数据集没有完全标记。我们在结果中的数据集上添加了三个新标签，新标签由六个类别（头盔、带头盔的头部、带头盔的人、头部、不带头盔的人和面部）组成，共有 75578 个标签。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第60张图片

SHWD安全帽佩戴检测数据集

数据集下载链接：http://suo.nz/2TCswQ

SHWD 提供了用于安全头盔佩戴和人头检测的数据集。它包括7581张图像，其中9044个人体安全头盔佩戴对象（正面）和111514个正常头部对象（未佩戴或负面）。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第61张图片

摩托车头盔检测数据集

数据集下载链接：http://suo.nz/318FBx

HELMET 数据集包含 2016 年在缅甸 12 个观测点录制的 910 个摩托车交通视频剪辑。每个视频剪辑的持续时间为 10 秒，以 10fps 的帧速率和 1920x1080 的分辨率记录。该数据集包含 10,006 辆摩托车，超过了现有数据集中可用的摩托车数量。数据集中的 91,000 个带注释帧中的每辆摩托车都用边界框进行注释，并且提供每辆摩托车的骑手人数以及特定位置的头盔使用数据。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第62张图片

安全帽和安全背心（反光衣）图像数据集

数据集下载链接：http://suo.nz/38ESGe

数据集中只有一个文件夹。

文件名以 pos 开头：图像包含安全帽或安全背心。文件名以 neg 开头：图像既不包含安全帽也不包含安全背心。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第63张图片

垃圾分类数据集

数据集下载链接：http://suo.nz/3gb5Jj

该数据集包含来自 12 个不同类别的生活垃圾的 15,150 张图像；纸、纸板、生物、金属、塑料、绿色玻璃、棕色玻璃、白色玻璃、衣服、鞋子、电池和垃圾。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第64张图片

塑料-纸张-垃圾袋合成图像数据集

数据集下载链接：http://suo.nz/2i1p7K

该数据集包含塑料袋、纸袋和垃圾袋的合成图像。Bag Classes 文件夹分别包含每个图像类的 5000 张图像，而 ImageClassesCombined 文件夹包含所有组合的类的注释图像。注释采用 COCO 格式。

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第65张图片

垃圾溢出数据集

数据集下载链接：http://suo.nz/2iM1Dd

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第66张图片

垃圾溢出数据集，来源印度街区。

YOLO格式的头盔/头部检测数据集

数据集下载链接：http://suo.nz/2pChfA

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）_第67张图片

你可能感兴趣的:(目标检测,计算机视觉,人工智能,目标跟踪,视觉检测)

基于yolov10的水果成熟度之石榴成熟度检测 qq1309399183 计算机视觉实战项目集合 YOLO 目标检测目标跟踪计算机视觉人工智能水果成熟度检测视觉检测
石榴成熟度检测**Pomegranate*是一个基于深度学习的系统，旨在自动化检测和分类石榴果实的生长阶段（未成熟、成熟、成熟期）。该系统采用最新的YOLOv10目标检测模型，能够高效地分析图像或视频中的石榴果实，并根据其外观特征识别其生长阶段。通过这种技术，农民可以更好地监控石榴果实的发育过程，优化作物管理，合理安排收获时间，从而提高生产效率和经济收益。系统概述石榴作为一种重要的水果作物，广泛种
[Github推荐]CVPR2019录用论文下载及可视化论文网站 spearhead_cai 计算机视觉深度学习科研论文 CVPR Github 计算机视觉深度学习
简介CVPR是IEEEConferenceonComputerVisionandPatternRecognition的缩写，即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议。它是IEEE一年一度的学术性会议，会议的主要内容是计算机视觉与模式识别技术。CVPR是世界顶级的计算机视觉会议（三大顶会之一，另外两个是ICCV和ECCV），本会议每年都会有固
【C++】——精细化哈希表架构：理论与实践的综合分析 vip1024p 面试学习路线阿里巴巴 c++散列表架构
先找出你的能力在哪里，然后再决定你是谁。——塔拉·韦斯特弗《你当像鸟飞往你的山》目录1.C++与哈希表：核心概念与引入2.哈希表的底层机制：原理与挑战2.1核心功能解析：效率与灵活性的平衡2.2哈希冲突的本质：问题与应对策略2.3开散列与闭散列：两大解决方案的比较3.闭散列的精确实现：从设计到优化3.1整体框架设计：面向扩展的架构3.2仿函数的灵活性：高效哈希的关键3.3插入操作：冲突检测与位置分
【折线图 Line】——5 花花 Show Python pyecharts—从0到精通信息可视化数据分析 python
解锁数据可视化的魔法钥匙——pyecharts实战指南在这个数据为王的时代，每一次点击、每一次交易、每一份报告背后都隐藏着无尽的故事与洞察。但你是否曾苦恼于如何将这些冰冷的数据转化为直观、吸引人的视觉盛宴？欢迎来到《pyecharts图形绘制大师班》在这里，你将不再受限于单调的表格和图表，而是学会如何运用pyecharts这一强大的Python数据可视化库，将复杂的数据转化为令人惊叹的交互式图形。
疯狂python_疯狂 python weixin_39646970 疯狂python
书籍：python游戏编码CodingGamesinPython-2018简介初学者和有经验的程序员可以使用Python来构建和玩电脑游戏，从令人惊叹的脑筋急转弯到具有爆炸性声音效果和3D图形的疯狂动作游戏。Python中CodingGames的每一章都展示了如何用简单的编号步骤构建一个完整的工作游戏。本书讲授如何使用免费的资源，如PyGameZero和Ble...文章python人工智能命理20
【人工智能】数据挖掘与应用题库（101-200）奋力向前123 人工智能人工智能数据挖掘
1、有矩阵A3×2，B2×3，C3×3，下列运算有意义的是（）答案：BC2、13524的逆序数为（）答案：33、矩阵A中元素a14的余子式记作M14，代数余子式记作A14，二者关系为（）答案：相反4、关于机器学习与深度学习的范畴关系，下列说法正确的是？答案：深度学习是机器学习的子集（分支）5、关于机器学习的本质，下列表述最恰当的是？答案：从数据或环境反馈中自主学习到规则6、深度学习的“深度”是指？
【人工智能】数据挖掘与应用题库（301-400）奋力向前123 人工智能人工智能数据挖掘 pandas
1、关于pandas中的Series描述错误的是答案：Series默认没有index2、关于DataFrame描述正确的是答案：DataFrame指数据框，相当于程序中的虚拟Excel表格创建DataFrame后，可以重新指定indexDataFrame允许有缺失值3、在DataFrame中，可以获取某一列的值，也可以获取某一行的值。答案:对4、对于数据框book_info，以下用法有误的是答案：
【人工智能】数据挖掘与应用题库（1-100）奋力向前123 人工智能人工智能算法
1、涉及变化快慢的问题可以考虑使用导数来分析。答案:对2、导数的几何意义是曲线在某点处切线的斜率。答案:对3、函数在某点的左导数存在，则导数就存在。答案:错4、关于梯度下降算法，下列说法错误的是（）错误:梯度下降算法能找到函数精确的最小值。5、正弦函数的导数是余弦函数。答案：对6、[u(x)×v(x)]'=u(x)'×v(x)'答案：错7、链式法则的步骤可以概况为：分解、各自求导、相乘、回代。答案
基于计算机视觉实现二维码识别含Matlab源码 NoABug 计算机视觉 matlab 人工智能
基于计算机视觉实现二维码识别含Matlab源码随着现代科技的不断发展，二维码已经成为了我们日常生活中必不可少的一个元素，它广泛应用于商品、文件、广告、交通等领域。为了更好地使用和管理这些二维码信息，需要准确、快速地对其进行识别。本文将介绍如何使用计算机视觉技术实现二维码的识别，并提供Matlab源代码。二维码原理与发展二维码是一种将信息编码成黑白方块形式的二进制条码，它由黑色正方形组成，其中有一些
java 心跳检测还没入门的大菜狗 java基础
今天再看SpringCloudEureka的时候，提到了心跳检测。之前也在某个地方看到过这个概念。但是一直没有深究。找到了这篇文章。写的很不错。就来转载一下http://blog.csdn.net/zhao9tian/article/details/52275214外网服务端保存内网服务端会话的有效性以及平台上监控所有内网服务端的网络状况，模仿心跳机制实现，这里在做一点叙诉，关于思路和具体实现。在
【学习笔记】Kubernetes 还没入门的大菜狗笔记
一、概览Kubernetes提供了一个抽象层，是用户可以在屋里或虚拟环境中部署容器化应用，提供以容器为中心的基础架构。Kubernetes的控制平面和工作节点都有什么组建？分别有什么作用？1.1Kubernetes控制平面和工作节点的组件及其作用控制平面组件控制平面组件负责管理集群的全局决策（如调度），以及检测和响应集群事件。kube-apiserverKubernetesAPI的前端，所有组件通
【十二】Golang 映射张胤尘 Golang golang 开发语言后端
欢迎来到张胤尘的开源技术站开源如江河，汇聚众志成。代码似星辰，照亮行征程。开源精神长，传承永不忘。携手共前行，未来更辉煌文章目录映射映射的定义映射初始化`make`函数使用字面量源码分析数据结构`hmap``bmap`数据存储键值访问竞态检测`Sanitizer`检测空检查并发写检查哈希值计算桶定位扩容情况处理桶内查找键值插入、扩容机制参数检查竞态检测`Sanitizer`检测并发检测哈希值计算初
Golang 新手入门教程（十九）：Go 中的泛型麻凡_ Golang 新手入门教程 golang 开发语言后端
本节重点：学会Go泛型的基本使用Go1.18版本正式支持泛型，本节主要介绍Go泛型的基础知识。什么是泛型在编程语言中，泛型提供了编译时类型安全检测机制，该机制允许程序员在编译时检测到非法的类型。在保证与Go1完全兼容的情况下，为类型及函数声明增加可选的类型参数（TypeParameters）来扩展支持泛型函数和类型。类型参数使用接口类型（InterfaceTypes）进行约束（Constraint
怎样通过人机融合智能去除“机器幻觉”？人机与认知实验室
人机融合智能的目标是通过深度结合人类智能和机器智能，解决现有人工智能系统（特别是深度学习模型，如各种大模型）可能出现的问题，比如“机器幻觉”现象。机器幻觉指的是人工智能模型在处理信息时，做出错误的、非理性的判断或预测，这种现象往往源于模型在训练数据中的偏差、不完全信息或过度依赖某些特定模式。通过人机融合的方式，可以有效减少这种“幻觉”，进而提升人机环境系统智能的可靠性和解释能力。1.结合人类的直觉
从机器幻觉到智能幻觉人机与认知实验室
机器幻觉与智能幻觉主要是关于人工智能（AI）系统在处理信息和生成输出时，可能会产生的错误认知或“幻觉”现象。1.机器幻觉在早期的计算机科学中，“机器幻觉”通常指的是计算机在进行数据处理时，出现了错误的输出或意外的结果。这类“幻觉”并不是指计算机本身具有意识，而是因为程序的设计、数据的不完整性或噪声、或算法的偏差等问题，导致机器产生了不符合现实的假设、错误的结论或奇怪的输出，具体涉及：图像生成幻觉：
注意力机制是如何提取有用信息的？人机与认知实验室
我们用通俗的方式解释注意力机制是如何通过比较查询（Query,Q）和键（Key,K）的相似度，来决定从值（Value,V）中提取多少有用信息的。场景：图书馆找书假设你在图书馆里，脑海中的问题是：“我想找一本关于人工智能的书。”（这就是你的查询，Q）。图书馆里的每本书都有一个标签，比如“人工智能入门”或“历史小说”（这些是键，K）。每本书的详细内容（比如具体的章节、知识点等）就是值，V。1、计算相似
深度学习-【完整代码+数据集】逻辑回归预测乳腺癌检测案例编程千纸鹤人工智能学习专栏深度学习逻辑回归人工智能癌症预测
作者主页：编程千纸鹤作者简介：Java、前端、Python开发多年，做过高程，项目经理，架构师主要内容：Java项目开发、Python项目开发、大学数据和AI项目开发、单片机项目设计、面试技术整理、最新技术分享收藏点赞不迷路关注作者有好处文末获得源码机器学习分为：有监督学习：数据带有标签无监督学习：数据没有标签，根据属性聚类在机器学习有监督学习中大致可以分为两大任务，一种是回归任务，一种是分类任务
JavaScript 系列之：垃圾回收机制程序员SKY JavaScript javascript
前言垃圾回收是一种自动内存管理机制，用于检测和清除不再使用的对象，以释放内存空间。当一个对象不再被引用时，垃圾回收器会将其标记为垃圾，然后在适当的时候清除这些垃圾对象，并将内存回收给系统以供其他对象使用。什么是"对象不再被引用"？当一个对象不再被任何变量或属性引用时，它就成为垃圾。例如，当一个函数执行完毕后，其中创建的局部变量将成为垃圾，因为它们无法再被访问到。"适当的时候"是指什么时候？首先Ja
【附源码】基于opencv+pyqt5搭建的人脸识别系统 ~啥也不会~ opencv 人工智能计算机视觉人脸识别 pyqt
文章目录前言一、人脸检测二、人脸识别1.训练识别器2.识别人脸三、界面相关1.Qlabel展示图片2.表格跟随内容而增加和减少3.选择图片文件4.警告框四、源码获取总结前言人脸识别技术作为人工智能领域的一颗璀璨明珠，正逐渐渗透到我们生活的每一个角落，从智能手机的解锁到机场的快速通关，从金融交易的安全认证到智慧城市的高效管理，它正以其独特的优势和强大的功能，为我们的生活带来前所未有的便捷与安全。本篇
端到端自动驾驶的分布式传感器融合架构 AI智能涌现深度研究计算机软件编程原理与应用实践 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
自动驾驶,分布式传感器融合,深度学习,计算机视觉,雷达,lidar,惯性导航,Kalman滤波,决策控制1.背景介绍自动驾驶技术作为未来交通运输的重要发展方向，近年来取得了显著进展。然而，实现真正安全的自动驾驶仍然面临着诸多挑战，其中之一就是如何有效地融合来自不同传感器的数据，构建一个可靠的感知、决策和控制系统。传统的自动驾驶系统通常依赖于单一传感器，例如摄像头或雷达，这会导致感知信息的缺失和鲁棒
大模型时代的软件架构设计 AI天才研究院计算 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
引言当今世界，人工智能（AI）技术正以惊人的速度发展，其中大模型（LargeModels）的崛起尤为引人注目。大模型，也被称为深度学习模型，因其庞大的参数规模和强大的数据处理能力，成为推动AI技术前进的重要力量。随着大模型的广泛应用，软件架构设计面临着前所未有的挑战和机遇。大模型时代的软件架构设计，不仅需要解决传统软件架构所面对的问题，如性能、可靠性和可扩展性等，还需要应对大模型带来的新挑战，如计
linux环境docker安装minio(在线安装docker) 小徐敲java linux docker 运维
最好查看官网的操作方式，因为每一个版本的配置文件和存储文件路径都可能有修改，minio官网linux下使用docker安装miniodocker安装minio检测linux是否安装dockerdocker-v如果没安装就安装docker,在线安装dockeryuminstalldocker启动dockersystemctlstartdocker查看docker版本docker-v拉取minio镜像
第一篇：k8s架构与组件详解 ※网络笨猪※ ##云原生-容器化-K8S##架构
没有那么多花里胡哨，直接进行一个K8s架构与组件的学习。一、K8s架构在Master通常上包括kube-apiserver、etcd存储、kube-controller-manager、cloud-controller-manager、kube-scheduler和用于K8s服务的DNS服务器（插件）。这些对集群做出全局决策(比如调度)，以及检测和响应集群事件的组件集合也称为控制平面。其实K8s官
计算机视觉与机器学习之文档解析与向量化技术加速多模态大模型训练与应用——文件向量化大模型！知世不是芝士计算机视觉人工智能大语言模型 ai大模型多模态大模型机器学习 LLM
目录前言1、TextIn文档解析技术1.1、文档解析技术1.2、目前存在的问题1.2.1、不规则的文档信息示例1.3、合合信息的文档解析1.3.1、合合信息的TextIn文档解析技术架构1.3.2、版面分析关键技术Layout-engine1.3.3、文档树提取关键技术Catalog-engine1.3.4、双栏1.3.5、非对称双栏1.3.6、双栏+表格1.3.7、无线表格1.3.8、合并单元格
人类驾驶的人脑两种判断模式（反射和预判）--＞自动驾驶两种AI模式 liron71 人工智能机器学习
一种模式是直觉模式，判断是基于条件反射，视觉感知触发到直接条件反射（从经历中沉淀形成的神经信息闭环），类似现在自动驾驶技术的传统AI模式。另一种模式是物理时空图式推理模式，判断是基于预判预测，人脑把物理世界的物理动态时空规则（规律）图像已经编码为脑内符号（语言或图式）系统，通过预判预测的思维链推理过程（语言符号或物理时空图式的推理运算，映射推理出了物理世界的后续时空图像，作出反馈的动作选择），根据
YOLOv9与YOLOv8创新点差异概述：奔强的程序 YOLO
架构改进：YOLOv8：引入了新的骨干网络，检测头，以及损失函数，旨在提高性能和灵活性。YOLOv9：可能在架构上进行了进一步的优化，比如改进了特征提取的方式、增强了多尺度检测能力等。这些改进有助于模型在处理不同大小和形状的目标时更加有效。梯度信息利用：YOLOv9的一个显著创新点是主打“可编程梯度信息来学习任何内容”。这意味着模型在训练过程中可能更加关注梯度信息的质量和流向，从而更有效地进行参数
Crawl4AI：开源的网络爬虫和抓取工惟贤箬溪穷玩Ai github 开源 ai
crawl4ai是一个开源项目，旨在帮助用户爬取GitHub上与AI（人工智能）相关的内容。这些内容通常包括AI相关的开源项目、库、资源、论文、教程等。项目提供了一个爬虫工具，可以自动化地抓取并提取GitHub上与人工智能相关的资源。以下是对该项目的详细解读：1.项目概述crawl4ai是一个爬虫框架，专门用于从GitHub上抓取与AI相关的开源项目或仓库。这些仓库包括AI领域的机器学习、深度学习
如果GPT-4还只是阿米巴原虫，未来的霸王龙会是什么样？| 赫拉利《智人之上》量子位
关注前沿科技量子位几乎所有人都已经发现，我们正生活在一场前所未有的信息革命之中。但这到底是一场怎样的革命？最近这几年，太多突破性的发明如洪水般滚滚而来，以至于我们很难判断到底是什么推动了这场革命。是互联网？智能手机？社交媒体？区块链？算法？还是人工智能？所以，在讨论目前这场信息革命的长期影响之前，让我们先回顾一下它的基础。本文分为三大部分，分别为：我们真的了解计算机吗？计算机正在塑造一个全新的信息
MoneyPrinterTurbo：AI驱动的全自动高清短视频生成框架萧鼎机器学习算法与实战人工智能音视频 python
引言在数字化时代，短视频已经成为信息传播的重要形式。无论是社交媒体、自媒体创作者，还是品牌营销和广告投放，短视频都占据了越来越重要的地位。然而，传统视频制作的门槛较高，需要专业的剪辑技能、素材采集以及后期处理，导致许多个人创作者和中小企业难以持续产出高质量内容。MoneyPrinterTurbo正是针对这一痛点而生的一款全自动短视频生成框架。它采用人工智能技术，从文案撰写到视频合成实现了全流程自动
【Stack around the variable ‘xxx‘ was corrupted】C++程序中被调函数中发生栈内存越界，越界到主调函数栈内存上，导致内存被篡改的典型案例分析 dvlinker C/C++实战专栏 C/C++软件开发从入门到实战 Satck corrupted 栈内存越界函数调用堆栈 RTC运行时检测汇编 CheckStackvars 函数调用栈分布
目录1、问题描述（栈内存越界-Stackaroundthevariable'byVol'wascorrupted）2、查看函数调用堆栈，进行初步分析3、VisualStudio中的/RTC编译选项说明3.1、RTC运行时检测可以做哪些检测？3.2、RTC运行时检测的原理3.3、为什么Release下/RTC编译是关闭的4、进一步分析，找到引发问题的原因5、最后C++软件异常排查从入门到精通系列教程
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，Django@Python2.x 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f