MrRoose

开源数据集分类汇总（医学，卫星，分割，分类，人脸，农业，姿势等）

本文汇总了医学图像、卫星图像、语义分割、自动驾驶、图像分类、人脸、农业、打架识别等多个方向的数据集资源，均附有下载链接。

该文章仅用于学习记录，禁止商业使用！

1.医学图像

疟疾细胞图像数据集

下载链接：http://suo.nz/2VQTUt

皮肤癌 MNIST：HAM10000

下载链接：http://suo.nz/33n6Xy

该数据集收集了来自不同人群的皮肤镜图像，通过不同的方式获取和存储。最终数据集包含 10015 张皮肤镜图像，可用作学术机器学习目的的训练集。案例包括色素病变领域所有重要诊断类别的代表性集合：光化性角化病和上皮内癌/鲍温氏病 (akiec)、基底细胞癌 (bcc)，超过50%的病变是通过组织病理学（histo）证实的，其余病例的ground truth要么是后续检查（follow_up），要么是专家共识（consensus），要么是活体共聚焦显微镜（confocal）证实. 数据集包括具有多个图像的病变，可以通过 HAM10000_metadata 文件中的 lesion_id 列进行跟踪。

乳房组织病理学图像

下载链接：http://suo.nz/347Jt1

原始数据集包含以 40 倍扫描的 162 个完整的乳腺癌 (BCa) 标本幻灯片图像。从中提取了 277,524 个大小为 50 x 50 的补丁（198,738 个 IDC 负值和 78,786 个 IDC 正值）。每个补丁的文件名格式为：u_xX_yY_classC.png — > example 10253_idx5_x1351_y1101_class0.png。其中 u 是患者 ID (10253_idx5)，X 是裁剪此补丁的 x 坐标，Y 是裁剪此补丁的 y 坐标，C 表示类，其中 0 是非 IDC 和1 是数据中心。

胸部 X 光图像（肺炎）

下载链接：http://suo.nz/3aXYPg

数据集分为 3 个文件夹（train、test、val）并包含每个图像类别（肺炎/正常）的子文件夹。有 5,863 张 X 射线图像 (JPEG) 和 2 个类别（肺炎/正常）。胸部 X 光图像（前后位）选自广州市妇女儿童医疗中心 1 至 5 岁儿科患者的回顾性队列。

白内障数据集

下载链接：http://suo.nz/2cOidH

用于白内障检测的白内障和正常眼睛图像数据集。

恶性与良性皮肤癌

下载链接：http://suo.nz/2kkvio

该数据集包含良性皮肤痣和恶性皮肤痣图像的平衡数据集。数据由两个文件夹组成，每个文件夹包含两种痣的 1800 张图片 (224x244)。

CT 医学图像

下载链接：http://suo.nz/2tQehH

该数据集旨在允许测试不同的方法来检查与使用对比度和患者年龄相关的 CT 图像数据的趋势。基本思想是识别与这些特征密切相关的图像纹理、统计模式和特征，并可能构建简单的工具，在这些图像被错误分类时自动对其进行分类（或查找可能是可疑情况、错误测量或校准不良机器的异常值）

MedMNIST医学图像分割评估

下载链接：http://suo.nz/2Bmrmo

MedMNIST，这是 10 个预处理的医学开放数据集的集合。MedMNIST 经过标准化处理，可在轻量级 28x28 图像上执行分类任务，无需背景知识。它涵盖了医学图像分析中的主要数据模式，在数据规模（从 100 到 100,000）和任务（二元/多类、序数回归和多标签）上具有多样性。MedMNIST 可用于教育目的、快速原型设计、多模式机器学习或医学图像分析中的 AutoML。此外，MedMNIST Classification Decathlon 旨在对所有 10 个数据集上的 AutoML 算法进行基准测试

多标签视网膜疾病 (MuReD) 数据集

下载链接：http://suo.nz/2ISEr5

多标签视网膜疾病（MuReD）数据集，使用从三个不同的最先进来源（即 ARIA、STARE 和 RFMiD 数据集）收集的图像，并执行一系列后处理确保图像质量的处理步骤、要分类的广泛疾病以及每个疾病标签有足够数量的样本。MuReD 数据集由 2208 张图像组成，具有 20 个不同的标签，图像质量和分辨率各不相同。同时，确保数据的最低质量，每个标签有足够数量的样本。

2.语义分割

高分二号 (GF-2) 卫星图像大型土地覆盖数据集

数据集下载地址：http://suo.nz/2dPkdv

GID 是具有高分二号 (GF-2) 卫星图像的大型土地覆盖数据集。这个新的数据集被命名为高分影像数据集（GID），由于其覆盖面大、分布广、空间分辨率高等特点，与现有的土地覆盖数据集相比具有优势。GID 由两部分组成：大规模分类集和精细土地覆盖分类集。大规模分类集包含 150 个像素级带注释的 GF-2 图像，精细分类集由 30,000 个多尺度图像块加上 10 个像素级带注释的 GF-2 图像组成。分别基于 5 个类别的训练图像和验证图像收集并重新标记 15 个类别的训练数据和验证数据。

DADA-seg

数据集下载地址：http://suo.nz/3bZ3qm

DADA-seg 是一个按像素标注的事故数据集，其中包含交通事故的各种关键场景。

Dark Zurich

数据集下载地址：http://suo.nz/34sQlF

Dark Zurich 是一个图像数据集，包含在夜间、黄昏和白天拍摄的总共 8779 张图像，以及每张图像的相机各自的 GPS 坐标。这些 GPS 注释用于构建一天中的跨时间对应关系，即，将每个夜间或黎明图像与其白天对应物相匹配。

斯坦福背景数据集

数据集下载地址：http://suo.nz/2WWDgY

斯坦福背景数据集是 Gould 等人引入的新数据集。(ICCV 2009)用于评估几何和语义场景理解的方法。该数据集包含 715 张图像，这些图像选自现有的公共数据集：LabelMe 、 MSRC、 PASCAL VOC 和Geometric Context。我们的选择标准是图像是户外场景，像素大约为 320 x 240，至少包含一个前景物体，并且地平线位于图像内（不需要可见）。

CIHP人体解析数据集

数据集下载地址：http://suo.nz/2ll7hi

Crowd Instance-level Human Parsing (CIHP) 数据集包含 38,280 张多人图像，这些图像具有精细的注释、高外观可变性和复杂性。该数据集可用于人体部分分割任务。

WoodScape自动驾驶鱼眼数据集

数据集下载地址：http://suo.nz/2sRklZ

WoodScape 包含四个环视摄像头和九项任务，包括分割、深度估计、3D 边界框检测和新型污染检测。为超过 10,000 张图像提供实例级别的 40 个类的语义注释。

3.图像分类

FruitNet水果分类/识别数据集

下载链接：http://suo.nz/2Cfo4y

需要高质量的水果图像来解决水果分类和识别问题。要构建机器学习模型，整洁干净的数据集是基本要求。为了这个目标，我们创建了名为“FruitNet”的六种流行印度水果的数据集。该数据集包含 6 种不同类别水果的 14700 多张经过处理的格式的高质量图像。图像分为 3 个子文件夹 1) 优质水果 2) 劣质水果和 3) 混合质量水果。每个子文件夹包含 6 个水果图像，即苹果、香蕉、番石榴、酸橙、橙子和石榴。使用具有高端分辨率相机的手机来捕捉图像。这些图像是在不同的背景和不同的光照条件下拍摄的。建议的数据集可用于训练，水果分类或重组模型的测试和验证。

卫星图像分类

下载链接：http://suo.nz/2D00yp

卫星图像分类数据集-RSI-CB256，该数据集有 4 个不同的类别，混合了传感器和谷歌地图快照

intel 自然风光图像分类数据集

下载链接：http://suo.nz/2KwdmY

这是世界各地自然风光的图像数据。

内容：此数据包含分布在 6 个类别下的大约 25,000 张大小为 150x150 的图像。{'建筑物'-> 0， '森林'-> 1， '冰川'-> 2， '山'-> 3， '海'-> 4， '街道'-> 5}

建筑遗产元素图像数据集

下载链接：http://suo.nz/2RmsZl

Architectural Heritage Elements Dataset (AHE) 是一个图像数据集，用于开发深度学习算法和建筑遗产图像分类中的特定技术。该数据集包含 10235 张图像，分为 10 个类别：祭坛：829 张图像；后殿：514 张图片；钟楼：1059张图片；栏目：1919张图片；圆顶（内部）：616 张图像；圆顶（外部）：1177 张图像；飞扶壁：407张图片；Gargoyle（和 Chimera）：1571 张图像；彩色玻璃：1033 幅图像；保险库：1110 张图像。

贝壳或鹅卵石：图像分类数据集

下载链接：http://suo.nz/2YSG42

数据集包含两个类：贝壳或卵石。该数据集可用于二元分类任务，以确定某个图像是贝壳还是鹅卵石。

板球-足球-棒球分类

数据集下载链接：http://suo.nz/33juP6

该数据集包含 252 张打板球、踢足球和打棒球的图像。主文件夹中有 3 个子文件夹 (1) cricket (2) football (3) baseball (cricket-football-baseball)。

花卉数据集

数据集下载地址：http://suo.nz/2fGKVt

该数据集包含 4242 张花卉图像。数据收集基于数据flicr、google images、yandex images。此数据集可用于从照片中识别植物。数据图片会分为五类：洋甘菊、郁金香、玫瑰、向日葵、蒲公英。每个种类大约有800张照片。照片分辨率不高，约为 320x240 像素。照片不会缩小到单一尺寸，它们有不同的比例。

90种动物图像数据集

数据集下载地址：http://suo.nz/2ncY0a

在这个数据集中有 90 个不同类别的 5400 张动物图像。此数据集是从 Google 图片创建的：https://images.google.com/。所有照片将按照其所属类别存放于各自的文件夹下。动物类别包括：羚羊，獾，蝙蝠，熊，蜜蜂，甲虫，野牛，公猪，蝴蝶，猫毛虫，黑猩猩等。该数据集中的图像大小不固定，可能需要后续的处理。

衣服数据集

数据集下载地址：http://suo.nz/2uJaOJ

衣服数据集总共收集了 20 种衣服的 5,000 张图像。该数据集是根据公共领域许可 (CC0) 发布的。我们使用了三种不同的方式来收集数据集：Toloka——众包平台；社交媒体上的网络众包计划；Tagias——一家专门从事数据收集的公司。标签是使用 IPython 小部件手动完成的，同时我们使用简单的神经网络纠正了标签错误。

数据集包含 20 个类，包括T 恤（1011 件），长袖（699 件），裤子（692 件），鞋子（431 件）衬衫（378 件），连衣裙（357 件），外套（312 件），短裤（308 件），帽子（171 件），裙子（155 件），西装外套（109 件）等。

商标数据集

数据集下载地址：http://suo.nz/2CfnTq

在这项工作中，我们构建了一个大规模的 logo 数据集 Logo-2K+，它涵盖了来自真实世界 logo 图像的各种 logo 类别。我们生成的徽标数据集包含 167,140 张图像，具有 10 个根类别和 2,341 个类别。

食物图像数据集

数据集下载地址：http://suo.nz/2D00oT

该数据集包含完整 food-101 数据的许多不同子集。为了给图像分析制作一个比 CIFAR10 或 MNIST 更简单的训练集，该数据包括图像的大规模缩小版本，以实现快速测试。数据已被重新格式化为 HDF5，特别是 Keras HDF5Matrix，这样可以轻松读取它们。

4.垃圾分类、水下垃圾/口罩垃圾/烟头垃圾检测

AquaTrash垃圾识别数据集

数据集下载链接：http://suo.nz/2CdMGi

该数据集包含 369 张用于深度学习的垃圾图像。总共有 470 个边界框。共有 4 类 {(0: glass), (1:paper), (2:metal), (3:plastic)}

口罩垃圾检测

数据集下载链接：http://suo.nz/2CYpbL

这个数据集是一个极具挑战性的集合，包含从 1200 多个城市和农村地区捕获和众包的 7000 多张原始 Masks 图像，其中每张图像都由DC Labs 的计算机视觉专业人员手动审查和验证。

数据集大小：7000+ 捕获者：超过 1200 多个众包贡献者分辨率：99% 图像高清及以上（1920x1080 及以上）地点：拍摄于印度 900 多个城市多样性：各种照明条件，如白天、夜晚、不同的距离、观察点等使用设备：2020-2021 年使用手机拍摄用途：口罩检测、口罩隔离、垃圾口罩检测等

烟头垃圾数据集

数据集下载链接：http://suo.nz/2KuC0k

该数据集由一组 2200 张合成合成的地面香烟图像组成。它专为训练 CNN（卷积神经网络）而设计。

水下垃圾检测数据集

数据集下载链接：http://suo.nz/2RkRCH

该数据来自 J-EDI 海洋垃圾数据集。构成该数据集的视频在质量、深度、场景中的对象和使用的相机方面差异很大。它们包含许多不同类型的海洋垃圾的图像，这些图像是从现实世界环境中捕获的，提供了处于不同衰减、遮挡和过度生长状态的各种物体。此外，水的清晰度和光的质量因视频而异。这些视频经过处理以提取 5,700 张图像，这些图像构成了该数据集，所有图像都在垃圾实例、植物和动物等生物对象以及 ROV 上标有边界框。

垃圾分类数据集

数据集下载链接：http://suo.nz/2YR4Ho

该数据集包含来自 12 个不同类别的生活垃圾的 15,150 张图像；纸、纸板、生物、金属、塑料、绿色玻璃、棕色玻璃、白色玻璃、衣服、鞋子、电池和垃圾。

Kaggle 垃圾分类图片数据集

数据集下载链接：http://suo.nz/36mRLb

该数据集是图片数据，分为训练集85%（Train）和测试集15%（Test）。其中O代表Organic（有机垃圾），R代表Recycle（可回收）

生活垃圾数据集

数据集下载链接：http://suo.nz/3dT4PS

大约9000多张独特的图片。该数据集由印度国内常见垃圾对象的图像组成。图像是在各种照明条件、天气、室内和室外条件下拍摄的。该数据集可用于制作垃圾/垃圾检测模型、环保替代建议、碳足迹生成等。

垃圾溢出数据集

数据集下载链接：http://suo.nz/2fJocH

SpotGarbage垃圾识别数据集

数据集下载链接：http://suo.nz/2nfBho

图像中的垃圾（GINI）数据集是SpotGarbage引入的一个数据集，包含2561张图像，956张图像包含垃圾，其余的是在各种视觉属性方面与垃圾非常相似的非垃圾图像。

5.目标跟踪

Temple Color 128

数据集下载链接：http://suo.nz/2dKEEL

本数据集包含一大组 128 种颜色序列，带有基本事实和挑战因素注释（例如，遮挡）

NfS高帧率视频数据集

数据集下载链接：http://suo.nz/34o8df

第一个更高帧率的视频数据集（称为极品飞车 - NfS）和视觉对象跟踪基准。该数据集包含 100 个视频（380K 帧），这些视频是使用现在常见的更高帧率 (240 FPS) 摄像机从现实世界场景中捕获的。所有帧都用轴对齐的边界框进行注释，所有序列都用九个视觉属性手动标记——例如遮挡、快速运动、背景杂乱等。

VOT2020

数据集下载链接：http://suo.nz/2W7iD5

PathTrack 数据集

数据集下载链接：http://suo.nz/2OFhXy

用于多目标跟踪 (MOT)。PathTrack 数据集包含 720 个视频序列中的 15,000 多个人的轨迹。

ALOV300++跟踪数据集

数据集下载链接：http://suo.nz/2dKDTl

ALOV++，Amsterdam Library of Ordinary Videos for tracking 是一个物体追踪视频数据，旨在对不同的光线、通透度、泛着条件、背景杂乱程度、焦距下的相似物体的追踪。

6.口罩识别检测

SF-MASK

数据集下载链接：http://suo.nz/2E6ADA

从监控录像中对有面具和无面具的人脸进行分类是最困难的任务之一，数据集SF-MASK来解决这些问题，该数据集适用于小尺寸人脸、部分隐藏的人脸、各种人脸方向和各种面具类型等。SF-MASK是通过收集已经发布的面具相关数据集而构建的。同时，通过分析现有数据集中缺失的数据和补充缺失的数据，使其更加完整。

口罩检测视频数据集

数据集下载链接：http://suo.nz/2wAnAv

一个实时视频/图像数据集，其中包含在大学环境中行走的多个主题（带/不带面具）。每个带注释的帧都包含多个具有唯一标识、边界框和类/标签信息的实例（即人）。数据集和注释可用于训练、验证和测试基于深度学习和计算机视觉的口罩检测算法。以下是数据集的详细信息：视频总帧数：4357 边界框总数：21941 带遮罩的盒子 (MW)：8306 不带遮罩的盒子 (NM)：13635 图像帧：此文件夹包含 4357 个视频帧 (.png)。

口罩佩戴数据集

数据集下载链接：http://suo.nz/2p4avO

该Mask Wearing数据集是戴各种口罩的人和不戴口罩的人的物体检测数据集。这些图像最初由台湾伊甸社会福利基金会的 Cheng Hsun Teng 收集，并由 Roboflow 团队重新标记。

口罩检测数据集

数据集下载链接：http://suo.nz/2ojy0l

数据集由 2 个文件夹中的 7553 张 RGB 图像组成，分别是 with_mask 和 without_mask。图像被命名为标签 with_mask 和 without_mask。戴口罩的人脸图像为3725张，不戴口罩的人脸图像为3828张。

MDMFR口罩数据集

数据集下载链接：http://suo.nz/2gNkVE

MDMFR 数据集由两个主要集合组成，1) 面罩检测和 2) 蒙面面部识别。我们的 MDMFR 数据集中有 6006 张图像。面罩检测集合包含两类人脸图像，即蒙面和未蒙面。检测数据库包含 3174 个带掩码和 2832 个不带掩码（未掩码）的图像。

RMFD口罩遮挡人脸数据集

数据集下载链接：http://suo.nz/2ojy0v

7.自动驾驶

ExDark图像数据集

下载地址：http://suo.nz/2lidoI

Exclusively Dark (ExDARK) 数据集是 7,363 张从极低光环境到黄昏（即 10 种不同条件）的低光图像的集合，具有 12 个对象类（类似于 PASCAL VOC），在图像类级别和局部对象边界上进行了注释盒子。

Nexet车辆检测数据集

下载地址：http://suo.nz/2sKekn

50000张带标注的训练图片

41190张测试图片

图片来自77个国家

Udacity 自动驾驶汽车数据集

下载地址：http://suo.nz/2Agrp4

该数据集包含 11 个类别的 97,942 个标签和 15,000 张图像。有 1,720 个空样本（没有标签的图像）。

所有图像均为 1920x1200（下载大小约为 3.1 GB）。本数据集还提供了一个降采样到 512x512（下载大小约 580 MB）的版本，适用于大多数常见的机器学习模型（包括 YOLO v3、Mask R-CNN、SSD 和 mobilenet）。

WoodScape

下载地址：http://suo.nz/2HMEtL

BDD100K

下载地址：http://suo.nz/2OCU68

UCB的全天候全光照大型数据集，包含1,100小时的HD录像、GPS/IMU、时间戳信息，100,000张图片的2D bounding box标注，10,000张图片的语义分割和实例分割标注、驾驶决策标注和路况标注。官方推荐使用此数据集的十个自动驾驶任务：图像标注、道路检测、可行驶区域分割、交通参与物检测、语义分割、实例分割、多物体检测追踪、多物体分割追踪、域适应和模仿学习。

Linkopings交通标志数据集

下载地址：http://suo.nz/2W97aP

超过 20,000 张图像，其中 20% 已标记。

包含 3488个交通标志。

从超过 350 公里的瑞典道路上记录的公路和城市序列。

非洲地区交通标志数据集

下载地址：http://suo.nz/2WTJGi

该数据集已特别针对非洲地区进行了改进。两个开源数据集仅用于提取非洲地区使用的交通标志。该数据集包含来自所有类别的 76 个类，例如监管、警告、指南和信息标志。该数据集总共包含 19,346 张图像和每个类别至少 200 个实例。

8.卫星图像

水体卫星图像的图像

数据集下载地址：http://suo.nz/2ksvWY

Sentinel-2 卫星拍摄的水体图像集。每张图片都带有一个黑白mask，其中白色代表水，黑色代表除水之外的其他东西。这些掩模是通过计算 NWDI（归一化水差指数）生成的，该指数经常用于检测和测量卫星图像中的植被，但使用更大的阈值来检测水体。

城市航拍图像分割数据集

数据集下载地址：http://suo.nz/2cWiSh

此数据集包含用于检查和准备航空影像分割数据集的脚本。该数据集包含一组不同的卫星图像，这些图像用目标城市的建筑物、道路和背景标签进行了注释。

游泳池和汽车卫星图像检测

数据集下载地址：http://suo.nz/3b5ZtQ

人工月球景观数据集

数据集下载地址：http://suo.nz/33zMp9

由于月球图像的稀缺性和缺乏注释，通常很难对其进行任何类型的机器学习实验。该数据集的目标是为公众提供人造而逼真的月球景观样本，可用于训练岩石检测算法。这些经过训练的算法可以在实际的月球图片或其他岩石地形图片上进行测试。该数据集目前包含 9,766 个岩石月球景观的真实渲染图，以及它们的分段等价物（3 类是天空、较小的岩石和较大的岩石）。还提供了所有较大岩石和经过处理、清理后的地面实况图像的边界框表。

马萨诸塞州道路数据集

数据集下载地址：http://suo.nz/32Pa9O

马萨诸塞州道路数据集由1171幅马萨诸塞州的航空图像组成。与建筑数据一样，每个图像的大小为1500×1500像素，占地2.25平方公里。

UC Merced Land-Use

数据集下载地址：http://suo.nz/2IXmvN

这是一个用于研究目的的 21 类土地利用图像数据集。以下每个类别都有 100 张图像：

农业飞机棒球钻石海滩建筑物丛林密集住宅森林高速公路高尔夫球场港口路口中型住宅移动房屋公园立交桥停车场河跑道稀疏住宅储油罐网球场

每个图像的尺寸为 256x256 像素。

这些图像是从美国地质勘探局国家地图城市区域图像集中针对全国各个城市地区的大图像中手动提取的。此公共领域图像的像素分辨率为 1 英尺。

Indian Pines

数据集下载地址：http://suo.nz/2JHZ1g

这一场景由AVIRIS传感器采集位于印第安纳州西北部的 Indian Pines 测试场上空，由 145×145 像素和 224 个光谱反射带组成，波长范围为 0.4–2.5 10^(-6) 米。该场景是一个较大场景的子集。印度松树场景包含三分之二的农业和三分之一的森林或其他天然多年生植被。有两条主要的双车道高速公路、一条铁路线，以及一些低密度住房、其他建筑结构和较小的道路。由于该场景是在 6 月份拍摄的，因此一些农作物（玉米、大豆）正处于生长早期阶段，覆盖率不到 5%。可用的基本事实被指定为十六个类别，并且并非全部都是相互排斥的。还通过去除覆盖吸水区域的谱带，将谱带数量减少到 200：[104-108]、[150-163]、220。

KSC

数据集下载地址：http://suo.nz/2Rec5X

KSC数据集是于1996年3月份在美国佛罗里达州肯尼迪太空中心进行成像，截取512×614大小进行标注的高光谱数据集。它是由机载可是红外成像光谱仪（AVIRIS）摄，AVIRIS的波长范围是400-2500nm。空间分辨率为18米，在去除吸水带以及低信噪比波段后，实际用于训练的波段是176个。研究区域有13中地物类型，包括Scrub、Willow swamp、Cabbage palm hammock、Slash pine等。

Washington DC

数据集下载地址：http://suo.nz/2YJZ9K

Washington DC数据集是由Hydice传感器获取的一幅华盛顿购物中心上空的航空高光谱影像，数据包含了从 0.4 -2.4 µm可见光和近红外波段范围的共191个波段，数据大小为1280×307。地物类别包括街道，草地，水，碎石小路，树木，阴影和屋顶。

BigEarthNet

数据集下载地址：https://bigearth.net/

使用Sentinel-2图像补丁构建BigEarthNet（现在称为BigEarthNet-S2，以前称为BigEarthNet），初步选择了2017年6月至2018年5月期间在欧洲10个国家（奥地利、比利时、芬兰、爱尔兰、科索沃、立陶宛、卢森堡、葡萄牙、塞尔维亚、瑞士）。所有图块均通过 Sentinel-2 Level 2A 产品生成和格式化工具 (sen2cor v2.5.5) 进行了大气校正。然后，它们被分为 590,326 个不重叠的图像块。每个图像块都由 2018 年 CORINE 土地覆盖数据库 (CLC 2018) 提供的多个土地覆盖类别（即多标签）进行注释。BigEarthNet中的标签属于2018年首次发布的标签。

9.农业相关

DeepWeeds 杂草类型分类数据集

下载链接：http://suo.nz/2OmaTQ

数据集包含 17,509 张图像，这些图像捕捉了八种原产于澳大利亚的不同杂草以及邻近的植物群。选定的杂草品种是昆士兰州牧草地的本地品种。它们包括：“中国苹果”、“蛇草”、“马缨丹”、“刺金合欢”、“暹罗草”、“白花菊”、“橡胶藤”和“帕金森属植物”。这些图像是从昆士兰以下地点的杂草侵扰中收集的：“Black River”、“Charters Towers”、“Cluden”、“Douglas”、“Hervey Range”、“Kelso”、“McKinlay”和“Paluma”。

仙人掌航拍图片数据集

下载链接：http://suo.nz/2VSnYx

在此数据集中，展示了 16,000 多个用于植物识别或分类的柱状仙人掌 (Neobuxbaumia tetetzo) 示例。

农作物图像分类（小麦、水稻、甘蔗、玉米等）

下载链接：http://suo.nz/33oB1C

数据集（作物图像）包含每种农业作物（玉米、小麦、黄麻、水稻和甘蔗）的 40 多张图像数据集（kag2）包含每类作物图像的 159 多张增强图像。增强包括水平翻转、旋转、水平平移、垂直平移。

5种不同的水稻图像数据集

下载链接：http://suo.nz/349aVN

使用了 Arborio、Basmati、Ipsala、Jasmine 和 Karacadag 水稻品种。
数据集(1) 有75K 幅图像，包括每个水稻品种的15K 幅图像。数据集（2）有 12 个形态特征、4 个形状特征和 90 个颜色特征。

玉米叶感染数据集

下载链接：http://suo.nz/3aZ0xg

收集了部分被秋粘虫等害虫感染的玉米叶片图像。有 Healthy 和 Infected 文件夹，每个文件夹都包含各自的图像。此外，还使用 VoTT 为受感染的图像准备了注释文件。

打架识别相关

监控摄像头下的打架检测

数据集下载链接：http://suo.nz/39IbxQ

该数据集是从包含打架实例的 Youtube 视频中收集的。此外，还包括一些来自常规监控摄像机视频的非打架序列。

总共有300个视频，150个打架+150个非打架
视频时长 2 秒
示例中仅包含与打架相关的部分

此外，由于任务是通过监控摄像头检测打斗，因此首选没有背景运动的视频作为样本。此外，还包括各种打斗场景，例如用物体撞击、踢打、拳击、摔跤。示例中的环境也各不相同，例如咖啡馆、街道、公共汽车等。

UBI-Fight异常事件检测数据集

数据集下载链接：http://suo.nz/3aoBUh

UBI-Fights 数据集是一个独特的全新大型数据集，涉及特定的异常检测并仍然在打斗场景中提供广泛的多样性，该数据集包含 80 小时的视频，在帧级别进行了完全注释。由 1000 个视频组成，其中 216 个视频包含打斗事件，784 个是正常的日常生活场景。删除所有可能干扰学习过程的不必要的视频片段（例如，视频介绍、新闻等）。

曲棍球比赛检测数据集

数据集下载链接：http://suo.nz/2ceViI

该数据集中包含 1000 个序列，分为两组：打斗和非打斗。

打架识别图像数据集

数据集下载链接：http://suo.nz/2jL8np

该数据集是为“打斗探测器”项目创建的，该项目检测静止图像中的打斗，然后将打斗探测器移动到上下文中具有时间维度的下一级视频检测。打斗数据集是从视频数据集 HMDB51 数据集创建的。

真实街头斗殴视频数据集

数据集下载链接：http://suo.nz/2rhiQO

该数据集包含从 youtube 视频中收集的 1000 个暴力视频和 1000 个非暴力视频，数据集中的暴力视频包含多种环境和条件下的许多真实街头斗殴情况。数据集中的非暴力视频也是从许多不同的人类行为中收集的，如运动、饮食、步行等。

人脸

FePh面部表情数据集

数据集下载链接：http://suo.nz/2zIouL

手语背景下带注释的序列化面部表情数据集，其中包含从公共电视台 PHOENIX 的每日新闻和天气预报中提取的 3000 多张面部图像。与大多数当前现有的面部表情数据集不同，FePh 提供具有不同头部姿势、方向和运动的序列化半模糊面部图像。

不平衡面部表情数据集

数据集下载链接：http://suo.nz/2OKM2R

图像大小保持 96x96，并使用改进后的标签。源数据集被分成两个子集——训练和测试。train.csv 和 test.csv 文件分别包含训练和测试子集的标签到文件名的映射。类别有：愤怒、蔑视、厌恶、恐惧、快乐、中性、悲伤和惊讶。

FER-2013

数据集下载链接：http://suo.nz/2WgZ7y

数据由 48x48 像素的人脸灰度图像组成。人脸已自动注册，因此人脸或多或少居中，并且在每张图像中占据大致相同的空间训练集包含 28,709 个示例，公共测试集包含 3,589 个示例。

FANE：面部表情和情绪数据集

数据集下载链接：http://suo.nz/2X1BD1

FANE 是一个图像数据集，用于对野外图像中的面部表情和情绪进行分类。数据集中有九个类别。总共有16,913 张图片。图像是从多个来源收集的，包括其他面部表情数据集，以及主要通过网络抓取的互联网。使用手动注释和预训练模型对图像进行标记。

小鼠面部表情数据集

数据集下载链接：http://suo.nz/34xOHI

老鼠在三种情绪状态（中性、疼痛和发痒）下的面部图像。

你可能感兴趣的:(数据集整理,人工智能,目标检测,图像处理,数据集)

【Grafana】Prometheus指标可视化Grafana，手把手教你如何自定义图形景天科技苑 grafana prometheus prometheus可视化 grafana自定义图形手撕grafana 自定义监控图形
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，云原生k8s，Prometheu
西安亲子鉴定中心14家地址合集（附2024年鉴定办理手册）国医基因周主任
在西安市，有不少的机构可以提供亲子鉴定服务。针对这一问题，小编为您整理了11家正规亲子鉴定中心的地址，并希望对您有所帮助。以下是这11家中心的详细地址，排名不分先后：西安亲子鉴定正规机构大全1、西安国医基因亲子鉴定中心机构地址：西安市新城区自强东路1118号机构电话：13193325921（微信同号）服务范围：新城区、碑林区、莲湖区、雁塔区、灞桥区、未央区、阎良区、临潼区、长安区、高陵区、鄠邑区、
肇庆司法亲子鉴定机构地址在哪里（附2024年最新地址一览表）国权基因
肇庆司法亲子鉴定机构在哪里？广东省肇庆市端州区的肇庆亲鉴生物可以做司法亲子鉴定咨询。为了方便快速找到肇庆亲子鉴定机构地址，小编特意整理了肇庆亲子鉴定机构名单供您参考，共有24家正规鉴定机构，排名不分先后。注：各鉴定机构的鉴定类别不同。请根据自身情况和鉴定机构的经营范围进行选择。内容仅供参考。肇庆市10家正规司法亲子鉴定机构地址大全如下：专家提醒：我们在选择亲子鉴定机构的时候，一定要看有没有正规资质
SpringBoot单元测试全攻略：MockMVC+Testcontainers+覆盖率分析 fanxbl957 Web spring boot 单元测试后端
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot单元测试全攻略：
AI作画：AI人工智能激发艺术创作灵感 AGI大模型与大数据研究院 AI作画人工智能 ai
AI作画：AI人工智能激发艺术创作灵感关键词：AI作画、生成艺术、深度学习、神经网络、艺术创作、人工智能、创意工具摘要：本文深入探讨AI作画技术如何激发艺术创作灵感。我们将从基础概念出发，解释AI如何"学习"艺术风格并生成新作品，分析核心技术原理，提供实际应用案例，并展望这一领域的未来发展趋势。通过通俗易懂的讲解和实际代码示例，帮助读者理解这项融合科技与艺术的创新技术。背景介绍目的和范围本文旨在向
时间管理050【反思】用反思三问清空爆满的收件箱嫝嫝
Hi！大家好，我是康康，非常有幸加入易效能天使班学习，为了更好地践行易效能的时间管理系统，以“转述”的形式，通过对叶武滨老师在喜马拉雅上的《叶武滨时间管理100讲》进行分享。今天是第50天，坐标某个小镇此文章开头参照【黄家整理师Helen】一、杂事：放在大脑里面的事1、每天在大脑里面，有许多事情和想法；2、大脑是记不住事的：需要利用优秀的系统来管理想法；3、大脑会非常的焦虑，事情没有完成的时候；二
深圳宝安亲子鉴定中心地址大全-21家（附2024年汇总鉴定）中量亲鉴生物
深圳宝安区可以做亲子鉴定的地方在哪里？深圳宝安区可以做亲子鉴定的机构地址在深圳市宝安区伟泰路（深圳国权基因）。今天小编整理了深圳21个可以进行亲子鉴定的地方，排名不分先后。部分机构可能无法进行司法亲子鉴定，需要根据业务范围进行选择。希望这些信息对大家能够有所帮助。深圳市中心医院、深圳市人民医院、深圳市中医医院等正规医院可以做隐私类型的亲子鉴定采样，但是不提供亲子鉴定服务，医院是不具备做亲子鉴定的资
从文本到语音：使用 ElevenLabs 和 FFmpeg 实现语音合成与播放曦紫沐语音模型 ffmpeg ElevenLabs 语音合成
摘要在当今的人工智能时代，语音合成技术正变得越来越普及。ElevenLabs是一个强大的语音合成平台，能够生成高质量的语音音频。本文将详细介绍如何结合Python、ElevenLabsAPI和FFmpeg工具集，实现从文本到语音的转换，并通过ffplay播放生成的音频文件。同时，我们将解决常见的问题，如ffplay未找到或音频无法播放等。1.引言随着人工智能技术的发展，语音合成（Text-to-S
DK遇见未来：机器人祖爸
人工智能、AI、机械设计、BigData……这些听起来就很高端的专业究竟是什么？这些前沿学科相遇又会碰撞出什么？机器人，将这些前沿领域结合在一起越来越多的融入到我们的工作与生活中可问题来了机器人究竟是什么呢？又该如何给孩子讲机器人呢？这本《DK遇见未来：机器人》完美解决您的烦恼最新数据、系统知识、精美插图可以说这是一本儿童机器人大百科让孩子在这里遇见未来在讲读版视频中与您共同思考未来社会中机器人与
ORACLE 11g 使用ROWNUM完美解决ORA-00600 内部错误代码有点智慧
分享一下我老师大神的人工智能教程！零基础，通俗易懂！http://blog.csdn.net/jiangjunshow也欢迎大家转载本篇文章。分享知识，造福人民，实现我们中华民族伟大复兴！1，ORA-00600：内部错误代码Oracle从11.2.0.1升级到11.2.0.4，开发人员报告说一个job运行失败，调试有报错信息，ORA-00600:内部错误代码，参数：[rwoirw:checkret
Kimi-Audio：最佳音LLM, 如何免费使用 Kimi-Audio AI 模型？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 kimi
简介继DeepSeek之后，字节跳动（现名MoonShotAI，又名Kimi）也在生成式人工智能领域加速发展，并发布了自己的音频模型Kimi-Audio，据说是迄今为止最好的音频模型。推荐文章《NvidiaGPU入门教程之02ubuntu安装A100显卡驱动(含8步快速浓缩教程)》权重2，安装A100显卡驱动《本地大模型知识库OpenWebUI系列之如何解决知识库上传文件故障Extractedco
Python就业薪资好不好，学Python工作机会多吗？ Python小辰
Python就业薪资好不好？学Python工作机会多吗？人工智能时代的来临让Python崭露头角，各大企业纷纷加大对相关人才的招聘力度吸引了很多人入行学习Python。近年来Python开发发展迅猛，吸引了很多科技公司入驻，且看小编的分析。Python薪资好不好?数据是最有力的答案。职友集统计数据显示，全国Python工程师的平均月资达19160，其中20-30K的工程师数量超过了四成。来自智联招
你要的答案就藏在自己的心裡。一字之师顿悟
人脑就是计算机。各种数据输入，处理一下得到一个结果，输出。但是人脑很懒，不愿意一直高速运转，平时都閒著，懒得思考。有很多问题，其实自己稍微想想就能得到答案的。但是懒于思考，就去问别人。内心中已经有了隐隐约约的线索，只是没有整理出来。和别人谈论，一点点脉络都清晰起来，答案水到渠成。这世界就是你内心的投射。你要的答案就藏在自己的心裡。
中国区域连续逐月的陆地水储量数据（2002.04-2023.02）做科研的周师兄遥感数据集数据集分享性能优化数据分析大数据
时间分辨率：月空间分辨率：0.5°-1°共享方式：开放获取数据大小：20.45MB数据时间范围：2002-04-01—2023-02-28元数据更新时间：2023-11-23数据集摘要陆地储水（TWS）作为水循环的主要组成部分，对于水资源管理、灾害监测和农业生产等领域的应用具有重要意义。自2002年4月以来，重力恢复和气候实验卫星(GRACE)及其后续卫星（GRACE-FO）提供了月尺度TWS数据
SinoLC-1:中国首幅1米分辨率土地覆盖图做科研的周师兄遥感数据集数据集分享数据库数据分析
时间分辨率：年空间分辨率：<=1m共享方式：开放获取数据大小：146.42GB数据时间范围：2002-12-01—2021-12-01元数据更新时间：2023-09-25数据集摘要SinoLC-1：中国1米分辨率土地覆盖图为首个具有中国国家尺度覆盖，空间分辨率1米的土地覆盖专题图。针对大范围高分辨率土地覆盖制图中地物复杂多样、高精度训练样本缺乏、制图方法区域迁移性要求高等关键难题，中国地质大学（武
景德镇可以做亲子鉴定的15个地址（附2024年鉴定中心汇总）国医基因李主任
景德镇哪里可以做亲子鉴定？景德镇国医基因可以做亲子鉴定，地址在景德镇中华北路317号。今天小编整理了景德镇可以做亲子鉴定的15个中心（含亲子鉴定医院采样中心），排名不分先后，部分医院不确定能否做亲子鉴定，还需要根据业务范围选择希望对大家有所帮助。景德镇亲子鉴定咨询中心介绍1、景德镇国医基因亲子鉴定咨询中心地址：景德镇中华北路317号简介：景德镇国医基因亲子鉴定咨询中心服务咨询点为被鉴定人提供景德镇
【乳腺超声、乳腺钼靶、宫颈癌、CT骨折】等项目数据调研，及相关参考内容整理汇总钱多多先森人工智能（AI）医学影像深度学习乳腺钼靶乳腺超声宫颈癌
文章目录一、乳腺超声内容整理1.1、数据集1.2、可以参考的论文1.3、可以参考的GitHub代码1.4、可以参考的博客1.5、简单任务需求二、宫颈癌风险智能诊断2.1、数据集2.2、KFB读取文件显示三、乳腺钼靶3.1、数据集3.2、拍摄方式：3.3、拍摄和观察视图3.4、DDSM标注文件解析四、CT骨折4.1、数据集五、总结本博客是一个笔记类的记录文档，主要是记录了在调研各个项目的过程中，遇到
老码农和你一起学AI：Python系列-Pandas大数据处理 chilavert318 熬之滴水穿石 pandas python
今天开始梳理一下pandas的大数据处理，在数据处理领域，Pandas凭借简洁的API和强大的功能成为Python开发者的首选工具。但当面对GB级甚至更大的数据集时，直接读取数据往往会触发“内存不足”的错误——这是因为Pandas默认将数据全部加载到内存中进行处理。此时，分块处理（Out-of-Core）技术就成为解决问题的关键。它通过将大文件拆分为小块，逐块加载并处理，最终整合结果，实现“用有限
AI驱动的电路仿真革命：从物理模型到智能学习的范式转移
AI驱动的电路仿真革命：从物理模型到智能学习的范式转移人工智能正颠覆传统电路仿真方法，本文将深入解析AI在电路建模、优化与故障诊断中的前沿应用，揭示智能仿真如何提升10倍效率并突破物理限制。一、AI电路仿真的数学基础1.1图神经网络建模电路拓扑电路可抽象为图结构G=(V,E)G=(V,E)G=(V,E)：VVV：节点（电子元件）EEE：边（连接关系）图卷积网络(GCN)更新公式：H(l+1)=σ(
MCP协议技术解析：AI时代的通信基础设施革命
MCP协议技术解析：AI时代的通信基础设施革命在AI从工具演变为协作伙伴的进程中，MCP协议正在成为连接智能体与现实世界的“数字神经系统”。当前人工智能技术正经历从孤立模型向生态系统协作的关键转型，而通信协议作为AI能力的“连接器”，其设计直接决定了智能系统的边界与效率。MCP协议（ModelContextProtocol）作为新一代AI通信基础设施，正在开发者社区引发一场静默革命。本文将从技术原
赋能智慧档案管理：藏语识别技术在某省档案馆的创新实践中科逸识 ocr 人工智能全文检索
引言：在数字化浪潮席卷全球的今天，档案馆作为文化遗产保存的重要载体，正面临从传统管理向智慧化转型的挑战。尤其对于多民族地区，如何高效处理少数民族语言档案，成为亟待突破的难题。近期，某省档案馆率先引入领先的藏语智能识别技术，为海量藏文档案的数字化整理、检索与利用插上了科技的翅膀，开创了民族语言档案管理的新范式。一、破解百年藏文档案的“沉睡”难题该档案馆珍藏了跨越数百年的藏文历史文献、公文、手稿等珍贵
杭州11个可以做亲子鉴定的地方（附2024年鉴定中心机构地址）国医基因孙主任
杭州市哪些地方可以做亲子鉴定？杭州市余杭区五常街道高顺路6号的杭州国医基因可以做亲子鉴定。今天小编整理了杭州市能做亲子鉴定的11个地方，排名不分先后，注：各鉴定机构的鉴定类别不同。请根据自身情况和鉴定机构的经营范围进行选择。内容仅供参考。杭州市11个可以做亲子鉴定的地址如下：杭州市司法鉴定机构名单2、浙江省立同德医院司法鉴定所；浙江省杭州市余杭区五常街道五常大道华立社区闲林东路3、杭州市第七人民医
GENERALIST REWARD MODELS: FOUND INSIDE LARGELANGUAGE MODELS 樱花的浪漫大模型与智能体对抗生成网络与动作识别强化学习语言模型人工智能自然语言处理深度学习机器学习计算机视觉
GeneralistRewardModels:FoundInsideLargeLanguageModelshttps://arxiv.org/pdf/2506.232351.概述将大型语言模型（LLMs）与复杂的人类价值观（如乐于助人和诚实）对齐，仍然是人工智能发展中的一个核心挑战。这项任务的主要范式是来自人类反馈的强化学习（RLHF）[Christianoetal.,2017;Baietal.,
财富容器笑影Fiona
财富流觉醒营正式课程第二天财富容器，这个词特别形象，当容器不够大，水不够多，太多也会满出来，当源头水流太小，也装不多。扩容，我们要扩容，但我们又要拒绝急功近利，企业扩张太快，成本急剧增加，会让企业死于现金流的崩溃，而人如果急于扩容，而你的基本盘不够大，也会让你空欢喜一场，因为你德不配位。九哥说财富基本盘等于本事*人脉。在本事这个部分，我一直觉得自己没有，但人家整理家务都能成为本事，真的让我打开思路
在慌乱的六月安静的活王子淳
我开始学会整理衣服，学会把有油渍的衣服浸泡在冷水中，看着护理剂的泡泡一点点将它们淹没，然后在“冰凉凉”的水中将泡泡揉净。我开始又变回那个熟悉的自己，话痨，有时焦虑，或者无助。在这个离家一千多公里的陌生城市，我戴上耳机，试图将自己麻痹在平行世界里。我依然会听宋冬野，会听贰佰，会听万青，会听彩文，会听梅卡德尔，会听棱镜，会听赵雷，会听陈奕迅，会听余佳运，会听盘尼西林，可仿佛这些也没有办法让我的夏天变得
一个例子带你入门机器学习
目录1.为建模选择数据2.选择预测目标3.选择“特征”4.构建您的模型（这篇文章将使用经典墨尔本房价数据集作为例子，引导机器学习的流程，数据集为melb_data.csv，请在csdn的下载区自行下载，运行代码时需要将数据集下载在同个目录下）1.为建模选择数据数据集有太多的变量，多到难以理解，甚至无法很好地打印出来。如何将这海量的数据削减为能够理解的内容？我们将首先凭借直觉选择几个变量。后续将介绍
初探机器学习与力学研究的交叉领域 faderbic 机器学习人工智能深度学习
目录关于如何踏入机器学习领域机器学习与力学研究的交叉方向1.使用机器学习加速有限元求解2.结合有限元计算和机器学习预测复杂材料结构与力学性能的关系3.结构健康检测4.疲劳寿命预测总结关于如何踏入机器学习领域因为我本科的专业是力学，所以当我开始关注机器学习领域时，首先考虑的是机器学习和力学的交叉领域。对于很多对人工智能感兴趣的朋友，想加入人工智能的潮流却不知道从何学起，我提供一个思路，我认为将自己学
阳春白雪（二十三）安之有翡
23：减肥院开张，白雪再次惊憾因为还未正式开业，时间尚充足，不过，白雪还是很自觉地待在店里，熟悉关于减肥仪器的原理，晚上大约7点多钟，白雪把卫生整理完，知道柔姐回来，她才离去。晚上吃完饭，白雪同阿姨讲了今天的一切，无意中提到李姐正需要联系广告。阿姨告诉白雪广告费可是一笔不小的数目，她这里有资源可提供。还说了，听意思这位女老板应该还不错，至少对白雪的印象不错。阿姨要白雪明天去可以提一下广告事，若能谈
[NIPST AI]对抗性机器学习攻击和缓解的分类和术语 Anooyman 人工智能网络安全人工智能大语言模型网络安全安全
原文link：https://nvlpubs.nist.gov/nistpubs/ai/NIST.AI.100-2e2025.pdfIntroduction人工智能（AI）系统在过去几年中持续全球扩展。这些系统正在被众多国家开发并广泛部署于各自的经济体系中，人们在生活的许多领域都获得了更多使用AI系统的机会。本报告区分了两大类AI系统：预测型AI（PredictiveAI，PredAI）和生成型A
承德市正规亲子鉴定中心地址大全（2024年最新汇总）国医基因陈主任
承德亲子鉴定中心地址在哪里？承德亲子鉴定中心地址在承德市西大街路北11号。亲子鉴定作为一种科学的身份确认手段，在现代社会中越来越受到关注和重视。承德内拥有多家正规且具备权威资质的亲子鉴定中心，能够为市民提供准确可靠的鉴定服务。为了方便广大市民在需要时能够迅速找到合适的鉴定机构，我们特地整理了承德正规亲子鉴定中心的地址信息，并进行了一次全面的更新与汇总。承德正规亲子鉴定中心地址大全1、承德国医基因承
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比