LoveMIss-Y

深度学习-各类数据集汇总

阅读目录

Images Analysis
Image Motion & Tracking
Video Analysis & Scene Understanding
3D Computer Vision
Analyzing Humans in Images
Application
Low- & Mid-Level Vision
Text

回到目录

Images Analysis

数据集	介绍	备注	网址
Flickr30k	图片描述	31,783 images，每张图片5个语句标注	链接
Microsoft COCO	图片描述	330,000 images,每张图片至少5个语句标注	链接
ESP Game	多标签定义图像	20,770 images，268 tags，诸如bed, light man,music	链接
IAPRTC-12	多标签定义图像	19,452 images,291 tags	链接
NUS-WIDE	多标签定义图像	269,648 images,several tags (2-5 on average) per image	链接
CUHK-PEDES	以文搜图	34,054 images，每张图片2条描述	链接
VRD	视觉关系检测	5,000 images, 100目录，37,993对关系	链接
sVG	视觉关系检测	108,000 images, 998,000对关系	链接
Visual Genome Dataset	图像属性检测	108,077 images, 5.4 M 区域块，2.8 M 属性，2.3 M 关系	链接
VQA	问答系统	1,105,904问题，11,059,040 回答	链接
Visual7W	问答系统	327,939 问答对	链接
TID2013	图像质量评价	25张参考图像，24个失真类型	链接
CSIQ	图像质量评价	30张参考图像，6个失真类型	链接
LIVE	图像质量评价	29张参考图像，5个失真类型	链接
WATERLOO	图像质量评价	4744张参考图像，20个失真类型	链接
photo.net	图像美观评价	20,278张图像，打分[0,10]	链接
DPChallenge.com	图像美观评价	16,509张图像，打分[0,10]	链接
CUHK	图像美观评价	28,410张图像，只分高质量和低质量	链接
AVA	图像美观评价	255,500张图像，打分[0,10]	链接

回到目录

Image Motion & Tracking

数据集	介绍	备注	网址
CUHK03	Person re-identification(人重识别)	image num:13164 person num:1360 camera num:10( 5 pairs)	链接
CUHK02	Person re-identification(人重识别)	image num:7264 person num:1816 camera num:10( 5 pairs)	链接
CUHK01	Person re-identification(人重识别)	image num:3884 person num:971 camera num: 2	链接
VIPeR	Person re-identification(人重识别)	image num:1264 person num:632 camera num:2	链接
ETH1,2,3	Person re-identification(人重识别)	image num:8580 person num:83,35,28 camera num:1	链接
PRID2011	Person re-identification(人重识别)	image num:24541 person num:934 camera num:2	链接
MARS	Person re-identification(人重识别)	image num:11910031 person num:1261 camera num:6	链接
Market1501	Person re-identification(人重识别)	image num:32217 person num:1501 camera num:6	链接
Epic Fail (EF) dataset	Risk Assessment(风险评估)	video num:3000	链接
Street Accident (SA) dataset	Risk Assessment(风险评估)	video num:1733	链接
OTB-50	visual tracking(跟踪)	video num:50	链接
OTB-100	visual tracking(跟踪)	video num:100	链接
VOT2015	visual tracking(跟踪)	video num:60	链接
ALOV300	visual tracking(跟踪)	video num:314	链接
MOT	visual tracking(跟踪)	video num:train:11 test:11	链接
THUMOS	Temporal action localization(动作定位)	video num:~3K activities class:20 instances:~3K	链接
ActivityNet	Temporal action localization(动作定位)	video num:20k activities class:200 instances:7.6K	链接
Mexaction2	Temporal action localization(动作定位)	activities class:2 instances:1975	链接
FlyingChairs dataset	optical flow(光流)	image pairs：22k	链接
FlyingThings3D	optical flow(光流)	image pairs：22k	链接
KITTI benchmark suite	optical flow(光流)	image pairs：1600	链接
MPI Sintel	optical flow(光流)	image pairs：1064	链接

回到目录

Video Analysis & Scene Understanding

数据集	介绍	备注	网址
UCF101	动作行为识别	13320 video,101类动作，主要是五大类：1)人-物交互；2)肢体运动；3)人-人交互；4)弹奏乐器；5)运动	链接
HMDB51	动作行为识别	7000 videos,51类，包括人脸表情动作，身体动作，人与人交互等	链接
Moments-in-Time	动作行为识别	1,000,000 videos,339类	链接
ActivityNet 1.3	动作行为识别	20,000 videos,200类	链接
Kinetics	动作行为识别	300,000 videos，400类	链接
AVA	动作行为识别	57,600 videos，80类	链接
Collective Activity Dataset	群体活动行为识别	44 videos,穿叉、行走、等待、交谈和排队五类	链接
Choi’s New Dataset	群体活动行为识别	32 videos，聚会，谈话，分开，一起走，追逐和排队六类	None
ActivityNet 1.3	检测动作事件的起始时间和终止时间	20,000 videos,200类动作的起始时间和终止时间	链接
THUMOS	检测动作事件的起始时间和终止时间	15,000 videos，101类动作的起始时间和终止时间	链接
MED	事件检测	32,744 videos,20个事件	链接
EventNet	事件检测	90,000 videos，500个事件	链接
Columbia Consumer Video	事件检测	9,317 videos，20个事件	链接
ADE20K	事件检测	20,210 videos，900个事件	链接
DAVIS	视频主物体分割	50 videos，分割标注	链接
FBMS	视频主物体分割	59 videos，分割标注	链接
IJB-C	视频人脸识别	11,000 videos，	链接
YouTube Faces	视频人脸识别	3,425 videos，1595 人	链接
MS-Celeb-1M	视频人脸识别	1,000,000 images，21,000人	链接
MSVD	视频描述	1,970 videos	链接
MSR-VTT-10K	视频描述	10，000 videos	链接
MSR-VTT-10K	视频描述	无	链接

回到目录

3D Computer Vision

数据集	介绍	备注	网址
photoface database	基于光度立体视觉的二维和三维人脸识别数据库	总共7356张图像，包含1839个session和261个subjects	None
NYU Depth V2 dataset	关于RGBD 图像场景理解的数据库	提供1449张深度图片和他们的密集2d点类标注	链接
SUN RGBD dataset	是上面的NYU Depth V2 dataset的超集，多了3D bounding boxes和room layouts的标注。	有10,000张RGB-D图片，有58,657个3D包围框和146,617 个2d包围框。	链接
PASCAL3D+	新的三维物体检测和姿态估计数据集，从PASCAL VOC 演化而来，包含图像，注解，和3D CAD模型	总共12个类，平均每个类别有3000多个实例	链接
IKEA	包含典型室内场景的三维模型的数据库，例如桌子椅子等	包含大约759张图片和219个3D模型	链接
New Tsukuba Dataset	包含了很多立体物体对的数据库，用于立体物体匹配	总共1800个立体物体对，以及每立体对的立体视差图、遮挡图和不连续图	链接
Oxford RobotCar Dataset	关于户外自动驾驶的数据集。	包含在驾驶汽车过程从6个摄像头收集的2000w张图片，和当时的激光雷达，GPS和地面实况标注。	链接
Middlebury V3	包含高分辨率物体立体视差标注的数据库	包含33个类，没有明说每类有多少数据	链接
ShapeNet	包含3D模型，和3d模型的类别标注的数据集，覆盖了常用的3D数据集PASCAL 3D+。	它涵盖55个常见的对象类别，有大约51,300个3D模型	链接
MICC dataset	包含了3D人脸扫描和在不同分辨率，条件和缩放级别下的几个视频序列的数据库。	有53个人的立体人脸数据	链接
CMU MoCap Dataset	包含了3D人体关键点标注和骨架移动标注的数据集。	有6个类别和23个子类别，总共2605个数据。	链接
DTU dataset	关于3D场景的数据集。	有124个场景，每场景有49/64个位置的RGB图像和结构光标注。	链接

回到目录

Analyzing Humans in Images

数据集	介绍	备注	网址
MSR-Action3D	包含深度的动作识别数据集，	有20个动作，总共557个序列。	链接
Florence-3D	包含深度的动作识别数据集，	有9个动作，总共215个动作序列。	链接
Berkeley MHAD	包含深度的动作识别数据集，	有11个动作，产生660个动作序列。	链接
Online Action Detection	包含深度的动作识别数据集，	数据集包含59个长序列，包含10种不同的日常生活行为。	链接
ChaLearn LAP IsoGD Dataset	RGB-D图像的手势识别的数据集。	包括47933个RGB-D手势视频，有249个手势标签。Training有35878视频，Validation有5784个，test有6271个	链接
MAFA dataset	关于面部遮挡问题的数据集	有30, 811张人脸和35806张有遮挡的脸组成。	链接
MSRC-12 Kinect Gesture Dataset	手势识别数据集	有4900张图片，包含12个不同手势，	链接
2013 Chalearn Gesture Challenge dataset	手势识别数据集	有11000张图片，包含20个不同手势，	链接
WIDER FACE	人脸检测数据集	有 32,203 张图片，标注了393703个人脸。	链接
FDDB	人脸检测数据集	2845张图片，标注了5171张人脸。	链接
300-VW dataset	面部表情数据集	包含114个视频和总计218,595帧。	链接
HMDB51	人类行为识别的数据集	包含51个动作，总共有6766个视频剪辑	链接
MPII Cooking Activities Dataset	人类行为识别的数据集	包含65个动作，有5609个视频	链接
UCF101	人类行为识别的数据集	包含101个动作，有13320个视频	链接
IJB-A dataset	包含视频和图片人脸识别的数据集	包含5712个图像和2085个视频	链接
YouTube celebrities	视频人脸识别的数据集	包含47位名人的1910个视频	链接
COX	视频人脸识别的数据集	包含1000个主题的4000个视频	链接
Human3.6M	人体姿态估计的数据集	360万张3D照片，11名受试者在4个视点下执行15个了不同的动作	链接
iLIDS	行人重识别的数据集	476 张图像，包含119个人	链接
VIPeR	行人重识别的数据集	632个行人图片对（由两个相机拍摄）	链接
CUHK01	行人重识别的数据集	包含971行人, 3884张图片	链接
CUHK03	行人重识别的数据集	包含1360行人, 13164张图片	链接
RWTH-PHOENIX-Weather multi-signer 2014	手语识别的数据集	包含了5672个德语手语的句子，有65,227个手语姿势和799,006帧	链接
AFLW	人类面部关键点的数据集	总共约有25k张脸，每幅图像标注了大约21个位置。	链接
CMU mocap database	动作识别的数据集	2235个数据，包含144个不同的动作。	链接
Georgia Tech (GT) database	人脸识别数据库	50个人每人15张人脸。	链接
ORL	人脸识别数据库	40个人每个人10张图。	链接

回到目录

Application

数据集	介绍	备注	网址
DogCentric Activity Dataset	第一视角的狗和人之间的相互行为的数据集（视频）	总共有10类，具体数据量没有明说，y是动作类别	链接
JPL First-Person Interaction Dataset	第一视角观察动作的数据集	57个视频，8个大类，y是动作类别	链接
NUS-WIDE	关于图像文本匹配的数据集	269,648个图像和对应的标签	链接
LabelMe Dataset	关于图像文本匹配的数据集	3825个图像和对应标签	链接
Pascal Dataset	关于图像文本匹配的数据集	5011张训练图像和4952张测试图像	)
ICDAR 2015	关于文本检测的数据集	1500张训练，1000张测试，y为四边形的四个顶点。	链接
COCO-Text	关于文本检测的数据集	63686张图片，其中43686张被选为训练集，剩下的2万用于测试。	链接
MSRA-TD500	关于文本检测的数据集	300个训练，200个测试图像	链接
Microsoft 7-Scenes Dataset	室内人体运动的数据集	有7种不同室内环境，每包含500-1000张图像视频序列。	链接
Oxford RobotCar	户外自动驾驶数据集	包含图像，激光扫描结果和GPS数据。	链接

回到目录

Low- & Mid-Level Vision

数据集	介绍	备注	网址
Deep Video Deblurring for Hand-held Cameras	video/image deblurring(图像去模糊)	video num:71 video time: 3-5s blurry and sharp pair image num:6708	链接
GOPRO dataset	video/image deblurring(图像去模糊)	blurry and sharp pair image num:3214 train num:2103 test num:1111	链接
BSD68	image restoration(图像修复)/高斯降噪	image num:68	链接
BSD100	“image restoration(图像修复)super resolution超分辨率重建”	image num:100	链接
Set5	“image restoration(图像修复)super resolution超分辨率重建”	image num:5	链接
Set14	“image restoration(图像修复)super resolution超分辨率重建”	image num:14	链接
Urban100	“image restoration(图像修复)super resolution超分辨率重建”	image num:100	链接
NYU v2 dataset	“image restoration(图像修复)depth super resolution深度超分辨率重建”	image num:1449	链接
Middlebury dataset	“image restoration(图像修复)depth super resolution深度超分辨率重建”	image pair num: 33	链接
alpha matting benchmark	Natural image matting(抠图)	“train num:27,test num:8”	链接
real image benchmark	Natural image matting(抠图)	“train num:49300,test num:1000”	链接
MSRA10K/MSRA-B	Image saliency detection(显著性区域检测)	image num(MSRA10K):10000 image num(MSRA-B):5000	链接
ECSSD	Image saliency detection(显著性区域检测)	image num:1000	链接
DUT-OMRON	Image saliency detection(显著性区域检测)	image num:5168	链接
PASCAL-S	Image saliency detection(显著性区域检测)	image num:850	链接
HKU-IS	Image saliency detection(显著性区域检测)	image num:4447	链接
SOD	Image saliency detection(显著性区域检测)	image num:300	链接
Describable Textures Dataset	texture synthesis(纹理合成)	image num:5640 category num:47 split train:val:test = 1:1:1	链接
CVPPP leaf segmentation	Instance segmentation(样例分割)	image num: 161 train num: 128 test num: 33	链接
KITTI car segmentation	Instance segmentation(样例分割)	image num: 3976 train num: 3712 test num: 144 val:120	链接
Cityscapes	Instance segmentation(样例分割)	image num: 5000 train num: 2975 test num: 1525 val:500	链接
SYMMAX	Symmetry Detection(对称性检测)	image num: train:200 test:100	链接
WHSYMMAX	Symmetry Detection(对称性检测)	image num: train:228 test:100 object num: 1	链接
SK506	Symmetry Detection(对称性检测)	image num: train:300 test:206 object num: 16	链接
Sym-PASCAL	Symmetry Detection(对称性检测)	image num: train:648 test:787 object num: 14	链接
Color Checker Dataset	Color constancy(颜色恒定)	image num: 568	链接
NUS 8-Camera Dataset	Color constancy(颜色恒定)	image num: 1736	链接

回到目录

Text

数据集	介绍	备注	网址
Stanford Sentiment Treebank	文本情感分析	11855个句子划分为239231个短语，每个短语有个概率值，越小越负面，越大越正面	链接
IMDB	文本情感分析	100,000句子，正面负面两类	链接
Yelp	文本情感分析	无	链接
Multi-Domain Sentiment Dataset(Amazon product)	文本情感分析	100,000+句子，正面负面2类或强正面、弱正面、中立、弱负面、强负面5类	链接
SemEval	文本情感分析	20,632句子，三类（正面、负面、中立）	链接
Sentiment140(STS)	文本情感分析	1,600,000句子,三类（正面、负面、中立）	链接

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
钢筋长度超限检测检数据集VOC+YOLO格式215张1类别 futureflsl 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：215标注数量(xml文件个数)：215标注数量(txt文件个数)：215标注类别数：1标注类别名称:["iron"]每个类别标注的框数：iron框数=215总框数：215使用标注工具：labelImg标注规则：对类别进
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
Python多线程实现大规模数据集高效转移 sand&wich 网络 python 服务器
背景在处理大规模数据集时，通常需要在不同存储设备、不同服务器或文件夹之间高效地传输数据。如果采用单线程传输方式，当数据量非常大时，整个过程会非常耗时。因此，通过多线程并行处理可以大幅提升数据传输效率。本文将分享一个基于Python多线程实现的高效数据传输工具，通过遍历源文件夹中的所有文件，将它们移动到目标文件夹。工具和库这个数据集转移工具主要依赖于以下Python标准库：os：用于文件系统操作，如
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
COCO 格式的数据集转化为 YOLO 格式的数据集 QYQY77 YOLO python
"""--json_path输入的json文件路径--save_path保存的文件夹名字，默认为当前目录下的labels。"""importosimportjsonfromtqdmimporttqdmimportargparseparser=argparse.ArgumentParser()parser.add_argument('--json_path',default='./instances
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
Python实现关联规则推荐这孩子谁懂哈 Python Machine Learning python 关联规则机器学习
1.什么关联规则关联规则（AssociationRules）是反映一个事物与其他事物之间的相互依存性和关联性，如果两个或多个事物之间存在一定的关联关系，那么，其中一个事物就能通过其他事物预测到。关联规则是数据挖掘的一个重要技术，用于从大量数据中挖掘出有价值的数据项之间的相关关系。关联规则挖掘的最经典的例子就是沃尔玛的啤酒与尿布的故事，通过对超市购物篮数据进行分析，即顾客放入购物篮中不同商品之间的关
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
[数据集][目标检测]汽车头部尾部检测数据集VOC+YOLO格式5319张3类别 FL1623863129 数据集目标检测汽车 YOLO
数据集制作单位：未来自主研究中心(FIRC)版权单位：未来自主研究中心(FIRC)版权声明：数据集仅仅供个人使用，不得在未授权情况下挂淘宝、咸鱼等交易网站公开售卖,由此引发的法律责任需自行承担数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：5319标注数量(xml文件
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR

深度学习-各类数据集汇总

Images Analysis

Image Motion & Tracking

Video Analysis & Scene Understanding

3D Computer Vision

Analyzing Humans in Images

Application

Low- & Mid-Level Vision

Text

你可能感兴趣的:(深度学习,数据集,深度学习,数据挖掘,机器学习)