jack_201316888

常用公共数据集

这是一个整理的图像和视频数据库列表，这些数据库对计算机视觉研究和算法评估很有用。（Google直接翻译的，希望对大家有帮助）

原文链接：http://homepages.inf.ed.ac.uk/rbf/CVonline/Imagedbase.htm#action

一、行动数据库

20bn-Something-Something - 密集标记的视频剪辑，显示人类使用日常物品执行预定义的基本动作（Twenty Billion Neurons GmbH）
3D在线行动数据集 - 有七个行动类别（微软和南洋理工大学）
50沙拉 - 完整注释的4.5小时RGB-D视频+加速度计数据数据集，捕获25人准备两个混合沙拉（邓迪大学，塞巴斯蒂安斯坦）
办公活动的第一人称视觉数据集（FPVO） - FPVO包含使用12名参与者收集的办公活动的第一人称视频片段。（G. Abebe，A。Catala，A。Cavallaro）
ActivityNet - 人类活动理解的大型视频基准（200个课程，每班100个视频，648个视频小时）（Heilbron，Escorcia，Ghanem和Niebles）
视频中的动作检测 - MERL购物数据集由106个视频组成，每个视频的序列长约2分钟（Michael Jones，Tim Marks）
演员和动作数据集 - 3782个视频，七个类别的演员表演八种不同的动作（Xu，Hsieh，Xiong，Corso）
用于行动识别的各种标记视频数据集的分析整理（Kevin Murphy）
ASLAN动作相似性标记挑战数据库（Orit Kliper-Gross）
用于理解非结构化社交活动的属性学习 - 包含10种非结构化社交事件类别的视频数据库，以及69个属性的注释。（Y. Fu Fudan / QMUL，T。Hospedales Edinburgh / QMUL）
视听事件（AVE）数据集 - AVE数据集包含4143个YouTube视频，涵盖28个事件类别和AVE数据集中的视频，在时间上标有视听事件边界。（田亚鹏，景石，李伯辰，段志尧，徐晨亮）
AVA：原子视觉动作的视频数据集 - 430个15分钟电影剪辑中的80个原子视觉动作。（谷歌机器感知研究小组）
BBDB - 棒球数据库（BBDB）是一个大型棒球视频数据集，包含4200小时的完整棒球比赛视频，有400,000个临时注释的活动片段。（Shim，Minho，Young Hwi，Kyungmin，Kim，Seon Joo）
使用标记来交互人物视频数据（Scott Blunsden，Bob Fisher，Aroosha Laghaee）
BU动作数据集 - 三个图像动作数据集（BU101，BU101未过滤，BU203未过滤），与视频数据集UCF101和ActivityNet的类别1：1对应。（S. Ma，SA Bargal，J。Zhang，L。Sigal，S。Sclaroff。）
伯克利MHAD：综合多模人类行动数据库（Ferda Ofli）
伯克利多模人类行动数据库 - 扩展应用领域的五种不同模式（加州大学伯克利分校和约翰霍普金斯大学）
早餐数据集 - 这是一个包含1712个视频剪辑的数据集，显示10个厨房活动，这些活动被手工分割成48个原子动作类。（H. Kuehne，AB Arslan和T. Serre）
Bristol Egocentric Object Interactions数据集 - 包含从第一人称（以自我为中心）观点拍摄的视频，其中3-5个用户在六个不同的位置执行任务（Dima Damen，Teesid Leelaswassuk和Walterio Mayol-Cuevas，布里斯托尔大学）
布朗早餐行动数据集 - 70个小时，10个不同的早餐准备活动400万帧（Kuehne，Arslan和Serre）
CAD-120数据集 - 侧重于高级活动和对象交互（康奈尔大学）
CAD-60数据集 - CAD-60和CAD-120数据集包含人类活动的RGB-D视频序列（康奈尔大学）
CVBASE06：带注释的体育视频（Janez Pers）
Charades数据集 - 来自267名志愿者的10,000个视频，每个视频都注释了多个活动，字幕，对象和时间本地化。（Sigurdsson，Varol，Wang，Laptev，Farhadi，Gupta）
可组合活动数据集 - 26个原子动作的不同组合形成16个活动类别，由14个科目和注释提供（智利大学和智利大学）
人类跌倒的连续多模态多视图数据集 - 数据集包括正常日常活动和模拟跌倒，用于评估人体跌倒检测。（Thanh-Hai Tran）
康奈尔活动数据集CAD 60，CAD 120（康奈尔机器人学习实验室）
DMLSmartActions数据集 - 十六名受试者以自然的方式进行了12种不同的行动。（不列颠哥伦比亚大学）
DemCare数据集 - DemCare数据集由来自不同传感器的一组不同数据集合组成，可用于从可穿戴/深度和静态IP摄像机识别人类活动，用于Alzheimmer疾病检测的语音识别以及用于步态分析和异常检测的生理数据。（K. Avgerinakis，A.Karakostas，S.Vrochidis，I。Kompatsiaris）
包含深度的人类行动视频数据集 - 它包含23种不同的行动（中央研究院的CITI）
DogCentric活动数据集 - 从安装在*狗*上的相机拍摄的第一人称视频*（Michael Ryoo）
爱丁堡ceilidh头顶视频数据 - 从头顶观看16个地面舞蹈，10个舞者遵循结构化的舞蹈模式（2种不同的舞蹈）。该数据集对于高度结构化的行为理解非常有用（Aizeboje，Fisher）
EPIC-KITCHENS - 由32名参与者在其原生厨房环境中记录的以自我为中心的视频，非脚本日常活动，11.5M帧，39.6K帧级动作片段和454.2K物体边界框（Damen，Doughty，Fidler等）
EPFL绉纱烹饪视频 - 分析1920x1080分辨率的6种结构化烹饪活动（12）视频（Lee，Ognibene，Chang，Kim和Demiris）
ETS曲棍球比赛事件数据集 - 此数据集包含使用固定摄像头拍摄的两个曲棍球比赛的镜头。（M.-A. Carbonneau，AJ Raymond，E。Granger和G. Gagnon）
FCVID：复旦 - 哥伦比亚视频数据集 - 根据239个类别手动注释的91,223个网络视频（江，吴，王，薛，张）
SoccerNet - 用于在足球视频中进行动作发现的可扩展数据集：500个足球游戏，完全注释主要动作（目标，牌，潜艇）和超过13K的足球比赛注释500K评论用于事件字幕和游戏摘要。（Silvio Giancola，Mohieddine Amine，Tarek Dghaily，Bernard Ghanem）
G3D - 使用Microsoft Kinect（Victoria Bloom）捕获的20个游戏动作的同步视频，深度和骨架数据
G3Di - 此数据集包含12个科目，分为6对（金斯顿大学）
游戏3D数据集 - 游戏场景中的实时动作识别（金斯顿大学）
佐治亚理工学院自我中心活动 - 凝视（+） - 人们观看的视频和他们的凝视位置（Fathi，Li，Rehg）
HMDB：大型人体运动数据库（Serre Lab）
好莱坞三维数据集 - 涵盖14个动作类（哈德菲尔德和鲍登）的650个3D视频剪辑
人类行动和场景数据集（Marcin Marszalek，Ivan Laptev，Cordelia Schmid）
人体搜索搜索人类注释器的序列，其任务是在AVA和THUMOS14数据集中发现动作。（Alwassel，H.，Caba Heilbron，F.，Ghanem，B。）
Hollywood Extended - 937个视频剪辑，总共787720帧，包含来自69部好莱坞电影的16种不同动作的序列。（Bojanowski，Lajugie，Bach，Laptev，Ponce，Schmid和Sivic）
HumanEva：用于评估关节人体运动的同步视频和运动捕捉数据集（布朗大学）
I-LIDS视频事件图像数据集（用于智能检测系统的图像库）（Paul Hosner）
I3DPost多视图人类行动数据集（Hansung Kim）
IAS-lab Action数据集 - 包含足够多的操作和执行操作的人数（帕多瓦大学的IAS实验室）
ICS-FORTH MHAD101行动共同分割 - 共享一个或多个共同动作以共同分割的 101对长期动作序列，包含三维骨架和视频相关的基于帧的特征（克里特岛大学和FORTH-ICS， K. Papoutsakis）
IIIT极限运动 - 来自YouTube的160个第一人称（自我中心）体育视频，帧级注释为18个动作类。（Suriya Singh，Chetan Arora和CV Jawahar。轨迹对齐）
INRIA Xmas运动采集序列（IXMAS）（INRIA）
InfAR数据集 - 不同时间神经计算的红外动作识别（陈强强，杜银河，刘江，吕静，杨鲁宇，孟德玉，Alexander G. Hauptmann）
JHMDB：基于来自HMDB51的928个剪辑的HMDB数据集（J-HMDB）的关节，包括21个动作类别（Jhuang，Gall，Zuffi，Schmid和Black）
JPL第一人称互动数据集 - 从第一人称角度拍摄的7种人类活动视频（Michael S. Ryoo，JPL）
耶拿行动识别数据集 - 爱宝犬行动（Korner和Denzler）
K3Da - Kinect 3D主动数据集 - K3Da（Kinect 3D主动）是一个真实的临床相关人类动作数据集，包含骨架，深度数据和相关参与者信息（D. Leightley，MH Yap，J。Coulson，Y。Barnouin和JS McPhee）
动力学人类行动视频数据集 - 300,000个视频剪辑，400个人类动作classe，10秒剪辑，每个剪辑单个动作（Kay，Carreira，et al）
KIT Robo-Kitchen活动数据集 - 由17人组成的540张剪辑，进行12项复杂的厨房活动。（L.R.R.Robok，S。Friedberger，UD Hanebeck，R。Stiefelhagen）
KTH人类行动识别数据库（KTH CVAP实验室）
卡尔斯鲁厄运动，意图和活动数据集（MINTA） - 7种类型的日常生活活动，包括完全运动的原始部分。（D。Gehrig，P。Krauthausen，L。Rybok，H。Kuehne，UD Hanebeck，T。Schultz， R. Stiefelhagen）
LIRIS人类活动数据集 - 包含（灰色/ rgb /深度）视频，显示人们进行各种活动（Christian Wolf等，法国国家科学研究中心）
MEXaction2动作检测和本地化数据集 - 支持开发和评估在相对较大的视频数据库中“发现”短行动实例的方法：77小时，117个视频（Michel Crucianu和Jenny Benois-Pineau）
MLB-YouTube - 棒球视频中的活动识别数据集（AJ Piergiovanni，Michael Ryoo）
时间数据集中的时刻 - 时间数据集中的时刻1M使用操作类型注释的3秒视频，这是用于在视频中识别和理解动作的最大数据集。（蒙福特，奥利瓦等人）
MPII烹饪活动数据集用于细粒度烹饪活动识别，其中还包括连续姿势估计挑战（Rohrbach，Amin，Andriluka和Schiele）
MPII Cooking 2数据集 - 细粒度烹饪活动的大型数据集，是MPII烹饪活动数据集的延伸。（Rohrbach，Rohrbach，Regneri，Amin，Andriluka，Pinkal，Schiele）
MSR-Action3D - 基准RGB-D动作数据集（Microsoft Research Redmond和University of Wollongong）
MSRActionPair数据集 - ：深度序列中活动识别的定向4D法线直方图（中佛罗里达大学和微软）
MSRC-12 Kinect手势数据集 - 来自执行12个手势的人的594个序列和719,359个帧（Microsoft Research Cambridge）
MSRC-12数据集 - 人体运动的序列，表示为身体部位，以及相关的姿势（Microsoft Research Cambridge and Cambridge of Cambridge）
MSRDailyActivity3D数据集 - 有16项活动（微软和西北大学）
ManiAc RGB-D动作数据集：不同的操纵动作，15种不同的版本，30种不同的操纵对象，20种长而复杂的链式操作序列（Eren Aksoy）
Mivia数据集 - 它由14个主题执行的7个高级动作组成。（Salemo大学的Mivia Lab）
MuHAVi - Multicamera人类行动视频数据（Hossein Ragheb）
多模态动作检测（MAD）数据集 - 它包含由20个主题执行的35个连续动作。（卡内基·梅隆大学）
多视图3D事件数据集 - 此数据集包括8个主题（加州大学洛杉矶分校）执行的8类事件
名古屋大学超低分辨率FIR图像动作数据集 - 由16x16低分辨率FIR传感器捕获的动作识别数据集。（名古屋大学）
NTU RGB + D动作识别数据集 - NTU RGB + D是用于人类动作识别的大规模数据集（Amir Shahroudy）
西北 - 加州大学洛杉矶分校Multiview Action 3D - 有10个行动类别:(西北大学和加州大学洛杉矶分校）
Office活动数据集 - 它由Kinect 2.0从执行常见办公活动的不同主体获取的骨架数据组成。（A. Franco，A。Magnani，D。Maiop）
牛津电视人体互动（牛津视觉几何组）
议会 - 议会数据集是228个视频序列的集合，描绘了希腊议会的政治演讲。（Michalis Vrigkas，Christophoros Nikou，Ioannins A. kakadiaris）
程序性人类行动视频 - 该数据集包含大约40,000个用于人类动作识别的视频，这些视频是使用3D游戏引擎生成的。该数据集包含大约600万帧，其可用于训练和评估模型，不仅是动作识别，而且还用于深度图估计，光流，实例分割，语义分割，3D和2D姿势估计以及属性学习的模型。（Cesar Roberto de Souza）
RGB-D活动数据集 - 数据集中的每个视频包含2-7个涉及与不同对象交互的操作。（康奈尔大学和斯坦福大学）
RGBD-Action-Completion-2016 - 该数据集包括414个完整/不完整的对象交互序列，跨越六个动作并呈现RGB，深度和骨架数据。（Farnoosh Heidarivincheh，Majid Mirmehdi，Dima Damen）
基于RGB-D的动作识别数据集 - 包含不同rgb-d动作识别数据集的列表和链接的论文。（张静，李万庆，Philip O. Ogunbona，王必皓，唐昌）
RGBD-SAR数据集 - RGBD-SAR数据集（中国电子科技大学和微软）
罗切斯特日常生活活动数据集（Ross Messing）
SBU Kinect交互数据集 - 它包含八种类型的交互（Stony Brook大学）
SBU-Kinect-Interaction数据集v2.0 - 它包含进行交互活动的人类RGB-D视频序列（Kiwon Yun等）
SDHA 2010年人类活动语义描述 - 人类互动（Michael S. Ryoo，JK Aggarwal，Amit K. Roy-Chowdhury）
SDHA人类活动语义描述2010年比赛 - 空中观点（Michael S. Ryoo，JK Aggarwal，Amit K. Roy-Chowdhury）
SFU排球小组活动识别 - 排球视频的2级注释数据集（9个玩家的动作和8个场景的活动）。（M.Ibrahim，S。Muralidharan，Z。Deng，A。Vahdat和G. Mori / Simon Fraser大学）
SYSU 3D人 - 对象交互数据集 - 40个科目进行12项不同的活动（中山大学）
ShakeFive数据集 - 仅包含两个动作，即握手和高五。（Universitit Utrecht）
ShakeFive2 - 153个高清视频中8个类别的肢体水平注释的二元人体交互数据集（Coert van Gemeren，Ronald Poppe，Remco Veltkamp）
野外体育视频（SVW） - SVW由Coach Eye智能手机用户使用智能手机拍摄的4200个视频，这是TechSmith公司开发的运动训练的领先应用程序。（Seyed Morteza Safdarnejad，Xiaoming Liu）
斯坦福体育赛事数据集（贾莉）
利兹活动数据集 - 早餐（LAD - 早餐） - 由15个带注释的视频组成，代表五个不同的人吃早餐或其他简单的一餐; （John Folkesson等人）
THU-READ（清华大学RGB-D自我中心行动数据集） - THU-READ是一个用于RGBD视频中动作识别的大型数据集，带有像素杠杆手部注释。（Yansong Tang，Yi Tian，Lu Jiwen Lu，Jianjiang Feng，Jie Zhou）
THUMOS - 在时间上未修剪的视频中的动作识别！ - 430小时的视频数据和4500万帧（Gorban，Idrees，Jiang，Zamir，Laptev Shah，Sukthanka）
TUM厨房数据集的日常操作活动（Moritz Tenorth，Jan Bandouch）
电视人体互动数据集（Alonso Patron-Perez）
下降检测数据集 - 两个场景中的六个主题连续执行了一系列操作（德克萨斯大学）
TJU数据集 - 包含在两个不同环境中由20个主题执行的22个动作; 共有1760个序列。（天津大学）
UCF-iPhone数据集 - 使用Apple iPhone 4智能手机上的惯性测量单元（IMU）从（6-9）个科目记录了9个有氧运动。（Corey McCall，Kishore Reddy和Mubarak Shah）
UPCV动作数据集 - 数据集由20个受试者两次执行的10个动作组成。（帕特雷大学）
UC-3D运动数据库 - 可用的数据类型包括高分辨率运动捕捉，通过Xsens的MVN Suit和Microsoft Kinect RGB以及深度图像采集。（葡萄牙科英布拉系统与机器人研究所）
UCF 101动作数据集 101动作类，超过13k个剪辑和27小时视频数据（佛罗里达中部大学）
UCF-犯罪数据集：监控视频中的真实异常检测 - 用于监控视频中真实异常检测的大型数据集。它包括1900长和未经修剪的现实监控视频（128小时），包括13个现实异常，如战斗，交通事故，入室盗窃，抢劫等，以及正常活动。（中佛罗里达大学计算机视觉研究中心）
UCFKinect - 数据集由16个动作组成（中佛罗里达大学奥兰多分校）
加州大学洛杉矶分校人与人对象互动（HHOI）数据集Vn1 - RGB-D视频中的人机交互（Shu，Ryoo和Zhu）
加州大学洛杉矶分校人与人对象互动（HHOI）数据集Vn2 - RGB-D视频中的人机交互（第2版）（Shu，Gao，Ryoo和Zhu）
UCR Videoweb多摄像机广域活动数据集（Amit K. Roy-Chowdhury）
UTD-MHAD - 八名受试者进行了四次27次动作。（德克萨斯大学达拉斯分校）
UTKinect数据集 - 10个受试者（德克萨斯大学）进行了两次人类行为的十种类型
UWA3D多视图活动数据集 - 由10个人（西澳大利亚大学）进行了30项活动
佛罗里达中部大学 - 现实视频中的50个动作类别识别（3 GB）（Kishore Reddy）
佛罗里达中部大学 - ARG航空相机，屋顶摄像机和地面摄像机（UCF计算机视觉实验室）
佛罗里达中部大学 - 长片动作数据集（佛罗里达中部大学）
佛罗里达中部大学 - 体育行动数据集（佛罗里达中部大学）
佛罗里达中部大学 - YouTube动作数据集（体育）（佛罗里达中部大学）
未分类体育新闻视频 - 74个体育新闻视频数据库，标记有10类体育。旨在测试多标签视频标记。（T. Hospedales，爱丁堡/ QMUL）
乌得勒支多人运动基准（UMPM）。 - 基于动作捕捉数据的人物视频录像和基础事实的集合。（NP van der Aa，X。Luo，GJ Giezeman，RT Tan，RC Veltkamp。）
VIRAT视频数据集 - 从涉及人类和车辆的两大类活动（单一对象和双对象）中识别事件。（Sangmin Oh等）
维罗纳社交互动数据集（Marco Cristani）
ViHASi：虚拟人体动作剪影数据（用户ID：VIHASI密码：虚拟$虚拟）（Hossein Ragheb，金斯顿大学）
Videoweb（multicamera）活动数据集（B. Bhanu，G。Denina，C。Ding，A。Ivers，A。Kamal，C。Ravishankar，A。Roy-Chowdhury，B。Varda）
WVU多视图动作识别数据集（西弗吉尼亚大学）
WorkoutSU-10用于锻炼动作的Kinect数据集（Ceyhun Akgul）
WorkoutSU-10数据集 - 包含由专业培训师为治疗目的选择的锻炼行动。（萨班哲大学）
腕上摄像机视频数据集 - 对象操作（Ohnishi，Kanehira，Kanezaki，Harada）
YouCook - 带有注释的88个开源YouTube烹饪视频（Jason Corso）
YouTube-8M数据集 - 用于视频理解研究的大型多样化标签视频数据集（Google Inc.）

二、农业

阿伯里斯特威斯叶评估数据集 - 用手标记的植物图像标记了一些时间步骤的叶级分割，以及来自植物牺牲的生物数据。（Bell，Jonathan; Dee，Hannah M.）
Fieldsafe - 农业中障碍物检测的多模态数据集。（奥胡斯大学）
KOMATSUNA数据集 - 数据集用于使用连续多视图RGB图像和深度图像进行叶子的实例分割，跟踪和重建。（九州大学Hideaki Uchiyama）
叶子计数数据集 - 估算小型植物生长阶段的数据集。（奥胡斯大学）
叶片分割挑战烟草和拟南芥植物图像（Hanno Scharr，Massimo Minervini，Andreas Fischbach，Sotirios A. Tsaftaris）
多物种果实花朵检测 - 该数据集由四组花卉图像组成，来自三种不同的树种：苹果，桃子和梨，以及伴随的地面真实图像。（Philipe A. Dias，Amy Tabb，Henry Medeiros）
植物表型分析数据集 - 适用于植物和叶子检测，分割，追踪和物种识别的植物数据（M. Minervini，A。Fischbach，H。Scharr，SA Tsaftaris）
植物幼苗数据集 - 12种杂草种的高分辨率图像。（奥胡斯大学）

三、属性识别

用于理解非结构化社交活动的属性学习 - 包含10种非结构化社交事件类别的视频数据库，以及69个属性的注释。（Y. Fu Fudan / QMUL，T。Hospedales Edinburgh / QMUL）
具有属性2 - 37322（自由许可）的动物50个动物类的图像，具有85个每类二进制属性。（Christoph H. Lampert，IST奥地利）
鸟类这个数据库包含6个不同类别的鸟类的600张图像（每个100个样本）。（Svetlana Lazebnik，Cordelia Schmid和Jean Ponce）
蝴蝶这个数据库包含719种不同类型蝴蝶的619张图像。（Svetlana Lazebnik，Cordelia Schmid和Jean Ponce）
CALVIN研究组数据集 - 使用眼睛跟踪，图像网络边界框，同步活动，火柴人和身体姿势，youtube对象，面部，马，玩具，视觉属性，形状类（CALVIN ggroup）进行对象检测
CelebA - 大型CelebFaces属性数据集（刘紫薇，罗平，王小刚，王小鸥）
DukeMTMC属性 - DukeMTMC-reID的23个行人属性（Lin，Zheng，Zheng，Wu和Yang）
EMOTIC（情境中的情绪） - 嵌入其自然环境中的人物（34357）的图像，用2种不同的情感表示进行注释。（Ronak kosti，Agata Lapedriza，Jose Alvarez，Adria Recasens）
拥有27个人类属性的HAT数据库（Gaurav Sharma，Frederic Jurie）
用于学习相对属性的LFW-10数据集 - 10,000对面部图像的数据集，具有10个属性的实例级注释。（CVIT，IIIT Hyderabad。）
市场-1501属性 - 1501名购物者的27个视觉属性。（林，郑，郑，吴，杨）
多级天气数据集 - 我们的多级基准数据集包含来自6个常见类别的65,000张图像，适用于晴天，阴天，下雨，下雪，阴霾和雷电天气。该数据集有益于天气分类和属性识别。（迪林）
个人照片集中的人物识别 - 我们引入了三个更难分割的评估和长期属性注释和每照片时间戳元数据。（哦，Seong Joon和Benenson，Rodrigo和Fritz，Mario和Schiele，Bernt）
UT-Zappos50K Shoes - 大型鞋类数据集，包含50,000个目录图像和超过50,000个成对相对属性标签，共11个细粒度属性（Aron Yu，Mark Stephenson，Kristen Grauman，UT Austin）
视觉属性数据集可视属性注释，用于超过500个对象类（动画和无生命），它们都在ImageNet中表示。每个对象类都使用基于636个属性的分类的视觉属性进行注释（例如，具有毛皮，由金属制成，是圆形的）。
视觉隐私（VISPR）数据集 - 隐私多标签数据集（22k图像，68隐私属性）（Orekondy，Schiele，Fritz）
WIDER属性数据集 - WIDER属性是一个大规模的人类属性数据集，有13789个图像属于30个场景类别，57524个人类边界框，每个用14个二进制属性注释。（Li，Yining和Huang，Chen和Loy，Chen Change and唐小鸥）

四、自动驾驶

AMUSE - 在多个测试驱动期间在真实交通场景中拍摄的汽车多传感器（AMUSE）数据集。（Philipp Koschorrek等）
自动驾驶 - 语义分割，行人检测，虚拟世界数据，远红外线，立体声，驾驶员监控。（CVC研究中心和UAB和UPC大学）
福特校园视觉和激光雷达数据集 - 来自专业（Applanix POS LV）和消费者（Xsens MTI-G）惯性测量单元（IMU），Velodyne 3D激光雷达扫描仪，两个推扫式前视Riegl激光雷达的时间注册数据，以及Point Grey Ladybug3全方位相机系统（Pandey，McBride，Eustice）
FRIDA（Foggy Road Image DAtabase）图像数据库 - 用于可见性和对比度恢复算法的性能评估的图像。FRIDA：18个城市道路场景的90幅合成图像。FRIDA2：330种不同道路场景的合成图像，其视点与车辆驾驶员的视点相近。（Tarel，Cord，Halmaoui，Gruyer，Hautiere）
House3D - House3D是一个虚拟3D环境，由数千个室内场景组成，这些场景配备了各种场景类型，布局和源自SUNCG数据集的对象。它包括超过45,000个室内3D场景，从工作室到带游泳池和健身室的两层房屋。所有3D对象都使用类别标签进行完全注释。环境中的代理可以访问多种模态的观察，包括RGB图像，深度，分割掩模和自上而下的2D地图视图。渲染器以每秒数千帧的速度运行，使其适用于大规模RL训练。（Yi Wu，Yuxin Wu，Georgia Gkioxari，Yuandong Tian，facebook research）
印度驾驶数据集（IDD） - 来自印度的非结构化驾驶条件，具有50,000帧（10,000个语义和40,000个粗略注释），用于训练自动驾驶汽车以查看使用对象检测，场景级和实例级语义分段（CVIT，IIIT Hyderabad和Intel ）
自动驾驶中的联合注意力（JAAD） - 数据集包括行人和汽车的实例，主要用于自动驾驶环境中的行为研究和检测。（Iuliia Kotseruba，Amir Rasouli和John K. Tsotsos）
LISA车辆检测数据集 - 在各种照明和交通条件下驾驶视频的第一人称色彩（Sivaraman，Trivedi）
失物招领数据集 - 失物招领数据集解决了自动驾驶应用中发现意外的小型道路危险（通常由货物丢失引起）的问题。（Sebastian Ramos，Peter Pinggera，Stefan Gehrig，Uwe Franke，Rudolf Mester，Carsten Rother）
nuTonomy场景数据集（nuScenes） - nuScenes数据集是一个大规模的自动驾驶数据集。它具有：全传感器套件（1x LIDAR，5x雷达，6x摄像头，IMU，GPS），1000个场景，每个20s，1,440,000个摄像头图像，400,000个激光雷达扫描，两个不同的城市：波士顿和新加坡，左侧与右侧交通，详细地图信息，25个对象类的手动注释，以2Hz注释的1.1M 3D边界框，可见性，活动和姿势等属性。（凯撒等人）
RESIDE（现实单图像去雾） - 目前最大规模的基准测试，包括合成和真实世界的模糊图像，用于图像去雾研究。RESIDE突出了各种数据源和图像内容，并提供各种培训或评估目的。（李博琪，任文琦，傅登攀，陶大成，丹峰，曾文君，王章阳）
SYNTHIA - 用于训练自动驾驶汽车的大型（约50万）虚拟世界图像。（计算机视觉中心的ADAS集团）
多车辆立体事件摄像机数据集 - 包含具有地面真实姿势，深度图和光流的立体对DAVIS 346b事件摄像机的多个序列。（lex Zihao Zhu，Dinesh Thakur，Tolga Ozaslan，Bernd Pfrommer，Vijay Kumar，Kostas Daniilidis）
图像和注释的SYNTHetic集合 - 在驾驶场景的背景下帮助语义分割和相关场景理解问题的目的。（计算机视觉中心，UAB）
TRoM：清华道路标记 - 这是一个有助于自动驾驶和ADAS道路标记分割领域的数据集。（刘晓龙，邓志东，曹乐乐，陆洪超）
密歇根大学北校区长期视野和激光雷达数据集 - 在15个月的时间内，在室内和室外，每周两次，每天不同的时间间隔，大约每两周一次。包括：移动障碍物（例如，行人，骑自行车和汽车），变化的照明，不同的观点，季节和天气变化（例如，落叶和雪），以及由施工引起的长期结构变化。包括地面真相姿势。（Carlevaris-Bianco，Ushani，Eustice）

五、生物/医药

2008年MICCAI MS病变分割挑战（美国国立卫生研究院神经科学研究蓝图）
ASU DR-AutoCC数据 - 糖尿病视网膜病变分类数据集的多实例学习特征空间（Ragav Venkatesan，Parag Chandakkar，Baoxin Li - 亚利桑那州立大学）
阿伯里斯特威斯叶评估数据集 - 用手标记的植物图像标记了一些时间步骤的叶级分割，以及来自植物牺牲的生物数据。（Bell，Jonathan; Dee，Hannah M.）
用于椎体定位基准的带注释的脊柱CT数据库，125名患者，242次扫描（Ben Glockern）
BRATS - 脑多参数磁共振图像中肿瘤结构的识别和分割（TU Munchen等）
乳腺超声数据集B - 2D乳腺超声图像，53个恶性病变和110个良性病变。（UDIAT诊断中心，MH Yap，R。Marti）
Calgary-Campinas公共脑MR数据集：来自三个不同供应商（GE，飞利浦和西门子）的扫描仪和两个磁场强度（1.5 T和3 T）的359名受试者获得了T1加权脑MRI。扫描对应于较老的成人受试者。（Souza，Roberto，Oeslle Lucena，Julia Garrafa，David Gobbi，Marina Saluzzi，Simone Appenzeller，Leticia Rittner，Richard Frayne和Roberto Lotufo）
Cholec80：80个胆囊腹腔镜视频，注释了相位和工具信息。（Andru Putra Twinanda）
CRCHistoPhenotypes - 标记的细胞核数据 - 结肠直肠癌？组织学图像？由近30,000个点状核组成，超过22,000个细胞类型标记（Rajpoot + Sirinukunwattana）
Cavy Action Dataset - 16个序列，640 x 480分辨率，每秒7.5帧（fps），共有大约31621506帧（272 GB）相互作用的豚鼠（豚鼠）（Al-Raziqi和Denzler）
细胞跟踪挑战数据集 - 具有基本事实的2D / 3D延时视频序列（Ma等，Bioinformatics 30：1609-1617,2014）
计算机断层扫描肺气肿数据库（Lauge Sorensen）
COPD机器学习数据集 - 来自肺部计算机断层扫描（CT）图像的特征数据集的集合，可用于慢性阻塞性肺病（COPD）的诊断。该数据库中的图像被弱标记，即每个图像，给出诊断（COPD或无COPD），但不知道肺的哪些部分受到影响。此外，图像是在不同的站点和不同的扫描仪获得的。这些问题与机器学习中的两种学习场景有关，即多实例学习或弱监督学习，以及转移学习或领域适应。（Veronika Cheplygina，Isabel Pino Pena，Jesper Holst Pedersen，David A. Lynch，Lauge S.，Marleen de Bruijne）
CREMI：MICCAI 2016 Challenge - 神经组织，神经元和突触分割，突触伴侣注释的6卷电子显微镜。（Jan Funke，Stephan Saalfeld，Srini Turaga，Davi Bock，Eric Perlman）
CRIM13 Caltech Resident-Intruder Mouse数据集 - 237个10分钟视频（25 fps）注释动作（13个课程）（Burgos-Artizzu，Doll ?? r，Lin，Anderson和Perona）
DIADEM：轴突和树突状形态学竞赛的数字重建（艾伦脑科学研究所等）
DIARETDB1 - 标准糖尿病视网膜病变数据库（Lappeenranta Univ of Technology）
驱动：用于血管提取的数字视网膜图像（乌得勒支大学）
DeformIt 2.0 - 图像数据增强工具：使用单个图像分割对（Brian Booth和Ghassan Hamarneh）模拟具有地面真实分割的新颖图像
可变形图像配准实验室数据集 - 用于可变形图像配准（DIR）空间精度性能的客观和严格评估。（Richard Castillo等人）
DERMOFIT皮肤癌数据集 - 在相同的受控条件下捕获10个类别的1300个病灶。包括病变分割面罩（Fisher，Rees，Aldridge，Ballerini等）
皮肤镜检查图像（Eric Ehrsam）
EPT29。这个数据库包含4841个样本的2613个样本，包括29个分类的EPT :( Tom等）
EATMINT（用于中介INTeraction的情感意识工具）数据库 - EATMINT数据库包含协作设置中的情感和社交行为的多模态和多用户录制。（Guillaume Chanel，Gaelle Molinari，Thierry Pun，Mireille Betrancourt）
FIRE眼底图像注册数据集 - 134个视网膜图像对和注册真实性。（FORTH-ICS）
组织学图像采集库（HICL） - HICL是来自各种疾病（例如脑癌，乳腺癌和HPV（人乳头瘤病毒） - 宫颈癌）的3870个病理图像（迄今为止）的汇编。（医学图像和信号处理（MEDISP）实验室，西阿提卡大学工程学院生物医学工程系）
蜜蜂分割数据集 - 它是一个数据集，包含蜂巢的2D表面上数百只蜜蜂的位置和方向角。（Bozek K，Hebert L，Mikheyev AS，Stephesn GJ）
IIT MBADA鼠标 - 小鼠行为数据。FLIR A315，空间分辨率为320 ?? 240px，30fps，50x50cm开放式竞技场，两位专家为三只不同的小鼠对，小鼠身份。（意大利技术研究所，PAVIS实验室）
印度糖尿病视网膜病变图像数据集 - 该数据集包括在像素级注释的视网膜眼底图像，用于与糖尿病视网膜病变相关的病变。此外，它提供了糖尿病性视网膜病和糖尿病性黄斑水肿的疾病严重性。该数据集可用于开发和评估用于早期检测糖尿病性视网膜病变的图像分析算法。（Prasanna Porwal，Samiksha Pachade，Ravi Kamble，Manesh Kokare，Girish Deshmukh，Vivek Sahasrabuddhe，Fabrice Meriaudeau）
IRMA（医学应用中的图像检索） - 该系列编辑匿名射线照片（Deserno TM，Ott B）
KID - 用于医疗决策支持的胶囊内窥镜数据库（Anastasios Koulaouzidis和Dimitris Iakovidis）
叶片分割挑战烟草和拟南芥植物图像（Hanno Scharr，Massimo Minervini，Andreas Fischbach，Sotirios A. Tsaftaris）
LITS肝脏肿瘤分割 - 130个3D CT扫描，肝脏和肝脏肿瘤的分割。公共基准与Codalab.org的排行榜（Patrick Christ）
医学图像数据库 - 基于真实情况的乳房异常超声图像数据库。（Stanislav Makhanov教授，biomedsiit.com）
麻省理工学院CBCL自动鼠标行为识别数据集（Nicholas Edelman）
MUCIC：马萨里克大学细胞图像采集 - 用于基准测试的细胞/组织的2D / 3D合成图像（马萨里克大学）
迷你乳腺摄影数据库（乳腺图像分析学会）
蛾细粒度识别 - 675个类似的类，5344个图像（Erik Rodner等）
Mouse Embryo Tracking Database - 细胞分裂事件检测（Marcelo Cicconet，Kris Gunsalus）
OASIS - 开放获取系列成像研究 - 大脑的500多个MRI数据集（华盛顿大学，哈佛大学，生物医学信息学研究网络）
植物表型分析数据集 - 适用于植物和叶子检测，分割，追踪和物种识别的植物数据（M. Minervini，A。Fischbach，H。Scharr，SA Tsaftaris）
RatSI：大鼠社交互动数据集 - 9只完全注释（11级）视频（15分钟，25 FPS）的两只大鼠在笼子里进行社交互动（Malte Lorbach，Noldus Information Technology）
视网膜眼底图像 - 血管分叉和交叉的基本事实（格罗宁根大学）
SCORHE - 1,2和3个鼠标行为视频，9个行为，（Ghadi H. Salem，等，NIH）
视网膜的结构分析 - 描述（400+视网膜图像，具有地面真相分割和医学注释）
脊柱和心脏数据（伦敦安大略省数字成像组，硕力）
Stonefly9这个数据库包含772个石蝇（汤姆等）9个标本的3826张图像。
合成迁移细胞 -Six人工迁移细胞（中性粒细胞）超过98个时间帧，各种水平的高斯/泊松噪声和不同的路径特征与地面实况。（Constantino Carlos Reyes-Aldasoro博士等人）
UBFC-RPPG数据集 - 使用CMS50E透射式脉搏血氧仪（Bobbia，Macwan，Benezeth，Mansouri，Dubois）获取的远程光电容积描记图（rPPG）视频数据和地面实况
Uni Bremen Open，腹部手术RGB数据集 - 使用直接安装在患者上方的Kinect v2记录完整，开放式腹部手术，俯视患者和工作人员。（Joern Teuber，Gabriel Zachmann，不来梅大学）
佛罗里达中部大学 - DDSM：用于筛查乳腺摄影的数字数据库（佛罗里达中部大学）
VascuSynth - 具有基本事实的120个3D血管树状结构（Mengliu Zhao，Ghassan Hamarneh）
VascuSynth - 血管合成器以3D体积生成血管树。（Ghassan Hamarneh，Preet Jassi，Mengliu Zhao）
York心脏MRI数据集（Alexander Andreopoulos）

六、相机校准

折反射相机校准图像（Yalin Bastanlar）
GoPro-Gyro数据集 - 该数据集由许多广角滚动快门视频序列和相应的陀螺仪测量组成（Hannes等）
LO-RANSAC - 用于估计单应性和极线几何的LO-RANSAC库（K.Lebeda，J。Matas和O. Chum）

七、面部和眼睛/虹膜数据库

2D-3D人脸数据集 - 此数据集包括2D人脸图像对及其对应的具有几何细节的3D人脸几何模型。（郭玉东，张居勇，蔡剑飞，蒋博一，郑建民）
300个野外视频（300-VW） - 68个面部地标追踪（Chrysos，Antonakos，Zafeiriou，Snape，Shen，Kossaifi，Tzimiropoulos，Pantic）
3D面具攻击数据库（3DMAD） - 使用Kinect RGBD和眼睛位置的1765人中的76500帧（Sebastien Marcel）
3D面部表情 - 宾厄姆顿大学3D静态和动态面部表情数据库（Lijun Yin，Jeff Cohn和队友）
AginG Faces in the wild v2数据库描述：AGFW-v2由36,299个面部图像组成，分为11个年龄组，每组间隔5年。平均而言，每组有3,300张图像。AGFW-v2中的面部图像不是公众人物，不太可能有明显的化妆或面部修改，有助于在学习过程中嵌入准确的老化效果。（Chi Nhan Duong，Khoa Luu，Kha Gia Quach，Tien D. Bui）
用于面部和说话人识别的视听数据库（Mobile Biometry MOBIO http://www.mobioproject.org/）
BANCA面部和语音数据库（萨里大学）
Binghampton Univ 3D静态和动态面部表情数据库（Lijun Yin，Peter Gerhardstein和队友）
Binghamton-Pittsburgh 4D自发面部表情数据库 - 由2D自发面部表情视频和FACS代码组成。（Lijun Yin等人）
BioID人脸数据库（BioID组）
BioVid热痛数据库 - 该视频（和生物医学信号）数据集包含87名受试验诱导的热痛的研究参与者的面部和生理心理反应。（马格德堡大学（神经信息技术组）和乌尔姆大学（Emotion Lab））
生物识别数据库 - 与虹膜识别相关的生物识别数据库（Adam Czajka）
Biwi 3D视听语音情感语料库 - 1000个高质量，动态的面部3D扫描，同时发出一组英语句子。
博斯普鲁斯海峡3D / 2D数据库的FACS注释面部表情，头部姿势和面部遮挡（Bogazici大学）
漫画/ Photomates数据集 - 具有正面和相应的漫画线条图的数据集（Tayfun Akgul）
CASIA-IrisV3（中国科学院，TN Tan，Z。Sun）
CASIR Gaze Estimation数据库 - RGB和深度图像（来自Kinect V1.0）和面部特征的基础真值，对应于凝视估计基准的实验：（Filipe Ferreira等）
CMU面部表情数据库（CMU / MIT）
CMU Multi-PIE人脸数据库 - 超过750,000张337人的图像，在五个月内最多可记录四次。（杰夫科恩等人）
CMU姿势，照明和表达（PIE）数据库（Simon Baker）
CMU / MIT正面（CMU / MIT）
CMU / MIT正面（CMU / MIT）
CSSE面部的正面强度和范围图像（Ajmal Mian）
CelebA - 大型CelebFaces属性数据集（刘紫薇，罗平，王小刚，王小鸥）
Cohn-Kanade AU编码表达数据库 - 100多个受试者的500+表达序列，由激活的行动单位编码（Affect Analysis Group，匹兹堡大学）
Cohn-Kanade AU编码表达数据库 - 用于自动面部图像分析和合成以及感知研究的研究（Jeff Cohn等）
哥伦比亚凝视数据集 - 5,880个图像，56人，5个头部姿势和21个凝视方向（Brian A. Smith，Qi Yin，Steven K. Feiner，Shree K. Nayar）
计算机视觉实验室人脸数据库（CVL人脸数据库） - 数据库包含798张114人的图像，每人7张图像，可免费用于研究目的。（Peter Peer等）
深远的未来凝视 - 该数据集由55个受试者执行的搜索和检索任务的57个序列组成。每个视频片段持续约15分钟，帧速率为10 fps，帧分辨率为480×640。每个主题被要求搜索22个项目（包括挂绳，笔记本电脑）的列表并将它们移动到包装位置（餐桌）。（新加坡国立大学信息通信研究所）
DISFA +：自发面部行动数据库的延伸丹佛强度 - DISFA（MH Mahoor）的扩展
DISFA：自发面部行动数据库的丹佛强度 - 一个非摆姿势的面部表情数据库，适用于那些有兴趣开发自动行动单元检测的计算机算法及其由FACS描述的强度的人。（MH Mahoor）
DHF1K - 1000个精心挑选的视频序列，带有17个观众的注视注释。（沉建兵教授）
EURECOM面部化妆品数据库 - 389张图片，50人有/无化妆，有关化妆量和位置的注释。（Jean-Luc DUGELAY等）
EURECOM Kinect人脸数据库 - 52人，2个会话，9个变种，6个面部地标。（Jean-Luc DUGELAY等）
EYEDIAP数据集 - EYEDIAP数据集用于训练和评估RGB和RGB-D数据的凝视估计算法。它包含多种参与者，头部姿势，凝视目标和感知条件。（Kenneth Funes和Jean-Marc Odobez）
Face2BMI数据集 Face2BMI数据集包含2103对面部，具有相应的性别，身高以及之前和当前的体重，允许训练可以从剖面图预测身体质量指数（BMI）的计算机视觉模型。（Enes Kocabey，Ferda Ofli，Yusuf Aytar，Javier Marin，Antonio Torralba，Ingmar Weber）
FDDB：人脸检测数据集和基准 - 研究无约束人脸检测（马萨诸塞大学计算机视觉实验室）
不同年龄人脸的FG-Net老龄化数据库（面部和手势识别研究网络）
人脸识别大挑战数据集（FRVT - 人脸识别供应商测试）
FMTV - 拉瓦尔脸部动作和延时视频数据库。238个热/视频科目，具有4年以上的各种姿势和面部表情（Ghiass，Bendada，Maldague）
面部超分辨率数据集 - 使用双摄像头设置（程超曲等）拍摄的地面真实HR-LR面部图像
FaceScrub - 拥有超过100,000人脸图像（530人）（50:50男性和女性）的数据集（H.-W. Ng，S。Winkler）
FaceTracer数据库 - 15,000张面孔（Neeraj Kumar，PN Belhumeur和SK Nayar）
面部表情数据集 - 该数据集由在现实世界条件下记录的242个面部视频（168,359帧）组成。（Daniel McDuff等人）
佛罗伦萨2D / 3D混合面数据集 - 弥合了2D，基于外观的识别技术和全3D方法之间的差距（Bagdanov，Del Bimbo和Masi）
面部识别技术（FERET）数据库（美国国家标准与技术研究院）
Gi4E数据库 - 眼睛跟踪数据库，使用标准网络摄像头拍摄1300多张图像，对应于不同的主体，注视屏幕上的不同点，包括地面真相2D虹膜和角点（Villanueva，Ponz，Sesma-Sanchez，Mikel Porta，和Cabeza）
谷歌面部表情比较数据集 - 一个大型的面部表情数据集，由面部图像三元组和人类注释组成，指定每个三元组中的哪两个面在面部表情方面形成最相似的对，这与主要关注的数据集不同离散情绪分类或行动单位检测（Vemulapalli，Agarwala）
Hannah和她的姐妹数据库 - 一个密集的视听人物导向的面部，语音片段，镜头边界的真实注释（Patrick Perez，Technicolor）
顶空数据集 - 顶空数据集是一组完整人体头部的3D图像，由1519名穿着紧身乳胶帽的受试者组成，以减少发型的影响。（Christian Duncan，Rachel Armstrong，Alder Hey Craniofacial Unit，英国利物浦）
香港脸部素描数据库
IDIAP头部姿势数据库（IHPD） - 该数据集包含一组会议视频以及各个参与者的主要基础（约128分钟）（Sileye Ba和Jean-Marc Odobez）
IMDB-WIKI - 500k +带有年龄和性别标签的脸部图像（Rasmus Rothe，Radu Timofte，Luc Van Gool）
印度电影人脸数据库（IMFDB） - 一个大型无约束的人脸数据库，包含来自100多个视频（Vijay Kumar和CV Jawahar）的100位印度演员的34512张图像
伊朗人脸数据库 - IFDB是中东地区第一个图像数据库，包含年龄，姿势和表情的彩色面部图像，其主题范围为2-85。（Mohammad Mahdi Dehshibi）
日本女性面部表情（JAFFE）数据库（Michael J. Lyons）
LFW：野性的标记面孔 - 不受约束的面部识别
LS3D-W - 一个大型3D人脸对齐数据集，注释68个点，包含在“野外”设置中捕获的面部。（Adrian Bulat，Georgios Tzimiropoulos）
MAFA：MAsked FAces - 30,811张图片，带有35,806张标记的MAsked FAces，每张蒙面的6个主要属性。（葛志明，贾莉，叶启庭，赵珞）
化妆诱导面部欺骗（MIFS） - 试图破坏目标身份的107次化妆变形。还有其他数据集。（Antitza Dantcheva）
Mexculture142 - 墨西哥文化遗产和眼动追踪凝视（Montoya Obeso，Benois-Pineau，Garcia-Vazquez，Ramirez Acosta）
麻省理工学院CBCL人脸识别数据库（生物学和计算机学习中心）
麻省理工学院面部数据库整理（Ethan Meyers）
麻省理工学院眼动追踪数据库（1003张图片）（Judd等）
MMI面部表情数据库 - 75个主题的2900个视频和高分辨率静止图像，注释为FACS AU。
MORPH（颅面纵向形态人脸数据库）（北卡罗来纳大学威尔明顿分校）
MPIIGaze数据集 - 213,659个样本，在不同照明条件和自然头部运动下具有眼睛图像和凝视目标，每天使用时从15名参与者及其笔记本电脑中收集。（张旭聪，Yuguke Sugano，Mario Fritz，Andreas Bulling。）
曼彻斯特注释说话面部视频数据集（Timothy Cootes）
MegaFace - 100万面临边界框（Kemelmacher-Shlizerman，Seitz，Nech，Miller，Brossard）
音乐视频数据集 - 来自YouTube的8个音乐视频，用于在不受约束的环境中开发多面部跟踪算法（张顺，黄佳斌，杨明轩）
NIST面部识别大挑战（FRGC）（NIST）
NIST照片识别数据库（美国国家标准与技术研究院）
NRC-IIT面部视频数据库 - 该数据库包含一对短视频片段，每个片段显示坐在显示器前面的计算机用户的面部，展示各种面部表情和方向（Dmitry Gorodnichy）
Notre Dame Iris Image Dataset（Patrick J. Flynn）
巴黎圣母院的脸，红外线脸，3D脸，表情，人群和眼睛生物识别数据集（巴黎圣母院）
ORL人脸数据库：40人，10人观看（ATT剑桥实验室）
OUI-Adience Faces - 针对性别和年龄分类以及3D面部（OUI）的未过滤面部
牛津：面孔，鲜花，多视图，建筑物，物体类别，运动分割，仿射协变区域，misc（Oxford Visual Geometry Group）
Pandora - POSEidon：面向驾驶员姿势的深度（Borghi，Venturelli，Vezzani，Cucchiara）
PubFig：Public Figures Face Database（Neeraj Kumar，Alexander C. Berg，Peter N. Belhumeur和Shree K. Nayar）
QMUL-SurvFace - 一个大型人脸识别基准，专门用于实际监控人脸分析和匹配。（QMUL计算机视觉组）
重新标记在野外的面孔 - 原始图像，但使用“深漏斗”方法对齐。（马萨诸塞大学阿默斯特分校）
RT-GENE：在自然环境中进行实时眼睛注视估计 122,531张图像，在自由观察条件和大型相机距离下，受试者的地面真实眼睛注视和头部姿势标签（Fischer，Chang，Demiris，伦敦帝国理工学院）
S3DFM - 爱丁堡语音驱动的3D面部运动数据库。77个人重复说10个密码：1秒500帧/秒600x600像素{IR强度视频，注册深度图像}加同步44.1 Khz音频。还有26人（10次重复）在说话时移动头部（张，费舍尔）
人类视觉输入的凝视对齐记录中的显着特征 - 人类凝视 - 临时数据的结核“在野外”（Frank Schumann等）
微型面部运动的SAMM数据集 - 该数据集包含来自13个不同种族的32名参与者的159次自发微型面部运动。（A.Davison，C.Lansley，N.Costen，K.Tan，MHYap）
SCface - 监控摄像头人脸数据库（Mislav Grgic，Kresimir Delac，Sonja Grgic，Bozidar Klimpak）
SiblingsDB - SiblingsDB包含两个数据集，描述与兄弟关系相关的个人图像。（Politecnico di Torino /计算机图形和视觉组）
使用迭代方法解决机器人 - 世界手眼校准问题 - 生成这些数据集用于校准机器人 - 摄像机系统。（艾米塔布）
自发情绪多模式数据库（SEM-db） - 用HD RGB，面部深度和IR帧，EEG信号和眼睛注视数据记录的视觉刺激数据的非姿势反应（Fernandez。黑山，Gkelias，Argyriou）
UNBC-McMaster肩痛表达档案数据库 - 痛苦的数据：UNBC-McMaster肩痛表达档案数据库（Lucy等人）
约克3D耳朵数据集 - 约克3D耳朵数据集是一组500个3D耳朵图像，由详细的2D标记合成，并以Matlab格式（.mat）和PLY格式（.ply）提供。（Nick Pears，Hang Dai，Will Smith，约克大学）
特隆赫姆Kinect RGB-D人物重新识别数据集（Igor Barros Barbosa）
UB KinFace数据库 - 布法罗大学亲属验证和识别数据库
UBIRIS：嘈杂的可见波长虹膜图像数据库（贝拉大学）
UMDFaces - 来自22,000个视频和370,000个带注释静止图像的约370万个带注释的视频帧。（Ankan Bansal等人）
UPNA Head Pose数据库 - 头部姿势数据库，包含120个网络摄像头视频，包含引导移动序列和自由移动序列，包括地面真实头部姿势和自动注释的2D面部点。（亚利桑那州，Bengoechea，Villanueva，Cabeza）
UPNA合成头部姿势数据库 - UPNA头部姿势数据库的合成复制品，具有120个视频，其2D地面实况地标投影，相应的头部姿势基础事实，3D头部模型和相机参数。（Larumbe，Segura，Ariz，Bengoechea，Villanueva，Cabeza）
UTIRIS跨光谱虹膜图像数据库（Mahdi Hosseini）
VGGFace2 - VGGFace2是一个大型人脸识别数据集，涵盖了姿势，年龄，光照，种族和职业的巨大变化。（牛津视觉几何组）
VIPSL数据库 - VIPSL数据库用于面部素描 - 照片合成和识别的研究，包括200个科目（每个科目1张照片和5张草图）。（Nannan Wang）
视觉搜索零镜头数据库 - 在三个日益复杂的视觉搜索任务中收集人类眼睛跟踪数据：对象阵列，自然图像和Waldo图像。（Kreiman实验室）
VT-KFER：用于自发和非自发面部表情识别的基于Kinect的RGBD +时间数据集--3个主题，1,956个RGBD序列，3个姿势中的6个面部表情（Aly，Trubanova，Abbott，White和Youssef）
华盛顿面部表情数据库（FERG-DB） - 一个由6个程式化（Maya）角色组成的数据库，带有7个带注释的面部表情（Deepali Aneja，Alex Colburn，Gary Faigin，Linda Shapiro和Barbara Mones）
WebCaricature数据集 - WebCaricature数据集是一个大型的照片漫画数据集，由来自网络收集的252个人的6042幅漫画和5974张照片组成。（景火，李文斌，史英桓，杨高，胡钧军）
更广泛的脸部：人脸检测基准 - 32,203张图像，393,703张标记面，61个活动类（Shuo Yang，Ping Luo，Chen Change Loy，Xiaoou Tang）
XM2VTS Face视频序列（295）：扩展的M2VTS数据库（XM2VTS） -（萨里大学）
耶鲁人脸数据库 - 10人的11个表达（A. Georghaides）
耶鲁人脸数据库B - 576人观看条件10人（A. Georghaides）
约克大学眼动追踪数据集（120图像）（Neil Bruce）
YouTube Faces DB - 1,525个不同的人的3,425个视频。（Wolf，Hassner，Maoz）
苏黎世自然图像 - 用于在一系列眼动追踪研究中创建自然刺激的图像材料（Frey等人）

八、指纹

FVC指法验证竞赛2002年数据集（博洛尼亚大学）
FVC指法验证竞赛2004年数据集（博洛尼亚大学）
指纹手册Minutiae Marker（FM3）数据库： - 指纹手动细节标记（FM3）数据库（Mehmet Kayaoglu，Berkay Topcu和Umut Uludag）
NIST指纹数据库（美国国家标准与技术研究院）
SPD2010指纹奇点检测竞赛（SPD 2010委员会）

九、一般图像

用于实际低光图像降噪的数据集 - 它包含由低光照相机噪声和低噪声对应物破坏的像素和强度对齐图像对。（J. Anaya，A。Barbu）
与Vincent van Gogh相关的绘画数据库 - 这是为“从印象派到表现主义：自动识别梵高的绘画”（Guilherme Folego和Otavio Gomes和Anderson Rocha）的论文建立的数据集VGDB-2016
AMOS：许多户外场景档案（20 + m）（Nathan Jacobs）
航拍图像使用不变的颜色特征和阴影信息从航拍图像构建检测。（Beril Sirmacek）
近似重叠误差数据集具有稀疏地面实况匹配集的图像对，用于评估局部图像描述符（Fabio Bellavia）
AutoDA（自动数据集扩充） - 自动构建的图像数据集，包括1250万张图像，其中包含1000种ILSVRC2012（Bai，Yang，Ma，Zhao）的相关文本信息
BGU自然场景高光谱图像数据库（Ohad Ben-Shahar和Boaz Arad）
布朗大学二元图像数据库（Ben Kimia）
Butterfly-200 - Butterfly-20是用于细粒度图像分类的图像数据集，其包含25,279个图像并且涵盖200种，116属，23个亚科和5个家族的四个级别类别。（陈天水）
CMP Facade数据库 - 包括来自不同地方的606个矫正图像，其中有12个建筑类别注释。（Radim Tylecek）
加州理工学院 - UCSD Birds-200-2011（Catherine Wah）
颜色校正数据集 - 基于Homography的注册图像，用于评估图像拼接的颜色校正算法。（法比奥贝拉维亚）
哥伦比亚多光谱图像数据库（F. Yasuma，T。Mitsunaga，D。Iso和SK Nayar）
DAQUAR（视觉图灵挑战） - 包含关于真实世界室内场景的问题和答案的数据集。（Mateusz Malinowski，Mario Fritz）
达姆施塔特噪声数据集 - 50对真实噪声图像和相应的地面实况图像（RAW和sRGB）（Tobias Plotz和Stefan Roth）
美国电影预告片2010-2014数据集 - 包含474个好莱坞电影预告片的链接以及相关的元数据（流派，预算，运行时，发布，MPAA评级，发布的屏幕，续集指标）（USC信号分析和解释实验室）
DIML Multimodal Benchmark - 评估光度和几何变化下的匹配性能，100张1200 x 800尺寸的图像。（延世大学）
DSLR照片增强数据集（DPED） - 由三个智能手机和一个数码单反相机在野外同步拍摄的22K照片，用于比较来自多个低质量图像（Ignatov，Kobyshev，Timofte，Vanhoey和Van Gool）的高质量图像。
Flickr风格 - 80K Flickr照片注释20个精选风格标签，85K绘画注释25个风格/流派标签（Sergey Karayev）
Forth Multispectral Imaging Datasets - 来自5幅绘画的23个光谱带的图像。图像用地面实况数据注释。（Karamaoynas Polykarpos等）
General 100 Dataset - General-100数据集包含100个bmp格式图像（无压缩），非常适合超分辨率训练（Dong，Chao和Loy，Chen Change和Tang，Xiaoou）
GOPRO数据集 - 具有清晰图像基础事实的模糊图像数据集（Nah，Kim和Lee）
HIPR2图像不同类型图像的目录（Bob Fisher等）
HPatches - 手工和学习本地描述符的基准和评估（Balntas，Lenc，Vedaldi，Mikolajczyk）
用于自然场景中局部照明的空间分布的高光谱图像 - 用于嵌入用于局部照明估计的探测球体的自然场景的30个校准的高光谱辐射图像。（Nascimento，Amano和Foster）
自然场景的高光谱图像 - 2002（David H. Foster）
自然场景的高光谱图像 - 2004（David H. Foster）
ISPRS多平台摄影测量数据集 - 1：最低点和斜空间图像加2：无人机和地面图像组合（Francesco Nex和Markus Gerke）
LIVE的图像和视频质量评估 - 用于开发图像质量算法（德克萨斯大学奥斯汀分校）
ImageNet大规模视觉识别挑战 - 目前有200个对象类和500 + K图像（Alex Berg，Jia Deng，Fei-Fei Li等）
ImageNet语言组织（WordNet）分层图像数据库 - 10E7图像，15K类别（李飞飞，贾登，郝素，李凯）
通过低成本全方位机器人改进的高性能结构3D稀疏映射 - 评估数据集 - 研究论文中使用的数据集：10.1109 / ICIP.2015.7351744（Breckon，Toby P.，Cavestany，Pedro）
LabelMeFacade数据库 - 945标记的建筑图像（Erik Rodner等）
局部照明高光谱辐射图像 - 用于局部照明估计的嵌入探测球体的自然场景的30个高光谱辐射图像（Sgio MC Nascimento，Kinjiro Amano，David H. Foster）
麦吉尔校准彩色图像数据库（Adriana Olmos和Fred Kingdom）
乘法失真图像数据库 - 用于评估多重失真图像上图像质量评估指标结果的数据库。（周飞）
NPRgeneral - 用于评估图像样式算法的标准化图像集合。（David Mold，Paul Rosin）
nuTonomy场景数据集（nuScenes） - nuScenes数据集是一个大规模的自动驾驶数据集。它具有：全传感器套件（1x LIDAR，5x雷达，6x摄像头，IMU，GPS），1000个场景，每个20s，1,440,000个摄像头图像，400,000个激光雷达扫描，两个不同的城市：波士顿和新加坡，左侧与右侧交通，详细地图信息，25个对象类的手动注释，以2Hz注释的1.1M 3D边界框，可见性，活动和姿势等属性。（凯撒等人）
NYU对称数据库 - 176个单对称和63个多对称图像（Marcelo Cicconet和Davi Geiger）
OceanDark数据集 - 来自东北太平洋水下站点的100个低照度水下图像。1400x1000像素，不同的照明和录制条件（Ocean Networks Canada）
OTCBVS Thermal Imagery基准数据集（俄亥俄州立大学队）
PAnorama Sparsely STructured Areas数据集 - 用于评估图像对齐的PASSTA数据集（Andreas Robinson）
QMUL-OpenLogo - 用于测试模型概括功能的徽标检测基准，用于检测自然场景中的各种徽标对象，其中大多数徽标类未标记。（QMUL计算机视觉组）
RESIDE（现实单图像去雾） - 目前最大规模的基准测试，包括合成和真实世界的模糊图像，用于图像去雾研究。RESIDE突出了各种数据源和图像内容，并提供各种培训或评估目的。（李博琪，任文琦，傅登攀，陶大成，丹峰，曾文君，王章阳）
Rijksmuseum Challenge 2014 - 它由来自rijksmuseum的100K艺术品组成，并附带描述每个物体的大量xml文件。（Thomas Mensink和Jan van Gemert）
在黑暗中看到 - 77 Gb的黑暗图像（Chen，Chen，Xu和Koltun）
智能手机图像去噪数据集（SIDD） - 智能手机图像去噪数据集（SIDD）包含大约30,000个噪声图像，在原始RGB和sRGB空间中具有相应的高质量地面实况，使用五个代表智能手机相机从10个具有不同光照条件的场景获得。（Abdelrahman Abdelhamed，Stephen Lin，Michael S. Brown）
斯坦福街景图像，姿势和3D城市数据集 - 街景图像（2500万图像和118个匹配图像对）的大规模数据集及其相对相机姿态，城市的3D模型和图像的3D元数据。（Zamir，Wekel，Agrawal，Malik，Savarese）
TESTIMAGES - 大量免费收集样本图像，用于不同类型显示器（即监视器，电视和数字电影放映机）的分析和质量评估以及图像处理技术。（Nicola Asuni）
康斯坦茨视觉质量数据库 - 用于开发和评估视觉质量评估算法的大型图像和视频数据库。（康斯坦茨大学MMSP小组）
自然场景的时间推移高光谱辐射图像 - 一天中拍摄的自然场景的7-9校准高光谱辐射图像的四个延时序列。（Foster，DH，Amano，K。，＆Nascimento，SMC）
延时高光谱辐射图像 - 自然场景的7-9校准高光谱图像的四个延时序列，间隔为10nm的光谱（David H. Foster，Kinjiro Amano，Sgio MC Nascimento）
Tiny Images数据集 7900万32x32彩色图像（Fergus，Torralba，Freeman）
TURBID数据集 - 降级图像的五个不同子集及其各自的地面实况。子集Milk和DeepBlue各有20张图像，子叶绿素有42张图像（Amanda Duarte）
UT Snap Angle 360°数据集 - 来自youtube的四个活动（迪士尼，游行，滑雪，音乐会）的360°视频列表（Kristen Grauman，UT Austin）
UT Snap Point数据集 - 人类对来自UT Egocentric数据集和新收集的移动机器人数据集的帧子集的捕捉点质量的判断（帧也包括在内）（Bo Xiong，Kristen Grauman，UT Austin）
视觉对话 - 在COCO图像上进行120k人 - 人对话，每对话10轮QA（Das，Kottur，Gupta，Singh，Yadav，Moura，Parikh，Batra）
视觉问题回答 - 254K imags，764K问题，基本事实（Agrawal，Lu，Antol，Mitchell，Zitnick，Batra，Parikh）
视觉问题生成 --15k图像（包括以物体为中心和以事件为中心的图像），75k自然问题询问可以引起进一步对话的图像（Nasrin Mostafazadeh，Ishan Misra，Jacob Devlin，Margaret Mitchell，Xiao Dong He，Lucy Vanderwende ）
VQA Human Attention - 用于视觉问答的60k人类注意力图，即人类选择回答图像问题的地方（Das，Agrawal，Zitnick，Parikh，Batra）
Wild Web篡改图像数据集 - 来自Web和社交媒体源的大量篡改图像，包括用于篡改本地化的地面实况注释掩码（Markos Zampoglou，Symeon Papadopoulos）
YFCC100M：多媒体研究的新数据 - 这个公开提供的1亿张照片和视频的策划数据集对所有人来说都是免费且合法的。（Bart Thomee，雅虎实验室和旧金山的Flickr等）

十、一般RGBD和深度数据集

注意：有3D数据集其他地方也是如此，例如在对象，场景和动作。

360D - 来自22096个独特视点的成对颜色和深度360球面全景图的数据集，用于评估全向密集深度估计方法。（Nikolaos Zioulis，Antonis Karakottas，Dimitrios Zarpalas，Petros Daras）
3D打印RGB-D对象数据集 - 具有groundtruth CAD模型和摄像机轨迹的5个对象，使用各种质量的RGB-D传感器进行记录。（西门子和TUM）
3DCOMET - 3DCOMET是用于测试3D数据压缩方法的数据集。（Miguel Cazorla，Javier Navarrete，Vicente Morell，Miguel Cazorla，Diego Viejo，Jose Garcia-Rodriguez，Sergio Orts。）
3D铰接式车身 - 具有旋转和平移的铰接式车身的3D重建。单摄像头，变焦。每个场景都可能有一个铰接的身体移动。包括四种数据集。包括仅使用场景的四个图像的样本重建结果。（Jihun Park教授）
用于从RGB-D数据进行非刚性重建的数据集 - 用于从RGB-D数据重建非刚性几何的八个场景，每个场景包含数百帧以及我们的结果。（Matthias Innmann，Michael Zollhoefer，Matthias Niessner，Christian Theobalt，Marc Stamminger）
大型对象扫描数据集 - 9个casses中的392个对象，每个数百帧（Choi，Zhou，Miller，Koltun）
铰接式物体挑战 - 4个铰接物体，由一维旋转和棱柱关节连接的刚性部件组成，7000 + RGBD图像，带有6D姿态估计注释（Frank Michel，Alexander Krull，Eric Brachmann，Michael.Y.Yang，Stefan Gumhold，Carsten Rother ）
BigBIRD - 每个对象有100个对象，600个3D点云和600个高分辨率彩色图像，跨越所有视图（Singh，Sha，Narayan，Achim，Abbeel）
CAESAR美国民用和欧洲表面人体测量资源项目 - 4000个3D人体扫描（SAE International）
CIN 2D + 3D对象分类数据集 - 来自18种常见家庭和办公室对象的对象的分段颜色和深度图像（Bjorn Browatzki等）
CoRBS - RGB-D SLAM基准测试，提供真实深度和颜色数据的组合，以及相机的地面实况轨迹和场景的真实3D模型（Oliver Wasenmuller）
CSIRO综合变形人 - 用于评估非刚性三维重建的合成RGBD数据集：2个主体和4个摄像机轨迹（Elanattil和Moghadam）
CTU服装折叠照片数据集 - 服装折叠的各个阶段的颜色和深度图像。（Sushkov R.，Melkumov I.，Smutn y V.（布拉格捷克技术大学））
CTU Garment Sorting Dataset - 服装图像，详细立体图像，深度图像和重量的数据集。（Petrik V.，Wagner L.（布拉格捷克技术大学））
服装零件数据集 - 服装零件数据集包括图像和深度扫描，使用Kinect获取，服装放在桌子上，使用多边形面具有超过一千个部分注释（衣领，袖口，帽子等）。（Arnau Ramisa， Guillem Aleny，Francesc Moreno-Noguer和Carme Torras）
Cornell-RGBD-Dataset - 办公场景（Hema Koppula）
CVSSP动态RGBD建模2015 - 该数据集包含使用Kinect V1 / V2捕获的一般动态场景的八个RGBD序列以及两个合成序列。（Charles Malleson，萨里大学CVSSP）
可变形3D重建数据集 - 动态移动机械玩具的两个单流RGB-D序列以及规范静止姿势中的地面真实3D模型。（西门子，TUM）
代尔夫特风车内部和外部激光扫描点云（Beril Sirmacek）
Diabetes60 - 60种西式菜肴的RGB-D图像，自制。使用Microsoft Kinect V2记录数据。（Patrick Christ和Sebastian Schlecht）
ETH3D - 用于多视图立体声和3D重建的基准测试，涵盖各种室内和室外场景，通过高精度激光扫描仪获取地面实况。（Thomas Sch ?? ps，Johannes L. Sch ?? nberger，Silvano Galliani，Torsten Sattler，Konrad Schindler，Marc Pollefeys，Andreas Geiger）
EURECOM Kinect Face数据库 - 52人，2个会话，9个变种，6个面部地标。（Jean-Luc DUGELAY等人）
G4S元房间 - RGB-D数据150次扫描，每次扫描18个图像。（John Folkesson等人）
Georgiatech-Metz Symphony Lake数据集 - 来自121次湖岸调查的超过4年的500万RGBD户外图像。（格里菲斯和普拉迪利耶）
Goldfinch：GOogLe图像搜索数据集用于FINe粒度CHallenges - 用于细粒鸟（11K种），蝴蝶（14K种），飞机（409种）和狗（515种）识别的大型数据集。（Jonathan Krause，Benjamin Sapp， Andrew Howard，Howard Zhou，Alexander Toshev，Tom Duerig，James Philbin，Li Fei-Fei）
House3D - House3D是一个虚拟3D环境，由数千个室内场景组成，这些场景配备了各种场景类型，布局和源自SUNCG数据集的对象。它包括超过45,000个室内3D场景，从工作室到带游泳池和健身室的两层房屋。所有3D对象都使用类别标签进行完全注释。环境中的代理可以访问多种模态的观察，包括RGB图像，深度，分割掩模和自上而下的2D地图视图。渲染器以每秒数千帧的速度运行，使其适用于大规模RL训练。（Yi Wu，Yuxin Wu，Georgia Gkioxari，Yuandong Tian，facebook research）
IMPART多视图/多模式2D + 3D电影制作数据集 - 激光雷达，视频，3D模型，球形摄像机，RGBD，立体声，动作，面部表情等（萨里大学）
工业3D物体检测数据集（MVTec ITODD） - 用于3D物体检测和姿态估计的3500个标记场景中的28个物体的深度和灰度值数据，重点关注工业设置和应用（MVTec Software GmbH，Munich）
Kinect v2数据集 - 使用核密度估计的高效多频相位展开（Felix等）
KOMATSUNA数据集 - 数据集用于使用连续多视图RGB图像和深度图像进行叶子的实例分割，跟踪和重建。（九州大学Hideaki Uchiyama）
McGill-Reparti人工感知数据库 - 来自四个摄像头的RGBD数据和两个人类受试者在车门上执行模拟装配任务的未过滤Vicon骨骼数据（Andrew Phan，Olivier St-Martin Cormier，Denis Ouellet，Frank P. Ferrie）。
元房间 - RGB-D数据由28个对齐的深度相机图像组成，通过让机器人到达特定的地方并使用各种倾斜进行360度平移来收集。（John Folkesson等人）
METU多模立体声数据集 - 多模立体视觉的基准数据集??? - METU多模态立体声数据集包括用于多模态立体视觉的基准数据集，该数据集由两个数据集组成：（1）来自Middlebury立体评估数据集的综合改变立体图像对和（2）可见红外图像从Kinect设备捕获的对。（Mustafa Yaman博士，Sinan Kalkan博士）
MHT RGB-D - 由林肯大学每隔5分钟由机器人收集16天。（John Folkesson等人）
在RGB-D中移动INFants（MINI-RGBD） - 用于婴儿姿势估计的合成的，逼真的RGB-D数据集，其包含具有地面真实关节位置的12个移动婴儿序列。（N. Hesse，C。Bodensteiner，M。Arens，UG Hofmann，R。Weinberger，AS Schroeder）
用于物体识别的多传感器3D物体数据集，具有全姿态估计 - 用于物体识别和姿态估计的多传感器3D物体数据集（Alberto Garcia-Garcia，Sergio Orts-Escolano，Sergiu Oprea等）
NTU RGB + D动作识别数据集 - NTU RGB + D是用于人类动作识别的大规模数据集（Amir Shahroudy）
nuTonomy场景数据集（nuScenes） - nuScenes数据集是一个大规模的自动驾驶数据集。它具有：全传感器套件（1x LIDAR，5x雷达，6x摄像头，IMU，GPS），1000个场景，每个20s，1,440,000个摄像头图像，400,000个激光雷达扫描，两个不同的城市：波士顿和新加坡，左侧与右侧交通，详细地图信息，25个对象类的手动注释，以2Hz注释的1.1M 3D边界框，可见性，活动和姿势等属性。（凯撒等人）
NYU Depth Dataset V2 - RGBD图像的室内分割和支持推断
奥克兰三维点云数据集（Nicolas Vandapel）
Pacman项目 - 来自20个类的400个对象的合成RGB-D图像。从3D网格模型生成（Vladislav Kramarev，Umit Rusen Aktas，Jeremy L. Wyatt。）
程序性人类行动视频 - 该数据集包含大约40,000个用于人类动作识别的视频，这些视频是使用3D游戏引擎生成的。该数据集包含大约600万帧，其可用于训练和评估模型，不仅是动作识别，而且还用于深度图估计，光流，实例分割，语义分割，3D和2D姿势估计以及属性学习的模型。（Cesar Roberto de Souza）
基于RGB-D的动作识别数据集 - 包含不同rgb-d动作识别数据集的列表和链接的论文。（张静，李万庆，Philip O. Ogunbona，王必皓，唐昌）
RGB-D Part Affordance数据集 - 用于105个厨房，工作室和园艺工具的RGB-D图像和地面真实可供选择标签，以及3个杂乱的场景（Myers，Teo，Fermuller，Aloimonos）
ScanNet：室内场景的富有注释的3D重建 --ScanNet是一个包含丰富注释的RGB-D扫描的数据集，包含超过1500次扫描的2.5M RGB-D图像，带有3D相机姿势，表面重建，和实例级语义分段。（Angela Dai，Angel X. Chang，Manolis Savva，Maciej Halber，Thomas Funkhouser，Matthias Niessner）
SceneNN：场景使用aNNotations网格化数据集 - 具有100多个室内场景的RGB-D场景数据集，标记为三角形网格，体素和像素。（Hua，Pham，Nguyen，Tran，Yu和Yeung）
Semantic-8：具有8个类的3D点云分类（苏黎世联邦理工学院）
小型办公室数据集 - 从2014年4月开始每5秒钟进行一次Kinect深度图像处理。（John Folkesson等人）
具有基础事实的立体声和ToF数据集 - 数据集包含使用飞行时间传感器和立体声设置采集的5个不同场景。还提供了地面实况信息。（Carlo Dal Mutto，Pietro Zanuttigh，Guido M. Cortelazzo）
SYNTHIA - 用于训练自动驾驶汽车的大型（约50万）虚拟世界图像。（计算机视觉中心的ADAS集团）
任务 - 超过450万个真实图像，每个图像具有25个语义，2D和3D任务的基础事实。（Zamir，Sax，Shen，Guibas，Malik，Savarese）
顶空数据集 - 顶空数据集是一组完整人体头部的3D图像，由1519名穿着紧身乳胶帽的受试者组成，以减少发型的影响。（Christian Duncan，Rachel Armstrong，Alder Hey Craniofacial Unit，英国利物浦）
约克3D耳朵数据集 - 约克3D耳朵数据集是一组500个3D耳朵图像，由详细的2D标记合成，并以Matlab格式（.mat）和PLY格式（.ply）提供。（Nick Pears，Hang Dai，Will Smith，约克大学）
THU-READ（清华大学RGB-D自我中心行动数据集） - THU-READ是一个用于RGBD视频中动作识别的大型数据集，带有像素杠杆手部注释。（Yansong Tang，Yi Tian，Lu Jiwen Lu，Jianjiang Feng，Jie Zhou）
TUM RGB-D基准测试 - 用于评估RGB-D视觉测距和SLAM算法的数据集和基准（Jorgen Sturm，Nikolas Engelhard，Felix Endres，Wolfram Burgard和Daniel Cremers）
UC-3D运动数据库 - 可用的数据类型包括高分辨率运动捕捉，采用Xsens和Microsoft Kinect RGB和深度图像的MVN Suit获得。（葡萄牙科英布拉系统与机器人研究所）
Uni Bremen Open，腹部手术RGB数据集 - 使用直接安装在患者上方的Kinect v2记录完整，开放式腹部手术，俯视患者和工作人员。（Joern Teuber，Gabriel Zachmann，不来梅大学）
USF范围图像数据库 - 400+激光测距仪和结构光照相机图像，其中许多具有地面真实分割（Adam等人）
华盛顿RGB-D对象数据集 - 300个常见的家庭用品和14个场景。（华盛顿大学和英特尔实验室西雅图）
Witham Wharf - 林肯大学每隔10分钟由机器人收集八个地点的RGB-D。（John Folkesson等人）

由于字数限制，将数据集分成两个，点击下面的字体进行继续进行观看

常用的公共数据集（二）

你可能感兴趣的:(AI)

OpenStack Heat模板实战：快速创建用户、容器、网络与云主机类型冯·诺依曼的 openstack 网络 ssh 运维云计算
Heat是OpenStack中的编排服务，通过YAML模板自动化资源管理。本文通过4个实战案例，详解如何用Heat模板创建用户体系、Swift容器、网络资源及云主机类型。一、创建用户、Domain、租户及用户绑定目标：在chinaskillsDomain下创建beijing_group租户，并创建用户cloud。#user_create.ymlheat_template_version:2016-
go面试必问，什么是中间件? 走，我们去吹风中间件 golang 面试服务器后端
中间件用过么？Middleware是Web的重要组成部分，中间件（通常）是一小段代码，它们接受一个请求，对其进行处理，每个中间件只处理一件事情，完成后将其传递给另一个中间件或最终处理程序，这样就做到了程序的解耦。全局中间件所有的请求都要经过此中间件packagemainimport("fmt""time""github.com/gin-gonic/gin")//定义中间funcMiddleWare
怎么做一个AI产品经理？ AI筑梦师 AI产品经理人工智能产品经理
AI产品经理全面进化：在人工智能迅猛发展的时代，产品经理的角色正经历前所未有的转型。从传统的需求捕捉者到技术与商业紧密结合的创新推动者，AI产品经理肩负着将前沿AI技术转化为解决用户痛点的产品的重要任务。随着大数据、云计算和大模型技术的不断成熟，产品经理不仅需要具备敏锐的市场洞察，还必须深刻理解AI技术本质，跨界整合技术、数据与业务优势，从而推动产品的持续创新与落地。本文将全面解析AI产品经理的角
visio 画弯曲箭头（波浪线曲线）小牛蛋 office工具 visio 画图
转自：http://blog.csdn.net/hfyinsdu/article/details/6619012作者:hfyinsdu示意图如下：步骤1.Visio工具栏有个“连接线”工具，下图所示2.用这个工具画个曲线，下图所示3.右键单击连线，选择里面的“曲线连接线”，上面图形将变成下面的图形4.里面有5个点，调节这5个点，即可得到曲线。5.箭头的类型（单、双箭头）和样式，可以通过右键，格式-
【AI】使用Python实现机器学习小项目教程丶2136 AI 人工智能 python 机器学习
引言在本教程中，我们将带领您使用Python编程语言实现一个经典的机器学习项目——鸢尾花（Iris）分类。通过这个项目，您将掌握机器学习的基本流程，包括数据加载、预处理、模型训练、评估和优化等步骤。论文AIGC检测，降AIGC检测，AI降重，三连私信免费获取：ReduceAIGC9折券！DetectAIGC立减2元券！AI降重9折券！目录引言一、项目背景与目标二、开发环境准备2.1所需工具2.2环
颠覆智能助手的游戏规则！LangGraph MCP助你构建通用AI助手！大模型. 人工智能 powerpoint 算法 redis 缓存大模型
LangGraphMCP：构建你的智能助手在当今快速发展的科技时代，智能助手已经成为我们生活中不可或缺的一部分。而LangGraphMCP的出现，将为你带来前所未有的便利！它基于LangGraph和模型上下文协议（MCP），为构建通用AI助手提供了强大的支持。主要功能无缝集成：能够将LLM（大语言模型）应用与各种外部数据源和工具进行无缝连接。想象一下，构建一个智能助手，能够实时获取所需信息，助你高
DeepSeek R2 提前：中国 AI 如何颠覆全球 AI 格局？大模型. 人工智能架构深度学习数据分析数据挖掘大模型 deepseek
DeepSeek定档2025年3月17日发布其新一代AI模型——DeepSeekR2。作为中国AI初创公司的代表，DeepSeek凭借其前作R1的惊人表现，已经在全球AI领域掀起了一场风暴。R2的发布不仅引发了用户的广泛关注，更被视为可能重塑全球AI竞争格局的关键时刻。一、DeepSeek的崛起DeepSeek是一家成立于2023年的中国AI初创公司，总部位于杭州，由梁文锋创立。2025年1月，D
苹果审核：2.1性能完整性被拒解决 #摩斯先生 iOS ios
Guideline2.1-Performance-AppCompleteness(a)SubmissionstoAppReview,includingappsyoumakeavailableforpre-order,shouldbefinalversionswithallnecessarymetadataandfullyfunctionalURLsincluded;placeholdertext,
【003】调用Kimi实现AI对话，流式内容输出_#py 木易:_/ Python AI对话数据库 microsoft
调用Kimi实现AI对话，流式内容输出前言1.实现流式输出的主要代码块2.完整代码前言流式输出（Streaming），一言以蔽之，就是每当Kimi大模型生成了一定数量的Tokens时（通常情况下，这个数量是1Token），立刻将这些Tokens传输给客户端，而不再是等待所有Tokens生成完毕后再传输给客户端。当你与Kimi智能助手进行对话时，Kimi智能助手的回复是按字符逐个“跳”出来的，这即是
AI人工智能中的概率论与统计学原理与Python实战：Python实现概率模型 AI天才研究院 AI实战 AI大模型企业级应用开发实战大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着人工智能技术的不断发展，概率论与统计学在人工智能领域的应用越来越广泛。概率论与统计学是人工智能中的基础知识之一，它们在机器学习、深度学习、自然语言处理等领域都有着重要的作用。本文将介绍概率论与统计学的核心概念、算法原理、具体操作步骤以及Python实现方法，并通过具体代码实例进行详细解释。2.核心概念与联系2.1概率论与统计学的区别概率论是一门数学学科，它研究随机事件发生的可能性。
【源码阅读】olmocr中的prompts 海绵波波107 #大模型 pdf
目录一、PDF转换为训练数据二、使用微调模型三、比较差异总结一、PDF转换为训练数据让ChatGPT-4将文档（如PDF文件）转换为结构化的“银级”训练数据（silvertrainingdata）#Thisisthepromptweuseforgettingchatgpt4otoconvertdocumentsintooursilvertrainingdatadefbuild_openai_sil
ollama下载的DeepSeek的模型(Model)文件在哪里？(C盘下) 神秘泣男子常见AI大模型部署与应用 Ollama部署LLM 人工智能 ollama llama 自然语言处理机器学习
目录一、下载大模型（DeepSeek）2.安装Ollama3.检查安装是否成功二、拉取大模型（DeepSeek）1.打开命令行2.下载模型3.测试下载4.等待下载完成三.模型存放路径这个位置！！在人工智能快速发展的今天，大语言模型已经成为许多人探索和使用的热门技术。而Ollama作为一款轻量级的本地大模型运行工具，让我们能够在个人电脑上体验各种强大的AI模型，如DeepSeek系列。不少用户在安装
《动态磁盘RAID阵列：深度解析与实战指南》懂技术的小又又计算机服务器 linux 数据库运维 windows 计算机网络
目录一、RAID技术概述常见RAID级别RAID0：条带化，提升读写性能，无冗余RAID1：镜像，数据冗余，提供数据保护RAID5：奇偶校验，提供冗余和负载均衡RAID10：镜像+条带化，兼具数据保护和高性能二、动态磁盘管理动态磁盘的优势三、动态磁盘RAID阵列实战实验环境搭建（vmvareworkstation）四、实际应用案例五、RAID技术的优化与维护六、RAID技术的未来发展七、软RAID
InfluxDB写入测试 PascalMing 编程 influxdb java 读写测试
早几年测试时序库时，采集数据到kafka，然后用不同数据进行存储验证。Influxdb是花时间比较多的，它的数据建模方法、读写方法都需要使用特殊的API。时间久了自己也经常忘记，把当时的测试关键代码记录下来，也方便日后查找。代码基于java编写。1、接口数据定义，clientid+tag组合必须唯一publicclassKafkaInfo{//客户端idpublicStringclientid;/
129-5*5矩阵的平方向上Claire 沈航矩阵 c语言线性代数
//129-5*5矩阵的平方#includeintmain(void){inta[5][5]
大模型联网搜索组件 SearXNG 部署和使用「已注销」
SearXNG是一个免费的互联网元搜索引擎，它整合了来自超过70个搜索服务的结果。用户不会被跟踪或进行特征分析，很好地保护了用户隐私。2022年11月OpenAI发布ChatGPT后，大模型和知识库开始火爆，联网搜索成为弥补大模型知识陈旧的重要工具。提供元搜索功能的SearXNG开始被很多大模型应用比如ChatNio[1]采用，在大模型时代发挥了巨大作用。本文将介绍如何基于docker部署私人的S
2-线性表重生之我是冯诺依曼数据结构数据结构
一-线性表的定义和基本操作1-线性表的定义线性表是具有相同数据类型的n个数据元素的有限序列，其中n为表长，当n=0时线性表是一个空表。若用L命名线性表，则其一般表示为①ai是线性表中的第i个元素线性表中的位序（位序从1开始，数组下标从0开始）②a1是表头元素，an是表尾元素③除第一个元素外，每个元素有且仅有一个直接前驱；除最后一个元素外，每个元素有且仅有一个直接后继2-线性表的基本操作①初始化表：
6-数组- 重生之我是冯诺依曼 C++c++
一-一维数组1-数组定义数组的定义方式和变量类似#includeusingnamespacestd;intmain(){inta[100],b[20];floatf[3];doubled[7];charc[9];strings[56];return0;}2-数组初始化#includeusingnamespacestd;intmain(){//自己输入数组长度inta[3]={0,1,2};//系统
4-if语句重生之我是冯诺依曼 C++c++
#includeusingnamespacestd;intmain(){//if语句intscore=0;cout>score;cout=90&&score=80&&score=70&&score=60&&score<70){cout<<"D"<
重生之我在学Vue--第16天 Vue 3 插件开发野生的程序媛 Vue 前端成仙之路 vue.js 前端 javascript 前端框架
重生之我在学Vue–第16天Vue3插件开发文章目录重生之我在学Vue--第16天Vue3插件开发前言一、插件的作用与开发思路1.1插件能做什么？1.2插件开发四部曲二、开发全局通知插件2.1插件基础结构2.2完整插件代码（带注释解析）2.3样式文件notification.css三、插件的安装与使用3.1在main.js中安装3.2在组件中使用四、插件开发进阶技巧4.1支持TypeScript类
AIGC从入门到实战：可能消失的职业和新出现的机会 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AIGC从入门到实战：可能消失的职业和新出现的机会作者：禅与计算机程序设计艺术1.背景介绍人工智能生成内容（AIGC）正在迅速改变我们的世界。从文本、代码到图像和音乐，AIGC正在各个领域展示其强大的能力，并开始挑战传统的创意产业。本篇文章将深入探讨AIGC的概念、技术原理、应用场景以及其对未来职业的影响，并为读者提供入门AIGC的实用指南。1.1AIGC的兴起AIGC的兴起得益于近年来人工智能技
【APM】Loki日志多行显示运维归一 DevOps APM loki 日志并行
上一篇文章我们搭建了Alertmanager和Loki，接下来我们来实现日志并行显示专栏：https://blog.csdn.net/zhanremo3062/category_12552674.html我们只需要修改Promtail服务的配置文件即可multiline:#RE2正则表达式，如果匹配将开始一个新的多行日志块#这个表达式必须被提供firstline:#解析的最大等待时间（Godura
c# EasyModbus Modbus TCP 通讯 babala_s c#服务器数据库
publicstaticModbusClientmodbusClient=null;publicMainViewModel(){modbusClient=newModbusClient("192.168.0.202",502);try{modbusClient.UnitIdentifier=1;//地址modbusClient.Baudrate=9600;modbusClient.Connecti
Collab-Overcooked:专注于多智能体协作的语言模型基准测试平台数据集
2025-02-27，由北京邮电大学和理想汽车公司联合创建。该平台基于《Overcooked-AI》游戏环境，设计了更具挑战性和实用性的交互任务，目的通过自然语言沟通促进多智能体协作。一、研究背景近年来，基于大型语言模型的智能体系统在复杂任务分解和规划方面展现出巨大潜力，成为自然语言处理领域的研究热点。然而，随着研究的深入，人们发现单个智能体在处理复杂任务时存在局限性，而多智能体系统通过协作能够显
书籍-《深度生成模型（第二版）》
书籍：DeepGenerativeModeling作者：JakubM.Tomczak出版：Springer编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《深度生成模型（第二版）》01书籍介绍本书是关于生成式AI背后模型的第一本全面著作，经过彻底修订，涵盖了所有主要类别的深度生成模型，包括混合模型、概率电路、自回归模型、基于流的模型、潜在变量模型、生成对抗网络（GANs）、混合模型、基于得分的
GitLab使用教程（入门）青妙山版本控制 GitLab
1、下载安装下载地址：https://git-scm.com/download/win2、配置信息1、查看git配置信息、用户名、邮箱gitconfig--listgitconfiguser.namegitconfiguser.email2、配置本地仓库的用户名和邮箱gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"em
vllm部署说明和注意事项 ai一小生 python 人工智能持续部署
1、vllm所在docker镜像可去vllm官网提供的镜像地址拉取地址：UsingDocker—vLLMVllm镜像运行需要不同的cuda版本依赖，如上vllm/vllm-openai:v0.7.2需要cuda12.1方可运行。DeepSeek-R1-Distill-Qwen-32B可去modelscope下载：整体大小约为60GB部署DeepSeek-R1-Distill-Qwen-32B模型，
Kotlin-inline函数特效左少华 kotlin kotlin 开发语言 android
在Kotlin里，inline关键字主要用于内联函数与内联属性。下面为你详细介绍：内联函数使用inline关键字修饰的函数，在编译时，编译器会把函数调用处替换成函数体本身，而不是常规的函数调用过程。这样做的好处是能减少函数调用的开销，特别是在使用高阶函数时效果显著。和C语言的宏替换有殊途同归。@Testfunmain3(){inlineFun{println("hello")}}privatein
ChatGPT智能聊天机器人实现云端源想 chatgpt 机器人
以下是一个从零实现类ChatGPT智能聊天机器人的完整开发指南，包含技术选型、核心代码逻辑和推荐学习资源：—云端平台整理一、技术架构与工具核心模型基座模型：HuggingFaceTransformers库（如GPT-2/GPT-3.5TurboAPI/LLaMA2）轻量化方案：微软DeepSpeed或MetaFairScale（降低显存占用）训练框架PyTorchLightning+Acceler
【面试经验】华为 AI软开计算产品线（面经+时间线） litterfinger 面试华为人工智能
一.岗位：AI软开二.时间线：投递08.09，机试08.28，测评08.29；面试均线上，一面09.12，二面09.27，三面09.29（本来是09.19线下二三面，但由于本人有事推迟）三.一面（50min）自我介绍简单介绍一下传统知识图谱建设和大模型对于知识的构建的差异和整体的趋势聊聊实习经历中的提示工程和sft具体的工作AI的一个发展历史流程和相关算法的引进知识图谱建设的总体流程回顾机试：老鼠
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。

常用公共数据集

目录

一、行动数据库

二、农业

三、属性识别

四、自动驾驶

五、生物/医药

六、相机校准

七、面部和眼睛/虹膜数据库

八、指纹

九、一般图像

十、一般RGBD和深度数据集

由于字数限制，将数据集分成两个，点击下面的字体进行继续进行观看

你可能感兴趣的:(AI)