熊猫小妖

制作目标检测数据集入门到精通（一）常用数据集(及下载数据网站)汇总

- 前言
- 1.目标识别知名数据集
- - 1.1 PASCAL VOC
  - 1.2 MS COCO
  - 1.3 ImageNet
- 2 人脸识别相关
- - 2.1 FERET人脸数据库
  - 2.2 CMU Multi-PIE人脸数据库
  - 2.3 年龄识别数据集IMDB-WIKI
  - 2.4 Large-scale CelebFaces Attributes (CelebA) Dataset
  - 2.5 Labeled Faces in the Wild Home (LFW)
  - 2.6 CeFA
  - 2.7 WildestFaces
- 3 skyimg.ai 发布的相关图像数据集的整理
- 4 CVonline: Image Databases
- - - 行动数据库
    - 属性识别
    - 自动驾驶
    - 生物/医学
    - 摄像机校准
    - 事件摄像机数据
    - 人脸和眼睛/虹膜数据库
    - 指纹
    - 一般图像
    - 常规RGBD、三维点云和深度数据集
    - 一般视频
    - 手、手抓握、手动作和手势数据库
    - 图像、视频和形状数据库检索
    - 对象数据库
    - 人（静态和动态），人体姿势
    - 人员检测和跟踪数据库（另见监控）
    - 遥感
    - 机器人学
    - 场景或场所，场景分割或分类
    - 分割
    - 同时定位和绘图
    - 监视和跟踪（另见人员）
    - 纹理
    - 城市数据集
    - 视觉与自然语言
    - 其他收藏页
    - 杂项主题
- 5 其他网友整理的数据合集
- - 包括了视频、音频、NLP 、CV、金融、交通、医疗、社会数据等多方面。
- 5 汇总几个下载一般数据集的常用网站
- - 5.1、Kaggle数据集
  - 5.2、Amazon数据集
  - 5.3、UCI机器学习资源库
  - 5.4、谷歌数据集搜索引擎
  - 5.5、微软数据集
  - 5.6、Awesome Public Datasets Collection
  - 5.7、政府数据集
  - 5.8、计算机视觉数据集
  - 5.9 阿里天池
  - 5.10 格物钛
- 6 部分数据交易平台

前言

本篇主要的目的是网罗汇总个人认知范围内的所有比较好的数据集及其链接地址、相关信息、以及链接地址等。以便于大家使用的时候可以尽快下载，尽快找到足量数据，所以事无巨细全都汇总在一起。主要包括以下几个来源：

学术上已经公布发表，或者成为业界检测某种算法性能的知名数据集
已知的别人已经整理过的、公开的数据整理数据集序列表
数据量丰富的，可以免费下载的常用网站

1.目标识别知名数据集

1.1 PASCAL VOC

简介

PASCAL VOC为图像识别和分类提供了一整套标准化的优秀的数据集，从2005年到2012年每年都会举行一场图像识别challenge。该挑战的主要目的是识别真实场景中一些类别的物体。在该挑战中，这是一个监督学习的问题，训练集以带标签的图片的形式给出。这些物体包括20类：

Person: person Animal: bird, cat, cow, dog, horse, sheep Vehicle:
aeroplane, bicycle, boat, bus, car, motorbike, train Indoor: bottle,
chair, dining table, potted plant, sofa, tv/monitor

数据说明

该挑战主要包括三类任务：

分类（classification），
检测（detection），
分割（segmentation）

所有的标注图片都有Detection需要的label，但只有部分数据有Segmentation Label。

VOC2007中包含9963张标注过的图片，由train/val/test三部分组成，共标注出24,640个物体。VOC2007的test数据label已经公布，之后的没有公布（只有图片，没有label）。

VOC2012的trainval/test包含08-11年的所有对应图片。trainval有11540张图片共27450个物体。对于分割任务， VOC2012的trainval包含07-11年的所有对应图片， test只包含08-11。trainval有 2913张图片共6929个物体。

在这里采用PASCAL VOC2012作为例子：

.
└── VOCdevkit     #根目录
    └── VOC2012   #不同年份的数据集，这里只下载了2012的，还有2007等其它年份的
        ├── Annotations        #存放xml文件，与JPEGImages中的图片一一对应，解释图片的内容等等
        ├── ImageSets          #该目录下存放的都是txt文件，txt文件中每一行包含一个图片的名称，末尾会加上±1表示正负样本
        │   ├── Action
        │   ├── Layout
        │   ├── Main
        │   └── Segmentation
        ├── JPEGImages         #存放源图片
        ├── SegmentationClass  #存放的是图片，语义分割相关
        └── SegmentationObject #存放的是图片，实例分割相关

说明：

Annotation文件夹存放的是xml文件，该文件是对图片的解释，每张图片都对于一个同名的xml文件。
ImageSets文件夹存放的是txt文件，这些txt将数据集的图片分成了各种集合。
其中Action下存放的是人的动作（例如running、jumping等等，这也是VOC challenge的一部分）；
Layout下存放的是具有人体部位的数据（人的head、hand、feet等等，这也是VOC challenge的一部分）；
Main下存放的是图像物体识别的数据，总共分为20类；
Segmentation下存放的是可用于分割的数据。
JPEGImages文件夹存放的是数据集的原图片
SegmentationClass以及SegmentationObject文件夹存放的都是图片，且都是图像分割结果图

下载链接

Pascal VOC网址：http://host.robots.ox.ac.uk/pascal/VOC/
查看各位大牛算法的排名的Leaderboards：http://host.robots.ox.ac.uk:8080/leaderboard/main_bootstrap.php
训练/验证数据集下载（2G）：host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
数据下载镜像网站（实测迅雷教育网速度很快）：https://pjreddie.com/projects/pascal-voc-dataset-mirror/
官方说明：The PASCAL Visual Object Classes Challenge 2012 (VOC2012) Development Kit

1.2 MS COCO

简介

是微软公司建立的数据集。对于目标检测任务，COCO包含80个类别，每年大赛的训练和和验证集包含120,000张图片，超过40,000张测试图片。下面是这个数据集中的80个类别：

Person#1：person
Vehicle#8：bicycle,car,motorcycle,airplane,bus,train,truck,boat
Outdoor#5：traffic light, firhydrant, stop sign, parking meter, bench
Animal#10：bird,cat, dog,horse, sheep, cow, elephant, bear, zebra,
giraffe Accessory#5：backpack, umbrella,handbag, tie, suitcase
Sport#10：frisbee, skis,snowboard, sports ball, kite, baseball bat ,
baseball glove, skateboard, surfboard, tennisracket Kitchen#7：bottle,
wine glass,cup, fork, knife, spoon, bowl Food#10：banana,
apple,sandwich, orange, broccoli, carrot, hot dog, pizza, donut, cake
Furniture#6: chair, couch, potted plant,bed, dining table, toilet
Electronic#6：tv, laptop, mouse,remote, keyboard, cell phone
Appliance#5：microwave, oven,toaster, sink, refrigerator Indoor#7：book,
clock, vase,scissors, teddy bear, hair drier, toothbrus

数据说明

数据集格式介绍：http://cocodataset.org/#format-data。
重要的网址：
在学习过程中，博主发现了写的更为详细和全面的一些介绍博客，记录在这里供大家参考：
COCO数据集的标注格式-知乎专栏

COCO有5种类型的标注，分别是：物体检测、关键点检测、实例分割、全景分割、图片标注，都是对应一个json文件。json是一个大字典，都包含如下的关键字：

{
     
	"info" : info,
	"images" : [image], 
	"annotations" : [annotation], 
	"licenses" : [license],
}

虽然每个json文件都有"info", “images” , “annotations”, "licenses"关键字，但不同的任务对应的json文件中annotation的形式不同，具体格式就不展开讨论了。

下载链接

数据集官网首页：http://cocodataset.org/#home
数据集下载：可用迅雷去下载官方链接，速度还是挺快的。如果速度不快，可能你需要找“正确版本”的迅雷

1.3 ImageNet

简介

是一个计算机视觉系统识别项目，是目前世界上图像识别最大的数据库，是美国斯坦福的计算机科学家，模拟人类的识别系统建立的。ImageNet数据集是按照WordNet架构组织的大规模带标签图像数据集。大约1500万张图片，2.2万类，每张都经过严格的人工筛选与标记。ImageNet类似于图片所有引擎。
其中，包括边界框的目标检测数据集，训练数据集包括500,000张图片，属于200类物体。由于数据集太大，训练所需计算量很大；类别数较多；造成了很少使用和目标检测的难度也很大。
ImageNet是根据WordNet层次结构组织的图像数据集。在ImageNet中，目标是为了说明每个synset提供平均1000幅图像。每个concept图像都是质量控制和人为标注的(quality-controlled and human-annotated)。在完成之后，希望ImageNet能够为WordNet层次结构中的大多数concept提供数千万个干净整理的图像(cleanly sorted images)。

ImageNet是一项持续的研究工作，旨在为世界各地的研究人员提供易于访问的图像数据库。目前ImageNet中总共有14197122幅图像，总共分为21841个类别(synsets)，大类别包括：amphibian、animal、appliance、bird、covering、device、fabric、fish、flower、food、fruit、fungus、furniture、geological formation、invertebrate、mammal、musical instrument、plant、reptile、sport、structure、tool、tree、utensil、vegetable、vehicle、person。

ImageNet数据集介绍以及下载链接：

http://www.image-net.org/

2 人脸识别相关

2.1 FERET人脸数据库

由FERET项目创建，此图像集包含大量的人脸图像，并且每幅图中均只有一个人脸。该集中，同一个人的照片有不同表情、光照、姿态和年龄的变化。包含1万多张多姿态和光照的人脸图像，是人脸识别领域应用最广泛的人脸数据库之一。其中的多数人是西方人，每个人所包含的人脸图像的变化比较单一。

http://www.nist.gov/itl/iad/ig/colorferet.cfm

2.2 CMU Multi-PIE人脸数据库

由美国卡耐基梅隆大学建立。所谓“PIE”就是姿态（Pose），光照（Illumination）和表情（Expression）的缩写。CMU Multi-PIE人脸数据库是在CMU-PIE人脸数据库的基础上发展起来的。包含337位志愿者的75000多张多姿态，光照和表情的面部图像。其中的姿态和光照变化图像也是在严格控制的条件下采集的，目前已经逐渐成为人脸识别领域的一个重要的测试集合。

http://www.flintbox.com/public/project/4742/

2.3 年龄识别数据集IMDB-WIKI

包含524230张从IMDB和Wikipedia爬取的名人数据图片。应用了一个新颖的化回归为分类的年龄算法。本质就是在0-100之间的101类分类后，对于得到的分数和0-100相乘，并将最终结果求和，得到最终识别的年龄。

https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/

2.4 Large-scale CelebFaces Attributes (CelebA) Dataset

CelebFaces Attributes Dataset (CelebA) is a large-scale face attributes dataset with more than 200K celebrity images, each with 40 attribute annotations. The images in this dataset cover large pose variations and background clutter. CelebA has large diversities, large quantities, and rich annotations, including

10,177 number of identities,

202,599 number of face images, and

5 landmark locations, 40 binary attributes annotations per image.

这是由香港中文大学汤晓鸥教授实验室公布的大型人脸识别数据集。该数据集包含有200K张人脸图片，人脸属性有40多种，主要用于人脸属性的识别。

下载链接

2.5 Labeled Faces in the Wild Home (LFW)

More than 13,000 images of faces collected from the web. Each face has been labeled with the name of the person pictured. 1680 of the people pictured have two or more distinct photos in the data set.

LFW数据集是为了研究非限制环境下的人脸识别问题而建立的。这个数据集包含超过13，000张人脸图像，均采集于Internet。

每个人脸均被标准了一个人名。其中，大约1680个人包含两个以上的人脸。

这个集合被广泛应用于评价Face Verification算法的性能。

下载链接

2.6 CeFA

发布了迄今为止最大的人脸活体检测数据集，在模式、被测目标数量和攻击类型方面都是如此。更重要的是，CeFA是唯一一个带有民族标签的公开人脸活体检测数据集。此外，通过从多模态数据中学习补充信息来缓解民族偏见，提供了一条基线：PSMM Net。广泛的实验验证了算法的实用性以及在所提出的数据集上训练模型的泛化能力。

论文 | https://openaccess.thecvf.com/content/
WACV2021/papers/Liu_CASIA-SURF_CeFA_A_
Benchmark_for_Multi-Modal_Cross-Ethnicity_Face_Anti-Spoofing_WACV_2021_paper.pdf
数据集 | https://sites.google.com/qq.com/face-anti-spoofing/welcome/challengecvpr2020?authuser=0
备注 | WACV2021

2.7 WildestFaces

研究了人脸识别背景下的部分监督域迁移问题，基于干净的训练图像，评估算法对粗劣视频中人的识别能力。引入一个数据集：WildestFaces，包含模糊、姿势多样性、遮挡和分辨率等不利图像。

论文 | https://arxiv.org/abs/2009.07576
数据集 | https://ycbilge.github.io/wildestFaces
备注 | WACV2021

3 skyimg.ai 发布的相关图像数据集的整理

大类主要包括：自然图像数据集、人脸数据集、视频数据集、文本数据集、推荐系统和排名、语音数据集、音符数据集等

因为数量众多，还是参见 datawhale的整理版

4 CVonline: Image Databases

这是一个非常强、内容覆盖面大、整理完善的汇总CV领域数据资源的网页

大类主要包括：

行动数据库

属性识别

自动驾驶

生物/医学

摄像机校准

事件摄像机数据

人脸和眼睛/虹膜数据库

指纹

一般图像

常规RGBD、三维点云和深度数据集

一般视频

手、手抓握、手动作和手势数据库

图像、视频和形状数据库检索

对象数据库

人（静态和动态），人体姿势

人员检测和跟踪数据库（另见监控）

遥感

机器人学

场景或场所，场景分割或分类

分割

同时定位和绘图

监视和跟踪（另见人员）

纹理

城市数据集

视觉与自然语言

其他收藏页

杂项主题

原网页链接：http://homepages.inf.ed.ac.uk/rbf/CVonline/Imagedbase.htm
或者参见有些人的翻译的版本：链接

5 其他网友整理的数据合集

包括了视频、音频、NLP 、CV、金融、交通、医疗、社会数据等多方面。

链接地址：https://blog.csdn.net/qq_32447301/article/details/79487335

5 汇总几个下载一般数据集的常用网站

不仅包含用于实验的大型数据集，还附带对数据集的描述以及使用示例。有的还包含用于解决与该数据集相关机器学习问题的算法代码。

5.1、Kaggle数据集

数据集地址：https://www.kaggle.com/datasets

5.2、Amazon数据集

数据集地址：https://registry.opendata.aws/

该数据源包含多个不同领域的数据集，如：公共交通、生态资源、卫星图像等。

网页中也有一个搜索框来帮助用户寻找想要的数据集，还有所有数据集的描述和使用示例，这些数据集信息丰富且易于使用！

数据集存储在Amazon Web Services (AWS)资源中，比如Amazon S3——云中的一个高度可伸缩的对象存储服务。

如果用户正在使用AWS进行机器学习实验和开发，这将非常方便，由于它是AWS网络的本地数据，因此数据集的传输将非常快。

5.3、UCI机器学习资源库

数据集地址：https://archive.ics.uci.edu/ml/datasets.html

另一个来自加州大学信息与计算机科学学院的大型资源库，包含100多个数据集。

用户可以找到单变量和多变量时间序列数据集，分类、回归或推荐系统的数据集。

有些UCI的数据集已经是被清洗过的。

5.4、谷歌数据集搜索引擎

数据集地址：https://toolbox.google.com/datasetsearch

在2018年末，谷歌做了他们最擅长的事情，推出了另一项伟大的服务——它是一个可以按名称搜索数据集的工具箱。

他们的目标是统一成千上万个不同的数据集存储库，使这些数据能够且易被发现。

5.5、微软数据集

数据集地址：https://msropendata.com/

2018年7月，微软与外部研究社区共同宣布推出“Microsoft Research Open Data”。

它在云中包含一个数据存储库，用于促进全球研究社区之间的协作。它提供了一系列用于已发表研究的、经过处理的数据集。

5.6、Awesome Public Datasets Collection

数据集地址：https://github.com/awesomedata/awesome-public-datasets

这是一个按“主题”组织的数据集，比如生物学、经济学、教育学等。

这里列出的大多数数据集都是免费的，但是在使用任何数据集之前，用户需要检查一下许可要求。

5.7、政府数据集

政府相关数据集也很容易找到的。

许多国家为了提高透明度，向公众分享了各种数据集。以下是一些例子：

欧盟开放数据门户：欧洲政府数据集。

数据集地址：https://data.europa.eu/euodp/data/dataset

美国政府数据：目前由于一些非政治性原因，暂时无法访问。

数据集地址：https://www.data.gov/

新西兰政府数据集：

数据集地址：https://catalogue.data.govt.nz/dataset

印度政府数据集：

数据集地址：https://data.gov.in/

5.8、计算机视觉数据集

数据集地址：https://www.visualdata.io/

Visual Data包含一些可以用来构建计算机视觉(CV)模型的大型数据集。

用户可以通过特定的CV主题查找特定的数据集，如语义分割、图像标题、图像生成，甚至可以通过解决方案(自动驾驶汽车数据集)查找特定的数据集。

5.9 阿里天池

数据集地址：https://tianchi.aliyun.com/dataset?spm=5176.12282016.0.0.29536d92P3ZKjo

5.10 格物钛

在CV等计算机领域中，好的数据，对模型训练至关重要。自己做数据，即昂贵又费时费力；但是，使用现成的数据集，即不好找又不好下载及使用。直到最近，找到一个数据集获取神器 Graviti Open Dataset。
简单点说，Graviti 是一个提供公开数据集的平台，你可以很方便的搜索你想要的数据，可在线预览样例数据、标注、标签，对于国外的数据不需要“梯子”、可高速免费下载。

Graviti 收录了 400 多个高质量 CV 类数据集，覆盖无人驾驶、智慧零售、机器人等多种 AI 应用领域。
不仅种类多，还方便搜索，可以按应用行业 , 标注类型进行筛选！查找简单操作。

除了整合数据集信息以外，在线可视化也是亮点！无需下载直接可以浏览样例数据，标注、标签同样可以轻松在线查看。

甚至，提供了数据分布：

官方地址：https://www.graviti.cn/open-datasets

6 部分数据交易平台

由于现在数据的需求很大，也催生了很多做数据交易的平台，当然，除去付费购买的数据，在这些平台，也有很多免费的数据可以获取。

优易数据：

拥有国家级信息资源的数据平台。包含政务、社会、社交、教育、消费、交通、能源、金融、健康等多个领域的数据资源。

数据堂：

提供数据交易、处理和数据API服务，包含语音识别、医疗健康、交通地理、电子商务、社交网络、图像识别等方面的数据。

conda安装R语言环境并部署至pycharm 楚门留香 r语言开发语言
优先看这个：[win10系统使用Pycharm-professional配置R语言-知乎(zhihu.com)](https://zhuanlan.zhihu.com/p/546788455)要安装R4.0.0的时候看这个：[R语言的安装（详细教程）_r语言安装教程-CSDN博客](https://blog.csdn.net/xhmico/article/details/122443660)r语言
机器学习——分类、回归、聚类、LASSO回归、Ridge回归（自用）代码的建筑师模型学习模型训练机器学习机器学习分类回归正则化项 LASSO Ridge 朴素
纠正自己的误区：机器学习是一个大范围，并不是一个小的方向，比如：线性回归预测、卷积神经网络和强化学都是机器学习算法在不同场景的应用。机器学习最为关键的是要有数据，也就是数据集名词解释：数据集中的一行叫一条样本或者实例，列名称为特征或者属性。样本的数量称为数据量，特征的数量称为特征维度机器学习常用库：Numpy和sklearn朴素的意思是特征的各条件都是相互独立的机器学习（模型、策略、算法）损失函数
基于Python PYQT5 的相机定时采集图像程序，GUI打包独立运行夏时summer time python qt 数码相机相机
基于PythonPYQT5编写相机定时采集图像及手动采集版本介绍Python3.6pyqt55.15.4pyqt5-tools5.15.4.3.2另外就是常用的cv2和numpy包fromPyQt5importQtCore,QtGui,QtWidgetsfromPyQt5importQtCore,QtGui,QtWidgetsimportcv2importnumpyasnpfromdatetime
《AI医疗系统开发实战录》第6期——智能导诊系统实战骆驼_代码狂魔程序员的法宝人工智能 django python neo4j 知识图谱
关注我，后期文章全部免费开放，一起推进AI医疗的发展核心主题：如何构建95%准确率的智能导诊系统？技术突破：结合BERT+知识图谱的混合模型设计一、智能导诊架构设计python基于BERT的意图识别模型（PyTorch）fromtransformersimportBertTokenizer,BertForSequenceClassificationimporttorchclassTriageMod
第二十二章: 静态多态与动态多态的衔接_《C++ Templates》notes 郭涤生 c/c++c++开发语言笔记
静态多态与动态多态的衔接核心知识点代码示例与测试用例测试用例输出多选题设计题关键技术总结核心知识点静态多态vs动态多态静态多态：编译期多态，通过模板实现，代码生成效率高，但灵活性差。动态多态：运行期多态，通过虚函数实现，灵活性高，但存在虚表开销。类型擦除（TypeErasure）核心思想：将不同类型的对象统一为通用接口，隐藏具体类型信息。实现方式：通常结合基类指针和模板注册机制。桥接模式（Brid
knife4j，微服务聚合Swagger文档图书馆的小盆友 java开发相关微服务 java microservices
前置知识我们将采用Nacos作为注册中心，Gateway作为网关，使用knife4j来生成API文档，对这些技术不了解的朋友可以看下下面的文章。SpringCloudGateway：新一代API网关服务SpringCloudAlibaba：Nacos作为注册中心和配置中心使用给Swagger换了个新皮肤，瞬间高大上了！应用架构我们理想的解决方案应该是这样的，网关作为API文档的统一入口，网关聚合所
jetson nano 实现串口的字节输出诶我就不告诉你单片机嵌入式硬件
实现jetosnnano的字节输出，但是存在一定的问题主要为在制作数据包的过程中，我遇到了当输出字节为0x0a的情况下串口会连续输出0x0d0x0a这时候需要在串口部分进行一定的配置防止自动换行的输出/*防止自动换行*/opt.c_oflag&=~OPOST;//禁用输出处理标志，防止自动转换换行符感谢博主JetsonNano入坑之路----（10）C/C++语言读写UART或USB串口数据_je
CentOS 7 下 Supervisor 安装与配置 OUDKE centos linux 运维服务器
Supervisor是一个用于管理和监控进程的工具，它可以在CentOS7服务器上轻松地启动、停止和重启进程。在本文中，我将向您展示如何安装和配置Supervisor。步骤1：安装Supervisor首先，我们需要使用yum包管理器安装Supervisor。打开终端并执行以下命令：sudoyuminstallepel-releasesudoyuminstallsupervisor这将安装Super
RISC-V生态架构浅析(认识RISC-V) JKX_geek
RISC-V生态架构浅析前言RISC-V最近越来越多的出现在科技新闻中，大量的公司加入到RISC-V研究和生产中。在越来越多的RISC-V研究热下，毋容置疑的是RISC-V的时代即将到来。让我们在这浪潮翻滚起来前，一起掀开RISC-V的神秘面纱，提前了解一下RISC-V究竟是什么。什么是RISC-VRISC-V应该泛指RISC-V指令集及其衍生出来的一系列生态。而RISC-V指令集，类似于INTE
C++在线OJ负载均衡项目平凡的小y c++开发语言
1.演示项目项目源码链接：2.项目所用技术和开发环境所用技术C++STL标准库Boost准标准库(字符串切割)cpp-httplib第三方开源网络库ctemplate第三方开源前端网页渲染库jsoncpp第三方开源序列化、反序列化库负载均衡设计MySQLCconnectAce前端在线编辑器html/css/js/jquery/ajax开发环境Ubuntu云服务器vscodeMysqlWorkben
Camera2 实现重力感应四个方向调试相机预览 ItJavawfc Camera Camera2 Camera 重力感应适配方向预览
Camera2API实现重力感应四个方向调试相机预览文章目录需求场景需求实现setAspectRatio设置显示长宽postScalepostRotate设置缩放和旋转manager.openCamera打开相机startPreviewgetPreviewRequestBuilder设置预览参数：createCaptureSession预览准备工作setRepeatingRequest请求预览总结
量化交易系统中如何处理机器学习模型的训练和部署？ openwin_top 量化交易系统开发机器学习人工智能量化交易
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位量化交易系统中，机器学习模型的训练和部署需要遵循一套严密的流程，以确保模型的可靠性、性能和安全性。以下是详细描述以及相关的示例：1.数据收集和预处理数据收集在量化交易中，数据是最重要的资产。收集的数
Mac下载python并安装小小酥*
下载pythonPython官网：https://www.python.org/进入官网后点击download，选择MacOSX版本2.安装MAC系统一般都自带有Python2.x版本的环境，你也可以在链接https://www.python.org/downloads/mac-osx/上下载最新版安装。3.设置环境变量程序和可执行文件可以在许多目录，而这些路径很可能不在操作系统提供可执行文件的搜
深入拆解Nightingale_alert中篇上(三) weixin_47028810 夜莺 github 开源软件 golang 运维
前言上一篇我们首先初步了解一下开源项目-夜莺的alert告警引擎模块的目录，其次通过查看n9e-alert通过Initialize函数的源码大概了解了告警引擎初始化做了哪些工作，另一个重要原因Initialize函数也是通过调用Start函数来实现启动告警引擎，这个和中心节点的n9e进程接入告警引擎是一致的。本文打算通过Start函数来进一步拆解并分析告警引擎的工作原理。告警引擎启动入口-Star
深入理解Python上下文管理器 ……-…… python 开发语言
1.什么是上下文管理器？2.with语句的魔法3.创建上下文管理器的两种方式3.1基于类的实现3.2使用contextlib模块4.异常处理1.什么是上下文管理器？上下文管理器（ContextManager）是Python中用于精确分配和释放资源的机制。它通过__enter__()和__exit__()两个魔术方法实现了上下文管理协议，确保即使在代码执行出错的情况下，资源也能被正确清理。#经典文件
基于Streamlit实现的音频处理示例大霸王龙音视频 ffmpeg
基于Streamlit实现的音频处理示例，包含录音、语音转文本、文件下载和进度显示功能，整合了多个技术方案：一、环境准备#安装依赖库pipinstallstreamlitstreamlit-webrtcaudio-recorder-streamlitopenai-whisperpython-dotx二、完整示例代码importstreamlitasstfromaudio_recorder_stre
异步编程中的并发编程优化 AI天才研究院架构师必知必会系列自然语言处理人工智能语言模型编程实践开发语言架构设计
文章目录1.简介2.基本概念术语说明什么是异步编程？为什么要异步编程？浅谈异步编程模型基于事件驱动的模型基于消息队列的模型基于协程的模型为什么要进行并发优化？3.基本算法原理和具体操作步骤1.串行执行2.并行执行3.任务分片4.超时重试5.异步回调6.消息队列7.缓存8.异步框架9.模型选择4.具体代码实例和解释说明模块划分1.串行执行2.并行执行3.任务分片4.超时重试5.异步回调6.消息队列7
Android Compose 框架副作用管理（SideEffect、EffectScope）深入剖析(十八) &有梦想的咸鱼& Android开发大全 Androiod Compose原理 android
AndroidCompose框架副作用管理（SideEffect、EffectScope）深入剖析一、引言在现代Android开发中，AndroidCompose作为一种声明式的UI构建方式，为开发者带来了全新的开发体验。它通过简洁的代码和高效的性能，使得构建复杂的用户界面变得更加容易。然而，在实际开发中，我们不仅需要处理UI的构建，还需要处理一些副作用操作，例如资源的初始化和释放、异步任务的执行
夜莺监控 v8.0 新版通知规则 | 对接飞书告警夜莺开源监控夜莺监控飞书告警飞书卡片告警
新版通知规则的介绍文章：夜莺监控巨大革新：抽象出通知规则，增强告警通知的灵活性新版通知规则对接钉钉：夜莺监控v8.0新版通知规则|对接钉钉告警新版通知规则对接企微：夜莺监控v8.0新版通知规则|对接企微告警本文对背景信息不做额外描述了，大家一定要先看看上面的文章，原理类似。本文直接讲解夜莺监控的通知规则如何对接飞书告警。开源夜莺和飞书的对接支持text和飞书卡片两种方式，不支持飞书应用。Flash
ArrayList 和 LinkedList区别重生之我在成电转码 java 多线程系统
一、底层实现特性ArrayListLinkedList数据结构动态数组（Object[]数组）双向链表（每个节点有前驱和后继）内存布局连续内存，空间利用率高非连续内存，空间占用大元素访问方式下标随机访问（基于索引）只能顺序遍历，找元素慢⏱二、时间复杂度对比（核心！）操作ArrayListLinkedList随机访问O(1)O(n)头部插入O(n)（全体后移）O(1)中间插入O(n)O(n)尾部插入
npm install 报错 gyp info it worked if it ends with ok npm ERR gyp verb cli [ m0_61083409 前端 html npm 前端 node.js
今天新启动一个项目，在npminstall安装依赖项时出现报错。ERR!code1npmERR!pathC:UsersAdministratorDesktope31mall-admin-webode_modulesode-sassnpmERR!commandfailednpmERR!commandC:Windowssystem32cmd.exe/d/s/cnodescripts/build.jsn
于STM32F103C8T6的智能灯泡控制系统C++源码实现程序员Thomas STM32 单片机智能灯泡 stm32 c++嵌入式硬件
以下是一个基于STM32F103C8T6的智能灯泡控制系统C++源码实现，整合了PWM调光、WiFi控制和环境感知功能。该代码已在STM32CubeIDE中验证，支持直接烧录运行：#include"main.h"#include#include"wifi.h"//LED设备抽象类（3设计）classLEDDevice{protected:TIM_HandleTypeDef*pwmTimer;uin
基于STM32的平衡车外设控制应用案例，提供C++源码程序员Thomas STM32 单片机平衡车 stm32 c++单片机
基于STM32的平衡车外设控制应用案例**下面是一个使用STM32控制平衡车的简单应用案例，包含姿态传感器读取、电机控制和串口通信功能。主要功能使用MPU6050传感器读取姿态数据使用PID控制器调整平衡车姿态通过串口输出调试信息电机速度控制C++源代码#include"stm32f10x.h"#include//定义常量#definePWM_MIN1000#definePWM_MAX2000#d
深入了解 ArangoDB 的图数据库应用与 Python 实践 eahba 数据库 python 开发语言
在当前数据驱动的时代，对连接数据的高效处理和分析需求日益增长。ArangoDB作为一个可扩展的图数据库系统，能够加速从连接数据中获取价值。本文将介绍如何使用Python连接和操作ArangoDB，并展示如何结合图问答链来获取数据洞察。技术背景介绍ArangoDB是一个多模型数据库，支持文档、图和键值类型的数据存储。其强大的图形存储和查询能力使其成为处理复杂数据关系的理想选择。通过JSON支持和单一
不懂英语可以学编程吗?,不懂英文可以学编程吗 P5688346 人工智能
大家好，给大家分享一下英语不好能学python编程吗，很多人还不知道这一点。下面详细解释一下。现在让我们来看看！Sourcecodedownload:本文相关源码提到人工智能，就不得不提Python编程语言，大多数人觉得编程语言肯定会涉及到很多代码，满屏的英文字母，想想就头疼，觉得自己不会英语，肯定学不好Python，但是不会英语到底能不能够学习Python呢，下面小编给大家分析分析。其实各位想要
一、Python入门基础 MeyrlNotFound python 开发语言
1.Python简介与环境搭建•了解Python的历史、特点和应用领域Python的历史Python是一种高级编程语言，由GuidovanRossum于1989年发明。Python语言的设计目标是让代码易读、易写、易维护，从而提高开发效率和代码质量。自其诞生以来，Python已从一个简单的系统管理工具发展成为一种广泛应用于多个领域的编程语言。Python的特点1.简单易学：Python的语法简洁明
基于JAVA中的spring框架和jsp实现自然灾害论坛平台项目【附项目源码+论文说明】大雄是个程序员项目实践自然灾害论坛平台 java 项目源码 spring 毕业设计课程设计网页设计
摘要在上个世纪末期，也就是20世纪末，随着计算机技术的发展与进步和数据库方面的知识在互联网的大力运用，互联网技术以及网站技术在网上的大力推广，网上论坛（自然灾害论坛）也逐渐在网兴起，它的出现帮助了网上各种特定的群体进行一个在线的知识传递与信息的交流。本计算机自然灾害论坛设计，采用了JSP（JAVA）技术和MYSQL数据库开发，尝试实现了自然灾害论坛的基本功能以及帮助我们掌握了论坛技术的核心特点。该
深入理解C++中的std::string::substr成员函数：子串操作的艺术星途码客 c++c++开发语言
引言在C++编程中，字符串处理是一项常见且重要的任务。std::string类作为C++标准库中的一部分，提供了丰富的成员函数来支持字符串的各种操作，其中substr成员函数在获取字符串子串方面扮演着关键角色。本文将深入探讨std::string::substr函数的工作原理、使用方法、异常处理以及性能考量，帮助读者全面掌握这一强大的字符串处理工具。题目：探索C++std::string::sub
为什么框架创建对象需要用反射和newInstance而不是直接new 小斌的Debug日记 java 开发语言
今天被这个问题难住了，想了几个点又查了很多资料，终于搞懂了首先不管是接口，面向对象还是框架，他们都有一个思想就是减少相同的代码，提升他们的通用性，并提高代码的复用性和可扩展性。你想直接new没问题，当你创建一个类的实例时，可能会创建一些你不需要的资源或者对象，就会浪费资源反射允许你在运行时动态地创建类的实例，如果用了反射，例如你想创建什么类的对象，就用字符串传进类名，然后用newInstance(
npm error gyp info 计算机辅助工程 npm 前端 node.js
在使用npm安装Node.js包时，可能会遇到各种错误，其中gyp错误是比较常见的一种。gyp是Node.js的一个工具，用于编译C++代码。这些错误通常发生在需要编译原生模块的npm包时。下面是一些常见的原因和解决方法：常见原因及解决方法Python未安装或版本不兼容：Node.js使用Python来运行gyp。确保你的系统上安装了Python，并且版本与node-gyp兼容。通常推荐使用Pyt
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option