伙伴lqs

目标检测任务数据集介绍-MS COCO数据集

本文简要介绍了COCO数据集的下载、数据内容及使用API接口。比较冗长，适合入门了解。

MS COCO数据集简介

简介
数据下载
- 2014 Train/Val
- 2017 Train/Val
数据内容与格式
- 2014Train/Val
使用接口

简介

MS COCO全称Microsoft Common Objects in Context，是一个包含了目标检测、分割、字幕的数据集。包含了以下特点：目标分割、情景中的识别、超像素Stuff分割（相较于Thing Class，即人、汽车、大象这类目标为主的目标检测任务，此任务更专注于Stuff Class，即草、墙、天空此类目标）、33万幅影像（其中超过20万幅有标注信息）、150万对象实例，80个object类别，91个stuff类别，每个影像5个字幕，25万个标注了关键点的人体目标。
官网地址：http://cocodataset.org（可能需要科学上网）。

打开官网后，依次浏览Dataset，Tasks，Evaluate可以看到数据集，比赛任务、以及提交结果的格式及提交方式等内容。我们最关心的是数据的下载、数据内容与格式及使用方法，按照这个顺序依次来了解该数据集。

数据下载

点击Dataset->Download可以看到有数据使用的API接口、Images影像数据、Annotations标注数据。

在概览中可以看到主要有2014和2017两个数据集，2014年的数据用于Detection（目标检测）、Captioning（字幕标注）、Keypoints（关键点检测）三个任务中，而2017年的数据在此基础之上，多了Stuff和Panoptic分割任务，因此2017年多了Stuff和Panoptic两种annotations标注数据。

2014 Train/Val

分别点击2014 Train images、2014 Val images、2014 Train/Val Annotations，下载2014年训练影像、验证影像、训练和验证标签，Test测试影像用于比赛，没有标注信息，在平时自己玩模型训练和测试时不需要，可不下载。

下载完后的压缩包：

2017 Train/Val

2017的数据相比于2014的数据，多了Stuff annotations（stuff类别分割标签）与Panoptic annotations（全景分割）的标签数据。在Download页面，分别点击2017 Train images、2017 Val images、2017 Train/Val annotations、2017 Stuff Tran/Val annotations、2017 Panoptic Train/Val annotations下载2017数据的训练/验证影像、训练/验证影像的目标检测标签、Stuff类别标签、全景分割标签。

下载后的压缩包：

数据内容与格式

标注数据集主要就两部分内容，影像数据和标注数据，我们使用数据时最关心的就是标注数据的格式与内容，在此以2014的数据为例，介绍COCO数据集的标注格式。

2014Train/Val

分别解压2014Train/Val/Annotations数据后得到train2014，val2014，annotations三个文件夹，其中train2014中存有82783张图片，val2014中存有40504张图片，图片格式均为jpg格式。
图片示例：

Annotations文件夹中就是最重要的标注数据，cations，instances，person_keypoints依次为字幕、目标检测、人体关键点的标注信息，本文主要关注目标检测的内容，以instance_train2014.json文件中的内容说明记录标注的格式。

在COCO官网，点击Evaluate->Data Format，即可查看数据组织格式。官方介绍中对数据做了如下说明
所有的标注文件都有以下内容：

{
"info" : info, 
"images" : [image], 
"annotations" : [annotation],
"licenses" : [license],
}

其中info，image，license的数据格式与内容为：

info{
"year" : int, 
"version" : str, 
"description" : str,
"contributor" : str, 
"url" : str, 
"date_created" : datetime,
}
image{
"id" : int, 
"width" : int,
"height" : int, 
"file_name" : str,
"license" : int,
"flickr_url" : str,
"coco_url" : str,
"date_captured" : datetime,
}
license{
"id" : int, 
"name" : str, 
"url" : str,
}

不同的标注文件其annotation内容也不同：

Objection Detection目标检测文件。每个目标实例标注都有包括类别id和分割掩码的一系列信息。其中分割掩码的标注格式根据目标是否是单独的对象而有所不同。iscrowd=0时，使用polygons格式（即成对使用x、y坐标标注多边顶点）；iscrowd=1时，表示是一个对象集合，使用RLE（Run-Length Encoding，变动长度编码算法）格式标注。categories域中记录了类别id和类别名称以及上级类别名称的映射关系。具体数据结构格式如下：

annotation{
"id" : int, 
"image_id" : int, 
"category_id" : int, 
"segmentation" : RLE or [polygon], 
"area" : float, 
"bbox" : [x,y,width,height], 
"iscrowd" : 0 or 1,
}

categories[{
"id" : int, 
"name" : str, 
"supercategory" : str,
}]

Keypoint Detection关键点检测标注文件。关键点标注文件内容在目标检测文件内容（包括id、bbox等）之上，增加了两个属性值。第一个是“关键点keypoint”，是一个3k长度的数组，其中k指代关键点的数量。每一个关键点有一个x，y坐标和一个是否可视标签v，v的定义为：v=0，则未标记（此情形x=y=0）；v=1，已标注，但不可视；v=2，已标注且可视。最后，在每个类别，categories结构多加了两个属性值，“keypoints”，是长度为k的数组，内容为关键点名称；“skeleton”，通过成对的关键点list定义关键点连接关系以用于可视化。目前关键点只标注于人体类别。具体数据结构格式如下：

annotation{
"keypoints" : [x1,y1,v1,...], 
"num_keypoints" : int, 
"[cloned]" : ...,
}

categories[{
"keypoints" : [str], 
"skeleton" : [edge], 
"[cloned]" : ...,
}]

"[cloned]": denotes fields copied from object detection annotations defined above.

Stuff Segmentation，Stuff类别分割。Stuff标注格式内容和上述的object detection目标检测格式相同（除了iscrowd属性没有必要所以默认设置为0）。在JSON格式中，影像中每个类别都用RLE格式标注。
Panoptic Segmentation全景分割。
全景分割任务的标注数据，其标注数据是逐影像表示，而不是逐目标表示的。每个逐影像表示的标注数据有两个部分（1）一个PNG格式的影像分割图像（2）一个存储了每个分割影像语义信息的JSON数据。其数据格式如下：

annotation{
"image_id" : int, 
"file_name" : str, 
"segments_info" : [segment_info],
}

segment_info{
"id" : int,. 
"category_id" : int, 
"area" : int, 
"bbox" : [x,y,width,height], 
"iscrowd" : 0 or 1,
}

categories[{
"id" : int, 
"name" : str, 
"supercategory" : str, 
"isthing" : 0 or 1, 
"color" : [R,G,B],
}]

Image Captioning图片字幕标注。每个字幕描述了该图片并且每张图片有至少5条字幕。

annotation{
"id" : int, 
"image_id" : int, 
"caption" : str,
}

仅仅通过这些说明，很难get到具体的数据样式（反正我看完了还是一塌糊涂。。。），最直观的方法还是打开一个标注文件，然后一条条的查看其中记录的数据，我们打开标注文件夹中的instances_train2014.json文件：

数据量非常大，该json文件有317MB，最开始记录了该json标注文件的信息info，其中有描述信息description，链接地址url，版本vision，年份year，贡献者contributor，创建日期data_created.

然后就是大量的images影像信息，是以列表保存，一个大括号{}里就是一幅影像image的信息（图片中选定的部分就是一幅影像的信息）。每幅影像信息依次记录许可号license，文件名file_name，coco网站影像链接coco_url，影像高度height，影像宽度width，获取日期data_captured，flickr网站影像链接flickr_url，影像标识号id。

所有的image信息结束后，接下来是使用许可license信息（图片中所选内容即为license信息），这时候已经到了六万多行。。。lincense信息中每一个大括号记录每一个许可的链接url，序号id，名称name。instances_train2014.json文件中共有8种license，截图中均已列出。

记录完licenses信息后就是真正的标注信息annotations 了，也是我们最需要关注的信息。每一个大括号里记录一个object对象的标注信息，依次为标注分割信息segmentation用polygon多边形或者RLE格式标注对象轮廓，面积area，是否是多目标聚集对象iscrowd，影像序号image_id，边界框bbox，类别序号category_id，该对象序号id。以上内容为一个标注对象的信息，通过这种数据结构，存储了所有标注对象的信息。

json文件的最后，就是类别信息categories，这时候已经到了17万行了。类别信息记录了所有类别的上级类别supercategory，序号id，名称name三个信息，每个大括号里记录一个类别。

因为看到在有的博客中提到2014年的目标检测任务序号id不连续，中间有缺的序号，但总数是80类，在此复制所有类别数据过来，整理一下即可求证。可以看到train2014中类别序号id确实不连续，总类别数为80.

	supercategoty	id	name
1	person	1	person
2	vehicle	2	bicycle
3	vehicle	3	car
4	vehicle	4	motorcycle
5	vehicle	5	airplane
6	vehicle	6	bus
7	vehicle	7	train
8	vehicle	8	truck
9	vehicle	9	boat
10	outdoor	10	trafficlight
11	outdoor	11	firehydrant
12	outdoor	13	stopsign
13	outdoor	14	parkingmeter
14	outdoor	15	bench
15	animal	16	bird
16	animal	17	cat
17	animal	18	dog
18	animal	19	horse
19	animal	20	sheep
20	animal	21	cow
21	animal	22	elephant
22	animal	23	bear
23	animal	24	zebra
24	animal	25	giraffe
25	accessory	27	backpack
26	accessory	28	umbrella
27	accessory	31	handbag
28	accessory	32	tie
29	accessory	33	suitcase
30	sports	34	frisbee
31	sports	35	skis
32	sports	36	snowboard
33	sports	37	sportsball
34	sports	38	kite
35	sports	39	baseballbat
36	sports	40	baseballglove
37	sports	41	skateboard
38	sports	42	surfboard
39	sports	43	tennisracket
40	kitchen	44	bottle
41	kitchen	46	wineglass
42	kitchen	47	cup
43	kitchen	48	fork
44	kitchen	49	knife
45	kitchen	50	spoon
46	kitchen	51	bowl
47	food	52	banana
48	food	53	apple
49	food	54	sandwich
50	food	55	orange
51	food	56	broccoli
52	food	57	carrot
53	food	58	hotdog
54	food	59	pizza
55	food	60	donut
56	food	61	cake
57	furniture	62	chair
58	furniture	63	couch
59	furniture	64	pottedplant
60	furniture	65	bed
61	furniture	67	diningtable
62	furniture	70	toilet
63	electronic	72	tv
64	electronic	73	laptop
65	electronic	74	mouse
66	electronic	75	remote
67	electronic	76	keyboard
68	electronic	77	cellphone
69	appliance	78	microwave
70	appliance	79	oven
71	appliance	80	toaster
72	appliance	81	sink
73	appliance	82	refrigerator
74	indoor	84	book
75	indoor	85	clock
76	indoor	86	vase
77	indoor	87	scissors
78	indoor	88	teddybear
79	indoor	89	hairdrier
80	indoor	90	toothbrush

在了解了一个json文件内容后，其他文件内容就好理解多了，同样的方法打开json文件查看其他标注文件内容。

使用接口

官网Dataset->Download中已经提供了COCO API地址以供下载使用该数据集的api接口，不过该版本windows环境下的兼容好像做的不行，所以找了另外一个win环境下的接口下载https://github.com/philferriere/cocoapi，该仓库对win的兼容做了一些小的修改，根据说明配置安装好pycocotools，主要步骤就是

下载该仓库压缩包文件
cd到PythonAPI文件夹，
运行一下命令，安装pycocotools即可

python setup.py build_ext install

也可以根据readme文件中指导安装。cd到git常用的文件夹，使用命令

$ pip install git+https://github.com/philferriere/cocoapi.git#subdirectory=PythonAPI

显示以下结果则安装成功。安装过程遇到问题可以参考一些大佬的解决办法https://blog.csdn.net/u010103202/article/details/87905029、https://www.jianshu.com/p/8658cda3d553

(dlwin36coco) Phil@SERVERP E:\repos
$ pip install git+https://github.com/philferriere/cocoapi.git#subdirectory=PythonAPI
Collecting git+https://github.com/philferriere/cocoapi.git#subdirectory=PythonAPI
  Cloning https://github.com/philferriere/cocoapi.git to c:\users\phil\appdata\local\temp\pip-req-build-jn698z8p
Building wheels for collected packages: pycocotools
  Running setup.py bdist_wheel for pycocotools ... done
  Stored in directory: C:\Users\Phil\AppData\Local\Temp\pip-ephem-wheel-cache-rde3oevt\wheels\69\2b\12\2fa959e49f73d26cff202c2f4e5079096c9c57c8a8509fd75c
Successfully built pycocotools
Installing collected packages: pycocotools
Successfully installed pycocotools-2.0

至此我们就对coco数据集内容与使用api的下载安装有了初步的了解，可以尝试在模型中使用coco数据集进行训练了，下篇博文链接中较详细得记录了coco api的使用方法。

【分类】【损失函数】处理类别不平衡：CEFL 和 CEFL2 损失函数的实现与应用丶2136 AI 分类人工智能损失函数
引言在深度学习中的分类问题中，类别不平衡问题是常见的挑战之一。尤其在面部表情分类任务中，不同表情类别的样本数量可能差异较大，比如“开心”表情的样本远远多于“生气”表情。面对这种情况，普通的交叉熵损失函数容易导致模型过拟合到大类样本，忽略少数类样本。为了有效解决类别不平衡问题，Class-balancedExponentialFocalLoss(CEFL)和Class-balancedExponen
水稻穗检测数据集VOC+YOLO格式6038张1类别 FL1623863129 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：6038标注数量(xml文件个数)：6038标注数量(txt文件个数)：6038标注类别数：1标注类别名称:["daosui"]每个类别标注的框数：daosui框数=117696总框数：117696使用标注工具：labe
【论文投稿】探秘计算机视觉算法：开启智能视觉新时代小周不想卷艾思科蓝学术会议投稿计算机视觉
目录引言一、计算机视觉算法基石：图像基础与预处理二、特征提取：视觉信息的精华萃取三、目标检测：从图像中精准定位目标四、图像分类：识别图像所属类别五、语义分割：理解图像的像素级语义六、计算机视觉算法前沿趋势与挑战引言在当今数字化浪潮中，计算机视觉宛如一颗璀璨的明珠，正深刻地改变着我们与世界的交互方式。从安防监控中的精准识别，到自动驾驶汽车的智能导航；从医疗影像的辅助诊断，到工业生产中的缺陷检测，计算
torch.utils.data.Dataset()和torch.utils.data.DataLoader() 我叫罗泽南深度学习 python
torch.utils.data.Dataset()和torch.utils.data.DataLoader()是Pytorch中处理数据集和批量加载数据的重要工具。下面将详细介绍它们的作用、用法，并通过一个简单的例子来演示如何使用它们。torch.utils.data.Dataset()Dataset是Pytorch数据加载的基类，用于表示一个数据集。用户可以继承Dataset类并实现其两个方法
交叉熵损失函数（Cross-Entropy Loss）我叫罗泽南深度学习人工智能
原理交叉熵损失函数是深度学习中分类问题常用的损失函数，特别适用于多分类问题。它通过度量预测分布与真实分布之间的差异，来衡量模型输出的准确性。交叉熵的数学公式交叉熵的定义如下：CrossEntroyLoss=−∑i=1Nyi⋅log(y^i)\begin{equation}CrossEntroyLoss=-\sum_{i=1}^{N}y_i\cdotlog(\hat{y}_i)\end{equati
AI大模型引领医疗变革：十大创新应用场景塑造智慧医疗新时代和老莫一起学AI 人工智能自动化数据库学习语言模型大模型
前言在人工智能技术的迅猛发展中，AI大模型以其无与伦比的数据处理能力和深度学习能力，正逐步成为医疗健康领域变革的引领者。本文旨在深入探讨AI大模型在医疗领域的十大创新应用场景，展示其如何显著提升医疗服务效率、赋能临床决策，并推动整个行业向智能化转型。一、智能化诊疗：精准辅助，提升诊断效率AI大模型凭借对海量医疗数据的深度分析，能够协助医生进行更为精准的诊断。例如，百度灵医大模型凭借强大的数据处理能
技术文档的精髓：规划布局、语言表达与更新维护重庆钢铁侠经验分享
本文将从技术文档的规划布局、语言表达以及更新与维护三个方面入手，探讨如何打造一份出色的技术文档，确保信息的系统性、连贯性以及时效性。一：技术文档的规划布局1.1确定文档的整体架构技术文档的规划布局是确保信息呈现系统性和连贯性的关键。首先，需要确定文档的整体架构，这包括章节设置和逻辑顺序。一个好的架构应该能够清晰地指导读者从入门到精通。章节设置：根据文档的目的和受众，合理设置章节。例如，对于深度学习
基于深度学习的推荐系统构建：Movielens 数据集 fresh的转码之路深度学习人工智能机器学习推荐算法
基于深度学习的推荐系统构建：Movielens数据集依赖环境代码语言：python3.11.5开发平台：pycharmtensorflow版本：2.18.0MovieLen1M数据及简介MovieLens1M数据集包含包含6000个用户在近4000部电影上的100万条评分，也包括电影元数据信息和用户属性信息。下载地址为：http://files.grouplens.org/datasets/mov
大数据是什么？用浅显的语言揭开神秘面纱 Echo_Wish 大数据大数据单例模式
大数据是什么？用浅显的语言揭开神秘面纱在我们生活的时代，“大数据”已经从一个技术术语，成为了街头巷尾时常听到的词汇。然而，究竟什么是大数据？它离我们有多远？我们该如何理解这个复杂又常用的概念？作为一名深耕大数据领域的创作者，我希望用通俗易懂的语言，结合生活实例和代码，为大家揭开大数据的神秘面纱。一、大数据的定义：比“大”更重要的是“复杂性”从广义上讲，大数据指的是无法通过传统手段高效处理的数据集合
基于Damo-YOLO和DyHead检测头的YOLOv8优化：多尺度目标检测的创新方案【YOLOv8】步入烟尘 YOLO系列创新涨点超专栏 YOLO 目标检测人工智能 YOLOv8
本专栏专为AI视觉领域的爱好者和从业者打造。涵盖分类、检测、分割、追踪等多项技术，带你从入门到精通！后续更有实战项目，助你轻松应对面试挑战！立即订阅，开启你的YOLOv8之旅！专栏订阅地址：https://blog.csdn.net/mrdeam/category_12804295.html文章目录基于Damo-YOLO和DyHead检测头的YOLOv8优化：多尺度目标检测的创新方案【YOLOv8
海外抖音技术深度解析：算法、AI与全球化的挑战神探阿航计算机产业科普与思考算法人工智能机器学习数据挖掘深度学习
引言2025年1月19日，在美国宣布暂停服务，这一事件引发了全球用户的广泛关注。作为全球最受欢迎的短视频平台之一，其成功离不开其强大的技术支撑，尤其是其个性化推荐算法和AI驱动的创作工具。然而，随着全球市场环境的变化，它面临的技术与运营挑战也日益凸显。本文将深入分析其技术核心、全球化运营中的挑战及其未来发展方向。核心：个性化推荐引擎其算法是其成功的关键，其核心在于个性化推荐引擎。该引擎采用深度学习
YOLOv8与Transformer：探索目标检测的新架构 AI架构设计之禅 AI大模型应用入门实战与进阶大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
YOLOv8与Transformer：探索目标检测的新架构关键词：目标检测，深度学习，YOLOv8，Transformer，计算机视觉，卷积神经网络摘要：目标检测是计算机视觉领域的一项重要任务，其目标是从图像或视频中识别和定位特定对象。近年来，YOLO（YouOnlyLookOnce）系列算法以其高精度和高速度成为目标检测领域的佼佼者。最新版本的YOLOv8引入了Transformer架构，进一步
图像生成大模型：Imagen 详解转角再相遇 imagen python 深度学习计算机视觉
近年来，图像生成技术取得了显著进展，推动了计算机视觉和生成对抗网络（GAN）等领域的发展。Imagen是一个新兴的图像生成大模型，其在生成高质量、逼真图像方面表现出色。本文将详细讲解Imagen的基本原理、架构、训练流程及应用场景。1.Imagen的基本原理1.1什么是Imagen？Imagen是一种基于深度学习的图像生成模型，结合了自注意力机制（Self-attentionMechanism）和
【MySQL】Mysql数据库导入导出sql文件、备份数据库、迁移数据库程序员洲洲数据库数据库 mysql 导入导出sql sql文件备份迁移
本文摘要：本文提出了xxx的实用开发小技巧。作者介绍：我是程序员洲洲，一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主。同时欢迎大家关注其他专栏，我将分享Web前后端开发、人工智能、机器学习、深度学习从0到1系列文章。同时洲洲已经建立了程序员技术交流群，如果您感兴趣，可以私信我加入我的社群，也可以直接vx联系（文末有名片）v：bdizztt随时
python中的读取文件的方法总结——路径念一不念二 python python 开发语言
在windows系统下的路径一般是“/”，在读取路径下的文件的时候，一般采用两种方式：read_csv(r"D:\dataset\data")read_csv("D:\\dataset\\data")在linux系统下的路径一般是“\”。（1）./data#对本目录下的数据集进行导入如果数据集data放在和.py文件下，可以使用.py文件对如下路径进行导入a=pd.read_csv("./cora
实战千问2大模型第五天——VLLM 运行 Qwen2-VL-7B（多模态）学术菜鸟小晨千问多模型 qwen2 vl
一、简介VLLM是一种高效的深度学习推理库，通过PagedAttention算法有效管理大语言模型的注意力内存，其特点包括24倍的吞吐提升和3.5倍的TGI性能，无需修改模型结构，专门设计用于加速大规模语言模型（LLM）的推理过程。它通过优化显存管理、支持大模型的批处理推理以及减少不必要的内存占用，来提高多GPU环境下的推理速度和效率。VLLM的核心特点包括：显存高效性：VLLM能够动态管理显存，
qwenvl 代码中的attention pool 注意力池如何理解，attention pool注意力池是什么？ OpenSani AI 大模型计算机视觉语言模型 qwenvl LLM
qwenvl中的attentionpool如何理解，其实这就是一个概念的问题看qwenvl的huggingface的代码的时候，发现代码里有一个Resampler以及attn_pool，这和之前理解的连接池线程池表示资源复用的意思不太一样，查了一下：注意这里的pool和线程池连接池里面的pool不一样:深度学习中的池化：池化在深度学习中主要指通过滑动窗口对特征图进行下采样，提取最重要的特征，减少计
计算机视觉与深度学习：使用深度学习训练基于视觉的车辆检测器（MATLAB源码-Faster R-CNN） ZhShy23 javascript 深度学习
在人工智能领域，计算机视觉是一个重要且充满活力的研究方向。它使计算机能够理解和分析图像和视频数据，从而做出有意义的决策。其中，目标检测是计算机视觉中的一项关键技术，它旨在识别并定位图像中的多个目标对象。车辆检测作为目标检测的一个重要应用，在自动驾驶、智能交通系统等领域有着广泛的应用前景。本文将介绍如何使用MATLAB和深度学习技术，特别是FasterR-CNN模型，来训练一个车辆检测器。文章目录一
GAN在图像增强中的应用实战指南码字仙子
本文还有配套的精品资源，点击获取简介：图像增强技术通过算法改善图像质量，GAN作为一种生成对抗网络，在此领域具有重要应用。通过生成器和判别器的对抗性训练，GAN可以生成逼真图像、修复低质量图像、扩增数据集并进行风格迁移。本项目将介绍如何使用Python及其相关库实现GAN图像增强，包括模型的构建、训练和评估。通过项目案例学习，你可以掌握GAN在图像增强中的实际应用，提高图像处理和深度学习的技能。1
DNA图谱分析：自动分析DNA图谱中的变异YOLOv5、YOLOv8、YOLOv10 2025年数学建模美赛 YOLO 深度学习目标跟踪机器人人工智能
目录引言项目背景与目标YOLO模型简介DNA图谱数据集准备YOLOv5、YOLOv8和YOLOv10模型训练与优化DNA图谱变异检测的实现UI界面设计与实现评估与优化未来展望结论完整代码实现1.引言随着基因组学的进步，DNA图谱分析已经成为基因检测、疾病诊断、遗传学研究等领域的重要工具。在DNA图谱中，通常会呈现出染色体的多个片段，其中的一些变异可能对健康产生深远的影响。手工分析DNA图谱变异不仅
【Python】已解决：WARNING: pip is configured with locations that require TLS/SSL, however the ssl module i 屿小夏 python pip ssl
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
深度学习模型推理速度/吞吐量计算(附代码） Scabbards_ 1500深度学习笔记深度学习人工智能
参考博文：https://mp.weixin.qq.com/s?__biz=MzI4MDYzNzg4Mw==&mid=2247546551&idx=2&sn=f198b6365e11f0a18832ff1203302632&chksm=ebb70e63dcc0877569d1838b2391744be628bf6cbb6e203a49f855e0769ecbbbf5a9929fe2db&scene
PyTorch使用教程- Tensor包 Loving_enjoy 论文 pytorch 人工智能
###PyTorch使用教程-Tensor包PyTorch是一个流行的深度学习框架，它提供了一个易于使用的API来创建和操作张量（Tensors）。张量是一个多维数组，类似于NumPy中的ndarray，但它是基于GPU的，支持自动求导。本文将详细介绍PyTorch中的Tensor包，包括张量的创建、运算、形状变换、索引与切片、以及重要的张量处理方式。####一、张量的创建在PyTorch中，可以
ChatGPT详解 Loving_enjoy 实用技巧人工智能自然语言处理
ChatGPT是一款由OpenAI研发和维护的先进的自然语言处理模型（NLP），全名为ChatGenerativePre-trainedTransformer，于2022年11月30日发布。以下是对ChatGPT的详细介绍：###一、技术架构与原理1.**技术架构**：ChatGPT建立在Transformer架构之上，这是一种深度学习模型，特别适用于处理自然语言。其核心是自注意力机制，允许模型在
Apache SeaTunnel 荣登 2024 年度中间件开源项目 Top 50 榜单 SeaTunnel 大数据
近日，ApacheSeaTunnel项目成功入选2024年度中间件开源项目Top50榜单。该榜单由OpenGithub技术社区评选，旨在表彰在中间件领域具有突出表现的开源项目。榜单链接：https://zhuanlan.zhihu.com/p/16116358605关于ApacheSeaTunnelApacheSeaTunnel是一个云原生的高性能海量数据集成工具。北京时间2023年6月1日，全球
YOLOv10改进，YOLOv10检测头融合RepConv卷积，添加小目标检测层（四头检测）+CA注意机制，全网首发挂科边缘 YOLOv10改进 YOLO 目标检测人工智能计算机视觉
摘要作者提出了一种简单而强大的卷积神经网络架构，其推理阶段采用与VGG类似的网络体结构，仅由一堆3x3卷积和ReLU组成，而训练阶段的模型具有多分支拓扑。这种训练阶段和推理阶段架构的解耦通过结构重参数化技术实现，因此我们将该模型命名为RepVGG。#理论介绍RepConv通过将多个卷积操作合并成一个卷积操作来优化计算的。首先在训练过程中使用多种操作（如多个卷积层、跳跃连接等）来提高模型的表达能力和
用TensorFlow.NET搭建一个全连接神经网络 chiyong7717 人工智能 c#python
在本文中，我们将学习如何在C＃中构建神经网络模型计算图。与线性分类器相比，神经网络的关键优势在于它可以分离不可线性分离的数据。我们将实现此模型来对MNIST数据集的手写数字图像进行分类。我们要构建的神经网络的结构如下。MNIST数据的手写数字图像有10个类（从0到9）。该网络具有2个隐藏层：第一层具有200个隐藏单元（神经元），第二层具有10个神经元（称为分类器层）。让我们一步一步地用代码来实现：
YOLOv11改进，YOLOv11检测头融合RepConv卷积，并添加小目标检测层（四头检测），适合目标检测、分割等任务挂科边缘 YOLOv8改进 YOLO 目标检测人工智能计算机视觉
摘要作者提出了一种简单而强大的卷积神经网络架构，其推理阶段采用与VGG类似的网络体结构，仅由一堆3x3卷积和ReLU组成，而训练阶段的模型具有多分支拓扑。这种训练阶段和推理阶段架构的解耦通过结构重参数化技术实现，因此我们将该模型命名为RepVGG。#理论介绍RepConv通过将多个卷积操作合并成一个卷积操作来优化计算的。首先在训练过程中使用多种操作（如多个卷积层、跳跃连接等）来提高模型的表达能力和
机器视觉算法与边缘计算：打造移动终端上的智能“慧眼” matlab_python22 计算机视觉
机器视觉算法与边缘计算：打造移动终端上的智能“慧眼”边缘计算的背景数据量激增与实时性需求：随着物联网的快速发展，大量智能设备接入网络，产生的数据量呈爆发式增长。传统云计算模式在处理这些海量实时数据时，面临延迟高、带宽压力大等问题，无法满足如自动驾驶、远程医疗等对实时性要求极高的应用场景的需求。云计算的局限性：云计算虽然提供了强大的计算和存储能力，但在数据传输过程中存在时间延迟，且数据集中存储在云端
Java 8 新特性 Stream javastream
什么是Stream？Stream（流）是一个来自数据源的元素队列并支持聚合操作元素队列数据是以一系列元素的形式存在的，按照某种顺序排列，形成一个队列。在流的概念中，这些元素通常是连续到达的，可以逐个处理，而不必一次性加载整个数据集到内存中。数据源流的来源。可以是集合，数组，I/Ochannel，产生器generator等。聚合操作对一系列元素执行计算以生成单个汇总值的过程。例如，计算流中所有元素的
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb