取个名字真难呐

读书笔记-计算机视觉

文章目录

1. 图像增广
2. 微调
3. 目标检测和边界框
- 3.1 锚框坐标转换
4. 锚框
- 4.1 锚框
- 4.2 交并比
- 4.3 将最接近的真实边界框分配给锚框
- 4.4 锚框偏移量归一化
- 4.5 使用真实边界框标记锚框
- 4.6 极大值抑制预测边界框
5. 多尺度目标检测
- 5.1 多尺度锚框
- 5.2 多尺度检测
6. 目标检测数据集
- 6.1 数据集预处理思路
- 6.2 源码
- 6.3 结果

1. 图像增广

代码

# -*- coding: utf-8 -*-
# @Project: zc
# @Author: zc
# @File name: Image Augmentation
# @Create time: 2021/12/15 19:16

# 1.导入数据库
import matplotlib.pyplot as plt
import torch
import torchvision
from torch import nn
from d2l import torch as d2l

# 2. 从官网上下载 CIFAR10 的训练数据集
all_images = torchvision.datasets.CIFAR10(train=True, root="../data",
										  download=True)
# 3. 显示 CIFAR10 前32个数据集
d2l.show_images([all_images[i][0] for i in range(32)], 4, 8, scale=0.8)

# 4.训练集数据增强的方式，用 Compose 进行组合
train_augs = torchvision.transforms.Compose([
	torchvision.transforms.RandomHorizontalFlip(),
	torchvision.transforms.ToTensor()])

# 5. 我们不需要对测试集进行数据增强，只需要转换成张量即可
test_augs = torchvision.transforms.Compose([
	torchvision.transforms.ToTensor()])


# 6. 下载 CIFAR10 并将数据转换成 DataLoader
def load_cifar10(is_train, augs, batch_size):
	dataset = torchvision.datasets.CIFAR10(root="../data", train=is_train,
										   transform=augs, download=True)
	dataloader = torch.utils.data.DataLoader(dataset, batch_size=batch_size,
											 shuffle=is_train, num_workers=d2l.get_dataloader_workers())
	return dataloader


# 7.用多 GPU 进行小批量训练
def train_batch_ch13(net, X, y, loss, trainer, devices):
	"""
	:param net: 定义的神经网络
	:param X: 实际的特征 features
	:param y: 实际的标签 label
	:param loss: 损失
	:param trainer: 优化器
	:param devices: 在 GPU 或者 CPU 上训练
	:return: train_loss_sum：训练损失总和；train_acc_sum：训练精度总和
	"""
	"""用多GPU进行小批量训练"""
	if isinstance(X, list):
		# 微调BERT中所需（稍后讨论），在 BERT 中是通过前面几个样本预测后面的字符，所以X输入为列表
		X = [x.to(devices[0]) for x in X]
	else:
		X = X.to(devices[0])  # 如果 X 是单个的值，就直接喂到 GPU 上
	y = y.to(devices[0])  # 将标签 Y 喂到 GPU 上
	net.train()  # 神经网络训练模式，nn.batch_Norm 和 nn.Dropout 不启用
	trainer.zero_grad()  # 将优化器的梯度清零
	pred = net(X)  # 特征 X 通过神经网络得到 pred 预测
	l = loss(pred, y)  # 计算预测 pred 和真实标签 y 之间的差值作为损失值
	l.sum().backward()  # 将损失求和成标量后回传求梯度
	trainer.step()  # 优化器更新权重
	train_loss_sum = l.sum()  # 计算训练损失总和
	train_acc_sum = d2l.accuracy(pred, y)  # 计算训练精度总和
	return train_loss_sum, train_acc_sum  # 返回 训练损失总和，训练精度总和


# 8.用多GPU进行模型训练
def train_ch13(net, train_iter, test_iter, loss, trainer, num_epochs,
			   devices=d2l.try_all_gpus()):
	"""

	:param net:        定义神经网络
	:param train_iter: 定义训练集迭代器
	:param test_iter:  定义测试机迭代器
	:param loss:       定义损失函数，评判预测值和实际值的偏差
	:param trainer:    定义优化器
	:param num_epochs: 定义训练几轮
	:param devices:    定义是在 GPU 还是 CPU 上进行
	:return:
	"""

	timer, num_batches = d2l.Timer(), len(train_iter)  # 定义计时器和批量大小
	animator = d2l.Animator(xlabel='epoch', xlim=[1, num_epochs], ylim=[0, 1],  # 做动画
							legend=['train loss', 'train acc', 'test acc'])
	net = nn.DataParallel(net, device_ids=devices).to(devices[0])  # 定义网络并行
	for epoch in range(num_epochs):  # 开始训练
		# 4个维度：储存训练损失，训练准确度，实例数，特点数
		metric = d2l.Accumulator(4)  # 定义累加器
		for i, (features, labels) in enumerate(train_iter):  # 逐个枚举训练迭代器的(特征，标签)
			timer.start()  # 开始计时
			l, acc = train_batch_ch13(  # 用多 GPU 进行小批量训练
				net, features, labels, loss, trainer, devices)
			metric.add(l, acc, labels.shape[0], labels.numel())  # 动态图增加点
			timer.stop()  # 计时结束
			if (i + 1) % (num_batches // 5) == 0 or i == num_batches - 1:
				animator.add(epoch + (i + 1) / num_batches,
							 (metric[0] / metric[2], metric[1] / metric[3],
							  None))
		test_acc = d2l.evaluate_accuracy_gpu(net, test_iter)  # 将预测值和测试集数据比较计算精度
		animator.add(epoch + 1, (None, None, test_acc))
	print(f'loss {metric[0] / metric[2]:.3f}, train acc '
		  f'{metric[1] / metric[3]:.3f}, test acc {test_acc:.3f}')
	print(f'{metric[2] * num_epochs / timer.sum():.1f} examples/sec on '
		  f'{str(devices)}')


# 9. 定义批量大小，GPU ,神经网络 net=resnet18
batch_size, devices, net = 256, d2l.try_all_gpus(), d2l.resnet18(10, 3)


# 10. 初始化权重，用 xavier 初始化，便于训练
def init_weights(m):
	if type(m) in [nn.Linear, nn.Conv2d]:
		nn.init.xavier_uniform_(m.weight)


# 11. 网络权重初始化
net.apply(init_weights)


# 12. 定义函数，功能是训练网络，运用数据增广 train_augs,test_augs
def train_with_data_aug(train_augs, test_augs, net, lr=0.001):
	"""

	:param train_augs:  训练集的在线数据增广
	:param test_augs:   测试集图像直接转张量，不做
	:param net: 定义神经网络
	:param lr:  设置学习率
	:return:
	"""
	train_iter = load_cifar10(True, train_augs, batch_size)  # 下载cifar10的训练集,转换成 dataloader
	test_iter = load_cifar10(False, test_augs, batch_size)  # 下载cifar10的测试集,转换成 dataloader
	loss = nn.CrossEntropyLoss(reduction="none")  # 定义损失为交叉熵损失
	trainer = torch.optim.Adam(net.parameters(), lr=lr)  # 定义优化器 Adam ，此优化器对学习率不敏感，方便训练
	train_ch13(net, train_iter, test_iter, loss, trainer, 10, devices)  # 用多GPU进行模型训练


# 13.调用函数，开始训练神经网络
train_with_data_aug(train_augs, test_augs, net)

# 14. 显示结果
plt.show()

结果

loss 0.168, train acc 0.942, test acc 0.845
826.6 examples/sec on [device(type='cuda', index=0)]

2. 微调

微调思路
代码

import matplotli.pylot as plt
import os
import torch
import torchvision
from torch import nn
from d2l import torch as d2l

d2l.DATA_HUB['hotdog'] = (d2l.DATA_URL + 'hotdog.zip',
	'fba480ffa8aa7e0febbb511d181409f899b9baa5')
data_dir = d2l.download_extract('hotdog')

train_imgs = torchvision.datasets.ImageFolder(os.path.join(data_dir,'train'))
test_imgs = torchvision.datasets.ImageFlolder(os.path.join(data_dir,'test'))

normalize = torchvision.transforms.Normalize(
[0.485,0.456,0.406],[0.229,0.224,0.225])

train_augs= torchvision.transforms.Compose([
	torchvision.transforms.RandomResizedCrop(224),
	torchvision.transforms.RandomHorizontalFlip(),
	torchvision.transforms.ToTensor(),
	normalize])

test_augs = torchvision.transforms.Compose([
	torchvision.transforms.Resize(256),
	torchvision.transforms.CenterCrop(224),
	torchvision.transforms.ToTensor(),
	normalize])


pretrained_net = torchvision.models.resnet18(pretrained=True)

# finetune_net = 特征层 + 输出层 fc(全连接层=in_features,out_features)


# 步骤1 ：将预训练模型中的特征层下载，给一个小的学习率
# 步骤2 ：将最后一个全连接层切割掉
# 步骤3 ：将最后一个全连接层嫁接到新的全连接层，输出为新的类型数
# 步骤4 ：将最后一个全连接层的权重和偏移进行初始化
finetune_net = torchvision.models.resnet18(pretrained=True)
finetune_net.fc = nn.Linear(finetune_net.fc.in_features,2)
nn.init.xavier_uniform_(finetune_net.fc.weight)


# net: 神经网络
# learning_rate：学习率
# batch_size：批量大小
# num_epochs: 整个训练集迭代次数
# param_group：判断是否为最后一个全连接层
def train_fine_tuning(net,learning_rate,batch_size=128,num_epochs=5,
		     param_group=True):
	# 训练迭代器，数据增广train_augs,随机打乱训练集
	train_iter = torch.utils.data.DataLoader(torchvision.datasets.ImageFolder(
		os.path.join(data_dir,'train'),transforms=train_augs),
		batch_size=batch_size,shuffle=True)
	# 测试迭代器，数据增广train_augs,
	test_iter = torch.utils.data.DataLoader(torchvision.datasets.ImageFolder(
		os.path.join(data_dir,'test'),transforms=test_augs),
		batch_size=batch_size)
	# 训练 GPU 或 CPU
	devices = d2l.try_all_gpus()
	# 损失为交叉熵损失，reduction="none"
	loss= nn.CrossEntropyLoss(reduction="none")
	# 判断参数是不是最后一个全连接层，如果param_group=True,就用10倍学习率，
	# 其他为指定学习率 learning_rate,并权重衰减 weight_decay=0.01
	if param_group:
		params_1x = [param for name,param in net.named_parameters()
			if name not in ["fc.weight","fc.bias"]]
		trainer = torch.optim.SGD([{'params':params_1x},
					   {'params':net.fc.parameters(),
					    'lr': learning_rate*10}],
					lr=learning_rate,weight_decay=0.01)
	else:
		trainer = torch.optiom.SGD(net.parameters(),lr=learning_rate,
					   weight_decay=0.001)
	# 开始训练
	d2l.train_ch13(net,train_iter,test_iter,loss,trainer,num_epochs,device)


# 指定神经网络 net=finetune_net,学习率 learning 
train_fine_tuning(finetune_net,5e-5)

3. 目标检测和边界框

3.1 锚框坐标转换

如图所示
方法1：已知两个角的坐标(x1,y1),(x2,y2),来求得中心点坐标(cx,cy)，高h,宽w:
$c_x =(x_1+x_2)/2$
$c_y = (y_1+y_2)/2$
$w = x_2-x_1$
$h=y_2-y_1$
方法2：已知中心点坐标(cx,cy),高h,宽w，来求得两个角的坐标(x1,y1),(x2,y2)；
$x_1 = c_x-w/2$
$x_2 = c_x +w/2$
$y_1 = c_y-h/2$
$y_2 = c_y+h/2$
代码如下：

# 1.导入相关数据数据库
import torch
import torchvision
from d2l import torch as d2l
import matplotlib.pyplot as plt


# 2.中心坐标 -> 边缘坐标
def box_corner_to_center(boxes):
	"""Convert from (upper-left, lower-right) to (center, width, height)."""
	x1, y1, x2, y2 = boxes[:, 0], boxes[:, 1], boxes[:, 2], boxes[:, 3]
	cx = (x1 + x2) / 2
	cy = (y1 + y2) / 2
	w = x2 - x1
	h = y2 - y1
	boxes = torch.stack((cx, cy, w, h), axis=-1) # 堆叠在一起
	return boxes


# 3.边缘坐标 -> 中心坐标
def box_center_to_corner(boxes):
	"""Convert from (center, width, height) to (upper-left, lower-right)."""
	cx, cy, w, h = boxes[:, 0], boxes[:, 1], boxes[:, 2], boxes[:, 3]
	x1 = cx - 0.5 * w
	y1 = cy - 0.5 * h
	x2 = cx + 0.5 * w
	y2 = cy + 0.5 * h
	boxes = torch.stack((x1, y1, x2, y2), axis=-1) # 堆叠在一起
	return boxes

4. 锚框

4.1 锚框

生成成以每个像素为中⼼具有不同形状的锚框
代码

# 1.导入相关数据库
import matplotlib.pyplot as plt
import torch
from d2l import torch as d2l



# 2.生成以每个像素为中心具有不同形状的锚框
# in_height:高；in_width:宽
# size:缩放比;ratios：宽高比
# 一般组合为:
# 定义一个大小S_1，遍历所有的ratios；
# 定义一个宽高比ratios,遍历所有的缩放比例s
# 所有的组合一共为 num_sizes+num_ratios-1
# data:输入的图像
# size:缩放比例
# ratios: 宽高比


def multibox_prior(data,size,ratios):
	# 获取图片的高,宽
	in_height,in_width = data.shape[-2:]
	# 获取设备CPU或GPU,缩放比size张量集,宽高比ratio张量集大小
	device,num_sizes,num_ratios = data.device,len(sizes),len(ratios)
	# 得到所有的组合 s+r-1
	boxes_per_pixel = (num_sizes+num_ratios-1)
	# 将列表转换成张量
	size_tensor = torch.tensor(size,device=device)
	ratio_tensor = torch.tensor(ratios,device=device)

	# 因为每个像素的高，宽各为 1
	offset_h,offset_w = 0.5,0.5
	setps_h = 1.0 /in_height	# 在 y 轴上缩放步长
	setps_w = 1.0 /in_width		# 在 x 轴上缩放步长
	
	# 生成锚框的所有中心点
	# 将每个像素的值加上0.5后除以总长得到中心缩放后的点坐标
	# 公式:(in_height+offset_h)/steps_h
	
	center_h = (torch.arange(in_height,device=device)+offset_h)*steps_h
	center_w = (torch.arange(in_width,device=device)+offset_w)*steps_w
	
	# 根据中心点获取网格，并将张量变成一串
	shift_y,shift_x = torch.meshgrid(center_h,center_w)
	shift_y,shift_x = shift_y.reshape(-1),shift_x.reshape(-1)

	# 生成"boxes_per_pixel"个高和宽
	# 之后用于创建锚框的四角坐标(xmin,xmax,ymin,ymax)
	w = torch.cat((size_tensor*torch.sqrt(ratio_tensor[0]),
		       size[0]*torch.sqrt(ratio_tensor[1:])))\
		       *in_height / in_width
	h = torch.cat((size_tensor / torch.sqrt(ratio_tensor[0]),
		       sizes[0]/torch.sqrt(ratio_tensor[1:])))
	
	# 除以2来获得半高和半宽
	anchor_manipulations = torch.stack((-w,-h,w,h).T.repeat(
					    in_heigth*in_width,1)/2)

	# 每个中心点都将有"boxes_per_pixel"个锚框
	# 所以生成含所有锚框中心的网络，重复了"boxes_per_pixel"次
	# unsqueeze(0)在第0中插入一个新的维度
	# repeat_interleave 重复函数
	out_grid = torch.stack([shift_x,shift_y,shift_x,shift_y],
		    dim=1).repeat_interleave(boxes_per_pixel,dim=0)
	output = out_grid + anchor_manipulations
	return output.unsqueeze(0)

4.2 交并比

定义
交并比指的是一个两个框 box1,box2 之间的交集和并集的比值
图形
代码

# 1.导入相关库
import torch
from d2l import torch as d2l


# 2. 定义计算交并比

def box_iou(boxes1, boxes2):
	"""
	function: 计算两个锚框或边缘框列表中成对的交并比
	:param box1: (x1,x2,y1,y2);左上坐标(x1,y1);右下坐标(x2,y2)
	:param box2: (x1,x2,y1,y2);左上坐标(x1,y1);右下坐标(x2,y2)
	:return:交并比
	"""
	# box_area = (x2-x1)*(y2-y1)
	box_area = lambda boxes: ((boxes[:, 2] - boxes[:, 0]) *
							  (boxes[:, 3] - boxes[:, 1]))
	# boxes1,boxes2,areas1,areas2的形状:
	# boxes1：(boxes1的数量,4),[x1,y1,x2,y2]
	# boxes2：(boxes2的数量,4),[x1,y1,x2,y2]
	# areas1：(boxes1的数量,), [area1,]
	# areas2：(boxes2的数量,)[area2,]
	areas1 = box_area(box1)
	areas2 = box_area(box2)
	# boxes1[:,None,:2] 取前面两个坐标值;boxes2[:,:2]：取坐标的后两个
	# 计算交集的inter_upperlefts左上点，inter_lowerrights右下点
	# 张量中用 None 可以对张量新增一个维度，这里是在第 1 维增加
	inter_upperlefts = torch.max(boxes1[:, None, :2], boxes2[:, :2])
	inter_lowerrights = torch.min(boxes1[:, None, 2:], boxes2[:, 2:])
	# inters：差值取正 如果值小于0，则元素值为0
	inters = (inter_lowerrights - inter_upperlefts).clamp(min=0)
	# 计算交集的面积
	inter_areas = inters[:, :, 0] * inters[:, :, 1]
	# 计算并集 并集 = 面积1 + 面积2 - 交集
	union_areas = areas1[:, None] + areas2 - inter_areas
	# 返回交并比
	return inter_areas / union_areas

4.3 将最接近的真实边界框分配给锚框

在目标检测中，我们需要将每个锚框看作成一个训练样本，我们随机生成锚框，锚框包含类别和偏移量。这样我们就可以通过偏移量，将数据集中的真实的边界框通过偏移量分配给锚框，注意这里是将最接近的真实边界框分配给锚框，注意分配的方向。

原理
让我们⽤⼀个具体的例⼦来说明上述算法。如图13.4.2（左）所⽰，假设矩阵X中的最⼤值为x23，我们将真实边界框B3分配给锚框A2。然后，我们丢弃矩阵第2⾏和第3列中的所有元素，在剩余元素（阴影区域）中找到最⼤的x71，然后将真实边界框B1分配给锚框A7。接下来，如图13.4.2（中）所⽰，丢弃矩阵第7⾏和第1列中的所有元素，在剩余元素（阴影区域）中找到最⼤的x54，然后将真实边界框B4分配给锚框A5。最后，如图13.4.2（右）所⽰，丢弃矩阵第5⾏和第4列中的所有元素，在剩余元素（阴影区域）中找到最⼤的x92，然后将真实边界框B2分配给锚框A9。之后，我们只需要遍历剩余的锚框A1, A3, A4, A6, A8，然后根据阈值确定是否为它们分配真实边界框。
思路
代码

def assign_anchor_to_bbox(ground_truth, anchors, device, iou_threshould=0.5):
	"""
	function : 将最接近的真实边界框分配给锚框
	:param ground_truth: 人工标注的边界框
	:param anchors: 随机生成的锚框
	:param device: GPU 或 CPU
	:param iou_threshould: 交并比设置，如果大于此值通过
	:return: anchors_bbox_map
	"""
	# 获得锚框的数量和真实标签框的数量
	num_anchors, num_gt_boxes = anchors.shape[0], ground_truth.shape[0]
	# 计算随机锚框与真实标签框的交并比
	# 位于第 i 行和第 j 列的元素 x_ij 是锚框 i 和 真实边界框 j 的 IoU
	jaccard = box_iou(anchors, ground_truth)
	# 对于每个锚框，分配的真实边界框的张量，我们先用 -1 填充
	anchors_bbox_map = torch.full((num_anchors,), -1, dtype=torch.long,
								  device=device)
	# 根据阈值，决定是否分配真实边界框，获得最大的 jaccard 的锚框
	# max_ious ：最大的交并比值；indices ：该行最大交并比值对应的序号
	max_ious, indices = torch.max(jaccard, dim=1)
	# 找到 max_ious 中 大于0.5 的锚框，获得索引值，变成行向量；
	# 两两一对[行数a，索引a,...行数j，索引j,]
	# anc_i 存储索引值
	anc_i = torch.nonzero(max_ious >= 0.5).reshape(-1)
	# box_j 存储对应索引值
	box_j = indices[max_ious >= 0.5]
	# 得到映射
	anchors_bbox_map[anc_i] = box_j
	# 列 cols 表示锚框数
	col_discard = torch.full((num_anchors,), -1)
	# 行 rows 表示真实边框数
	row_discard = torch.full((num_gt_boxes,), -1)
	for _ in range(num_gt_boxes):
		# 开始计算得到最大jaccard
		max_idx = torch.argmax(jaccard)
		box_idx = (max_idx % num_gt_boxes).long()
		anc_idx = (max_idx / num_gt_boxes).long()
		# 根据锚框来找到边框
		anchors_bbox_map[anc_idx] = box_idx
		# 将列丢掉
		jaccard[:, box_idx] = col_discard
		# 将行丢掉
		jaccard[anc_idx, :] = row_discard
	return anchors_bbox_map

4.4 锚框偏移量归一化

当我们得到了锚框时，获得了锚框的类别和偏移量，锚框A的偏移量将根据B和A中心坐标的相对位置以及这两个框的相对大小进行标记。我们定义框A和B，中心坐标分别为
$A:(x_a,y_a,w_a,h_a);B:(x_b,y_b,w_b,h_b)$

我们将 A 相对于B的偏移量标记为：
$(\frac{\frac{x_b-x_a}{w_a}-\mu_x}{\sigma_x},\frac{\frac{y_b-y_a}{h_a}-\mu_y}{\sigma_y},\frac{\log\frac{w_b}{w_a}-\mu_w}{\sigma_w},\frac{\log\frac{h_b}{h_a}-\mu_h}{\sigma_h})$
代码

import torch
from d2l import torch as d2l


def offset_box(anchors, asigned_bb, eps=le - 6):
	"""
	function:对锚框偏移量进行转换
	:param anchors: 锚框
	:param asigned_bb:被分配的边框
	:param eps: 防止除零
	:return: 防止偏移
	"""
	# 将锚框变成(x_1,x_2,w_1,h_1)
	c_anc = d2l.box_corner_to_center(anchors)
	# 将边缘框变成(x_1,x_2,w_1,h_1)
	c_asigned_bb = d2l.box_corner_to_center(asigned_bb)
	# 坐标,高宽归一化
	offset_xy = 10 * (c_asigned_bb[:, :2] - c_anc[:, :2]) / c_anc[:, 2:]
	offset_wh = 5 * torch.log(eps + c_asigned_bb[:, 2:] / c_anc[:, 2:])
	# 将(坐标，高宽)拼接
	offset = torch.cat([offset_xy, offset_wh], axis=1)
	return offset

4.5 使用真实边界框标记锚框

类别数：[用户指定的类别 + 1];1表示的背景类，如果没有识别就为背景类
代码

def multibox_target(anchors, labels):
	"""
	function : 使用真实边界框标记锚框
	:param anchors: 锚框; [batch_size,x_1,y_1,x_2,y_2]
	:param labels: 标签 [batch_size,labels,x_1,y_1,x_2,y_2]
	:return:bbox_offset[边缘框的偏移], bbox_mask[边缘框的掩码], class_labels[标签类别]
	"""
	# 定义批量大小和锚框，
	# anchors.squeeze 表示：如果第 0 维大小为 1 ，则移除
	batch_size, anchors = labels.shape[0], anchors.squeeze(0)
	# 创建变量列表
	batch_offset, batch_mask, batch_class_labels = [], [], []
	# device = GPU,设置锚框大小
	device, num_anchors = anchors.device, anchors.shape[0]
	for i in range(batch_size):
		# 获取第 i 个 批量的标签 labels
		label = labels[i, :, :]
		# 将最接近的真实边界框分配给锚框
		anchors_bbox_map = assign_anchor_to_bbox(label[:, 1:], anchors, device)
		# 获得真实边缘框的掩码mask ，如果 anchors_bbox_map >=0 则为1，否则为 0
		bbox_mask = ((anchors_bbox_map >= 0).float().unsqueeze(-1)).repeat(1, 4)
		# 将类标签和分配的边界框坐标初始化为零
		class_labels = torch.zeros(num_anchors, dtype=torch.long, device=device)
		assigned_bb = torch.zeros((num_anchors, 4), dtype=torch.float32, device=device)
		# 使用真实边界框来标记锚框的类别
		# 如果一个锚框没有被分配，我们标签机其为背景(值为零)
		indices_true = torch.nonzero(anchors_bbox_map >= 0)
		bb_idx = anchors_bbox_map[indices_true]
		class_labels[indices_true] = label[bb_idx, 0].long() + 1
		assigned_bb[indices_true] = label[bb_idx, 1:]
		# 偏移量转换
		offset = offset_boxes(anchors, assigned_bb) * bbox_mask
		batch_offset.append(offset.reshape(-1))
		batch_mask.append(bbox_mask.reshape(-1))
		batch_class_labels.append(class_labels)
	bbox_offset = torch.stack(batch_offset)
	bbox_mask = torch.stack(batch_mask)
	class_labels = torch.stack(batch_class_labels)
	return (bbox_offset, bbox_mask, class_labels)

4.6 极大值抑制预测边界框

非极大值抑制(non_maximum suppression,NMS)的出现是为了解决在预测中，如果我们对于同样一个目标进行多次预测时，我们需要将多个预测的目标进行求最大的那个目标，这样我们就需要使用非机制抑制.这种技术在目标检测中经常用到。

offset_inverse
根据带有预测偏移量的锚框来预测边界框

def offset_inverse(anchors, offset_preds):
	"""
	function: 根据带有预测偏移量的锚框来预测边界框
	锚框 + 预测偏移量  ->预测-> 预测边界框
	我们有一堆的锚框，我们需要通过跟标注的边缘框的距离来预测
	这些锚框属于那个类别的锚框
	:param anchors: 锚框 [x_1,y_1,x_2,y_2]
	:param offset_preds: 预测偏移量;[x,y,w,h]
	:return: 预测的边界框
	"""
	# [x_1,y_1,x_2,y_2] --> anc = [x,y,w,h]
	anc = d2l.box_corner_to_center(anchors)
	# 没弄明白为什么要这么做
	pred_bbox_xy = (offset_preds[:, :2] * anc[:, 2:] / 10) + anc[:, :2]
	pred_bbox_wh = torch.exp(offset_preds[:, 2:] / 5) * anc[:, 2:]
	# pred_bbox [x,y,w,h]
	pred_bbox = torch.cat((pred_bbox_xy, pred_bbox_wh), axis=1)
	predicted_bbox = d2l.box_center_to_corner(pred_bbox)
	return predicted_bbox

nms
具体流程如下：

def nms(boxes, scores, iou_threshould):
	"""
	function : 对预测边界框的置信度进行排序
	:param boxes: 预测边界框
	:param scores: 置信度
	:param iou_threshould: 设置丢弃的交并比值
	:return: 保留预测边界框的指标
	"""
	# 对置信度进行降序排序，B 表示降序后的索引值
	B = torch.argsort(scores, dim=-1, descending=True)
	# 设置保留的列表,保留预测边界框的指标
	keep = []
	while B.numel() > 0:
		i = B[0] # 将列表中最大置信度作为B0基准
		keep.append(i)
		if B.numel() == 1: break
		iou = box_iou(boxes[i, :].reshape(-1, 4), # 将B0与其他的锚框进行交并比 IoU
					  boxes[B[1:], :].reshape(-1, 4)).reshape(-1)
		# torch.nonzero 返回的不为零的值所在的索引位置
		inds = torch.nonzero(iou <= iou_threshould).reshape(-1)
		B = B[inds + 1]
	return torch.tensor(keep, device=boxes.device)

multibox_detection

def multibox_detection(cls_probs, offset_preds, anchors, nms_threshould=0.5,
					   pos_threshould=0.009999999):
	"""
	function: 使用非极大值抑制来预测边界框
	:param cls_probs:类别的概率大小[batch_size,num_classes,num_anchors]
	:param offset_preds:偏移预测值
	:param anchors:锚框 [batch_size,x1,y1,x2,y2]
	:param nms_threshould: nms的丢弃交并比
	:param pos_threshould:
	:return:[batch_size,num_anchors,class,Confidence_interval,x1,y1,x2,y2]
	"""
	device, batch_size = cls_probs.device, cls_probs.shape[0]
	anchors = anchors.squeeze(0) # [x1,y1,x2,y2]
	num_classes, num_anchors = cls_probs.shape[1], cls_probs.shape[2]
	out = []
	for i in range(batch_size):
		cls_probs, offset_preds = cls_probs[i], offset_preds[i].reshape(-1, 4)
		conf, class_id = torch.max(cls_probs[1:], 0)
		# predicted_bb = [x1,y1,x2,y2]
		predicted_bb = offset_inverse(anchors, offset_preds)
		keep = nms(predicted_bb, conf, nms_threshould)
		all_idx = torch.arange(num_anchors, dtype=torch.long, device=device)
		combined = torch.cat((keep, all_idx))
		uniques, counts = combined.unique(return_counts=True)
		non_keep = uniques[counts == 1]
		all_idx_sorted = torch.cat((keep, non_keep))
		class_id[non_keep] = -1
		class_id = class_id[all_idx_sorted]
		conf, predicted_bb = conf[all_idx_sorted], predicted_bb[all_idx_sorted]
		below_min_idx = (conf < pos_threshould)
		class_id[below_min_idx] = -1
		conf[below_min_idx] = 1 - conf[below_min_idx]
		pred_info = torch.cat((class_id.unsqueeze(1),
							   conf.unsqueeze(1),
							   predicted_bb), dim=1)
		out.append(pred_info)
	return torch.stack(out)

5. 多尺度目标检测

5.1 多尺度锚框

就是我们可以通过不同的比例来对同样的图像生成不同大小的锚框

代码

def display_anchors(fmap_w, fmap_h, s):
	"""
	function : 根据指定的高fmap_h,宽fmap_w，和比例s 来生成不同的锚框,
	因为锚框中的(x,y)轴坐标值已经被处以特征图fmap的宽度和高度，因此这些值
	介于0和1之间，表示特征图中锚框的相对位置。所以为了还原，我们需要乘以
	相对应的w,h
	:param fmap_w: 宽
	:param fmap_h: 高
	:param s: 比例大小
	:return: 显示锚框
	"""
	# 设置画布大小
	d2l.set_figsize()
	# 全为 0 的张量，fmap = (x,y,f,w)
	fmap = torch.zeros((1, 10, fmap_h, fmap_w))
	# 生成不同尺寸的锚框
	anchors = d2l.multibox_prior(fmap, sizes=s, ratios=[1, 2, 0.5])
	bbox_scale = torch.tensor((w, h, w, h))
	d2l.show_bboxes(d2l.plt.imshow(img).axes,
					anchors[0] * bbox_scale)

5.2 多尺度检测

我们可以利用深层神经网络在多个层次上对图像进行分层表示，从而实现多尺度目标检测

6. 目标检测数据集

6.1 数据集预处理思路

下载数据集
读取数据集的图像和标签
将(features,labels)变成 dataset 一对对的
将 dataset 变成批量的dataloader，得到 train_iter,val_iter
批量读取显示

6.2 源码

# 1. 导入相关数据库
import matplotlib.pyplot as plt
import os
import pandas as pd
import torch
import torchvision

from d2l import torch as d2l

# 2. 定义数据地址
d2l.DATA_HUB['banana-detection'] = (
    d2l.DATA_URL + 'banana-detection.zip',
    '5de26c8fce5ccdea9f91267273464dc968d20d72')

# 3. 读取香蕉检测数据集中的图像和标签
def read_data_bananas(is_train=True):
    """读取香蕉检测数据集中的图像和标签"""
    # data_dir ='..\\data\\banana-detection
    data_dir = d2l.download_extract('banana-detection')
    # 地址目录
    csv_fname = os.path.join(data_dir, 'bananas_train' if is_train
                             else 'bananas_val', 'label.csv')
    # 读取 csv文件
    # 原始的csv_data形状：[1000,6]:[img_name,label,xmin,ymin xmax ymax]
    csv_data = pd.read_csv(csv_fname)
    # 将 表格数据的行序列用 img_name 代替
    csv_data = csv_data.set_index('img_name')# 形状：[1000,5]:(img_name)[label,xmin,ymin,xmax,ymax]
    # 创建两个空列表 images,targets
    images, targets = [], []
    # 逐行迭代数据
    # img_name:str '0.png';
    # target:series:[0-label,0-xmin,0-ymin,0-xmax,0-ymax]
    # targets : (1000,5);每行为：[label,xmin,ymin,xmax,ymax]
    # images :  (1000,3):每行为：[channels,height,width]
    for img_name, target in csv_data.iterrows():
        images.append(torchvision.io.read_image(
            os.path.join(data_dir, 'bananas_train' if is_train else
                         'bananas_val', 'images', f'{img_name}')))
        # 这里的target包含（类别，左上角x，左上角y，右下角x，右下角y），
        # 其中所有图像都具有相同的香蕉类（索引为0）
        targets.append(list(target))
        # images = Tensor[image_channels, image_height, image_width]
        # unsqueeze 在第 1 维增加一个大小为 1 的维度，并归一化处理
    return images, torch.tensor(targets).unsqueeze(1) / 256

#@save
# 4. 自定义香蕉数据集，需满足三个条件
# 1) 初始化函数: __init__
# 2) 根据 index 获取 label 函数： __getitem__
# 3) 特征的长度函数 : __len__
class BananasDataset(torch.utils.data.Dataset):
    """一个用于加载香蕉检测数据集的自定义数据集"""
    def __init__(self, is_train):
        self.features, self.labels = read_data_bananas(is_train)
        print('read ' + str(len(self.features)) + (f' training examples' if
              is_train else f' validation examples'))

    def __getitem__(self, idx):
        return (self.features[idx].float(), self.labels[idx])

    def __len__(self):
        return len(self.features)


# 5. 加载香蕉检测数据集，将得到的dataset转换成 DataLoader 类型，
# 生成训练迭代器train_iter,验证迭代器val_iter ,方便后期训练
def load_data_bananas(batch_size):
    """加载香蕉检测数据集"""
    # 训练集需要打乱来提高网络的鲁棒性，所以 shuffle=True
    # 验证集则不需要，所以 shuffle=False
    train_iter = torch.utils.data.DataLoader(BananasDataset(is_train=True),
                                             batch_size, shuffle=True)
    val_iter = torch.utils.data.DataLoader(BananasDataset(is_train=False),
                                           batch_size)
    return train_iter, val_iter


# 6. 定义批量大小batch_size=32,边缘框大小edge_size=256
batch_size, edge_size = 32, 256

# 7. 加载训练集迭代器 train_iter,验证集不需要
train_iter, _ = load_data_bananas(batch_size)
# features:[1000]
# labels = tensor:(1000,1,5)
# 8. 将训练集中的第一个batch拿出来
batch = next(iter(train_iter))

print(batch[0].shape, batch[1].shape)

# 9. 将第0个批量中的前10个训练集加载进来，
#    permute 调换张量的顺序为 (0,2,3,1)后再除以255后使得张量值在[0,1]之间
imgs = (batch[0][0:10].permute(0, 2, 3, 1)) / 255

# 10.设置轴
axes = d2l.show_images(imgs, 2, 5, scale=2)

# 11. 将前10张图片含边缘框显示出来
for ax, label in zip(axes, batch[1][0:10]):
    d2l.show_bboxes(ax, [label[0][1:5] * edge_size], colors=['w'])
    plt.show()

6.3 结果

你可能感兴趣的:(pytorch,计算机视觉,深度学习,机器学习)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
【安装环境】配置MMTracking环境 xuanyu22 安装环境机器学习神经网络深度学习 python
版本v0.14.0安装torchnumpy的版本不能太高，否则后面安装时会发生冲突。先安装numpy，因为pytorch的安装会自动配置高版本numpy。condainstallnumpy=1.21.5mmtracking支持的torch版本有限，需要找到合适的condainstallpytorch==1.11.0torchvision==0.12.0cudatoolkit=10.2-cpytor
Python(PyTorch)和MATLAB及Rust和C++结构相似度指数测量导图亚图跨际 Python 交叉知识算法量化检查图像压缩质量低分辨率多光谱峰值信噪比端到端优化图像压缩手术机器人三维实景实时可微分渲染重建三维可视化
要点量化检查图像压缩质量低分辨率多光谱和高分辨率图像实现超分辨率分析图像质量图像索引/多尺度结构相似度指数和光谱角映射器及视觉信息保真度多种指标峰值信噪比和结构相似度指数测量结构相似性图像分类PNG和JPEG图像相似性近似算法图像压缩，视频压缩、端到端优化图像压缩、神经图像压缩、GPU变速图像压缩手术机器人深度估计算法重建三维可视化推理图像超分辨率算法模型三维实景实时可微分渲染算法MATLAB结构
异常的核心类Throwable 无量 java 源码异常处理 exception
java异常的核心是Throwable，其他的如Error和Exception都是继承的这个类里面有个核心参数是detailMessage，记录异常信息，getMessage核心方法，获取这个参数的值，我们可以自己定义自己的异常类，去继承这个Exception就可以了，方法基本上，用父类的构造方法就OK，所以这么看异常是不是很easy package com.natsu;
mongoDB 游标（cursor）实现分页迭代开窍的石头 mongodb
上篇中我们讲了mongoDB 中的查询函数，现在我们讲mongo中如何做分页查询如何声明一个游标 var mycursor = db.user.find({_id:{$lte:5}}); 迭代显示游标数
MySQL数据库INNODB 表损坏修复处理过程 0624chenhong tomcat mysql
最近mysql数据库经常死掉，用命令net stop mysql命令也无法停掉，关闭Tomcat的时候，出现Waiting for N instance(s) to be deallocated 信息。查了下，大概就是程序没有对数据库连接释放，导致Connection泄露了。因为用的是开元集成的平台，内部程序也不可能一下子给改掉的，就验证一下咯。启动Tomcat,用户登录系统，用netstat -
剖析如何与设计人员沟通不懂事的小屁孩工作
最近做图烦死了，不停的改图，改图……。烦，倒不是因为改，而是反反复复的改，人都会死。很多需求人员不知该如何与设计人员沟通，不明白如何使设计人员知道他所要的效果，结果只能是沟通变成了扯淡，改图变成了应付。那应该如何与设计人员沟通呢？我认为设计人员与需求人员先天就存在语言障碍。对一个合格的设计人员来说，整天玩的都是点、线、面、配色，哪种构图看起来协调；哪种配色看起来合理心里跟明镜似的，
qq空间刷评论工具换个号韩国红果果 JavaScript
var a=document.getElementsByClassName('textinput'); var b=[]; for(var m=0;m<a.length;m++){ if(a[m].getAttribute('placeholder')!=null) b.push(a[m]) } var l
S2SH整合之session 灵静志远 spring AOP struts session
错误信息： Caused by: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'cartService': Scope 'session' is not active for the current thread; consider defining a scoped
xmp标签 a-john 标签
今天在处理数据的显示上遇到一个问题： var html = '<li><div class="pl-nr"><span class="user-name">' + user + '</span>' + text + '</div></li>'; ulComme
Ajax的常用技巧（2）---实现Web页面中的级联菜单 aijuans Ajax
在网络上显示数据，往往只显示数据中的一部分信息，如文章标题，产品名称等。如果浏览器要查看所有信息，只需点击相关链接即可。在web技术中，可以采用级联菜单完成上述操作。根据用户的选择，动态展开，并显示出对应选项子菜单的内容。在传统的web实现方式中，一般是在页面初始化时动态获取到服务端数据库中对应的所有子菜单中的信息，放置到页面中对应的位置，然后再结合CSS层叠样式表动态控制对应子菜单的显示或者隐
天-安-门，好高 atongyeye 情感
我是85后，北漂一族，之前房租1100，因为租房合同到期，再续，房租就要涨150。最近网上新闻，地铁也要涨价。算了一下，涨价之后，每次坐地铁由原来2块变成6块。仅坐地铁费用，一个月就要涨200。内心苦痛。晚上躺在床上一个人想了很久，很久。我生在农
android 动画百合不是茶 android 透明度平移缩放旋转
android的动画有两种 tween动画和Frame动画 tween动画;,透明度,缩放,旋转,平移效果 Animation 动画 AlphaAnimation 渐变透明度 RotateAnimation 画面旋转 ScaleAnimation 渐变尺寸缩放 TranslateAnimation 位置移动 Animation
查看本机网络信息的cmd脚本 bijian1013 cmd
@echo 您的用户名是：%USERDOMAIN%\%username%>"%userprofile%\网络参数.txt" @echo 您的机器名是：%COMPUTERNAME%>>"%userprofile%\网络参数.txt" @echo ___________________>>"%userprofile%\
plsql 清除登录过的用户征客丶 plsql
tools---preferences----logon history---history 把你想要删除的删除 -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一起进步。 email ： binary_spac
【Pig一】Pig入门 bit1129 pig
Pig安装 1.下载pig wget http://mirror.bit.edu.cn/apache/pig/pig-0.14.0/pig-0.14.0.tar.gz 2. 解压配置环境变量如果Pig使用Map/Reduce模式，那么需要在环境变量中，配置HADOOP_HOME环境变量 expor
Java 线程同步几种方式 BlueSkator volatile synchronized ThredLocal ReenTranLock Concurrent
为何要使用同步？ java允许多线程并发控制，当多个线程同时操作一个可共享的资源变量时（如数据的增删改查），将会导致数据不准确，相互之间产生冲突，因此加入同步锁以避免在该线程没有完成操作之前，被其他线程的调用，从而保证了该变量的唯一性和准确性。 1.同步方法&
StringUtils判断字符串是否为空的方法（转帖） BreakingBad null StringUtils “”
转帖地址：http://www.cnblogs.com/shangxiaofei/p/4313111.html public static boolean isEmpty(String str) 　　判断某字符串是否为空，为空的标准是 str== null 或 str.length()== 0
编程之美-分层遍历二叉树 bylijinnan java 数据结构算法编程之美
import java.util.ArrayList; import java.util.LinkedList; import java.util.List; public class LevelTraverseBinaryTree { /** * 编程之美分层遍历二叉树 * 之前已经用队列实现过二叉树的层次遍历，但这次要求输出换行，因此要
jquery取值和ajax提交复习记录 chengxuyuancsdn jquery取值 ajax提交
// 取值 // alert($("input[name='username']").val()); // alert($("input[name='password']").val()); // alert($("input[name='sex']:checked").val()); // alert($("
推荐国产工作流引擎嵌入式公式语法解析器-IK Expression comsci java 应用服务器工作 Excel 嵌入式
这个开源软件包是国内的一位高手自行研制开发的，正如他所说的一样，我觉得它可以使一个工作流引擎上一个台阶。。。。。。欢迎大家使用，并提出意见和建议。。。 ----------转帖--------------------------------------------------- IK Expression是一个开源的（OpenSource），可扩展的（Extensible），基于java语言
关于系统中使用多个PropertyPlaceholderConfigurer的配置及PropertyOverrideConfigurer daizj spring
1、PropertyPlaceholderConfigurer Spring中PropertyPlaceholderConfigurer这个类，它是用来解析Java Properties属性文件值，并提供在spring配置期间替换使用属性值。接下来让我们逐渐的深入其配置。基本的使用方法是：(1) <bean id="propertyConfigurerForWZ&q
二叉树:二叉搜索树 dieslrae 二叉树
所谓二叉树,就是一个节点最多只能有两个子节点,而二叉搜索树就是一个经典并简单的二叉树.规则是一个节点的左子节点一定比自己小,右子节点一定大于等于自己(当然也可以反过来).在树基本平衡的时候插入,搜索和删除速度都很快,时间复杂度为O(logN).但是,如果插入的是有序的数据,那效率就会变成O(N),在这个时候,树其实变成了一个链表. tree代码:
C语言字符串函数大全 dcj3sjt126com c function
C语言字符串函数大全函数名: stpcpy 功能: 拷贝一个字符串到另一个用法: char *stpcpy(char *destin, char *source); 程序例: #include <stdio.h> #include <string.h> int main
友盟统计页面技巧 dcj3sjt126com 技巧
在基类调用就可以了, 基类ViewController示例代码 -(void)viewWillAppear:(BOOL)animated { [super viewWillAppear:animated]; [MobClick beginLogPageView:[NSString stringWithFormat:@"%@",self.class]];
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法 flyvszhb java jdk
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法本机已经安装了jdk1.7，而比较早期的项目需要依赖jdk1.6，于是同时在本机安装了jdk1.6和jdk1.7. 安装jdk1.6前，执行java -version得到 C:\Users\liuxiang2>java -version java version "1.7.0_21&quo
Java在创建子类对象的同时会不会创建父类对象 happyqing java 创建子类对象父类对象
1.在thingking in java 的第四版第六章中明确的说了，子类对象中封装了父类对象， 2."When you create an object of the derived class, it contains within it a subobject of the base class. This subobject is the sam
跟我学spring3 目录贴及电子书下载 jinnianshilongnian spring
一、《跟我学spring3》电子书下载地址：《跟我学spring3》（1-7 和 8-13） http://jinnianshilongnian.iteye.com/blog/pdf 跟我学spring3系列 word原版下载二、源代码下载最新依
第12章 Ajax（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BI and EIM 4.0 at a glance blueoxygen BO
http://www.sap.com/corporate-en/press.epx?PressID=14787 有机会研究下EIM家族的两个新产品~~~~ New features of the 4.0 releases of BI and EIM solutions include: Real-time in-memory computing –
Java线程中yield与join方法的区别 tomcat_oracle java
长期以来，多线程问题颇为受到面试官的青睐。虽然我个人认为我们当中很少有人能真正获得机会开发复杂的多线程应用(在过去的七年中，我得到了一个机会)，但是理解多线程对增加你的信心很有用。之前，我讨论了一个wait()和sleep()方法区别的问题，这一次，我将会讨论join()和yield()方法的区别。坦白的说，实际上我并没有用过其中任何一个方法，所以，如果你感觉有不恰当的地方，请提出讨论。 &nb
android Manifest.xml选项阿尔萨斯 Manifest
结构继承关系 public final class Manifest extends Objectjava.lang.Objectandroid.Manifest 内部类 class Manifest.permission权限 class Manifest.permission_group权限组构造函数 public Manifest () 详细 androi
Oracle实现类split函数的方 zhaoshijie oracle
关键字：Oracle实现类split函数的方项目里需要保存结构数据，批量传到后他进行保存，为了减小数据量，子集拼装的格式，使用存储过程进行保存。保存的过程中需要对数据解析。但是oracle没有Java中split类似的函数。从网上找了一个，也补全了一下。 CREATE OR REPLACE TYPE t_split_100 IS TABLE OF VARCHAR2(100); cr