梦终会碎

iou画 yolov3_编码实现yolov3过程详解

一.参数设置

要研究一个网络，首先要搞懂各种参数的设置，因为网络训练和测试都依赖于这些超参数。除了一些超参数，u版的yolov3把网络的参数也放在了config文件里，加大了阅读的难度。我选择了把网络参数直接放在网络定义的文件里，config文件只保存超参数。

# custom

cfg.annotations_path = "./data/annotations/annotations.txt" #标签的path

cfg.class_path = "./data/data.names" #类别名文件

cfg.image_path = "./data/images/" #存放图像的path

cfg.mean_and_val = "./data/mean_and_val.txt" #数据集均值和方差

cfg.tensorboard_path = "./log/" #存放tensorboard的log输出

cfg.checkpoint_save_path = "./checkpoint/" #存放训练参数

cfg.num_classes = 1 #有多少类

cfg.strides = [8,16,32] #输入与三个分支的大小比例

cfg.device = "cuda" #cpu

cfg.anchors = [[[1.25,1.625],[2.0,3.75],[4.125,2.875]],

[[1.875,3.8125],[3.875,2.8125],[3.6875,7.4375]],

[[3.625,2.8125],[4.875,6.1875],[11.65625,10.1875]]]

# train

cfg.batch_size = 2 #每次训练的batch size

cfg.input_sizes = [320,352,384,416,448,480,512,544,576,608] #随机选择的输入图像大小

cfg.max_boxes_per_scale = 150 #label每个scale最多有多少个box

cfg.if_pad = True #对输入resize是否进行补空

cfg.random_horizontal_flip = True #随机水平翻转

cfg.random_crop = True #随机裁剪

cfg.max_epoch = 300 #最多学习的epoch数

cfg.lr_start = 1e-4 #初始學習率

cfg.lr_end = 1e-6 #結束學習率

cfg.warmup = 200 #前多少iter採取warmup測略

cfg.momentum = 0.9 #动量参数

cfg.weight_decay = 0.0005 #权重衰减正则项防止过拟合

cfg.iou_thresh = 0.225 #计算loss时的iou thresh

cfg.focal_gamma = 2 #计算conf loss的focal loss的gamma参数

cfg.focal_alpha = 0.5 #计算conf loss的focal loss的alpha参数

# test

cfg.input_size = 416 #输入大小

cfg.conf_thresh = 0.3

cfg.cls_thresh = 0.5

cfg.nms_thresh = 0.5

这里需要注意的是，yolov3借鉴faster rcnn的思想引入了anchor。针对yolov3的三个分支，分别为每个分支提供了三种预先选择的anchor大小。这里的anchors是手动设置的，可以根据图像和标签的特征用k-means得到，这里是coco数据集的anchors设置，如果要跑自己的数据集的话，需要自己得到适合自己数据集的anchors，也可以用coco默认的

二.网络结构

花了一天时间整理的网络结构图

我们可以看到yolov3最后的输出有三个分支，每个分支分别预测大中小三种scale的目标，而且输出的大小其中一维为(3*(5+num classes))，这个3的意思就是每种scale的输出都提供了3种不同的anchor，可以更好地预测多尺度的目标。当然，如果为了训练自己的数据集，可以对yolov3的网络结构进行魔改，我们可以输出四个分支甚至更多，而且每个分支我们也可以不仅仅只提供三种anchor，如果要改这些的话就不是调参那么简单了，需要对网络结构比较了解。

三.网络代码

花了一下午时间按照画的模型结构图，用pytorch重构了yolov3的代码。官方的yolov3代码网络结构比较不好理解，我重构后的结构比较好理解一些。

1.为了提高代码复用率，每一层的卷积、池化等操作都封装在了convolution类里

class convolution(nn.Module):

def __init__(self,in_channel,out_channel,kernel_size,stride,padding,if_bn,if_activity,if_pooling=False):

super(convolution, self).__init__()

self.if_bn=if_bn

self.if_activity = if_activity

self.if_pooling = if_pooling

self.conv = nn.Conv2d(in_channels=in_channel, out_channels=out_channel,

kernel_size=kernel_size, stride=stride,padding=padding,bias= not if_bn)

if if_bn:

self.bn = nn.BatchNorm2d(num_features=out_channel,momentum=0.9,eps=1e-5)

self.activity = nn.LeakyReLU(negative_slope=0.1)

self.pooling = nn.MaxPool2d(kernel_size=2,stride=2)

def forward(self,x):

x = self.pooling(x) if self.if_pooling else x

if self.if_bn:

x = self.conv(x)

x = self.bn(x)

else:

x = self.conv(x)

return self.activity(x) if self.if_activity else x

2.残差模块

class residual_block(nn.Module):

def __init__(self,channel):

super(residual_block,self).__init__()

self.conv_1x1 = convolution(channel,channel//2,1,1,0,True,True)

self.conv_3x3 = convolution(channel//2,channel,3,1,1,True,True)

def forward(self,x):

res = self.conv_1x1(x)

res = self.conv_3x3(res)

return res+x

3.darknet53主干网络，大量复用了convolution类和residual_block类

class darknet53(nn.Module):

def __init__(self):

super(darknet53,self).__init__()

self.first_stage = convolution(3,32,3,1,1,True,True)

self.second_stage = convolution(32,64,3,1,1,True,True,True)

self.third_stage = convolution(64,128,3,1,1,True,True,True)

self.forth_stage = convolution(128,256,3,1,1,True,True,True)

self.fifth_stage = convolution(256,512,3,1,1,True,True,True)

self.sixth_stage = convolution(512,1024,3,1,1,True,True,True)

self.first_residual = residual_block(64)

self.second_residual = [residual_block(128) for i in range(2)]

self.third_residual = [residual_block(256) for i in range(8)]

self.forth_residual = [residual_block(512) for i in range(8)]

self.fifth_residual = [residual_block(1024) for i in range(8)]

def forward(self,img):

x = self.first_stage(img)

x = self.second_stage(x)

x = self.first_residual(x)

x = self.third_stage(x)

for i in range(2):

x = self.second_residual[i](x)

x = self.forth_stage(x)

for i in range(8):

x = self.third_residual[i](x)

out1 = x

x = self.fifth_stage(x)

for i in range(8):

x = self.forth_residual[i](x)

out2 = x

x = self.sixth_stage(x)

for i in range(4):

x = self.fifth_residual[i](x)

return out1,out2,x

4.yolov3，输出为代表三种大小的框的预测向量，shape分别为(n,255,13,13)、(n,255,26,26)、(n,255,52,52)。

class yolov3(nn.Module):

def __init__(self):

super(yolov3,self).__init__()

self.darknet53 = darknet53()

self.bobj_stage = nn.Sequential(

convolution(1024 ,512, 1, 1, 0, True, True),

convolution(512, 1024, 3, 1, 1, True, True),

convolution(1024, 512, 1, 1, 0, True, True),

convolution(512, 1024, 3, 1, 1, True, True),

convolution(1024, 512, 1, 1, 0, True, True)

)

self.bobj_out_stage = nn.Sequential(

convolution(512 ,1024, 3, 1, 1, True, True),

convolution(1024, 3*(5+80), 1, 1, 0, False, False)

)

self.mobj_stage = nn.Sequential(

convolution(768, 256, 1, 1, 0, True, True),

convolution(256, 512, 3, 1, 1, True, True),

convolution(512, 256, 1, 1, 0, True, True),

convolution(256, 512, 3, 1, 1, True, True),

convolution(512, 256, 1, 1, 0, True, True)

)

self.mobj_stage_conv = convolution(512, 256, 1, 1, 0, True, True)

self.mobj_out_stage = nn.Sequential(

convolution(256, 512, 3, 1, 1, True, True),

convolution(512, 3 * (5 + 80), 1, 1, 0, False, False)

)

self.sobj_stage = nn.Sequential(

convolution(384, 128, 1, 1, 0, True, True),

convolution(128, 256, 3, 1, 1, True, True),

convolution(256, 128, 1, 1, 0, True, True),

convolution(128, 256, 3, 1, 1, True, True),

convolution(256, 128, 1, 1, 0, True, True)

)

self.sobj_stage_conv = convolution(256, 128, 1, 1, 0, True, True)

self.sobj_out_stage = nn.Sequential(

convolution(128, 256, 3, 1, 1, True, True),

convolution(256, 3 * (5 + 80), 1, 1, 0, False, False)

)

def forward(self,img):

route1,route2,x = self.darknet53(img)

# big objectx = self.bobj_stage(x)

bobj_output = self.bobj_out_stage(x)

# middle objectx = self.mobj_stage_conv(x)

x = nn.functional.interpolate(x,scale_factor=2)

x = torch.cat((x,route2),dim=1)

x = self.mobj_stage(x)

mobj_output = self.mobj_out_stage(x)

# small objectx = self.sobj_stage_conv(x)

x = nn.functional.interpolate(x, scale_factor=2)

x = torch.cat((x, route1), dim=1)

x = self.sobj_stage(x)

sobj_output = self.sobj_out_stage(x)

return bobj_output,mobj_output,sobj_output

四.dataloader部分

此部分借鉴了tensorflow版本的yolov3，每次返回image batch和label

1.dataloader需要的一些超参数

def __init__(self):

self.image_path = cfg.image_path #图像保存路径self.annotations_path = cfg.annotations_path #标签保存路径self.class_path = cfg.class_path #类别名保存路径self.class_names = self.get_class_names() #类别名self.num_classes = len(self.class_names) #类别数self.bacth_size = cfg.batch_size #batch sizeself.anchors = np.array(cfg.anchors) #三种不同尺度的三种anchors,一共九个self.annotations = self.get_annotations() #图像名和属于此图的bboxesself.num_annotations = len(self.annotations) #样本数量self.num_batches = np.ceil(len(self.annotations)/self.bacth_size) #一个epoch有多少个batchself.input_sizes = cfg.input_sizes #一个list,从中随机选取输入图像大小self.output_size = [52,26,13] #yolo输出大小,根据input size来计算self.strides = cfg.strides

self.max_boxes_per_scale = cfg.max_boxes_per_scale

self.iter = 0 #当前迭代次数

2.在数据输入网络前做的数据增强和数据预处理。数据增强包括随机裁剪和随机翻转，预处理包括将图像resize到合适的大小，这个大小也是随机选择的，但是要满足可以被32整除，然后要进行归一化处理。

#对image进行归一化操作def normalization(self,image):

image = image/255.

return image

#对图像resize以符合输入要求,可选择pad和no pad方式def resize_image(self,image,bboxes,input_size):

h, w, _ = image.shape #(h,w,c)if not cfg.if_pad: #直接resize,可能会导致图像变形new_image = cv2.resize(image,(input_size,input_size))

bboxes[:,[0,2]] = bboxes[:,[0,2]]*input_size/w

bboxes[:,[1,3]] = bboxes[:,[1,3]]*input_size/h

else: #补空保证图像不变形scale = input_size/max(w,h) #得到input size/图像的宽和高较小的那一个scalew,h = int(scale*w),int(scale*h) #将原图像resize到这个大小,不改变原来的形状

image = cv2.resize(image,(w,h))

fill_value = 0 #选择边缘补空的像素值new_image = np.ones((input_size,input_size,3)) * fill_value #新的符合输入大小的图像dw,dh = (input_size-w)//2,(input_size-h)//2

new_image[dh:dh+h,dw:dw+w,:] = image

bboxes[:, 0] = bboxes[:, 0] * scale + dw

bboxes[:, 2] = bboxes[:, 2] * scale + dw

bboxes[:, 1] = bboxes[:, 1] * scale + dh

bboxes[:, 3] = bboxes[:, 3] * scale + dh

return new_image,bboxes

#随机水平翻转def random_horizontal_flip(self,image,bboxes):

flip_image = np.copy(image)

flip_bboxes = np.copy(bboxes)

if random.random() < 0.5:

_, w, _ = image.shape

flip_image = image[:, ::-1, :]

flip_bboxes[:,0] = w-bboxes[:,2]

flip_bboxes[:,2] = w-bboxes[:,0]

return flip_image,flip_bboxes

#随机裁剪def random_crop(self,image,bboxes):

if random.random() < 0.5:

h, w, _ = image.shape

max_bbox = np.concatenate([np.min(bboxes[:, 0:2], axis=0), np.max(bboxes[:, 2:4], axis=0)], axis=-1)

max_l_trans = max_bbox[0]

max_u_trans = max_bbox[1]

max_r_trans = w - max_bbox[2]

max_d_trans = h - max_bbox[3]

crop_xmin = max(0, int(max_bbox[0] - random.uniform(0, max_l_trans)))

crop_ymin = max(0, int(max_bbox[1] - random.uniform(0, max_u_trans)))

crop_xmax = max(w, int(max_bbox[2] + random.uniform(0, max_r_trans)))

crop_ymax = max(h, int(max_bbox[3] + random.uniform(0, max_d_trans)))

image = image[crop_ymin: crop_ymax, crop_xmin: crop_xmax]

bboxes[:, [0, 2]] = bboxes[:, [0, 2]] - crop_xmin

bboxes[:, [1, 3]] = bboxes[:, [1, 3]] - crop_ymin

return image, bboxes

3.每次取batch所做的操作

def __next__(self):

input_size = random.choice(self.input_sizes) #每次随机选取输入图像的大小self.output_size = [input_size//stride for stride in self.strides] #yolo输出大小batch_images = np.zeros((self.bacth_size,input_size,input_size,3)).astype(np.float32)

batch_mask_bboxes = [np.zeros((self.bacth_size,self.output_size[i],self.output_size[i],

len(self.anchors[0]), 5 + self.num_classes)).astype(np.float32) for i in range(3)]

batch_list_bboxes = [np.zeros((self.bacth_size,self.max_boxes_per_scale,4)).astype(np.float32) for _ in range(3)]

annotation_count = 0 #这个batch已经处理了多少个annotationif self.iter

image_and_labels = self.annotations[index] #取image name和labelsimage = self.get_image_array(image_and_labels[0]) #image -> np.arraybboxes = self.get_bbox_array(image_and_labels[1:]) #str -> np.array

image, bboxes = self.data_augmentation(image,bboxes) #数据增强image, bboxes = self.resize_image(image,bboxes,input_size) #resize到随机随机选取的图像大小image = self.normalization(image) #归一化以加快收敛速度batch_images[annotation_count] = image #预处理后的image放入batchlabel = self.extract_label(bboxes) #对bbox进行处理batch_mask_bboxes[0][annotation_count] = label[0][0]

batch_mask_bboxes[1][annotation_count] = label[0][1]

batch_mask_bboxes[2][annotation_count] = label[0][2]

batch_list_bboxes[0][annotation_count] = label[1][0]

batch_list_bboxes[1][annotation_count] = label[1][1]

batch_list_bboxes[2][annotation_count] = label[1][2]

#self.show_image_and_bboxes(np.copy(image), np.copy(bboxes)) #可视化查看数据增强的正确性annotation_count += 1 #一个batch里已处理的数目加一self.iter += 1

batch_images = batch_images.transpose([0,3,1,2]) #转置成(n,c,h,w)batch_images = torch.from_numpy(batch_images) #转为tensorbatch_mask_small_bboxes = torch.from_numpy(batch_mask_bboxes[0])

batch_mask_middle_bboxes = torch.from_numpy(batch_mask_bboxes[1])

batch_mask_big_bboxes = torch.from_numpy(batch_mask_bboxes[2])

batch_list_small_bboxes = torch.from_numpy(batch_list_bboxes[0])

batch_list_middle_bboxes = torch.from_numpy(batch_list_bboxes[1])

batch_list_big_bboxes = torch.from_numpy(batch_list_bboxes[2])

return batch_images,batch_mask_small_bboxes,batch_mask_middle_bboxes,batch_mask_big_bboxes,\

batch_list_small_bboxes,batch_list_middle_bboxes,batch_list_big_bboxes

else:

self.iter = 0 #重置迭代次数np.random.shuffle(self.annotations) #将annotation打乱raise StopIteration

四.计算loss

1.在计算loss前，需要对yolov3的原始输出进行解码，decode过程如下：

defdecode(output,stride,anchors):

decice = torch.device(cfg.device)

batch_size,output_size = output.shape[0:2]

anchors = anchors.to(torch.device(cfg.device))

output_xy = output[...,0:2] #中心点x和youtput_wh = output[...,2:4] #w和houtput_conf = output[...,4:5] #置信度output_prob = output[...,5:] #概率分布

y_stride = torch.arange(0, output_size).unsqueeze(1).repeat(1, output_size).to(torch.float32) #每个网格y的偏移量x_offset = torch.arange(0, output_size).unsqueeze(0).repeat(output_size, 1).to(torch.float32) #每个网格x的偏移量xy_offset = torch.stack([x_offset, y_stride], dim=-1)

xy_offset = xy_offset.unsqueeze(0).unsqueeze(3).repeat(batch_size, 1, 1, 3, 1).to(decice)

output_xy = (torch.sigmoid(output_xy)+xy_offset)*stride #x和y加上偏移量并乘以stride

output_wh = (torch.exp(output_wh)*anchors)*stride #w和h乘以三种不同的anchors并乘以strideoutput_conf = torch.sigmoid(output_conf)

output_prob = torch.sigmoid(output_prob)

pred = torch.cat((output_xy,output_wh,output_conf,output_prob),-1)

returnpred

这里解释一下边框偏移公式：

pred_x = sigmoid(out_x) + offset_x

pred_y = sigmoid(out_y) + offset_y

pred_w = anchor_w * exp(out_w)

pred_h = anchor_h * exp(out_h)

在这里，out_*为yolo原始的xywh偏移量，offset_x和offset_y为该方格左上角到特征图左上角的距离，anchor_w和anchor_h为该ceil的anchor的w和h。

需要注意的是，对out_x和out_y使用sigmoid是为了将x和y偏移量限制(0,1)之内，保证了预测的中心点在方格内，有利于模型收敛。

1.box loss

yolov3论文里的box loss定义如下：

其中，l^obj代表该网格中是否有目标，如果有的话为1，没有的话为0；

而后面的预测框和真实框的偏移量现在普遍使用giou，giou定义为iou - (area_c - union) / union,iou为两个box的交并比，union为两个box的并集面积，area_c代表两个box的最小外接矩形的面积。

这部分loss的计算代码如下：

# giou lossgiou = box_iou(pred_xywh,mask_xywh,giou=True) #先计算解码后的output与标签的box的giou(n,ceil size,ceil size,num anchors,1)bbox_loss = 2.0 - 1.0 * mask_xywh[:, :, :, :, 2:3] * mask_xywh[:, :, :, :, 3:4] / (input_size ** 2)

giou_loss = mask_conf * bbox_loss * (1 - giou)

2.obj loss

yolov3论文里的obj loss定义如下：

其中，l^noboj代表该网格中是否没有目标，如果没有的话为1，有的话为0，和l^obj的定义是相反的；

而预测概率和真实概率的loss普遍使用focal loss计算。

这部分loss的计算代码如下：

# conf lossiou = box_iou(pred_xywh.unsqueeze(4),label_xywh.unsqueeze(1).unsqueeze(1).unsqueeze(1),

giou=False).squeeze(-1) #(n,size,size,num anchors,150)iou_max = iou.max(-1, keepdim=True)[0] #(n,size,size,num anchors,1)label_noobj_mask = (1.0 - mask_conf) * (iou_max < cfg.iou_thresh)

conf_loss = (mask_conf * Focal_loss(input=output_conf,target=mask_conf,gamma=2,alpha=1) +

label_noobj_mask * Focal_loss(input=output_conf,target=mask_conf,gamma=2,alpha=1))

需要注意的是，这里和真实框的iou小于阈值的预测框才会被认为是负样本，这个iou thresh通常设为0.3.

3.cls loss

yolov3论文里的cls loss定义如下：

这里就没什么好讲的了，如果是单类别使用BCE LOSS，如果是多类别使用CrossEntropy LOSS。

这部分loss的计算代码如下：

# cls losscls_loss = mask_conf * BCE_loss(output_cls,mask_cls)

至此，yolov3的loss function部分介绍完毕，接下来就可以进行反向传播更新参数了，在训练代码中也有很多方法帮助训练得更好，在第五部分train中会有所体现。

5.训练网路

有了前面的准备工作，现在就可以训练自己的yolov3了，其实训练部分真的没有什么好介绍的，不同网络的训练部分大同小异，无非就是使用什么训练策略，使用什么优化器，使用什么学习率策略等等。

终于把代码写的差不多了，这几天尝试了训练和测试，因为我的电脑要训练完voc或者coco这种数据集需要时间太久了，所以我制作了一个小数据集，一共22张图像，用于检测人脸。

我训练使用的batch size为2，训练大概需要3800mb显存，所以一般的显卡还是可以训练的。训练的loss和learning rate如下。

下面展示几张测试的效果，因为数据集实在太少，所以训练的效果还有待提升。

还有实时调用摄像头进行检测的结果，我的用了快四年的笔记本勉强可以做到实时检测，fps估计在1到2之间，有明显的卡顿。

本文链接

0 评论

No comments.

姓名

你可能感兴趣的:(iou画,yolov3)

Python中手动实现进制转换棉猴 Python 进制转换十进制二进制十六进制八进制
在《Python中进制转换》中提到可以使用bin()、oct()、int()和hex()等函数编程实现数字间的进制转换。除了编程实现进制转换外，还可以通过手动实现。1手动实现二进制数转换为十进制可以通过“填空法”手动将二进制数转换为十进制数，例如将二进制数“0b1101”转换为十进制数的方法如图1所示。“填空法”可以归纳为四个步骤：首先“画空格”，接下来“写次方”，然后“填数字”，最后“列算式”。
编写简单的小程序又熟了 Python入门学习 python flask
编写简单的小程序文章目录编写简单的小程序1.turtle的认识与使用1.1turtle常用的函数1.2用turtle画小蛇1.3begin_fill和end_fill绘制太阳花2.变量2.1变量的创建2.2命名规则2.3保留字及查看方法3.运算符3.1算数运算符3.2关系运算符3.3逻辑运算符4.注释与缩进5.赋值语句6.输出与输入7.数据类型7.1字符串的索引7.2列表8.字符编码8.2乱码问题
Python Flask教程 cunchi4221 python java web ajax vue ViewUI
WelcometoPythonFlasktutorial.Inpreviouslessonwehavelearntaboutpythonlambda.PythonflaskisanAPIthathelpsustobuildwebbasedapplicationinpython.Let’sgetstartedwithpythonflasktutorialforbeginnersnow.欢迎使用Pyt
网络安全威胁与防护措施（下）冬冬小圆帽 web安全网络 php
8.恶意软件（Malware）**恶意软件（Malware，MaliciousSoftware）**是指旨在通过破坏、破坏或未经授权访问计算机系统、网络或设备的程序或代码。恶意软件通常用于窃取敏感信息、破坏系统、窃取资源、干扰正常操作，或者获取非法控制。恶意软件种类繁多，攻击手段不断发展，可能对个人用户、企业和政府构成严重威胁。恶意软件的主要类型：病毒（Virus）：定义：病毒是能够自我复制并将自
Unity中基于粒子碰撞的智能腐蚀系统开发指南——从水枪控制到动态物体管理爱吃程序猿的喵 unity 粒子系统碰撞检测动态对象管理 Unity初学者游戏开发者
完整代码：usingSystem.Collections.Generic;usingUnityEngine;usingUnityEngine.UI;publicclassWaterGunController1:MonoBehaviour{[Header("粒子系统")]publicParticleSystemwaterParticles;[Header("UI控制")]publicButtonst
[解决方案]word文档无法存放过长过大的visio图片狮子再回头其他应用 visio word office UML
一：问题描述visio-UML画的流程图过长了，复制黏贴到word，一页无法显示全二：解决办法1.选择文档内容，工具栏“开始”——“段落”——“行距”——“单倍行距”，注意不能为固定值；2.选择“插入”---“对象”--“由文件创建”，如下图再选择浏览，打开自己的visio文件，确定。visio文件插入后，可能显示过大或不全，点击“图片工具”。调整下拉框中的高度/宽度，直到显示全visio图片.
华为OD机试 - 相对开音节 - 正则表达式（Python/JS/C/C++ 2024 E卷 100分）哪吒华为od 正则表达式 python
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述相对开音节构成的结构为辅音+元音（aeiou）+辅音(r除外)+
【IT大学生必会的】 10 种图表线性回归 .Boss. 深度学习开发语言人工智能机器学习算法
这段时间，不少同学提到了一些图表的问题。每次在使用matplotlib画图，运用这些图表说明问题的时候，很多时候是模糊的，比如说什么时候画什么图合适？其实这个根据你自己的需求，自己的想法来就行。今天的话，我这里举例在线性回归中，最常用的一些图表，应该可以cover绝大多数情况了。其他算法模型适用的图表，咱们在后面再给大家进行总结~至于数据集，表现方式，大家可以根据我给出的代码继续调整即可！那么，在
【sass】学会这个技巧，少写很多css 蒜香拿铁 css sass 前端
sass的高级用法我发现，大多数人使用sass预处理器最多的就是嵌套和变量这两种用法。现在我在列举一些常用的高级用法，希望让大家少敲两行代码。@extend意思是将某个选择器下的所有样式继承过来.error{border:1px#f00;background-color:#fdd;}.seriousError{@extend.error;border-width:3px;}@mixin样式混入，搭
阅读理解英语小崔的技术博客读书成长笔记其他
Wesearchforloveandtrytogetlove,andyetitseemslikewenevergetenough.Evenwhenwehavefoundlove,itcanslipawayastimepasses.Loveisthespacious,openattentionofourawareness.Thekeytoexperiencingloveistonoticewhere
图像识别技术与应用课后总结（20）一元钱面包人工智能
图像分割概念图像分割是把图像中不同像素划分到不同类别，预测目标轮廓，属于细粒度分类。比如将图像里不同物体、背景等区分开来，就像把一幅画里的各个元素精准归类。应用场景人像抠图：能精准分离人物和背景，用于图片编辑、影视制作等，比如去除照片背景换背景。医学组织提取：在医学影像（如CT、MRI图像）中分离出不同组织，辅助疾病诊断、手术规划等。遥感图像分析：分析卫星或航空遥感图像时，区分土地、植被、建筑等不
TCP心跳消息 DamnF-- Unity网络开发基础服务器前端 unity 网络 tcp/ip
客户端主动断开连接usingSystem.Collections;usingSystem.Collections.Generic;usingUnityEngine;publicclassLesson10:MonoBehaviour{voidStart(){#region知识点一目前的客户端主动断开连接//目前在客户端主动退出时//我们会调用socket的ShutDown和Close方法//但是通过
uniapp集成保利威直播SDK，ios为什么不能后台挂起uniapp插件？
背景问题：用uniapp开发小程序和APP，集成保利威直播SDK的时候，ios端不能后台挂起uniapp插件，怎么处理？解决办法：ios端使用后台音频播放和画中画功能，没有在manifest.json进行权限配置，在manifest.json进行权限配置即可。
[ARM+Codesys Customer Case] Application Case of RK3568/A40i/STM32+Codesys in Intelligent Manufacturi ARM+FPGA+AI工业主板定制专家 stm32 codesys rk3568 A40I
Vegetablesareessentialfoodsinpeople'sdailylives,andtherearevariouswaystoconsumethem.Sinceenteringamoderatelyprosperoussociety,people'spaceoflifehasbecomeincreasinglyfast,andmanytraditionalservicescann
【day14】画流程图鹿鸣悠悠文旅行业知识学习流程图
绘制业务流程图是梳理和优化企业流程的重要工具，以下是零基础也能快速上手的指南，涵盖必备知识、绘制步骤和常见误区：一、画流程图前必须了解的3个核心概念流程图的本质不是“画图”，而是将复杂业务逻辑可视化的工具，核心在于逻辑清晰、角色明确。目标：让内外部人员快速理解流程中的关键环节、决策点、责任方。常见流程图类型类型适用场景示例工具符号基本流程图简单线性流程（如审批流程）矩形（步骤）、菱形（判断）跨职能
DeepSeek可以画图嘛？DeepSeek怎么画流程图，分享2025年最新版教程 wd209988 流程图 ppt powerpoint 信息可视化人工智能
‍‌‌‌‌‍‌‌‌‍‌‌‌‍‌‌‌‍‌‌‌‌‌‍‌‌‌你是否遇到过需要快速绘制专业流程图却无从下手的窘境？传统的流程图绘制方法不仅耗时耗力，对工具和技能的要求也让人望而却步。今天，我们将介绍一款革命性工具：亿图图示PPT插件。它能借助DeepSeek大模型的智能能力，让你在PPT中一键生成精美流程图，不用反复折腾！一、流程图绘制的传统方法目前主流的流程图绘制方式主要有三种，第一种是手动绘制工具：比
Spring Boot + Spring-Security实现前后端分离双重身份认证初学者指南（手机号密码JWT + 短信验证码） Iceroki Spring Boot spring spring boot java
折（mo）腾（yu）了好几天，终于把双重身份认证实现了。（账号密码jwt+短信验证码）看了很多视频，照葫芦画瓢敲了两三次，遇到各种各样的bug，比如循环依赖（通过@PostConstructor+setter解决）、框架报错等，翻了上百次csdn才逐渐摸清。总算对spring-security有了一个大概的认识，写一点学习心得，希望能帮到初学者，同时以备自己未来复习。spring-security
html中单选框怎么取消选中,radio单选框的选中与取消你这人真狗 html中单选框怎么取消选中
需求：单选框可重复点击选中和取消；背景：单选框只可以选中，取消需要点击其他单选框。解决方案：单选按钮取消选中$(function(){$('input:radio').click(function(){vardomName=$(this).attr('name');var$radio=$(this);//ifthiswaspreviouslycheckedif($radio.data('wasch
llama-factory微调 AI Echoes 深度学习人工智能机器学习 deepseek
大模型微调实操--llama-factoryllama-factory环境安装前置准备英伟达显卡驱动更新地址下载NVIDIA官方驱动|NVIDIAcuda下载安装地址CUDAToolkit12.2Downloads|NVIDIADeveloperpytorch下载安装地址PreviousPyTorchVersions|PyTorchllama-factory项目和文档地址https://githu
【Agent】OpenManus-Agent-实现具体的智能体非晓为骁 AI agent agi ai openManus Manus 架构
所有实例Agent都是继承ToolCallAgent，所以只列出额外的参数字段，继承的见ToolCallAgent1.Manus（通用Agent）概述Manus是一个多功能通用Agent，使用多种工具解决各种任务，提供了包括Python执行、网络浏览、文件操作和信息检索等功能。参数属性名默认值nameManusdescriptionAversatileagentthatcansolvevariou
python编程基础与案例集锦,python编程案例教程答案青峰235 python 开发语言信息可视化
大家好，小编来为大家解答以下问题，python编程案例教程航空工业出版社课后答案，python编程案例教程答案航空工业出版社，现在让我们一起来看看吧！1.整理字符串输入整理用户输入的问题在编程过程中极为常见。通常情况下，将字符转换为小写或大写就够了，有时你可以使用正则表达式模块「Regex」完成这项工作python编程代码画樱花。但是如果问题很复杂，可能有更好的方法来解决：user_input="
python列表排序方法从大到小,python列表排序sorted 青峰235 windows python linux 人工智能
本篇文章给大家谈谈python列表排序的方法有几种，以及python列表排序方法从大到小，希望对各位有所帮助，不要忘了收藏本站喔。Pythonlist内置sort()方法用来排序，也可以用python内置的全局sorted()方法来对可迭代的序列排序生成新的序列。1）排序基础简单的升序排序是非常容易的python引用turtle画蝴蝶。只需要调用sorted()方法。它返回一个新的list，新的l
数据可视化：python画散点图scatter 西红柿爱吃小番茄 python python 数据可视化 matplotlib
数据可视化：python画散点图scatter我想遍历一幅图的所有像素的h分量的值，然后用散点图表示出来。观察这幅图的h分量的值得变化范围。scatter函数的原型matplotlib.pyplot.scatter(x,y,s=20,c='b',marker='o',cmap=None,norm=None,vmin=None,vmax=None,linewidths=None,vert=None,
visio 画弯曲箭头（波浪线曲线）小牛蛋 office工具 visio 画图
转自：http://blog.csdn.net/hfyinsdu/article/details/6619012作者:hfyinsdu示意图如下：步骤1.Visio工具栏有个“连接线”工具，下图所示2.用这个工具画个曲线，下图所示3.右键单击连线，选择里面的“曲线连接线”，上面图形将变成下面的图形4.里面有5个点，调节这5个点，即可得到曲线。5.箭头的类型（单、双箭头）和样式，可以通过右键，格式-
使用Unity引擎开发的Windows 11系统3D打地鼠游戏的方案 1079986725 手机游戏开发者 Windows 游戏 java 玩游戏
创建Unity项目：使用UnityHub新建3D项目设置目标平台为Windows场景搭建：csharp//地鼠控制器WhackAMole.csusingUnityEngine;usingSystem.Collections;publicclassWhackAMole:MonoBehaviour{publicfloatpopupDuration=1.5f;publicfloatminHideTime
Axure RP从入门到精通（五十七）灵魂提问 - 写PRD需求文档是使用Word文档还是Axure？风流少年 Axure RP 从入门到精通 axure
在实际工作中有些公司使用Word文档来写需求文档（一般是大公司），有些公司使用Axure来写需求文档，他们习惯在画原型的时候在旁边写需求，并用辅助线来连接需求说明和对应的功能（组件），那么我们应该如何选择使用方式？？？一：使用Word文档写需求文档的优劣势1.1优势方便存档，方便交接和传播（传递）；方便习惯使用Word文档的技术人员；方便发邮件做报告；还对于一些有较复杂流程，需要用到各种图示的产品
[学习笔记] Windows编程——GDI——（六）设备上下文根本没在怕哦 Windows 编程学习笔记 windows
前言：学习笔记，随时更新。如有谬误，欢迎指正。说明：红色字体为较为重要部分。绿色字体为个人理解部分。原文链接：https://learn.microsoft.com/en-us/windows/win32/gdi/device-contexts6设备上下文设备上下文是一种结构，用于定义一组图形对象及其关联属性，以及影响输出的图形模式。图形对象包括用于线条绘制的笔、用于绘制和填充的画刷、用于复制或滚
Android手写签名功能（包含画米字格，人名和书写轨迹） zhang106209 自定义的控件 android 手写签名 Canvas画米子格 Canvas
本文主要介绍Android手写签名的功能实现，效果如下图1、根据人名的个数绘制人的名称这个逻辑分几个步骤：首先创建画笔，然后根据一个字，创建一个字的矩形框，然后根据矩形框获取到画这个字的宽高。//设置抗锯齿mMiPaint.setAntiAlias(true);mMiPaint.setTextSize(strokeWidth);//设置签名笔画样式mMiPaint.setStyle(Paint.S
《无声代码里的银杏时钟》程序员
陆昭的耳机永远比别人多一副。2023年入职那天，他把降噪耳机和助听设备叠在一起塞进耳朵，工位隔板上贴着便签："请打字沟通，谢谢"。"新来的聋子也配做核心组？"茶水间的议论像针一样扎进助听器。他攥紧咖啡杯，屏幕上是祖传的银行核心系统——用了二十年的COBOL代码，每个字符都像生锈的齿轮，稍碰就会崩出火星。第一个月，他在代码注释里画银杏叶。总行老楼前的银杏树是地标，入职培训时HR说："这棵树比系统年龄
Qt+ffmpeg环境搭建技术不支持 qt ffmpeg 开发语言
Qt+ffmpeg环境搭建各平台常见视频开发库举例:iOS：AVFoundationAudioUnitAndroid：MediaPlayer，MediaCodecWindows：DirectShowLinux：GStreamerFFmpeg库是一个跨平台的视频开发库,还有libVLC也是一个跨平台的视频开发库掌握了其中一个库,也能很快上手其它库,因为音视频解码的原理类似引入FFmpeg库有两种方式
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。