AI松子666

深度学习python处理数据脚本

概述

总结深度学习项目中使用到的小工具.

图片与标签xml文件相对应

此脚本文件是为了解决图片与标签xml文件不对应的问题,清理数据,主要体现在图片多出几张或者标签多出几张的情况下.
(这里也可以变成“图片与标签txt文件相对应”，只需要把代码中的xml改成txt就可以了)

#encoding:utf-8
# !/usr/bin/python

'''
USE Method:python move.py --xml xmlpath --pic picpath
//由于path =  os.path.abspath('.')代码，xmlpath取当前路径下的文件夹路径
'''


import os
import sys
import argparse
import os.path
import shutil

path =  os.path.abspath('.')

def parse_args():
    """
    Parse input arguments
    """
    parser = argparse.ArgumentParser(description='cut pic and xml 1 to 2')
    parser.add_argument('--xml', dest='xml', type=str)
    parser.add_argument('--pic', dest='pic',type=str)

    if len(sys.argv) == 1:
        parser.print_help()
        sys.exit(1)

    args = parser.parse_args()
    return args

if __name__ == '__main__':

    args = parse_args()
    print('Called with args:')
    print(args)

    xml = args.xml
    pic = args.pic
    xml_path = path + '/' + xml
    pic_path = path + '/' + pic
    dst_xml_path = path + '/' + "not_pic"
    dst_pic_path = path + '/' + "not_xml"

    if not os.path.exists(dst_pic_path):
        os.mkdir(dst_pic_path)
    else:
        print "此目录已存在！"
        sys.exit(1)

    if not os.path.exists(dst_xml_path):
        os.mkdir(dst_xml_path)
    else:
        print "此目录已存在！"
        sys.exit(1)

    for file in os.listdir(pic_path):
        xml_name = os.path.join(xml_path, os.path.splitext(file)[0] + ".xml")
        if os.path.exists(xml_name):
            print "This file", file, "has xml !"
        elif not os.path.exists(xml_name):
            print "This file", file, "has not xml !"
            shutil.move(os.path.join(pic_path,file), dst_pic_path)

    for file in os.listdir(xml_path):
        pic_name = os.path.join(pic_path, os.path.splitext(file)[0] + ".jpg")
        if os.path.exists(pic_name):
            print "This file", file, "has pic !"
        elif not os.path.exists(pic_name):
            print "This file", file, "has not pic !"
            shutil.move(os.path.join(xml_path, file), dst_xml_path)

    print "Done!"

        #pic_path = os.path.join(pic_path, pic_name)
        #shutil.move(xml_name, dst_path)
        
    #for dirpath, dirnames, filenames in os.walk("f:/"):
     #   for filename in filenames:
      #      if os.path.splitext(filename)[1] == ".txt":
       #        print filepath
        #        copy(filepath, "F:/test/" + filename)
         #       Shutil.move(changeFilePath, dst_path)

修改xml中的标签值

修改标签中的值,这里举例只修改标签中的名称.应用场景:当标签类别需要合并,细标签要合并成粗标签时用到.

#!/usr/bin/python
#-*- coding: utf-8 -*-

'''
USE Method : python modify_xml_label.py
'''
# coding=utf-8
import os
import os.path
import xml.dom.minidom

import sys
reload(sys)
sys.setdefaultencoding("utf-8")

path = "/media/t/disk1/jie_shou_ren_ming/matiansu/output/tail_xml"
outpath = "/media/t/disk1/jie_shou_ren_ming/matiansu/output/tail_output_xml"
files = os.listdir(path)  # 得到文件夹下所有r文件名称
s = []
for xmlFile in files:
    # 遍历文件夹
    portion = os.path.splitext(xmlFile)
    if not os.path.isdir(xmlFile):
        # 判断是否是文件夹,不是文件夹才打开
        # print (xmlFile)
 
        # xml文件读取操作
 
        # 将获取的xml文件名送入到dom解析
	print(xmlFile)
        dom = xml.dom.minidom.parse(os.path.join(path, xmlFile))
        ###最核心的部分os.path.join(path,xmlFile),路径拼接,输入的是具体路径
        root = dom.documentElement
        name = root.getElementsByTagName('name')
        # pose=root.getElementsByTagName('pose')
        # 重命名class name
        for i in range(len(name)):
            # print (name[i].firstChild.data)
            # print(xmlFile)
            # if portion[1] == ".xml":
            #     newname = portion[0] + ".jpg"
            #     print(newname)
            newname ="2"
            if name[i].firstChild.data =="1":
 
                name[i].firstChild.data = newname
                print(name[i].firstChild.data)
 
            # 保存修改到xml文件中
        with open(os.path.join(outpath, xmlFile), 'w') as fh:
            dom.writexml(fh)
            print('修改filename OK!')

生成xml脚本(caffe)

应用场合:通过小批量标注数据,用caffe训练一个初步模型,在通过下面脚本生成xml标签文件,方便后续标注组人员标注.

#!/usr/bin/env python
# set up Python environment: numpy for numerical routines, and matplotlib for plotting
#-*- coding: utf-8 -*-

import glob

from lxml import etree, objectify

import time
import numpy as np
import sys
import cv2
#from pascal_voc_writer import Writer
#import matplotlib.pyplot as plt
# display plots in this notebook
import argparse
# set display defaults
#plt.rcParams['figure.figsize'] = (10, 10)        # large images
#plt.rcParams['image.interpolation'] = 'nearest'  # don't interpolate: show square pixels
#plt.rcParams['image.cmap'] = 'gray'  # use grayscale output rather than a (potentially misleading) color heatmap

# The caffe module needs to be on the Python path;
#  we'll add it here explicitly.
import sys
caffe_root = './'  # this file should be run from {caffe_root}/examples (otherwise change this line)
sys.path.insert(0, caffe_root + 'python')
import os
import caffe
import math
from os import walk
from os.path import join
# If you get "No module named _caffe", either you have not built pycaffe or you have the wrong path.

CLASSES = ('__background__',
           'SmallVehicle', 'bus', 'BigVehicle')

def gen_txt(image,result,filename, path):
    w = image.shape[1]
    h = image.shape[0]
    E = objectify.ElementMaker(annotate=False)
    anno_tree = E.annotation(
        E.folder('JPEGImages'),
        E.filename(filename),
        E.size(
            E.width(w),
            E.height(h),
            E.depth(3)
        ),
        E.segmented(0),
    )
    #etree.ElementTree(anno_tree).write(path[:-4]+".xml", pretty_print=True)
    for i in range(result.shape[1]):
	for j in range(3,7,1):
	    if result[0][i][j]<0:
		result[0][i][j] = 0
	    if result[0][i][j]>1:
		result[0][i][j] = 1
        left = result[0][i][3] * w
        top = result[0][i][4] * h
        right = result[0][i][5] * w
        bot = result[0][i][6] * h
        label = result[0][i][1]
	score = result[0][i][2]
	if(score<0.5) :
	    continue;
        E2 = objectify.ElementMaker(annotate=False)
        anno_tree2 = E2.object(
            E.name(CLASSES[int(label)]),
            E.pose('Unspecified'),
            E.truncated('0'),
            E.difficult('0'),
            E.bndbox(
                E.xmin(int(left)),
                E.ymin(int(top)),
                E.xmax(int(right)),
                E.ymax(int(bot))
            )
        )
	print "i = %d " % i
        anno_tree.append(anno_tree2)
    etree.ElementTree(anno_tree).write(path[:-4]+".xml", pretty_print=True)

def vis_detections(image,result) :
    w = image.shape[1]
    h = image.shape[0]
    for i in range(result.shape[1]):
        left = result[0][i][3] * w
        top = result[0][i][4] * h
        right = result[0][i][5] * w
        bot = result[0][i][6] * h
        score = result[0][i][2]
        label = result[0][i][1]
        box = [left,top,right,bot];
        if(score>0.4) :
            print(left,right,top,bot,score,label)
            cv2.rectangle(image,(int(left), int(top)),(int(right),int(bot)),(0,255,0), 2)

            label = '{:s} {:.3f}'.format(CLASSES[int(label)], score)
            font = cv2.FONT_HERSHEY_SIMPLEX
            size = cv2.getTextSize(label, font, 0.5, 0)[0]
            cv2.rectangle(image,(int(left), int(top)),
                    (int(left+size[0]),int(top+ size[1])),(0,255,0), -1)

            cv2.putText(image, label,(int(left+0.5), int(top+ size[1]+0.5)),font,0.5,(0,0,0),0)
def write_detections(image,result,writer) :
    w = image.shape[1]
    h = image.shape[0]
    for i in range(result.shape[1]):
        left = result[0][i][3] * w
        top = result[0][i][4] * h
        right = result[0][i][5] * w
        bot = result[0][i][6] * h
        score = result[0][i][2]
        label = result[0][i][1]
        if(score>0.1) :
            print(left,right,top,bot,score,label)
            cv2.rectangle(image,(int(left), int(top)),(int(right),int(bot)),(0,255,0), 2)

            label = '{:s}'.format(CLASSES[int(label)])
            font = cv2.FONT_HERSHEY_SIMPLEX
            size = cv2.getTextSize(label, font, 0.5, 0)[0]
            cv2.rectangle(image,(int(left), int(top)),
                    (int(left+size[0]),int(top+ size[1])),(0,255,0), -1)

            cv2.putText(image, label,(int(left), int(top+ size[1])),font,0.5,(0,0,0),0)
            #writer.addObject(label, int(left+0.5), int(top+0.5), int(right+0.5), int(bot+0.5))
def det(image,transformer,net):
    
    transformed_image = transformer.preprocess('data', image)
    #plt.imshow(image)

    net.blobs['data'].data[...] = transformed_image

    ### perform classification
    output = net.forward()

    res = output['detection_out'][0]  # the output probability vector for the first image in the batch
    #print(res.shape)
    return res

def is_imag(filename):
    return filename[-4:] in ['.png', '.jpg']

def main(args):    
 
    caffe.set_mode_gpu()
    model_def = args.model_def
    model_weights = args.model_weights
    
    net = caffe.Net(model_def,      # defines the structure of the model
                    model_weights,  # contains the trained weights
                    caffe.TEST)     # use test mode (e.g., don't perform dropout)
    
    mu = np.array([0.5, 0.5, 0.5])
    # create transformer for the input called 'data'
    transformer = caffe.io.Transformer({'data': net.blobs['data'].data.shape})

    transformer.set_transpose('data', (2,0,1))  # move image channels to outermost dimension
    transformer.set_mean('data', mu)            # subtract the dataset-mean value in each channel
    transformer.set_raw_scale('data', 1.0)      # rescale from [0, 1] to [0, 255]
    transformer.set_channel_swap('data', (2,1,0))  # swap channels from RGB to BGR

    net.blobs['data'].reshape(1,        # batch size
                              3,         # 3-channel (BGR) images
                              args.image_resize, args.image_resize)  # image size is 227x227
    
    filenames = os.listdir(args.image_dir)
    images = filter(is_imag, filenames)
    for image in images :
        
        pic = args.image_dir + image
        input = caffe.io.load_image(pic)       
        image_show =cv2.imread(pic)
        start_time=time.time()
        result = det(input,transformer,net)
        end_time=time.time() 
        print("time:%lf"  % (end_time-start_time))
        #vis_detections(image_show,result)
        gen_txt(image_show,result,image, pic)
        if args.write_voc:
            writer = Writer(pic, input.shape[1], input.shape[0])
            write_detections(image_show,result,writer)
            base = os.path.splitext(pic)[0]
            writer.save(base+".xml")
        else :
            cv2.imshow("Image", image_show)
            #cv2.waitKey (1000)
      
def parse_args():
    parser = argparse.ArgumentParser()
    '''parse args'''
    parser.add_argument('--image_dir', default='/media/t/disk1/DukTo0929/14/')
    parser.add_argument('--model_def', default='/media/t/disk1/jie_shou_ren_ming/guopei/MobileNetSSD_deploy.prototxt')
    parser.add_argument('--model_weights', default='/media/t/disk1/jie_shou_ren_ming/guopei/mobilenet_v2_300x300_iter_10000.caffemodel')
    parser.add_argument('--image_resize', default=608, type=int)
    parser.add_argument('--write_voc', default=False)
    return parser.parse_args()
    
if __name__ == '__main__':
    main(parse_args())

删除满足一定条件的标注框

应用场景:例如删除标注数据中标注框的面积小于10000的框.

#!/usr/bin/python
#-*- coding: utf-8 -*-

'''
USE Method : python modify_xml_label.py
'''
# coding=utf-8
import os
import os.path
from lxml import etree, objectify
import xml.dom.minidom

import sys
reload(sys)
sys.setdefaultencoding("utf-8")

path = "/home/t/data/VOCdevkit/MyDataSet/Annotations"
outpath = "/home/t/data/VOCdevkit/MyDataSet/Annotations_output"

def gen_txt(w,h,result,filename,path):
    E = objectify.ElementMaker(annotate=False)
    anno_tree = E.annotation(
        E.folder('JPEGImages'),
        E.filename(filename),
	#E.path(path),
        E.size(
            E.width(w),
            E.height(h),
            E.depth(3)
        ),
        E.segmented(0),
    )
    for i in range(len(result)):
        E2 = objectify.ElementMaker(annotate=False)
        anno_tree2 = E2.object(
            E.name(result[i][0]),
            E.pose('Unspecified'),
            E.truncated('0'),
            E.difficult('0'),
            E.bndbox(
                E.xmin(result[i][1]),
		E.xmax(result[i][2]),
                E.ymin(result[i][3]),
                E.ymax(result[i][4])
            )
        )
	print "i = %d " % i
        anno_tree.append(anno_tree2)
    etree.ElementTree(anno_tree).write(path, pretty_print=True)

files = os.listdir(path)  # 得到文件夹下所有r文件名称

for xmlFile in files:
    # 遍历文件夹
    portion = os.path.splitext(xmlFile)
    rect_coordinates = []
    if not os.path.isdir(xmlFile):
        # 判断是否是文件夹,不是文件夹才打开
        # print (xmlFile)
 
        # xml文件读取操作
 
        # 将获取的xml文件名送入到dom解析
	print(xmlFile)
        dom = xml.dom.minidom.parse(os.path.join(path, xmlFile))
        ###最核心的部分os.path.join(path,xmlFile),路径拼接,输入的是具体路径
        root = dom.documentElement
        xmin = root.getElementsByTagName('xmin')
        ymin = root.getElementsByTagName('ymin')
        xmax = root.getElementsByTagName('xmax')
        ymax = root.getElementsByTagName('ymax')
	width = root.getElementsByTagName('width')
	height = root.getElementsByTagName('height')
	name = root.getElementsByTagName('name')

        # pose=root.getElementsByTagName('pose')
        # 重命名class name
	if(0 == len(xmin)):
	    continue
        for i in range(len(xmin)):
            # print (name[i].firstChild.data)
            # print(xmlFile)
            # if portion[1] == ".xml":
            #     newname = portion[0] + ".jpg"
            #     print(newname)
	    rect_coordinate = []
            area  = ((int)(xmax[i].firstChild.data)-(int)(xmin[i].firstChild.data))*((int)(ymax[i].firstChild.data)-(int)(ymin[i].firstChild.data))
            
            if area < 10000:
 		print area
                continue
	    else:
		rect_coordinate.append(name[i].firstChild.data)
		rect_coordinate.append(xmin[i].firstChild.data)
		rect_coordinate.append(xmax[i].firstChild.data)
		rect_coordinate.append(ymin[i].firstChild.data)
		rect_coordinate.append(ymax[i].firstChild.data)
                rect_coordinates.append(rect_coordinate)
    	gen_txt(width[0].firstChild.data,height[0].firstChild.data,rect_coordinates,xmlFile,os.path.join(outpath, xmlFile))
            # 保存修改到xml文件中
        #with open(os.path.join(outpath, xmlFile), 'w') as fh:
            #dom.writexml(fh)
            #print('修改filename OK!')

caffe测试python脚本

caffe前向推理脚本:

import numpy as np  
import sys,os  
import cv2
caffe_root = './caffe_ssd/'  # this file should be run from {caffe_root}/examples (otherwise change this line)
sys.path.insert(0, caffe_root + 'python')
import caffe  

net_file= './MobileNetSSD_deploy.prototxt'  
caffe_model='./mobilenet_v2_300x300_iter_2000.caffemodel'  

test_dir = "/media/t/disk1/chengyun/vehicle_data_v2/kakou/JPEGImages"

if not os.path.exists(caffe_model):
    print(caffe_model + " does not exist")
    exit()
if not os.path.exists(net_file):
    print(net_file + " does not exist")
    exit()
net = caffe.Net(net_file, caffe_model, caffe.TEST)  

CLASSES = ('background',
           'car')


def preprocess(src):
    img = cv2.resize(src, (300,300))
    #img = img - np.array([104.0, 117.0, 123.0])
    img = img - 127.5
    img = img * 0.007843
    return img

def postprocess(img, out):   
    h = img.shape[0]
    w = img.shape[1]
    box = out['detection_out'][0,0,:,3:7] * np.array([w, h, w, h])

    cls = out['detection_out'][0,0,:,1]
    conf = out['detection_out'][0,0,:,2]
    return (box.astype(np.int32), conf, cls)

def detect(imgfile):
    origimg = cv2.imread(imgfile)
    img = preprocess(origimg)
    
    img = img.astype(np.float32)
    img = img.transpose((2, 0, 1))

    net.blobs['data'].data[...] = img
    out = net.forward()  
    box, conf, cls = postprocess(origimg, out)

    for i in range(len(box)):
       p1 = (box[i][0], box[i][1])
       p2 = (box[i][2], box[i][3])
       width = box[i][2] - box[i][0]
       height = box[i][3] - box[i][1]
       #cv2.rectangle(origimg, p1, p2, (255,0,0), 2)
       p3 = (max(p1[0], 15), max(p1[1], 15))
       cv2.rectangle(origimg, p1, p2, (255,0,0), 2)
       title = "%s:%.2f" % (CLASSES[int(cls[i])], conf[i])
       cv2.putText(origimg, title, p3, cv2.FONT_ITALIC, 1, (0, 255, 0), 2)
    #cv2.imshow("SSD", origimg)
    cv2.imwrite(os.path.join("imgs_res", os.path.basename(imgfile)), origimg)
    #k = cv2.waitKey(0) & 0xff
        #Exit if ESC pressed
    #if k == 27 : return False
    return True

for f in os.listdir(test_dir):
    if detect(test_dir + "/" + f) == False:
       break

将图片分成白天和晚上

#!/usr/bin/env python
# set up Python environment: numpy for numerical routines, and matplotlib for plotting
#-*- coding: utf-8 -*-

import glob

import time
import numpy as np
import sys
import cv2
#from pascal_voc_writer import Writer
#import matplotlib.pyplot as plt
# display plots in this notebook
import argparse
# set display defaults
#plt.rcParams['figure.figsize'] = (10, 10)        # large images
#plt.rcParams['image.interpolation'] = 'nearest'  # don't interpolate: show square pixels
#plt.rcParams['image.cmap'] = 'gray'  # use grayscale output rather than a (potentially misleading) color heatmap

# The caffe module needs to be on the Python path;
#  we'll add it here explicitly.
import sys
import os
#import python
import math
from os import walk
from os.path import join
# If you get "No module named _caffe", either you have not built pycaffe or you have the wrong path.

def get_image_list(image_dir, suffix=['jpg','JPG','png']):
    '''get all image path ends with suffix'''
    if not os.path.exists(image_dir):
        print("PATH:%s not exists" % image_dir)
        return []
    imglist = []
    filenames = []
    for root, sdirs, files in os.walk(image_dir):
        if not files:
            continue
        for filename in files:
            filepath = os.path.join(root, filename)
            if filename.split('.')[-1] in suffix:
                imglist.append(filepath)
		filenames.append(filename)
    return imglist,filenames

def is_night_or_day(img,thres0=40,thres1=100):
    img_BGR = img.copy()
    img_HSV = cv2.cvtColor(img_BGR,cv2.COLOR_BGR2HSV)
    img_H,img_S,img_V = cv2.split(img_HSV)
    average_V = np.sum(np.reshape(img_V,(img_V.size,))) / img_V.size
    if (average_V < thres0):
	return 0
    elif (average_V > thres1):
        return 1
    else:
	return 2

if __name__ == '__main__':
    image_src = '/media/t/disk1/jie_shou_ren_ming/chengyun/vehicle_data_v2/kakou/JPEGImages'
    image_src_path , filenames = get_image_list(image_src, suffix=['jpg','JPG','png'])
    for i in range(len(image_src_path)):
        image_show =cv2.imread(image_src_path[i])
	dst_img_name = filenames[i]
	if (is_night_or_day(image_show) == 0):
	    cv2.imwrite('/media/t/disk1/jie_shou_ren_ming/chengyun/vehicle_data_v2/kakou/output'+'/night/'+dst_img_name,image_show)
	elif (is_night_or_day(image_show) == 1):
	    cv2.imwrite('/media/t/disk1/jie_shou_ren_ming/chengyun/vehicle_data_v2/kakou/output'+'/day/'+dst_img_name,image_show)
	else:
	    cv2.imwrite('/media/t/disk1/jie_shou_ren_ming/chengyun/vehicle_data_v2/kakou/output'+'/others/'+dst_img_name,image_show)

截取ROI区域的图片

#encoding:utf-8
import cv2
import argparse
import sys
import os
import xml.dom.minidom

path =  os.path.abspath('.')

def parse_args():
    """
    Parse input arguments
    """
    parser = argparse.ArgumentParser(description='save classes to folder')
    parser.add_argument('--xml', dest='xml', type=str)
    parser.add_argument('--pic', dest='pic', type=str)

    if len(sys.argv) == 1:
        parser.print_help()
        sys.exit(1)

    args = parser.parse_args()
    return args

def ReadXml(xmlfile):
    dom = xml.dom.minidom.parse(xmlfile)        #打开xml文档
    root = dom.documentElement               #得到xml文档对象

    name = root.getElementsByTagName('name')

    xmin = root.getElementsByTagName('xmin')
    ymin = root.getElementsByTagName('ymin')
    xmax = root.getElementsByTagName('xmax')
    ymax = root.getElementsByTagName('ymax')

    results = []

    for i in range(len(name)):
        imgbox = [int(xmin[i].firstChild.data),int(ymin[i].firstChild.data),int(xmax[i].firstChild.data),int(ymax[i].firstChild.data)]
        results.append({'name':name[i].firstChild.data.encode("utf-8"), 'imgbox':imgbox})

    return results

def saveimg(dir,picfile):
    img = cv2.imread(picfile)
 #   if img == None :
 #       print None
 #       return "0"
    xml_class = dir['name']

    xml_class_path = os.path.join(path , 'classes1',xml_class)
    pic_class = os.path.join(xml_class_path,os.path.splitext(x)[0] + ".jpg")

    if not os.path.exists(xml_class_path):
        os.mkdir(xml_class_path)
        class_img = img[dir['imgbox'][1]:dir['imgbox'][3], dir['imgbox'][0]:dir['imgbox'][2]]
        cv2.imwrite(pic_class,class_img)
    else:
        class_img = img[dir['imgbox'][1]:dir['imgbox'][3], dir['imgbox'][0]:dir['imgbox'][2]]
        cv2.imwrite(pic_class, class_img)

if __name__ == '__main__':

    args = parse_args()
    print('Called with args:')
    print(args)

    pic_folder = args.pic
    xml_folder = args.xml

    pic_folder_path = os.path.join(path,pic_folder)
    xml_folder_path = os.path.join(path,xml_folder)

    if not os.path.exists(os.path.join(path, 'classes1')):
        os.mkdir(os.path.join(path, 'classes1'))
    else:
        print "此目录已存在！"
        sys.exit(1)

    for x in os.listdir(xml_folder_path) :

        xml_file_path = os.path.join(xml_folder_path,x)
        pic_file_path = os.path.join(pic_folder_path,os.path.splitext(x)[0]  + ".jpg")
        results = ReadXml(xml_file_path)

        print xml_file_path
        print pic_file_path

        for num in xrange(len(results)) :
            saveimg(results[num],pic_file_path)
            
        print "This file has done! "
        print "_______________________________________"

    print 'Done'

xml转txt文件的脚本

我们知道使用labelimg标注好的文件格式是.xml文件如果我们要使用yolov5就需要把它转换成yolov5需要的文件格式 .txt （这是重点）代码附下：

# -*- coding: utf-8 -*-
import os
import xml.etree.ElementTree as ET
 
dirpath = r'D:\pythonProject1\yolov5-6.0\bottle_dataset\stronger\xml'  # 原来存放xml文件的目录
newdir = r'D:\pythonProject1\yolov5-6.0\bottle_dataset\stronger\labels'  # 修改label后形成的txt目录
 
if not os.path.exists(newdir):
    os.makedirs(newdir)
 
dict_info = {'green': 0, 'transparent': 1, 'white': 2, 'blue': 3, 'unknown': 4, 'orange': 5}  # 有几个 类别 填写几个label names
 
for fp in os.listdir(dirpath):
    if fp.endswith('.xml'):
        root = ET.parse(os.path.join(dirpath, fp)).getroot()
 
        xmin, ymin, xmax, ymax = 0, 0, 0, 0
        sz = root.find('size')
        width = float(sz[0].text)
        height = float(sz[1].text)
        filename = root.find('filename').text
        for child in root.findall('object'):  # 找到图片中的所有框
 
            sub = child.find('bndbox')  # 找到框的标注值并进行读取
            label = child.find('name').text
            label_ = dict_info.get(label)
            if label_:
                label_ = label_
            else:
                label_ = 0
            xmin = float(sub[0].text)
            ymin = float(sub[1].text)
            xmax = float(sub[2].text)
            ymax = float(sub[3].text)
            try:  # 转换成yolov3的标签格式，需要归一化到（0-1）的范围内
                x_center = (xmin + xmax) / (2 * width)
                x_center = '%.6f' % x_center
                y_center = (ymin + ymax) / (2 * height)
                y_center = '%.6f' % y_center
                w = (xmax - xmin) / width
                w = '%.6f' % w
                h = (ymax - ymin) / height
                h = '%.6f' % h
            except ZeroDivisionError:
                print(filename, '的 width有问题')
            with open(os.path.join(newdir, fp.split('.xml')[0] + '.txt'), 'a+') as f:
                f.write(' '.join([str(label_), str(x_center), str(y_center), str(w), str(h) + '\n']))
print('ok')

代码只需要更改5，6行的文件路径和第11行你所标注的类别即可。

注：.xml转化成.txt文件放入labels内。

注：我们用到的所有照片放入JPEGImage内。

生成的.txt内容如下（以我的数据为例）第一列是设定的标签，后面是坐标位置

yolo的txt标签文件转换成voc的xml文件脚本

网上很多xml转txt格式的，却没有txt转xml格式的，自己写了脚本如下：
txt标签文件格式

xml文件格式

转换代码如下：

#coding=utf-8
#makexml("txt所在文件夹","xml保存地址","图片所在地址")

from xml.dom.minidom import Document
import os
import cv2

def makexml(txtPath,xmlPath,picPath): #读取txt路径，xml保存路径，数据集图片所在路径
        dict = {'0': "person",#字典对类型进行转换
                '1': "car",
                '2': "bus",
                '3': "truck"}
        files = os.listdir(txtPath)
        for i, name in enumerate(files):
          xmlBuilder = Document()
          annotation = xmlBuilder.createElement("annotation")  # 创建annotation标签
          xmlBuilder.appendChild(annotation)
          txtFile=open(txtPath+name,'r',encoding='iso8859-1')
          txtList = txtFile.readlines()
          img = cv2.imread(picPath+name[0:-4]+".jpg")
          print(picPath+name[0:-4]+".jpg")
          Pheight,Pwidth,Pdepth=img.shape
          #for i in txtList:
          #oneline = i.strip().split(" ")

          folder = xmlBuilder.createElement("folder")#folder标签
          folderContent = xmlBuilder.createTextNode("VOC2007")
          folder.appendChild(folderContent)
          annotation.appendChild(folder)

          filename = xmlBuilder.createElement("filename")#filename标签
          filenameContent = xmlBuilder.createTextNode(name[0:-4]+".jpg")
          filename.appendChild(filenameContent)
          annotation.appendChild(filename)

          size = xmlBuilder.createElement("size")# size标签
          width = xmlBuilder.createElement("width")  # size子标签width
          widthContent = xmlBuilder.createTextNode(str(Pwidth))
          width.appendChild(widthContent)
          size.appendChild(width)
          height = xmlBuilder.createElement("height") # size子标签height
          heightContent = xmlBuilder.createTextNode(str(Pheight))
          height.appendChild(heightContent)
          size.appendChild(height)
          depth = xmlBuilder.createElement("depth") # size子标签depth
          depthContent = xmlBuilder.createTextNode(str(Pdepth))
          depth.appendChild(depthContent)
          size.appendChild(depth)
          annotation.appendChild(size)

          for i in txtList:
             oneline = i.strip().split(" ")
             object = xmlBuilder.createElement("object")
             picname = xmlBuilder.createElement("name")
             if oneline[0]>='4':
                continue
             nameContent = xmlBuilder.createTextNode(dict[oneline[0]])
             picname.appendChild(nameContent)
             object.appendChild(picname)
             pose = xmlBuilder.createElement("pose")
             poseContent = xmlBuilder.createTextNode("Unspecified")
             pose.appendChild(poseContent)
             object.appendChild(pose)
             truncated = xmlBuilder.createElement("truncated")
             truncatedContent = xmlBuilder.createTextNode("0")
             truncated.appendChild(truncatedContent)
             object.appendChild(truncated)
             difficult = xmlBuilder.createElement("difficult")
             difficultContent = xmlBuilder.createTextNode("0")
             difficult.appendChild(difficultContent)
             object.appendChild(difficult)
             bndbox = xmlBuilder.createElement("bndbox")
             xmin = xmlBuilder.createElement("xmin")
             mathData=int(((float(oneline[1]))*Pwidth+1)-(float(oneline[3]))*0.5*Pwidth)
             if mathData<0:
                mathData= 0
             xminContent = xmlBuilder.createTextNode(str(mathData))
             xmin.appendChild(xminContent)
             bndbox.appendChild(xmin)
             ymin = xmlBuilder.createElement("ymin")
             mathData = int(((float(oneline[2]))*Pheight+1)-(float(oneline[4]))*0.5*Pheight)
             if mathData<0:
                mathData= 0
             yminContent = xmlBuilder.createTextNode(str(mathData))
             ymin.appendChild(yminContent)
             bndbox.appendChild(ymin)
             xmax = xmlBuilder.createElement("xmax")
             mathData = int(((float(oneline[1]))*Pwidth+1)+(float(oneline[3]))*0.5*Pwidth)
             if mathData > Pwidth:
                mathData= Pwidth
             xmaxContent = xmlBuilder.createTextNode(str(mathData))
             xmax.appendChild(xmaxContent)
             bndbox.appendChild(xmax)
             ymax = xmlBuilder.createElement("ymax")
             mathData = int(((float(oneline[2]))*Pheight+1)+(float(oneline[4]))*0.5*Pheight)
             if mathData > Pheight:
                mathData= Pheight
             ymaxContent = xmlBuilder.createTextNode(str(mathData))
             ymax.appendChild(ymaxContent)
             bndbox.appendChild(ymax)
             object.appendChild(bndbox)

             annotation.appendChild(object)

          f = open(xmlPath+name[0:-4]+".xml", 'w')
          xmlBuilder.writexml(f, indent='\t', newl='\n', addindent='\t', encoding='utf-8')
          f.close()

if __name__ == "__main__":
	txt_path = '/root/zhangsong/huawei/data/zsmodify_data/txt/'
	xml_path = '/root/zhangsong/huawei/data/zsmodify_data/Annotations/'
	image_path = '/root/zhangsong/huawei/data/zsmodify_data/JPEGImages/'
	
	makexml(txt_path,xml_path,image_path)

python遍历获取文件：for (root, dirs, files) in walk(roots)：

注意事项：这是个遍历类似于生成器的感觉，一层一层遍历直接上代码，帮助大家清晰理解：
测试代码如下

path = 'F:/KuGou'
def file_name(file_dir):
    a = 1
    for root, dirs, files in os.walk(file_dir):#遍历文件夹、根目录、目录文件夹、目录里的文件
        print(root)
        print("*****************")
        print(dirs)
        print("************")
        print(files)
        print(a)
        a +=1
file_name(path)

结果如下


F:/KuGou
*****************
['01', '02']
************
[]
1
F:/KuGou\01
*****************
[]
************
['1.png', '2.png']
2
F:/KuGou\02
*****************
[]
************
['2018120618453717793.pdf']
3

删除爬虫出来的小图片

爬虫爬了大量的图片，但的图片大小残次不齐，下面的代码目的是删除小于20K的图片
这里图片size小于250*250的就会删除，最后计算一个小于20K文件的百分比。但第一次运行的时候先不要运行remove语句，毕竟20K的闸值需要你自己设定的

import os

'''
DirList = [
    '/home/king/PycharmProjects/nsfw_data_scrapper/raw_data/drawings',
    '/home/king/PycharmProjects/nsfw_data_scrapper/raw_data/hentai',
    '/home/king/PycharmProjects/nsfw_data_scrapper/raw_data/neutral',
    '/home/king/PycharmProjects/nsfw_data_scrapper/raw_data/porn',
    '/home/king/PycharmProjects/nsfw_data_scrapper/raw_data/sexy']
'''
DirList = [
    'E:\\projection\\fair\\data\\dataset\\open_fire']


for path in DirList:
    print(path)
    tall = 0
    small = 0
    for filename in os.listdir(path):
        fullName = os.path.join(path, filename)
        size = os.path.getsize(fullName)
        if size < 250 * 250:
            small = small + 1
            os.remove(fullName)
        tall = tall + 1
    print(tall, small, small/tall * 100)

python脚本文件操作删除满足一定条件的文件内容（darknet标签文件修改）

#删除类型为0（火）的标签
with open(label_file,"r",encoding="utf-8") as f:
    read_lines = f.readlines()
    #print(lines)
with open(label_file,"w",encoding="utf-8") as f_w:
    for read_line in read_lines:
        if int(read_line.split()[0]) == 0:
            continue   
        else:
            #类型为0的标签之外，所有标签类别减1
            modefy_read_line_list = list(read_line)
            if int(modefy_read_line_list[0]) > 0 :
                modefy_read_line_list[0] = str(int(modefy_read_line_list[0]) -1)
                read_line = ''.join(modefy_read_line_list)
        f_w.write(read_line)

opencv-python图片基本操作

scr_img = cv2.imread(image_path）
#scr_img.shape[0] #图像的高度
#scr_img.shape[1] #图像的宽度
xmins = xmins * scr_img.shape[1]
ymins = ymins * scr_img.shape[0]
xmaxs = xmaxs * scr_img.shape[1]
ymaxs = ymaxs * scr_img.shape[0]
out_iou_img = scr_img[(int)(ymins):(int)(ymaxs),(int)(xmins):(int)(xmaxs)]     #截取ROI区域的图片
cv2.imwrite(output_file + 'cat_{}_{}.jpg'.format(i,objects_num),out_iou_img)   #保存图片

图片的复制粘贴（用于数据增强）

如果想将两张图像进行融合，只需再读取一张图像即可，方法原理类似。实现代码如下：

# -*- coding:utf-8 -*-
import cv2
import numpy as np

#读取图片
img = cv2.imread("test.jpg", cv2.IMREAD_UNCHANGED)
test = cv2.imread("test3.jpg", cv2.IMREAD_UNCHANGED)

#定义300*100矩阵 3对应BGR
face = np.ones((200, 200, 3))

#显示原始图像
cv2.imshow("Demo", img)

#显示ROI区域
face = img[100:300, 150:350]
test[400:600,400:600] = face
cv2.imshow("Pic", test)

#等待显示
cv2.waitKey(0)
cv2.destroyAllWindows()

修改文件名

#-*- coding: utf-8 -*-
#!/usr/bin/env python
'''
USE Method:python ./modify_file_name.py                
'''
#-*- coding: utf-8 -*-
#!/usr/bin/env python
'''
USE Method:python ./modify_file_name.py                
'''
import os
import glob
import cv2
global count
def get_image_list(image_dir, suffix=['jpg','JPG','png']):
    '''get all image path ends with suffix'''
    if not os.path.exists(image_dir):
        print("PATH:%s not exists" % image_dir)
        return []
    imglist = []
    count = 0
    for root, sdirs, files in os.walk(image_dir):
        if not files:
            continue
        for filename in files:
            filepath = os.path.join(root, filename)
            print('*************')
	        #filename = filename + '.jpg'
            if filename.split('.')[-1] in suffix:
                newpath = os.path.join(root, 'crawler0_20210106_') + str(count) + '.jpg'
                os.rename(filepath,newpath)
                count += 1
    return imglist

if __name__ == '__main__':
    image_src = r'C:\Users\Administrator\Desktop\crawler0'
    image_src_path = get_image_list(image_src, suffix=['jpg','JPG','png'])

随机删除图片

如果图片有点多余，可以随机删除一定比例的图片，也可以删除对应的标签文件。

import os  
import io  
import math
import sys
import cv2
import shutil
import random
import numpy as np
from collections import namedtuple, OrderedDict  

label_names = ['person','car','bus','truck','motorcycle','chemical']

def get_files(dir, suffix): 
    res = []
    for root, directory, files in os.walk(dir):
        for filename in files:
            name, suf = os.path.splitext(filename) 

            if suf in suffix:
                #res.append(filename)
                res.append(os.path.join(root, filename))
    return res

def random_filter_image(list_path,random_rate):
    image_list = get_files(list_path, ['.jpg'])
    total_len = len(image_list)
    print('total_label_len', total_len)
    for i in range(0, total_len):
        gen_rate = random.random() 
        #'''
        if (gen_rate < random_rate):
            pass
        else:
            os.remove(image_list[i])
            continue
        #'''
        image_file = image_list[i]
        file_name, type_name = os.path.splitext(image_file)
        file_txt_name = file_name + '.txt'
        with open(file_txt_name,"w",encoding="utf-8") as f_w:
            pass

    random.shuffle(image_list)

def main():  
    global random_rate
    #list_path = r'C:\Users\Administrator\Desktop\negative_image\101\outsourcing_data\201210'
    list_path = r'E:\projection\fair\data\genarate_4to1\negative_image\101\data\20729'

    save_base_dir= r'E:\projection\cat'
    random_rate = 0.25
    random_filter_image(list_path,random_rate)

if __name__ == '__main__':  

    main()

文件重命名

#-*- coding: utf-8 -*-
#!/usr/bin/env python
'''
USE Method:python ./modify_file_name.py                
'''
import os
import glob
import cv2
global count
def get_image_list(image_dir, suffix=['jpg','JPG','png']):
    '''get all image path ends with suffix'''
    if not os.path.exists(image_dir):
        print("PATH:%s not exists" % image_dir)
        return []
    imglist = []
    count = 0
    for root, sdirs, files in os.walk(image_dir):
        if not files:
            continue
        for filename in files:
            filepath = os.path.join(root, filename)
            print('filename*************',filename)
            #print('root*************',root)
	        #filename = filename + '.jpg'
            if filename.split('.')[-1] in suffix:
                newpath = os.path.join(root, 'output') + str(count) + '.mp4'
                print('newpath*************',newpath)
                os.rename(filepath,newpath)
                count += 1
    return imglist

if __name__ == '__main__':
    image_src = r'E:\projection\fair\data\磁盘\output1'
    image_src_path = get_image_list(image_src, suffix=['mp4'])

标签过滤

darknet删除一些不满足要求的标签框，如标签坐标为负值。

import os  
import io  
import math
import sys
import random
import argparse

from collections import namedtuple, OrderedDict  

label_names = ['person','car','bus','truck']

def get_files(dir, suffix): 
    res = []
    for root, directory, files in os.walk(dir): 
        for filename in files:
            name, suf = os.path.splitext(filename) 
            if suf == suffix:
                #res.append(filename)
                res.append(os.path.join(root, filename))
    return res
def gbbox_iou(box1, box2):
    b1_x1, b1_y1, b1_x2, b1_y2 = box1
    b2_x1, b2_y1, b2_x2, b2_y2 = box2

    inter_rect_x1 = max(b1_x1, b2_x1)
    inter_rect_y1 = max(b1_y1, b2_y1)
    inter_rect_x2 = min(b1_x2, b2_x2)
    inter_rect_y2 = min(b1_y2, b2_y2)
   
    inter_width = inter_rect_x2 - inter_rect_x1 + 1
    inter_height = inter_rect_y2 - inter_rect_y1 + 1
    if inter_width > 0 and inter_height > 0:  
        inter_area = inter_width * inter_height
        #iou
        b1_area = (b1_x2 - b1_x1 + 1) * (b1_y2 - b1_y1 + 1)
        b2_area = (b2_x2 - b2_x1 + 1) * (b2_y2 - b2_y1 + 1)
        #iou = inter_area / (b1_area + b2_area - inter_area)
        iou = inter_area / b1_area

    else:
        iou = 0
    return iou

def convert_dataset(list_path, output_file):

    # 读取目录里面所有的 txt标记文件 列表
    label_list = get_files(list_path, '.txt')
    total_label_len = len(label_list)
    random.shuffle(label_list)
    print('total_label_len', total_label_len)
    error_count = 0
    fp=open(output_file,'w')

    for i in range(0, total_label_len):
        sys.stdout.write('\r>> Calculating {}/{} error{}'.format(
            i + 1, total_label_len, error_count))
        sys.stdout.flush()
        
        # 单个Label txt文件读取
        label_file = label_list[i]
        file_name, type_name = os.path.splitext(label_file)
        image_path = file_name + '.jpg'
        if type_name != '.txt' or not os.path.exists(image_path):
            error_count += 1
            print("error_file: ",label_file.encode('UTF-8', 'ignore').decode('UTF-8'))
            continue
        fd = open(label_file, 'r')
        lines = [line.split() for line in fd]
        fd.close()
        error_id = 0
        for line in lines:  
            class_index = int(line[0])
            xmins = float(line[1]) - float(line[3]) / 2
            ymins = float(line[2]) - float(line[4]) / 2
            xmaxs = float(line[1]) + float(line[3]) / 2                             
            ymaxs = float(line[2]) + float(line[4]) / 2 
            if  float(line[3])<=0 or float(line[4]) <= 0 :
                error_id = 1
                print('\n error index: ', class_index, 'label_file', label_file)
                continue
            if class_index >= 3:
                error_id = 1
                print('\n error index: ', class_index, 'label_file', label_file)
                continue
            # if xmins < 0 or ymins < 0 :
            #     error_id = 1
            #     print('\n error index: ', class_index, 'label_file', label_file)
            # if  ymaxs > 1  or xmaxs > 1 :
            #     print('\n error index: ', class_index, 'label_file', label_file)
            #     error_id = 1

        if error_id:
            continue
        # is_person_car = False            
        # bbox_num = len(lines)
        # for  i in range(0, bbox_num):

        #     if int(lines[i][0]) != 0:
        #         continue
        #     for j in range(0, bbox_num):

        #         if i==j or int(lines[j][0])==0:
        #             continue
        #         xmins = float(lines[i][1]) - float(lines[i][3]) / 2
        #         ymins = float(lines[i][2]) - float(lines[i][4]) / 2
        #         xmaxs = float(lines[i][1]) + float(lines[i][3]) / 2                             
        #         ymaxs = float(lines[i][2]) + float(lines[i][4]) / 2 

        #         xmins1 = float(lines[j][1]) - float(lines[j][3]) / 2
        #         ymins1 = float(lines[j][2]) - float(lines[j][4]) / 2
        #         xmaxs1 = float(lines[j][1]) + float(lines[j][3]) / 2                             
        #         ymaxs1 = float(lines[j][2]) + float(lines[j][4]) / 2 

        #         box1 = (xmins, ymins, xmaxs, ymaxs)
        #         box2 = (xmins1, ymins1, xmaxs1, ymaxs1)
        #         #过滤行人在车中
        #         iou = gbbox_iou(box1, box2)
        #         if iou > 0.99:
        #            is_person_car = True
        # if  is_person_car:
        #     continue
        print("image_path: ", image_path)
        fp.write(image_path)
        fp.write('\n')
    print('total_label_len', total_label_len)
    fp.close()


def main(): 

    parser = argparse.ArgumentParser(prog='gen_label_list.py')
    parser.add_argument('--img-path', type=str, default='/root/zhangsong/fairworks/github/darknet-master/fireworks/data/smoke', help='test path')
    parser.add_argument('--valid', type=str, default='fireworks/data/test_train.txt', help='*.txt path')
    opt = parser.parse_args()

    print(opt.img_path, opt.valid)
    convert_dataset(opt.img_path, opt.valid)
  
  
if __name__ == '__main__':  
    main()

darknet感兴趣区域截取

import os  
import io  
import math
import sys
import random
import argparse
import cv2

from collections import namedtuple, OrderedDict  

label_names = ['person','car','bus','truck']

def get_files(dir, suffix): 
    res = []
    for root, directory, files in os.walk(dir): 
        for filename in files:
            name, suf = os.path.splitext(filename) 
            if suf == suffix:
                #res.append(filename)
                res.append(os.path.join(root, filename))
    return res
    
def gbbox_iou(box1, box2):
    b1_x1, b1_y1, b1_x2, b1_y2 = box1
    b2_x1, b2_y1, b2_x2, b2_y2 = box2

    inter_rect_x1 = max(b1_x1, b2_x1)
    inter_rect_y1 = max(b1_y1, b2_y1)
    inter_rect_x2 = min(b1_x2, b2_x2)
    inter_rect_y2 = min(b1_y2, b2_y2)
   
    inter_width = inter_rect_x2 - inter_rect_x1 + 1
    inter_height = inter_rect_y2 - inter_rect_y1 + 1
    if inter_width > 0 and inter_height > 0:  
        inter_area = inter_width * inter_height
        #iou
        b1_area = (b1_x2 - b1_x1 + 1) * (b1_y2 - b1_y1 + 1)
        b2_area = (b2_x2 - b2_x1 + 1) * (b2_y2 - b2_y1 + 1)
        #iou = inter_area / (b1_area + b2_area - inter_area)
        iou = inter_area / b1_area
    else:
        iou = 0
    return iou

def convert_dataset(list_path, output_file):
    # 读取目录里面所有的 txt标记文件 列表
    label_list = get_files(list_path, '.txt')
    total_label_len = len(label_list)
    random.shuffle(label_list)
    print('total_label_len', total_label_len)
    error_count = 0

    for i in range(0, total_label_len):
        sys.stdout.write('\r>> Calculating {}/{} error{}\n'.format(
            i + 1, total_label_len, error_count))
        sys.stdout.flush()
        
        # 单个Label txt文件读取
        label_file = label_list[i]
        file_name, type_name = os.path.splitext(label_file)
        #print(file_name)
        #print(file_name.split('\\')[-1] + 'aaaaaa')
        cut_image_name_list = file_name.split('\\')[-2:] #cut_image_name_list is list
        cut_image_name = ''.join(cut_image_name_list) #list to str
        image_path = file_name + '.jpg'
        if type_name != '.txt' or not os.path.exists(image_path):
            error_count += 1
            print("error_file: ",label_file.encode('UTF-8', 'ignore').decode('UTF-8'))
            continue

        scr_img = cv2.imread(image_path) 
        #'''
        #删除类型为0（火）的标签
        with open(label_file,"r",encoding="utf-8") as f:
            read_lines = f.readlines()
            #print(lines)
        with open(label_file,"w",encoding="utf-8") as f_w:
            for read_line in read_lines:
                if int(read_line.split()[0]) == 0:
                    continue   
                else:
                    #所有标签类别减1
                    modefy_read_line_list = list(read_line)
                    if int(modefy_read_line_list[0]) > 0 :
                        modefy_read_line_list[0] = str(int(modefy_read_line_list[0]) -1)
                        read_line = ''.join(modefy_read_line_list)
                #删除标签矩形长宽及面积比较小的图片
                labels_coordi = read_line.split()
                if float(labels_coordi[3]) * scr_img.shape[1] < 30.0 :
                    continue
                if float(labels_coordi[4]) * scr_img.shape[0] < 30.0 :
                    continue
                
                f_w.write(read_line)   
        #'''    

        #截取图片
        fd = open(label_file, 'r')
         
        lines = [line.split()  for line in fd]
        fd.close()

        error_id = 0
        
        objects_num = 0
        #newlabels = []
        for line in lines: 
            '''
            if int(line[0]) == 0:
                continue
            else:
                newlabels
                '''
            class_index = int(line[0])
            xmins = float(line[1]) - float(line[3]) / 2
            ymins = float(line[2]) - float(line[4]) / 2
            xmaxs = float(line[1]) + float(line[3]) / 2                             
            ymaxs = float(line[2]) + float(line[4]) / 2 
            if  float(line[3])<=0 or float(line[4]) <= 0 :
                error_id = 1
                print('\n error index: ', class_index, 'label_file', label_file)
                continue
            if class_index >= 3: 
                error_id = 1
                print('\n error index: ', class_index, 'label_file', label_file)
                continue
            if xmins < 0 :
                xmins = 0 
            if ymins < 0 :
                ymins = 0
            if ymaxs > 1 :
                ymaxs = 1
            if xmaxs > 1 :
                xmaxs = 1
            xmins = xmins * scr_img.shape[1]
            ymins = ymins * scr_img.shape[0]
            xmaxs = xmaxs * scr_img.shape[1]
            ymaxs = ymaxs * scr_img.shape[0]
            out_iou_img = scr_img[(int)(ymins):(int)(ymaxs),(int)(xmins):(int)(xmaxs)]
            '''
            #实现感兴趣区域ROI的复制粘贴
            temp_iou_img = scr_img[0:80,0:200]
            scr_img[100:180,100:300] = temp_iou_img
            cv2.imwrite(output_file + 'zhantie_{}_{}.jpg'.format(i,objects_num),scr_img)
            '''
            
            cv2.imwrite(output_file + '{}_{}.jpg'.format(cut_image_name,objects_num),out_iou_img)
            objects_num += 1
        if error_id:
            continue
        
    print('total_label_len', total_label_len)


def main(): 

    parser = argparse.ArgumentParser(prog='gen_label_list.py')
    parser.add_argument('--img-path', type=str, default='E:\\projection\\fair\\data\\smoke', help='test path')
    parser.add_argument('--out-path', type=str, default='E:\\projection\\forestout\\', help='*.txt path')
    opt = parser.parse_args()

    print(opt.img_path, opt.out_path)
    convert_dataset(opt.img_path, opt.out_path)
  
if __name__ == '__main__':  
    main()

统一图片大小

import os  
import io  
import math
import sys
import cv2
import shutil
import random
import numpy as np
from collections import namedtuple, OrderedDict  

label_names = ['person','car','bus','truck','motorcycle','chemical']

def get_files(dir, suffix): 

    res = []

    for root, directory, files in os.walk(dir): 

        for filename in files:

            name, suf = os.path.splitext(filename) 

            if suf in suffix:
                #res.append(filename)

                res.append(os.path.join(root, filename))
    return res

def uniform_image_size(list_path,width_size,height_size):
    image_list = get_files(list_path, ['.jpg'])
    total_len = len(image_list)
    print('total_label_len', total_len)
    for i in range(0, total_len):
        image_file = image_list[i]
        img = cv2.imread(image_file)
        if img.shape[0] != height_size or img.shape[1] != width_size:
            img = cv2.resize(img, (width_size,height_size), interpolation=cv2.INTER_LINEAR)
            os.remove(image_file)
            cv2.imwrite(image_file, img)
        print('img.shape[0]',img.shape[0],'--------',image_file)

    random.shuffle(image_list)

def main():  

    list_path = r'E:\projection\fair\data\genarate_4to1\negative_image\101'

    width_size = 1280
    height_size = 720

    uniform_image_size(list_path,width_size,height_size)

if __name__ == '__main__':  

    main()

图片打mask

import os
import io
import math
import sys
import cv2
import shutil
import random
import numpy as np
from collections import namedtuple, OrderedDict

label_names = ['person', 'car', 'bus', 'truck', 'motorcycle', 'chemical']

def get_files(dir, suffix):
    res = []

    for root, directory, files in os.walk(dir):

        for filename in files:

            name, suf = os.path.splitext(filename)

            if suf == suffix:
                # res.append(filename)

                res.append(os.path.join(root, filename))
    return res


def convert_dataset(list_path, save_base_dir):
    while True:
        width_rate = random.random()
        if (width_rate > 0.3 and width_rate < 0.7):
            break
        else:
            continue
    while True:
        height_rate = random.random()
        if (height_rate > 0.3 and height_rate < 0.7):
            break
        else:
            continue
    image_list = get_files(list_path, '.jpg')
    total_len = len(image_list)
    print('total_label_len', total_len)

    if not os.path.exists(save_base_dir):
        os.makedirs(save_base_dir)

    random.shuffle(image_list)

    error_count = 0

    image_count = 0

    for i in range(0, total_len):
        image_file = image_list[i]

        img = cv2.imread(image_file)

        img_h, img_w, img_c = img.shape

        print("img: ", img_w, img_h)

        img_name, img_type = os.path.splitext(image_file)

        _, image_name = os.path.split(img_name)

        image_count += 1

        img4 = np.full((img_h, img_w, img.shape[2]), 0, dtype=np.uint8)

        img4[700:1200, :] = img[700:1200, :]

        save_img = save_base_dir + '/' + image_name + str(image_count) + 'preprocess.jpg'

        cv2.imwrite(save_img, img4)


def main():
    list_path = r'F:\gongye\data\biaozhu\JPEGImages\IMG_3462'

    # base_dir = os.getcwd()

    save_base_dir = r'F:\gongye\data\biaozhu\JPEGImages\IMG_3462cutmask'

    # save_base_dir = os.path.join(save_base_dir, 'r554DergCvk4h00')

    convert_dataset(list_path, save_base_dir)


if __name__ == '__main__':
    main()

结果如下：

只列举了一些基本的python脚本,拿去用吧.

你可能感兴趣的:(caffe)

基于Spring Boot的多级缓存架构实现天才选手Yoke springboot java spring boot 缓存架构
基于SpringBoot的多级缓存架构实现以下是一个基于SpringBoot的多级缓存架构实现示例多级缓存架构实现方案1.依赖配置（pom.xml）org.springframework.bootspring-boot-starter-cachecom.github.ben-manes.caffeinecaffeineorg.springframework.bootspring-boot-star
Redis+Guava(二级缓存,Caffeine) yan0219n 工具 redis guava 缓存
/***本地缓存*/privateCachelocalCache=CacheBuilder.newBuilder().concurrencyLevel(16)//并发级别.initialCapacity(1000)//初始容量.maximumSize(1000)//缓存最大长度.expireAfterAccess(1,TimeUnit.HOURS)//缓存1小时没被使用就过期.build();Ca
[WinError 182] 操作系统无法运行 %1 Error loading “.......\torch\lib\caffe2_detectron_ops_gpu.dll“ 研志必有功人工智能 pytorch 深度学习
目录报错原因解决方法报错原因这个是conda环境里面的包出问题了，必须对相关依赖包进行更新解决方法使用win+R启动命令行或者终端，输入condaactivateenv_name(环境名称)进入环境后，再输入以下命令condaupdate-nbaseconda对环境下的所有包进行更新后就不会再报错
Ubuntu系统下交叉编译hdf5 linux运维
一、参考资料hdf5/release_docs/INSTALL_Autotools.txt安装HDF5caffe移植到arm平台HDF5-1.14.3编译Ubuntu系统下HDF5源码安装使用步骤（基于ubuntu22.04版本）二、交叉编译hdf5hdf5依赖zlib，因此编译hdf5之前务必编译zlib库。此外，建议安装szip库，虽然不是必须的。1.下载源码下载hdf5：Indexof/ft
java本地缓存组件之caffeine为什么是性能之王？ rider189 java 开发语言
读者专属福利：零基础java自学视频，从入门到精通1.基于Window-TinyLFU的淘汰算法Caffeine采用Window-TinyLFU（WindowedTinyLeastFrequentlyUsed）算法，结合了LRU（最近最少使用）和LFU（最不经常使用）的优势，解决了传统算法的缺陷：窗口缓存（WindowCache）：保留最近访问的少量条目（类似LRU），用于捕捉突发性短期热点数据。
【深入探索 Caffeine：Java 缓存利器】提前退休了-程序员阿飞 java 缓存 spring
引言咱搞软件开发的时候，缓存可是提升系统性能的关键。用好了缓存，能大大减少对数据库、远程服务这些后端数据源的访问，系统响应更快，吞吐量也能提高。Java里有不少不错的缓存框架，不过Caffeine性能好、功能多，越来越受开发者欢迎了。接下来我就跟你好好唠唠Caffeine的原理、特点还有咋用，让你能把这个厉害的缓存工具用得明明白白。什么是Caffeine？Caffeine是一个基于Java8开发的
Java本地缓存技术选型（Guava Cache、Caffeine、EhCache）子龙技术 java
前言对一个java开发者而言，提到缓存，第一反应就是Redis。利用这类缓存足以解决大多数的性能问题了，我们也要知道，这种属于remotecache（分布式缓存），应用的进程和缓存的进程通常分布在不同的服务器上，不同进程之间通过RPC或HTTP的方式通信。这种缓存的优点是缓存和应用服务解耦，支持大数据量的存储，缺点是数据要经过网络传输，性能上会有一定损耗。与分布式缓存对应的是本地缓存，缓存的进程和
从零开始 CMake 学习笔记（A）hello-cmake OOOrchid 混合计算 c++cmake
从零开始CMake学习笔记（A）hello-cmake最近基于Caffe2C++项目开发算子时，接触到了C++，查找的资料基本又杂又多，官方文档又缺少自己动手的小实验，因此有必要跟着github上的案例学习学习，顺带记录下自己的学习笔记留待后用。定义：CMake可以编译源代码、制作程序库、产生适配器（wrapper）、还可以用任意的顺序建构执行档。CMake支持in-place建构（二进档和源代码
Caffeine缓存 qq_45825178 java 缓存
一、添加Caffeine提供了四种缓存添加策略：手动加载，自动加载，手动异步加载和自动异步加载。1、手动加载cache.get(key,k->value)，当在缓存中不存在该key对应的缓存元素的时候，进行计算生成并直接写入至缓存内，而当该key对应的缓存元素存在的时候将会直接返回存在的缓存值。当缓存的元素无法生成或者在生成的过程中抛出异常而导致生成元素失败，cache.get会返回null。ca
Springboot（四十九）SpringBoot3整合jetcache缓存 camellias_ spring boot 缓存后端
上文中我们学习了springboot中缓存的基本使用。缓存分为本地caffeine缓存和远程redis缓存。现在有一个小小的问题，我想使用本地caffeine缓存和远程redis缓存组成二级缓存。还想保证他们的一致性，这个事情该怎么办呢？Jetcache框架为我们解决了这个问题。‌JetCache‌是一个由阿里巴巴开发的基于Java的缓存系统封装，旨在通过统一的API和注解简化缓存的使用。JetC
Redis+Caffeine多级缓存架构代码实战 web2u 缓存缓存 redis 架构 java spring 数据库
构建本地Caffeine缓存privatefinalCacheLOCAL_CACHE=Caffeine.newBuilder().initialCapacity(1024).maximumSize(10_000L)//最大10000条//缓存5分钟后移除.expireAfterWrite(Duration.ofMinutes(5)).build();Caffeine简介Caffeine是一个高性能
运用Faster RCNN、YOLO经典目标检测算法对滑坡图像进行检测 AngeliaZ Faster RCNN YOLO
本次实验采用的操作系统为Ubuntu16.04平台，编程环境基于Python，GPU为NVIDIAGeForce740m，在基于深度学习框架CAFFE下进行实验。实验输出结果
本地缓存Caffeine 赤橙红的黄缓存缓存 caffe
1、简介Caffine是一款高性能的近似LFU（最近最少频率使用）准入策略的本地缓存组件，Caffeine的底层数据存储采用ConcurrentHashMap，使用WindowTinyLfu回收策略，提供了一个近乎最佳的命中率。适用范围：变更频率低、实时性要求低的数据应用场景：常用数据的枚举值（如类目）；依赖第三方系统一些不频繁变更的键值对（先在本地缓存中查找，若存在则返回，若不存在再调用第三方系
Linux的cuda安装找不到路径,Cuda安装详细步骤 Tom K
为了学习Caffe新买了笔记本，安装cuda时遇到了很多问题，不过好在都成功的解决了。网上有很多cuda的安装教程，每个人的电脑配置不同遇到的问题也不一样，现在就我自己的安装配置情况总结一下具体的安装步骤，因为有同学的正确指导，在实际的安装过程中并没有遇到什么特别大的难题，每一步都很仔细，都查清楚了才开始执行下一步：笔记本主要参数笔记本型号：惠普WASD15-AX019TX(X1G89PA)内存：
落地 dnn对象检测没学上了 dnn 人工智能神经网络
"C:\opencv\opencv\sources\samples\dnn\models.yml"下载opencv的深度模型框架，例如caffe，copyMobileNetSSD_deploy.prototxt和MobileNetSSD_deploy.caffemodel所在的位置，其中prototxt需要后面生成，这两个文件用于std::stringmodel_text_file和std::st
简述Caffe、TensorFlow、TensorFlow Lite、ONNX、DarkNet、PyTorch 等模型科学的发展-只不过是读大自然写的代码断纱检测 caffe tensorflow pytorch
以下是对Caffe、TensorFlow、TensorFlowLite、ONNX、DarkNet和PyTorch等模型的简述：Caffe：Caffe（ConvolutionArchitectureForFeatureExtraction）是一个用于特征抽取的卷积框架，它是一个清晰、可读性高且快速的深度学习框架。Caffe由加州伯克利大学的贾扬清开发，起初是一个用于深度卷积网络的Python框架（无
python神经网络框架有哪些,python调用神经网络模型小明技术分享 python 神经网络深度学习
人工智能Python深度学习库有哪些由于Python的易用性和可扩展性，众多深度学习框架提供了Python接口，其中较为流行的深度学习库如下：第一：CaffeCaffe是一个以表达式、速度和模块化为核心的深度学习框架，具备清晰、可读性高和快速的特性，在视频、图像处理方面应用较多。Caffe中的网络结构与优化都以配置文件形式定义，容易上手，无须通过代码构建网络;网络训练速度快，能够训练大型数据集与S
缓存失效算法孜泽本地缓存 java 后端本地缓存缓存失效算法
缓存失效算法主要是进行缓存失效的，当缓存中的存储的对象过多时，需要通过一定的算法选择出需要被淘汰的对象，一个好的算法对缓存的命中率影响是巨大的。常见的缓存失效算法有FIFO、LRU、LFU，以及Caffeine中的WindowTinyLFU算法。FIFOFIFO算法是一种比较容易实现也最容易理解的算法。它的主要思想就是和队列是一样的，即先进先出（FirstInFirstOut）一般认为一个数据是最
自建stgcn数据集并训练青年夏日科技工作者 AI编程
参考了许多博文，慢慢地也就把st-gcn跑出来了，参考的文章一会附在文章里面，实测有用。1.安装st-gcn复现STGCNCPU版（ubuntu16.04+pytorch0.4.0+openpose+caffe）_Significance的博客-CSDN博客复现旧版STGCNGPU版（win10+openpose1.5.0）_Significance的博客-CSDN博客22.准备训练数据集官方使用
使用onnxruntime-web 运行yolov8-nano推理 CHEN_RUI_2200 机器学习 YOLO
ONNX（OpenNeuralNetworkExchange）模型具有以下两个特点促成了我们可以使用onnxruntime-web直接在web端上运行推理模型，为了让这个推理更直观，我选择了试验下yolov8识别预览图片：1.跨平台兼容性ONNX是一种开放的格式，可以在不同的深度学习框架之间共享模型，如PyTorch、TensorFlow、MXNet和Caffe2。这使得用户可以在一个框架中训练模
分布式二级缓存组件实战（Redis+Caffeine实现）鸨哥学JAVA 程序员 Java 编程 redis 缓存分布式
所谓二级缓存缓存就是将数据从读取较慢的介质上读取出来放到读取较快的介质上，如磁盘-->内存。平时我们会将数据存储到磁盘上，如：数据库。如果每次都从数据库里去读取，会因为磁盘本身的IO影响读取速度，所以就有了像redis这种的内存缓存。可以将数据读取出来放到内存里，这样当需要获取数据时，就能够直接从内存中拿到数据返回，能够很大程度的提高速度。但是一般redis是单独部署成集群，所以会有网络IO上的消
使用 Caffeine 和 Redis 实现高效的二级缓存架构微技术 redis 架构数据库缓存
在现代应用开发中，缓存是提升系统性能的关键手段。为了兼顾本地缓存的高性能和分布式缓存的扩展能力，常见的实现方式是结合使用Caffeine和Redis实现二级缓存架构。本文将详细介绍如何通过SpringBoot实现一个Caffeine+Redis二级缓存，并通过合理的架构设计和代码实现，确保缓存的一致性、性能和容错性。一、需求与挑战1.多级缓存的需求：•一级缓存（Caffeine）：快速响应，存储本
如何确保热点产品查询延迟控制在10ms以内?思维导图代码示例（java 架构) 用心去追梦 java 架构开发语言
为了确保热点产品查询的延迟控制在10ms以内，可以采取一系列优化措施和技术手段。以下是一个思维导图的结构和一个简化的Java架构代码示例，用于展示如何实现这一目标。思维导图结构低延迟查询数据预加载热点数据预测提前加载到内存缓存使用高性能缓存内存级缓存（如Caffeine）分布式缓存（如Redis）缓存一致性管理弱一致性模型缓存更新策略（写后失效、读时更新等）并发处理多线程/异步编程线程池管理数据库
Spring Cache自定义过期时间
背景要求：对数据做统计分析，时间截止到当天零点根据要求，每天查询的数据范围都是截止前一天结束，第二天需要查询新数据。那么缓存只保留一天。使用caffeine简单举个例子，主要依赖有：org.springframework.bootspring-boot-starter-web2.7.18org.springframework.bootspring-boot-starter-cache2.7.18c
深度学习框架人工智能操作系统训练&前向推理 PyTorch Tensorflow MindSpore caffe 张量加速引擎TBE 深度学习编译器多面体 polyhedral AI集群框架 EwenWanW 深度学习人工智能 pytorch 深度学习编译器
深度学习框架人工智能操作系统训练&前向推理深度学习框架发展到今天，目前在架构上大体已经基本上成熟并且逐渐趋同。无论是国外的Tensorflow、PyTorch，亦或是国内最近开源的MegEngine、MindSpore，目前基本上都是支持EagerMode和GraphMode两种模式。AI嵌入式框架OneFlow&清华计图Jittor&华为深度学习框架MindSpore&旷视深度学习框架MegEn
Caffeine 与 Guava Cache 雨季里的向日葵 java
一、概要1.1背景在项目开发中，为提升系统性能，减少IO开销，本地缓存是必不可少的。最常见的本地缓存是Guava和Caffeine，Caffeine是基于GoogleGuavaCache设计经验改进的结果，相较于Guava在性能和命中率上更具有效率。1.2应用场景愿意消耗一些内存空间来提升速度预料到某些键会被多次查询缓存中存放的数据总量不会超出内存容量二、GuavaCache2.1GuavaCac
OSError: [WinError 126] 找不到指定的模块---caffe2_detectron_ops_gpu.dll 努力的小柚 python运行问题 python pytorch
代码复现记录：问题：OSError:[WinError126]找不到指定的模块。Errorloading"C:\Anaconda\Anaconda3\envs\TIN\lib\site-packages\torch\lib\caffe2_detectron_ops_gpu.dll"oroneofitsdependencies.在搜索很多关于无法查找到caffe2_detectron_ops_gpu
caffe/PyTorch/TensorFlow 在Jupyter Notebook GPU中运用俊俏的萌妹纸 caffe 人工智能深度学习
在JupyterNotebook中使用Caffe框架并利用GPU加速，可以实现多种效果和目的，主要集中在深度学习领域。以下是一些主要的应用场景：快速训练模型：GPU加速可以显著提高模型训练的速度。对于大型数据集和复杂的神经网络结构，使用GPU可以大大减少训练时间。实时数据增强：在训练过程中，可以实时地对输入数据进行变换和增强，以提高模型的泛化能力。GPU加速使得这些操作更加高效。大规模数据处理：深
Linux下Caffe、Docker、Tensorflow、PyTorch环境搭建(CentOS 7) SnailTyan
文章作者：Tyan博客：noahsnail.com|CSDN|注：模型的训练、测试、部署都可以通过Docker环境完成，环境问题会更少。1.CUDA8.0安装CUDA8.0Configenvvariables#CUDAPATHexportPATH="/usr/local/cuda-8.0/bin:$PATH"#CUDALDLIBRARY_PATHexportLD_LIBRARY_PATH="/us
JVM级缓存本地缓存Caffeine 旺仔爱Java JVM专题 jvm JVM缓存本地缓存 Caffeine Guava Cache
JVM级缓存本地缓存Caffeine和GuavaCache前言一、创建缓存的代码逻辑二、Caffeine的优化方面淘汰算法W-TinyLFU三、Caffeine的业务使用总结前言最新的Java面试题，技术栈涉及Java基础、集合、多线程、Mysql、分布式、Spring全家桶、MyBatis、Dubbo、缓存、消息队列、Linux…等等，会持续更新。一、创建缓存的代码逻辑Caffeine：publ
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st