粼粼淇

从VOC,ImageNet,COCO,OpenImage等数据集中挑选自己需要的类别数据

VOC,ImageNet,COCO,OpenImage是CV行业常用的开源数据集，其中VOC比较古老了，ImageNet名气最响，种类和图片量较多，OpenImage种类和图片量最大，COCO介于他们之间吧。很多时候我们并不需要这些数据集中的所有数据，而是其中一小部分，因此需要从原始数据中挑选出自己需要的类别数据，下面就来我在这些数据集合中挑选我需要类别的一点小结。

首先要说明的是，这些数据集的标记文件都是不一样的，具体如下：

VOC：xml。标记中直接使用目标类别名称，和绝对尺寸的标记框

ImageNet：xml。标记中直接使用目标类别词条索引，和绝对尺寸的标记框

COCO：json。标记中直接使用目标类别名称，和绝对尺寸的标记框

OpenImage：csv。标记中直接使用目标类别词条索引，和相对尺寸的标记框

因为我还需要自己标注一些数据，采用的是labelimg这个软件标注的，为了方便数据查看和格式统一，这里我把挑选的数据标注文件格式都统一转化为和VOC相同的xml格式，数据具体结构也和VOC大致一样，不过为了方便管理增添了一些信息，这个我在下面挑选VOC数据集时会说明一下。

为了简洁，我直接附上代码吧。还有为了便于数据管理，我采用了用类别名来+图片编号来命名图片名和标注文件名，为啥采用这种格式，主要考虑基于下面几点（最根本原因是方便图片管理）：

还是先上一张VOC图片命名方式（年号+图像编号）的图片吧，有图有真相

再上一张我的图片命名样式图吧

这两个什么不同吧，你看第一种命名方式，你不细看图片内容，你能知道图片有啥吗？鬼知道呀。但我采用的是类别+当前类别图片编号命名，如果一个图片有多个类别，优先级高的类别具有图片命名权，比如我在VOC中挑选的类别有car和bird,其中car的优先级最高，因此当一张图片中同时含有car和bird时，car具有图片命名权。此时你一看文件名字你就知道这张图片至少有个啥目标。这么做主要有一下几点考虑：

1、方便数据管理。你不用统计你特别关注的类别样本数，只要通过最后一个文件的名字就能估计出当前数据库最少有多少个样本

2、方便数据管理。切分train,val,test时不用担心你特别关注的类别样本都划到trian或val后test去了

3、方便数据管理。检测效果不好，你需要补充数据，你知道急需补充的是哪些

嗯，好像大致就这些

首先附上VOC格式的xml操作处理函数，下面挑选数据和转化需要用到。因为函数名基本说明了各个函数干什么用的，在此我就不多解释，有点基础一看就知道了，下面的程序采用的是python2写得，转到python3会有些问题，主要是print，还有字典，python3中去掉了has_key等一些问题，有些地方现在看不是那么优雅，算了懒得改了，python2中反正能用的。

#!/usr/bin/python
# -*- coding: UTF-8 -*-
# 2018/08/15 by DQ

import os,sys
reload(sys)
sys.setdefaultencoding('UTF-8')

from xml.etree.ElementTree import Element, SubElement, ElementTree
try:
	import xml.etree.cElementTree as ET
except ImportError:
	import xml.etree.ElementTree as ET
	
##get object annotation bndbox loc start
def GetImAnnotBoxs(AnotPath,BBoxAreaTol=50*50):
	tree = ET.ElementTree(file=AnotPath)  # open xml
	root = tree.getroot()
	ObjectSet = root.findall('object')
	ObjBndBoxSet = {}
	_,AnnotName=os.path.split(AnotPath)
	for Object in ObjectSet:
		ObjName = Object.find('name').text
		BndBox = Object.find('bndbox')
		try :
			IsDifficult=Object.find('difficult').text
		except:
			IsDifficult=0
			
		if int(IsDifficult):
			continue
		try:
			x1 = int(BndBox.find('xmin').text)  # -1
		except:
			x1 = int(float(BndBox.find('xmin').text))
		try:
			y1 = int(BndBox.find('ymin').text)  # -1
		except:
			y1 = int(float(BndBox.find('ymin').text))  # -1
		try:
			x2 = int(BndBox.find('xmax').text)  # -1
		except:
			x2 = int(float(BndBox.find('xmax').text))  # -1
		try:
			y2 = int(BndBox.find('ymax').text)  # -1
		except:
			y2 = int(float(BndBox.find('ymax').text))  # -1
			
		BndBoxLoc = [x1, y1, x2, y2]
		BBoxArea=(x2-x1)*(y2-y1)
		if BBoxArea>=BBoxAreaTol:
			if ObjBndBoxSet.has_key(ObjName):
				ObjBndBoxSet[ObjName].append(BndBoxLoc)
			else:
				ObjBndBoxSet[ObjName] = [BndBoxLoc]  # why not ues dict(key=val)?
	return ObjBndBoxSet
##get object annotation bndbox loc end

def GetAnnotImWHD(AnotPath):
	tree = ET.ElementTree(file=AnotPath)  # open xml
	root = tree.getroot()
	source = root.find('size')
	ImW = source.find('width').text
	ImH = source.find('height').text
	ImDep=source.find('depth').text
	ImWHD=(int(ImW),int(ImH),int(ImDep))
	return ImWHD

def GetAnnotImOriginalName(AnotPath):
	tree = ET.ElementTree(file=AnotPath)  # open xml
	root = tree.getroot()
	source = root.find('source')
	ImName = source.find('image').text
	return ImName

ImExpName = '.jpg'
AnnotExpName = '.xml'

def WriteObject(Object, ObjectName, Bndbox):  # =SubElement(object,'').text=
    name = SubElement(Object, 'name').text = ObjectName
    truncated = SubElement(Object, 'truncated').text = '0'
    difficult = SubElement(Object, 'difficult').text = '0'

    bndbox = SubElement(Object, 'bndbox')  # =SubElement(bndbox,'').text=
    xmin = SubElement(bndbox, 'xmin').text = str(int(Bndbox[0]))
    ymin = SubElement(bndbox, 'ymin').text = str(int(Bndbox[1]))
    xmax = SubElement(bndbox, 'xmax').text = str(int(Bndbox[2]))
    ymax = SubElement(bndbox, 'ymax').text = str(int(Bndbox[3]))


def VOCXml2MyXml(AnotName, ImSource, ObjectSet, AnotWriteFolder,ImWHD,
                 AnnotImFolder='VOC2012',CurY_M_D={},NotesDict={}):
    SplitStr = AnotName.split('.')
    ImId = SplitStr[0]
    ImName = ImId + ImExpName

    Root = Element('annotation')  # =SubElement(Root,'')
    folder = SubElement(Root, 'folder').text = AnnotImFolder
    filename = SubElement(Root, 'filename').text = ImName

    source = SubElement(Root, 'source')  # =SubElement(source,'').text
    database = SubElement(source, 'database').text ='Foreigner Database 2019'  
    database = SubElement(source, 'image').text = ImSource
    owner = SubElement(source, 'owner').text = 'DQ'
    date = SubElement(source, 'date').text = CurY_M_D
    if NotesDict:
        NoteTextSet=''
        k=0
        for NoteKey, NoteText in NotesDict.iteritems():
            if ObjectSet.has_key(NoteKey):
                k+=1
                NoteTextSet+=unicode(str(k)+'.'+NoteKey+':'+NoteText+';\n')
        if NoteTextSet:
            note = SubElement(source, 'note').text = NoteTextSet

    size = SubElement(Root, 'size')  # =SubElement(size,'').text
    width = SubElement(size, 'width').text = str(ImWHD[0]) #'960'
    height = SubElement(size, 'height').text = str(ImWHD[1])#'540'
    depth = SubElement(size, 'depth').text = str(ImWHD[2]) #'3'

    segmented = SubElement(Root, 'segmented').text = '0'
    # print 'VOCXml2MyXmlForInsulator.py-->VOCXml2MyXml()'

    if ObjectSet:
        for ObjectName, BndboxSet in ObjectSet.iteritems():
            for Bndbox in BndboxSet:
                Object = SubElement(Root, 'object')
                WriteObject(Object, ObjectName, Bndbox)

    Tree = ElementTree(Root)
    AnotPath = os.path.join(AnotWriteFolder, AnotName)
    Tree.write(AnotPath)

下面我把一个文件中的包含在这四个数据集中挑选文件的函数分开来陈述：

先附上各个子函数开头需要的公用部分：

#!/usr/bin/python
# -*- coding: UTF-8 -*-
# 2019/09/19 by DQ

import os
import datetime
import shutil
from XmlOptFuns import GetImAnnotBoxs,GetAnnotImWHD,VOCXml2MyXml #Xml标注文件的常用操作函数

Year = datetime.datetime.now().year
Month = str(datetime.datetime.now().month).zfill(2)
Day = str(datetime.datetime.now().day).zfill(2)
Hour=str(datetime.datetime.now().hour).zfill(2)
Minute=str(datetime.datetime.now().minute).zfill(2)
Y_M_D = '{}-{}-{}'.format(Year, Month, Day)
Y_M_D_H_M='{}-{}-{}-{}-{}'.format(Year, Month, Day,Hour,Minute)
ImExpName = '.jpg'#标注图片扩展名，所有其他格式都转化为这种格式
AnnotExpName = '.xml'#标注文件扩展名，所有其他格式都转化为这种格式
SelectDataMainDir='/data/dataset/SelfSelectDataSet'
ObjIdLen=6
BBoxAreaTol=50*50 #标注框面积阈值，去掉比较小的标注框

1、抽取VOC上的数据集并筛选出我需要的类数据

def VOC2012Data2Mine():
	ExpectClss=('person','car','bird')#需要挑选的类别,按优先级排列，如果一个标注图片中同时含有多个类，优先级靠前的具有文件命名权
	ClsCounter={}
	for ExpectCls in ExpectClss:
		ClsCounter[ExpectCls]=0
	
	VOCMainDir='/data/dataset/VOCdevkit2012/VOC2012'
	SelectDataSubDir = os.path.join(SelectDataMainDir, 'SelectVOC')
	VOCAnnotDir=os.path.join(VOCMainDir,'Annotations')
	VOCImDir=os.path.join(VOCMainDir,'JPEGImages')
	AnnotNames=os.listdir(VOCAnnotDir)
	for AnnotName in AnnotNames[:]:
		AnnotPath=os.path.join(VOCAnnotDir,AnnotName)
		ObjBndBoxs=GetImAnnotBoxs(AnnotPath,BBoxAreaTol)#得到标注boxes
		SelectObjBoxs={}
		for ExpectCls in ExpectClss:
			if ObjBndBoxs.has_key(ExpectCls) or ObjBndBoxs.has_key(ExpectCls.capitalize()):#筛选出我需要的类别及boxes
				SelectObjBoxs[ExpectCls]=ObjBndBoxs[ExpectCls]
		if SelectObjBoxs:
			ImPath1=os.path.join(VOCImDir,AnnotName[:-4]+ImExpName)
			ImPath2=os.path.join(VOCImDir,AnnotName[:-4] + ImExpName.upper())
			ImPath=''
			if os.path.exists(ImPath1):
				ImPath=ImPath1
			elif os.path.exists(ImPath2):
				ImPath = ImPath2
			else:
				continue
			for ExpectCls in ExpectClss:#确定一下当前数据用那个类别来命名
				if SelectObjBoxs.has_key(ExpectCls):
					ClsCounter[ExpectCls]+=1
					ExpectClsStr=ExpectCls+str(ClsCounter[ExpectCls]).zfill(ObjIdLen)
					NewAnnotName='VOC-{}_{}'.format(ExpectClsStr,AnnotName)
					break
			
			ImSource='flickr'
			ImWHD = GetAnnotImWHD(AnnotPath)
			SelectAnnotDir = os.path.join(SelectDataSubDir, ExpectCls, 'AnnotSet')#标注文件存放的文件夹
			if not os.path.exists(SelectAnnotDir):
				os.makedirs(SelectAnnotDir)
			VOCXml2MyXml(NewAnnotName, ImSource, SelectObjBoxs, SelectAnnotDir, ImWHD,
			             AnnotImFolder='VOC2012', CurY_M_D=Y_M_D, NotesDict={})#标注文件采用在VOC格式基础上，增补了一些信息，如数据入库时间，数据入库人员，以及备注信息
			
			SelectImDir = os.path.join(SelectDataSubDir, ExpectCls, 'ImSet')#标注图片存放的文件夹
			if not os.path.exists(SelectImDir):
				os.makedirs(SelectImDir)
			NewImName=NewAnnotName[:-4]+ImExpName
			NewImPath=os.path.join(SelectImDir,NewImName)
			shutil.copy(ImPath,NewImPath)
			MsgStr='{}--->{}\n'.format(ImPath,NewImPath)
			print MsgStr
	
	ImClsInfoTxtPath=os.path.join(SelectDataSubDir,'SelectVOCInfo.txt')#统计一下整理的数据量
	with open(ImClsInfoTxtPath,'w') as FId:
		for ExpectCls in ClsCounter.keys():
			LineStr='{}ImNum={}\n'.format(ExpectCls,ClsCounter[ExpectCls])
			FId.writelines(LineStr)

2、抽取COCO上的数据集并筛选出我需要的类数据

"""
#coco数据集格式示例如下
{"images": 
[
{"id": 44, "file_name": "000044.jpg", "width": 600, "height": 338},
{"id": 48, "file_name": "000048.jpg", "width": 600, "height": 338}, 
{"id": 54, "file_name": "000054.jpg", "width": 600, "height": 338}
], 
"type": "instances", 
"annotations": 
[
{"ignore": 0, "image_id": 44, "segmentation": [], "bbox": [109, 274, 29, 27], "area": 783, "category_id": 2, "iscrowd": 0, "id": 1}, 
{"ignore": 0, "image_id": 48, "segmentation": [], "bbox": [301, 39, 80, 48], "area": 3840, "category_id": 1, "iscrowd": 0, "id": 2}, 
{"ignore": 0, "image_id": 48, "segmentation": [], "bbox": [197, 117, 73, 51], "area": 3723, "category_id": 1, "iscrowd": 0, "id": 3}, 
{"ignore": 0, "image_id": 48, "segmentation": [], "bbox": [239, 75, 81, 55], "area": 4455, "category_id": 1, "iscrowd": 0, "id": 4}, 
{"ignore": 0, "image_id": 48, "segmentation": [], "bbox": [158, 159, 76, 54], "area": 4104, "category_id": 1, "iscrowd": 0, "id": 5},
{"ignore": 0, "image_id": 48, "segmentation": [], "bbox": [95, 204, 85, 56], "area": 4760, "category_id": 1, "iscrowd": 0, "id": 6}, 
{"ignore": 0, "image_id": 48, "segmentation": [], "bbox": [14, 265, 81, 72], "area": 5832, "category_id": 1, "iscrowd": 0, "id": 7}, 
{"ignore": 0, "image_id": 48, "segmentation": [], "bbox": [374, 8, 44, 34], "area": 1496, "category_id": 2, "iscrowd": 0, "id": 8}, 
{"ignore": 0, "image_id": 54, "segmentation": [], "bbox": [409, 96, 36, 42], "area": 1512, "category_id": 2, "iscrowd": 0, "id": 9}], 
"categories": 
[
{"supercategory": "none", "id": 1, "name": "Class1"}, #没有写具体的类别
{"supercategory": "none", "id": 3, "name": "Class2"}, 
{"supercategory": "none", "id": 2, "name": "Class3"}, 
{"supercategory": "none", "id": 0, "name": "Class4"}
]
}
"""
#抽取COCO上的数据集并筛选出我需要的类数据
def COCOData2Mine():
	from pycocotools.coco import COCO #coco官方提供的coco数据集合读写接口
	
	def COCOJson2MyXml(AnotName, ImSource, ObjectSet, AnotWriteFolder, ImWHD,
	                   AnnotImFolder, CurY_M_D):
		VOCXml2MyXml(AnotName, ImSource, ObjectSet, AnotWriteFolder, ImWHD,
		             AnnotImFolder, CurY_M_D, NotesDict={})
		
		
	ExpectClss = ('truck','car','person','bird')
	DataTypes = ('train2014','val2014')
	COCODir = '/data/dataset/coco'
	for DataType in DataTypes:
		ImDir = os.path.join(COCODir, 'images', DataType)
		AnnotPath = '{}/annotations/instances_{}.json'.format(COCODir, DataType)
		coco = COCO(AnnotPath)
		SubDirName=DataType[:-4].capitalize()
		SelectDataSubDir = os.path.join(SelectDataMainDir, 'SelectCOCO',SubDirName)
		
		ClsCounter = {}
		for ExpectCls in ExpectClss:
			ClsCounter[ExpectCls] = 0
		ImNames = os.listdir(ImDir)
		for ImName in ImNames[:]:
			SplitStrs=ImName[:-4].split('_')
			ImId=int(SplitStrs[2])
		
			ImInfo=coco.loadImgs(ImId)[0]
			SelectObjBoxs={}
			AnnotIds=coco.getAnnIds(imgIds=ImId)
			AnnotInfos=coco.loadAnns(AnnotIds)
			for AnnotInfo in AnnotInfos:
				CatId=AnnotInfo['category_id']
				CatInfo=coco.loadCats(CatId)[0]
				CatName=CatInfo['name']
				if CatName in ExpectClss:
					bbox=AnnotInfo['bbox']
					BBox=[int(float(bbox[0])),int(float(bbox[1])),int(float(bbox[0]+bbox[2])),int(float(bbox[1]+bbox[3]))]
					BBoxArea=(BBox[2]-BBox[0])*(BBox[3]-BBox[1])
					if BBoxArea>=BBoxAreaTol:
						if SelectObjBoxs.has_key(CatName):
							SelectObjBoxs[CatName].append(BBox)
						else:
							SelectObjBoxs[CatName]=[BBox]
						
			if SelectObjBoxs:
				for ExpectCls in ExpectClss:
					if SelectObjBoxs.has_key(ExpectCls):
						ClsCounter[ExpectCls] += 1
						ExpectClsStr = ExpectCls + str(ClsCounter[ExpectCls]).zfill(ObjIdLen)
						NewImIdStr = str(ImId).zfill(ObjIdLen)
						NewImName = 'COC_{}_{}{}.jpg'.format(ExpectClsStr,SubDirName[0],NewImIdStr)
						break
				
				AnotName=NewImName[:-4]+'.xml'
				ImWHD=[ImInfo['width'],ImInfo['height'],3]
				SelectAnnotDir = os.path.join(SelectDataSubDir, ExpectCls, 'AnnotSet')
				if not os.path.exists(SelectAnnotDir):
					os.makedirs(SelectAnnotDir)
				COCOJson2MyXml(AnotName, ImName, SelectObjBoxs, SelectAnnotDir, ImWHD,
				               AnnotImFolder='COCO2014', CurY_M_D=Y_M_D)
				
				SelectImDir = os.path.join(SelectDataSubDir, ExpectCls, 'ImSet')
				if not os.path.exists(SelectImDir):
					os.makedirs(SelectImDir)
				ImPath=os.path.join(ImDir,ImName)
				NewImPath=os.path.join(SelectImDir,NewImName)
				shutil.copy(ImPath,NewImPath)
				MsgStr = '{}--->{}\n'.format(ImPath, NewImPath)
				print MsgStr
				
		ImClsInfoTxtName='SelectCOCO({})Info.txt'.format(SubDirName)
		ImClsInfoTxtPath = os.path.join(SelectDataSubDir,ImClsInfoTxtName)
		with open(ImClsInfoTxtPath, 'w') as FId:
			TotalImNum=0
			for ExpectCls in ClsCounter.keys():
				TotalImNum+=ClsCounter[ExpectCls]
				LineStr = '{}ImNum={}\n'.format(ExpectCls, ClsCounter[ExpectCls])
				FId.writelines(LineStr)
			LineStr = 'TotalImNum={}\n'.format(TotalImNum)
			FId.writelines(LineStr)

3、抽取ImageNet上的ILSVRC2016_LOC数据集并筛选出我需要的类数据

def ImageNetData2Mine():
	ExpectClss = ('forklift','pickup truck','tractor', 'car', 'person', 'bird')
	ClsIdNameChs = \
	    [
		('n02814533', 'beach wagon', u'轿车'),
		('n03384352', 'forklift', u'叉车'),
		('n03770679', 'minivan', u'面包车'),
		('n03930630', 'pickup truck', u'皮卡'),
		('n04465501', 'tractor', u'拖拉机'),
		]
	NeedCvtClss=\
	[('n02814533', 'car', u'汽车'),
	 ('n03770679', 'car', u'汽车')
	]
	
	for NeedCvtCls in NeedCvtClss:
		for k in range(len(ClsIdNameChs)):
			ClsIdNameCh=ClsIdNameChs[k]
			if NeedCvtCls[0]==ClsIdNameCh[0]:
				ClsIdNameChs[k]=NeedCvtCls
				
	ClsId2ClsNames={}
	for ClsIdNameCh in ClsIdNameChs:
		ClsId2ClsNames[ClsIdNameCh[0]]=ClsIdNameCh[1]
	
	ImageNetDir = '/data/dataset/ImageNet/ILSVRC2016_LOC'
	ImMainDir =os.path.join(ImageNetDir,'Data/CLS-LOC/train')
	AnnotMainDir = os.path.join(ImageNetDir, 'Annotations/CLS-LOC/train')
	SelectDataSubDir=os.path.join(SelectDataMainDir, 'SelectImageNet')
	
	ClsCounter = {}
	for ExpectCls in ExpectClss:
		ClsCounter[ExpectCls] = 0
		
	for ClsIdNameCh in ClsIdNameChs:
		AnnotIms=[]
		ClsId=ClsIdNameCh[0]
		ImDir=os.path.join(ImMainDir,ClsId)
		AnnotDir=os.path.join(AnnotMainDir,ClsId)
		if os.path.isdir(AnnotDir):
			AnnotNames=os.listdir(AnnotDir)
			for AnnotName in AnnotNames:
				AnnotPath=os.path.join(AnnotDir,AnnotName)
				if os.path.isfile(AnnotPath) and AnnotName.endswith(AnnotExpName):
					ImName=AnnotName[:-4]+'.JPEG'
					ImPath=os.path.join(ImDir,ImName)
					if os.path.exists(ImPath):
						ObjBndBoxs1 = GetImAnnotBoxs(AnnotPath, BBoxAreaTol)
						ObjBndBoxs={}
						for ObjId in ObjBndBoxs1.keys():
							ObjBndBoxs[ClsId2ClsNames[ObjId]]=ObjBndBoxs1[ObjId]
							
						SelectObjBoxs = {}
						for ExpectCls in ExpectClss:
							if ObjBndBoxs.has_key(ExpectCls) or ObjBndBoxs.has_key(ExpectCls.capitalize()):
								SelectObjBoxs[ExpectCls] = ObjBndBoxs[ExpectCls]
						if SelectObjBoxs:
							AnnotIms.append(ImName)
							SplitStr=ImName[:-5].split('_')
							assert SplitStr[0]==ClsId,'ClsName is not same'
							for ExpectCls in ExpectClss:
								if SelectObjBoxs.has_key(ExpectCls):
									ClsCounter[ExpectCls] += 1
									ExpectClsStr = ExpectCls + str(ClsCounter[ExpectCls]).zfill(ObjIdLen)
									NewAnnotName = 'ImNt-{}_{}'.format(ExpectClsStr,ImName[:-5]+AnnotExpName)
									break
									
							ImWHD = GetAnnotImWHD(AnnotPath)
							SelectAnnotDir = os.path.join(SelectDataSubDir, ExpectCls, 'AnnotSet')
							if not os.path.exists(SelectAnnotDir):
								os.makedirs(SelectAnnotDir)
							VOCXml2MyXml(NewAnnotName, ImName, SelectObjBoxs, SelectAnnotDir, ImWHD,
							             AnnotImFolder='ImageNet2016', CurY_M_D=Y_M_D, NotesDict={})
							
							SelectImDir = os.path.join(SelectDataSubDir, ExpectCls, 'ImSet')
							if not os.path.exists(SelectImDir):
								os.makedirs(SelectImDir)
							NewImName = NewAnnotName[:-4] + ImExpName
							NewImPath = os.path.join(SelectImDir, NewImName)
							shutil.copy(ImPath, NewImPath)
							MsgStr = '{}--->{}\n'.format(ImPath, NewImPath)
							print MsgStr
									
		DirName = '{}({})_NoAnnot'.format(ClsId, ClsId2ClsNames[ClsId])
		SaveImDir = os.path.join(SelectDataSubDir, ClsId2ClsNames[ClsId], 'NoAnnotImSet', DirName)
		if not os.path.isdir(SaveImDir):
			os.makedirs(SaveImDir)
		ImNames = os.listdir(ImDir)
		NoAnnotIms=set(ImNames).difference(set(AnnotIms))
		for NoAnnotIm in NoAnnotIms:
			ImPath=os.path.join(ImDir,NoAnnotIm)
			shutil.copy(ImPath,SaveImDir)
			
	ImClsInfoTxtName = 'SelectImageNetInfo.txt'
	ImClsInfoTxtPath = os.path.join(SelectDataSubDir, ImClsInfoTxtName)
	with open(ImClsInfoTxtPath, 'w') as FId:
		TotalImNum = 0
		for ExpectCls in ClsCounter.keys():
			TotalImNum += ClsCounter[ExpectCls]
			LineStr = '{}ImNum={}\n'.format(ExpectCls, ClsCounter[ExpectCls])
			FId.writelines(LineStr)
		LineStr = 'TotalImNum={}\n'.format(TotalImNum)
		FId.writelines(LineStr)

4、抽取OpenImage上的数据集并筛选出我需要的类数据

def OpenImageData2Mine():
	import csv,cv2
	
	def GetRealClsNames(ClsDescptBoxPath):
		ClsDescpts = csv.reader(open(ClsDescptBoxPath, 'r'))
		RealClsNames = {}
		for ClsDescpt in ClsDescpts:
			LabelName, ClsName = ClsDescpt[0], ClsDescpt[1]
			RealClsNames[LabelName] = ClsName
		return RealClsNames
	
	def GetAnnotInfos(AnnotPath):
		AnnotInfos = []
		with open(AnnotPath, 'r') as FId:
			for AnnotInfo in csv.reader(FId):
				AnnotInfos.append(AnnotInfo)
		return AnnotInfos
	
	
		
	ImCls='Truck'
	DataTypes = ('train', 'test', 'validation')
	ExpectClss = ('crane', 'forklift', ImCls.lower(),'pickup truck', 'tractor', 'van', 'car', 'person', 'bird')
	OpenImDir='/data/dataset/OpenImage/WeNeedData'
	CSVMainDir = os.path.join(OpenImDir,ImCls,'csv_folder')
	ImMainDir = os.path.join(OpenImDir,ImCls,'Dataset')
	
	ClsDescptBoxPath = os.path.join(CSVMainDir, 'class-descriptions-boxable.csv')
	RealClsNames = GetRealClsNames(ClsDescptBoxPath)

	
	for DataType in DataTypes:
		ClsCounter = {}
		for ExpectCls in ExpectClss:
			ClsCounter[ExpectCls] = 0
		SubDirName = DataType.capitalize()
		SelectDataSubDir = os.path.join(SelectDataMainDir, 'SelectOpenImage',SubDirName)
		if not os.path.exists(SelectDataSubDir):
			os.makedirs(SelectDataSubDir)
			
		AnnotName = '{}-annotations-bbox.csv'.format(DataType)
		AnnotPath = os.path.join(CSVMainDir, AnnotName)
		AnnotInfos = GetAnnotInfos(AnnotPath)
		ImDir = os.path.join(ImMainDir, DataType, ImCls)
		ImNames = os.listdir(ImDir)
		for ImName in ImNames[:]:
			ImPath = os.path.join(ImDir, ImName)
			if os.path.isfile(ImPath):
				ImPath = os.path.join(ImDir, ImName)
				Im = cv2.imread(ImPath)
				ImH, ImW, ImD= Im.shape
				CurImName,CurImExpName=os.path.splitext(ImName)
				SelectObjBoxs = {}
				ContinueFindCount=0#同一张图片的标记框是连续罗列的#现在想想其实设置一个标记符号判断最简单
				for AnnotInfo in AnnotInfos:
					if AnnotInfo[0] == CurImName:

						xxyy = [float(AnnotInfo[4]), float(AnnotInfo[5]), float(AnnotInfo[6]), float(AnnotInfo[7])]
						BBox = [int(xxyy[0] * ImW), int(xxyy[2] * ImH), int(xxyy[1] * ImW), int(xxyy[3] * ImH)]
						
						BBoxArea = (BBox[2] - BBox[0]) * (BBox[3] - BBox[1])
						if BBoxArea >= BBoxAreaTol:
							LabelName = AnnotInfo[2]
							RealClsName = RealClsNames[LabelName].lower()
							if RealClsName in ExpectClss:
								if RealClsName in SelectObjBoxs.keys():
									SelectObjBoxs[RealClsName].append(BBox)
								else:
									SelectObjBoxs[RealClsName] = [BBox]
						 ContinueFindCount+=1#每找到一个计数一下
						 if ContinueFindCount>50:#一张图片中最大有50个框（我猜想的）
							break
				if SelectObjBoxs:
					for ExpectCls in ExpectClss:
						if SelectObjBoxs.has_key(ExpectCls):
							ClsCounter[ExpectCls] += 1
							ExpectClsStr = ExpectCls + str(ClsCounter[ExpectCls]).zfill(ObjIdLen)
							NewAnnotName = 'OpIm-{}_{}'.format(ExpectClsStr, CurImName + AnnotExpName)
							break
							
					ImWHD =(ImW,ImH,ImD)
					SelectAnnotDir = os.path.join(SelectDataSubDir, ExpectCls, 'AnnotSet')
					if not os.path.exists(SelectAnnotDir):
						os.makedirs(SelectAnnotDir)
					VOCXml2MyXml(NewAnnotName, ImName, SelectObjBoxs, SelectAnnotDir, ImWHD,
					             AnnotImFolder='OpenImage2019', CurY_M_D=Y_M_D, NotesDict={})
					
					SelectImDir = os.path.join(SelectDataSubDir, ExpectCls, 'ImSet')
					if not os.path.exists(SelectImDir):
						os.makedirs(SelectImDir)
					NewImName = NewAnnotName[:-4] + ImExpName
					NewImPath = os.path.join(SelectImDir, NewImName)
					if CurImExpName==ImExpName:
						shutil.copy(ImPath, NewImPath)
						MsgStr = '{}--->{}\n'.format(ImPath, NewImPath)
					else:
						cv2.imwrite(NewImPath,Im)
						MsgStr = 'imwrite Im--->{}\n'.format(NewImPath)
					print MsgStr
							
		ImClsInfoTxtName = 'SelectOpenImage({})Info.txt'.format(SubDirName)
		ImClsInfoTxtPath = os.path.join(SelectDataSubDir, ImClsInfoTxtName)
		with open(ImClsInfoTxtPath, 'w') as FId:
			TotalImNum = 0
			for ExpectCls in ClsCounter.keys():
				TotalImNum += ClsCounter[ExpectCls]
				LineStr = '{}ImNum={}\n'.format(ExpectCls, ClsCounter[ExpectCls])
				FId.writelines(LineStr)
			LineStr = 'TotalImNum={}\n'.format(TotalImNum)
			FId.writelines(LineStr)

好了就写到这里吧。

table合并行花归去 vue3 element vue.js javascript elementui
{{scope.row.gdLength/10}}importtype{TableColumnCtx}from'element-plus';consttableData=[{"id":6140,"projectId":1306,"projectName":"","sectionId":12985,"sectionName":"YYZQ-9标","tunnelId":96160,"tunnelNam
Java 基础数据类型代码先锋者 java开发 java 开发语言
一、引言在Java中每个变量都必须先声明其数据类型，才能使用（即Java是强类型语言）。Java的数据类型分为两大类：基本数据类型（PrimitiveDataTypes）和引用数据类型（ReferenceDataTypes）。二、基本数据类型分类Java有8种基本数据类型（如下图所示），可分为四大类（整数型，浮点型，字符型和布尔型）：8大基本数据类型具体位数、取值范围和默认值等如下表所示：数据类型
Linux内核srio驱动,Zynq—Linux移植学习笔记（十四）：RapidIO驱动开发 weixin_39942572 Linux内核srio驱动
#defineDRIVER_NAME"xiic-rio"#defineSRIO_ZYNQ_BASEADDR0x40000000#defineSRIO_ZYNQ_NODE_BASEADDR0x10100#defineSRIO_ZYNQ_MAX_HOPCOUNT13structxiic_rio{structmutexlock;u8*data;};/*Weneedglobalvarriableforma
C语言，记录一次局部变量被意外修改的问题三日沐水嵌入式全套学习教程 c语言
背景：单片机开发过程中，我在函数体内（begin_face_record）定义了一个局部变量data_length，在使用的时候，该局部变量一直别改变，每次调用其他函数，例如c库里面的函数memcpy，不知什么情况data_length值就会被改变。1、源码分析voidmain(void){init_gpio();init_face();face_power_up();begin_face_rec
使用SQL-PGVector进行PostgreSQL与语义搜索/RAG的结合 fgayif sql postgresql 数据库 python
在现代数据密集型应用中，语义搜索和检索增强生成（RAG）技术越来越受欢迎。通过结合PostgreSQL和pgvector扩展，我们可以实现高效的语义搜索。本文将深入探讨如何配置和使用SQL-PGVector，实现强大的数据查询能力。技术背景介绍PostgreSQL是一个功能强大的开源关系数据库，在处理结构化数据方面具备优势。为了增强其在非结构化数据处理中的能力，我们可以使用pgvector扩展，该
【Apache Tomcat信息泄露漏洞】猫饭_ACE 业务所需 tomcat apache java
一、漏洞详情ApacheTomcat是一个流行的开源Web服务器和Java代码的Servlet容器。9月28日，Apache发布安全公告，公开披露了Tomcat中的一个信息泄露漏洞（CVE-2021-43980）。由于某些Tomcat版本中的阻塞式读写的简化实现导致存在并发错误（极难触发），可能使客户端连接共享一个Http11Processor实例，导致响应或部分响应被错误的客户端接收，造成信息泄
Mariadb5.5.68升级10.5 熊博主 Linux云计算架构工程师 mysql mariadb 运维 linux 服务器
Mariadb5.5.68升级10.5#提前备份好数据库[root@master~]#mysqldump-uroot-p--all-databases>alldb.sqlEnterpassword:[root@master~]#llalldb.sql-rw-r--r--.1rootroot51523011月1818:59alldb.sql#移除原来的mariadb数据库[root@master~]
大数据学习（75）-大数据组件总结 viperrrrrrr 大数据 impala yarn hdfs hive CDH mapreduce
大数据学习系列专栏：哲学语录:用力所能及，改变世界。如果觉得博主的文章还不错的话，请点赞+收藏⭐️+留言支持一下博主哦一、CDHCDH（ClouderaDistributionIncludingApacheHadoop)是由Cloudera公司提供的一个集成了ApacheHadoop以及相关生态系统的发行版本。CDH是一个大数据平台，简化和加速了大数据处理分析的部署和管理。CDH提供Hadoop的
echarts tooltip 自动轮播前端bug工程师可视化 vue.js echarts vue.js
一、效果展示二、使用步骤代码如下（示例）：data(){return{setInterval:''}},constmyChart=this.$echarts.init(document.getElementById("id"))letoption={tooltip:{//鼠标滑过配置项},//其他配置项}myChart.setOption(option)letidx=1this.setInterv
FPGA基带平台射频数据处理装置及验证系统设计与方法 BE东欲
本文还有配套的精品资源，点击获取简介：FPGA在射频数据处理领域拥有灵活性和高性能，广泛用于通信、雷达、卫星导航等。本资料包重点介绍FPGA基带平台在数字信号处理中的应用，包括调制解调、滤波和FFT等任务。涵盖射频数据处理装置结构，验证系统设计和实施，以及相关工具的使用方法。为学习者提供实践经验和理论知识，助力开发高效可靠的通信系统。1.FPGA在射频数据处理中的应用数字信号处理（DSP）是现代电
echarts图表在修改了数据之后，如何进行重新渲染？小智玩前端 echarts javascript 前端
letmap=echarts.init(document.getElementById('map'));letoption=map.getOption()//获取option数据option.series[0].data=[1,2,3]//找到data修改数据map.setOption(option,true)//重新渲染
echarts的tooltip自动轮播，dataZoom同步轮播小智玩前端 echarts 前端 javascript
功能：tooltip轮播时，dataZoom也同步轮播，并且鼠标放上去之后，停止轮播；鼠标移出后重新触发轮播；封装成一个函数，直接用就行，代码如下：/*myChart：创建的图表实例startValue：dataZoom的起始值endValue：dataZoom的末尾值dataLength：x轴数据的长度*/autoPlay(myChart,startValue,endValue,dataLeng
FIN41920 Sustainable Finance 后端
FIN41920SustainableFinanceGroupProject2025ThepurposeofthisprojectistoevaluatetheabilityofapplyingUStoxicemissiondataandaccountingdatatoanalysetheeffectoftoxicemissionsonfirms’financialperformance.Here
YashanDB备份数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E6%95%B0%E6%8D%AE%...操作说明使用本方式执行备份时，要求数据库运行于OPEN状态且归档模式开启。备份命令仅SYS超级用户或拥有SYSDBA、SYSBACKUP权限的用户才可执行，备份语法详细说明请参考开发手册BACKUPDATABASE。若数据库在
如何在 React 项目中优化列表渲染性能，避免不必要的重绘？前端大白话大白话前端八股 react.js 前端前端框架
大白话如何在React项目中优化列表渲染性能，避免不必要的重绘？在React项目里，要是列表数据量很大，每次数据变化都重新渲染列表，会严重影响性能。1.使用key属性key属性能帮助React识别哪些元素发生了变化，这样在更新列表时，React就只更新那些真正改变的元素，而不是重新渲染整个列表。importReactfrom'react';//假设这是我们的数据列表constdata=[{id:1
揭秘时空大数据：详细介绍、真实应用场景和数据示例解析陈书予 GIS开发（时空大数据）前端大数据 python 时序数据库
时空大数据(SpatialBigData)是指利用空间环境和时间环境信息，以及数字技术，从多种来源获取的海量、动态的、多维的数据，对空间环境和时间环境进行实时监测，并基于复杂的数据分析和挖掘，获取有价值的信息。时空大数据示例：1）社会网络数据：Twitter、Facebook、Instagram等社交媒体上的海量数据，可以通过时间、空间、主题等来提取有价值的信息。2）遥感图像数据：通过遥感技术从卫
【赵渝强老师】达梦数据库的归档模式赵渝强老师达梦（DM）数据库数据库 oracle
达梦数据库的备份与恢复都需要使用到重做日志文件。在默认的情况下，达梦数据库采用的非归档模式。通过执行下面的语句可以查看当前数据库实例的日志模式。SQL>selectarch_modefromv$database;#输出的信息如下：行号ARCH_MODE-------------------1N#提示：这里输出的N表示的是非归档模式。由于在非归档模式下，重做日志文件会发生覆盖的情况，从而造成数据的丢
Python 自动探索性数据分析库———KLib 若木胡 tools python 数据分析开发语言
Python自动探索性数据分析库——KLib一、引言在当今数据驱动的时代，数据分析师和科学家们面临着海量的数据需要处理和分析。探索性数据分析（EDA）作为数据处理流程中的关键环节，旨在帮助人们快速理解数据的特征、分布、相关性等重要信息，从而为后续的深入分析、建模以及决策提供坚实的基础。Python以其丰富的生态系统和强大的功能在数据分析领域占据着重要地位，而KLib则是其中一款专注于自动探索性数据
$.ajax()方法详解小二爱编程· ajax javascript jquery
jquery中的ajax方法参数总是记不住，这里记录一下。目录1.url2.type3.timeout4.async5.cache6.data7.dataType8.beforeSend9.complete10.success11.error12.contentType13.dataFilter14.dataFilter15.global16.ifModified17.jsonp18.userna
源码篇：python生成《蔬菜店销售数据分析报告》案例 IT小本本 python python 数据分析开发语言
本文将通过Python实现一个完整的蔬菜销售数据分析项目，涵盖数据生成、清洗、分析及可视化全流程。我们将利用模拟数据生成技术创建90天的销售记录，通过Pandas进行数据处理，结合Matplotlib和Seaborn实现多样化的可视化图表，并最终生成动态交互报告。一、数据生成：模拟真实销售场景为了模拟真实的蔬菜销售数据，我们设计了包含10种蔬菜（白菜、土豆、西红柿等）的90天销售记录。数据生成逻辑
软件工程：数据字典愚戏师软件工程软件工程数据库
一、数据字典的核心作用定位：数据字典是数据流图（DFD）的补充说明文档，与DFD共同构成系统的逻辑模型。核心价值：消除二义性：明确数据流、存储、元素的定义，避免理解偏差。设计依据：为数据库设计、代码开发提供数据规范。团队协作：作为开发团队的共享词汇表，确保术语一致性。二、数据字典的四大组成要素1.数据流（DataFlow）定义：数据在系统中的流动路径。描述内容：来源与去向：起点（外部实体/处理）、
存算一体与存算分离：架构设计的深度解析与实现方案克里斯蒂亚诺罗纳尔多阿维罗大数据数据库
随着数据量的不断增大和对计算能力的需求日益提高，存算一体作为一种新型架构设计理念，在大数据处理、云计算和人工智能等领域正逐步引起广泛关注。在深入探讨存算一体之前，我们需要先了解存储和计算的基本概念，以及存算分离和存算一体之间的区别。什么是存算一体？存算一体，顾名思义，是将数据存储与计算资源紧密结合，形成一个统一的架构。在这种架构下，存储和计算不仅在物理层面上结合，更在架构设计上深度融合。具体来说，
LakeHouse湖仓一体成为下一站灯塔，数仓、数据湖架构即将退出群聊科杰科技大数据数据仓库
摘要：当前的大数据技术应用趋势表明，客户对单一的数据湖和数仓架构并不满意。近年来几乎所有的数据仓库都增加了对Parquet和ORC格式的外部表支持，这使数仓用户可以从相同的SQL引擎查询数据湖表，但它不会使数据湖表更易于管理，也不会消除仓库中数据的ETL复杂性、陈旧性和高级分析挑战。KeenDataLakeHouse（湖仓一体）作为新一代大数据技术架构，将逐渐取代单一数据湖和数仓架构，成为大数据架
车载以太网测试-14【交换机以及MAC地址表】车载测试工程师车载以太网测试 tcp/ip 网络网络协议经验分享车载系统
目录1摘要2车载交换机概述2.1OSI模型中的位置2.2车载交换机在数据链路层的功能3车载交换机的工作原理3.1车载交换机的关键工作步骤3.2车载交换机的关键技术3.3车载交换机的工作示例3.4MAC地址表3.4.1MAC地址表的工作原理3.4.2MAC地址表示例3.4.3MAC地址表的超时机制4总结1摘要车载交换机工作在OSI模型的数据链路层（DataLinkLayer），具体来说是数据链路层的
Linux学习1_Linux命令及英文全称 Wang_Zhenwei —Linux 转载 linux
LinuxCommandreferences(命令全称，方便记忆)aliasCreateyourownnameforacommandarchprintmachinearchitectureashashcommandinterpreter(shell)awk(gawk)patternscanningandprocessinglanguagebasenameRemovedirectoryandsuff
BPM软件是什么？15款好用的BPM软件盘点
在当今竞争激烈的商业环境中，企业需要不断优化其业务流程以提高效率和竞争力。而业务流程管理（BusinessProcessManagement，BPM）软件正是帮助企业实现这一目标的关键工具之一。本文将详细介绍BPM软件的概念、功能以及其在现代企业中的应用，并为大家盘点15款市场上广受好评的BPM软件。一、什么是BPM软件？BPM软件是一种用于设计、执行、监控和优化企业业务流程的软件工具。它通过图形
Linux vim mode | raw / cooked 斐夷所非 Linux vim mode
注：机翻，未校。vimterminal“raw”modeVim终端“raw”模式1.原始模式与已处理模式的区别Weknowvimputstheterminalin“raw”modewhereitreceiveskeystrokesastheyaretyped,opposedto“cooked”modewherethecommandisnotprocessedfullyunlesstheend-us
Docker 存储 Psycho_MrZhang Docker docker java 容器
目录挂载在执行run时设置参数-v即可实现目录映射,实现原理会在宿主机器创建一个空文件夹#挂载宿主机的/data目录到容器的/app目录dockerrun-d-v/data:/app--namemy-appmy-image#挂载docker内的/usr/share/nginx/html目录到本地机的/app/nghtmldockerrun-d-v/app/nghtml:/usr/share/ngi
优化Apache Spark性能之JVM参数配置指南 weixin_30777913 jvm spark 大数据开发语言性能优化
ApacheSpark运行在JVM之上，JVM的垃圾回收（GC）、内存管理以及堆外内存使用情况，会直接对Spark任务的执行效率产生影响。因此，合理配置JVM参数是优化Spark性能的关键步骤，以下将详细介绍优化策略和配置建议。通过以下优化方法，可以显著减少GC停顿时间、提升内存利用率，进而提高Spark作业吞吐量和数据处理效率。同时，要根据具体的工作负载和集群配置进行调整，并定期监控Spark应
taosdump备份多个数据库近10天的数据会飞的土拨鼠呀运维学习笔记数据库 oracle
以下是使用taosdump备份多个指定数据库近10天数据的详细步骤：方法1：直接指定多个数据库名称通过--databases参数直接指定多个数据库，逗号分隔：#!/bin/bash#定义备份目录和时间范围BACKUP_DIR="./backup"START_TIME=$(date-d"10daysago""+%Y-%m-%d%H:%M:%S")END_TIME=$(date"+%Y-%m-%d%H
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(

从VOC,ImageNet,COCO,OpenImage等数据集中挑选自己需要的类别数据

你可能感兴趣的:(Data,process,数据处理)