爱学习的小奶狗

目标检测-数据处理常用脚本文件

目标检测中一些对数据集的处理脚本

解释说明：该部分脚本是作者在做目标检测算法时所用到的一些数据集的处理脚本。脚本主要包含以下内容

将xml数据转换为coco数据
数据集的划分，分别有传统的划分方式和按照类别进行划分的方式
获取数据集中的包含的类别和各类别包含的个数
将含有不同标注的xml文件合并
删除xml文件中的指定类别
删除xml文件中空类别的xml文件
获取包含指定类别的xml文件
删除xml文件中图像边缘的类别.
删除xml文件中超出图像的框
找出xml文件中图像size记录为0的文件
为xml文件添加某些属性
查找那些无法用CV2读取的图片
查找那些无法转换为矩阵的图片
将标注后的数据中指定类别的图像裁剪出来
数据的扩增处理

1 将VOC格式的数据集转换为COCO数据集格式

1.1 直接将所有xml文件转换

脚本描述：对已经换分好验证集合测试集的VOC数据集，将数据集中的XML文件写入到json文件中。

#!/usr/bin/python
# -*- coding:utf-8 -*-
# @Author: hj
# @Time: 2018-01-29 2020-10-9
# @Description: 

import os, sys, json

from xml.etree.ElementTree import ElementTree, Element

data_root = r'/home/blue/hanjian/datasets/2021_bisai_data/fushusheshi/'   # VOC数据集的根目录

TXT_PATH = data_root + 'ImageSets/Main/train.txt'       # train.txt和val.txt的文件位置
XML_PATH = data_root + 'Annotations'                    # xml标签的目录
JSON_PATH = data_root + 'train.json'                    # json文件的存储目录

json_obj = {}
images = []
annotations = []
categories = []
categories_list = []
image_id = 0
annotation_id = 0
catID = 0
classes = ("fnsssh","ghptwbq","gjptwbq","ghpsh","gjpsh","sbpsh")    # 要转换的类别信息

def read_xml(in_path):
    tree = ElementTree()
    tree.parse(in_path)
    return tree

def if_match(node, kv_map):
    for key in kv_map:
        if node.get(key) != kv_map.get(key):
            return False
    return True
    
def get_node_by_keyvalue(nodelist, kv_map):
    result_nodes = []
    for node in nodelist:
        if if_match(node, kv_map):
            result_nodes.append(node)
    return result_nodes

def find_nodes(tree, path):
    return tree.findall(path)

print("-----------------Start------------------")

xml_names = []
sum = 0

f = open(TXT_PATH)
lines = f.readlines()
for line in lines:
    line = line.strip("\r\n") + ".xml"
    #print line
    xml_names.append(line)
    sum = sum + 1
#print "xml",sum
f.close()

for xml in xml_names:
    flag = False
    tree = read_xml(XML_PATH + "/" + xml)
    object_nodes = get_node_by_keyvalue(find_nodes(tree, "object"), {})
    if len(object_nodes) == 0:
        image = {}
        file_name = os.path.splitext(xml)[0]
        image["file_name"] = file_name + ".jpg"
        width_nodes = get_node_by_keyvalue(find_nodes(tree, "size/width"), {})
        image["width"] = int(width_nodes[0].text)
        height_nodes = get_node_by_keyvalue(find_nodes(tree, "size/height"), {})
        image["height"] = int(height_nodes[0].text)
        image["id"] = image_id
        print(xml, "no object")
    else:
        image = {}
        file_name = os.path.splitext(xml)[0]
        image["file_name"] = file_name + ".jpg"
        width_nodes = get_node_by_keyvalue(find_nodes(tree, "size/width"), {})
        image["width"] = int(width_nodes[0].text)
        height_nodes = get_node_by_keyvalue(find_nodes(tree, "size/height"), {})
        image["height"] = int(height_nodes[0].text)
        image["id"] = image_id 


        name_nodes = get_node_by_keyvalue(find_nodes(tree, "object/name"), {})
        xmin_nodes = get_node_by_keyvalue(find_nodes(tree, "object/bndbox/xmin"), {})
        ymin_nodes = get_node_by_keyvalue(find_nodes(tree, "object/bndbox/ymin"), {})
        xmax_nodes = get_node_by_keyvalue(find_nodes(tree, "object/bndbox/xmax"), {})
        ymax_nodes = get_node_by_keyvalue(find_nodes(tree, "object/bndbox/ymax"), {})
       # print ymax_nodes
        for index, node in enumerate(object_nodes):
            annotation = {}
            segmentation = []
            bbox = []
            seg_coordinate = [] 
            seg_coordinate.append(int(xmin_nodes[index].text))
            seg_coordinate.append(int(ymin_nodes[index].text))
            seg_coordinate.append(int(xmin_nodes[index].text))
            seg_coordinate.append(int(ymax_nodes[index].text))
            seg_coordinate.append(int(xmax_nodes[index].text))
            seg_coordinate.append(int(ymax_nodes[index].text))
            seg_coordinate.append(int(xmax_nodes[index].text))
            seg_coordinate.append(int(ymin_nodes[index].text))
            segmentation.append(seg_coordinate)
            width = int(xmax_nodes[index].text) - int(xmin_nodes[index].text)
            height = int(ymax_nodes[index].text) - int(ymin_nodes[index].text)
            area = width * height
            bbox.append(int(xmin_nodes[index].text))
            bbox.append(int(ymin_nodes[index].text))
            bbox.append(width)
            bbox.append(height)

            annotation["segmentation"] = segmentation
            annotation["area"] = area
            annotation["iscrowd"] = 0
            annotation["image_id"] = image_id
            annotation["bbox"] = bbox
            if name_nodes[index].text not in classes:
                continue
            else:
                annotation["category_id"] = name_nodes[index].text
            annotation["id"] = annotation_id
            annotation_id += 1
            annotation["ignore"] = 0
            annotations.append(annotation)
            flag = True

    if flag:
        images.append(image)
        image_id += 1
        print("processing " + xml)

cat_iter = 0
for idx, i  in enumerate(classes):
    categorie = {}
    categorie["supercategory"] = None
    categorie["id"] = i
    categorie["name"] = i
    categories.append(categorie)


json_obj["images"] = images
json_obj["type"] = "instances"
json_obj["annotations"] = annotations
json_obj["categories"] = categories

f = open(JSON_PATH, "w")
#json.dump(json_obj, f)
json_str = json.dumps(json_obj)
f.write(json_str)

print("------------------End-------------------")

1.2 通过txt文件转换

解释说明：读取txt文件中的xml文件名，然后去读取xml文件



import os, sys, json

from xml.etree.ElementTree import ElementTree, Element


TXT_PATH = 'D:/Dataset/VOCdevkit/VOC2012/ImageSets/Main/val.txt'
XML_PATH = 'D:/Dataset/VOCdevkit/VOC2012/Annotations'
JSON_PATH = 'D:/Dataset/val.json'



json_obj = {}
images = []
annotations = []
categories = []
categories_list = []
image_id = 0
annotation_id = 0
catID = 0

classes = ('aeroplane', 'aeroplane', 'bird', 'boat','bottle','bottle','bus','car','cat','chair','cow','diningtable','dog',
           'horse','motorbike','person','pottedplant','sheep','sofa','train','tvmonitor')



def read_xml(in_path):
    tree = ElementTree()
    tree.parse(in_path)
    return tree


def if_match(node, kv_map):
    for key in kv_map:
        if node.get(key) != kv_map.get(key):
            return False
    return True


def get_node_by_keyvalue(nodelist, kv_map):
    result_nodes = []
    for node in nodelist:
        if if_match(node, kv_map):
            result_nodes.append(node)
    return result_nodes


def find_nodes(tree, path):
    return tree.findall(path)


print("-----------------Start------------------")

xml_names = []
sum = 0

f = open(TXT_PATH)
lines = f.readlines()
for line in lines:
    line = line.strip("\r\n") + ".xml"
    #print line
    xml_names.append(line)
    sum = sum + 1
#print "xml",sum
f.close()



for xml in xml_names:
    flag = False
    tree = read_xml(XML_PATH + "/" + xml)
    object_nodes = get_node_by_keyvalue(find_nodes(tree, "object"), {})
    if len(object_nodes) == 0:
        image = {}
        file_name = os.path.splitext(xml)[0]
        image["file_name"] = file_name + ".jpg"
        width_nodes = get_node_by_keyvalue(find_nodes(tree, "size/width"), {})
        image["width"] = int(width_nodes[0].text)
        height_nodes = get_node_by_keyvalue(find_nodes(tree, "size/height"), {})
        image["height"] = int(height_nodes[0].text)
        image["id"] = image_id
        print(xml, "no object")
    else:
        image = {}
        file_name = os.path.splitext(xml)[0]
        image["file_name"] = file_name + ".jpg"
        width_nodes = get_node_by_keyvalue(find_nodes(tree, "size/width"), {})
        image["width"] = int(width_nodes[0].text)
        height_nodes = get_node_by_keyvalue(find_nodes(tree, "size/height"), {})
        image["height"] = int(height_nodes[0].text)
        image["id"] = image_id 


        name_nodes = get_node_by_keyvalue(find_nodes(tree, "object/name"), {})
        xmin_nodes = get_node_by_keyvalue(find_nodes(tree, "object/bndbox/xmin"), {})
        ymin_nodes = get_node_by_keyvalue(find_nodes(tree, "object/bndbox/ymin"), {})
        xmax_nodes = get_node_by_keyvalue(find_nodes(tree, "object/bndbox/xmax"), {})
        ymax_nodes = get_node_by_keyvalue(find_nodes(tree, "object/bndbox/ymax"), {})
       # print ymax_nodes
        for index, node in enumerate(object_nodes):
            annotation = {}
            segmentation = []
            bbox = []
            seg_coordinate = [] 
            seg_coordinate.append(int(xmin_nodes[index].text))
            seg_coordinate.append(int(ymin_nodes[index].text))
            seg_coordinate.append(int(xmin_nodes[index].text))
            seg_coordinate.append(int(ymax_nodes[index].text))
            seg_coordinate.append(int(xmax_nodes[index].text))
            seg_coordinate.append(int(ymax_nodes[index].text))
            seg_coordinate.append(int(xmax_nodes[index].text))
            seg_coordinate.append(int(ymin_nodes[index].text))
            segmentation.append(seg_coordinate)
            width = int(xmax_nodes[index].text) - int(xmin_nodes[index].text)
            height = int(ymax_nodes[index].text) - int(ymin_nodes[index].text)
            area = width * height
            bbox.append(int(xmin_nodes[index].text))
            bbox.append(int(ymin_nodes[index].text))
            bbox.append(width)
            bbox.append(height)

            annotation["segmentation"] = segmentation
            annotation["area"] = area
            annotation["iscrowd"] = 0
            annotation["image_id"] = image_id
            annotation["bbox"] = bbox
            if name_nodes[index].text not in classes:
                continue
            else:
                annotation["category_id"] = name_nodes[index].text
            annotation["id"] = annotation_id
            annotation_id += 1
            annotation["ignore"] = 0
            annotations.append(annotation)
            flag = True

    if flag:
        images.append(image)
        image_id += 1
        print("processing " + xml)

cat_iter = 0
for idx, i  in enumerate(classes):
    categorie = {}
    categorie["supercategory"] = None
    categorie["id"] = i
    categorie["name"] = i
    categories.append(categorie)


json_obj["images"] = images
json_obj["type"] = "instances"
json_obj["annotations"] = annotations
json_obj["categories"] = categories

f = open(JSON_PATH, "w")
#json.dump(json_obj, f)
json_str = json.dumps(json_obj)
f.write(json_str)

print("------------------End-------------------")

2 VOC数据集的训练集和验证集的划分

2.1 传统的划分方式

脚本说明：按照传统的划分方式，数据集的训练集和验证集的数据是按照固定比例划分的，但是此种划分存在的局限性是：训练集和验证集中具体的类别不是按照固定比例的。

#!/usr/bin/python
# -*- coding:utf-8 -*-
# @author: hj
# @description: 数据预处理：根据xml划分trainval、train、val、test.txt

import os
import random
'''
		假设总数据为：100
		 trainval_percent = 0.7   
		 train_percent = 0.8 
		则训练集  train = 100 * 0.7 * 0.8 = 56
		验证集   val = 100 * 0.7 * (1-0.8) = 14 
		测试集   test = 100 *(1 - 0.7) = 30
	
	注意： 在实际目标检测中（工程应用中）一般是不需要测试集的，只有在比赛环境中才可能用到测试集。
		可根据自己的实际情况选取是否要测试集。
'''
trainval_percent = 0.7   # 训练集+验证集的比例为0.7   测试集的比例为0.3
train_percent = 0.8      # 训练集和验证集中训练集所占比例

xmlfilepath = '/home/djm/djm_work_dir/mmdetection/data/datasets/anyi/xml/'    # xml文件路径
txtsavepath = '/home/djm/djm_work_dir/mmdetection/data/datasets/anyi/annotations/' # txt文件保存路径

# 历遍"Annotations"文件夹然后返回列表
total_xml = os.listdir(xmlfilepath)
total_xml.sort()
#total_xml.sort(key = lambda x: int(x[:-4]))

# 获取列表的总数
num = len(total_xml)
numlist = range(num)


tv = int(num * trainval_percent)
tr = int(tv * train_percent)

trainval = random.sample(numlist, tv)
trainval.sort()
test = list(set(numlist).difference(set(trainval)))
test.sort()

train = random.sample(trainval, tr)
train.sort()
val = list(set(trainval).difference(set(train)))
val.sort()

ftrainval = open(os.path.join(txtsavepath, 'trainval.txt'), 'w')
ftest = open(os.path.join(txtsavepath, 'test.txt'), 'w')
ftrain = open(os.path.join(txtsavepath, 'train.txt'), 'w')
fval = open(os.path.join(txtsavepath, 'val.txt'), 'w')

for i in numlist:
    # 使用切片方法获取文件名(去掉后缀".xml")
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        ftrainval.write(name)
        if i in train:
            ftrain.write(name)
        else:
            fval.write(name)
    else:
        ftest.write(name)

ftrainval.close()
ftrain.close()
fval.close()
ftest.close()

2.1 按照类别数对数据集进行划分

脚本说明：由于传统的数据划分存在局限性，如：当A类有100个，B类有100个，此时按照传统的划分方式，可能将A类划分30个而B类只划分10个，存在较大的随机性。

本次脚本的划分方式是按照数据集中的类别比例进行划分，如我们划分可能是A类20个和B类20个。

#!/usr/bin/python
# -*- coding:utf-8 -*-
# @author: hj



#数据集划分
import os
import random
import xml.etree.ElementTree as ET

root_dir=r''  # xml文件路径

classname = ["bl_jyz_wh","bl_jyz_zb","c_jyz_wh","czjyz","fhjyz","jyhyw"]     # 类别

## 0.7train 0.1val 0.2test

total_xml = os.listdir(root_dir)
need_xml = []

# 获取到每个类别包含的xml文件名字
for obj_name in classname:
    name_num = []
    for obj_xml in total_xml:
        tree = ET.parse(root_dir + obj_xml)
        root = tree.getroot()
        for root_name in root.findall("object"):
            root_name = root_name.find("name")
            if root_name.text == obj_name:
                if obj_xml not in name_num:
                    name_num.append(obj_xml)

    # 从每个类别包含的xml文件列表中随机抽取20%的xml文件

    classname_xml = []
    num = len(name_num)
    list = range(num)
    tr = int(num * 0.2)
    val = random.sample(list, tr)
    print(len(val))
    for i in val:
        classname_xml.append(name_num[i])
    # 得到每个类别的xml文件后进行去重处理

    for xml in classname_xml:
        if xml not in need_xml:
            need_xml.append(xml)

val_need_name = []
for xml in need_xml:
    val_need_name.append(xml.split(".xml")[0])
train_need_name = []
for xml in total_xml:
    if xml.split(".xml")[0] not in val_need_name:
            train_need_name.append(xml.split(".xml")[0])

print(len(val_need_name))
print(len(train_need_name))

root_dirs = r"/"   #voc源路径

ftrain = open(root_dirs+'train.txt', 'w')
fval = open(root_dirs+'val.txt', 'w')

for i in val_need_name:
    fval.write(i+'\n')
for j in train_need_name:
    ftrain.write(j+'\n')
ftrain.close()
fval.close()
print("数据划分完毕==========")

3. 对标准的VOC数据集的一些操作

3.1 获取数据集中的包含的类别和各类别包含的个数

解释说明：通过VOC数据集中的所有XML文件获取到数据集中包含哪些类别，并输出各个类别的数目。

import os
from tqdm import tqdm
import xml.dom.minidom

def ReadXml(FilePath):
    if os.path.exists(FilePath) is False:
        return None
    dom = xml.dom.minidom.parse(FilePath)
    root_ = dom.documentElement
    object_ = root_.getElementsByTagName('object')
    info = []
    for object_1 in object_:
        name = object_1.getElementsByTagName("name")[0].firstChild.data
        bndbox = object_1.getElementsByTagName("bndbox")[0]
        xmin = int(bndbox.getElementsByTagName("xmin")[0].firstChild.data)
        ymin = int(bndbox.getElementsByTagName("ymin")[0].firstChild.data)
        xmax = int(bndbox.getElementsByTagName("xmax")[0].firstChild.data)
        ymax = int(bndbox.getElementsByTagName("ymax")[0].firstChild.data)
        info.append([xmin, ymin, xmax, ymax, name])
    return info

def CountLabelKind(Path):
    LabelDict = {}
    print("Star to count label kinds....")
    for root, dirs, files in os.walk(Path):
        for file in tqdm(files):
            if file[-1] == 'l':
                Infos = ReadXml(root + "\\" + file)
                for Info in Infos:
                    if Info[-1] not in LabelDict.keys():
                        LabelDict[Info[-1]] = 1
                    else:
                        LabelDict[Info[-1]] += 1

    return dict(sorted(LabelDict.items(), key=lambda x: x[0]))

if __name__ == '__main__':

    SrcDir = r"" # 数据集中xml文件的路径

    LabelDict = CountLabelKind(SrcDir)
    KeyDict = sorted(LabelDict)
    print("%d kind labels and %d labels in total:" % (len(KeyDict), sum(LabelDict.values())))
    print(KeyDict)
    print("Label Name and it's number:")
    for key in KeyDict:
        print("%s\t: %d" % (key, LabelDict[key]))

3.2 通过TXT文件获取到val、train数据中各个类别的数目

解释说明：数据集划分完毕后，想要获取到train和val中各个类别的数目。

import xml.etree.ElementTree as ET
import os
import numpy as np
from tqdm import tqdm
# import matplotlib.pyplot as plt

# xml文件路径
xmlpath =r'' # xml文件路径
classes={}
xmlnames = []
with open("【txt文件路径】", 'r', encoding='utf-8') as f:
    filename = f.readlines()
    print(filename)

xmlnames = [c.strip("\n") + '.xml' for c in filename]

print(xmlnames)

for xmlname in tqdm(xmlnames):#遍历所有的文件
    if xmlname.endswith('.xml'):#如果是xml
      # print('当前xml文件名:',xmlname)
      tree = ET.parse(os.path.join(xmlpath,xmlname))#解析xml
      objs=tree.findall('object')
      for obj in objs:
        cls=obj.find('name').text
        if cls not in classes.keys():
           classes[cls]=1
        else:
            classes[cls]+=1

    print('当前统计 ',xmlname,'{:d}/{:d}'.format(xmlnames.index(xmlname)+1,len(xmlnames)))


index = []
values = []
for cls1 in classes.keys():
    print(cls1,'：',classes[cls1])
    index.append(cls1)
    values.append(classes[cls1])

4. 对XML文件的一些操作

4.1 将含有不同标注的xml文件合并

解释说明：对同一张图片生成了两个xml文件（两个xml文件是同名的），两个xml文件中标注的类别信息不一样。需要将两个xml文件合并为一个xml文件。

# -*- coding:utf-8 -*-
import os, shutil
import xml.etree.ElementTree as ET
import time
from multiprocessing import Pool
#from tqdm import tqdm

"""
@功能：合并同名称的xml节点，并将两份数据集整合成一份。
@作者：HJ

"""

"""
思路： 1。首先按照xml文件名，再找对应的图片名，拷贝到相应目录；
      2。如果出现说名称重复的，则将对应的两个xml节点合并成一个xml发到目录里面；
      3。源目录剩下重复的xml跟图片文件。     

"""
# 打开文件
rootPath = "D:\基地装置和通道和杆塔\ceshi"

selectPicPathw = r"D:\基地装置和通道和杆塔\jpg/"
selectXmlPathw = r"D:\基地装置和通道和杆塔\xml/"


def gci(filepath):
    # 遍历filepath下所有文件，包括子目录
    files = os.listdir(filepath)
    for fi in files:
        fi_d = os.path.join(filepath, fi)

        # isdir和isfile参数必须跟绝对路径
        if os.path.isdir(fi_d):
            gci(fi_d)
            if 'xml' in fi_d:
                xmlPath = fi_d + '/'
                jpgpath = xmlPath.split('xml')[0] + 'jpg/'
                print('jpgpath', jpgpath)
                print('xmlPath', xmlPath)
                merge_2xml(jpgpath, xmlPath, selectPicPathw, selectXmlPathw)


def merge_2xml(ImgPath, AnnoPath, selectPicPathw, selectXmlPathw):
    XmlList = os.listdir(AnnoPath)

    for xml in XmlList:  # type: object

        a, b = os.path.splitext(xml)

        imgfile = ImgPath + a + '.jpg'
        xmlfile = AnnoPath + a + '.xml'

        # print("imgfile: ",imgfile)
        # print("xmlfile: ",xmlfile)

        try:
            shutil.move(xmlfile, selectXmlPathw)
            shutil.move(imgfile, selectPicPathw)
        except Exception as r:
            print('error:', r)
            # xml文件已存在，将对应的两个xml节点合并成一个xml发到目录里面；
            xmlfile_exists = selectXmlPathw + a + '.xml'

            tree_exists = ET.parse(xmlfile_exists)
            tree_new = ET.parse(xmlfile)
            root_exists = tree_exists.getroot()
            root_new = tree_new.getroot()

            for it in root_new.iter('object'):
                root_exists.append(it)
            os.remove(xmlfile_exists)

            tree_exists.write(xmlfile_exists)

if __name__ == '__main__':
    gci(rootPath)

4.2 删除xml文件中的指定类别

解释说明： xml文件中包含了不需要训练的类别，可通过此脚本删除。

import os
import xml.etree.ElementTree as ET
import tqdm

def del_delete_eq_1(xml_path):
    # 从xml文件中读取，使用getroot()获取根节点，得到的是一个Element对象
    tree = ET.parse(xml_path)
    root = tree.getroot()

    for object in root.findall('object'):
        deleted = str(object.find('name').text)

        if (deleted in ["需要删除的类别"]):
            root.remove(object)

    tree.write(xml_path)


def main():
    root_dir = r"" #xml文件路径
    xml_path_list = [os.path.join(root_dir, x) for x in os.listdir(root_dir)]

    # 使用tqdm显示进程
    for xml in tqdm.tqdm(xml_path_list):
        del_delete_eq_1(xml)


if __name__ == '__main__':
    main()

4.3 删除xml文件中空类别的xml文件

解释说明：数据清洗完毕后，xml文件中可能存在较多空标签的xml文件，可通过此脚本删除

#  批量移除空的xml标注和xml对应的图片
import xml.etree.cElementTree as ET
import os

path_root = r''   # xml文件路径
path_jpg = r''     # jpg图片路径

xml_list = os.listdir(path_root)

count = 0
for axml in xml_list:
    path_xml = os.path.join(path_root, axml)
    file_name = os.path.splitext(axml)[0]
    tree = ET.parse(path_xml)
    root = tree.getroot()


    if len(root.findall('object')) == 0:
        count = count + 1
        os.remove(path_xml)
        os.remove(path_jpg + "/" +  file_name +".jpg")   # 注意图片后缀   自行更改
        print(count)

4.4 获取包含指定类别的xml文件

解释说明：将xml文件中包含指定类别的xml文件提取出来。

import cv2
import os,shutil
import xml.etree.ElementTree as ET
import pdb
import time
from multiprocessing import Pool


AnnoPath =r"" # xml文件地址
selectXmlPathw =r"" # 需要将xml文件提取到指定位置的地址


ClassList2=["jccj","jcps","jclzym"]  # 需要提取的类别

PicCount = 0

def ProcessPic(imgPath):
    global PicCount
    print("count:",PicCount)
    PicCount += PicCount
    a, b = os.path.splitext(imgPath)
    # print("a:",a,"b:",b)
    # ImgPath = os.path.join(ImgPath)
    tree = ET.parse(AnnoPath + a + '.xml')
    # tree = ET.parse(xml_path)
    root = tree.getroot()
    # object_name = root.iter('name')
    # object_name = tree.find('object')

    xmlfile = AnnoPath + a + '.xml'
    # print("imgfile",imgfile)
    # print("xmlfile", xmlfile)
    for sub4 in root.findall("object"):
        subsub = sub4.find('name')
        #if subsub.text == 'ladder-bak':
        if subsub.text in ClassList2:
             shutil.move(xmlfile, selectXmlPathw)
             break

if __name__ == '__main__':

    ImgPathList = os.listdir(AnnoPath)
    start = time.time()
    pool = Pool()
    pool.map(ProcessPic, ImgPathList)
    pool.close()
    pool.join()
    end = time.time()
    print(end - start)

4.5 删除xml文件中图像边缘的类别

解释说明：删除xml文件中图像边缘的xml类别（作者在做数据扩增的时候发现可能存在部分xml文件做扩增后有些标注会叠加在图像的边缘）。

import os
import xml.etree.ElementTree as ET
import tqdm

def del_delete_eq_1(xml_path):
    # 从xml文件中读取，使用getroot()获取根节点，得到的是一个Element对象
    tree = ET.parse(xml_path)
    root = tree.getroot()
    for object in root.findall('object'):
        xmin = int(object.find("bndbox").find("xmin").text)
        ymin = int(object.find("bndbox").find("ymin").text)
        xmax = int(object.find("bndbox").find("xmax").text)
        ymax = int(object.find("bndbox").find("ymax").text)
        if abs(xmax - xmin) <= 2 or abs(ymin - ymax) <= 2:
            root.remove(object)
    tree.write(xml_path)

def main():
    root_dir = r""  # xml文件路径
    xml_path_list = [os.path.join(root_dir, x) for x in os.listdir(root_dir)]

    # 使用tqdm显示进程
    for xml in tqdm.tqdm(xml_path_list):
        del_delete_eq_1(xml)
if __name__ == '__main__':
    main()

4.6 删除xml文件中超出图像的框

解释说明：数据扩增后可能有部分类别的框会超出增强后图像的边缘。

import os
import xml.etree.ElementTree as ET
import tqdm
def del_delete_eq_1(xml_path):
    # 从xml文件中读取，使用getroot()获取根节点，得到的是一个Element对象
    tree = ET.parse(xml_path)
    root = tree.getroot()
    width = int(root.find("size").find("width").text)
    height = int(root.find("size").find("height").text)
    for object in root.findall('object'):
        xmin = int(object.find("bndbox").find("xmin").text)
        ymin = int(object.find("bndbox").find("ymin").text)
        xmax = int(object.find("bndbox").find("xmax").text)
        ymax = int(object.find("bndbox").find("ymax").text)
        if xmin < 0 or ymin < 0 or xmax > width or ymax > height:
            root.remove(object)
            print(xml_path)
    tree.write(xml_path)

def main():
    root_dir = r""  # xml文件地址
    xml_path_list = [os.path.join(root_dir, x) for x in os.listdir(root_dir)]

    # 使用tqdm显示进程
    for xml in xml_path_list:
        del_delete_eq_1(xml)
if __name__ == '__main__':
    main()

4.7 找出xml文件中图像size记录为0的文件

解释说明：数据中可能会存在xml文件记录图像的size为0的数据。

import os
import xml.etree.ElementTree as ET
import tqdm


def chacuo(xml_path):
    # 从xml文件中读取，使用getroot()获取根节点，得到的是一个Element对象
    tree = ET.parse(xml_path)
    root = tree.getroot()

    wh = root.find("size")
    width = int(wh.find("width").text)
    height = int(wh.find("height").text)

    if width == 0 or height == 0:
        print(xml_path)
        # os.remove(xml_path)
    # tree.write(xml_path)


def main():
    root_dir = r"D:\基地装置和通道和杆塔\xml/"
    xml_path_list = [os.path.join(root_dir, x) for x in os.listdir(root_dir)]
    # 使用tqdm显示进程
    for xml in tqdm.tqdm(xml_path_list):
        chacuo(xml)
if __name__ == '__main__':
    main()

4.8 为xml文件添加某些属性

解释说明：不同的标注软件会产生不同的xml文件，但是有些标注软件在写入xml文件时会忽略某些属性。作者在做实验时发现，不同的算法源码对XML文件的解析不一样，有些源码会找一些不必要的属性，当找不到这些属性时会报错。如：旷视开源的yolox源码在训练时会检测xml文件的difficult，pose等属性。

import os
import xml.etree.ElementTree as ET
import tqdm


def insert(xml_path):
    # 从xml文件中读取，使用getroot()获取根节点，得到的是一个Element对象
    tree = ET.parse(xml_path)
    root = tree.getroot()

    for object in root.findall('object'):
        try:
            object.find("difficult").text   #属性
        except: 
            x = ET.Element("difficult")      # 属性
            x.text = "0"                     #属性值
            object.append(x)
            tree.write(xml_path)
            print(xml_path)

def main():
    root_dir = r"" # xml文件路径
    xml_path_list = [os.path.join(root_dir, x) for x in os.listdir(root_dir)]
    # 使用tqdm显示进程
    for xml in xml_path_list:
        insert(xml)
if __name__ == '__main__':
    main()

5. 对JPG文件的一些操作

5.1 查找那些无法用CV2读取的图片

import cv2
import os
import tqdm
path_img = r"E:\wurenji\JPEGImages/"
path_jpg = os.listdir(path_img)

for path in tqdm.tqdm(path_jpg):
    img = cv2.imread(path_img + path, cv2.IMREAD_COLOR)
    try:
        assert img is not None
    except:
        print(path)

5.2 查找那些无法转换为矩阵的图片

import os
import shutil

#查找那些无法读取的jpg文件

path_img = r"E:\wurenji\fushusheshi\JPEGImages/"

import numpy as np
from PIL import Image
path_jpg = os.listdir(path_img)
count = 0

for absolute_path in path_jpg:
    try:
        img = Image.open(path_img + absolute_path)
    except:
        count = count + 1
        print("corrupt img",absolute_path)

    try:
        img = np.asarray(path_img + absolute_path)
    except:
        print('corrupt img', absolute_path)
print(count)

5.3 将标注后的数据中指定类别的图像裁剪出来

解释说明：当数据较为庞大的时候，我们不可能一条条的去查询标注人员是否标注错误，此时可以通过此脚本，将标注后的XML文件中在图像中进行裁剪，找出指定类别的所有裁剪图片。这样会非常的方便

import os
import cv2
from xml.etree.ElementTree import ElementTree, Element


jpg_dir = r'E:\lsqlm\zzy\jpg'   # JPG文件地址
xml_dir = r'E:\lsqlm\zzy\xml'   # xml文件地址
jpc_crop_dir = r'E:\lsqlm\zzy\bcqlm' # 裁剪后图片保存地址
cat_id = ['bcqlm']              # 需要裁剪的类别
et = ElementTree()
xml_files = os.listdir(xml_dir)
resize_scale = 224               

for xml_file in xml_files:
    print(xml_file)
    jpg_file = xml_file.replace('.xml', '.jpg')
    jpg_path = os.path.join(jpg_dir, jpg_file)
    xml_path = os.path.join(xml_dir, xml_file)
    # if not os.path.exists(jpg_path):
    #     continue

    img = cv2.imread(jpg_path)
    tree = et.parse(xml_path)
    object_nodes = tree.findall('object')
    object_num = 0
    if len(object_nodes) > 0:
        for object_node in object_nodes:
            if object_node.find('name').text not in cat_id:
                continue
            else:
                object_num += 1
            xmin = int(object_node.find('bndbox/xmin').text)
            ymin = int(object_node.find('bndbox/ymin').text)
            xmax = int(object_node.find('bndbox/xmax').text)
            ymax = int(object_node.find('bndbox/ymax').text)
            object_region = img[ymin:ymax, xmin:xmax]
            w, h = xmax - xmin, ymax - ymin
            m = max(w, h)
            ratio = resize_scale / m
            new_w, new_h = int(ratio * w), int(ratio * h)
            assert new_w > 0 and new_h > 0, 'new_w/new_h is zero!!'
            resize_object_region = cv2.resize(object_region,(new_w,new_h))
            jpg_crop_name = jpg_file.replace('.jpg', '_'+str(object_num)+'.jpg')
            cv2.imwrite(os.path.join(jpc_crop_dir, jpg_crop_name), resize_object_region)

6. 数据的扩增处理

解释说明：当数据集中的部分类别较少时，我们可以对指定类别进行扩增处理，但是需要注意的是扩增后的数据是不能够用来验证的，因为数据不管怎么扩增它和原始数据的相似度还是非常大的，当放入验证集时验证结果就不客观了。

import os
import shutil
import numpy as np
import imgaug as ia
import xml.etree.ElementTree as ET

from PIL import Image
from imgaug import augmenters as iaa

ia.seed(1)


def read_xml_annotation(root, image_id):
    in_file = open(os.path.join(root, image_id),encoding="utf-8")
    tree = ET.parse(in_file)
    root = tree.getroot()
    bndboxlist = []

    for object in root.findall('object'):  # 找到root节点下的所有country节点
        bndbox = object.find('bndbox')  # 子节点下节点rank的值

        xmin = int(bndbox.find('xmin').text)
        xmax = int(bndbox.find('xmax').text)
        ymin = int(bndbox.find('ymin').text)
        ymax = int(bndbox.find('ymax').text)

        bndboxlist.append([xmin, ymin, xmax, ymax])

    return bndboxlist


def change_xml_annotation(root, image_id, new_target):
    new_xmin = new_target[0]
    new_ymin = new_target[1]
    new_xmax = new_target[2]
    new_ymax = new_target[3]

    in_file = open(os.path.join(root, str(image_id) + '.xml'))  # 这里root分别由两个意思
    tree = ET.parse(in_file)
    xmlroot = tree.getroot()
    object = xmlroot.find('object')
    bndbox = object.find('bndbox')
    xmin = bndbox.find('xmin')
    xmin.text = str(new_xmin)
    ymin = bndbox.find('ymin')
    ymin.text = str(new_ymin)
    xmax = bndbox.find('xmax')
    xmax.text = str(new_xmax)
    ymax = bndbox.find('ymax')
    ymax.text = str(new_ymax)
    tree.write(os.path.join(root, str("%06d" % str(id) + '.xml')))


def change_xml_list_annotation(root, image_id, new_target, saveroot, _id):
    in_file = open(os.path.join(root, str(image_id) + '.xml'),encoding="utf-8")  # 这里root分别由两个意思
    tree = ET.parse(in_file)
    elem = tree.find('filename')
    elem.text = _id + '.jpg'
    xmlroot = tree.getroot()
    index = 0

    for object in xmlroot.findall('object'):  # 找到root节点下的所有country节点
        bndbox = object.find('bndbox')  # 子节点下节点rank的值

        new_xmin = new_target[index][0]
        new_ymin = new_target[index][1]
        new_xmax = new_target[index][2]
        new_ymax = new_target[index][3]

        xmin = bndbox.find('xmin')
        xmin.text = str(new_xmin)
        ymin = bndbox.find('ymin')
        ymin.text = str(new_ymin)
        xmax = bndbox.find('xmax')
        xmax.text = str(new_xmax)
        ymax = bndbox.find('ymax')
        ymax.text = str(new_ymax)

        index = index + 1

    tree.write(os.path.join(saveroot, _id + '.xml'))


def mkdir(path):
    # 去除首位空格
    path = path.strip()
    # 去除尾部 \ 符号
    path = path.rstrip("\\")
    # 判断路径是否存在
    isExists = os.path.exists(path)
    # 判断结果
    if not isExists:
        # 如果不存在则创建目录
        os.makedirs(path)
        print(path + ' 创建成功')
        return True
    else:
        # 如果目录存在则不创建，并提示目录已存在
        print(path + ' 目录已存在')
        return False


if __name__ == "__main__":
    IMG_DIR = r""  # 需要增强的影像文件夹路径
    XML_DIR = r""  # 需要增强的XML文件夹路径

    AUG_IMG_DIR = r""  # 存储增强后的影像文件夹路径
    AUG_XML_DIR = r""  # 存储增强后的XML文件夹路径

    try:
        shutil.rmtree(AUG_IMG_DIR)
    except FileNotFoundError as e:
        a = 1
    mkdir(AUG_IMG_DIR)

    try:
        shutil.rmtree(AUG_XML_DIR)
    except FileNotFoundError as e:
        a = 1
    mkdir(AUG_XML_DIR)

    AUGLOOP = 3  # 每张影像增强的数量

    boxes_img_aug_list = []
    new_bndbox = []
    new_bndbox_list = []

    # 影像增强
    seq = iaa.Sequential([
        #对80%的图像进行左右翻转
        iaa.Fliplr(0.8),
        # 使用下面的一个或者两个方法进行增强图像
        iaa.SomeOf((0,2),
                       [
                           # 随机裁剪
                           iaa.Crop(percent=(0,0.2)),# 裁剪幅度为0~0.2

                           iaa.Affine(  # 部分图像做仿射变换
                               scale={"x": (0.8, 1.2), "y": (0.8, 1.2)},  # 图像缩放为80%到120%
                               cval=(0),  # 全白全黑填充
                               mode=ia.ALL  # 定义填充图像外区域的方法
                           ),

                            # 模糊
                           iaa.OneOf([
                               iaa.GaussianBlur((0, 3.0)),
                               iaa.AverageBlur(k=(2, 7)),  # 核大小2~7之间，k=((5, 7), (1, 3))时，核高度5~7，宽度1~3
                               iaa.MedianBlur(k=(3, 11)),
                           ]),
                           # 对比度变为原来的一半或者1.5
                           iaa.ContrastNormalization((0.9,1.2),per_channel=0.5),

                       ],
                        random_order=True  #随机选择
                   )
    ])

    for root, sub_folders, files in os.walk(XML_DIR):

        for name in files:

            bndbox = read_xml_annotation(XML_DIR, name)

            for epoch in range(AUGLOOP):
                seq_det = seq.to_deterministic()  # 保持坐标和图像同步改变，而不是随机
                # 读取图片
                img = Image.open(os.path.join(IMG_DIR, name[:-4] + '.jpg'))
                # sp = img.size
                img = np.asarray(img)
                # bndbox 坐标增强
                for i in range(len(bndbox)):
                    bbs = ia.BoundingBoxesOnImage([
                        ia.BoundingBox(x1=bndbox[i][0], y1=bndbox[i][1], x2=bndbox[i][2], y2=bndbox[i][3]),
                    ], shape=img.shape)

                    bbs_aug = seq_det.augment_bounding_boxes([bbs])[0]
                    boxes_img_aug_list.append(bbs_aug)

                    # new_bndbox_list:[[x1,y1,x2,y2],...[],[]]
                    n_x1 = int(max(1, min(img.shape[1], bbs_aug.bounding_boxes[0].x1)))
                    n_y1 = int(max(1, min(img.shape[0], bbs_aug.bounding_boxes[0].y1)))
                    n_x2 = int(max(1, min(img.shape[1], bbs_aug.bounding_boxes[0].x2)))
                    n_y2 = int(max(1, min(img.shape[0], bbs_aug.bounding_boxes[0].y2)))
                    if n_x1 == 1 and n_x1 == n_x2:
                        n_x2 += 1
                    if n_y1 == 1 and n_y2 == n_y1:
                        n_y2 += 1
                    if n_x1 >= n_x2 or n_y1 >= n_y2:
                        print('error', name)
                    new_bndbox_list.append([n_x1, n_y1, n_x2, n_y2])
                # 存储变化后的图片
                image_aug = seq_det.augment_images([img])[0]
                path = os.path.join(AUG_IMG_DIR, name[:-4] + '_' + str(epoch) + '.jpg')
                image_auged = bbs.draw_on_image(image_aug, thickness=0)
                try:
                    Image.fromarray(image_auged).save(path)
                except:
                    print(path)

                # 存储变化后的XML
                change_xml_list_annotation(XML_DIR, name[:-4], new_bndbox_list, AUG_XML_DIR,
                                           name[:-4] + '_' + str(epoch))
                print(name[:-4] + '_' + str(epoch) + '.jpg')
                new_bndbox_list = []

你可能感兴趣的:(目标检测,目标检测,深度学习,人工智能)

Radiance Fields from VGGSfM和Mast3r:两种先进3D重建方法的比较与分析 2401_87458718 3d
VGGSfM和Mast3r:3D场景重建的新方向在计算机视觉和3D重建领域,如何从2D图像重建3D场景一直是一个充满挑战的研究课题。近年来,随着深度学习技术的发展,一些新的方法被提出并取得了显著的进展。本文将重点介绍两种最新的基于深度学习的3D重建方法:VGGSfM和Mast3r,并通过GaussianSplatting技术对它们的性能进行全面比较和分析。VGGSfM:基于视觉几何的深度结构运动恢
基于 PyTorch 的 MNIST 手写数字分类模型欣然～ pytorch 分类人工智能
一、概述本代码使用PyTorch框架构建了一个简单的神经网络模型，用于解决MNIST手写数字分类任务。代码主要包括数据的加载与预处理、神经网络模型的构建、损失函数和优化器的定义、模型的训练、评估以及最终模型的保存等步骤。二、依赖库torch：PyTorch深度学习框架的核心库，提供了张量操作、自动求导等功能。torch.nn：PyTorch的神经网络模块，包含了各种神经网络层、损失函数等。torc
探索Google AI聊天模型的集成和使用 qahaj 人工智能 python
随着人工智能的飞速发展，GoogleAI的聊天模型提供了强大的自然语言处理能力，可以应用于多种场景中。本文将为你介绍如何通过GoogleAI和LangChain库来使用这些聊天模型。技术背景介绍GoogleAI提供了一系列强大的聊天模型，这些模型具备不同的功能和参数设置。它们不仅可以通过GoogleAI服务访问，还可以通过GoogleCloudVertexAI以企业级功能使用。在本文中，我们将重点
“租赁业务ERP+deepseek”模式的应用软件研究员汽车 DeepSeek 汽车租赁系统
汽车租赁业务从上世纪90年代发展至今，从传统的人工管理到软件辅助，随着互联网的发展，业务公司对汽车租赁系统提出了更高的要求，比如自助订单，业务推广、客户资质评估，车辆风控，风险预警等，又随着近期人工智能的出现，业务公司对业务系统的期望更高，期望都节约更多人工成本，让管理变得简单快捷高效和智能。所以就引发人们新的启发：“业务系统ERP+deepseek”，但业务系统ERP+deepseek能否满足业
高效快速教你DeepSeek如何进行本地部署并且可视化对话大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
科技文章：高效快速教你DeepSeek如何进行本地部署并且可视化对话摘要：随着自然语言处理（NLP）技术的进步，DeepSeek作为一款基于深度学习的语义搜索技术，广泛应用于文本理解、对话系统及信息检索等多个领域。本文将探讨如何高效快速地在本地部署DeepSeek，并结合可视化工具实现对话过程的监控与分析。通过详尽的步骤、案例分析与代码示例，帮助开发者更好地理解和应用DeepSeek技术。同时，本
不懂英语可以学编程吗?,不懂英文可以学编程吗 P5688346 人工智能
大家好，给大家分享一下英语不好能学python编程吗，很多人还不知道这一点。下面详细解释一下。现在让我们来看看！Sourcecodedownload:本文相关源码提到人工智能，就不得不提Python编程语言，大多数人觉得编程语言肯定会涉及到很多代码，满屏的英文字母，想想就头疼，觉得自己不会英语，肯定学不好Python，但是不会英语到底能不能够学习Python呢，下面小编给大家分析分析。其实各位想要
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
《当人工智能遇上广域网：跨越地理距离的通信变革》程序猿阿伟人工智能
在数字化时代，广域网作为连接全球信息的纽带，让数据能够在不同地区的网络之间流动。然而，地理距离给广域网数据传输带来诸多挑战，如高延迟、低带宽、信号衰减和不稳定等问题。幸运的是，飞速发展的人工智能技术为解决这些难题提供了新的方向，开启了广域网传输的新篇章。广域网传输面临的地理挑战广域网覆盖范围极为广泛，可连接不同城市、国家甚至跨越洲际，这使得数据传输要跨越漫长的地理距离。以跨国公司的广域网为例，其总
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
NLP高频面试题（十）——目前常见的几种大模型架构是啥样的 Chaos_Wang_ NLP常见面试题自然语言处理架构人工智能
深入浅出：目前常见的几种大模型架构解析随着Transformer模型的提出与发展，语言大模型迅速崛起，已经成为人工智能领域最为关注的热点之一。本文将为大家详细解析几种目前常见的大模型架构，帮助读者理解其核心差异及适用场景。1.什么是LLM（大语言模型）？LLM通常指参数量巨大、能够捕捉丰富语义信息的Transformer模型，它们通过海量的文本数据训练而成，能够实现高度逼真的文本生成、复杂的语言理
深度学习 | pytorch + torchvision + python 版本对应及环境安装 zfgfdgbhs 深度学习 python pytorch
目录一、版本对应二、安装命令（pip）1.版本（1）v2.5.1~v2.0.0（2）v1.13.1~v1.11.0（3）v1.10.1~v1.7.02.安装全过程（1）选择版本（2）安装结果参考文章一、版本对应下表来自pytorch的github官方文档：pytorch/vision:Datasets,TransformsandModelsspecifictoComputerVisionpytor
机器学习 Day01人工智能概述山北雨夜漫步机器学习人工智能
1.什么样的程序适合在gpu上运行计算密集型的程序：此类程序主要运算集中在寄存器，寄存器读写速度快，而GPU拥有强大的计算能力，能高效处理大量的寄存器运算，因此适合在GPU上运行。像科学计算中的数值模拟、密码破解等场景的程序，都属于计算密集型，在GPU上运行可大幅提升运算速度。易于并行的程序：GPU采用SIMD架构，有众多核心，同一时间每个核心适合做相同的事。易于并行的程序能充分利用GPU这一特性
《今日AI-人工智能-编程日报》-源自2025年3月20日小亦编辑部每日AI-人工智能-编程日报人工智能大数据
一、AI行业动态英伟达新一代AI芯片Rubin发布计划英伟达宣布其新一代AI芯片Rubin将于2026年下半年推出，下下一代AI芯片架构命名为Feynman，计划于2028年登场。同时，英伟达还推出了RTXPRO6000系列Blackwell专业卡，拥有24064核心、96GB显存和最高600W功耗。OpenAI星际之门数据中心建设进展OpenAI的首个数据中心“星际之门”预计于2026年中在德克
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
AIOps：解决企业IT挑战的智能利器雅菲奥朗认证培训 AIOps SRE 可观测性
前言：在当今数字化的时代，企业IT基础设施和应用程序规模不断扩大，面临着日益复杂的挑战。在这种情况下，AIOps人工智能运维成为解决企业IT运维困境的智能利器。AIOps与可观测性密切相关，可观测性是实现AIOps的基础。通过收集、监视和理解系统数据，AIOps能够自动化运维任务、实时监控系统状态、预测潜在问题，从而提高效率和稳定性。AIOps尤其适用于IT运维部门，这是一个迫切需要此类技术的群体
使用AIOps进行更好的事件管理茵赛飞3D CAD数据转换软件 pagerduty devops 人工智能运维
DevOps为科技界带来了更加协作和高效的工作流程。随着AIOps的集成，自动化更进一步，使用人工智能为团队提供更快的根本原因分析和算法降噪。主要从采用AIOps中受益的主要领域之一是事件管理。AIOps可以帮助DevOps团队自动化工作流程，以实现更智能、更高效的事件管理，从而腾出时间让IT运营团队成员专注于创新以改善用户体验。在本文中，我们将了解AIOps如何从检测和识别到响应改进事件管理，以
AI大模型编程能力对比：Deepseek&Claude&Gemini 黑夜路人（heiyeluren） AI人工智能人工智能 ai AIGC 语言模型
在当今快速发展的技术领域，人工智能（AI）模型在编程和数据处理方面的应用越来越广泛。不同的AI模型因其独特的设计理念和技术优势，适用于不同的编程任务和场景。本文将对三种主流的AI模型——DeepSeekv3、GeminiFlash2.0和Claude3.5Sonnet的编程能力进行详细对比，帮助读者根据具体需求选择最合适的工具。同时对DeepSeekv3、GeminiFlash2.0和Claude
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
哈尔滨工业大学DeepSeek公开课人工智能：大模型原理技术与应用-从GPT到DeepSeek｜附视频下载方法你觉得205 人工智能机器学习大数据 ai 知识图谱 python 运维
导读INTRODUCTION今天继续哈尔滨工业大学车万翔教授带来了一场主题为“DeepSeek技术前沿与应用”的报告。本报告深入探讨了大语言模型在自然语言处理（NLP）领域的核心地位及其发展历程，从基础概念出发，延伸至语言模型在机器翻译、拼音输入法、语音识别等任务中的关键作用。强调了语言模型不仅辅助其他NLP任务，本身也蕴含大量知识，如地理信息、语义理解和推理能力。随着技术的发展，尤其是trans
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
编程内容简述！恶霸不委屈开发语言青少年编程汇编 java python
编程是指通过计算机语言来开发软件、程序和应用的过程，通常通过编写一系列的指令，来让计算机完成特定的任务。编程可以涉及多个领域和技术，以下是一些主要的编程内容：1.编程语言编程语言是程序员与计算机进行沟通的桥梁，不同的编程语言适用于不同的任务。常见的编程语言有：Python：简单易学，适用于数据分析、人工智能、网页开发等。JavaScript：网页开发中不可或缺的语言，用于动态网页和前端开发。Jav
大模型Agent 和 RAG 的关系大数据追光猿大模型语言模型人工智能学习方法 transformer
Agent和RAG（Retrieval-AugmentedGeneration）是两种在自然语言处理（NLP）和人工智能领域中广泛使用的技术，它们在功能、目标和实现方式上既有区别又有联系。以下是它们的关系及其协同作用的详细分析。1.Agent和RAG的定义（1）Agent定义：Agent是一种智能体，能够感知环境并采取行动以完成特定任务。在NLP领域，Agent通常指一个基于大语言模型（LLM）的
国产模型能否挑战 GPT-4？一文拆解 DeepSeek-V3 架构与实战应用 AI筑梦师人工智能学习框架架构深度学习 python agi 人工智能 tensorflow
✳️一、引言✅1.1DeepSeek-V3发布背景与定位随着大模型技术的快速演进，从GPT-3到GPT-4，全球在通用人工智能方向取得了长足进展。但与此同时，开源社区始终缺乏一个真正兼顾性能、效率、中文能力和实用性的高质量大模型。DeepSeek-V3的推出正是在这个背景下的一次关键突破。DeepSeek-V3是由中国团队DeepSeek开发的第三代大语言模型，它具备以下几个核心特性：开源可商用：
Agent、RAG、LangChain的概念及作用北极冰雨大模型人工智能
Agent：概念：在人工智能中，Agent通常指的是能够执行任务或做出决策的实体，可以是简单的程序，也可以是复杂的系统，如自动化客服助手、推荐系统等，甚至可以是软件代理、机器人或虚拟助手等各种形式。作用：它能利用内置的大语言模型来做出规划，决定执行哪些步骤，以及每个步骤需要调用哪些工具（如RAG），之后调用相应的工具，最终完成任务。例如，在客服问答场景中，Agent可以根据用户的问题，规划出需要查
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
DeepSeek多语言AI高效应用实践智能计算研究中心其他
内容概要在人工智能技术快速迭代的背景下，DeepSeek系列模型凭借混合专家架构（MoE）与670亿参数规模，在多语言处理、视觉语言理解及复杂任务生成领域实现了突破性进展。本文系统性拆解其技术架构设计逻辑，聚焦论文写作、代码生成、SEO关键词拓展三大核心场景，分析模型在高生成质量、低使用成本维度的差异化优势。技术维度DeepSeekProver传统单模态模型多语言支持97种语言动态切换单一语种优化
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
英伟达常用GPU参数速查表，含B300..... Ai17316391579 深度学习服务器人工智能机器学习服务器电脑计算机视觉深度学习神经网络
英伟达常用GPU参数速查表，收藏备用：含RTX5090、RTX4090D、L40、L20、A100、A800、H100、H800、H20、H200、B200、B300、GB300.....专注于高性能计算人工智能细分领域kyfwq001#5090##4090##英伟达“新核弹”B200发布##英伟达##英伟达B300##GPU##服务器##显卡##英伟达H800/A800芯片将禁售#
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源