Le0v1n

常用脚本-持续更新（文件重命名、视频抽帧、拆帧、删除冗余文件、yolo2xml、转换图片格式、修改xml）

所有代码位置：Learning-Notebook-Codes/Python/常用脚本

1. 文件重命名

脚本路径：codes/files_rename.py
脚本说明：可以自动重命名某个文件夹下指定类型的文件。
- 修改前文件名称: img1.jpg
- 修改后文件名称: Le0v1n-20231123-X-0001.jpg

import os
import tqdm
import datetime


"""============================ 需要修改的地方 ==================================="""
SRC_PATH = 'Python/常用脚本/EXAMPLE_FOLDER'  # 文件夹路径
file_type = ('.png', '.jpg', '.jpeg', '.gif')  # 想要重命名的文件类型

# -------------------重命名相关------------------
retain_previous_name = False  # 是否保留之前的名称
new_name = "Le0v1n"  # retain_previous_name为False时生效
use_date_stamp = True  # 是否使用时间戳 -> e.g. 20231123
comment = "X"  # 备注
use_serial_numbering = True  # 是否使用顺序的编号 -> 1, 2, 3, 4, 5, 6, ...
start_number = 1  # 从编号几开始 -> e.g. 1: 从 0001 开始编号
numbering_placeholder = 4  # 编号保留的占位 -> e.g. 0001, 0002, 0003, ...
hyphen = '-'  # 连字符 -> e.g. filename-0001.jpg
"""==============================================================================="""

# 获取目录中的所有图片文件
files_list = [file for file in os.listdir(SRC_PATH) if file.lower().endswith(file_type)]

"------------计数------------"
TOTAL_FILES_NUM = len(files_list)  # 需要重命名的文件数量
RENAME_NUM = 0  # 重命名成功数量
"---------------------------"

# 获取当前时间并格式化时间戳
timestamp = datetime.datetime.now().strftime("%Y%m%d")

# 遍历文件
process_bar = tqdm.tqdm(total=TOTAL_FILES_NUM, desc="为指定格式的文件重命名", unit='file')  # 创建进度条
for idx, file_name in enumerate(files_list):
    file_pre, file_ext = os.path.splitext(file_name)  # 获得文件名和后缀
    process_bar.set_description(f"rename for \033[1;31m{file_name}\033[0m")

    # 构建新的文件名
    if retain_previous_name:  # 保留原有的名称
        NEW_FILE_NAME = f"{file_pre}"
    elif new_name:  # 不保留原有的名称且新名称存在
        NEW_FILE_NAME = new_name
    else:  # 不保留原有的名称也没有新名称 -> 报错
        raise KeyError(f"不保留原有的名称也没有新名称!")
    
    if use_date_stamp:  # 使用时间戳
        NEW_FILE_NAME += f"{hyphen}{timestamp}"
    
    if comment:  # 添加备注
        NEW_FILE_NAME += f"{hyphen}{comment}" 
    
    if use_serial_numbering:  # 使用编号
        NEW_FILE_NAME += f"{hyphen}{idx + start_number:0{numbering_placeholder}d}"

    # 加上扩展名
    NEW_FILE_NAME += file_ext
    
    # 开始重命名文件         
    _src = os.path.join(SRC_PATH, file_name)  # 旧文件路径
    _dst = os.path.join(SRC_PATH, NEW_FILE_NAME)  # 新文件路径
    
    os.rename(_src, _dst)  # 重命名文件
    RENAME_NUM += 1
    process_bar.update(1)
process_bar.close()
    
print(f" 文件重命名完成: {RENAME_NUM}/{TOTAL_FILES_NUM}")

2. 视频抽帧

脚本路径：codes/extract_frames.py
脚本说明：根据帧间隔对某个文件夹下指定类型的视频文件进行抽帧，得到系列图片。
- 视频文件所在文件夹名称: EXAMPLE_FOLDER
- 抽帧得到的文件夹名称: EXAMPLE_FOLDER/extract_frames_results/test_vid_0001.jpg

import cv2
import os
import tqdm
from utils import create_folder


"""============================ 需要修改的地方 ==================================="""
SRC_PATH = "Python/常用脚本/EXAMPLE_FOLDER"  # 原始视频路径
frame_interval = 10  # 视频采样间隔，越小采样率越高 -> 60 | 30 | 15 | 10
video_type = ['.mp4', '.avi']  # 视频格式(.mp4 | .avi)

DST_PATH = "extract_frames_results"  # 保存图片文件夹名称
save_img_format = '.jpg'  # 保存的图片格式(.jpg | .png)
"""==============================================================================="""

# 构建路径
results_imgs_path = os.path.join(SRC_PATH, DST_PATH)  # 保存图片路径

# 得到存放所有视频的list
video_list = [x for x in os.listdir(SRC_PATH) if os.path.splitext(x)[-1] in video_type]

"------------计数------------"
TOTAL_VID_NUM = len(video_list)
SUCCEED_NUM = 0  # 完成视频的个数
TOTAL_IMG_NUM = 0  # 统计得到的所有图片数量
"---------------------------"

print(f"\033[1;31m[SRC]视频路径为: {SRC_PATH}\033[0m"
      f"\n\t\033[1;32m视频个数: {TOTAL_VID_NUM}\033[0m"
      f"\n\033[1;31m[DST]图片保存路径为: {DST_PATH}\033[0m"
      f"\n\t\033[1;32m保存的图片格式为: {save_img_format}\033[0m"
      f"\n\n请输入 \033[1;31m'yes'\033[0m 继续，输入其他停止")
_INPUT = input()
if _INPUT != "yes":
    exit()
    
create_folder(results_imgs_path, verbose=True)  # 创建文件夹

# 创建一个tqdm进度条对象
progress_bar = tqdm.tqdm(total=len(video_list), desc="视频拆帧...", unit="vid")
statistics_dict = dict()  # 创建一个字典，用于统计
for vid_name in video_list:  # 遍历所有的视频
    save_number = 1  # 记录当前视频保存的frame个数
    vid_pre, vid_ext = os.path.splitext(vid_name)  # 获取文件名和后缀
    
    vid_path = os.path.join(SRC_PATH, vid_name)  # 视频完整路径
    
    # 创建VideoCapture对象
    vc = cv2.VideoCapture(vid_path)

    # 检查视频是否成功打开
    if not vc.isOpened():
        continue
    
    # 逐帧读取视频并保存为图片
    frame_count = 0
    while True:
        # 读取一帧
        rval, frame = vc.read()

        # 检查是否成功读取帧
        if not rval:  # 读取帧失败
            break

        # 每隔 frame_interval 帧保存一次图片
        if frame_count % frame_interval == 0:
            # 生成图片文件名
            frame_name = f"{vid_pre}_{save_number:04d}{save_img_format}"
            frame_path = os.path.join(results_imgs_path, frame_name)  # Python\常用脚本\EXAMPLE_FOLDER\extract_frames_results\test_vid_0016.jpg

            progress_bar.set_description(f"\033[1;31m{vid_name}\033[0m -> "
                                            f"\033[1;36m{save_number * frame_interval:04d}\033[0m"
                                            f" ({save_number})")  # 更新tqdm的描述
            # 保存帧为图片
            cv2.imwrite(frame_path, frame)
            save_number += 1

        # 帧数加1
        frame_count += 1

    # 释放VideoCapture对象
    vc.release()
    TOTAL_IMG_NUM += save_number  # 更新图片数量
    SUCCEED_NUM += 1
    statistics_dict[vid_pre] = save_number  # 更新字典，记录当前视频得到的frame个数
    progress_bar.update()  
progress_bar.close()

print("------------------------------------------------------------------")
_cont = 0
for k, v in statistics_dict.items():
    print(f"\033[1;34m"
          f" 1. [{k}] 得到 frame 个数 -> {v}"
          f"\033[0m")
    _cont += 1
print()
print(f"\033[1;31m"
      f" 视频拆帧 ({TOTAL_VID_NUM}个)完成，总共得到[{TOTAL_IMG_NUM}]张{save_img_format}图片!"
      f"\033[0m")
print("------------------------------------------------------------------")

3. 根据文件A删除冗余的文件B

脚本路径：codes/delete-Redundant_fileB.py
脚本说明：根据文件 A 删除冗余文件 B。
用途：根据 annotations 删除冗余的 images。
要求：文件 A 和文件 B 应该有相同的名字（后缀不同）。

"""
+ 脚本说明：根据文件 A 删除冗余文件 B。
+ 用途：根据 annotations 删除冗余的 images。
+ 要求：文件 A 和 文件 B 应该有相同的名字（后缀不同）。
"""
import os
import tqdm


"""============================ 需要修改的地方 ==================================="""
path_A = 'Python/常用脚本/EXAMPLE_FOLDER/images'  # 不删除
file_type_A = ('.jpg', '.png')

path_B = 'Python/常用脚本/EXAMPLE_FOLDER/annotations'  # 会删除的
file_type_B = ('.json', '.xml')
"""==============================================================================="""

# 获取两种文件列表
files_A_list = [file for file in os.listdir(path_A) if file.endswith(file_type_A)]
files_B_list = [file for file in os.listdir(path_B) if file.endswith(file_type_B)]

"------------计数------------"
NUM_B = len(files_A_list)
NUM_B = len(files_B_list)
SUCCEED_NUM = 0
SKIP_NUM = 0
"---------------------------"

print(f"文件[A]所在文件夹路径为: {path_A}"
      f"\n\t文件[A]数量为: {NUM_B}"
      f"\n\t文件[A]的后缀为: {file_type_A}"
      f"\n文件[B]所在文件夹路径为: {path_B}"
      f"\n\t文件[B]数量为: {NUM_B}"
      f"\n\t文件[B]的后缀为: {file_type_B}"
      f"\n\n请输入 \033[1;31m'yes'\033[0m 继续，输入其他停止")
_INPUT = input()
if _INPUT != "yes":
    exit()

# 遍历文件B
process_bar = tqdm.tqdm(total=NUM_B, desc="根据文件A删除冗余的文件B", unit='unit')
for name_B in files_B_list:
    pre_B, ext_A = os.path.splitext(name_B)  # 分离文件名和后缀
    process_bar.set_description(f"Process with \033[1;31m{name_B}\033[0m")
    
    # 判断对应的同名 A 文件是否存在，如果存在则跳过
    dst_path = os.path.join(path_A, pre_B)  # 没有后缀
    _exist_flag = 0
    for ext_A in file_type_A:  # 遍历所有格式，看是否有至少一个同名文件存在
        if os.path.exists(dst_path + ext_A):
            _exist_flag += 1
    if _exist_flag > 0:  # 如果存在至少一个同名文件, 则跳过
        SKIP_NUM += 1
        process_bar.update()
    else:  # 没有同名文件, 则删除文件B
        del_path = os.path.join(path_B, name_B)
        os.remove(del_path)
        SUCCEED_NUM += 1
        process_bar.update()
process_bar.close()

print(f" 冗余的B文件删除已完成!"
      f"\n\t删除文件数量/文件B数量 = {SUCCEED_NUM}/{NUM_B}"
      f"\n\t跳过文件数量/文件B数量 = {SKIP_NUM}/{NUM_B}")

if SUCCEED_NUM + SKIP_NUM == NUM_B:
    print(" No Problems")
else:
    print(f" 有问题，请仔细核对!"
          f"\n\tSUCCEED_NUM: {SUCCEED_NUM}\tSKIP_NUM: {SKIP_NUM}"
          f"\n\tSUCCEED_NUM + SKIP_NUM + ERROR_NUM = {SUCCEED_NUM + SKIP_NUM}"
          f"\n\tTOTAL_NUM: {NUM_B}")

4. yolo2xml

脚本路径：codes/D-yolo2xml.py
脚本说明：将yolo格式txt标注文件转换为voc格式xml标注文件
用途：将 YOLO 格式的标签文件还原为 xml 格式
要求：图片和yolo标签应该有相同的名字（后缀不同）

"""
+ 脚本说明：将yolo格式txt标注文件转换为voc格式xml标注文件
+ 用途：将 YOLO 格式的标签文件还原为 xml 格式
+ 要求：图片和yolo标签应该有相同的名字（后缀不同）
"""
from xml.dom.minidom import Document
import os
import cv2
import tqdm


"""============================ 需要修改的地方 ==================================="""
IMAGE_PATH = "EXAMPLE_FOLDER/images"  # 原图文件夹路径
TXT_PATH = "EXAMPLE_FOLDER/labels-yolo"  # 原txt标签文件夹路径
XML_PATH = "EXAMPLE_FOLDER/labels-xml"  # 保存xml文件夹路径
image_type = '.jpg'
create_empty_xml_for_neg = True  # 是否为负样本生成对应的空的xml文件


classes_dict = {
    '0': "cat",
    '1': 'dog'
}
"""==============================================================================="""

os.makedirs(XML_PATH) if not os.path.exists(XML_PATH) else None

txt_file_list = [file for file in os.listdir(TXT_PATH) if file.endswith(".txt") and file != 'classes.txt']

"------------计数------------"
TOTAL_NUM = len(txt_file_list)
SUCCEED_NUM = 0  # 成功创建xml数量
SKIP_NUM = 0  # 跳过创建xml文件数量
OBJECT_NUM = 0  # object数量
"---------------------------"

process_bar = tqdm.tqdm(total=TOTAL_NUM, desc="yolo2xml", unit='.txt')
for i, txt_name in enumerate(txt_file_list):
    process_bar.set_description(f"Process in \033[1;31m{txt_name}\033[0m")
    txt_pre, txt_ext = os.path.splitext(txt_name)  # 分离前缀和后缀
    
    xmlBuilder = Document()  # 创建一个 XML 文档构建器
    annotation = xmlBuilder.createElement("annotation")  # 创建annotation标签
    xmlBuilder.appendChild(annotation)
    
    # 打开 txt 文件
    txtFile = open(os.path.join(TXT_PATH, txt_name))
    txtList = txtFile.readlines()  # 以一行的形式读取txt所有内容
    
    if not txtList and not create_empty_xml_for_neg:  # 如果 txt 文件内容为空且不允许为负样本创建xml文件
        SKIP_NUM += 1
        process_bar.update()
        continue
        
    # 读取图片
    img = cv2.imread(os.path.join(IMAGE_PATH, txt_pre) + image_type)
    H, W, C = img.shape
    
    # folder标签
    folder = xmlBuilder.createElement("folder")  
    foldercontent = xmlBuilder.createTextNode('images')
    folder.appendChild(foldercontent)
    annotation.appendChild(folder)  # folder标签结束

    # filename标签
    filename = xmlBuilder.createElement("filename")  
    filenamecontent = xmlBuilder.createTextNode(txt_pre + image_type)
    filename.appendChild(filenamecontent)
    annotation.appendChild(filename)  # filename标签结束

    # size标签
    size = xmlBuilder.createElement("size")  
    width = xmlBuilder.createElement("width")  # size子标签width
    widthcontent = xmlBuilder.createTextNode(str(W))
    width.appendChild(widthcontent)
    size.appendChild(width)  # size子标签width结束

    height = xmlBuilder.createElement("height")  # size子标签height
    heightcontent = xmlBuilder.createTextNode(str(H))
    height.appendChild(heightcontent)
    size.appendChild(height)  # size子标签height结束

    depth = xmlBuilder.createElement("depth")  # size子标签depth
    depthcontent = xmlBuilder.createTextNode(str(C))
    depth.appendChild(depthcontent)
    size.appendChild(depth)  # size子标签depth结束
    annotation.appendChild(size)  # size标签结束
    
    # 读取 txt 内容，生成 xml 文件内容
    for line in txtList:  # 正样本(txt内容不为空)
        # .strip()去除行首和行尾的空白字符（如空格和换行符）
        oneline = line.strip().split(" ")  # oneline是一个list, e.g. ['0', '0.31188484251968507', '0.6746135899679205', '0.028297244094488208', '0.04738990959463407']

        # 开始 object 标签
        object = xmlBuilder.createElement("object")  # object 标签
        
        # 1. name标签
        picname = xmlBuilder.createElement("name")  
        namecontent = xmlBuilder.createTextNode(classes_dict[oneline[0]])  # 确定是哪个类别
        picname.appendChild(namecontent)
        object.appendChild(picname)  # name标签结束

        # 2. pose标签
        pose = xmlBuilder.createElement("pose")  
        posecontent = xmlBuilder.createTextNode("Unspecified")
        pose.appendChild(posecontent)
        object.appendChild(pose)  # pose标签结束

        # 3. truncated标签
        truncated = xmlBuilder.createElement("truncated")  
        truncatedContent = xmlBuilder.createTextNode("0")
        truncated.appendChild(truncatedContent)
        object.appendChild(truncated)  # truncated标签结束
        
        # 4. difficult标签
        difficult = xmlBuilder.createElement("difficult")  
        difficultcontent = xmlBuilder.createTextNode("0")
        difficult.appendChild(difficultcontent)
        object.appendChild(difficult)  # difficult标签结束

        # 5. bndbox标签
        bndbox = xmlBuilder.createElement("bndbox")  
        ## 5.1 xmin标签
        xmin = xmlBuilder.createElement("xmin")  
        mathData = int(((float(oneline[1])) * W + 1) - (float(oneline[3])) * 0.5 * W)
        xminContent = xmlBuilder.createTextNode(str(mathData))
        xmin.appendChild(xminContent)
        bndbox.appendChild(xmin)  # xmin标签结束

        ## 5.2 ymin标签
        ymin = xmlBuilder.createElement("ymin")  # ymin标签
        mathData = int(((float(oneline[2])) * H + 1) - (float(oneline[4])) * 0.5 * H)
        yminContent = xmlBuilder.createTextNode(str(mathData))
        ymin.appendChild(yminContent)
        bndbox.appendChild(ymin)  # ymin标签结束
        
        ## 5.3 xmax标签
        xmax = xmlBuilder.createElement("xmax")  # xmax标签
        mathData = int(((float(oneline[1])) * W + 1) + (float(oneline[3])) * 0.5 * W)
        xmaxContent = xmlBuilder.createTextNode(str(mathData))
        xmax.appendChild(xmaxContent)
        bndbox.appendChild(xmax)  # xmax标签结束

        ## 5.4 ymax标签
        ymax = xmlBuilder.createElement("ymax")  # ymax标签
        mathData = int(
            ((float(oneline[2])) * H + 1) + (float(oneline[4])) * 0.5 * H)
        ymaxContent = xmlBuilder.createTextNode(str(mathData))
        ymax.appendChild(ymaxContent)
        bndbox.appendChild(ymax)  # ymax标签结束

        object.appendChild(bndbox)  # bndbox标签结束
        annotation.appendChild(object)  # object标签结束
        
        OBJECT_NUM += 1

    # 创建 xml 文件
    f = open(os.path.join(XML_PATH, txt_pre) + '.xml', 'w')

    # 为 创建好的 xml 文件写入内容
    xmlBuilder.writexml(f, indent='\t', newl='\n',
                        addindent='\t', encoding='utf-8')
    f.close()  # 关闭xml文件
    
    SUCCEED_NUM += 1
    process_bar.update()
process_bar.close()

print(f"yolo2xml已完成, 详情如下:"
      f"\n\t成功转换文件数量/总文件数量 = \033[1;32m{SUCCEED_NUM}\033[0m/{TOTAL_NUM}"
      f"\n\t跳过转换文件数量/总文件数量 = \033[1;31m{SKIP_NUM}\033[0m/{TOTAL_NUM}"
      f"\n\t所有样本的 object 数量/总文件数量 = \033[1;32m{OBJECT_NUM}\033[0m/{TOTAL_NUM}"
      f"\n\t平均每个xml文件中object的数量为: {int(OBJECT_NUM / SUCCEED_NUM)}")

if SUCCEED_NUM + SKIP_NUM == TOTAL_NUM:
    print(f"\n \033[1;32mNo Problem\033[0m")
else:
    print(f"\n \033[1;31m貌似有点问题, 请仔细核查!\033[0m")

5. 转换图片格式

脚本路径：codes/E-转换图片格式
脚本说明：对指定文件夹下所有的图片进行格式转换
用途：统一数据集图片的格式
要求：无
注意：
1. 不需要转换的则跳过
2. 不是图片的文件会扔到指定位置 RECYCLE_BIN_PATH

"""
+ 脚本说明：对指定文件夹下所有的图片进行格式转换
+ 用途：统一数据集图片的格式
+ 要求：无
+ 注意：
  1. 不需要转换的则跳过
  2. 不是图片的文件会扔到指定位置 RECYCLE_BIN_PATH
"""
import os
import tqdm
from PIL import Image
import shutil


"""============================ 需要修改的地方 ==================================="""
# 定义文件夹路径
IMG_PATH                 = "EXAMPLE_FOLDER/images"  # 输入图片所在文件夹路径
wanna_convert_image_type = '.jpg'  # 想要转换的图片格式
other_image_type         = ['.png', '.jpeg']  # 什么格式的图片将会被转换
"""==============================================================================="""

# 确定回收站位置
RECYCLE_BIN_PATH = os.path.join(os.path.dirname(IMG_PATH), "recycle_bin")

# 获取文件夹内所有文件
all_files = os.listdir(IMG_PATH)

"------------计数------------"
TOTAL_NUM           = len(all_files)
SUCCEED_CONVERT_NUM = 0
SKIP_CONVERT_NUM    = 0
OTHER_FILE_NUM      = 0
"---------------------------"

# 遍历所有的图片
process_bar = tqdm.tqdm(total=TOTAL_NUM, desc=f"将所有图片转换为{wanna_convert_image_type}格式", unit='file')
for file_name in all_files:
    # 分离文件名和后缀
    file_pre, file_ext = os.path.splitext(file_name)
    process_bar.set_description(f"Process in \033[1;31m{file_name}\033[0m")
    
    # 构建文件完整路径
    file_path = os.path.join(IMG_PATH, file_name)
    
    # 检查文件是否为.jpg格式
    if file_ext == wanna_convert_image_type:  # 如果是 jpg 则跳过
        SKIP_CONVERT_NUM += 1
        process_bar.update()
        continue
    elif file_ext in other_image_type:  # 如果是其他图片格式
        with Image.open(file_path) as img:
            # 构建输出文件路径
            dst_save_path = os.path.join(IMG_PATH, file_pre) + wanna_convert_image_type
            img.save(dst_save_path)  # 保存为.jpg格式
            
            # 将原有的图片移动到其他文件夹下
            dst_move_path = os.path.join(RECYCLE_BIN_PATH, file_name)
            shutil.move(src=file_path, dst=dst_move_path)

            SUCCEED_CONVERT_NUM += 1
            process_bar.update()
    else:  # 既不是 jpg 也不是 png、jpeg，则移动到其他文件夹下
        if not os.path.exists(RECYCLE_BIN_PATH):
            os.mkdir(RECYCLE_BIN_PATH)
            
        dst_move_path = os.path.join(RECYCLE_BIN_PATH, file_name)
        shutil.move(src=file_path, dst=dst_move_path)
        OTHER_FILE_NUM += 1
        process_bar.update()
process_bar.close()

print(f" 所有图片已转换为jpg, 详情如下:"
      f"\n\t成功转换数量/总文件数量 = \033[1;32m{SUCCEED_CONVERT_NUM}\033[0m/{TOTAL_NUM}"
      f"\n\t跳过文件数量/总文件数量 = \033[1;34m{SKIP_CONVERT_NUM}\033[0m/{TOTAL_NUM}"
      f"\n\t其他格式文件数量/总文件数量 = \033[1;31m{OTHER_FILE_NUM}\033[0m/{TOTAL_NUM}")

if SUCCEED_CONVERT_NUM + SKIP_CONVERT_NUM + OTHER_FILE_NUM == TOTAL_NUM:
    print(" No Problems")
else:
    print(f" 貌似有点问题, 请仔细核查!"
          f"\n\tSUCCEED_NUM: {SUCCEED_CONVERT_NUM}"
          f"\n\tSKIP_NUM: {SKIP_CONVERT_NUM}"
          f"\n\tOTHER_FILE_NUM = {OTHER_FILE_NUM}"
          f"\nSUCCEED_NUM + SKIP_NUM + OTHER_FILE_NUM = {SUCCEED_CONVERT_NUM + SKIP_CONVERT_NUM + OTHER_FILE_NUM}"
          f"\nTOTAL_NUM: {TOTAL_NUM}")

6. 根据图片修改xml文件中的size尺寸信息

脚本路径：codes/F-根据图片修改xml文件中的size尺寸信息.py
脚本说明：根据图片修改xml文件中的size尺寸信息
用途：修正数据集标签的信息
要求：无
注意：
1. 不是in-place操作
2. 不需要转换的也会复制到新的文件夹下
3. 如果遇到xml没有对应图片的，则会记录该错误，并生成 ERROR_LOG.txt 文件

"""
+ 脚本说明：根据图片修改xml文件中的size尺寸信息
+ 用途：修正数据集标签的信息
+ 要求：无
+ 注意：
  1. 不是in-place操作
  2. 不需要转换的也会复制到新的文件夹下
  3. 如果遇到xml没有对应图片的，则会记录该错误，并生成 ERROR_LOG.txt 文件
"""
from PIL import Image
import os
import xml.etree.ElementTree as ET
import tqdm
import sys


"""============================ 需要修改的地方 ==================================="""
# 输入和输出文件夹路径
XML_PATH  = "EXAMPLE_FOLDER/labels-xml"  # 修正前的 xml 文件夹路径
SAVE_PATH = "EXAMPLE_FOLDER/labels-xml-fixed"  # 修正后的 xml 文件夹路径
IMG_PATH  = "EXAMPLE_FOLDER/images"  # 同名图片文件夹路径
img_type  = '.jpg'  # 图片的格式
"""==============================================================================="""

# 确保输出文件夹存在
if not os.path.exists(SAVE_PATH):
    os.makedirs(SAVE_PATH, exist_ok=True)

# 获取xml文件列表
annotation_files = [file for file in os.listdir(XML_PATH) if file.lower().endswith('.xml')]

"------------计数------------"
TOTAL_NUM   = len(annotation_files)  # 需要处理的 .xml 文件数量
SUCCEED_NUM = 0  # 成功修改的数量
SKIP_NUM    = 0  # 跳过的数量
ERROR_NUM   = 0  # 出错的数量
ERROR_LIST  = []  # 出错的logging
"---------------------------"

# 遍历所有的xml文件
process_bar = tqdm.tqdm(total=TOTAL_NUM, desc="根据图片修正 xml 文件的尺寸  信息", unit='xml')
for xml_file in annotation_files:
    xml_name, xml_ext = os.path.splitext(xml_file)  # 分离文件名和后缀
    process_bar.set_description(f"Process in \033[1;31m{xml_file}\033[0m")
    
    # 读取 xml 文件
    xml_path = os.path.join(XML_PATH, xml_file)  # 获取完整路径
    tree     = ET.parse(xml_path)  # 解析 xml 树
    root     = tree.getroot()  # 获取 xml 树的根
    
    # 获取同名图片文件名
    image_path = os.path.join(IMG_PATH, xml_name) + img_type
    
    # 判断对应的同名图片文件是否存在，如果不存在则记录错误
    if not os.path.exists(image_path):
        ERROR_NUM += 1
        ERROR_LIST.append(xml_path)
        process_bar.update()
        continue
    
    # 使用PIL获取图片尺寸
    image = Image.open(image_path)
    width, height = image.size
    
    # 判断 xml 中的  标签是否和图片尺寸对应
    size_elem = root.find("size")
    if size_elem.find("width").text == str(width) and size_elem.find("height").text == str(height):
        # 不需要修正，直接保存文件
        output_path = os.path.join(SAVE_PATH, xml_file)
        tree.write(output_path, encoding="utf-8")
        SKIP_NUM += 1
        process_bar.update()
        continue
    else:
        # 更新xml中的标签
        size_elem.find("width").text = str(width)
        size_elem.find("height").text = str(height)

        # 保存修正后的xml文件
        output_path = os.path.join(SAVE_PATH, xml_file)
        tree.write(output_path, encoding="utf-8")
        SUCCEED_NUM += 1
        process_bar.update()
process_bar.close()

print(f" xml 文件的 size 信息修正已完成, 详情如下:"
      f"\n\t成功修正数量/总xml数量 = \033[1;32m{SUCCEED_NUM}\033[0m/{TOTAL_NUM}"
      f"\n\t跳过数量/总xml数量 = \033[1;34m{SKIP_NUM}\033[0m/{TOTAL_NUM}"
      f"\n\t出错数量/总xml数量 = \033[1;31m{ERROR_NUM}\033[0m/{TOTAL_NUM}")

if SUCCEED_NUM + SKIP_NUM == TOTAL_NUM:
    print(" \033[1;32mNo Problems\033[0m")
else:
    print(f" 貌似有点问题, 请仔细核查!"
          f"\n\tSUCCEED_NUM: {SUCCEED_NUM}"
          f"\n\tSKIP_NUM: {SKIP_NUM}"
          f"\n\tERROR_NUM = {ERROR_NUM}"
          f"\nSUCCEED_NUM + SKIP_NUM + ERROR_NUM = {SUCCEED_NUM + SKIP_NUM + ERROR_NUM}"
          f"\nTOTAL_NUM: {TOTAL_NUM}")

if ERROR_LIST:  # 如果有出错信息
    program_path = sys.argv[0]  # 获取程序完整路径
    program_name = os.path.basename(program_path)  # 获取程序名称
    program_parent_path = os.path.dirname(program_path)  # 获取程序所在文件夹路径
    
    ERROR_LOG_PATH = os.path.join(program_parent_path, f"ERROR_LOG-[{program_name}].txt")
    
    with open(ERROR_LOG_PATH, "w") as file:  # 打开文本文件以写入模式
        file.write(f"Program: {program_path}\n")  # 写入程序名称
        file.write(f" 出错了 -> 出错数量/总文件数量 = {ERROR_NUM}/{TOTAL_NUM}\n")  # 写入总体出错信息
        file.write('=' * 50 + '\n')  # 写入分隔线

        # 遍历出错信息列表，写入文件
        for e in ERROR_LIST:
            file.write(f"{e}\n")
            
        # 写入分隔线
        file.write('=' * 50 + '\n')
        
    print(f"\033[1;31m出错信息\033[0m已写入到 [\033[1;34m{ERROR_LOG_PATH}\033[0m] 文件中, 请注意查看!")

Python第六章08：元组操作练习题苹果.Python.八宝粥 python 开发语言
#元组定义操作练习题"""定义一个元组，内容是：('周杰伦',11,['football','music'])，记录一个学生的信息（姓名、年龄、爱好）请通元组（tuple）的功能，对其进行如下操作：1.查询其年龄所在的下标位置2.查询学生的姓名3.删除学生爱好中的football4.增加爱好：coding"""my_tuple=('周杰伦',11,['football','music'])#1.查
Python第六章07：元组的定义和操作苹果.Python.八宝粥 python 前端开发语言
#tuple元组的定义和操作#tuple元组定义用小括号：(1,2,3,4,5),可以是不同类型元素#给变量定义元组时，写括号不写tuple：a=(1,2,3,4,5)#变量=（）变量=tuple（）空元组变量#tuple元组定义完成后，不可以修改，但是，如果元组中嵌套了一个列表时，元组中列表的内容可以修改#封装数据后，不希望被篡改数据，就使用元组tuple#1.定义一个元组t1=("halibo
利用Python爬虫获取Shopee（虾皮）商品详情：实战指南小爬虫程序猿 python 爬虫开发语言
在跨境电商领域，Shopee（虾皮）作为东南亚及台湾地区领先的电商平台，拥有海量的商品信息。无论是进行市场调研、数据分析，还是寻找热门商品，获取Shopee商品详情都是一项极具价值的任务。然而，手动浏览和整理这些信息显然是低效且容易出错的。幸运的是，通过编写Python爬虫程序，我们可以高效地完成这一任务。本文将详细介绍如何利用Python爬虫获取Shopee商品详情，并提供完整的代码示例。一、为
cifs挂载 mount ubuntu_在Linux上使用CIFS，如何挂载Windows共享王小约 cifs挂载 mount ubuntu
在Linux和UNIX操作系统上，可以使用mount命令的cifs选项将Windows共享安装在本地目录。常见的Internet文件系统(CIFS)是网络文件共享协议，CIFS是SMB的一种形式。在本教程中，解释如何在Windows共享上手动和自动挂载Linux系统。安装CIFS程序包要在Windows系统上挂载Linux共享，首先需要安装CIFS程序包。在Ubuntu和Debian上安装CIFS
Linux中挂载Windows Samba共享的指南执剑走天涯xp linux windows 运维
主要步骤：安装cifs-utils确保你的Linux系统已安装cifs-utils包。如果未安装，使用以下命令：sudoapt-getinstallcifs-utils#Debian/Ubuntu系统sudoyuminstallcifs-utils#CentOS/RHEL系统创建挂载点创建一个本地目录来挂载Windows共享：sudomkdir/mnt/share编辑/etc/fstab文件使用文
在Mac M1/M2芯片上完美安装DeepCTR库：避坑指南与实战验证 ku_code_ku 机器学习 macos 推荐算法推荐系统
让推荐算法在AppleSilicon上全速运行概述作为推荐系统领域的最经常用的明星库，DeepCTR集成了CTR预估、多任务学习等前沿模型实现。但在AppleSilicon架构的Mac设备上，安装过程常因ARM架构适配、依赖库版本冲突等问题受阻。本文通过20+次环境搭建实测，总结出最稳定的安装方案。关键版本说明（2024年验证）组件推荐版本注意事项Python3.10.x向下兼容至3.7，但3.1
数据库数值函数详解 web安全工具库数据库 oracle jvm
各类资料学习下载合集https://pan.quark.cn/s/8c91ccb5a474数值函数是数据库中用于处理数值数据的函数，可以用于执行各种数学运算、统计计算等。数值函数在数据分析及处理时非常重要，能够帮助我们进行数据的聚合、计算和转换。在本篇博客中，我们将详细介绍常用的数据库数值函数，并通过Python和SQLite进行示例，帮助您理解和应用这些函数。1.数值函数的基本概念数值函数是用于
Python中Requests的Cookies的简单使用北条苒茗殇 python 开发语言 Requests
概述Python的Requests库中有一个cookies，是用于管理HTTPCookie的工具，可以像字典一样操作Cookie，支持自动处理作用域（域名、路径）和持久化，cookies是一个RequestsCookieJar的类型。一、概念1.作用自动存储服务器返回的Cookie根据请求域名和路径进行自动发送匹配的Cookie支持手动添加、修改、删除Cookie2.RequestsCookieJ
Pytest基础使用北条苒茗殇 pytest
概述Pytest是Python里的一个强大的测试框架，灵活易用，可以进行功能，自动化测试使用，可以与Requests，Selenium等进行结合使用，同时可以生成Html的报告。一、Pytest的基本使用在未指定Pytest的配置文件时，会对以下文件进行执行：test_*.py，如：test_1.py*_test.py，如：1_test.py会对以下的类和函数进行执行：类：以Test_开头的类，如
Visual Studio Code官网下载地址及使用技巧（含常用的拓展插件推荐） ITCTCSDN vscode ide 编辑器
VisualStudioCode（简称“VSCode”）是Microsoft于2015年4月发布的可运行于MacOS、Windows和Linux之上的跨平台源代码编辑器，它具有对JavaScript，TypeScript和Node.js的内置支持，并具有丰富的其他语言（例如C++，C＃，Java，Python，PHP，Go）和运行时（例如.NET和Unity）扩展的生态系统。VisualStudi
利用AI与MySQL提升工业物联网健康监测的智慧水平——构建预测性维护的新纪元墨夶数据库学习资料1 人工智能 mysql 物联网
在工业4.0和智能制造的大背景下，如何确保生产设备的高效稳定运行成为企业竞争力的核心要素之一。传统的事后维修方式已经难以满足现代制造业的需求，而基于人工智能（AI）的预测性维护系统则为这一挑战提供了全新的解决方案。今天，我们将深入探讨如何结合AI技术和MySQL数据库，打造一个智能、高效的工业物联网（IIoT）健康监测平台，助力企业在激烈的市场竞争中脱颖而出。一、为什么选择AI+MySQL？1.A
python中rmdir和rmtree的用法 Gin387 python
shutil.rmtree()是Python中shutil模块提供的一个函数，用于递归删除整个目录树（包括子目录和所有文件）。os.rmdir()（只能删除空目录）不同，shutil.rmtree()可以强制删除非空目录importshutil#删除指定目录及其所有内容shutil.rmtree('path/to/directory')
构建 Python 插件架构：打造灵活可扩展的模块化应用全栈探索者chen python python 架构开发语言学习机器学习程序人生插件
构建Python插件架构：打造灵活可扩展的模块化应用前言在现代软件开发中，单一的代码库往往难以满足不断变化的业务需求和多样化的扩展场景。如何设计一个应用，使其既能保持核心功能的稳定，又能轻松集成第三方功能、模块或定制化扩展？答案就是——插件架构。通过插件架构，你可以让应用具备极高的灵活性，支持动态加载、无缝扩展以及解耦维护。本文将深入探讨如何在Python中设计和构建一个插件架构。从核心概念、模块
31天Python入门——第11天:挑战一口气把闭包·装饰器讲明白安然无虞 Python手把手教程 python 开发语言后端 pyqt
你好，我是安然无虞。文章目录1.闭包扩展知识:闭包的自由变量是如何存储的2.装饰器装饰器的应用场景3.补充练习1.闭包闭包是指在一个函数内部定义的函数，并且这个内部函数可以访问外部函数的变量、参数.换句话说，闭包是一个包含了函数及其相关引用环境的组合体.在Python中，当一个函数返回了内部函数的引用时，这个内部函数可以访问并操作外部函数的局部变量，它就创建了一个闭包,即使外部函数已经执行完毕，它
opencv python rgb转yuv_OpenCV之色彩空间与色彩空间转换 xiao fei opencv python rgb转yuv
python代码：importcv2ascvsrc=cv.imread("test.jpg")cv.namedWindow("rgb",cv.WINDOW_AUTOSIZE)cv.imshow("rgb",src)#RGBtoHSVhsv=cv.cvtColor(src,cv.COLOR_BGR2HSV)cv.imshow("hsv",hsv)#RGBtoYUVyuv=cv.cvtColor(sr
【AI大模型】搭建本地大模型GPT-NeoX：详细步骤及常见问题处理 qzw1210 gpt 人工智能深度学习
搭建本地大模型GPT-NeoX：详细步骤及常见问题处理GPT-NeoX是一个开源的大型语言模型框架，由EleutherAI开发，可用于训练和部署类似GPT-3的大型语言模型。本指南将详细介绍如何在本地环境中搭建GPT-NeoX，并解决过程中可能遇到的常见问题。1.系统要求1.1硬件要求1.2软件要求操作系统:Linux(推荐Ubuntu20.04或更高版本)CUDA:11.2或更高版本Python
Open3D 点云DBSCAN聚类算法 MelaCandy 算法聚类 numpy 计算机视觉图像处理 3d
目录一、DBSCAN基本原理二、代码实现2.1关键函数2.2完整代码三、实现效果3.1原始点云3.2聚类后点云Open3D点云算法汇总及实战案例汇总的目录地址：Open3D点云算法与点云深度学习案例汇总（长期更新）-CSDN博客一、DBSCAN基本原理DBSCAN（Density-BasedSpatialClusteringofApplicationswithNoise）是一种基于密度的聚类算法，
python 列表倒序输出小琳爱分享 python python
python列表倒序输出#使用reverseli1=[1,6,4,3,7,9]li2=['a','m','s','g']li1.reverse()li2.reverse()print(li1,li2)#利用list切片li1=[1,6,4,3,7,9]li2=['a','m','s','g']print(li1[::-1])print(li2[::-1])#利用算法进行转换，这里需要用到深层cop
Deepseek 个性化决策输出 meisongqing DeepSeek 个性化
Deepseek个性化决策输出：基于用户画像的定制化内容生成在教育场景中，通过构建动态用户画像与智能决策模型，教育数字人可基于学生水平实时调整讲解深度，实现精准化、个性化的学习支持。以下是核心实现框架与关键步骤：1.用户画像构建：多维度数据融合数据采集：显性数据：年龄、学科成绩、测试结果、学习时长、知识点掌握进度。隐性数据：交互行为（如答题犹豫时间、回放次数）、情绪识别（语音/表情分析）、认知负荷
python怎么输出倒序 hakesashou python基础知识 python java 服务器
python怎么输出倒序？下面给大家介绍四种方法：创建测试列表>>> lst = [1,2,3,4,5,6]方法1：>>> lst.reverse() #reverse()反转>>> lst[6, 5, 4, 3, 2, 1]方法2：>>> lst1 = [i for i in reversed(lst)] #reversed只适用于与序列(列表、元组、字符串)>>> lst1[6, 5, 4,
我与DeepSeek读《大型网站技术架构》- 总结诺亚凹凸曼架构
文章目录读后感一、总结二、反思三、创新四、展望当代大型网站架构一、架构分层模型二、关键组件与技术选型三、架构演进策略四、架构突破口读后感一、总结架构演化优先于设计大型网站架构不是预先设计的产物，而是通过反复迭代和试错演化形成的。技术选型的核心动机是对业务需求的深刻理解，而非盲目模仿。典型案例包括淘宝架构因业务爆发力被迫转型为分布式系统。开放与协作的价值互联网的开放生态通过API经济（如淘宝Open
chatgpt赋能python：Python怎么倒序列表 aijinglingchat ChatGpt python chatgpt 人工智能计算机
Python怎么倒序列表列表是Python中最常用的数据结构之一，但在实际使用时，有时需要将列表进行倒序排列。Python提供了多种方法来实现这个需求，本文将简要介绍这些方法以及它们的使用场景。方法1：使用reverse()函数使用列表的reverse()方法是Python中最简单直接的方法来倒序列表。该方法会将原列表倒置。lst=[1,2,3,4,5]lst.reverse()print(lst
“统计视角看世界”专栏阅读引导赛卡统计视角看世界信息可视化数据分析
根据文章主题和逻辑关系，我为您设计以下阅读引导方案：1.六西格玛基础2.帕累托图3.直方图4.散点图基础5.散点图高阶6.多变量可视化7.密度图进阶8.回归分析配套文字说明：入门基石（必读）《1.六西格玛遇上Python》→方法论总纲，建议优先精读基础三剑客（可并行）├─《2.帕累托图》→重点数据排序与决策├─《3.直方图》→数据分布核心工具└─《4.散点图》→数据探索第一视角高阶应用链（递进学习
自定义mavlink 生成wireshark wlua插件错误（已解决） JasonComing 问题收集 wireshark wlua mavlink
进入正题python3-mpymavlink.tools.mavgen--lang=WLua--wire-protocol=2.0--output=output/developmessage_definitions/v1.0/development.xml编译WLUA的时候遇到一些问题1.ERROR:SCHEMASV:SCHEMAV_CVC_ENUMERATION_VALID3765:0:ERRO
吐血整理 python最全习题100道（含答案）持续更新题目，建议收藏！ Bejpse 面试学习路线阿里巴巴 python 开发语言 pycharm redis java-ee
最近为了提升python水平，在网上找到了python习题，然后根据自己对于python的掌握，整理出来了答案，如果小伙伴们有更好的实现方式，可以下面留言大家一起讨论哦~已知一个字符串为“hello_world_yoyo”,如何得到一个队列[“hello”,”world”,”yoyo”]test=‘hello_world_yoyo’使用split函数，分割字符串，并且将数据转换成列表类型print
密码学，算法在人工智能的实战利用 china—hbaby 人工智能密码学
在人工智能（AI）的快速发展中，数据安全和隐私保护成为了核心议题。密码学，作为保护信息安全的基石，其在AI领域的应用显得尤为重要。本文将探讨密码学在AI中的利用，并提供一些代码示例来展示其实际应用。密码学的概述即常用加密方式密码学（Cryptography）是数学和计算机科学的一个分支，它涉及保护信息的安全性和隐私性。密码学的主要目标是确保信息在传输过程中不被未授权的第三方读取或篡改，以及确保信息
Node.js 如何发布一个 NPM 包——详细教程还是鼠鼠 node.js npm 前端 node.js vscode
在本文中，我将带大家一步步学习如何创建并发布一个NPM包，帮助开发者理解整个流程，并能顺利将自己的JavaScript库发布到NPM上供他人使用。1.安装Node.js和npm在开始之前，请确保你的电脑上已经安装了Node.js和npm（Node.js自带npm）。你可以在终端（Windows用户请使用cmd或PowerShell）输入以下命令检查是否已安装：node-vnpm-v如果出现版本号，
【人工智能时代】-人工智能发展史：1900~2023 xiaoli8748_软件开发人工智能时代人工智能搜索引擎
第一阶段：人工智能发展历史：1900-19591909年西班牙工程师LeonardoTorresyQuevedo发明了“Occultus”，这是一个可以自动执行国际象棋对弈的机器，预示了未来的计算智能。
每日面试题-假设有一个 1G 大的 HashMap，此时用户请求过来刚好触发它的扩容，会怎样？让你改造下 HashMap 的实现该怎样优化？晚夜微雨问海棠呀 java 开发语言
一、原理解析：HashMap扩容机制的核心问题当HashMap的size>capacity*loadFactor时触发扩容（默认负载因子0.75）。扩容流程如下：创建新数组：容量翻倍（newCap=oldCap{privateNode[]oldTable;privateNode[]newTable;privatevolatileintmigrationIndex=0;//迁移进度指针publicv
从 Windows 共享到 Linux：Jenkins 代码部署方案调整 XMYX-0 windows linux jenkins
文章目录从Windows共享到Linux：Jenkins代码部署方案调整方案1：使用NFS（推荐）介绍特点适用场景在192.168.1.100上配置NFS安装NFS服务器创建共享目录修改NFS共享配置启动NFS并应用配置在controller服务器上挂载NFS安装NFS客户端手动挂载开机自动挂载方案2：使用Rsync（RemoteSync）同步文件介绍特点适用场景在controller服务器上安装
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio

常用脚本-持续更新（文件重命名、视频抽帧、拆帧、删除冗余文件、yolo2xml、转换图片格式、修改xml）

1. 文件重命名

2. 视频抽帧

3. 根据文件A删除冗余的文件B

4. yolo2xml

5. 转换图片格式

6. 根据图片修改xml文件中的size尺寸信息

你可能感兴趣的:(Python,深度学习（Deep,Learning）,面试题（Interview,Questions）,windows,人工智能)