青右

将INRIA数据集改为PascalVOC格式

将INRIA数据集改为PascalVOC格式

INRIA数据集链接：https://pan.baidu.com/s/1Z2TVvGuuvor7juqj3uPG-g
提取码：07ed

我制作的PascalVOC格式的INRIA数据集链接：https://pan.baidu.com/s/1licLJkXICcwSdAwMb8B0OA
提取码：3rh2

目录

- 将INRIA数据集改为PascalVOC格式
- - PascalVOC格式介绍
  - INRIA数据集介绍
  - 分别创建对应文件夹
  - JPEGImages
  - - 将原图像处理为jpg格式保存在JPEGImages文件夹中
  - Annotations
  - - 将图片信息提取并保存到txt文件中
    - 将txt文本中的信息保存为xml文件
  - ImageSets
  - - trainval.txt
    - train.txt
    - val.txt

PascalVOC格式介绍

PascalVOC格式数据集由三个部分构成，JPEGImages，Annotations，ImageSets。
JPEGImages：存放的是训练与测试的所有图片。
Annotations：里面存放的是每张图片打完标签所对应的XML文件
ImageSets：里面有个Main文件夹，其中包含存储着图片名称的txt文件，分为训练与测试。

INRIA数据集介绍

此处参考行人检测数据集汇总

该数据库是目前使用最多的静态行人检测数据库，提供原始图片及相应的标注文件。训练集有正样本614张（包含2416个行人），负样本1218张；测试集有正样本288张（包含1126个行人），负样本453张。图片中人体大部分为站立姿势且高度大于100个象素，部分标注可能不正确。图片主要来源于GRAZ-01、个人照片及google，因此图片的清晰度较高。在XP操作系统下部分训练或者测试图片无法看清楚，但可用OpenCV正常读取和显示。

分别创建对应文件夹

JPEGImages

将原图像处理为jpg格式保存在JPEGImages文件夹中

(因为第一次制作数据集，为了省事，我直接把INRIA数据集中的70X134H96和96X160H96中的图片全部放到JPEGImages文件夹中了)

import os
from PIL import Image


image_path = "JPEGImages/"   # 修改为图片保存路径
image_list = os.listdir(image_path)   # 以列表保存图片名

for img in image_list:
    img = image_path + img   # 图片路径
    new_img = img[:-3] + "jpg"   # 新图片名
    im = Image.open(img)   # 打开图片
    im = im.convert("RGB")   # png为四通道RGBA，jpg为三通道RGB
    im.save(new_img)   # 保存
    if img[-3:] == "png":
        os.remove(img)   # 删除png图片

Annotations

这个地方有点问题，我直接对所有图片进行了批量处理，导致没有提取图片的特征，如果要进行特征提取，就需要一张张处理图片

（此处参考博客：Python 提取图像信息保存为TXT、xml格式）

将图片信息提取并保存到txt文件中

import os
import cv2


# 图像处理类  内置各种函数
class image_processing():

    def __init__(self):
        self.img_path = "./JPEGImages/"   # 修改为jpg图片保存的路径
        self.annotations_txt_path = "./"   # 修改为txt文件保存的路径
        self.annotations_xml_path = "./Annotations/"   # 修改为xml文件保存的路径
        if not os.path.exists(self.annotations_xml_path):
            os.makedirs(self.annotations_xml_path)

    # 图像批量重命名
    def rename(self):
        imagelist = os.listdir(self.img_path)
        total_num = len(imagelist)  # 得到图像数量大小

        i = 4500
        for item in imagelist:
            # print item
            if item.endswith('.jpg'):
                src = os.path.join(os.path.abspath(self.img_path), item)
                dst = os.path.join(os.path.abspath(self.img_path), '00' + format(str(i), '0>4s') + '.jpg')
                os.rename(src, dst)
                print('converting %s to %s ...' % (src, dst))
                i = i + 1
        print('total %d to rename & converted %d jpgs' % (total_num, i))

    # 提取图像的shape到txt文件里
    def get_image_information(self):
        image_list = os.listdir(self.img_path)
        print(len(image_list))

        file_txt = open('./sex_image_txt.txt', "w")

        for i in range(len(image_list)):
            img = cv2.imread(os.path.join(self.img_path + image_list[i]))
            image_shape = img.shape
            print(image_shape)
            file_txt.write(image_list[i] + ' ' + '3 ' + '5 ' + '5 ' + str(image_shape[0] - 5) + str(image_shape[1] - 5) + '\n')
        file_txt.close()


if __name__ == '__main__':
    newname = image_processing()
    # newname.rename()
    newname.get_image_information()

将txt文本中的信息保存为xml文件

from xml.dom.minidom import Document
import os
from PIL import Image

ann_path = "./sex_image_txt.txt"   # 修改为txt文件路径
img_path = "./JPEGImages/"   # 修改为jpg图片路径
xml_path = "./Annotations/"   # 修改为xml文件路径
database_name = "INRIAPerson Database"

# 标签的类别
label_list = ["person"]

if not os.path.exists(xml_path):
    os.mkdir(xml_path)


def writeXml(imgname, imgpath, w, h, label_list, wxml, database_name):
    doc = Document()
    # owner
    annotation = doc.createElement('annotation')
    doc.appendChild(annotation)
    # owner
    folder = doc.createElement('folder')
    annotation.appendChild(folder)
    folder_txt = doc.createTextNode(database_name)
    folder.appendChild(folder_txt)

    filename = doc.createElement('filename')
    annotation.appendChild(filename)
    filename_txt = doc.createTextNode(imgname)
    filename.appendChild(filename_txt)

    path = doc.createElement('path')
    annotation.appendChild(path)
    path_txt = doc.createTextNode(imgpath)
    path.appendChild(path_txt)
    # ones#
    source = doc.createElement('source')
    annotation.appendChild(source)

    database = doc.createElement('database')
    source.appendChild(database)
    database_txt = doc.createTextNode(database_name)
    database.appendChild(database_txt)
    # onee#
    # twos#
    size = doc.createElement('size')
    annotation.appendChild(size)

    width = doc.createElement('width')
    size.appendChild(width)
    width_txt = doc.createTextNode(str(w))
    width.appendChild(width_txt)

    height = doc.createElement('height')
    size.appendChild(height)
    height_txt = doc.createTextNode(str(h))
    height.appendChild(height_txt)

    depth = doc.createElement('depth')
    size.appendChild(depth)
    depth_txt = doc.createTextNode("3")
    depth.appendChild(depth_txt)
    # twoe#
    segmented = doc.createElement('segmented')
    annotation.appendChild(segmented)
    segmented_txt = doc.createTextNode("0")
    segmented.appendChild(segmented_txt)

    # object
    object = doc.createElement('object')
    annotation.appendChild(object)

    name = doc.createElement('name')
    object.appendChild(name)
    name_content = doc.createTextNode(label_list[0])
    name.appendChild(name_content)

    pose = doc.createElement('pose')
    object.appendChild(pose)
    pose_content = doc.createTextNode("0")
    pose.appendChild(pose_content)

    truncated = doc.createElement('truncated')
    object.appendChild(truncated)
    truncated_content = doc.createTextNode("0")
    truncated.appendChild(truncated_content)

    difficult = doc.createElement('difficult')
    object.appendChild(difficult)
    difficult_content = doc.createTextNode("0")
    difficult.appendChild(difficult_content)

    bndbox = doc.createElement('bndbox')
    object.appendChild(bndbox)

    xmin = doc.createElement('xmin')
    bndbox.appendChild(xmin)
    xmin_content = doc.createTextNode(str(5))
    xmin.appendChild(xmin_content)

    ymin = doc.createElement('ymin')
    bndbox.appendChild(ymin)
    ymin_content = doc.createTextNode(str(5))
    ymin.appendChild(ymin_content)

    xmax = doc.createElement('xmax')
    bndbox.appendChild(xmax)
    xmax_content = doc.createTextNode(str(w - 5))
    xmax.appendChild(xmax_content)

    ymax = doc.createElement('ymax')
    bndbox.appendChild(ymax)
    ymax_content = doc.createTextNode(str(h - 5))
    ymax.appendChild(ymax_content)

    # threee#
    with open(wxml, "wb") as f:
        f.write(doc.toprettyxml(indent='\t', encoding='utf-8'))
        # f.write(doc.toprettyxml())
    f.close()
    return


f = open(ann_path, 'r')
txt_list = f.readlines()
f.close()
im_name_list = []

for line in txt_list:
    line = line.strip()
    line_split = line.split(' ')
    # print  line

    img_name = line_split[0]
    im_name_list.append(img_name)

    fileimgpath = os.path.join(img_path, img_name)
    im = Image.open(fileimgpath)
    width = int(im.size[0])
    height = int(im.size[1])
    # print width,height
    # print label_list
    savename = os.path.join(xml_path, img_name.split('.')[0] + '.xml')
    writeXml(img_name, fileimgpath, width, height, label_list, savename, database_name)

ImageSets

这个文件夹里可以添加其他文件，但只用Main文件就足够运行
Main文件夹下要有三个txt文件，分别是train.txt，val.txt，trainval.txt
train.txt - 训练集图片文件名
val.txt - 测试集图片文件名
trainval.txt - 完整数据集图片文件名

此处我把数据集划分的比例为训练集：测试集=2：1

trainval.txt

import os


image_path = "JPEGImages/"   # 图片路径
filename = "trainval.txt"

image_list = os.listdir(image_path)
with open(filename, "w") as f:
    for im in image_list:
        s = im[:-4] + " " + "\n"
        f.write(s)

train.txt

import os


image_path = "JPEGImages/"   # 图片路径
filename = "train.txt"

image_list = os.listdir(image_path)

i = 0
with open(filename, "w") as f:
    for im in image_list:
        if i == 2:
            i = 0
            continue
        i += 1
        s = im[:-4] + " " + "\n"
        f.write(s)

val.txt

import os


image_path = "JPEGImages/"   # 图片路径
filename = "val.txt"

image_list = os.listdir(image_path)

i = 0
with open(filename, "w") as f:
    for im in image_list:
        i += 1
        if i != 3:
            continue
        if i == 3:
            s = im[:-4] + " " + "\n"
            f.write(s)
            i = 0

你可能感兴趣的:(python,计算机视觉,深度学习)

破译AI黑箱：如何用20行Python理解ChatGPT？ Ven% 简单入门pytorch 人工智能 python chatgpt
文章目录一、核心概念：大模型本质二、代码逐行解析（以线性回归为例）三、关键概念详解四、与大模型的本质联系五、大模型训练核心思想六、如何扩展成真实大模型七、总结：AI训练的本质一、核心概念：大模型本质大模型=复杂数学函数+数据驱动训练现实任务（如图像识别、语言翻译）过于复杂，人类无法直接编写数学函数解决。解决方案：构建参数化的数学模型（如神经网络）用大量数据训练，自动寻找最优参数得到能解决特定任务的
python for android api,python-for-android
python-for-androidpython-for-androidisapackagingtoolforPythonappsonAndroid.YoucancreateyourownPythondistributionincludingthemodulesanddependenciesyouwant,andbundleitinanAPKalongwithyourowncode.Feature
Python国内镜像地址及配置使用方式源图客工具应用 Python python 开发语言
便捷设置pip全局镜像源pipconfigsetglobal.index-urlhttps://pypi.tuna.tsinghua.edu.cn/simple一、国内镜像地址清华源：https://pypi.tuna.tsinghua.edu.cn/simple/阿里云：http://mirrors.aliyun.com/pypi/simple/清华大学：https://pypi.tuna.ts
python学习之路 - python的文件操作
目录一、python文件操作1、文件的编码a、概念b、编码分类2、文件的读取a、打开文件a、读取文件字节c、读取文件行d、for循环的读取3、文件的关闭4、文件的写入5、文件的追加6、文件操作综合a、案例一：读取字符个数b、案例二：复制文件一、python文件操作1、文件的编码a、概念计算机只能识别0和1，所以需要用编码技术将内容翻译成0和1b、编码分类UTF-8除非有特殊要求，否则一般都用此编码
【华为OD机试真题 2025B卷】770、周末爬山 | 机试真题+思路参考+代码解析（C++、Java、Py、C语言、JS） KJ.JK OJ+最新华为OD机试 (C++Java Py C JS)华为od c++java 华为OD机试真题 2025B卷 javascript 周末爬山
文章目录一、题目题目描述输入输出样例1样例2二、代码与思路参考C++语言思路C++代码Java语言思路Java代码Python语言思路Python代码C语言思路C代码JS语言思路JS代码作者：KJ.JK订阅本专栏后即可解锁在线OJ刷题权限专栏介绍：最新的华为OD机试题目总结，使用C++、Java、Python、C语言、JS五种语言进行解答，每个题目的思路分析都非常详细，支持在线OJ评测刷题！！！！
orb-slam run rgbd data hetongqiyue 计算机视觉 slam
TUM数据集准备+RGB-D运行从这个网址下载tum数据集[http://vision.in.tum.de/data/datasets/rgbd-dataset/download]并且解压缩。使用python脚本关联RGB图像和深度图像[associate.py],[http://vision.in.tum.de/data/datasets/rgbd-dataset/tools].我们已经提供了一
Blender glTF 2.0 导入导出插件技术文档花锨潜Praised
BlenderglTF2.0导入导出插件技术文档glTF-Blender-IOBlenderglTF2.0importerandexporter项目地址:https://gitcode.com/gh_mirrors/gl/glTF-Blender-IO1.安装指南1.1系统要求Blender2.8及以上版本Python3.x1.2安装步骤Blender内置插件：Blender2.8及以上版本已经内
Python 开发安卓Android及IOS应用库Kivy安装尝试 dingcb168 WIFI 开关 KIVY
yeayee------>更多技巧------>更多源码------>www.yeayee.com转载：https://www.cnblogs.com/yeayee/p/5420858.htmlPython开发安卓Android及IOS应用库Kivy安装尝试Python开发安卓Android及IOS应用库Kivy安装尝试：先来看看这货可以用来制作什么应用：CreateapackageforWind
Python数据解析与图片下载工具：从JSON到本地文件的自动化流程龙潜月七 python json 自动化
Python数据解析与图片下载工具：从JSON到本地文件的自动化流程在日常开发和数据处理中，我们经常需要从JSON数据中提取信息，并根据其中的URL下载相关资源。本文将介绍一个实用的Python工具，它可以解析JSON数据，提取关键信息，并批量下载图片资源，适用于数据采集、内容管理和自动化测试等场景。一、工具功能概述这个多功能工具包含三个核心模块：JSON数据解析：从输入的JSON字符串中提取指定
Python时间管理工具：实现定时任务的时间点循环更新龙潜月七 python java 服务器
Python时间管理工具：实现定时任务的时间点循环更新在自动化任务、定时推送等场景中，我们常常需要按照预设的时间点循环执行操作。本文将介绍一个实用的Python工具，它可以根据预设的时间点列表自动计算下一个执行时间，并将其保存到文件中，适用于定时任务调度、内容发布等场景。一、工具功能与应用场景这个时间管理工具的核心功能是：维护一个预设时间点列表（如每天6:00、12:00、18:00、22:00）
Termux备份与恢复龙潜月七 python
转载自：https://bbs.zsxwz.com/thread-3473.htm好不容易才安装了各种软件，环境等等，因此做一个备份有时候还是必要的，以免一时手贱。备份方法很多，比如dd，rsync，restic，比较简单的就是使用tar打包。（主要是因为学生党，没流量每次下载400m的python了）爬虫在手，天下我有。https://wiki.termux.com/wiki/Backing_u
Python Selenium搭建UI自动化测试框架测试界霄霄软件测试 python selenium ui 功能测试软件测试自动化测试程序人生
自动化测试是软件测试中非常重要的一部分，可以提高测试效率和测试覆盖率。在UI自动化测试中，Selenium是非常流行的工具。本文将介绍如何使用Python和Selenium搭建UI自动化测试框架。一、环境准备在开始搭建UI自动化测试框架之前，需要先安装Python和Selenium。可以从Python官网下载Python安装包，并使用pip命令安装Selenium。二、框架目录结构在搭建UI自动化
python-文件操作 qq_512720272 python python 开发语言
1文件操作1.1文件打开与关闭1.1.1打开文件-open#打开文件（默认为只读模式）file_path='example.txt'withopen(file_path,'r')asfile:#执行文件操作，例如读取文件内容file_content=file.read()print(file_content)#文件在with块结束后会自动关闭，无需显式关闭文件在上述示例中：'example.txt
【PyTorch】PyTorch中张量(Tensor)微分操作咸鱼鲸 PyTorch pytorch 人工智能 python
PyTorch深度学习总结第六章PyTorch中张量(Tensor)微分操作文章目录PyTorch深度学习总结前言一、torch.autograd模块二、主要功能和使用方法1.张量的requires_grad属性2.backward()方法3.torch.no_grad()上下文管理器三、函数总结前言上文介绍了PyTorch中张量(Tensor)的计算操作，本文将介绍张量的微分(torch.aut
拿来就能用的python 课程 1
拿来就能用的python课程引言python是很多人入门计算机语言的首选。但是繁文缛节，很多人从怎么装python开始学起，然后python计算，然后什么是函数，然后什么是类，然后就因为太难放弃了。（说的是不是你？）没错，今天我会跳着讲。如何利用python读写文件。突然想起来jojo奇妙冒险里的岸边露伴的替身天堂之门。天堂之门的能力就是能把对手变成一本书，可以供岸边读取，并且可以在上面修改内容。
Python自动化办公:读取Excel数据并批量生成合同，高效办公，快速回家蚂蚁爱Python Python 基础知识 Python实战项目 python 自动化开发语言
前言在我们的工作中，面临着大量的重复性工作，通过人工方式处理往往耗时耗力易出错。而Python在自动化办公方面具有极大的优势，可以解决我们工作中遇到的很多重复性问题，分分钟搞定办公需求。快速下班回家陪老婆…一、背景在我们经济交往中，有时会涉及到销售合同的批量制作。比如我们需要根据如下合同数据（Excel），进行批量生成销售合同（Word）。二、准备我们首先要准备好一份合同模板（Word），将需要替
Python-Docx库 | Word与Python的完美结合
今天给大家分享Python处理Word的第三方库：Python-Docx。什么是Python-Docx？Python-Docx是用于创建和更新MicrosoftWord（.docx）文件的Python库。日常需要经常处理Word文档，用Python的免费第三方包：Python-Docx处理docx十分方便。而且这个包和pandas包结合使用，可以在word插入excel表格，节省了很多复制、粘贴、
【python】批量读取Word文档中的特定表格并保存为Excel文件七十二旹 python python word excel
批量读取Word文档中的特定表格并保存为Excel文件在工作中，我们常常需要从多个Word文档中提取数据，然后将这些数据汇总到一个Excel文件中进行分析。下面，我将分享一个Python脚本，它可以从多个Word文档中读取特定的表格数据，并将这些数据保存到一个Excel文件中。代码实现我们首先导入所需的库：importosimportreimportpandasaspdfromdocximport
Python3-word文档操作（四）：利用python给word文档加入表格 liranke Python学习笔记 python python docx python表格 python创建文档 python创建表格
1简介：本篇继续python操作word之旅：利用python给word文档加入表格。上几篇中，学习了是用python进行简单的word文档的创建，word文档的内容获取，以及内容修改，具体参考如下链接：传送门：Python3-word文档操作（一）：利用python创建word文档，并且设置标题和正文的内容，设置字体样式Python3-word文档操作（二）：利用python获取word文档的内
AI办公自动化：用kimi批量将word文档部分文件名保存到Excel中 AIGCTribe 人工智能 word excel
文件夹中有很多个word文档，现在只要英文部分的文件名，保存到一个Excel文件中。可以在kimi中输入提示词：你是一个Python编程专家，要完成一个编写Python脚本的任务，具体步骤如下：打开文件夹：F:\AI自媒体内容\AI视频教程下载\新建文件夹读取文件夹里面所有docx文档的文件名；去掉文件名中的“AI视频教程下载：”，剩下的文件名保存到Excel文件“新建XLSX工作表.xlsx”的
华为 OD 机考 Python 【数组连续和】 codereasy 华为 python 算法华为机试华为机考
题目给定一个含有N个正整数的数组,求出有多少个连续区间（包括单个正整数）,它们的和大于等于x。输入描述第一行两个整数Nx（0
pythonflow_MLflow系列1：MLflow入门教程（Python） weixin_39872334 pythonflow
这篇教程展示了如何：训练一个线性回归模型将训练代码打包成一个可复用可复现的模型格式将模型部署成一个简单的HTTP服务用于进行预测这篇教程使用的数据来自UCI的红酒质量数据集，主要用于根据红酒的PH值，酸度，残糖量等指标来评估红酒的质量。我们会用到什么？安装MLflow和scikit-learn，推荐两种安装方式：安装MLflow及其依赖：pipinstallmlflow[extras]分别安装ML
Python 爬虫学习过程中最容易踩的 10 个坑，你中招了吗？程序员威哥 python 开发语言科技
写给每一个在爬虫路上被“反爬”、被“封IP”、被“乱码”支配过的你。Python爬虫作为数据获取与自动化最常见的工具之一，看似简单，但很多初学者（甚至有经验的开发者）在实际开发中都容易陷入一些坑。本文将结合真实项目经验，总结10个最常见的坑，并给出对应的解决方案，助你少走弯路、爬得更稳。✅适合人群正在学习Python爬虫的新手想要了解常见问题和最佳实践的开发者爬虫踩坑无数但依然热爱爬虫的老玩家坑1
全网首创Python泛娱乐新闻图片文字自动剪辑第1版 Mr数据杨 Python 视频剪辑人工智能娱乐音视频 movipy 图文转视频
在自媒体平台中，娱乐新闻解说视频通过自动化技术生成正逐渐成为主流。这种方式不仅大大提升了内容的生产效率，还为创作者提供了快速生成大量视频的能力。基于Python和百度AI技术的架构，本项目旨在开发一套优化的自动化视频生成脚本，通过智能化手段在较短的时间内实现高质量视频的批量生产。该项目不仅在技术上进行了优化，还显著提升了视频内容的流畅度与可观看性，使其更具吸引力。文章目录项目介绍工作流程素材准备加
2025B卷华为OD机试（Python/JS/C/C++）真题【B卷+A卷+C卷+D卷+E卷】目录哪吒搬砖工逆袭Java架构师华为od 算法 python 2025B卷华为OD机试
专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华为OD往常的操作，B卷题目是由往
2025B卷 - 华为OD机试七日集训第5期 - 按算法分类，由易到难，循序渐进，玩转OD（Python/JS/C/C++）
目录推荐刷题方法：一、适合人群二、本期训练时间三、如何参加四、七日集训第5期五、精心挑选21道高频100分经典题目，作为入门。第1天、逻辑分析第2天、逻辑分析第3天、逻辑分析第4天、字符串处理第5天、深度优先搜索dfs第6天、广度优先搜索bfs第7天、动态规划六、集训总结国内直接使用ChatGPT4o、o3、o4-mini-high、GPT-4.5、GPT4.1、Gemini2.5pro0605、
【2025B卷】华为OD机试最新题库，按算法分类，高效刷题（持续更新）（Python/JS/C/C++）哪吒搬砖工逆袭Java架构师华为od 算法 python 2025B卷华为OD机试
专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华为OD往常的操作，B卷题目是由往
AI产品经理技术篇：AI领域常用术语解析让我看看好学吗人工智能产品经理机器学习深度学习学习
作为AI产品经理，深入理解人工智能领域的核心术语是高效沟通、需求定义和产品落地的关键。无论是与算法工程师协作优化模型，还是向业务方解释技术方案，准确掌握专业术语能显著提升决策效率，避免因概念混淆导致的开发偏差。本文系统梳理了模型与算法、NLP（自然语言处理）、CV（计算机视觉）、数据处理、核心评估指标等领域的核心术语，帮助产品经理快速构建AI技术认知框架。目录1.基础概念2.模型与算法3.自然语言
2025B卷最新华为OD机考指南宝典（Python/JS/C/C++）哪吒搬砖工逆袭Java架构师华为OD机试 python 2025B卷算法华为od
专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华为OD往常的操作，B卷题目是由往
【持续更新】2025华为OD机试2025A卷机考真题库清单含考点说明（已更新600+题）（Python/JS/C/C++）哪吒搬砖工逆袭Java架构师华为od python javascript 2025A卷华为OD机试
专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。2025年3月16日，华为OD机试已经将华为OD机试（E卷）切换为2025A卷。目前正在考的是2025A卷，按照华为OD往常的
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他