我不是小哥哥

yolov2 - tiny模型训练识别

兴趣尝试，训练一下自己的数据集做图像识别人脸口罩。

darknet网络下载

下载地址：https://pjreddie.com/darknet/yolov2/
直接按照步骤，里面有不同yolo版本的基本配置文件，区别是使用什么样的预训练模型就用什么样的weight文件，下载好后直接放在darknet目录下。

尝试运行:

cd darknet

./darknet detector test cfg/voc.data cfg/yolov2-tiny-voc.cfg yolov2-tiny-voc.weights data/dog.jpg

测试结果：

bicycle居然没识别出来。确实精度差点。

数据集处理

一、转换数据集格式

我是直接从网上下载的数据集，但jpg和xml是一一对应放在同一个文件夹下，而一般训练大多是按照VOC格式存储，所以要先转换数据集格式。

VOC数据集格式如下：

VOCdevkit
——VOC2020        #文件夹的年份可以自己取
————Annotations  #放入所有的xml文件
————ImageSets    
——————Main       #放入train.txt,val.txt,test.txt,trainval.txt文件（不一定全要建）
————JPEGImages   #放入所有的图片文件
 
Main中的文件分别表示test.txt是测试集，train.txt是训练集，val.txt是验证集，trainval.txt是训练和验证集

二、数据增强：

数据增强

参考链接
博主用的os.walk()，获取路径，但是读取的文件路径是乱序（害苦我了），之后稍微改了一下。
在网上搜索发现，获取文件路径有两种方法：

os.listdir(path)只能获取当前目录下的所有文件或者文件夹的名称，而不能获取文件夹的绝对路径
os.walk(path) 返回包含(root,dirs,files)三种信息的生成器。
os.walk(path)获得的并不是路径，所以需要将获得的三种信息进行链接才能得到路径
root 所指的是当前正在遍历的这个文件夹的本身的地址
dirs 是一个 list ，内容是该文件夹中所有的目录的名字(不包括子目录)
files 同样是 list , 内容是该文件夹中所有的文件(不包括子目录)

这里采用的是os.listdir（），再sort（），将文件排序后再依次读取并且重命名为000123.xml/.jpg格式的文件。

#author:gr
# -*- coding:utf-8 -*-

import os
import shutil

path = '/Users/apple/train'   #数据集文件夹路径，下面包含每个类，改成你自己的
new_img_path = '/Users/apple/VOCdevkit/VOC2020/JPEGImages/'   #新的图片路径，改成你自己的
new_ann_path = '/Users/apple/VOCdevkit/VOC2020/Annotations/'    #新的xml路径，搞成你自己的
count_img = 1   #每提取一张图片，count+1，也能够按顺序给图片重命名
count_ann = 1   #每提取一个xml，count+1也能够按顺序给文件重命名
path_list = os.listdir(path) #获取文件名+后缀
path_list.sort()#我对数据集没有顺序要求，只需jpg和xml一一对应，所以最简单的排序
#print(path_list)
root = path
for files in path_list:
    '''循环path文件下每个每个文件夹，每个图片，按照以.jpg结尾和.xml结尾区分'''
    #print(files)
    if files[-3:] == 'jpg':
        file_path = root + '/' + files
        shutil.copy(file_path, os.path.join(new_img_path, str(count_img).zfill(6)+'.jpg'))
        count_img = count_img + 1
    elif files[-3:] == 'xml':
        file_path = root + '/' + files
        shutil.copy(file_path, os.path.join(new_ann_path, str(count_ann).zfill(6)+'.xml'))
        count_ann = count_ann + 1
print(count_img)
print(count_ann)

二、接着生成tain.txt

再将生成之后的文件VOCdevkit放到/darknet/scripts/目录下

#author:gr
# -*- coding:utf-8 -*-

# 生成main.txt
import os
def main(src, dest):
    count = 0
    out_file = open(dest,'w')  #生成了在指定目录下的txt文件
    path_list = os.listdir(src)
    path_list.sort()
    with open(dest, 'w') as f:
        for name in path_list:
            base_name = os.path.basename(name)
            file_name = base_name.split('.')[0]
            f.write('%s\n' % file_name)
            count = count + 1
    print(count)

if __name__ == '__main__':
    TrainDir = '/Users/apple/VOCdevkit/VOC2020/JPEGImages/'  #图片文件所在目录
    target = '/Users/apple/VOCdevkit/VOC2020/ImageSets/Main/train.txt'
    main(TrainDir, target)

三、修改voc_label.py.直接在vocdevkit文件里自动创建label文件夹包含每张照片对应的txt文件。
按照如下格式：

<object-class> <x> <y> <width> <height>

分别代表物体类别，
中心归一化横坐标（x）
中心归一化纵坐标（y）
归一化宽度（w）
归一化高度（h）

计算公式参考：
dw = 1 / width
dh = 1/ height
x = ( xmin + xmax ) / 2 * dw
y = ( ymin + yman ) / 2 * dh
w = ( xmax - xmin ) / 2 * dw
h = ( ymax - ymin ) / 2 * dh

实现代码：

import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join

#sets=[('2012', 'train'), ('2012', 'val'), ('2007', 'train'), ('2007', 'val'), ('2007', 'test')]

#classes = ["aeroplane", "bicycle", "bird", "boat", "bottle", "bus", "car", "cat", "chair", "cow", "diningtable", "dog", "horse", "motorbike", "person", "pottedplant", "sheep", "sofa", "train", "tvmonitor"]

sets = [('2020','train')]	#训练的集合

classes = ["face_mask","face"] #标注的类别


def convert(size, box):
    dw = 1./(size[0])
    dh = 1./(size[1])
    x = (box[0] + box[1])/2.0 - 1
    y = (box[2] + box[3])/2.0 - 1
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x*dw
    w = w*dw
    y = y*dh
    h = h*dh
    return (x,y,w,h)

def convert_annotation(year, image_id):
    in_file = open('VOCdevkit/VOC%s/Annotations/%s.xml'%(year, image_id))
    out_file = open('VOCdevkit/VOC%s/labels/%s.txt'%(year, image_id), 'w')
    tree=ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)

    for obj in root.iter('object'):
        difficult = obj.find('difficult').text
        cls = obj.find('name').text
        if cls not in classes or int(difficult)==1:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text))
        bb = convert((w,h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')

wd = getcwd()

for year, image_set in sets:
    if not os.path.exists('VOCdevkit/VOC%s/labels/'%(year)):
        os.makedirs('VOCdevkit/VOC%s/labels/'%(year))
    image_ids = open('VOCdevkit/VOC%s/ImageSets/Main/%s.txt'%(year, image_set)).read().strip().split()
    list_file = open('%s_%s.txt'%(year, image_set), 'w')
    for image_id in image_ids:
        list_file.write('%s/VOCdevkit/VOC%s/JPEGImages/%s.jpg\n'%(wd, year, image_id))
        convert_annotation(year, image_id)
    list_file.close()

#os.system("cat 2007_train.txt 2007_val.txt 2012_train.txt 2012_val.txt > train.txt")
#os.system("cat 2007_train.txt 2007_val.txt 2007_test.txt 2012_train.txt 2012_val.txt > train.all.txt")
os.system("cat 2020_train.txt 2020_val.txt  > train.txt")

最后生成了label文件夹包含所有的图片对应的txt文件，生成2020_train.txt，2020_val.txt之类的文本文件列出了该年份的图像文件和图像集。 train.txt需要一个文本文件，其中包含要训练的所有图像。

不过我的数据集有一点不规范没有< size >标签，弄了好久。不过一般按照正常情况标注的应该不会发生，如果有出入相应修改代码就行了。这里就不详述啦

修改相应配置文件

四、修改cfg文件和names文件

在cfg文件夹下找到voc.data文件

  1 classes= 2	#classes训练类别数
  2 train  = <path-to-voc>/train.txt #训练集
  3 valid  = <path-to-voc>2020_test.txt#测试集
  4 names = data/voc.names
  5 backup = backup

< path-to-voc>就是你放数据集的位置

修改data文件夹下voc.name文件，换成你训练的类别：

mask
face

五、下载预训练模型

wget https://pjreddie.com/media/files/darknet19_448.conv.23

六、修改cfg/yolo-tiny-voc.cfg

1.修改了batch和subdivison

[net]
# Testing
#batch=1
#subdivisions=1
# Training
batch=64
subdivisions=8
width=416
height=416
channels=3
momentum=0.9
decay=0.0005
angle=0
saturation = 1.5
exposure = 1.5
hue=.1

2.修改最后一层的卷积核和类别

filter =5*(5+2)

[convolutional]
size=1
stride=1
pad=1
filters=35//
activation=linear
[region]
anchors = 1.08,1.19,  3.42,4.41,  6.63,11.38,  9.42,5.11,  16.62,10.52
bias_match=1
classes=2//
coords=4
num=5
softmax=1
jitter=.2
rescore=1

object_scale=5
noobject_scale=1
class_scale=1
coord_scale=1

absolute=1
thresh = .6
random=1

五、Makefile文件

GPU=1
CUDNN=1
OPENCV=1
OPENMP=0
DEBUG=0

cd darkent

make

数据集终于弄好了，下一步准备上服务器了，嘿嘿嘿。

训练

cd darknet目录下执行

./darknet detector train cfg/voc.data cfg/yolov2-tiny-voc.cfg darknet19_448.conv.23

测试

cd darknet

./darknet detector test cfg/voc.data cfg/yolov2-tiny-voc.cfg backup/yolov2-tiny-voc_final.weights

输入图片名进行测试

Enter Image Path: data/1.jpg
data/1.jpg: Predicted in 1.202904 seconds.
face: 56%
mask: 91%

（一般放在darknet/data下）

./darknet detector test cfg/voc.data cfg/yolov2-tiny-voc.cfg backup/yolov2-tiny-voc_final.weights data/1.jpg

点开prediction.jpg，效果还行，就不放出来了。

计算map值

由于yolov2版本比较低，无法直接计算出map，所以先生成检测结果文件（以下保存在mask.txt中）

./darknet detector valid cfg/voc.data cfg/yolov2-tiny-voc.cfg backup/yolov2-tiny-voc_final.weights -out mask.txt -gpu 0 -thresh .5

其他

训练暂停：ctrl+z
恢复训练：fg
训练终止：ctrl+c

训练中遇到的一些问题

一、Couldn’t open file

Couldn't open file: /darknet/scripts/2020_train.txt

solution：

修改cfg/voc.data,要用绝对路径不要用相对路径

train = /home/你的用户名/darknet/scripts/2020_train.txt
valid = /home/你的用户名/darknet/scripts/2020_val.txt

二、Cannot load image

Cannot load image "/darknet/scripts/VOCdevkit/VOC2020/JPEGImages/002846.jpg" 
STB Reason: can't fopen

solution:

重要的事情说三遍
绝对路径！绝对路径！绝对路径！

ps:这个如果用之前的文件生成的文件的确是绝对路径，由于我个人原因修改了一下路径，变成了相对路径，所以我的问题不一定都会遇到。

其他学习

服务器上传，下载文件参考：
https://blog.csdn.net/resilient/article/details/85334594

上传文件：scp -P(大写) 端口号。。。。。

你可能感兴趣的:(那些事,图像识别)

python三角网格代码_Python 实现 Delaunay Triangulation weixin_39828457 python三角网格代码
DelaunayTriangulation是一种空间划分的方法，它能使得分割形成的三角形最小的角尽可能的大，关于DelaunayTriangulation的详细介绍，请参考这里，DelaunayTriangulation在很多领域都有应用，科学计算领域它是有限元和有限体积法划分网格的重要方法，除此之外在图像识别、视觉艺术等领域也有它的身影。贴一段有趣的油管视频，用DelaunayTriangula
Orangepi Zero2 全志H616开发学习会学嵌入式 ARM Linux全志平台开发学习 linux 开发语言服务器
一.简介1.1为什么学学习目标依然是Linux系统，平台是ARM架构·蜂巢快递柜，配送机器人，这些应用场景用C51,STM32单片机无法实现·第三方介入库的局限性，比如刷脸支付和公交车收费设备需要集成支付宝SDK，提供的libalipay.so是Linux的库，设备必须跑Linux系统·图像识别，音频，视频等领域的技术支撑也无法脱离Linux系统·人工智能型设备通常需要更好的系统和更高的算力，所以
贝叶斯网络与深度学习的结合：图像识别和分类 AI天才研究院 AI人工智能与大数据计算 AI大模型企业级应用开发实战自然语言处理人工智能语言模型编程实践开发语言架构设计
本文我将为您撰写一篇关于"贝叶斯网络与深度学习的结合：图像识别和分类"的技术博客文章。这篇文章将深入探讨贝叶斯网络和深度学习在图像识别和分类领域的结合应用。我会遵循您提供的要求和结构模板,确保文章内容全面、深入且易于理解。让我们开始吧。贝叶斯网络与深度学习的结合：图像识别和分类关键词：贝叶斯网络、深度学习、图像识别、图像分类、概率推理、卷积神经网络、不确定性建模文章目录贝叶斯网络与深度学习的结合：
onnx模型部署 python_深度学习模型转换与部署那些事(含ONNX格式详细分析) weixin_39759270 onnx模型部署 python
背景深度学习模型在训练完成之后，部署并应用在生产环境的这一步至关重要，毕竟训练出来的模型不能只接受一些公开数据集和榜单的检验，还需要在真正的业务场景下创造价值，不能只是为了PR而躺在实验机器上在现有条件下，一般涉及到模型的部署就要涉及到模型的转换，而转换的过程也是随着对应平台的不同而不同，一般工程师接触到的平台分为GPU云平台、手机和其他嵌入式设备对于GPU云平台来说，在上面部署本应该是最轻松的事
Python中Tesseract OCR的中文识别包实操指南
本文还有配套的精品资源，点击获取简介：TesseractOCR是一个开源的光学字符识别引擎，支持多语言包括中文识别。介绍如何在Python中使用pytesseract库进行图像文字识别，并详细说明安装TesseractOCR以及其中文语言包的步骤。提供了一个Python示例代码来展示图像识别的流程，并解释如何通过预处理提高识别准确率。此外，概述了TesseractOCR的高级功能和训练自定义模型的
FastGPT与MCP：解锁AI新时代的技术密码挑战者666888 AI模型应用实战迁移学习集成学习文心一言
一、AI浪潮中的新星：FastGPT与MCP登场在当今科技飞速发展的时代，人工智能（AI）已成为推动各行业变革的核心力量。从智能语音助手到复杂的图像识别系统，AI的应用无处不在，而其中的关键技术——语言模型和集成平台，更是备受关注。FastGPT和MCP（Multi-ComponentPlatform）作为这一领域的新兴代表，正逐渐崭露头角，为AI的发展注入新的活力。FastGPT，以其高效的推理
TensorFlow：开启智能时代的引擎科技林总 DeepSeek学AI 人工智能
想象一下，计算机能看懂病历、汽车能自动驾驶、机器能创作艺术——这一切的核心，正是深度学习的力量。而推动这场革命的引擎之一，就是今天的主角：**TensorFlow**。---###**一、背景：为什么需要TensorFlow？1.**深度学习的爆发**-传统编程无法解决图像识别、自然语言处理等复杂问题。-神经网络需要高效工具处理海量数据和计算。2.**Google的答案**-2015年开源Tens
卷积神经网络亿只小灿灿 Python 算法与数据结构人工智能 cnn 人工智能神经网络
一、引言在当今人工智能的浪潮中，卷积神经网络（ConvolutionalNeuralNetwork，CNN）无疑是一颗璀璨的明星。它在图像识别、语音处理、自然语言处理等众多领域取得了巨大的成功，极大地推动了人工智能技术的发展。那么，什么是卷积神经网络？它的算法原理是什么？本文将深入探讨这些问题，并通过Python代码实现一个简单的卷积神经网络，以帮助读者更好地理解和掌握这一强大的技术。二、卷积神经
Docker 从入门到精通：运维工程师的容器化生存指南大模型大数据攻城狮运维 docker 容器 k8s 运维面试 dockerfile 虚拟化
目录第1章：Docker是什么？为什么它能改变运维的游戏规则？第2章：Docker安装与环境准备第3章：Docker常用命令入门第4章：Dockerfile的初探第5章：Docker网络的那些事儿第6章：数据持久化：让容器数据不“失忆”第7章：DockerCompose：多容器的“交响乐指挥家”第8章：进阶命令与运维技巧第9章：Docker与CI/CD：让部署快如闪电第10章：容器监控：让你的Do
机器视觉_图像算法（六）——形状矩(Hu) 智能之心 #机器视觉_图像算法形状矩 opencv
图像形状矩：一个从一幅数字图形中计算出来的矩集，通常描述了该图像形状的全局特征，并提供了大量的关于该图像不同类型的几何特性信息，比如大小、位置、方向及形状等。一阶矩与形状有关，二阶矩显示曲线围绕直线平均值的扩展程度，三阶矩则是关于平均值的对称性的测量。由二阶矩和三阶矩可以导出一组共7个不变矩。而不变矩是图像的统计特性，满足平移、伸缩、旋转均不变的不变性，在图像识别领域得到了广泛的应用。一般由mom
embedding模型有哪些？如何选择合适的embedding模型？行云流水AI笔记 embedding
embedding模型是一种将数据映射到低维空间的模型，常用于自然语言处理、推荐系统、图像识别等领域。以下是一些常见的embedding模型：Word2Vec：CBOW（ContinuousBag-of-Words）：通过上下文预测中心词。Skip-Gram：通过中心词预测上下文。GloVe（GlobalVectorsforWordRepresentation）：结合了词频统计和Word2Vec的
聊聊 SQL 注入那些事儿白露与泡影 sql 数据库
相信大家对于学校们糟糕的网络环境和运维手段都早有体会，在此就不多做吐槽了。今天我们来聊一聊SQL注入相关的内容。何谓SQL注入？SQL注入是一种非常常见的数据库攻击手段，SQL注入漏洞也是网络世界中最普遍的漏洞之一。大家也许都听过某某学长通过攻击学校数据库修改自己成绩的事情，这些学长们一般用的就是SQL注入方法。SQL注入其实就是恶意用户通过在表单中填写包含SQL关键字的数据来使数据库执行非常规代
深度学习详解：通过案例了解机器学习基础 beist 深度学习机器学习人工智能
引言机器学习（MachineLearning，ML）和深度学习（DeepLearning，DL）是现代人工智能领域中的两个重要概念。通过让机器具备学习的能力，机器可以从数据中自动找到函数，并应用于各种任务，如语音识别、图像识别和游戏对战等。在这篇笔记中，我们将通过一个简单的案例，逐步了解机器学习的基础知识。1.1机器学习案例学习1.1.1回归问题与分类问题在机器学习中，根据所要解决的问题类型，任务
AI人工智能领域中OpenCV的深度学习融合 AI大模型应用实战人工智能 opencv 深度学习 ai
AI人工智能领域中OpenCV的深度学习融合关键词：AI人工智能、OpenCV、深度学习融合、计算机视觉、图像识别摘要：本文深入探讨了在AI人工智能领域中OpenCV与深度学习的融合。我们将先介绍OpenCV和深度学习的基本概念，再讲解它们融合的原理和方式，通过实际代码案例展示融合的具体操作，探讨其在不同场景的应用，推荐相关工具和资源，分析未来发展趋势与挑战。希望能让大家对这一融合有全面且深入的了
探索 SSD FW 顶层架构：开发难题与应对策略 Richard_Lynn SSD SSD FW顶层架构要素
探索SSDFW顶层架构：开发难题与应对策略在SSD开发的复杂版图中，FW（固件）顶层架构是核心支撑，决定着SSD的性能、稳定性与兼容性。但开发过程中，各类难题如荆棘丛生，今天就结合架构元素与实际挑战，聊聊SSDFW开发那些事儿。一、FW顶层架构关键元素解析（一）FSP：闪存信号处理的“精准操盘手”FSP承担读恢复、最优读电压表管理重任。SSD运行中，NAND闪存因磨损、温度变化，数据读取易出错。F
自动化搜索和操作的Python脚本：使用PyAutoGUI和图像识别木觞清 python
在现代计算机使用中，自动化操作已经成为提高效率和减少重复工作的重要手段。Python作为一种强大的编程语言，通过其丰富的第三方库可以实现各种自动化任务。本文将介绍如何使用PyAutoGUI库和图像识别来编写一个简单的自动化脚本，实现从搜索到操作的全自动化过程。简介在本文中，我们将使用Python编写一个脚本，该脚本能够执行以下操作：自动打开浏览器并导航到指定的搜索页面。在搜索框中输入指定的关键字。
Python学习Day33 m0_64472246 python打卡学习 python
学习来源：浙大疏锦行一、PyTorch和CUDA的安装：给电脑装“超级计算器”通俗解释PyTorch：是一个专门用于深度学习的“工具箱”，类似程序员的“智能积木”，能快速搭建神经网络。CUDA：是NVIDIA显卡的“加速引擎”，相当于给电脑的显卡装了一个“超级计算器”，让它能快速计算复杂的数学问题（如图像识别、数据训练）。安装逻辑：先装CUDA（显卡的“计算器驱动”），再装PyTorch（用这个计
人工神经网络：架构原理与技术解析 weixin_47233946 架构
##引言在深度学习和人工智能领域，人工神经网络（ArtificialNeuralNetwork,ANN）作为模拟人脑认知机制的核心技术，已在图像识别、自然语言处理和强化学习等领域实现了革命性突破。从AlphaGo击败人类顶尖棋手到ChatGPT的对话生成能力，ANN的进化持续推动技术边界的扩展。本文将深入剖析人工神经网络的核心原理、技术实现与发展趋势。##一、基础概念与数学模型###1.1生物启发
程序员速进！传统插件与 AI 补全效率大揭秘，错过血亏 yzhSWJ 人工智能 JBoltAI JAVA AI AI编程
宝子们，作为一个在Java开发领域摸爬滚打多年的程序员，今天就来和大家唠唠传统IDE插件和AI代码补全那些事儿。在咱们的日常开发工作中，代码补全工具那可是提高效率的得力助手，今天就来给大家扒一扒它们之间的效率差距。传统IDE插件代码补全原理传统IDE插件就像是一个超级聪明的助手，你在写代码的时候，它会根据你已经写出来的部分，在它的“拼图盒子”（代码库）里找那些可能匹配的拼图块（代码片段），然后告诉
图像处理技术研究与实现——python+opencv AnronSakura 图像处理 python opencv
背景介绍21世纪是一个充满信息的时代，图像作为人类感知世界的视觉基础，是人类获取信息、表达信息和传递信息的重要手段。处理图像，可以帮助我们更好地获取信息，也可以使我们更客观、准确地认识世界。图像处理作为计算机视觉领域的重要分支，在各个行业中扮演着越来越重要的角色。从医疗诊断、自动驾驶、安防监控到人工智能领域的图像识别，图像处理无处不在。OpenCVOpenCV是一个开源的计算机视觉库，它包含了丰富
PaddleOCR + Flask 构建 Web OCR 服务实战随风九天服务 flask 前端 ocr PaddleOCR
1、前言随着图像识别技术的发展，OCR（光学字符识别）已经成为很多应用场景中的基础能力。PaddleOCR是百度开源的一个高性能OCR工具库，支持中英文、多语言、轻量级部署等特性。而Flask是一个轻量级的PythonWeb框架，非常适合快速构建RESTfulAPI或小型Web应用。本文将带你一步步使用PaddleOCR+Flask搭建一个完整的WebOCR服务，实现图片上传→文字识别→返回结构化
【深度学习加速探秘】Winograd 卷积算法：让计算效率 “飞” 起来 heimeiyingwang 算法深度学习算法人工智能
一、为什么需要Winograd卷积算法？从“卷积计算瓶颈”说起在深度学习领域，卷积神经网络（CNN）被广泛应用于图像识别、目标检测、语义分割等任务。然而，卷积操作作为CNN的核心计算单元，其计算量巨大，消耗大量的时间和计算资源。随着模型规模不断增大，传统卷积算法的计算效率成为限制深度学习发展的一大瓶颈。Winograd卷积算法的出现，犹如一把利刃，直击传统卷积计算的痛点。它通过巧妙的数学变换，大幅
如何高效编写Airtest用例，如何可持续地维护用例脚本 996小白的进阶路深入浅出自动化测试 Airtest
告别“一锅粥”脚本：Airtest用例高效编写与可持续维护的最佳实践Airtest以其“所见即所得”的图像识别和简洁的API，极大地降低了UI自动化的门槛。然而，“写得爽”不等于“维护得好”。一个缺乏良好设计的自动化项目，最终会变成一个难以维护、频繁失败且无人敢动的“代码山”。本文将提供一套从“入门”到“架构”的实践指南，帮助你构建一个高效、健壮且易于维护的Airtest自动化测试体系。第一部分：
HarmonyOS SDK:Image Classification 能力进行图片识别
在鸿蒙应用开发中，HarmonyOSSDK提供了丰富的AI能力接口，开发者可以快速集成语音识别、图像识别、自然语言处理等智能功能到自己的应用中。作为一名鸿蒙开发者，在实际项目中我深刻体会到这些AI能力对提升用户体验和产品智能化水平的重要性。以图像识别为例，借助HarmonyOSSDK中的ImageClassificationAPI，我们可以轻松实现图片内容的自动识别与分类。通过调用系统提供的AI引
探秘卷积神经网络（CNN）：从原理到实战的深度解析 LNL13 cnn 人工智能神经网络
在图像识别、视频处理等领域，卷积神经网络（ConvolutionalNeuralNetwork，简称CNN）如同一位“超级侦探”，能够精准捕捉图像中的关键信息，实现对目标的快速识别与分析。从医疗影像诊断到自动驾驶中的路况感知，CNN凭借独特的架构设计和强大的特征提取能力，成为深度学习领域的中流砥柱。接下来，让我们深入探索CNN的奥秘。一、CNN的诞生背景与核心优势传统的神经网络，如多层感知机（ML
AI芯片设计与神经网络加速华清远见成都中心人工智能神经网络深度学习
随着人工智能技术的飞速发展，神经网络在图像识别、语音处理、自然语言理解等众多领域取得了显著成就。然而，神经网络的大规模计算需求对传统计算芯片提出了严峻挑战。AI芯片应运而生，其设计目的便是为神经网络提供高效的计算支持，实现神经网络的加速运行。深入研究AI芯片设计与神经网络加速技术，对于推动人工智能技术的广泛应用和进一步发展具有重要意义。一、AI芯片设计基础·计算架构：是AI芯片设计的核心。常见的计
AI+法律，能不能帮我打官司？——聊聊自动化法律分析那些事儿 Echo_Wish Python 进阶人工智能自动化运维
AI+法律，能不能帮我打官司？——聊聊自动化法律分析那些事儿朋友们大家好，我是你们熟悉的Echo_Wish。今天咱们不讲图像识别、不聊大模型压缩，也不搞无人机降落——今天咱搞点“法理情”的结合，聊聊人工智能在法律分析中的自动化落地实践。这几年，“AI改变行业”是老生常谈了，但你知道吗？有一个行业，既复杂、规则化强、文本数据多、人才极度紧缺，又一直被认为是“最不可能被AI替代的职业”之一——那就是法
nginx之keepalive详解与其配置
文章目录一、keepalive理解什么是keepalive如何确定请求头和响应体的长度？是否可使用长连接的条件是什么？keepalive时Nginx的等待时长是多少？keepalive的优势是什么？二、nginx的keepalive配置nginx保持keepalive需做那些事情nginx的文件配置三、应用场景什么时候使用？什么时候不用？一、keepalive理解什么是keepalivekeepa
种地也能玩 AI？聊聊我用 Python 打造“智慧农场”的那些事 Echo_Wish Python 进阶人工智能 python 开发语言
种地也能玩AI？聊聊我用Python打造“智慧农场”的那些事一、AI下田，不只是噱头不知道你有没有这种感觉：一说到“智慧农业”，总觉得是科研机构或者高大上的农业园区才搞得起的玩意。传感器、无人机、5G网络、大数据平台、AI模型听起来就贵。但其实，现在Python+AI的技术方案，已经能帮很多普通农业场景实现“高性价比”的智能化管理了。我们不谈什么宏观政策、不讲农业4.0的概念，今天就来实打实地聊聊
Python 爬虫大师课：PlayStation 商店反爬破解（Scrapy + Playwright + AI 图像识别） Python核芯 Python爬虫实战项目 python 爬虫 scrapy
引言在数字化浪潮的推动下，游戏产业蓬勃发展，而PlayStation作为全球知名的游戏平台，其商店中蕴含着海量的游戏数据。这些数据对于游戏玩家、游戏开发者以及市场研究者来说都极具价值。然而，PlayStation商店为了保护其数据安全和用户体验，设置了诸多反爬虫机制。今天，就让我们一同探索如何运用Scrapy、Playwright以及AI图像识别技术，巧妙地破解PlayStation商店的反爬机制
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他