雯文闻

【深度之眼opencv-6】：图像特征与目标检测

一、图像特征理解
- 1、颜色特征
- 2、纹理特征
- 3、形状特征
- 4、空间关系特征
二、形状特征
- 1、HOG-`方向梯度直方图`(Histogram of Oriented Gradient, HOG)
- - HOG特征提取
  - HOG实现过程-`hog.detectMultiScale(img, 0.1, (1, 1))`
- 2、Harris
- - 角点概念
  - Harris角点检测
  - Harris实现过程
  - Harris代码-`cv2.cornerHarris()`
- 3、SIFT-`尺度不变特征变换算法`
- - SIFT算法
  - SIFT特点
  - SIFT算法步骤
  - 函数封装-` sift=cv2.xfeatures2d.SIFT_create()`&`kp=sift.detect(gray, None)`
- 4、代码汇总
三、LBP纹理特征
- LBP介绍-`局部二值模式`
- LBP原理
- LBP 实现（opencv封装不好，自己实现）
四、模版匹配-`cv2.matchTemplate(target,tpl,method)`
五、人脸检测-`face_cascade.detectMultiScale()`
六、行人检测

一、图像特征理解

图像特征是图像中独特的，易于跟踪和比较的特定模板或特定结构。
特征就是有意义的图像区域，该区域具有独特性或易于识别性!

图像特征提取与匹配是计算机视觉中的一个关键问题，在目标检测、物体识别、三维重建、图像配准、图像理解等具体应用中发挥着重要作用。
图像特征主要有图像的颜色特征、纹理特征、形状特征和空间关系特征。

1、颜色特征

颜色特征是一种全局特征，描述了图像或图像区域所对应的景物的表面性质
颜色特征描述方法:
• 颜色直方图
• 颜色空间
• 颜色分布

2、纹理特征

纹理特征也是一种全局特征，它也描述了图像或图像区域所对应景物的表面性质。但由于纹理只是一种物体表面的特性，并不能完全反映出物体的本质属性，所以仅仅利用纹理特征是无法获得高层次图像内容的。

3、形状特征

形状特征有两类表示方法，一类是轮廓特征，另一类是区域特征。
图像的轮廓特征主要针对物体的外边界.
图像的区域特征则描述了是图像中的局部形状特征。

4、空间关系特征

空间关系特征，是指图像中分割出来的多个目标之间的相互的空间位置或相对方向关系
这些关系也可分为连接/邻接关系、交叠/重叠关系和包含/独立关系等。

二、形状特征

1、HOG-`方向梯度直方图`(Histogram of Oriented Gradient, HOG)

HOG特征提取

方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。
它通过计算和统计图像局部区域的梯度方向直方图来构成特征。
Hog特征结合SVM分类器已经被广泛应用于图像识别中，尤其在行人检测中获得了极大的成功。
主要思想:在一副图像中，目标的形状能够被梯度或边缘的方向密度分布很好地描述。

HOG实现过程-`hog.detectMultiScale(img, 0.1, (1, 1))`

• 灰度化(将图像看做一个x,y,z(灰度)的三维图像);
• 采用Gamma校正法对输入图像进行颜色空间的标准化(归一化);
• 计算图像每个像素的梯度(包括大小和方向);
• 将图像划分成小cells;
• 统计每个cell的梯度直方图(不同梯度的个数)，得到cell的描述子;
• 将每几个cell组成一个block，得到block的描述子;
• 将图像image内的所有block的HOG特征descriptor串联起来就可以得到HOG特征，该特征向量就是用来目标检测或分类的特征。

hog = cv2.HOGDescriptor()  # 启动检测器对象
hog.setSVMDetector(cv2.HOGDescriptor_getDefaultPeopleDetector())  # 指定检测器类型为人体
found, w = hog.detectMultiScale(img, 0.1, (1, 1))  # 加载并检测图像

# -------------------------------HOG特征-------------------------------
flag = 0
# flag = 1
if flag:
    def is_inside(o, i):
        ox, oy, ow, oh = o
        ix, iy, iw, ih = i
        return ox > ix and oy > iy and ox + ow < ix + iw and oy + oh < iy + ih


    def draw_person(image, person):
        x, y, w, h = person
        cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 255), 2)


    img = cv2.imread('people.jpg')

    hog = cv2.HOGDescriptor()  # 启动检测器对象
    hog.setSVMDetector(cv2.HOGDescriptor_getDefaultPeopleDetector())  # 指定检测器类型为人体
    found, w = hog.detectMultiScale(img, 0.1, (1, 1))  # 加载并检测图像

    print(found)
    print(w)

    # 丢弃某些完全被其它矩形包含在内的矩形NMS
    found_filtered = []
    for ri, r in enumerate(found):
        for qi, q in enumerate(found):
            if ri != qi and is_inside(r, q):
                break
            else:
                found_filtered.append(r)

    # 对不包含在内的有效矩形进行颜色框定
    for person in found_filtered:
        draw_person(img, person)

    cv2.imshow('people detection', img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

2、Harris

角点概念

角点:在现实世界中，角点对应于物体的拐角，道路的十字路口、丁字路口等。
从图像分析的角度来定义角点可以有以下两种定义:
• 角点可以是两个边缘的交点;
• 角点是邻域内具有两个主方向的特征点;
角点计算方法:
• 前者通过图像边缘计算，计算量大，图像局部变化会对结果产生较大的影响;
• 后者基于图像灰度的方法通过计算点的曲率及梯度来检测角点;

Harris角点检测

角点所具有的特征:
• 轮廓之间的交点;
• 对于同一场景，即使视角发生变化，通常具备稳定性质的特征;
• 该点附近区域的像素点无论在梯度方向上还是其梯度幅值上有着较大变化;
性能较好的角点:
• 检测出图像中“真实”的角点
• 准确的定位性能
• 很高的重复检测率
• 噪声的鲁棒性
• 较高的计算效率

Harris实现过程

• 计算图像在X和Y方向的梯度;
• 计算图像两个方向梯度的乘积;
• 使用高斯函数对三者进行高斯加权，生成矩阵M的A,B,C;
• 计算每个像素的Harris响应值R，并对小于某一阈值t的R置为零;
• 在3×3或5×5的邻域内进行非最大值抑制，局部最大值点即为图像中的角点;

Harris代码-`cv2.cornerHarris()`

函数：cv2.cornerHarris() 进行角点检测。
参数如下:
img ：数据类型为float32 的输入图像
blockSize ：角点检测中要考虑的领域大小
ksize - Sobel ：求导中使用的窗口大小
k - Harris ：角点检测方程中的自由参数,取值参数为 [0,04,0.06]

# -------------------------------Harris角点检测-------------------------------
flag = 0
flag = 1
if flag:
    img = cv2.imread('harris2.png')
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    gray = np.float32(gray)

    # 输入图像必须是 float32 ,最后一个参数在 0.04 到 0.06 之间
    dst = cv2.cornerHarris(gray, 2, 3, 0.06)

    # 结果进行膨胀，可有可无
    dst = cv2.dilate(dst, None)

    # 设定阈值，不同图像阈值不同
    img[dst > 0.01 * dst.max()] = [0, 0, 255]

    cv2.imshow('dst_img', img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

3、SIFT-`尺度不变特征变换算法`

SIFT算法

SIFT，即尺度不变特征变换算法(Scale-invariant feature transform， SIFT)，是用于图像处理领域的一种算法。SIFT具有尺度不变性，可在图像中检测出关键点，是一种局部特征描述子。

其应用范围包含物体辨识、机器人地图感知与导航、影像缝合、3D模型建立、手势辨识、影像追踪和动作比对。

SIFT特点

SIFT特性:
• 独特性，也就是特征点可分辨性高，类似指纹，适合在海量数据中匹配。
• 多量性，提供的特征多。
• 高速性，就是速度快。
• 可扩展，能与其他特征向量联合使用。
SIFT特点:
• 旋转、缩放、平移不变性
• 解决图像仿射变换，投影变换的关键的匹配
• 光照影响小
• 目标遮挡影响小
• 噪声景物影响小

SIFT算法步骤

• 尺度空间极值检测点检测
• 关键点定位:去除一些不好的特征点，保存下来的特征点能够满足稳定性等条件
• 关键点方向参数:获取关键点所在尺度空间的邻域，然后计算该区域的梯度和方向，根据计算得到的结果创建方向直方图，直方图的峰值为主方向的参数
•关键点描述符:每个关键点用一组向量(位置、尺度、方向)将这个关键点描述出来，使其不随着光照、视角等等影响而改变
• 关键点匹配:分别对模板图和实时图建立关键点描述符集合，通过对比关键点描述符来判断两个关键点是否相同

函数封装-`sift=cv2.xfeatures2d.SIFT_create()`&`kp=sift.detect(gray, None)`

返回的关键点是一个带有很多不用属性的特殊结构体，属性当中有坐标，方向、角度等。
使用sift.compute()函数来进行计算关键点描述符
•kp,des = sift.compute(gray,kp)
如果未找到关键点，可使用函数sift.detectAndCompute()直接找到关键点并计算。
在第二个函数中，kp为关键点列表，des为numpy的数组，为关键点数目×128

kp,des=sift.compute(gray,kp)&sift.detectAndCompute()封装在高版本opencv中，有专利保护，可以更新版本尝试。

    sift = cv2.xfeatures2d.SIFT_create()
    kp = sift.detect(gray, None)  # 找到关键点
    img = cv2.drawKeypoints(gray, kp, img)  # 绘制关键点

# -------------------------------SIFT-------------------------------
flag = 0
flag = 1
if flag:
    img = cv2.imread('harris2.png')
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

    sift = cv2.xfeatures2d.SIFT_create()
    kp = sift.detect(gray, None)  # 找到关键点
    img = cv2.drawKeypoints(gray, kp, img)  # 绘制关键点

    cv2.imshow('res', img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

4、代码汇总

import cv2
import numpy as np
import matplotlib.pyplot as plt

# -------------------------------HOG特征-------------------------------
flag = 0
# flag = 1
if flag:
    def is_inside(o, i):
        ox, oy, ow, oh = o
        ix, iy, iw, ih = i
        return ox > ix and oy > iy and ox + ow < ix + iw and oy + oh < iy + ih


    def draw_person(image, person):
        x, y, w, h = person
        cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 255), 2)


    img = cv2.imread('people.jpg')

    hog = cv2.HOGDescriptor()  # 启动检测器对象
    hog.setSVMDetector(cv2.HOGDescriptor_getDefaultPeopleDetector())  # 指定检测器类型为人体
    found, w = hog.detectMultiScale(img, 0.1, (1, 1))  # 加载并检测图像

    print(found)
    print(w)

    # 丢弃某些完全被其它矩形包含在内的矩形NMS
    found_filtered = []
    for ri, r in enumerate(found):
        for qi, q in enumerate(found):
            if ri != qi and is_inside(r, q):
                break
            else:
                found_filtered.append(r)

    # 对不包含在内的有效矩形进行颜色框定
    for person in found_filtered:
        draw_person(img, person)

    cv2.imshow('people detection', img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

# -------------------------------Harris角点检测-------------------------------
flag = 0
# flag = 1
if flag:
    img = cv2.imread('harris2.png')
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    gray = np.float32(gray)

    # 输入图像必须是 float32 ,最后一个参数在 0.04 到 0.06 之间
    dst = cv2.cornerHarris(gray, 2, 3, 0.06)

    # 结果进行膨胀，可有可无
    dst = cv2.dilate(dst, None)

    # 设定阈值，不同图像阈值不同
    img[dst > 0.01 * dst.max()] = [0, 0, 255]

    cv2.imshow('dst_img', img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

# -------------------------------SIFT-------------------------------
flag = 0
flag = 1
if flag:
    img = cv2.imread('harris2.png')
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

    sift = cv2.xfeatures2d.SIFT_create()
    kp = sift.detect(gray, None)  # 找到关键点
    img = cv2.drawKeypoints(gray, kp, img)  # 绘制关键点

    cv2.imshow('res', img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

三、LBP纹理特征

LBP介绍-`局部二值模式`

LBP(Local Binary Pattern，局部二值模式)，是一种用来描述图像局部纹理特征的算子;
它具有旋转不变性和灰度不变性等显著的优点;

LBP原理

LBP算子定义在一个3×33×3的窗口内，以窗口中心像素为阈值，与相邻的8个像素的灰度值比较，若周围的像素值大于中心像素值，则该位置被标记为1;，否则标记为0。
如此可以得到一个8位二进制数(通常还要转换为10进制，即LBP码，共256种)，将这个值作为窗口中心像素点的LBP值，以此来反应这个3×3区域的纹理信息。

特点
LBP记录的是中心像素点与领域像素点之间的差值
当光照变化引起像素灰度值同增同减时，LBP变化并不明显
LBP对与光照变化不敏感，LBP检测的仅仅是图像的纹理信息;

LBP 实现（opencv封装不好，自己实现）

import cv2
import numpy as np
import matplotlib.pyplot as plt


def LBP(src):
    '''
    :param src:灰度图像
    :return:
    '''
    height = src.shape[0]
    width = src.shape[1]
    dst = src.copy()
    lbp_value = np.zeros((1, 8), dtype=np.uint8)
    # print(lbp_value)
    neighbours = np.zeros((1, 8), dtype=np.uint8)
    # print(neighbours)
    for x in range(1, width - 1):
        for y in range(1, height - 1):
            neighbours[0, 0] = src[y - 1, x - 1]
            neighbours[0, 1] = src[y - 1, x]
            neighbours[0, 2] = src[y - 1, x + 1]
            neighbours[0, 3] = src[y, x - 1]
            neighbours[0, 4] = src[y, x + 1]
            neighbours[0, 5] = src[y + 1, x - 1]
            neighbours[0, 6] = src[y + 1, x]
            neighbours[0, 7] = src[y + 1, x + 1]
            center = src[y, x]
            for i in range(8):
                if neighbours[0, i] > center:
                    lbp_value[0, i] = 1
                else:
                    lbp_value[0, i] = 0

            lbp = lbp_value[0, 0] * 1 + lbp_value[0, 1] * 2 + lbp_value[0, 2] * 4 + lbp_value[0, 3] * 8 \
                  + lbp_value[0, 4] * 16 + lbp_value[0, 5] * 32 + lbp_value[0, 6] * 64 + lbp_value[0, 7] * 128

            # print(lbp)
            dst[y, x] = lbp

    return dst


img = cv2.imread('people.jpg', 0)
LBP_img = LBP(img)

cv2.imshow('LBP', LBP_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

四、模版匹配-`cv2.matchTemplate(target,tpl,method)`

result = cv2.matchTemplate(target, tpl, md)
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(result)

import cv2
import numpy as np
import matplotlib.pyplot as plt


def template_demo(tpl, target):
    method = [cv2.TM_SQDIFF_NORMED, cv2.TM_CCORR_NORMED, cv2.TM_CCOEFF_NORMED]
    th, tw = tpl.shape[:2]

    for md in method:
        result = cv2.matchTemplate(target, tpl, md)

        min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(result)

        if md == cv2.TM_SQDIFF_NORMED:
            tl = min_loc
        else:
            tl = max_loc

        br = (tl[0] + tw, tl[1] + th)  # br是矩形右下角的点的坐标
        cv2.rectangle(target, tl, br, (0, 0, 255), 2)

        cv2.namedWindow("match-" + np.str(md), cv2.WINDOW_NORMAL)
        cv2.imshow("match-" + np.str(md), target)


tpl = cv2.imread('sample2.jpg')
target = cv2.imread('target1.jpg')

template_demo(tpl, target)

cv2.waitKey(0)
cv2.destroyAllWindows()

五、人脸检测-`face_cascade.detectMultiScale()`

一般人脸识别系统包含四步骤：人脸检测、人脸对齐、人脸特征提取、人脸识别

人脸检测 Face Detection
输入：Image
输出：人脸坐标框
人脸对齐 Face Alignment：
输入：Image+人脸坐标框
输出：五官关键点的坐标序列（5点、69点、90点等等）
人脸特征提取 Face Feature Extraction
用一串字符表示人脸特征。
人脸识别
输入：人脸特征
输出：找到注册库中相似度最高的特征，将最高相似度值和设定的阈值进行比较。超过阈值则是“1”，否则是“0”。

方法一：cv2.CascadeClassifier(r'haarcascade_frontalface_default.xml')&face_cascade.detectMultiScale()

import cv2

# 读入图像
img = cv2.imread("3.png")

# 加载人脸特征，该文件在 python安装目录\Lib\site-packages\cv2\data 下
face_cascade = cv2.CascadeClassifier(r'haarcascade_frontalface_default.xml')
# 将读取的图像转为COLOR_BGR2GRAY，减少计算强度
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 检测出的人脸个数
faces = face_cascade.detectMultiScale(gray, scaleFactor = 1.15, minNeighbors = 4, minSize = (5, 5))

print("Face : {0}".format(len(faces)))
print(faces)
# 用矩形圈出人脸的位置
for(x, y, w, h) in faces:
    cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), 2) 

cv2.namedWindow("Faces")
cv2.imshow("Faces", img)
cv2.waitKey(0)
cv2.destroyAllWindows()

方法二：

# -*- coding：utf-8 -*-
import cv2
import dlib
import numpy as np


predictor_model = 'shape_predictor_68_face_landmarks/shape_predictor_68_face_landmarks.dat'
detector = dlib.get_frontal_face_detector()
predictor = dlib.shape_predictor(predictor_model)

# cv2读取图像
test_film_path = "3.png"
img = cv2.imread(test_film_path)
# 取灰度
img_gray = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)

# 人脸数rects
rects = detector(img_gray, 0)
print(rects[0])
for i in range(len(rects)):
    landmarks = np.matrix([[p.x, p.y] for p in predictor(img,rects[i]).parts()])
    print(landmarks, type(landmarks))
    for idx, point in enumerate(landmarks):
        # 68点的坐标
        pos = (point[0, 0], point[0, 1])
        #print(idx+1, pos)

        # 利用cv2.circle给每个特征点画一个圈，共68个
        cv2.circle(img, pos, 3, color=(0, 255, 0))
        # 利用cv2.putText输出1-68
        font = cv2.FONT_HERSHEY_SIMPLEX
        cv2.putText(img, str(idx+1), pos, font, 0.5, (0, 0, 25 5), 1, cv2.LINE_AA)

#cv2.imwrite("result.png", img)
cv2.imshow("img", img)
cv2.waitKey(0)
cv2.destroyAllWindows()

六、行人检测

你可能感兴趣的:(opencv,opencv)

基于Python开发的海关报表自动识别系统的示例代码 go5463158465 python 深度学习算法 python 开发语言
以下是一个基于Python开发的海关报表自动识别系统的示例代码，该系统包含输入报表、预处理、分类识别、文本检测和生成报表的基本功能。本示例主要使用了pytesseract进行文本识别，opencv-python进行图像预处理，同时简单模拟了报表分类的逻辑。环境准备在运行代码之前，需要安装以下库：pipinstallopencv-pythonpytesseractpandas此外，还需要安装Tess
使用 Python 和 OpenCV 从一组图片生成 MP4 格式的视频 @Mr_LiuYang 写过的小程序 python opencv 音视频
概要在创建动画、制作幻灯片，从生成的图像数据中导出动态视频时，我们需要将一系列静态图片合成一个视频。安装依赖代码需要安装OpenCV库。可以通过命令行安装：pipinstallopencv-python完整代码图片尺寸不一时见后文调整视频尺寸importcv2importos#设置图像文件夹路径image_folder='person'#输出视频文件名output_video='person.mp
OpenCV机器学习（10）训练数据的一个核心类cv::ml::TrainData 村北头的码农 OpenCV opencv 机器学习人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::ml::TrainData类是OpenCV机器学习模块中用于表示训练数据的一个核心类。它封装了样本数据、响应（标签）、样本权重等信息，并提供了多种方法来创建和操作这些数据，以适应不同的机器学习算法需求。主要功能数据准备：允许你从原始数据创建训练数据对象。支
深度学习工厂的蓝图：拆解CUDA驱动、PyTorch与OpenCV的依赖关系时光旅人01号深度学习 pytorch opencv
想象一下，你正在建造一座深度学习工厂，这座工厂专门用于高效处理深度学习任务（如训练神经网络）和计算机视觉任务（如图像处理）。为了让工厂顺利运转，你需要搭建基础设施、安装设备、设置生产线，并配备控制台来管理整个生产过程。以下是这座工厂的详细构建过程：1.工厂的基础设施：Ubuntu比喻：Ubuntu是工厂所在的土地和建筑，提供了基础设施和运行环境。作用：提供操作系统环境，支持安装和运行各种工具和框架
使用Python和OpenCV实现图像像素压缩与解压东方佑量子变法 python opencv 开发语言
在本文中，我们将探讨如何使用Python和OpenCV库来实现一种简单的图像像素压缩算法。我们将详细讨论代码的工作原理，并提供一个具体的示例来演示该过程。1.引言随着数字媒体的普及，图像处理成为了一个重要的领域。无论是为了减少存储空间还是加快网络传输速度，图像压缩技术都扮演着至关重要的角色。这里，我们提出了一种基于像素重复模式的简单压缩算法，它适用于具有大量连续相同像素值的图像。2.技术栈介绍2.
【干货】视频文件抽帧（opencv和ffmpeg方式对比） zkFun 超硬干货 Python opencv ffmpeg 人工智能
1废话不多说，直接上代码opencv方式importtimeimportsubprocessimportcv2,osfrommathimportceildefextract_frames_opencv(video_path,output_folder,frame_rate=1):"""使用OpenCV从视频中抽取每秒指定帧数的帧,并保存到指定文件夹。如果视频长度不是整数秒,则会在最后一帧时补充空白
查看opencv版本信息 zhanghui9020
在VS2010中编写控制台C++程序：#include#include"cv.h"usingnamespacestd;main(){cout<<CV_VERSION;}运行即可打印安装的opencv的版本信息
OpenCV的卡尔曼滤波器：实现和应用雪域Code opencv 人工智能计算机视觉 C/C++
OpenCV的卡尔曼滤波器：实现和应用卡尔曼滤波器（Kalmanfilter）是一种最优估计的算法，在众多领域有着广泛的应用，如控制系统、通信系统、机器人等。OpenCV作为一个计算机视觉库，也提供了对卡尔曼滤波器的支持。本文将介绍OpenCV中卡尔曼滤波器的基本原理、实现方法以及在图像处理中的应用。一、卡尔曼滤波器简介卡尔曼滤波器是一种用于状态估计和信号滤波的算法，主要针对线性、高斯分布的系统。
利用 OpenCV 进行棋盘检测与透视变换萧鼎 python基础到进阶教程 opencv 人工智能计算机视觉
利用OpenCV进行棋盘检测与透视变换1.引言在计算机视觉领域，棋盘检测与透视变换是一个常见的任务，广泛应用于摄像机标定、文档扫描、增强现实（AR）等场景。本篇文章将详细介绍如何使用OpenCV进行棋盘检测，并通过透视变换将棋盘区域转换为一个标准的矩形图像。我们将基于一段Python代码进行分析，代码的主要任务包括：读取图像并进行预处理（灰度转换、自适应直方图均衡化、去噪）检测边缘并提取棋盘区域计
对换脸、动嘴生成的视频做初筛之群害马音视频计算机视觉 opencv
首尾帧人脸差异检测代码概述本脚本实现了一个简单的视频筛查系统，主要功能是通过比较视频首帧和尾帧中的人脸差异来判断视频是否合格。如果视频中没有人脸或存在其他异常情况，视频将被移动到错误目录中。具体来说，系统包含以下几个主要步骤：加载视频文件：尝试打开视频文件，并读取首帧和尾帧。人脸检测：使用OpenCV的Haar级联分类器检测视频首帧和尾帧中的人脸。人脸提取与标准化：从检测到的人脸区域中提取并标准化
使用OpenCV在Visual Studio上编译x86或x64平台的应用程序程序世界航海 opencv visual studio 人工智能编程
OpenCV是一个广泛使用的计算机视觉库，它提供了丰富的图像处理和计算机视觉算法。如果你想在VisualStudio上编译一个使用OpenCV的应用程序，并且需要针对特定的x86或x64平台进行优化，那么本文将为你提供一些指导。以下是在VisualStudio中编译x86或x64平台上的OpenCV应用程序的步骤：步骤1：安装VisualStudio和OpenCV首先，确保你已经安装了最新版本的V
用realsense d435i传感器在实际环境中跑ORB_SLAM3，顺带解决一部分编译问题睫力上爬 SLAM 日常折腾传感器 ORB_SLAM3
是的ORB_SLAM3来了，时隔五年，它来带的惊喜到底是啥呢？一个完全依赖于最大后验估计（MAP）的单/双目惯导融合系统高回召的地点识别功能（High-recallplacerecognition）第一个完整的多地图系统（multi-map）一个抽象的相机模型表示论文地址论文细节今天不说，今天主要先拿到代码，并且用自己的传感器试试实际效果编译终端拉代码记得提前安装好OpenCV，Eigen，和Pa
ROS教程（六）：Rviz显示USB摄像头（详细图文） Leslie___Cheung ROS ROS rviz usb摄像头
目录前言一、RVIZ介绍1.数据类型介绍2.界面介绍二、配置RVIZ1.打开RVIZ2.添加模块三、启动总结（最重要的）前言上一章讲解了如何使用OpenCV调用电脑摄像头或USB摄像头，本章Leslie就讲解如何使用rviz来显示摄像头的画面。一、RVIZ介绍1.数据类型介绍参考ROS教程（四）->数据类型介绍2.界面介绍二、配置RVIZ1.打开RVIZ打开终端，输入rvi
【ORB_SLAM系列3】—— 如何在Ubuntu18.04中使用自己的单目摄像头运行ORB_SLAM3（亲测有效，踩坑记录）啥也不会的研究僧 SLAM算法安装与实践记录 ubuntu 计算机视觉人工智能自动驾驶
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、ORB_SLAM3源码编译二、ORB_SLAM3实时单目相机测试1.查看摄像头的话题2.运行测试三.运行测试可能的报错1.报错一(1)问题描述(2)原因分析(3)解决2.报错二(1)问题描述(2)解决前言本次教程运行ORB_SLAM3，所需的环境如下：Ubuntu18.04、ros版本：melodicOpencv4.5
奥比中光3D机器视觉相机能连接halcon吗？视觉人机器视觉机器视觉3D 3d 数码相机视觉检测 c#
奥比中光的设备与Halcon的兼容性可以通过以下方式实现：数据接口的通用性奥比中光的相机（如AstroPro、大白等）支持通过UVC协议获取彩色图像，深度数据则通过OpenNI或ROS2接口传输105。若Halcon支持这些协议或标准接口（如ROS消息、OpenCV图像流），则可通过直接调用或二次开发实现连接。例如，通过Python或C#脚本将图像数据从相机传输至Halcon的处理流程中。SDK与
Ubuntu 安装 OpenCV (C++) LegendBIT 程序开发--基本工具 ubuntu opencv c++
版本详情：Ubuntu:22.04+5.15.0-133-genericgcc:11.4.0g++:11.4.0OpenCV:4.7.01.卸载OpenCV进入原先编译opencv的build目录，在该目录下打开终端，执行以下代码（如果build已经删除了，可以重新编译一遍该版本的opencv，然后在最后一步执行sudomakeuninstall）sudomakeuninstallcd..sudo
QT5在windows下调用OpenCV库出现: undefined reference to `xxxxx' 错误解决办法（适用MinGW编译器）。 DS小龙哥 QT(C++)应用软件开发 AI人工智能 opencv
一、环境介绍window系统：win10X64QT版本:5.12QT5.12自带的MinGW编译器版本：mingw730_32与mingw730_64在QT的安装目录下，可以查看MinGW编译器的版本:二、使用OpenCV出现的问题在QT框架代码里使用老版本的分类器(cvLoad、cvHaarDetectObjects)处理图像时，正常编译没有问题，当使用新版本级联分类器(CascadeClass
使用opencv实现深度学习的图片与视频的超分辨率人工智能研究所人工智能之计算机视觉 opencv 深度学习视频超分辨率图片超分辨率
图片超分辨率什么是视频与图片的超分辨率，总结一下便是给一张分辨率比较低的图片，进行超分辨率的处理后，生成比较清晰的高分辨率的图片，上图图片完美解释了超分辨率的过程，由于不同的算法不同，处理的结果也不相同，本期我们介绍一下如何进行图片的超分辨率的处理。·EDSR模型图像超分辨率EDSR：EnhancedDeepResidualNetworksforSingleImageSuper-Resolutio
OpenCV 简介奇点创客 OpenCV
OpenCV（OpenSourceComputerVisionLibrary，开源计算机视觉库：http://opencv.org）是一个开放源代码库，其中包含数百种计算机视觉算法。本文档介绍所谓的OpenCV2.xAPI，与基于C的OpenCV1.xAPI相比，该API本质上是一套C++API（自OpenCV2.4发行以来，不推荐再使用CAPI，并且不使用“C”编译器进行测试）。OpenCV具有
OpenCV机器学习（1）人工神经网络 - 多层感知器类cv::ml::ANN_MLP 村北头的码农 OpenCV opencv 机器学习人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::ml::ANN_MLP是OpenCV库中的一部分，用于实现人工神经网络-多层感知器（ArtificialNeuralNetwork-Multi-LayerPerceptron,ANN-MLP）。它提供了一种方式来创建和训练多层感知器模型，以解决分类、回归等
[C#]C#使用yolov8的目标检测tensorrt模型+bytetrack实现目标追踪 FL1623863129 深度学习 c#YOLO 目标检测
【测试通过环境】win10x64vs2019cuda11.7+cudnn8.8.0TensorRT-8.6.1.6opencvsharp==4.9.0.NETFramework4.7.2NVIDIAGeForceRTX2070Super版本和上述环境版本不一样的需要重新编译TensorRtExtern.dll，TensorRtExtern源码地址：TensorRT-CSharp-API/src/T
树莓派通过手机热点，无线连接PC端电脑，进行远程操作 Epiphany_ZZW 树莓派智能手机
树莓派通过手机热点实现无线连接具有以下几点优势：1.该方式能够联网，方便在项目开发时下载一些数据包。2.该方式能够通过手机端查看树莓派IP地址(有些情况树莓派ip地址会发生改变)借鉴链接如下：树莓派的使用网线及无线连接方法及手机连接树莓派_opencv镜像具体操作方式如下：打开终端：pi@raspberrypi:~$sudonano/etc/wpa_supplicant/wpa_supplican
推荐学习图像处理的入门书：《Python图像处理实战》天飓学习感悟学习图像处理 python
《Python图像处理实战》是一本全面介绍Python图像处理技术的实用指南，是由人民邮电出版社于2020年12月出版。这本书的作者桑迪潘·戴伊是一位兴趣广泛的数据科学家，主要研究机器学习、深度学习、图像处理和计算机视觉。在《Python图像处理实战》一书中，作者主要介绍了如何用Python图像处理库（如PIL、python-opencv、Scipy等），机器学习库（scikit-learn）和深
使用 OpenCV 和 Python 对图像进行卡通化无水先生 AI原理和python实现人工智能综合 opencv python 人工智能
关键词：OpenCVlibrarytoconvertimagestocartoons目录一、说明二、OpenCV2.1要求支持库2.2方法2.3实施和执行三、定义卡通化函数3.1添加按钮3.2保存图像四、结论一、说明在本文中，我们将构建一个有趣的应用程序，将提供给它的图像卡通化。为了构建这个卡通化应用程序，我们将使用python和OpenCV。这是机器学习令人兴奋和激动的应用程序之一。在构建此应用
使用Qt+opencv实现游戏辅助点击工具-以阴阳师为例虎式坦克我最爱游戏
注：本文章技术交流使用，不侵犯任何著作权。一.阴阳师辅助软件需要实现哪些功能?1.首先，对于肝绘卷拿角色而言，需要打困难28副本和结界突破循环刷绘卷碎片。这一功能让你每月免费悠闲地拿到最新角色，即使你是较新的玩家！2.有人喜欢打阴阳寮突破，因为结界卡可以合成勾玉，另外寮突破后给的寮勋章可以维持寮正常运转。3.御魂等副本，这款游戏的御魂是核心玩法。而且这只是一个辅助工具，不修改游戏内存，用来解放双手
ORB-SLAM3源码的学习：GeometricTools文件 PaLu-LvL 计算机视觉 #ORB-SLAM3 c++计算机视觉 ubuntu 人工智能学习
前言GeometricTools提供了两种几何计算功能：1.计算两个关键帧之间的基础矩阵、2.通过三角化算法从两个视角恢复三维点。这部分功能在ORB-SLAM2中就已经介绍过了，这里不过多赘述。1.头文件GeometricTools.h除了计算基础矩阵和三角化恢复三维点外，头文件中还提供了两种用于比较矩阵的模板函数。第一个函数用于比较一个OpenCV矩阵和一个Eigen矩阵，第二个函数用于比较两个
OpenCV：人脸检测与Haar级联分类器（十三） WHCIS opencv opencv 数学建模人工智能计算机视觉音视频算法
一、Haar级联检测深度解析1.1Haar特征数学建模Haar特征的本质是通过矩形区域对比捕捉局部特征，其数学形式可扩展为四元组表示：特征定义：Haar(f)=(t,x,y,w,h)×s\text{Haar}(f)=(t,x,y,w,h)\timessHaar(f)=(t,x,y,w,h)×s其中：ttt表示特征类型（共14种基础变体）(x,y)(x,y)(x,y)为特征锚点坐标(w,h)(w,h
Python 爬虫验证码识别 acheding python python 爬虫 ocr
在我们进行爬虫的过程中，经常会碰到有些网站会时不时弹出来验证码识别。我们该如何解决呢？这里分享2种我尝试过的方法。0.验证码示例1.OpenCV+pytesseract使用Python中的OpenCV库进行图像预处理（边缘保留滤波、灰度化、二值化、形态学操作和逻辑运算），然后结合pytesseract进行文字识别。pytesseract需要配合安装在本地的tesseract-ocr.exe文件一起
三种方式实现人车流统计（yolov5+opencv+deepsort+bytetrack+iou） Jayson God 人工智能 c++yolov5 opencv 算法人工智能
一、运行环境1、项目运行环境如下2、CPU配置3、GPU配置如果没有GPUyolov5目标检测时间会比较久二、编程语言与使用库版本项目编程语言使用c++，使用的第三方库，onnxruntime-linux-x64-1.12.1，opencv-4.6.0opencv官方地址Releases-OpenCVopencvgithub地址https://github.com/opencv/opencv/tr
从养殖场到科技前沿：YOLOv11+OpenCV精准计数鸡蛋与鸡星际编程喵 Python探索之旅 YOLO opencv 人工智能 python 目标检测计算机视觉
前言谁能想到，鸡蛋和鸡的计数居然能变成一项高科技活儿？想象一下，早上去市场，卖家把鸡蛋摔得稀巴烂，结果鸡蛋滚得到处都是——难道你就得一个个捡回来数？还得小心别弄错？可是，你又不是超人！别担心，科技来帮忙！今天的主角是YOLOv11和OpenCV，它们是计算机视觉领域的两位大佬，专门为你解决这一难题。无论是鸡蛋还是鸡，它们都能精准识别，数得清清楚楚。不信？那我们就一起去看看怎么用这对“黄金搭档”解决
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》