10.19课后作业

一、视频分镜:基于均值哈希;基于直方图相似度

 

首先导入需要的包以及视频所在位置

import cv2
import numpy as np
import matplotlib.pyplot as plt
import os
os.chdir(r"C:\Users\lenovo\AppData\Local\Programs\Python\Python37\Lib\site-packages\1")

第二步开始利用均值哈希算法计算相似度

首先利用resize函数将其缩放为8*8

# 均值哈希算法
def aHash(pic):
    # 缩放为8*8
    plt.imshow(pic)
    plt.axis('off')  #去掉坐标轴
    plt.show()
    img = cv2.resize(pic, (8, 8))
    plt.imshow(pic)
    plt.axis('off')  #去掉坐标轴
    plt.show()

接着转换为灰度图,然后通过遍历累加求出像素和

# 转换为灰度图
    gray = cv2.cvtColor(pic, cv2.COLOR_BGR2GRAY)
    # s为像素和初值为0,hash_str为hash值初值为''
    s = 0
    hash_str = ''
    # 遍历累加求像素和
    for i in range(8):
        for j in range(8):
            s = s + gray[i, j]

最后根据灰度平均值分类讨论

    # 求平均灰度
    avg = s / 64
    # 灰度大于平均值为1相反为0生成图片的hash值
    for i in range(8):
        for j in range(8):
            if gray[i, j] > avg:
                hash_str = hash_str + '1'
            else:
                hash_str = hash_str + '0'
    return hash_str

第三步通过两种形式的直方图来计算相似度

1)RGB每个通道的直方图(先分离再计算):

# 通过得到RGB每个通道的直方图来计算相似度
def classify_hist_with_split(image1, image2, size=(256, 256)):
    # 将图像resize后,分离为RGB三个通道,再计算每个通道的相似值
    image1 = cv2.resize(image1, size)
    image2 = cv2.resize(image2, size)
    plt.imshow(image1)
    plt.show()
    plt.axis('off')
    
    plt.imshow(image2)
    plt.show()
    plt.axis('off')
    
    sub_image1 = cv2.split(image1)
    sub_image2 = cv2.split(image2)
    sub_data = 0
    
    for im1, im2 in zip(sub_image1, sub_image2):
        sub_data += calculate(im1, im2)
    sub_data = sub_data / 3
    return sub_data

2)单通道的直方图:

# 计算单通道的直方图的相似值
def calculate(image1, image2):
    hist1 = cv2.calcHist([image1], [0], None, [256], [0.0, 255.0])
    hist2 = cv2.calcHist([image2], [0], None, [256], [0.0, 255.0])
    plt.plot(hist1, color="r")
    plt.plot(hist2, color="g")
    plt.show()
    # 计算直方图的重合度
    degree = 0
    for i in range(len(hist1)):
        if hist1[i] != hist2[i]:
            degree = degree + (1 - abs(hist1[i] - hist2[i]) / max(hist1[i], hist2[i]))
        else:
            degree = degree + 1
    degree = degree / len(hist1)
    return degree

*注:hist是一个shape为(256,1)的数组,表示0-255每个像素值对应的像素个数,下标即为相应的像素值   plot一般需要输入x,y,若只输入一个参数,那么默认x为range(n),n为y的长度

 cv2.calcHist():括号内参数分别为:输入图像,选择图像的通道,掩膜(一般为None),使用多少个bin(一般为256),像素值的范围,(一般为[0,255])

3)根据1)和2)确定好直方图后,开始对比Hash值

# Hash值对比
def cmpHash(hash1, hash2):
    n = 0
    # hash长度不同则返回-1代表传参出错
    if len(hash1)!=len(hash2):
        return -1
    # 遍历判断
    for i in range(len(hash1)):
        # 不相等则n计数+1,n最终为相似度
        if hash1[i] != hash2[i]:
            n = n + 1
    return n

第四步通过调用图片得出最终结果

img1 = cv2.imread('./pic/image158.jpg')  #  11--- 16 ----13 ---- 0.43
img2 = cv2.imread('./pic/image159.jpg')


hash1 = aHash(img1)
hash2 = aHash(img2)
n = cmpHash(hash1, hash2)
print('均值哈希算法相似度:', n)

n = classify_hist_with_split(img1, img2)
print('三直方图算法相似度:', n)

二、在不同参数和视频的情况下,利用FFMPEG截取一分钟视频进行测试(2-3个)

用到的命令为:ffmpeg -i input.mp4 -ss 0:05 -t 60 output.mp4

其中i 后对应的是输入的原视频,ss后对应的是从第几秒开始截取,t后对应的是最多截取多少秒,输出视频为output

举例1:命令行:ffmpeg -i hqmg.mp4 -ss 0:05 -t 60 output.mp4

出现结果:10.19课后作业_第1张图片

举例2:命令行:ffmpeg -i xxm.mp4 -ss 0:10 -t 60 xxm2.0.mp4

出现结果: 10.19课后作业_第2张图片

举例3:通过查找资料得到一种更快捷的方式: 

ffmpeg -ss 0:10 -i xxm.mp4 -t 60 -c:v copy -c:a copy xxm3.0.mp4

*注:把-ss 1:05放到-i前面,与原来的区别是,这样会先跳转到第0:10秒在开始解码输入视频,而原来的会从开始解码,只是丢弃掉前0:10秒的结果。
-c:v 和 -c:a分别指定视频和音频的编码格式。
-c:v copy -c:a copy标示视频与音频的编码不发生改变,而是直接复制,这样会大大提升速度。

出现结果更快,得到视频3.0与2.0同样

你可能感兴趣的:(python)