拔牙不打麻药

计算机视觉实验四分别使用颜色布局描述符(Color Layout Descriptor)与方向梯度直方图(HOG)实现图像检索，并且画出图像的PR曲线图

数据集描述

数据集是Corel-1K,数据集中有一千张图片，每一百张图片为一个类别，比如海滩、汽车等等，0.jpg-99.jpg为一个类别，100.jpg-199.jpg为一个类别，以此类推。

颜色布局描述符

思路分析

参考教程：https://blog.csdn.net/qq_38204686/article/details/107187215
https://blog.csdn.net/majianxiong_lzu/article/details/90203927

先讲一下CLD的处理流程：

图像分割
将图片分割成8*8共64个小块，每个小块长宽为height/8,width/8。
选择每小块中的代表色
mpeg-7标准推荐使用区域块的平均像素颜色值作为代表颜色。
颜色空间转换
需要将RGB颜色空间转换成YCbCr空间。
DCT转换
对转化成YCbCr的图片进行离散余弦转换得到三组DCT矩阵。
对矩阵进行之字型扫描

扫描的目的是对矩阵的低频系数进行分组。
CLD特征匹配
通过对两个图片的CLD之间的距离计算来完成匹配。
距离排序
算法得出的距离较小的几张图，就是算法认为和样本是同类的图，但事实上得出的前几张图并不是真正的和样本同一类，据此来得到precision和recall所需的参数。
precision和recall

precision = （算法检索到的真实正例）/算法认为是真实正例的所有样本（包括是真的和不是真的算法认为真的）
recall = （算法检索到的真实正例）/所有真实正例（样本里面是真的）

代码解释

图像分割，将图像分割成8*8的小块，以样本小块

  #图像分割8*8
    n=8;

    (height,width,channel)=img.shape
    #print(height,width,channel) 

    block_h = np.fix(height/n); #每块的高度
    block_w=np.fix(width/n); #每块的宽度
    #print(block_h,block_w) #32.0 48.0

    im_n=np.zeros((n,n,channel))

    for i in range(n):
        for j in range(n):
            for k in range(channel):
            #确定块的坐标表达
                a = block_h * i+1;
                b = block_h * (i+1); #height: b-a
                c = block_w * j+1;
                d = block_w * (j+1); #width: d-c
            #循环到右下角的块时
                if i == (n-1):
                    b = height-1;
                if j == (n-1):
                    d = width-1;

小块代表色的选择，计算小块中的平均像素颜色作为代表色。

#每块代表色的选择，实现“mpeg-7标准推荐使用区域块的平均像素颜色值作为代表颜色”
                #print(img[int(a)][int(d)][int(k)])

                arr=[img[int(a)][int(c)][k],img[int(a)][int(d)][k],img[int(b)][int(c)][k],img[int(b)][int(d)][k]]
                
                pix = np.mean(np.mean(arr));
                #print(pix)
                im_n[i][j][k]=pix
                #print(im_n)

将RGB颜色空间转化成YCbCr颜色空间

 # 将rgb转换色彩空间为YCbCr
    mat = np.array(
       [[ 65.481, 128.553, 24.966 ],
        [-37.797, -74.203, 112.0  ],
        [  112.0, -93.786, -18.214]])
    offset = np.array([16, 128, 128])


    im_YCbCr = rgb2ycbcr(mat,offset,im_n)

DCT变换

#DCT变换
    im_DCT = np.zeros((n,n,channel)); 
    #因为dct操作只能对二维矩阵进行操作，所以这里要把y,cb,cr分别拎出来处理
    im_DCT[:,:,0] = dct(im_YCbCr[:,:,0])
    im_DCT[:,:,1] = dct(im_YCbCr[:,:,1])
    im_DCT[:,:,2] = dct(im_YCbCr[:,:,2])
    #print(im_DCT)

按照之字形对矩阵进行扫描

#按照之字形扫描im_DCT存储到descript中
    zig = [[0   ,  1  ,   5  ,   6  ,  14  ,  15  ,  27  ,  28],
           [2   ,  4  ,   7  ,  13  ,  16 ,   26  ,  29  ,  42],
           [3   ,  8  ,  12 ,   17  ,  25 ,   30  ,  41  ,  43],
           [9   , 11  ,  18  ,  24  ,  31 ,   40  ,  44  ,  53],
           [10   , 19  ,  23 ,   32  ,  39 ,   45  ,  52  ,  54],
           [20   , 22  ,  33  ,  38  ,  46 ,   51  ,  55  ,  60],
           [21   , 34  ,  37  ,  47  ,  50 ,   56  ,  59  ,  61],
           [35   , 36  ,  48  ,  49  ,  57 ,   58  ,  62  ,  63 ]]
    descript = np.zeros((n*n,channel));
    for i in range (n):
        for j in range (n):
            descript[zig[i][j],:] = im_DCT[i,j,:];
            #print(descript);

    result = descript;

result就是这一张图片输出的CLD矩阵

样本以0.jpg为例，依次打开1-999.jpg，命名为img2，先对每一个img2改变大小，改成和样本一样或者样本和img2都改成同样的大小（如果不改的话因为大小不同可能导致无法计算距离）。然后计算样本的CLD矩阵和img2的CLD矩阵。并根据CLD矩阵计算距离（这里用的欧式距离）。同时根据文件名编号来判断是哪个类class，比如166.jpg就是第二类，366.jpg就是第四类，总共十个类。接着用class判断是否和样本同一个类，是为1，否为0，写入new_class中。

#img2 = cv2.imread('./Corel-1K/image.orig/3.jpg')
    img_index = 0; #设置样本img的编号
    img=cv2.imread('./Corel-1K/image.orig/'+str(img_index)+'.jpg') #这里就是读取0.jpg
    img = cv2.resize(img,(200,200))
    #print('shape',img.shape)
    img_class = int((img_index)/100)+1 #算出样本img的类别，0-99为类1,100-199为类2,，以此类推
    print("class",img_class)
    
    CLD_img1 = CLD(img) #对img进行CLD处理
    cld_index=[] 
    cld_img=[]
    cld_class = []
    cld_new_class = [] 
    for i in range(0,1000):
        if i == img_index: #如果读到样本img的编号就跳过
            print("skip>>>>>>>"+str(i))
            continue;
        img2 = cv2.imread('.\\Corel-1K\\image.orig\\%d.jpg' %(i))
        img2 = cv2.resize(img2,(200,200))
        #print(img2.shape)
        #print(i)
        img2_class = int((i)/100)+1
        #print(img2_class)
        if img_class == img2_class: #判断循环取出的图片是否和样本为同一个类别
            new_class = 1
        else:
            new_class = 0
        CLD_img2 = CLD(img2);
        distances = distance_CLD(CLD_img1,CLD_img2);
        cld_index.append(i)
        cld_img.append(distances)
        cld_class.append(img2_class)
        cld_new_class.append(new_class)

将CLD数据、距离、class、new_class写入dataframe中，按照距离进行升序排列。

#print(cld_img)
    test_dict = {'index':cld_index,'distance':cld_img,'original class':cld_class,'new class':cld_new_class} #把除了0.jpg之外的图片的编号、距离、类别（每一百个为一个类，
    #如0-99为一类），是否为同一类（是为1，否为0）
    df = pd.DataFrame(test_dict)
    #display(df)
    df.sort_values(by="distance",axis=0,ascending=True,inplace=True) #按照distance进行升序排列,排序后distance小的就是系统以为是和样本同类的
    #display(df)
    #print(df["index"])

原dataframe

排序后

循环统计前99个里是真的同一类的图片有多少（根据new_class=1判断），据此得出每循环一次（相当于每读入一张图片）的recall和precision，并把这两个数据写入recall[ ]和precision[ ]两个数组中。

 flag = 0 #定义在new class中遇到的1的个数
    j = 0 #循环到第几个
    precision = []
    recall = []
    
    
    for c in df['new class']:
        if j== 99:
            break
        if c == 1:
            flag+=1 #当new class为1时flag+1；统计循环j次时的flag
            #print("flag",flag)
        j+=1
        pre = flag/j #precision = 真的预测为真/（真的预测为真+假的预测为真）
        rec = flag/99 #recall = 真的预测为真/（真的预测为真+真的预测为假）
        precision.append(pre) #把获得的pre加入到数组precision中
        recall.append(rec)

画线，以recall数组为横坐标，precision为纵坐标画线。

#print("precision",precision)
    #print("recall",recall)
    drawline(recall,precision)

完整代码

#!/usr/bin/env python
# coding: utf-8

# In[1]:


import cv2
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from scipy.fftpack import dct


# In[2]:



def cvshow(name,img):
    cv2.imshow(name,img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()


# In[3]:


def CLD(img):
    #图像分割8*8
    n=8;

    (height,width,channel)=img.shape
    #print(height,width,channel) #256,383,3

    block_h = np.fix(height/n); #每块的高度
    block_w=np.fix(width/n); #每块的宽度
    #print(block_h,block_w) #32.0 48.0

    im_n=np.zeros((n,n,channel))

    for i in range(n):
        for j in range(n):
            for k in range(channel):
            #确定块
                a = block_h * i+1;
                b = block_h * (i+1); #height: b-a
                c = block_w * j+1;
                d = block_w * (j+1); #width: d-c
            #循环到右下角的块时
                if i == (n-1):
                    b = height-1;
                if j == (n-1):
                    d = width-1;
            #每块代表色的选择，实现“mpeg-7标准推荐使用区域块的平均像素颜色值作为代表颜色”
                #print(img[int(a)][int(d)][int(k)])

                arr=[img[int(a)][int(c)][k],img[int(a)][int(d)][k],img[int(b)][int(c)][k],img[int(b)][int(d)][k]]
                
                pix = np.mean(np.mean(arr));
                #print(pix)
                im_n[i][j][k]=pix
                #print(im_n)

    # 将rgb转换色彩空间为YCbCr
    mat = np.array(
       [[ 65.481, 128.553, 24.966 ],
        [-37.797, -74.203, 112.0  ],
        [  112.0, -93.786, -18.214]])
    offset = np.array([16, 128, 128])


    im_YCbCr = rgb2ycbcr(mat,offset,im_n)
    
    #DCT变换
    im_DCT = np.zeros((n,n,channel)); 
    #因为dct操作只能对二维矩阵进行操作，所以这里要把r,g,b分别拎出来处理
    im_DCT[:,:,0] = dct(im_YCbCr[:,:,0])
    im_DCT[:,:,1] = dct(im_YCbCr[:,:,1])
    im_DCT[:,:,2] = dct(im_YCbCr[:,:,2])
    #print(im_DCT)

    #按照之字形扫描im_DCT存储到descript中
    zig = [[0   ,  1  ,   5  ,   6  ,  14  ,  15  ,  27  ,  28],
           [2   ,  4  ,   7  ,  13  ,  16 ,   26  ,  29  ,  42],
           [3   ,  8  ,  12 ,   17  ,  25 ,   30  ,  41  ,  43],
           [9   , 11  ,  18  ,  24  ,  31 ,   40  ,  44  ,  53],
           [10   , 19  ,  23 ,   32  ,  39 ,   45  ,  52  ,  54],
           [20   , 22  ,  33  ,  38  ,  46 ,   51  ,  55  ,  60],
           [21   , 34  ,  37  ,  47  ,  50 ,   56  ,  59  ,  61],
           [35   , 36  ,  48  ,  49  ,  57 ,   58  ,  62  ,  63 ]]
    descript = np.zeros((n*n,channel));
    for i in range (n):
        for j in range (n):
            descript[zig[i][j],:] = im_DCT[i,j,:];
            #print(descript);

    result = descript;
    return result;


# In[4]:


#颜色空间转换的函数
def rgb2ycbcr(mat,offset,rgb_img):
    n=8
    channel=3
    ycbcr_img = np.zeros((n,n,channel))
    for x in range(n):
        for y in range(n):
            ycbcr_img[x, y, :] = np.round(np.dot(mat, rgb_img[x, y, :] * 1.0 / 255) + offset)
    return ycbcr_img


# In[5]:


def distance_CLD(img1,img2):
    return np.sqrt(np.sum(np.square(img1 - img2))) #欧式距离


# In[6]:


def drawline(recall,precision):
    plt.plot(recall,precision)
    plt.xlabel("recall")
    plt.ylabel("precision")
    plt.title('PR Graph of CLD')
    plt.show()


# In[7]:


if __name__ == "__main__":
    #img2 = cv2.imread('./Corel-1K/image.orig/3.jpg')
    img_index = 0; #设置样本img的编号
    img=cv2.imread('./Corel-1K/image.orig/'+str(img_index)+'.jpg') #这里就是读取0.jpg
    img_class = int((img_index)/100)+1 #算出样本img的类别，0-99为类1,100-199为类2,，以此类推
    print("class",img_class)
    
    CLD_img1 = CLD(img) #对img进行CLD处理
    cld_index=[] 
    cld_img=[]
    cld_class = []
    cld_new_class = [] 
    for i in range(0,1000):
        if i == img_index: #如果读到样本img的编号就跳过
            print("skip>>>>>>>"+str(i))
            continue;
        img2 = cv2.imread('.\\Corel-1K\\image.orig\\%d.jpg' %(i))
        img2 = cv2.resize(img2,(256,383))
        #print(img2.shape)
        #print(i)
        img2_class = int((i)/100)+1
        #print(img2_class)
        if img_class == img2_class: #判断循环取出的图片是否和样本为同一个类别
            new_class = 1
        else:
            new_class = 0
        CLD_img2 = CLD(img2);
        distances = distance_CLD(CLD_img1,CLD_img2);
        cld_index.append(i)
        cld_img.append(distances)
        cld_class.append(img2_class)
        cld_new_class.append(new_class)
        
    #print(cld_img)
    test_dict = {'index':cld_index,'distance':cld_img,'original class':cld_class,'new class':cld_new_class} #把除了0.jpg之外的图片的编号、距离、类别（每一百个为一个类，
    #如0-99为一类），是否为同一类（是为1，否为0）
    df = pd.DataFrame(test_dict)
    #display(df)
    df.sort_values(by="distance",axis=0,ascending=True,inplace=True) #按照distance进行升序排列,排序后distance小的就是系统以为是和样本同类的
    #display(df)
    #print(df["index"])
    
    flag = 0 #定义在new class中遇到的1的个数
    j = 0 #循环到第几个
    precision = []
    recall = []
    
    
    for c in df['new class']:
        if j== 99:
            break
        if c == 1:
            flag+=1 #当new class为1时flag+1；统计循环j次时的flag
            #print("flag",flag)
        j+=1
        pre = flag/j #precision = 真的预测为真/（真的预测为真+假的预测为真）
        rec = flag/99 #recall = 真的预测为真/（真的预测为真+真的预测为假）
        precision.append(pre) #把获得的pre加入到数组precision中
        recall.append(rec)
        
    #print("precision",precision)
    #print("recall",recall)
    drawline(recall,precision)


# In[ ]:

运行结果

HOG

参考教程：https://blog.csdn.net/abc13526222160/article/details/102574369?utm_medium=distribute.pc_relevant.none-task-blog-title-6&spm=1001.2101.3001.4242
先来讲讲HOG的过程：

图像预处理
对图像的尺寸进行调整，用伽马校正调整曝光使图像更接近于人眼的状态。
计算梯度

水平梯度为10，垂直梯度为32。
梯度幅度为

梯度方向为

梯度方向为0-180度。
计算梯度直方图
block归一化
降低光照的影响
得到HOG特征向量

代码解释

用的是skimage.feature.hog的方法来得到HOG特征向量

def HOG(img):
    img_gray = rgb2gray(img)/255.0 #转化成灰度图像并进行归一化
    fd = hog(img_gray, orientations=10, pixels_per_cell=[8,8], cells_per_block=[8,8], visualize=False, 
             transform_sqrt=True,block_norm='L2-Hys')
    #print(fd)
    return fd

其他步骤和CLD差不多

完整代码

#!/usr/bin/env python
# coding: utf-8

# In[1]:


import cv2
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from skimage.feature import hog


# In[2]:


def rgb2gray(im): #灰度化
    gray = im[:, :, 0]*0.2989+im[:, :, 1]*0.5870+im[:, :, 2]*0.1140
    return gray


# In[3]:


def HOG(img):
    img_gray = rgb2gray(img)/255.0 #转化成灰度图像并进行归一化
    fd = hog(img_gray, orientations=10, pixels_per_cell=[8,8], cells_per_block=[8,8], visualize=False, 
             transform_sqrt=True,block_norm='L2-Hys')
    #print(fd)
    return fd
    


# In[4]:


def distance_HOG(img1,img2):
    return np.sqrt(np.sum(np.square(img1 - img2))) #欧式距离


# In[5]:


def drawline(recall,precision):
    plt.plot(recall,precision)
    plt.xlabel("recall")
    plt.ylabel("precision")
    plt.title('PR Graph of CLD')
    plt.show()


# In[7]:


if __name__ == "__main__":
    #img2 = cv2.imread('./Corel-1K/image.orig/3.jpg')
    img_index = 0; #设置样本img的编号
    img=cv2.imread('./Corel-1K/image.orig/'+str(img_index)+'.jpg') #这里就是读取0.jpg
    img = cv2.resize(img,(200,200))
    img_class = int((img_index)/100)+1 #算出样本img的类别，0-99为类1,100-199为类2,，以此类推
    print("class",img_class)
    print('img',img.shape)
    
    HOG_img1 = HOG(img) #对img进行HOG处理
    print("HOG_img1 size",HOG_img1.shape)
    hog_index=[] 
    hog_img=[]
    hog_class = []
    hog_new_class = [] 
    
    for i in range(0,1000):
        if i == img_index: #如果读到样本img的编号就跳过
            print("skip>>>>>>>"+str(i))
            continue;
        img2 = cv2.imread('.\\Corel-1K\\image.orig\\%d.jpg' %(i))
        img2 = cv2.resize(img2,(200,200))
        #print(img2.shape)
        #print(i)
        img2_class = int((i)/100)+1
        #print(img2_class)
        if img_class == img2_class: #判断循环取出的图片是否和样本为同一个类别
            new_class = 1
        else:
            new_class = 0
        HOG_img2 = HOG(img2);
        distances = distance_HOG(HOG_img1,HOG_img2);
        hog_index.append(i)
        hog_img.append(distances)
        hog_class.append(img2_class)
        hog_new_class.append(new_class)
        
    #print(cld_img)
    test_dict = {'index':hog_index,'distance':hog_img,'original class':hog_class,'new class':hog_new_class} #把除了0.jpg之外的图片的编号、距离、类别（每一百个为一个类，
    #如0-99为一类），是否为同一类（是为1，否为0）
    df = pd.DataFrame(test_dict)
    #display(df)
    df.sort_values(by="distance",axis=0,ascending=True,inplace=True) #按照distance进行升序排列,排序后distance小的就是系统以为是和样本同类的
    #display(df)
    #print(df["index"])
    
    flag = 0 #定义在new class中遇到的1的个数
    j = 0 #循环到第几个
    precision = []
    recall = []
    
    
    for c in df['new class']:
        if j== 99:
            break
        if c == 1:
            flag+=1 #当new class为1时flag+1；统计循环j次时的flag
            #print("flag",flag)
        j+=1
        pre = flag/j #precision = 真的预测为真/（真的预测为真+假的预测为真）
        rec = flag/99 #recall = 真的预测为真/（真的预测为真+真的预测为假）
        precision.append(pre) #把获得的pre加入到数组precision中
        recall.append(rec)
        
    #print("precision",precision)
    #print("recall",recall)
    drawline(recall,precision)

阳老师真的好耐心哦，一步一步指导我，尽管我问很傻的问题都会回答，太感人了555.

昨天晚上和弟弟还有室友吃小火锅，太舒服了，然后喝了rio（乳酸菌的还不错），uno局老放垃圾话，导致自己老输，脸上贴的条条可以绕地球一圈，气鼠（虽然但是放垃圾话真的好爽）。然后玩的忘记时间了，忘记背单词（马上组队打卡就要结束了来这出，以后每天都定好闹钟背单词！），也忘记买鞋555555555555555，下次记住了大促前不能组局玩耍555.

11.25更新
贴一下老师的代码

#!/usr/bin/env python
# coding: utf-8

# # 1.图像检索实验

# In[1]:


import cv2  #opencv 读取进来为BGR格式
import matplotlib.pyplot as plt
import numpy as np
import os

#一个魔法指令，不需要采用plt.show()显示图像
get_ipython().run_line_magic('matplotlib', 'inline')


# In[2]:


def cv_show(name,img):
    cv2.imshow(name,img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()


# In[3]:


# 把目标图放在64x128的灰色图片中间，方便计算描述子
def get_hog_descriptor(image):
    hog = cv2.HOGDescriptor()
    h, w = image.shape[:2]
    rate = 64 / w
    image = cv2.resize(image, (64, np.int(rate*h)))
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    bg = np.zeros((128, 64), dtype=np.uint8)
    bg[:,:] = 127
    h, w = gray.shape
    dy = (128 - h) // 2
    bg[dy:h+dy,:] = gray
    descriptors = hog.compute(bg, winStride=(8, 8), padding=(0, 0))
    return descriptors


# In[4]:


# 计算图像的color layout descriptor(CLD)
rows = 8
cols = 8
def  get_CLD_descriptor(img):
        averages = np.zeros((rows,cols,3))
        imgH, imgW, _ = img.shape
        for row in range(rows):
            for col in range(cols):
                slice = img[int(imgH/rows * row): int(imgH/rows * (row+1)), int(imgW/cols*col) : int(imgW/cols*(col+1))]
                average_color_per_row = np.mean(slice, axis=0)
                average_color = np.mean(average_color_per_row, axis=0)
                average_color = np.uint8(average_color)
                averages[row][col][0] = average_color[0]
                averages[row][col][1] = average_color[1]
                averages[row][col][2] = average_color[2]
        icon = cv2.cvtColor(np.array(averages, dtype=np.uint8), cv2.COLOR_BGR2YCR_CB)
        y, cr, cb = cv2.split(icon)
        dct_y = cv2.dct(np.float32(y))
        dct_cb = cv2.dct(np.float32(cb))
        dct_cr = cv2.dct(np.float32(cr))
        dct_y_zigzag = []
        dct_cb_zigzag = []
        dct_cr_zigzag = []
        flip = True
        flipped_dct_y = np.fliplr(dct_y)
        flipped_dct_cb = np.fliplr(dct_cb)
        flipped_dct_cr = np.fliplr(dct_cr)
        for i in range(rows + cols -1):
            k_diag = rows - 1 - i
            diag_y = np.diag(flipped_dct_y, k=k_diag)
            diag_cb = np.diag(flipped_dct_cb, k=k_diag)
            diag_cr = np.diag(flipped_dct_cr, k=k_diag)
            if flip:
                diag_y = diag_y[::-1]
                diag_cb = diag_cb[::-1]
                diag_cr = diag_cr[::-1]
            dct_y_zigzag.append(diag_y)
            dct_cb_zigzag.append(diag_cb)
            dct_cr_zigzag.append(diag_cr)
            flip = not flip
        return np.concatenate([np.concatenate(dct_y_zigzag), np.concatenate(dct_cb_zigzag), np.concatenate(dct_cr_zigzag)])


# In[5]:


# 测试图像
img_color = cv2.imread('images/lena.jpg')

hog_des = get_hog_descriptor(img_color)
print(hog_des.shape)

CLD_des = get_CLD_descriptor(img_color)
print(CLD_des.shape)
#print(CLD_des)


# In[6]:


allpath=[]
allname=[]

#获取文件列表
def get_allfile(path):
    allfilelist=os.listdir(path)
    # 遍历该文件夹下的所有目录或者文件
    for file in allfilelist:
        filepath=os.path.join(path,file)
        # 如果是文件夹，递归调用函数
        if os.path.isdir(filepath):
            getallfile(filepath)
        # 如果不是文件夹，保存文件路径及文件名
        elif os.path.isfile(filepath):
            allpath.append(filepath)
            allname.append(file)
            
    return allpath, allname


# In[7]:


def get_file(root_path,all_files=[]):
   
    # 递归函数，遍历该文档目录和子目录下的所有文件，获取其path
    files = os.listdir(root_path)
    for file in files:
        if not os.path.isdir(root_path + '/' + file):   # not a dir
            all_files.append(root_path + '/' + file)
        else:  # is a dir
            get_file((root_path+'/'+file),all_files)
    return all_files


# In[8]:


img_path = "data/Corel-1K"
#allpath, allname = get_allfile(img_path) #获取文件目录 + 文件名

#print(allpath[0])
#print(allname[0])

allpath = get_file(img_path)

# list_name = allpath[0].split('/');
print(len(allpath))
print(allpath[0])


# 遍历所有文件
hogs = []
labels = []
for file in allpath:   
    print(allpath.index(file)+1)
    img = cv2.imread(file)
    hog_feat = get_hog_descriptor(img)
    
    list_name = file.split('/')
    class_label = list_name[2]
    
    hogs.append(hog_feat)
    labels.append(class_label)   
    
allpath.clear()   #情况列表


# In[9]:


dist = np.zeros((1000,1000))
for i in np.arange(1000):
                hog1 = hogs[i]
                #print(i)
                for j in np.arange(1000):
                    hog2 = hogs[j]
                    dist[i][j] = np.sqrt(np.sum(np.square(hog1 - hog2 )))
                    #dist[i][j]= np.linalg.norm(hog1 - hog2)
                    #np.delete(hog1)
                    #np.delete(hog2)


# In[10]:


print(dist[0][0])
#print(dist[0])
index = dist.argsort()   #按照二维数组从小到大进行排序，返回数组的索引

index_count = np.zeros((1000,999))
for i in range(1000):
    for j in range(1,1000):
        if labels[index[i][0]] == labels[index[i][j]]:
            index_count[i][j-1] = 1
        else:
            index_count[i][j-1] = 0
                
# 画出检索结果的Precision与Recall曲线
#Precision = np.zeros((1000,10))
#Recall = np.zeros((1000,10))
#for i in range(1000):
#    for j in range(1,11):
#        Precision[i][j-1]= np.sum(index_count[i][:j*10])/(j*10)
#        Recall[i][j-1] = np.sum(index_count[i][:j*10])/100

#P = Precision.mean(axis = 0)  #二维数组按照列求平均值
#R = Recall.mean(axis =0)

#plt.figure(1)
#plt.plot(P, R)
#plt.xlim([0,1])
#plt.ylim([0,1])
#plt.show()
#print(np.max(np.where(index_count[0]==1)))


# In[11]:


# 画出检索结果的Precision与Recall曲线

Precision = np.zeros((1000,99))
Recall = np.zeros((1000,99))
for i in range(1000):
    list_num = np.where(index_count[0]==1)
    for j in range(99):
        Precision[i][j]= np.sum(index_count[i][:list_num[0][j]])/list_num[0][j]
        Recall[i][j]= np.sum(index_count[i][:list_num[0][j]])/99
        
P = Precision.mean(axis = 0)  #二维数组按照列求平均值 
R = Recall.mean(axis =0)

plt.figure(1)
plt.plot(R, P)
plt.xlabel('Recall')
plt.ylabel('Precision')
#plt.xlim([0,1])
#plt.ylim([0,1])
plt.show()


# ### 基于Color Layout Descriptor(CLD)特征的图像检索

# In[12]:


img_path = 'data/Corel-1K'

allpath = get_file(img_path)

# 遍历所有文件
CLDs = []
labels = []
for file in allpath:   
    print(allpath.index(file)+1)
    img = cv2.imread(file)
    CLD_feat = get_CLD_descriptor(img)
    
    list_name = file.split('/')
    class_label = list_name[2]
    
    CLDs.append(CLD_feat)
    labels.append(class_label)   
    
allpath.clear()   #情况列表


# In[13]:


dist2 = np.zeros((1000,1000))
for i in np.arange(1000):
                CLD1 = CLDs[i]
                for j in np.arange(1000):
                    CLD2 = CLDs[j]
                    dist2[i][j] = np.sqrt(np.sum(np.square(CLD1 - CLD2 )))


# In[14]:


index = dist2.argsort()   #按照二维数组从小到大进行排序，返回数组的索引

index_count = np.zeros((1000,999))
for i in range(1000):
    for j in range(1,1000):
        if labels[index[i][0]] == labels[index[i][j]]:
            index_count[i][j-1] = 1
        else:
            index_count[i][j-1] = 0


# In[15]:


# 画出检索结果的Precision与Recall曲线
Precision = np.zeros((1000,99))
Recall = np.zeros((1000,99))
for i in range(1000):
    list_num = np.where(index_count[0]==1)
    for j in range(99):
        Precision[i][j]= np.sum(index_count[i][:list_num[0][j]])/list_num[0][j]
        Recall[i][j]= np.sum(index_count[i][:list_num[0][j]])/99
        
P = Precision.mean(axis = 0)  #二维数组按照列求平均值 
R = Recall.mean(axis =0)

plt.figure(1)
plt.plot(R, P)
plt.xlabel('Recall')
plt.ylabel('Precision')
plt.show()

霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
OpenCV图片操作100例：从入门到精通指南（1）总有刁民想爱朕ha opencv 计算机视觉人工智能
OpenCV图片操作100例：从入门到精通指南本文整理了100个OpenCV实用技巧，涵盖图像处理各个领域，助你轻松掌握计算机视觉核心技能！一、入门必备：基础操作1.图像读写与显示importcv2#读取图像（BGR格式）img=cv2.imread('image.jpg')#显示图像cv2.imshow('示例图片',img)cv2.waitKey(0)#按任意键退出cv2.destroyAll
OpenCV图片操作100例：从入门到精通指南（3）总有刁民想爱朕ha opencv 人工智能计算机视觉
高效学习路径：1️⃣分阶段学习：入门：1-20例（基础操作）进阶：21-50例（图像处理）高级：51-100例（计算机视觉）2️⃣项目驱动学习：证件照背景替换（1-15例）停车场车位检测（30-45例）视频运动追踪（70-85例）3️⃣性能优化技巧：#使用UMat加速图像处理umat_img=cv2.UMat(img)processed=cv2.GaussianBlur(umat_img,(5,5
OpenCV入门到精通：AI视觉处理的完整指南 AI云原生与云计算技术学院人工智能 opencv 计算机视觉 ai
OpenCV入门到精通：AI视觉处理的完整指南关键词：OpenCV、计算机视觉、图像预处理、目标检测、AI视觉应用摘要：本文是一份面向AI视觉爱好者的OpenCV完整学习指南。从OpenCV的核心概念讲起，结合生活案例、代码示例和项目实战，逐步拆解图像读取/显示、灰度化、边缘检测、目标检测等关键技术。无论你是想入门计算机视觉的新手，还是希望用OpenCV解决实际问题的开发者，都能通过本文掌握从理论
CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
OpenCV入门到精通：从基础到实战的全面指南
摘要：本文旨在为初学者和有一定经验的开发者提供OpenCV从入门到精通的全面指南。文章首先介绍了OpenCV的基本概念和安装方法，然后深入讲解了图像处理基础、特征检测与匹配、视频处理与分析等核心内容，最后通过实战案例展示了OpenCV在计算机视觉任务中的应用。关键词：OpenCV；图像处理；特征检测；视频分析；实战案例引言OpenCV（OpenSourceComputerVisionLibrary
【人工智能面经第五期：模型训练与优化核心面试深度问答】码上有前 Pytorch Python 深度学习人工智能面试职场和发展
作者：“码上有前”文章简介：人工智能面经欢迎小伙伴们点赞、收藏⭐、留言模型训练与优化核心面试深度问答摘要围绕模型训练与优化的训练技巧（正则化、迁移学习）和数据工程（数据增强、标注质量）展开，通过20个关键问题，解析正则化协同策略、迁移学习适配场景、数据增强实践等核心要点，助力读者掌握人工智能与计算机视觉岗位面试中模型训练优化的知识体系，明晰技术原理与实际应用的关联。目录训练技巧-正则化策略相关问题
机器学习手写字体识别系统：技术演进与应用实践万能小贤哥机器学习人工智能
引言：手写字体识别的技术定位与价值在信息处理领域，人工录入手写文本的低效性与机器识别的高效性形成鲜明对比。例如，医疗处方的人工处理需约5分钟/张，而采用手写字体识别技术可将时间缩短至10秒/张，显著提升处理效率。作为计算机视觉与人工智能的重要分支，手写字体识别技术通过将手写文本转换为可编辑电子文本，不仅大幅减少人工输入时间和错误，降低人工处理成本，还能在大量数据处理时保持高于人工录入的准确性，是人
【论文阅读笔记】TimesURL: Self-supervised Contrastive Learning for Universal Time Series 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
TimesURL:Self-supervisedContrastiveLearningforUniversalTimeSeriesRepresentationLearning摘要学习适用于多种下游任务的通用时间序列表示，并指出这在实际应用中具有挑战性但也是有价值的。最近，研究人员尝试借鉴自监督对比学习（SSCL）在计算机视觉（CV）和自然语言处理（NLP）中的成功经验，以解决时间序列表示的问题。
异物检测的计算机视觉算法技术路线思绪漂移计算机视觉算法人工智能
异物检测的计算机视觉算法技术路线在现代智能监测系统中，异物检测有着其必要性和运维重要性，通过计算机视觉算法，可以实时识别各种异常物体，为设备安全运行提供有力保障。本文将介绍异物检测的主要技术路线。一、分类识别适应场景分类识别技术主要适用于已知目标类别的异物检测场景。在运维环境中，这类场景包括：固定区域内的障碍物监测（如轨道区域的石块、工具、动物等）关键部件的异物附着检测（如固定装置上的杂物）安全通
【AI大模型】深入解析预训练：大模型时代的核心引擎我爱一条柴ya 学习AI记录深度学习人工智能 ai python AI编程算法
预训练已成为现代人工智能，尤其是自然语言处理和计算机视觉领域的基石技术。它彻底改变了模型开发范式，催生了BERT、GPT等革命性模型。本文将系统阐述预训练的核心概念、原理、方法、应用及挑战。一、预训练的本质：为何需要它？核心问题：数据标注的瓶颈监督学习依赖海量高质量标注数据，获取成本极高（时间、金钱、专业知识）。对于复杂任务（如理解语义、生成文本），标注难度呈指数级上升。标注数据稀缺导致模型泛化能
OpenCvSharp 实现环形文字识别OCR实例（C#） XisVisual_Basic ocr c#计算机视觉 C#
近年来，随着计算机视觉和图像处理的不断发展，光学字符识别（OCR）技术也变得愈发成熟。OCR技术可以将图像中的文字转换为可编辑和可搜索的文本，为人们带来了极大的便利。在本篇文章中，我们将介绍如何使用OpenCvSharp库来实现环形文字的识别。首先，在使用OpenCvSharp之前，我们需要确保已经在项目中引用了该库，并添加相应的命名空间。usingOpenCvSharp;接下来，我们需要准备一张
Python|OpenCV-实现识别弧形文字(17) 写python的鑫哥 OpenCV入门与进阶 python opencv 人工智能计算机视觉弧形文字环形文字识别
前言本文是该专栏的第19篇，后面将持续分享OpenCV计算机视觉的干货知识，记得关注。我们知道，OCR可以识别文字方面的需求，但是如果遇到那些目标文字是“弧形文字”，需要怎么去识别呢？遇到想要识别“弧形文字”的需求，这个时候你可以借助于Opencv+OCR技术来实现。而本文，笔者将针对上述问题需求，利用OpenCV结合OCR来实现“弧形文字”的识别。废话不多说，具体的细节部分以及详细的解决方案，跟
【小白入门必看】一文读懂深度学习计算机视觉技术及学习路线
一、什么是计算机视觉？计算机视觉，其实就是教机器怎么像我们人一样，用摄像头看看周围的世界，然后理解它。比如说，它能认出这是个苹果，或者那边有辆车。除此之外，还能把拍到的照片或者视频转换成有用的信息，帮我们做决定。整个过程就是为了让机器能看懂图像，然后根据这些图像来做出聪明的选择。二、计算机视觉实现起来难吗？人类依赖视觉，找辆汽车轻而易举，毕竟汽车那么大，一眼就能看出来，所以常误以为计算机视觉简单，
计算机视觉：Transformer的轻量化与加速策略 xcLeigh 计算机视觉CV 计算机视觉 transformer 人工智能 AI 策略
计算机视觉：Transformer的轻量化与加速策略一、前言二、Transformer基础概念回顾2.1Transformer架构概述2.2自注意力机制原理三、Transformer轻量化策略3.1模型结构优化3.1.1减少层数和头数3.1.2优化Patch大小3.2参数共享与剪枝3.2.1参数共享3.2.2剪枝3.3知识蒸馏四、Transformer加速策略4.1模型量化4.2.2TPU加速4.
【机器学习】解密计算机视觉：CNN、目标检测与图像识别核心技术（第25天）吴师兄大模型 0基础实现机器学习入门到精通机器学习计算机视觉 cnn 人工智能目标检测图像识别 pytorch
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
人体坐姿检测系统开发实战（YOLOv8+PyTorch+可视化） Loving_enjoy 计算机学科论文创新点人工智能深度学习迁移学习经验分享
本文将手把手教你构建智能坐姿检测系统，结合目标检测与姿态估计技术，实现不良坐姿的实时识别与预警###一、项目背景与价值现代人每天平均坐姿时间超过8小时，不良坐姿会导致：-脊椎压力增加300%-颈椎病发病率提升45%-腰椎间盘突出风险增加60%本系统通过计算机视觉技术实时监测坐姿状态，对驼背、侧倾、前倾等不良姿势进行智能识别和预警。相较于传统传感器方案，我们的视觉方案具有非接触、低成本、易部署的优势
魔都AI医疗哪家强？全景揭秘科技创新与未来钱景！
引言上海作为中国科技创新的先锋城市，正在AI医疗领域崭露头角。根据2024年12月的数据，上海拥有34家专注于AI药物研发的公司，占全国预临床研究的60%和临床试验的47%。这些公司利用深度学习、大语言模型（LLM）和计算机视觉等技术，革新药物发现、医疗影像分析和数据治理，推动医疗行业的智能化转型。从全球首个人工智能医院“AgentHospital”到AI驱动的诊断系统，上海的AI医疗生态正在重塑
语义分割模型的轻量化与准确率提升研究 pk_xz123456 仿真模型深度学习算法 transformer 深度学习人工智能算法数据结构
语义分割模型的轻量化与准确率提升研究1.引言语义分割是计算机视觉领域的核心任务之一，它要求模型为图像中的每个像素分配一个类别标签。随着深度学习的发展，语义分割模型在多个领域得到了广泛应用，如自动驾驶、医学影像分析、遥感图像解译等。然而，现有的语义分割模型往往面临两个主要挑战：模型复杂度高导致难以部署在资源受限的设备上，以及准确率仍有提升空间以满足实际应用需求。本文将从模型轻量化和准确率提升两个角度
Python深度学习实践：建立端到端的自动驾驶系统 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：建立端到端的自动驾驶系统1.背景介绍自动驾驶系统是当今科技领域最具挑战性和前景的应用之一。它融合了计算机视觉、深度学习、规划与控制等多个领域的先进技术,旨在实现车辆的自主感知、决策和操控。随着人工智能技术的不断发展,越来越多的公司和研究机构投入了大量资源来开发自动驾驶系统。Python作为一种高效、易学且开源的编程语言,在这一领域扮演着重要角色。本文将探讨如何利用Pyth
从0开始学习计算机视觉--Day08--卷积神经网络
之前我们提到，神经网络是通过全连接层对输入做降维处理，将输入的向量通过矩阵和激活函数进行降维，在神经元上输出激活值。而卷积神经网络中，用卷积层代替了全连接层。不同的是，这里的输入不再需要降维，而是可以保留输入的空间结构，例如输入的是32×32×3的图片，在全连接层中是3072×1的向量，而卷积层里则保持不变。这里的改变的地方是对于同样的WX的函数形式，这里是把5×5×3的权重矩阵（也叫卷积核）向量
Python打卡：Day40
#先继续之前的代码importtorchimporttorch.nnasnnimporttorch.optimasoptimfromtorch.utils.dataimportDataLoader,Dataset#DataLoader是PyTorch中用于加载数据的工具fromtorchvisionimportdatasets,transforms#torchvision是一个用于计算机视觉的库，
BigQuery对象引用（ObjectRef）全面指南：一站式整合结构化与非结构化多模态数据分析
引言企业需要同时管理有组织表格中的结构化数据，以及日益增长的非结构化数据（如图片、音频和文档）。传统上，联合分析这些多样化数据类型非常复杂，通常需要使用不同的工具。非结构化媒体通常需要导出到专门的服务进行处理（如图片分析需计算机视觉服务，音频需语音转文本引擎），这会造成数据孤岛，阻碍全局分析视角的建立。以虚构的电商支持系统为例：结构化的工单信息存储在BigQuery表中，而相关的支持通话录音或损坏
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
OpenCV 图像操作：颜色识别、替换与水印添加
目录引言代码实现1.导入必要的库2.图像加法3.图像直接相加4.颜色加权加法5.HSV颜色空间转换概念作用6.查找颜色范围对应的像素点7.与运算-生成掩膜8.添加水印9.主函数总结引言在计算机视觉领域，OpenCV是一个强大的库，提供了丰富的图像操作功能。本文将详细介绍如何使用OpenCV进行图像加法、颜色加权加法、HSV颜色空间转换、颜色范围查找、与运算生成掩膜以及添加水印等操作，并给出相应的P
YOLO学习笔记｜从YOLOv5到YOLOv11：技术演进与核心改进北斗猿 YOLO学习从零到1 YOLO 目标检测算法 python 计算机视觉
从YOLOv5到YOLOv11：技术演进与核心改进深度解析一、YOLO系列发展概述YOLO（YouOnlyLookOnce）目标检测算法自2016年诞生以来，凭借其"单次检测"的独特理念和卓越的实时性能，持续引领着计算机视觉领域的技术革新。从JosephRedmon的初代YOLO到AlexeyBochkovskiy的YOLOv4，再到Ultralytics团队的YOLOv5及后续系列，这一算法家族
《卷积神经网络到Vision Transformer：计算机视觉的十年架构革命》 HeartException 人工智能学习
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站题目《卷积神经网络到VisionTransformer：计算机视觉的十年架构革命》展开深度解析，全文采用技术演进史+架构对比+产业影响的三段式结构，附关键数据与趋势预测：卷积神经网络到VisionTransformer：计算机视觉的十年架构革命副标题：从局部感知到全局建模，一场改变AI视觉基石的
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option

计算机视觉 实验四 分别使用颜色布局描述符(Color Layout Descriptor)与方向梯度直方图(HOG)实现图像检索，并且画出图像的PR曲线图

目录

数据集描述

颜色布局描述符

思路分析

代码解释

完整代码

运行结果

HOG

代码解释

完整代码

你可能感兴趣的:(计算机视觉,计算机视觉)

计算机视觉实验四分别使用颜色布局描述符(Color Layout Descriptor)与方向梯度直方图(HOG)实现图像检索，并且画出图像的PR曲线图