Python列表删除重复元素与图像相似度判断及删除实例代码

发现问题

项目需要，需要删除文件夹中的冗余图片。涉及图像文件名的操作，图像文件名存储在list中

python list删除元素有remove()和pop()，remove()对元素进行操作，pop()对索引进行操作，并会返回pop掉的值。一个只会从列表移除一个数

一.如果已经有了一个列表l，令h=l，对l操作时同时会影响h，貌似原因是内存共享的，正确的方法是h=l.copy()

二.测试时，发现一个问题，如下面代码和结果：

item=2时，并没有把2全部删掉，后面重复的3也没有删去。

**查阅一些资料后发现：list的遍历是基于下标的不是基于元素，你删掉一个元素后，列表就发生了变化，所有的元素都往前移动了一个位置，假设要删除重的2，一个列表中索引为4，对应的值为2，索引为5，对应的值为2，索引为6，对应的值为3，当前循环删掉索引4时对应的值2之后，索引4的值为2，索引5，值为3，下一次循环，本来要再删一个2，但此时索引为5对应的为3，就漏掉了一个2。

解决方案：

（1）倒序循环遍历：

（2）实际用的方法，判断到重复元素后，将那个item复制为0或‘0'，相当于用一个标识符占住重复元素的位置，循环时先判断是否为‘0'，最后通过

list = list(set(list))

list.remove('0')

即可

附图像去冗余算法，判断图像相似通过，感知哈希算法和三通道直方图，及图像尺寸

from img_similarity import runtwoImageSimilaryFun
import os
from PIL import Image
import shutil
import time
import numpy as np
 
def similar(path1, path2):
    img1 = Image.open(path1)
    img2 = Image.open(path2)
    w1 = img1.size[0] # 图片的宽
    h1 = img2.size[1]  # 图片的高
    w2 = img2.size[0] # 图片的宽
    h2 = img2.size[1]  # 图片的高
    w_err = abs(w1 - w2)/w1
    h_err = abs(h1 - h2)/h1
    if w_err > 0.1 or h_err >0.1:
        return 0
    else:
        phash, color_hist = runtwoImageSimilaryFun(path1, path2)
        if phash <=8 or color_hist >=0.9:
            return 1
        else:
            return 0
 
 
path = './crop_img'
result_imgdirs_path = './removed_repeat_img'
folderlist = os.listdir(path)
folderlist.sort()
for item in folderlist:
    folder_path = path + '/' + item
    new_folder_path = result_imgdirs_path + '/' + item
    os.makedirs(new_folder_path)
 
    imglist = os.listdir(folder_path)
    imglist.sort()
 
    time_start = time.time()
 
    for i,item1 in enumerate(imglist):
        if item1 == '0':
            continue
        path1 = folder_path + '/' + item1
        for j, item2 in enumerate(imglist[i + 1:]):
            if item2 == '0':
                continue
            path2 = folder_path + '/' + item2
            t = similar(path1, path2)
            if t:
                #将判断为相似的图片在trans_list中的名字置‘0'，代表不需要复制
                imglist[i+j+1] = '0'
 
    imglist = list(set(imglist))
    imglist.remove('0')
 
    time_end = time.time()
    time_c = time_end - time_start
    print('{} similarity judgement list time cost {}s'.format(item, time_c))
 
 
    time_start = time.time()
    #移动图片
    for item3 in imglist:
        ori_img_path = folder_path + '/' + item3
        new_img_path = new_folder_path + '/' + item3
        shutil.copy(ori_img_path, new_img_path)
 
    time_end = time.time()
    time_c = time_end - time_start # 运行所花时间
    print('{} move image time cost {}s'.format(item, time_c))

img_similarity.py

import cv2
import numpy as np
from PIL import Image
import requests
from io import BytesIO
import matplotlib
 
matplotlib.use('TkAgg')
import matplotlib.pyplot as plt
 
 
def aHash(img):
    # 均值哈希算法
    # 缩放为8*8
    img = cv2.resize(img, (8, 8))
    # 转换为灰度图
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    # s为像素和初值为0，hash_str为hash值初值为''
    s = 0
    hash_str = ''
    # 遍历累加求像素和
    for i in range(8):
        for j in range(8):
            s = s + gray[i, j]
    # 求平均灰度
    avg = s / 64
    # 灰度大于平均值为1相反为0生成图片的hash值
    for i in range(8):
        for j in range(8):
            if gray[i, j] > avg:
                hash_str = hash_str + '1'
            else:
                hash_str = hash_str + '0'
    return hash_str
 
 
def dHash(img):
    # 差值哈希算法
    # 缩放8*8
    img = cv2.resize(img, (9, 8))
    # 转换灰度图
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    hash_str = ''
    # 每行前一个像素大于后一个像素为1，相反为0，生成哈希
    for i in range(8):
        for j in range(8):
            if gray[i, j] > gray[i, j + 1]:
                hash_str = hash_str + '1'
            else:
                hash_str = hash_str + '0'
    return hash_str
 
 
def pHash(img):
    # 感知哈希算法
    # 缩放32*32
    img = cv2.resize(img, (32, 32))  # , interpolation=cv2.INTER_CUBIC
    # 转换为灰度图
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    # 将灰度图转为浮点型，再进行dct变换
    dct = cv2.dct(np.float32(gray))
    # opencv实现的掩码操作
    dct_roi = dct[0:8, 0:8]
 
    hash = []
    avreage = np.mean(dct_roi)
    for i in range(dct_roi.shape[0]):
        for j in range(dct_roi.shape[1]):
            if dct_roi[i, j] > avreage:
                hash.append(1)
            else:
                hash.append(0)
    return hash
 
 
def calculate(image1, image2):
    # 灰度直方图算法
    # 计算单通道的直方图的相似值
    hist1 = cv2.calcHist([image1], [0], None, [256], [0.0, 255.0])
    hist2 = cv2.calcHist([image2], [0], None, [256], [0.0, 255.0])
    # 计算直方图的重合度
    degree = 0
    for i in range(len(hist1)):
        if hist1[i] != hist2[i]:
            degree = degree + \
                     (1 - abs(hist1[i] - hist2[i]) / max(hist1[i], hist2[i]))
        else:
            degree = degree + 1
    degree = degree / len(hist1)
    return degree
 
 
def classify_hist_with_split(image1, image2, size=(256, 256)):
    # RGB每个通道的直方图相似度
    # 将图像resize后，分离为RGB三个通道，再计算每个通道的相似值
    image1 = cv2.resize(image1, size)
    image2 = cv2.resize(image2, size)
    sub_image1 = cv2.split(image1)
    sub_image2 = cv2.split(image2)
    sub_data = 0
    for im1, im2 in zip(sub_image1, sub_image2):
        sub_data += calculate(im1, im2)
    sub_data = sub_data / 3
    return sub_data
 
 
def cmpHash(hash1, hash2):
    # Hash值对比
    # 算法中1和0顺序组合起来的即是图片的指纹hash。顺序不固定，但是比较的时候必须是相同的顺序。
    # 对比两幅图的指纹，计算汉明距离，即两个64位的hash值有多少是不一样的，不同的位数越小，图片越相似
    # 汉明距离：一组二进制数据变成另一组数据所需要的步骤，可以衡量两图的差异，汉明距离越小，则相似度越高。汉明距离为0，即两张图片完全一样
    n = 0
    # hash长度不同则返回-1代表传参出错
    if len(hash1) != len(hash2):
        return -1
    # 遍历判断
    for i in range(len(hash1)):
        # 不相等则n计数+1，n最终为相似度
        if hash1[i] != hash2[i]:
            n = n + 1
    return n
 
 
def getImageByUrl(url):
    # 根据图片url 获取图片对象
    html = requests.get(url, verify=False)
    image = Image.open(BytesIO(html.content))
    return image
 
 
def PILImageToCV():
    # PIL Image转换成OpenCV格式
    path = "/Users/waldenz/Documents/Work/doc/TestImages/t3.png"
    img = Image.open(path)
    plt.subplot(121)
    plt.imshow(img)
    print(isinstance(img, np.ndarray))
    img = cv2.cvtColor(np.asarray(img), cv2.COLOR_RGB2BGR)
    print(isinstance(img, np.ndarray))
    plt.subplot(122)
    plt.imshow(img)
    plt.show()
 
 
def CVImageToPIL():
    # OpenCV图片转换为PIL image
    path = "/Users/waldenz/Documents/Work/doc/TestImages/t3.png"
    img = cv2.imread(path)
    # cv2.imshow("OpenCV",img)
    plt.subplot(121)
    plt.imshow(img)
 
    img2 = Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
    plt.subplot(122)
    plt.imshow(img2)
    plt.show()
 
 
def bytes_to_cvimage(filebytes):
    # 图片字节流转换为cv image
    image = Image.open(filebytes)
    img = cv2.cvtColor(np.asarray(image), cv2.COLOR_RGB2BGR)
    return img
 
 
def runAllImageSimilaryFun(para1, para2):
    # 均值、差值、感知哈希算法三种算法值越小，则越相似,相同图片值为0
    # 三直方图算法和单通道的直方图 0-1之间，值越大，越相似。 相同图片为1
    # t1,t2   14;19;10;  0.70;0.75
    # t1,t3   39 33 18   0.58 0.49
    # s1,s2  7 23 11     0.83 0.86  挺相似的图片
    # c1,c2  11 29 17    0.30 0.31
 
    if para1.startswith("http"):
        # 根据链接下载图片，并转换为opencv格式
        img1 = getImageByUrl(para1)
        img1 = cv2.cvtColor(np.asarray(img1), cv2.COLOR_RGB2BGR)
 
        img2 = getImageByUrl(para2)
        img2 = cv2.cvtColor(np.asarray(img2), cv2.COLOR_RGB2BGR)
    else:
        # 通过imread方法直接读取物理路径
        img1 = cv2.imread(para1)
        img2 = cv2.imread(para2)
 
    hash1 = aHash(img1)
    hash2 = aHash(img2)
    n1 = cmpHash(hash1, hash2)
    print('均值哈希算法相似度aHash：', n1)
 
    hash1 = dHash(img1)
    hash2 = dHash(img2)
    n2 = cmpHash(hash1, hash2)
    print('差值哈希算法相似度dHash：', n2)
 
    hash1 = pHash(img1)
    hash2 = pHash(img2)
    n3 = cmpHash(hash1, hash2)
    print('感知哈希算法相似度pHash：', n3)
 
    n4 = classify_hist_with_split(img1, img2)
    print('三直方图算法相似度：', n4)
 
    n5 = calculate(img1, img2)
    print("单通道的直方图", n5)
    print("%d %d %d %.2f %.2f " % (n1, n2, n3, round(n4[0], 2), n5[0]))
    print("%.2f %.2f %.2f %.2f %.2f " % (1 - float(n1 / 64), 1 -
                                         float(n2 / 64), 1 - float(n3 / 64), round(n4[0], 2), n5[0]))
 
    plt.subplot(121)
    plt.imshow(Image.fromarray(cv2.cvtColor(img1, cv2.COLOR_BGR2RGB)))
    plt.subplot(122)
    plt.imshow(Image.fromarray(cv2.cvtColor(img2, cv2.COLOR_BGR2RGB)))
    plt.show()
 
 
def runtwoImageSimilaryFun(para1, para2):
    # 均值、差值、感知哈希算法三种算法值越小，则越相似,相同图片值为0
    # 三直方图算法和单通道的直方图 0-1之间，值越大，越相似。 相同图片为1
    # t1,t2   14;19;10;  0.70;0.75
    # t1,t3   39 33 18   0.58 0.49
    # s1,s2  7 23 11     0.83 0.86  挺相似的图片
    # c1,c2  11 29 17    0.30 0.31
 
    if para1.startswith("http"):
        # 根据链接下载图片，并转换为opencv格式
        img1 = getImageByUrl(para1)
        img1 = cv2.cvtColor(np.asarray(img1), cv2.COLOR_RGB2BGR)
 
        img2 = getImageByUrl(para2)
        img2 = cv2.cvtColor(np.asarray(img2), cv2.COLOR_RGB2BGR)
    else:
        # 通过imread方法直接读取物理路径
        img1 = cv2.imread(para1)
        img2 = cv2.imread(para2)
 
 
    hash1 = pHash(img1)
    hash2 = pHash(img2)
    n3 = cmpHash(hash1, hash2)
 
    n4 = classify_hist_with_split(img1, img2)
 
    return n3, n4
 
 
 
if __name__ == "__main__":
    p1 = '/Users/Desktop/11/24.jpeg'
    p2 = '/Users/Desktop/11/25.jpeg'
    runAllImageSimilaryFun(p1, p2)

总结

到此这篇关于Python列表删除重复元素与图像相似度判断及删除的文章就介绍到这了,更多相关Python列表删除重复元素内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

matlab绘图——彩色螺旋图 MATLAB卡尔曼 MATLAB技巧 matlab 信息可视化开发语言
代码生成的图形是一个动态的彩色螺旋，展示了如何利用极坐标和颜色映射创建视觉吸引力强的图形。该图形可以用于数据可视化、艺术创作或数学演示，展示了MATLAB在图形处理方面的强大能力。通过调整theta和r的范围，可以创建出不同形状和复杂度的螺旋图形。文章目录运行结果MATLAB源代码代码介绍代码分解与解释运行结果彩色螺旋图，运行结果：MATLAB源代码clc;clear;closeall;theta
快递物流订阅与推送API：自动获取物流信息 api
前言随着互联网技术的飞速发展，电子商务已经成为人们日常生活的重要组成部分。随之而来的是消费者对物流信息透明度的需求日益增长，他们希望随时了解包裹的最新状态。为了满足这一需求，快递物流订阅与推送API应运而生，为物流服务提供了一种高效、实时的信息更新方式。一、快递物流订阅与推送API的基本概念快递物流订阅与推送API是一种基于Web服务的接口，允许用户通过编程方式订阅特定包裹的物流信息，并在物流状态
漆包线行业MES系统的核心功能与应用
漆包线行业在管理上面临诸多难题，如确保高质量产品输出的同时维持高效生产效率、管理多样化的原材料库存、优化生产流程以减少次品率、快速响应市场需求、实现成本控制与节能减排目标等。为了解决这些难题，漆包线MES（制造执行系统）应运而生。以下是漆包线MES系统的主要功能：1、生产计划与排程自动接收订单：MES系统能够自动接收来自ERP（企业资源计划）系统的订单信息。智能生成计划：根据生产能力、物料供应、设
制造业数字化转型要注重哪些方面？
制造业数字化转型要注重哪些方面？随着互联网的日益普及，计算和存储能力的迅猛发展，物联网和传感器技术的广泛应用，以及工业软件的不断进化，数据的采集、存储、传输、展现、分析与优化都具备了良好的技术基础。在这种背景下，制造业数字化转型的浪潮势不可挡。优秀的制造企业也在一直致力于产品本身的数字化转型，实现数据采集、状态感知与远程控制，提高产品的附加值，增加服务收入。同时，也只有推进数字化转型，制造企业才能
云起无垠入选中国信息通信研究院2024年度首期“磐安”优秀案例人工智能
近日，中国信通院举办的深度观察报告会系列论坛在北京顺利召开。在数字生态治理分论坛上，2024年度首期“磐安”优秀案例——AI+数字安全应用优秀案例遴选结果正式公布，云起无垠凭借其在生成式AI网络安全攻防对抗垂直领域扎实的研究及应用成果，成功入选该年度首期“磐安”优秀案例。当下，数字化浪潮席卷全球，信息技术广泛渗透各个产业。云计算、大数据、人工智能、物联网等前沿技术深度融合，传统制造业生产线、现代服
企业工商四要素核验API：确保企业信息真实性的高效工具 api
前言在当今复杂多变的商业环境中，企业信息的真实性和准确性对于合作伙伴的选择、信用评估、风险控制等多个方面都具有至关重要的意义。为了确保交易的安全性和可靠性，越来越多的企业和机构开始采用企业工商四要素核验API，通过验证企业名称、社会统一信用代码、法人名称及法人身份证等关键信息，来核实企业的合法身份和经营资质。什么是企业工商四要素核验API？企业工商四要素核验API是一种基于互联网技术的数据接口服务
智能图像识别系统设计与实现算法机器学习人工智能
摘要本文讨论了图像识别技术在安防领域的应用，详细介绍了如何利用AI设计实时图像识别系统解决传统监控系统的不足，包括快速识别潜在威胁和提高实时性。文章包含可运行的代码模块（基于Python和OpenCV），并通过实际案例展示如何应对技术挑战。引言传统监控系统主要依赖人工监控，面临效率低、实时性差等问题。而人工智能和图像识别技术的发展为安防领域带来了革命性的改变。通过基于AI的实时图像识别系统，可以快
实名认证：身份证二要素核验API api
前言在数字化时代，个人身份信息的安全性和准确性变得至关重要。随着网络服务的普及和在线交易的频繁，如何确保用户身份的真实性，防止欺诈和非法行为，已成为各行各业亟需解决的问题。身份证二要素核验API作为一种创新的技术解决方案，正逐渐成为提高身份验证安全性和效率的关键工具。身份证二要素核验API概述身份证二要素核验API是一种在线验证服务，它通过比对用户提供的姓名和身份证号码与官方数据库中的信息是否一致
分布式微服务技术，模拟面试与解答。RabbitMQ（五） zxb11c rabbitmq 分布式
分布式微服务技术，模拟面试与解答。Consul（一）分布式微服务技术，模拟面试与解答。Ocelot（二）分布式微服务技术，模拟面试与解答。Redis（三）分布式微服务技术，模拟面试与解答。MongoDB（四）分布式微服务技术，模拟面试与解答。RabbitMQ（五）分布式微服务技术，模拟面试与解答。Nacos（六）分布式微服务技术，模拟面试与解答。ELK（七）分布式微服务技术，模拟面试与解答。Sky
高成长、高潜力、高社区影响！镜舟科技入选 2024 中国新锐技术先锋企业数据库开源数据分析
2024年12月4日，中国技术先锋年度评选|2024中国新锐技术先锋企业榜单正式发布。作为中国领先的新一代开发者社区，SegmentFault思否依托上千万开发者用户数据分析，各科技企业在国内技术领域的行为及影响力指标，最终评选出30家新锐技术先锋企业，镜舟科技作为领先的数据技术企业，入选30强之列。2024中国新锐技术先锋企业榜隶属于中国技术先锋年度评选，旨在挖掘信奉技术力量、敢于技术创新、践行
面试官：Redis中大Key怎么删除？后端go面试问题
首先来看一下该岗位的职责和要求：岗位职责负责公司旗下产品的全新需求开发负责公司中台系统管理系统开发开发临时性工具和数据处理工作设计开发可复用模块，提高开发效率节省维护成本保质保量的完成上级领导安排的技术相关工作任职要求本科以上学历，计算机相关专业优先，3年左右Golang开发经验，有PHP转Go项目经验者优先熟练掌握Golang/PHP语言，熟悉至少一种Golang框架熟练掌握关系型数据库Mysq
多版本并发控制：MVCC的作用和基本原理 koping_wu mysql 数据库
多版本并发控制：MVCC的作用和基本原理1、MVCC简介1.1快照读与当前读的区别1.1.1快照读1.1.2当前读1.2数据库的读写问题1.3MVCC的作用2、MVCC实现原理之ReadView2.1什么是ReadView2.2ReadView的设计思路2.3MVCC整体操作流程1、MVCC简介1.1快照读与当前读的区别mysql在读数据的场景下，根据是否加锁分为了2种读的方式：1.1.1快照读不
腾讯AI开放平台的接口调用指南
在多模态模型的架构上，ChatGPT的绘图能力主要依赖以下几个核心组件：跨模态编码器（Cross-ModalEncoder）：跨模态编码器的作用是将文本和图像的特征进行对齐。GPT可以将用户输入的文本描述转换为文本特征表示，然后利用跨模态编码器将这些特征映射到图像特征空间。这种方式确保模型能够理解描述性语言中不同细节是如何与图像特征对应的。
“赛教融合”背景下，职业院校教师教学能力提升创新路径武汉唯众智创人工智能职业教育职教赛教融合
自2010年起，教育部启动全国职业院校信息化教学大赛，旨在深化职业教育教学改革与创新。至2018年，该赛事升级为全国职业院校技能大赛教学能力比赛，显著增强了其专业性和实践性，成为推动职业教育发展的强劲动力。2024年下半年，“全国职业院校技能大赛教学能力比赛”官网也已更名为“全国职业院校技能大赛教师赛服务平台”。这一大赛致力于推广信息化教学手段的日常应用，全面提高职业院校教师的教学能力和信息素养，
分布式微服务搭建 Xi-Tong 微服务架构云原生 linux centos bash jdk
分布式微服务架构搭建（举出一个项目搭建的例子，其他项目可参考本文档）基于Nginx作为web服务器、JDK作为Java运行环境、MySQL作为关系型数据库、Nacos作为服务发现和配置中心、Maven作为项目管理工具、Redis作为缓存和消息中间件（视具体需求而定）、Node.js与npm作为某些微服务（如前端服务或特定业务逻辑服务）的开发和依赖管理工具，可以搭建一个完整的分布式微服务架构项目。以
【Python Dash】零基础也能轻松掌握的学习路线与参考资料 weishaoonly python dash 学习
PythonDash是一个可视化框架，可以帮助开发者快速构建交互式仪表板和应用程序。它基于Plotly.js库建立，提供了一种易于使用的Python界面，用户可以通过简单的Python代码创建仪表板和应用程序。本篇文章将介绍PythonDash的学习路线，并给出参考资料和优秀实践，并对PythonDash应用的未来趋势进行了展望。一、PythonDash的学习路线以下是学习PythonDash的建
pnpm下载element-plus，卡住不动，如何解决？？ bug菌¹ 全栈Bug调优(实战版)element-plus pnpm
本文收录于《全栈Bug调优(实战版)》专栏，主要记录项目实战过程中所遇到的Bug或因后果及提供真实有效的解决方案，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！全文目录：问题描述解决方案解决方法文末福利，等你来拿！✨️WhoamI?问题描述pnpm下载element-plus包卡在这个环节一直不动了：具体如下图所示，如何解决？
全国快递物流查询 API：助力物流信息高效流转 api
前言在当今电商蓬勃发展的时代，快递物流行业扮演着至关重要的角色。而全国快递物流查询API的出现，更是为物流信息的高效流转提供了强大助力，成为连接商家、物流企业和消费者的桥梁。全国快递物流查询API的定义与功能全国快递物流查询API是一种应用程序接口，它允许开发者将快递物流查询功能集成到自己的软件或系统中。通过调用该API，用户可以轻松获取快递包裹的实时物流信息，包括快递单号、收发件人信息、包裹状态
WPF基础 | WPF 布局系统深度剖析：从 Grid 到 StackPanel xcLeigh WPF 从入门到精通 wpf C#
WPF基础|WPF布局系统深度剖析：从Grid到StackPanel一、前言二、Grid布局：万能的布局王者2.1Grid布局基础：构建网格世界2.2子元素定位与跨行列：布局的精细操控2.3自适应布局：灵活应变的秘诀三、StackPanel布局：简约而不简单3.1StackPanel布局基础：有序堆叠之道3.2属性控制：定制堆叠细节3.3自适应与动态布局：智能的布局响应四、Grid与StackPa
WPF基础 | 深入 WPF 事件机制：路由事件与自定义事件处理 xcLeigh WPF 从入门到精通 wpf C#
WPF基础|深入WPF事件机制：路由事件与自定义事件处理一、前言二、WPF事件基础概念2.1事件的定义与本质2.2常见的WPF事件类型三、路由事件3.1路由事件的概念与原理3.2路由事件的三个阶段3.3路由事件的标识与注册3.4常见的路由事件示例四、自定义事件处理4.1为什么需要自定义事件4.2自定义路由事件的创建4.3自定义非路由事件的创建4.4自定义事件参数的传递五、路由事件与自定义事件处理的
macOS 安装和管理多个Python版本 weixin_30590285 python 操作系统 shell
?John'sblog?说明目前Python同时更新与维护Python2和Python3，选择Python2还是选择Python3，取决于当前要使用的库、框架支持哪个版本，所以经常会遇到切换版本的情况。那么应该怎样有效的更改呢？很多小伙伴一定会想到修改环境变量，指定Python的默认路径，这样当然可以，然而不够优雅。那么怎样的方法才算优雅呢？当然是一条命令了?。这里通过brew安装pyenv，再用
弹性伸缩与微服务架构：构建高性能高可用的服务 AI天才研究院大数据AI人工智能架构师必知必会系列编程实践开发语言架构设计 docker kubernetes
作者：禅与计算机程序设计艺术1.简介随着互联网产品的快速发展、服务器计算能力的提升以及云平台的普及，"大规模分布式计算"已成为新时代的一个重要特征。为了应对这一挑战，云厂商们开始将单一应用拆分成多个微服务，从而实现资源和任务的灵活分配。如何有效地管理、监控和部署这些微服务，是实现微服务架构的关键。微服务架构可以让开发者将单个功能划分成一个独立的模块，并由不同的团队独立开发和维护。当需求增加或者出现
拥抱AI，赋能药学：人工智能在药学领域的应用与展望明哲AI AI助力科研人工智能大模型 AI药学数智药学药师
拥抱AI，赋能药学：人工智能在药学领域的应用与展望医药行业正在经历一场静悄悄的革命，而这场革命的引擎正是近年来炙手可热的人工智能（AI）。如果说，过去药学实践更多依赖于药剂师的经验积累，那么未来，AI将引领药学走向“循证精准”的新时代。本文将深入解读《AREVIEWON“AIINTEGRATIONINPHARMACYPRACTICE”》这篇综述，抽丝剥茧地分析AI如何重塑药学实践的各个环节，探讨其
Python函数的5个核心概念昊昊该干饭了 python python 开发语言
Python函数是编程的基石之一，也是提高代码复用性和可读性的关键工具。本文将从零开始，详细剖析Python函数的五个核心概念：定义、参数、返回值、作用域，以及嵌套函数。通过深度解析与实践案例，让大家彻底掌握Python函数的精髓。目录1.什么是函数？1.1函数的定义1.2函数的优点2.核心概念一：函数的定义与调用3.核心概念二：函数的参数3.1参数的种类3.2参数解包4.核心概念三：函数的返回值
Python数据类型与操作昊昊该干饭了 python 数据结构 python 开发语言
Python是一种动态类型的编程语言，拥有丰富的数据类型，这些类型在编程中无处不在，掌握它们是学习Python的第一步。本篇文章将以循序渐进的方式，从字符串、数字，到列表、元组，再到字典，全面讲解它们的定义、常见操作以及应用场景，帮助大家打好Python基础。目录一、字符串：文本处理的基础1.字符串的定义与基本操作常见操作统计字符串中单词个数2.字符串的方法二、数字：Python的数值操作1.数字
代码随想录1.23 我会非常幸运代码随想录跟练记录 c++力扣算法数据结构链表开发语言
文章目录链表基础203.移除链表元素707.设计链表==206反转链表==链表基础链表定义：structListnode{intval;//链表节点数值Listnode*next;//下个节点的指针}//使用，定义头节点就行Listnode*name=newListnode();head->val=5;203.移除链表元素设置一个虚拟头节点。需要定义了两个新链表，一个是用于存储虚拟头节点的链表，一
为什么redis会开小差？Redis 频繁异常的深度剖析与解决方案磐基Stack专业服务团队 redis 数据库缓存
文章目录导读为什么redis会开小差？1.连接数过多2.bigkey3.慢命令操作4.内存策略不合理5.外部数据双写一致性6.保护机制未开启7.数据集中过期8.CPU饱和9.持久化阻塞10.网络问题结论导读提起分布式缓存，想必大多数同学脑海中都会浮出redis这个名字来……但是，对于它，你真的玩转了吗？为什么你的redis会慢，会卡顿，会崩溃？现在带你一探究竟。为什么redis会开小差？本文主要简
缓存-Redis-数据结构-redis哪些数据结构是跳表实现的? 看个人简介有交流群(付费) Redis 缓存 redis 数据结构
在Redis中，跳表（SkipList）被用于实现有序集合（SortedSet）数据结构。以下是对此实现的详细解释：Redis中的有序集合（SortedSet）有序集合（SortedSet），简称ZSET，是一种将成员与分数（score）关联的集合，成员按照分数的升序或降序排列。与普通集合不同，有序集合中的每个成员都是唯一的，并且可以通过分数进行高效的排序和范围查询。内部实现Redis中的有序集合
springboot第83集：理解SaaS多租户应用的架构和设计，设备介入，网关设备，安全，实时实现，序列化... 掘金-我是哪吒 spring boot 架构安全数据库后端
springboot第83集：理解SaaS多租户应用的架构和设计，设备介入，网关设备，安全，实时实现，序列化，数据交换，存储与查询，流处理，消息队列[什么是多租户]聊到PaaS,SaaS，就不得不谈到多租户。多租户指一套系统能够支撑多个租户。一个租户通常是具有相似访问模式和权限的一组用户，典型的租户是同一个组织或者公司的若干用户。要实现多租户，首先需要考虑的是数据层面的多租户。数据层的多租户模型对
docker实践与应用举例周盛欢 docker
第一步：搞清楚Docker是啥玩意儿Docker是个啥？简单来说，它就像是一个“打包神器”。你可以把你的程序、代码、运行环境（比如Python、Java、数据库之类的）全部打包成一个“盒子”，然后这个“盒子”可以放到任何地方运行，不用担心环境问题。这就像是你把一个玩具打包好，不管带到哪里，都能拿出来玩，而且不会坏。为啥要用Docker呢？因为它能解决“在我电脑上能运行，但到你电脑上就报错”的问题。
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他

Python列表删除重复元素与图像相似度判断及删除实例代码

发现问题

解决方案：

总结

你可能感兴趣的:(Python列表删除重复元素与图像相似度判断及删除实例代码)