Kamen Black君

结合PCA降维的DBSCAN聚类方法（附Python代码）

目录

前言介绍：

1、PCA降维：

（1）概念解释：

（2）实现步骤：

（3）优劣相关：

2、DBSCAN聚类：

（1）概念解释：

（2）算法原理：

（3）优劣相关：

代码实现：

0、数据准备：

1、PCA降维：

2、DBSCAN聚类：

3、代码汇总：

实现效果：

1、降维效果：

2、聚类效果：

写在最后：

前言介绍：

1、PCA降维：

（1）概念解释：

PCA，全称Principal Component Analysis，即主成分分析。是一种降维方法，实现途径是提取特征的主要成分，从而在保留主要特征的情况下，将高维数据压缩到低维空间。

在经过PCA处理后得到的低维数据，其实是原本的高维特征数据在某一低维平面上的投影（只要维度较低，都可以视为平面，例如三维相对于四维空间也可以视为一个平面）。虽然降维的数据能够反映原本高维数据的大部分信息，但并不能反映原本高维空间的全部信息，因此要根据实际情况，加以鉴别使用。

（2）实现步骤：

PCA主要通过6个步骤加以实现：

1、标准化（将原始数据进行标准化，一般是去均值，如果特征在不同量级上，还要将矩阵除以标准差）

具体：

其中，E为原始矩阵，Emean为均值矩阵，Enorm为标准化矩阵。

2、协方差（计算标准化数据集的协方差矩阵）

具体：

其中，Cov为协方差矩阵，m为样本的数量，Enorm为均值矩阵。

3、特征值（计算协方差矩阵的特征值和特征向量）

具体：

假设实数λ、n行（原始矩阵E的列数即为n）1列的矩阵X（即n维向量）满足下式：

则λ为Cov的特征值，其中Cov为协方差矩阵。

4、K 特征（保留特征值最大的前K个特征（K是降维后，我们期望达到的维度））

具体：

若有多个特征值，则保留前K个最大的特征值，以满足之后的计算需求。

5、K 向量（找到这K个特征值对应的特征向量）

具体：

通过步骤3中的公式得到每个特征值对应的特征向量。

6、得降维（将标准化数据集乘以该K个特征向量，得到降维后的结果）

具体：

其中，Epca为最后要求得的PCA降维矩阵，Enorm为标准化矩阵，X1、X2、X3、...、Xk为对K个特征值对应的特征向量。

（3）优劣相关：

        优点：

        1.PCA降维之后的各个主成分之间相互正交，可消除原始数据之间相互影响的因素。

        2.PCA降维的计算过程并不复杂，因实现起来较简单容易。

        3.在保留大部分主要信息的前提下，起到了降维，简便化计算效果。

        缺点：

        1.特征主成分的定义具有模糊性，解释性差。

        2.PCA降维选取令原数据在新坐标轴上方差最大的主成分的标准，使得一些方差小的特征较易丢失，有损失重要信息的可能性。

2、DBSCAN聚类：

（1）概念解释：

密度聚类亦称“基于密度的聚类”（Density-Based Clustering）,此类算法假设聚类结构能通过样本分布的紧密程度确定。通常情形下，密度聚类算法从样本密度的角度来考察样本之间的可连续性，并基于可连接样本不断扩展聚类簇以获得最终的聚类结果。

DBSCAN（Density-Based Spatial Clustering of Applications with Noise）就是这样一种聚类算法，该算法基于一组“领域”（neighborhood）参数（ε,MinPts）来刻画样本分布的紧密程度。

（2）算法原理：

给定数据集D={x1,x2,...,xm}，定义下面这几个概念：

理解了相关概念之后，下面给出算法实现的伪代码：

（3）优劣相关：

优点：

1、能够识别任意形状的样本。

2、该算法将具有足够密度的区域划分为簇，并在具有噪声的空间数据库中发现任意形状的簇。

3、无需指定簇个数，而是由算法自主发现。

缺点：

1、需要指定最少点个数（MinPts）与半径（ε）。（但其实相对其他聚类算法来说，已经具有较大的自由性。）

2、最少点个数与半径对算法的影响较大，一般需多次调试。

代码实现：

0、数据准备：

在这里，我们使用sklearn库的鸢尾花iris数据集（sklearn.datasets.load_iris）作为测试数据样本。iris数据集包含150个样本，每个样本包含四个属性特征（花萼长度、花萼宽度、花瓣长度、花瓣宽度）和一个类别标签（分别用0、1、2表示山鸢尾、变色鸢尾和维吉尼亚鸢尾）。

首先，我们要安装sklearn库。安装此库，还是通过pip install命令，但是并不是pip install sklearn，而是pip install scikit-learn。正如我们调用opencv是import cv2，而安装却是通过pip install opencv一样。

pip install scikit-learn

然后，获取数据集，其中x为鸢尾花的特征数据集（数据类型为数组numpy.adarray），y为鸢尾花的标签数据集（数据类型为数组numpy.adarray）。

from sklearn.datasets import load_iris
x = load_iris().data
y = load_iris().target

1、PCA降维：

import numpy as np

def PCA_DimRed(dataMat,topNfeat): #PCA_DimRed--PCA dimension reduction,PCA降维
    meanVals = np.mean(dataMat, axis=0)
    meanRemoved = dataMat - meanVals  # 标准化（去均值）
    covMat = np.cov(meanRemoved, rowvar=False)
    eigVals, eigVets = np.linalg.eig(np.mat(covMat))  # 计算矩阵的特征值和特征向量
    eigValInd = np.argsort(eigVals)  # 将特征值从小到大排序，返回的是特征值对应的数组里的下标
    eigValInd = eigValInd[:-(topNfeat + 1):-1]  # 保留最大的前K个特征值
    redEigVects = eigVets[:, eigValInd]  # 对应的特征向量
    lowDDatMat = meanRemoved * redEigVects  # 将数据转换到低维新空间
    # reconMat = (lowDDatMat * redEigVects.T) + meanVals  # 还原原始数据
    return lowDDatMat

2、DBSCAN聚类：

import numpy as np
import random
import copy

def DBSCAN_cluster(mat,eps,min_Pts): #进行DBSCAN聚类，优点在于不用指定簇数量，而且适用于多种形状类型的簇
    k = -1
    neighbor_list = []  # 用来保存每个数据的邻域
    omega_list = []  # 核心对象集合
    gama = set([x for x in range(len(mat))])  # 初始时将所有点标记为未访问
    cluster = [-1 for _ in range(len(mat))]  # 聚类
    for i in range(len(mat)):
        neighbor_list.append(find_neighbor(mat, i, eps))
        if len(neighbor_list[-1]) >= min_Pts:
            omega_list.append(i)  # 将样本加入核心对象集合
    omega_list = set(omega_list)  # 转化为集合便于操作
    while len(omega_list) > 0:
        gama_old = copy.deepcopy(gama)
        j = random.choice(list(omega_list))  # 随机选取一个核心对象
        k = k + 1
        Q = list()
        Q.append(j)
        gama.remove(j)
        while len(Q) > 0:
            q = Q[0]
            Q.remove(q)
            if len(neighbor_list[q]) >= min_Pts:
                delta = neighbor_list[q] & gama
                deltalist = list(delta)
                for i in range(len(delta)):
                    Q.append(deltalist[i])
                    gama = gama - delta
        Ck = gama_old - gama
        Cklist = list(Ck)
        for i in range(len(Ck)):
            cluster[Cklist[i]] = k
        omega_list = omega_list - Ck
    return cluster

3、代码汇总：

from sklearn.datasets import load_iris
import numpy as np
import random
import copy
import matplotlib.pyplot as plt

def PCA_DimRed(dataMat,topNfeat): #PCA_DimRed--PCA dimension reduction,PCA降维
    meanVals = np.mean(dataMat, axis=0)
    meanRemoved = dataMat - meanVals  # 标准化（去均值）
    covMat = np.cov(meanRemoved, rowvar=False)
    eigVals, eigVets = np.linalg.eig(np.mat(covMat))  # 计算矩阵的特征值和特征向量
    eigValInd = np.argsort(eigVals)  # 将特征值从小到大排序，返回的是特征值对应的数组里的下标
    eigValInd = eigValInd[:-(topNfeat + 1):-1]  # 保留最大的前K个特征值
    redEigVects = eigVets[:, eigValInd]  # 对应的特征向量
    lowDDatMat = meanRemoved * redEigVects  # 将数据转换到低维新空间
    # reconMat = (lowDDatMat * redEigVects.T) + meanVals  # 还原原始数据
    return lowDDatMat

def find_neighbor(data,pos,eps): #寻找相邻点函数
    N = list()
    temp = np.sum((data-data[pos])**2, axis=1)**0.5
    N = np.argwhere(temp <= eps).flatten().tolist()
    return set(N)

def DBSCAN_cluster(data,eps,min_Pts): #进行DBSCAN聚类，优点在于不用指定簇数量，而且适用于多种形状类型的簇，如果使用K均值聚类的话，对于这次实验的数据（条状簇）无法得到较好的分类结果
    k = -1
    neighbor_list = []  # 用来保存每个数据的邻域
    omega_list = []  # 核心对象集合
    gama = set([x for x in range(len(data))])  # 初始时将所有点标记为未访问
    cluster = [-1 for _ in range(len(data))]  # 聚类
    for i in range(len(data)):
        neighbor_list.append(find_neighbor(data, i, eps))
        if len(neighbor_list[-1]) >= min_Pts:
            omega_list.append(i)  # 将样本加入核心对象集合
    omega_list = set(omega_list)  # 转化为集合便于操作
    while len(omega_list) > 0:
        gama_old = copy.deepcopy(gama)
        j = random.choice(list(omega_list))  # 随机选取一个核心对象
        k = k + 1
        Q = list()
        Q.append(j)
        gama.remove(j)
        while len(Q) > 0:
            q = Q[0]
            Q.remove(q)
            if len(neighbor_list[q]) >= min_Pts:
                delta = neighbor_list[q] & gama
                deltalist = list(delta)
                for i in range(len(delta)):
                    Q.append(deltalist[i])
                    gama = gama - delta
        Ck = gama_old - gama
        Cklist = list(Ck)
        for i in range(len(Ck)):
            cluster[Cklist[i]] = k
        omega_list = omega_list - Ck
    return cluster

if __name__ == "__main__":
    #1、准备数据
    x = load_iris().data
    y = load_iris().target

    #2、PCA降维
    pro_data = PCA_DimRed(x,2)

    #3、DBSCAN聚类（此步中要保证数据集类型为数组，以配合find_neighbor函数）
    pro_array = np.array(pro_data)
    thecluster = DBSCAN_cluster(pro_array,eps=0.8,min_Pts=30)

    #4、展示降维效果：
    print("下面是降维之前的鸢尾花数据集特征集：")
    print(x)
    print("下面是降维之后的鸢尾花数据集特征集：")
    print(pro_data)

    #5、展示聚类效果：
    plt.figure()
    plt.scatter(pro_array[:, 0], pro_array[:, 1], c=thecluster)
    plt.show()

实现效果：

1、降维效果：

降维之前的鸢尾花数据集特征集：

降维之后的鸢尾花数据集特征集：

2、聚类效果：

可以看出来，DBSCAN聚类方法并不能很准确地根据PCA降维后的鸢尾花特征集对鸢尾花样本进行聚类，原因是变色鸢尾与维吉尼亚鸢尾的样本特征较近，两者更类似于同属于一个密度空间，因而导致了该实验的不准确性。

但是，其实也可以看出，山鸢尾与其他两种鸢尾能够进行较好的区别 ，说明该方法仍适用于不同类别样本间差距较大的聚类情形。

写在最后：

本篇文章主要介绍了PCA降维、DBSCAN聚类这两个机器学习操作的基本原理，以及两者结合的用于实际数据处理的方法。

可能基于PCA降维的DBSCAN聚类的方法不是很适用于sklearn库中的鸢尾花数据集，但是该方法既具有处理高维数据的能力，也能够处理各种形状的簇，说明其作为一套较为完整的聚类方法，仍然具有较为广阔的应用场景。

希望大家能够积极应用这个方法，使得其拥有更多的应用可能性。谢谢各位！

参考书籍：

周志华.机器学习[M].北京：清华大学出版社，2016.01

参考文章：

六种常见聚类算法：http://t.csdn.cn/Urhn9

Python PCA(主成分分析法)降维的两种实现：http://t.csdn.cn/NlAeU

DBSCAN聚类算法Python实现：http://t.csdn.cn/lkFhF

PCA降维原理操作步骤与优缺点：http://t.csdn.cn/QiEJM

好了以上就是所有的内容，希望大家多多关注，点赞，收藏，这对我有很大的帮助。谢谢大家了！

好了，这里是Kamen Black 君。祝国康家安，大家下次再见喽！！！~~溜溜球~~~~

你可能感兴趣的:(python,人工智能,机器学习,聚类,python,机器学习,人工智能,降维)

python文本处理beautifulsoup4库安装与使用范哥来了 python 开发语言
BeautifulSoup4（通常简称为bs4）是一个非常强大的Python库，用于从HTML和XML文件中提取数据。它能够解析文档，并提供方便的方法来遍历、搜索和修改解析树。下面是如何安装以及一些基本的使用示例。安装beautifulsoup4首先，确保你的环境中已经安装了Python和pip（Python的包管理工具）。然后，在命令行中运行以下命令来安装beautifulsoup4：pipin
Manus学习手册合集【建议收藏】周师姐学习 pdf 人工智能
这两天，一款通用AI智能体Manus还没发布就火了，因为还在内测中，用户需要邀请码才能够体验，这就导致原本免费的邀请码在二手平台最高被炒到8万8。相比于之前爆火的DeepSeek和ChatGPT这类AI对话工具，Manus是全球首款真正意义上的通用人工智能！没错，就是科幻电影里面能够独立思考，自主运行的人工智能！！manus学习资料：https://pan.xunlei.com/s/VOKk8Cq
10个热门AI API（2024年2月）程序员后端
人工智能（AI）在当今数字时代发挥着重要的作用，为企业带来了全新的机遇和变革。AI不再是一种陌生的科技概念，而是已经渗透到各行各业，成为推动创新和提升效率的关键引擎。其核心优势在于能够处理大规模的数据、执行复杂的任务、模拟人类思维过程，并以前所未有的方式改善业务流程。AIAPI作为连接企业和强大AI技术的桥梁，扮演着至关重要的角色。通过使用AIAPI，企业能够快速、轻松地将先进的人工智能功能集成到
【python】协程（coroutine） atwdy Python python coroutine 协程 asyncio
协程（coroutine）可以理解为一个可以中途暂停保存当前执行状态信息并可以从此处恢复执行的函数，多个协程共用一个线程执行，适合执行需要“等待”的任务。所以严格意义上，多个协程同一时刻也只有一个在真正的执行，因为线程是任务调度的基本单位。注意这里的执行指的是占用CPU计算，不包括等待阻塞等场景。python中实现协程的标准库是asyncio，标准库的实现中大致可以由底层到顶层分为下面几个对象：c
基于阿里云调用deepseek大模型 atwdy 大模型 deepseek deepseek-r1 deepseek API 阿里云
文章目录1.单轮对话2.多轮对话参考文档选择需要调用的模型，每个模型的详细信息中会有API示例（deepseek-r1），需要做的就是申请自己的APIkey就行了，过程中可能需要实名认证。python中安装OpenAISDK：pipinstallopenai。安装后如果出现ImportError，可能是python的版本低了，升级下版本。当前测试环境是Python3.9.7，openai==1.6
人工智能学习大纲互联网搬砖老肖 AI 原力计划工具使用人工智能学习
前言人工智能正以惊人的速度发展，其潜力既令人兴奋，也引人深思。它既可能为解决全球性问题带来希望，也可能带来前所未有的挑战。人工智能时代的到来已是不可逆转的趋势，科幻电影中的某些场景或许将成为现实。我对人工智能的研究越深入，就越能感受到它的强大力量。我所担忧的不仅仅是它对就业市场的冲击，更是它可能对人类社会结构带来的深远影响。未来，对人工智能的理解可能像今天对电脑操作的掌握一样重要。掌握人工智能技术
01计算机视觉学习计划依旧阳光的老码农计算机视觉计算机视觉人工智能
计算机视觉系统学习计划（3-6个月）本计划按照数学→编程→图像处理→机器学习→深度学习→3D视觉→项目实战的顺序，确保从基础到高级，结合理论和实践。第一阶段（第1-2个月）：基础夯实✅目标：掌握数学基础、Python/C++编程、基本图像处理1️⃣数学基础（2周）每日2小时线性代数：矩阵运算、特征值分解（推荐《线性代数及其应用》）概率统计：高斯分布、贝叶斯定理微积分：偏导数、梯度下降傅里叶变换：图
决策树 vs 神经网络：何时使用？ HP-Succinum 机器学习决策树神经网络算法
目录1.决策树（DecisionTrees）1.1特点1.2优点1.3缺点1.4适用场景2.神经网络（NeuralNetworks）2.1特点2.2优点2.3缺点2.4适用场景3.何时选择哪种方法？4.结合使用的可能性5.总结在机器学习领域，决策树（DecisionTrees）和神经网络（NeuralNetworks）是两种常见但风格截然不同的算法。它们各自适用于不同类型的问题，本文将介绍它们的特
python-Scrapy爬虫框架介绍（整个数据的流程） onesalatree Scrapy框架爬虫 python 软件框架爬虫 scrapy
python-Scrapy爬虫框架介绍随着在家的线上教育的进行，课程的深入学习，所要学习的内容和作业也在不断的增多，所以没有过多的自己的时间去学习新的爬虫知识，但疫情逐渐的在好转，我也很是期待开学的那一天，毕竟线上教育的效果没有在学校的更为显著，主要是老师们录课很辛苦今天我想和兄弟们分享一下Scrapy爬虫的原理，也是自己最近刚学习的，有什么不足的地方兄弟们可以评论你或者私信喔。Python爬虫的
Conda操作使用教程迷鹿鹿鹿鹿鹿 conda
声明：该文章仅为学习使用，严禁用于商业用途和非法用途，否则由此产生的一切后果均与作者无关！如有侵权，请私信联系本人删帖！Conda操作使用教程Conda是一个开源的包管理和环境管理工具，支持多种编程语言（以Python为主）。它能够帮助用户快速安装、运行和更新软件包，并创建相互隔离的虚拟环境，避免项目之间的依赖冲突。目录Conda的安装基础命令虚拟环境管理包管理环境导出与共享常见问题总结一、安装1
Manus AI：全球首款通用型 AI Agent 的创新与挑战萧鼎 python基础到进阶教程人工智能
1.引言：AIAgent时代的到来人工智能正在从单纯的对话式助手进化为更高级的智能体（Agent），能够自主完成任务，而不仅仅是提供信息或建议。2025年3月6日，由中国团队Monica推出的ManusAI正式亮相，号称全球首款通用型AIAgent（自主智能体）。与传统的AI助手相比，Manus不仅能够理解用户的自然语言指令，还能拆解任务、自动执行，并交付完整的成果。这标志着AI进入了一个新的发展
使用 Dlib 库进行人脸检测和人脸识别萧鼎 python基础到进阶教程计算机视觉人工智能 python 人脸识别人脸检测
使用Dlib库进行人脸检测和人脸识别什么是Dlib？Dlib是一个广泛使用的C++库，提供了多种用于机器学习和计算机视觉的工具。它包含了人脸检测、人脸识别、物体检测、图像处理等功能。Dlib具有高效、易用的Python接口，因此它也被广泛应用于Python中进行深度学习和计算机视觉任务。安装Dlib首先，我们需要在Python环境中安装Dlib库。你可以通过pip进行安装：pipinstalldl
介绍常见的图片分类模型与算法萧鼎 python基础到进阶教程算法分类数据挖掘
介绍常见的图片分类模型与算法在机器学习和深度学习的领域中，图片分类任务是一个广泛的应用场景。随着深度学习技术的飞速发展，很多强大的图像分类算法和模型已经被提出，广泛应用于从医疗影像到自动驾驶、从人脸识别到图像检索等多个领域。本文将重点介绍多种用于图像分类的经典算法与模型，帮助你了解在图像分类任务中常用的技术。1.传统机器学习模型在深度学习崭露头角之前，传统的机器学习模型是图像分类的主流方法。这些模
Python图形界面开发：PyQt与Tkinter对比分析萧鼎 python基础到进阶教程 python pyqt 数据库
Python图形界面开发：PyQt与Tkinter对比分析图形用户界面（GUI）是应用程序中不可或缺的一部分，可以帮助用户更直观地与程序进行交互。Python拥有许多开发GUI的库，其中PyQt和Tkinter是最受欢迎的两个选择。本篇博客将从功能、易用性、性能、社区支持、学习曲线等角度对比分析这两个库，并通过一个简单的实战项目帮助你更直观地理解它们的差异。一、PyQt与Tkinter简介1.Py
网页自动化测试和爬虫：Selenium库入门与进阶萧鼎 python基础到进阶教程爬虫 selenium 测试工具
网页自动化测试和爬虫：Selenium库入门与进阶在现代Web开发和数据分析中，自动化测试和数据采集成为了开发流程中的重要部分。Python的Selenium库是一种强大的工具，不仅用于网页自动化测试，也在网页爬虫中得到了广泛的应用。本文将带你从Selenium的基础用法入手，逐步深入到进阶技巧，帮助你轻松应对网页自动化任务。一、Selenium简介与安装Selenium是一个浏览器自动化工具，可
Python中的PDF处理工具：PyPDF2和ReportLab使用指南萧鼎 python基础到进阶教程 python pdf pypdf2 reportlab
Python中的PDF处理工具：PyPDF2和ReportLab使用指南在日常工作和项目中，PDF文件处理是个常见需求，不论是合并报告、加密文档、填充表单，还是生成发票。Python中有许多用于操作PDF文件的库，其中PyPDF2和ReportLab是两个广泛使用的工具：前者用于PDF文档的读取和修改，后者用于从头生成PDF文件。在这篇博客中，我们将介绍如何使用PyPDF2和ReportLab完成
AI与大数据融合：技术路径与行业赋能互联网Ai好者人工智能大数据
在数字化浪潮中，数据已成为驱动社会与商业变革的核心生产要素。据IDC预测，2025年全球数据总量将增长至175ZB，其中物联网设备、社交媒体及企业数字化系统贡献了80%的增量数据。面对海量异构数据的处理需求，传统分析工具已显现出明显局限：Gartner研究指出，仅35%的企业能有效利用其数据资产。在此背景下，人工智能技术通过算法突破与算力跃迁，正重塑大数据价值挖掘范式，构建从数据感知到决策闭环的全
AI大模型在职业教育中的应用解决方案中年猿人人工智能 ai 学习
1.引言随着新经济、新技术的加速发展和经济结构的不断调整，职业教育迎来了新的发展机遇与挑战。传统的职业教育模式难以满足日益个性化、多样化的学习需求，同时，技术快速更迭使得职业技能更新频率大幅提高。这些变化要求职业教育能够更加灵活、高效地适应劳动力市场的需求，并为学生提供与时俱进的技能培养。人工智能（AI）作为一种前沿的科技趋势，其大模型技术通过强大的数据处理能力和学习算法，在众多行业中均展现了巨大
DevOps落地实践点滴和踩坑记录-(1) xuhss_com 计算机 devops 运维计算机
优质资源分享学习路线指引（点击解锁）知识定位人群定位Python实战微信订餐小程序进阶级本课程是pythonflask+微信小程序的完美结合，从项目搭建到腾讯云部署上线，打造一个全栈订餐系统。Python量化交易实战入门级手把手带你打造一个易扩展、更安全、效率更高的量化交易系统记录初衷本人一直在从事企业内DevOps落地实践的工作，走了不少弯路，也努力在想办法解决面临的问题，期间也经历过不少人和事
一文读懂！OpenCV 实时人脸识别从 0 到 1，小白也能轻松实操的超详细教程（完整教程及源码） AI_DL_CODE opencv 人工智能计算机视觉人脸识别
摘要：本文围绕使用OpenCV实现实时人脸识别展开。从环境搭建入手，详细介绍Python及相关库的安装。数据准备环节涵盖收集、标注及预处理步骤。深入阐述特征提取、模型训练方法，包含传统与深度学习方式，还介绍OpenCV预训练模型的使用与评估。详细讲解实时识别过程，包括打开摄像头、逐帧处理及结果显示优化。针对复杂场景，提出光照、姿态、遮挡等问题的解决办法及模型更新维护策略。通过丰富代码示例与解释，助
Python爬虫丨批量下载必应4K壁纸凌小添 Python爬虫项目 python 爬虫开发语言
1.项目背景经常用电脑的朋友应该会发现，电脑锁屏页面是微软必应每天更新的精美壁纸，偶尔还能看到一些十分惊艳的壁纸，于是我去寻找如何下载他们，我在GitHub上闲逛时，还真发现一个自动归档这些壁纸的仓库。该项目由GitHub用户niumoo维护，项目地址：niumoo/bing-wallpaper。该项目每天自动归档必应首页美图！但当我点开README.md时，发现仓库仅保存图片Markdown索引
练习题：70 狐凄练习算法
Python题目题目编写一个函数，接受两个参数，进行除法运算，如果除数为0，使用try-except语句捕获异常并返回错误信息。题目分析需求理解本题要求使用Python编写一个函数，该函数接收两个参数，对这两个参数进行除法运算。在运算过程中，需要考虑除数为0的特殊情况，当除数为0时，不能让程序崩溃，而是要使用try-except语句捕获异常，并返回相应的错误信息。关键知识点函数定义：在Python
Python OCR库：自动化测试验证码识别神器！测试大大怪 python ocr selenium appium 功能测试测试用例测试工具
在接口自动化工作中，经常需要处理文字识别的任务，而OCR（OpticalCharacterRecognition，光学字符识别）库能够帮助我们将图像中的文字提取出来。Python中有几个常用的OCR库，包括pyocr、pytesseract和python-tesseract、EasyOCR。本文将对它们进行比较，并提供一些示例代码来演示它们在实际接口自动化工作中的应用。1、pyocrPyOCR是一
python量化交易——金融数据管理最佳实践——使用qteasy大批量自动拉取金融数据 QTEASY量化交易 qteasy 量化交易 python python 金融量化交易
文章目录使用数据获取渠道自动填充数据QTEASY数据拉取功能数据拉取接口`refill_data_source()`数据拉取API的功能特性多渠道拉取数据实现下载流量控制实现错误重试日志记录其他功能qteasy是一个功能全面且易用的量化交易策略框架，Github地址在这里。使用它，能轻松地获取历史数据，创建交易策略并完成回测和优化，还能实盘运行。项目文档在这里。使用qteasy,您可以非常容易地在
初学者如何用 Python 写第一个爬虫？陆鳐LuLu python 爬虫开发语言
编写第一个Python爬虫并不难，以下是一个简单的步骤指南，帮助从零开始。1.安装必要的库首先，你需要安装requests和BeautifulSoup这两个库。requests用于发送HTTP请求，BeautifulSoup用于解析HTML内容。pipinstallrequestsbeautifulsoup42.导入库在你的Python脚本中导入所需的库。importrequestsfrombs4
python使用pandas创建dataframe仿真数据、将字典数据转化为dataframe statistics.insight 数据科学持续学习机器学习数据挖掘数据分析人工智能 python
python使用pandas创建dataframe仿真数据、将字典数据转化为dataframe目录python使用pandas创建dataframe仿真数据、将字典数据转化为dataframe#导入包和库#python使用pandas创建dataframe仿真数据、将字典数据转化为dataframe#导入包和库importpandasaspdimportnumpyasnp#不显示关于在切片副本上设
第十五届蓝桥杯python组 Rainbow一定行蓝桥杯python组蓝桥杯
填空题试题A:拼正方形【问题描述】小蓝正在玩拼图游戏，他有7385137888721个2×2的方块和10470245个1×1的方块，他需要从中挑出一些来拼出一个正方形，比如用3个2×2和4个1×1的方块可以拼出一个4×4的正方形，用9个2×2的方块可以拼出一个6×6的正方形，请问小蓝能拼成的最大的正方形的边长为多少。【答案提交】这是一道结果填空的题，你只需要算出结果后提交即可。本题的结果为一个整数
python中的numpy库有什么优缺点_python中关于numpy库的介绍 weixin_34938347
1.Numpy是什么？NumPy(NumericalPython的缩写)是一个开源的Python科学计算库。使用NumPy，就可以很自然地使用数组和矩阵。NumPy包含很多实用的数学函数，涵盖线性代数运算、傅里叶变换和随机数生成等功能。这个库的前身是1995年就开始开发的一个用于数组运算的库。经过了长时间的发展，基本上成了绝大部分Python科学计算的基础包，当然也包括所有提供Python接口的深
弹性算力革命：企业级GPU云服务如何重构AI与图形处理的效能边界
企业级GPU云服务是一种面向企业用户，基于云计算技术，将强大的图形处理器（GPU）资源以服务的形式提供给企业的创新模式。通过这种模式，企业无需自行购置、安装和维护昂贵的GPU硬件设备，只需按需从云端获取GPU计算资源，就能满足自身多样化的业务需求。随着人工智能、大数据、深度学习、虚拟现实以及高性能计算等前沿技术在各行业的深入渗透，企业对于大规模并行计算能力的要求越来越高。GPU凭借其卓越的并行计算
弹性算力革命：企业级GPU云服务如何重构AI与图形处理的效能边界
企业级GPU云服务是一种面向企业用户，基于云计算技术，将强大的图形处理器（GPU）资源以服务的形式提供给企业的创新模式。通过这种模式，企业无需自行购置、安装和维护昂贵的GPU硬件设备，只需按需从云端获取GPU计算资源，就能满足自身多样化的业务需求。随着人工智能、大数据、深度学习、虚拟现实以及高性能计算等前沿技术在各行业的深入渗透，企业对于大规模并行计算能力的要求越来越高。GPU凭借其卓越的并行计算
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他