weixin_39748928

python特征提取方法_大师兄的Python机器学习笔记:特征提取

一、关于分类(Classification)

1. 什么是分类

分类是机器学习的重要模块，主要用来预测数据的类别标签。

2. 常见分类问题

1) 二分类(Binary Classification)

例:新冠人数增长还是减少?

2) 多分类(Multicalss classification)

互斥。例：足球比赛结果主队是胜、平还是负?

非互斥。例：火锅底料的味道是酸、甜还是辣？

3. 分类流程

特征提取与特征选取 >> 分类器处理 >> 获得结果

二、关于特征提取

1. 特征提取与特征选取

特征提取和特征选择统称为降维(DimensionalityReduction)。

1.1 意义

研究如何从众多特征中求出那些对分类识别最有效的特征，从而实现特征空间维数的压缩,即获取一组“少而精”且分类错误概率小的分类待征.

1.2 目的

使在最小维数特征空间中异类模式点相距较远(类间距离较大)，而同类模式点相距较近(类内距离较小)。

1.3 特征要求

具有很大的识别信息量: 所提供的特征应具有很好的可分性，使分类器容易判别。

具有可靠性: 对那些模棱两可，似是而非不易判别的特征应该去掉。

具有尽可能强的独立性: 重复的、相关性强的特征只选一个，因为强的相关性并没有增加更多的分类信息，不能要。

数量尽可能少，同时损失的信息尽量小。

1.4 特征提取(Feature Extraction)

常用的方法有主成分分析(PCA)，独立成分分析(ICA)，线性判别分析(LDA)。

将提取的k维特征子集 [Xs1,Xs2,........Xsk] 映射到新特征 [Ye1,Ye2, ...,Yen]上起到进一步的降维。

特征提取后的新特征是原来特征的一个映射。

1.5 特征选取(Feature Selection)

特征选择是从样本集中选取重要的特征子集。

常用特征选择有过滤法(Filter)，包裹法(Wrapper)，嵌入法(Embedded)等。

特征选择后的特征是原来特征的一个子集。

image.png

2. 特征选取常用方法

常用方法有过滤法，包裹法和嵌入法。

2.1 过滤法(Filter)

过滤法按照特征的发散性或相关性对各个特征进行评分，设定阈值或者选择阈值的个数，完成特征选择。

特征的发散性：特征在不同样本之间的差异性。

特征的相关性：特征值和目标值之间在数据上的因果关系。

1) 方差法(VarianceThreshold)

方差法通过计算每个特征的均值和方差，设定一个基础阈值。

当该维度的特征方差小于基础阈值时，则丢弃该特征。

这种方法简单高效的过滤了一些低方差的特征，但依赖于阈值的设置。

>>>import os

>>>import pandas as pd

>>>from sklearn.feature_selection import VarianceThreshold

>>>def to_float(func):

>>> def wrapper(*args,**kwargs):

>>> # 将数据改为浮点数

>>> data = func(*args,**kwargs)

>>> for column in data:

>>> if column == 'date': continue # 跳过日期

>>> if str(data[column][1]).isdigit(): # 如果是数字

>>> data[column] = data[column].astype('float') # 将列转为浮点数

>>> return data

>>> return wrapper

>>>@to_float

>>>def read_csv(file):

>>> # 获得文件中的数据

>>> return pd.read_csv(file)

>>>def sort_by_varianceThreshold(dataset,threshold):

>>> # 使用方差法过滤特征

>>> sel = VarianceThreshold(threshold)

>>> return sel.fit_transform(dataset)

>>>if __name__ == '__main__':

>>> file_path = os.path.join('D:\\','dataset','us-counties.csv')

>>> data = read_csv(file_path)#

>>> data_selected = data[['cases','deaths']] # 选出2个特征

>>> threshold=(.7*(1-.7)) # 阈值设置为比例超过70%的特征

>>> print(sort_by_varianceThreshold(data_selected,threshold))

[[ 1. 0.]

[ 1. 0.]

...

[56. 0.]

[ 4. 0.]

[ 4. 0.]]

2) 单变量特征选择

单变量特征选择能够对每一个特征进行测试，衡量该特征和响应变量之间的关系,根据得分扔掉不好的特征。

单变量特征选择方法,独立的衡量每个特征与响应变量之间的关系

SelectKBest : 移除那些除了评分最高的 K 个特征之外的所有特征。

SelectPercentile: 移除除了用户指定的最高得分百分比之外的所有特征。

GenericUnivariateSelect: 允许使用可配置方法来进行单变量特征选择。

>>>import os

>>>import pandas as pd

>>>from sklearn.feature_selection import SelectKBest,chi2

>>>def to_float(func):

>>> def wrapper(*args,**kwargs):

>>> # 将数据改为浮点数

>>> data = func(*args,**kwargs)

>>> for column in data:

>>> if column == 'date': continue # 跳过日期

>>> if str(data[column][1]).isdigit(): # 如果是数字

>>> data[column] = data[column].astype('float') # 将列转为浮点数

>>> return data

>>> return wrapper

>>>@to_float

>>>def read_csv(file):

>>> # 获得文件中的数据

>>> return pd.read_csv(file)

>>>def sort_by_transform(x,y,k):

>>> # 使用卡方检验过滤特征,选出最好的k个特征

>>> return SelectKBest(chi2,k=k).fit_transform(x,y)

>>>if __name__ == '__main__':

>>> file_path = os.path.join('D:\\','dataset','us-counties.csv')

>>> data = read_csv(file_path)#

>>> data_selected = data[['cases','deaths']] # 选出2个特征

>>> data_deaths = data['deaths']

>>> print(sort_by_transform(data_selected,data_deaths,1)) # 这里直接选用死亡数据作为评估器，所以返回卡方选出的数据一定是死亡数据

[[ 1.]

[ 1.]

...

[56.]

[ 4.]

[ 4.]]

2.2 包裹法(Wrapper)

包裹法就是选定特定算法，然后再根据算法效果来选择特征集合,通过不断的启发式方法来搜索特征。

从最终的学习器性能来看，包裹式特征选择比过滤式特征选择更好。

但是由于在特征选择过程中需多次训练学习期，因此包裹式特征选择的计算开销通常要大得多。

>>>import os

>>>import pandas as pd

>>>from sklearn.feature_selection import RFE

>>>from sklearn.svm import SVR

>>>def to_float(func):

>>> def wrapper(*args,**kwargs):

>>> # 将数据改为浮点数

>>> data = func(*args,**kwargs)

>>> for column in data:

>>> if column == 'date': continue # 跳过日期

>>> if str(data[column][1]).isdigit(): # 如果是数字

>>> data[column] = data[column].astype('float') # 将列转为浮点数

>>> return data

>>> return wrapper

>>>@to_float

>>>def read_csv(file):

>>> # 获得文件中的数据

>>> return pd.read_csv(file)

>>>def sort_by_wrapper(x,y,k,step=1):

>>> estimator = SVR(kernel='linear')

>>> selector = RFE(estimator,k,step=step) # 通过处理越来越少的特征集合来递归的选择特征。

>>> return selector.fit(x,y)

>>>if __name__ == '__main__':

>>> file_path = os.path.join('D:\\','dataset','us-counties.csv')

>>> data = read_csv(file_path)#

>>> data_selected = data[['cases','deaths']].loc[[0,1,2,3,4,5]]

>>> data_deaths = data['deaths'].loc[[0,1,2,3,4,5]]

>>> selector = sort_by_wrapper(data_selected,data_deaths,1)

>>> print(f'特征选择结果:{selector.support_},排行:{selector.ranking_}')

选择结果:[False True],排行:[2 1]

2.3 嵌入法(Embedded)

就是利用正则化的思想，配置特征属性的权重，权重为0则等于被舍弃了。

>>>import os

>>>import pandas as pd

>>>from sklearn.feature_selection import SelectFromModel

>>>from sklearn.svm import LinearSVC

>>>def to_float(func):

>>> def wrapper(*args,**kwargs):

>>> # 将数据改为浮点数

>>> data = func(*args,**kwargs)

>>> for column in data:

>>> if column == 'date': continue # 跳过日期

>>> if str(data[column][1]).isdigit(): # 如果是数字

>>> data[column] = data[column].astype('float') # 将列转为浮点数

>>> return data

>>> return wrapper

>>>@to_float

>>>def read_csv(file):

>>> # 获得文件中的数据

>>> return pd.read_csv(file)

>>>def sort_by_Model(x,y):

>>> lsvc = LinearSVC(C=0.01,penalty='l1',dual=False).fit(x,y)

>>> model = SelectFromModel(lsvc,prefit=True)

>>> return model.transform(x)

>>>if __name__ == '__main__':

>>> file_path = os.path.join('D:\\','dataset','us-counties.csv')

>>> data = read_csv(file_path)#

>>> data_selected = data[['cases','deaths']].loc[[x for x in range(0,1000)]]

>>> data_deaths = data['deaths'].loc[[x for x in range(0,1000)]]

>>> print(sort_by_Model(data_selected,data_deaths).shape)

(1000, 2)

3. 特征提取常用方法

常用的方法有主成分分析(PCA)，独立成分分析(ICA)，线性判别分析(LDA)。

如果数据有类别，最好先考虑用LDA降维，也可先用小幅度的PCA降维消除噪声再用LDA降维。

若训练数据无类别，则优先考虑PCA。

3.1 主成分分析(PCA)

PCA是最常用的线性降维方法，它的目标是通过某种线性投影，将高维的数据映射到低维的空间中表示, 并期望在所投影的维度上数据的方差最大(样本的分布最散乱)以使用较少的数据维度同时保留住较多的原数据点的特征。

优点：

仅仅需要以方差衡量信息量，不受数据集以外的因素影响。

各主成分之间正交，可消除原始数据成分间的相互影响的因素。

计算方法简单，主要运算是特征值分解，易于实现。

缺点：

提取出的各个特征维度的含义具有一定的模糊性，不如原始样本特征的解释性强。

PCA会消除一些类信息，但是方差小的非主成分也可能含有对样本差异的重要信息，因降维丢弃可能对后续数据处理有影响。

>>>import os

>>>import pandas as pd

>>>import matplotlib.pyplot as plt

>>>import numpy as np

>>>from sklearn.decomposition import PCA

>>>def to_float(func):

>>> def wrapper(*args,**kwargs):

>>> # 将数据改为浮点数

>>> data = func(*args,**kwargs)

>>> for column in data:

>>> if column == 'date': continue # 跳过日期

>>> if str(data[column][1]).isdigit(): # 如果是数字

>>> data[column] = data[column].astype('float') # 将列转为浮点数

>>> return data

>>> return wrapper

>>>def to_display(func):

>>> def wrapper(*args, **kwargs):

>>> # 可视化

>>> data = func(*args,**kwargs)

>>> x = np.array([np.arange(len(data))])

>>> plt.scatter(x,data,marker='X')

>>> plt.show()

>>> return data

>>> return wrapper

>>>@to_float

>>>def read_csv(file):

>>> # 获得文件中的数据

>>> return pd.read_csv(file)

>>>@to_display

>>>def sort_by_PCA(x):

>>> pca = PCA(n_components=1) # 加载PCA算法，设置降维后主成分数为2

>>> reduced_x = pca.fit_transform(x)

>>> return reduced_x

>>>if __name__ == '__main__':

>>> file_path = os.path.join('D:\\','dataset','us-counties.csv')

>>> data = read_csv(file_path)#

>>> data_selected = data[['cases','deaths']].loc[[x for x in range(0,100)]]

>>> sort_by_PCA(data_selected)

3.2 独立成分分析(ICA)

ICA寻找的是最能使数据的相互独立的方向，而PCA仅要求方向是不相关的。

独立可以推出不相关，反之则不可以，而高斯分布的情况下独立等价于不相关。

因此ICA需要数据的高阶统计量，PCA则只需要二阶统计量。

>>>import os

>>>import pandas as pd

>>>import matplotlib.pyplot as plt

>>>import numpy as np

>>>from sklearn.decomposition import FastICA

>>>def to_float(func):

>>> def wrapper(*args,**kwargs):

>>> # 将数据改为浮点数

>>> data = func(*args,**kwargs)

>>> for column in data:

>>> if column == 'date': continue # 跳过日期

>>> if str(data[column][1]).isdigit(): # 如果是数字

>>> data[column] = data[column].astype('float') # 将列转为浮点数

>>> return data

>>> return wrapper

>>>def to_display(func):

>>> def wrapper(*args, **kwargs):

>>> # 可视化

>>> data = func(*args,**kwargs)

>>> print(args[1])

>>> plt.scatter(args[1],data,marker='X')

>>> plt.show()

>>> return data

>>> return wrapper

>>>@to_float

>>>def read_csv(file):

>>> # 获得文件中的数据

>>> return pd.read_csv(file)

>>>@to_display

>>>def sort_by_ICA(x,y):

>>> ica = FastICA(n_components=1) # 加载PCA算法，设置降维后主成分数为2

>>> reduced_x = ica.fit_transform(x)

>>> return reduced_x

>>>if __name__ == '__main__':

>>> file_path = os.path.join('D:\\','dataset','us-counties.csv')

>>> data = read_csv(file_path)#

>>> data_selected = data[['cases','deaths']].loc[[x for x in range(0,100)]]

>>> data['date'] = pd.to_datetime(data.date)

>>> date = data[['date']].loc[[x for x in range(0,100)]]

>>> sort_by_ICA(data_selected,date)

3.3 线性判别分析(LDA)

LDA也称为Fisher判别分析，是从更利于分类的角度来降维.

LDA投影后希望每一种类别数据的投影点尽可能的接近，而不同类别的数据的类别中心之间的距离尽可能的大。

LDA算法优点：

在降维过程中可以使用类别的先验知识经验，而像PCA这样的无监督学习则无法使用类别先验知识。

LDA在样本分类信息依赖均值而不是方差的时候，比PCA之类的算法较优。

LDA算法缺点：

LDA不适合对非高斯分布样本进行降维，PCA也有这个问题。

LDA降维最多降到类别数k-1的维数，如果我们降维的维度大于k-1，则不能使用LDA。当然目前有一些LDA的进化版算法可以绕过这个问题。

LDA在样本分类信息依赖方差而不是均值的时候，降维效果不好。

LDA可能过度拟合数据。

>>>import os

>>>import pandas as pd

>>>import matplotlib.pyplot as plt

>>>import numpy as np

>>>from sklearn.decomposition import LatentDirichletAllocation

>>>def to_float(func):

>>> def wrapper(*args,**kwargs):

>>> # 将数据改为浮点数

>>> data = func(*args,**kwargs)

>>> for column in data:

>>> if column == 'date': continue # 跳过日期

>>> if str(data[column][1]).isdigit(): # 如果是数字

>>> data[column] = data[column].astype('float') # 将列转为浮点数

>>> return data

>>> return wrapper

>>>def to_display(func):

>>> def wrapper(*args, **kwargs):

>>> # 可视化

>>> data = func(*args,**kwargs)

>>> plt.scatter(args[1],data,marker='X')

>>> plt.show()

>>> return data

>>> return wrapper

>>>@to_float

>>>def read_csv(file):

>>> # 获得文件中的数据

>>> return pd.read_csv(file)

>>>@to_display

>>>def sort_by_LDA(x,y):

>>> lda = LatentDirichletAllocation(n_components=1) # 加载PCA算法

>>> reduced_x = lda.fit_transform(x)

>>> return reduced_x

>>>if __name__ == '__main__':

>>> file_path = os.path.join('D:\\','dataset','us-counties.csv')

>>> data = read_csv(file_path)#

>>> data_selected = data[['cases']].loc[[x for x in range(0,100)]]

>>> data['date'] = pd.to_datetime(data.date)

>>> date = data[['date']].loc[[x for x in range(0,100)]]

>>> sort_by_LDA(data_selected,date)

你可能感兴趣的:(python特征提取方法)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
上位机知识篇---SD卡&U盘镜像
常用的镜像烧录软件balenaEtcherbalenaEtcher是一个开源的、跨平台的工具，用于将操作系统镜像文件（如ISO和IMG文件）烧录到SD卡和USB驱动器中。以下是其使用方法、使用场景和使用注意事项的介绍：使用方法下载安装：根据自己的操作系统，从官方网站下载对应的安装包。Windows系统下载.exe文件后双击安装；Linux系统若下载的是.deb文件，可在终端执行“sudodpkg-
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
LeetCode 148. 排序链表：归并排序的细节解析进击的小白菜 2025 Top100 详解 leetcode 链表算法
文章目录题目描述一、方法思路：归并排序的核心步骤二、关键实现细节：快慢指针分割链表1.快慢指针的初始化问题2.为什么选择`fast=head.next`？示例1：链表长度为偶数（`1->2->3->4`）三、完整代码实现四、复杂度分析五、总结题目描述LeetCode148题要求对链表进行排序，时间复杂度需为O(nlogn)，且空间复杂度为O(logn)。由于链表的特殊结构（无法随机访问），归并排序
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
基于开源AI智能名片链动2+1模式与S2B2C商城小程序的渠道选择策略研究说私域人工智能小程序
摘要：在数字化商业环境下，品牌与产品的渠道选择对其市场推广和运营成功至关重要。本文聚焦于如何依据自身品牌和产品特性，结合开源AI智能名片链动2+1模式与S2B2C商城小程序，运用科学的渠道选择方法，慎重挑选1-2个适宜平台，集中资源发力并取得成绩后再拓展其他渠道。通过理论分析与案例研究，探讨该策略的有效性和可行性，为企业渠道布局提供参考。关键词：渠道选择；开源AI智能名片；链动2+1模式；S2B2
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
基于架构的软件设计（Architecture-Based Software Design，ABSD）是一种以架构为核心的软件开发方法
ABSD方法与生命周期基于架构的软件设计（Architecture-BasedSoftwareDesign，ABSD）是一种以架构为核心的软件开发方法，强调在开发的各个阶段都要以架构为中心，确保系统的整体结构和质量属性得到有效管理。ABSD方法是一个自顶向下、递归细化的过程，软件系统的架构通过该方法得到细化，直到能产生软件构件和类。ABSD方法的三个基础功能的分解：使用基于模块的内聚和耦合技术，将
【前端】jQuery数组合并去重方法总结
在jQuery中合并多个数组并去重，推荐使用原生JavaScript的Set对象（高效简单）或$.unique()（仅适用于DOM元素，不适用于普通数组）。以下是完整解决方案：方法1：使用ES6Set（推荐）//定义多个数组constarr1=[1,2,3];constarr2=[2,3,4];constarr3=[3,4,5];//合并数组并用Set去重constmergedArray=[...
C++ 设计模式：抽象工厂（Abstract Factory）冀晓武 C++设计模式 c++设计模式抽象工厂模式
链接：C++设计模式链接：C++设计模式-工厂方法链接：C++设计模式-原型模式链接：C++设计模式-建造者模式抽象工厂（AbstractFactory）是一种创建型设计模式，它提供一个接口，用于创建一系列相关或相互依赖的对象，而无需指定它们的具体类。抽象工厂模式通常用于创建一组相关的产品对象，例如不同类型的机器人和它们的配件。1.问题分析在某些情况下，我们需要创建一组相关或相互依赖的对象，但我们
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
EMQX 社区版单机和集群部署 pcj_888 MQTT MQTT EMQ
EMQ支持Docker，宿主机，k8s部署；支持单机或集群部署。以下给出EMQX社区版单机和集群部署方法1.Docker单机部署官方推荐最小配置：2核4G下载容器镜像dockerpullemqx/emqx:5.3.2启动容器dockerrun-d--nameemqx\-p1883:1883\-p8083:8083\-p8883:8883\-p8084:8084\-p18083:18083\emqx
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
C++设计模式：简单工厂、工厂方法、抽象工厂起个别名 C++算法 c++
1.工厂模式的特点在我们现实生活中，买馒头和自己蒸馒头、去饭店点一份大盘鸡和自己养鸡，杀鸡，做大盘鸡，这是全然不同的两种体验：自己做麻烦，而且有失败的风险，需要自己承担后果。买现成的，可以忽略制作细节，方便快捷并且无风险，得到的肯定是美味的食物。对于后者，就相当于是一个加工厂，通过这个工厂我们就可以得到想要的东西，在程序设计中，这种模式就叫做工厂模式，工厂生成出的产品就是某个类的实例，也就是对象。
docker安装node部分问题自律的蜗牛 docker 容器 node.js
sudonlatestsudo:n:commandnotfound如果运行sudonlatest时出现：sudo:n:commandnotfound说明n版本管理工具未安装或未添加到PATH环境变量。解决方案1️⃣先检查n是否已安装运行：whichn或者：command-vn如果有输出/usr/local/bin/n，说明n已安装，但可能需要sudo访问。如果没有任何输出，说明n没有安装，跳到方法
本地包解决npm error code E404 雅痞yuppie npm 前端 node.js
这个错误提示表明npm找不到名为create-vue-admin-cli的包。这是因为你开发的CLI工具还没有发布到npm官方注册表。要解决这个问题，有两种方法：方法一：使用本地开发模式测试1.确保你的CLI已正确链接到全局在你的vue-admin-cli项目根目录下执行：npmlink这会在全局环境中创建一个符号链接，指向你本地的CLI项目。2.使用本地链接的CLI创建项目直接使用命令：vue-
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
前端 NPM 包的依赖可视化分析工具推荐前端视界前端艺匠馆前端 npm arcgis ai
前端NPM包的依赖可视化分析工具推荐关键词：NPM、依赖管理、可视化分析、前端工程、包管理、依赖冲突、性能优化摘要：本文将深入探讨前端开发中NPM包依赖可视化分析的重要性，介绍5款主流工具的使用方法和特点，并通过实际案例展示如何利用这些工具优化项目依赖结构、解决版本冲突问题以及提升构建性能。文章将帮助开发者更好地理解和掌控项目依赖关系，提高开发效率和项目可维护性。背景介绍目的和范围本文旨在为前端开
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》