septnancye

Python数据预处理和PCA、ICA、LDA降维的方法(实验代码)

1.标准差标准化

数据预处理——标准差标准化

数据预处理——离差标准化

数据预处理——非线性转换

数据预处理——归一化

数据预处理——二值化

数据预处理——独热编码

数据预处理——缺失值的插补

数据预处理——生成多项式特征

2,降维

PCA

ICA

LDA

数据预处理——标准化

标准化是指将数据按比例缩放，并落入某个特定区间，目的是消除特征间量纲和取值范围差异的影响。

常用的标准化方法：标准差标准化和离差标准化。

1.标准差标准化

标准差标准化也称零均值标准化或分数标准化，是当前使用最广泛的数据标准化方法。经标准差标准化处理后的数据的标准差为1，均值为0，其转化公式如下公式所示。

其中 X ̅为原始数据的均值， δ为原始数据的标准差。注意，这里的标准差是指加了Delta Degrees of Freedom因子后的标准差，这与传统的标准差计算公式有区别（在numpy中，有std()函数用于计算标准差）。

preprocessing模块的StandardScaler类可用于特征的标准差标准化处理。StandardScaler类能创建标准差标准化转换器，其基本语法格式如下。

class sklearn.preprocessing.StandardScaler(copy=True, with_mean=True, with_std=True)

StandardScaler类常用的参数及其说明，如下表所示。

StandardScaler类
参数名称	说明
with_mean	接收bool。若为True，表示在缩放数据前进行中心化，当数据为稀疏矩阵时，将不起作用并可能引起异常。默认为True
with_std	接收bool。表示是否将数据缩放为单位方差或单位标准差。默认为True

StandardScaler对象拥有4个属性，如下表所示。

StandardScaler对象
属性	说明
scale_	每个特征对应的数据缩放比例
mean_	每个特征的均值
var_	每个特征的方差
n_samples_seen_	由估算器分配给每个特征的样本数

StandardScaler对象提供7种方法，如下表所示。

StandardScaler对象提供7种方法
方法	格式	说明
fit	fit(X, y=None)	计算标准化所需的均值与方差
fit_transform	fit_transform(X, y=None, **fit_params)	先应用fit方法，然后应用transform方法
get_params	get_params(deep=True)	获取对象参数
inverse_transform	inverse_transform(X, copy=None)	将应用了变换的数据转换回原数据
partial_fit	partial_fit(X, y=None)	在线fit方法
set_params	set_params(**params)	设置对象参数
transform	transform(X, y='deprecated', copy=None)	对数据X进行转换

数据预处理——标准差标准化

标准差标准化
样本	收入	年龄
1	7688	32
2	5788	29
3	4600	25
4	8900	35
5	9600	38
6	8100	33

from sklearn import preprocessing
import numpy as np
x_a = np.array([[7688,32],[5788,29],
                [4600,25],[8900,35]])
x_b = np.array([[9600,38],[8100,33]])

std_transformer = preprocessing.StandardScaler().fit(x_a)
x_train = preprocessing.StandardScaler().fit_transform(x_a)
x_test = preprocessing.StandardScaler().fit_transform(x_b)

print('训练集的标准差标准化:\n' , x_train)
print('训练集的标准差标准化:\n' , x_test)

print('特征均值为: \n' , std_transformer.mean_,'\n' ,
      '特征方差为:', std_transformer.var_)

print('标准化后的均值: \n' , x_train.mean(),'\n' ,
      '标准化后的方差为:', x_test.var(),'\n',
      '标准化后的标准差为:',x_train.std())

数据预处理——离差标准化

2.离差标准化

离差标准化是对原始数据的一种线性变换，是将原始数据的数值映射到[0,1]区间之间，转换公式如下式所示。

其中 max为样本数据的最大值， min为样本数据的最小值，max-min 为极差。离差标准化保留了原始数据值之间的联系，是消除量纲和数据取值范围影响最简单的方法。

preprocessing模块的MinMaxScaler类用于特征离差标准化处理。MinMaxScaler类能创建标离差标准化转换器，其基本语法格式如下。

class sklearn.preprocessing. MinMaxScaler (feature_range=(0, 1), copy=True)

MinMaxScaler对象拥有5个属性，如下表所示。

MinMaxScaler对象的属性
属性	说明
min_	每个特征的最小调整
scale_	每个特征对应的数据缩放比例
data_min_	每个特征的最小值
data_max_	每个特征的最大值
data_range_	每个特征的范围

from sklearn import preprocessing
import numpy as np
x_a = np.array([[7688,32],[5788,29],
                [4600,25],[8900,35]])
x_b = np.array([[9600,38],[8100,33]])

mms_transformer = preprocessing.MinMaxScaler().fit(x_a)
print('生成规则后的离差标准化转换器为: \n',mms_transformer)
x_train = preprocessing.MinMaxScaler().fit_transform(x_a)
x_test = preprocessing.MinMaxScaler().fit_transform(x_b)
print('训练集的离差标准化: \n', x_train)
print('测试集的离差标准化: \n', x_test)
print('特征最大值为: \n',mms_transformer.data_max_,'\n',
      '特征最小值为：',mms_transformer.data_min_)
print('标准化后的均值: \n' , x_train.mean(),'\n' ,
      '标准化后的方差为:', x_test.var(),'\n',
      '标准化后的标准差为:',x_train.std())

数据预处理——非线性转换

类似于标准化处理，将数据映射到[0,1]的均匀分布上。非线性转换将每个特征值转换到相同的范围内或者分布内，使异常数据变得平滑，可以消除不寻常的分布，并且比缩放方法更少受异常值的影响。但是，它会扭曲特征内和特征间的相关性和距离。

样本	收入	年龄
1	7688	32
2	5788	29
3	4600	25
4	8900	35
5	9600	38
6	8100	33

from sklearn import preprocessing
import numpy as np


x_a = np.array([[7688,32],[5788,29],
                [4600,25],[8900,35]])
x_b = np.array([[9600,38],[8100,33]])

quantile_transform = preprocessing.QuantileTransformer(n_quantiles=2,
                                                       random_state=0)
x_train = quantile_transform.fit_transform(x_a)
x_test = quantile_transform.fit_transform(x_b)

print('训练集的非线性转换: \n', x_train)
print('测试集的非线性转换: \n', x_test)

数据预处理——归一化

归一化也称正则化，指依照特征矩阵的行处理数据，目的在于使样本向量在点乘运算或其他核函数计算相似性时拥有统一的标准，正则化规则为L2正则项时的转换公式如下所示。

其中 n 为特征数， i 为特征序号。

preprocessing模块的 Normalizer 类用于特征归一化化处理。 Normalizer 类用于创建归一化转换器，其基本语法格式如下。

class sklearn.preprocessing.Normalizer(norm='l2', copy=True)

Normalizer对象未提供属性，比 StandardScaler 对象少了 inverse_transform 和 partial_fit 方法，如下表所示。

方法	格式	说明
fit	fit(X, y=None)	不进行任何操作，并使估计器保持不变，仅用于实现通常的API
fit_transform	fit_transform(X, y=None, **fit_params)	先应用fit方法，然后应用transform方法
get_params	get_params(deep=True)	获取对象参数
set_params	set_params(**params)	设置对象参数
transform	transform(X, y='deprecated', copy=None)	对数据X进行转换

from sklearn import preprocessing
import numpy as np


x_a = np.array([[7688,32],[5788,29],
                [4600,25],[8900,35]])
x_b = np.array([[9600,38],[8100,33]])

norm_transformer = preprocessing.Normalizer().fit(x_a)

print('生成规则后离差标准化转换器为: \n', norm_transformer)
print('归一化后的训练集为: \n', norm_transformer.transform(x_a))
print('归一化后的测试集为: \n', norm_transformer.transform(x_b))

数据预处理——二值化

特征二值化指通过设置阈值，将特征值转换为0或1，当特征值大于阈值时转换为1，小于或等于阈值时转换为0。特征二值化与数据离散化不同，特征二值化后的值落在0或1，而数据离散化落在所属区间。

preprocessing模块的Binarizer类用于特征二值化。Binarizer类用于创建二值化转换器，其基本语法格式如下

class sklearn.preprocessing.Binarizer(threshold=0.0, copy=True)

Binarizer对象较StandardScaler少了partial_fit和inverse_transform方法，如下表所示。

方法	格式	说明
fit	fit(X, y=None)	不进行任何操作，并使估计器保持不变，仅用于实现通常的API
fit_transform	fit_transform(X, y=None, **fit_params)	先应用fit方法，然后应用transform方法
get_params	get_params(deep=True)	获取对象参数
set_params	set_params(**params)	设置对象参数
transform	transform(X, y='deprecated', copy=None)	对数据X进行转换

from sklearn import preprocessing
import numpy as np


x_a = np.array([[7688,32],[5788,29],
                [4600,25],[8900,35]])
x_b = np.array([[9600,38],[8100,33]])

bin_transformer = preprocessing.Binarizer(threshold=100).fit(x_a)
print('生成规则后的二值转换器为: \n',bin_transformer)

x_train = preprocessing.Binarizer(threshold=100).fit_transform(x_a)
x_test = preprocessing.Binarizer(threshold=100).fit_transform(x_b)
print('训练集二值化: \n', x_train)
print('测试集二值化: \n',x_test)

数据预处理——独热编码

from sklearn import preprocessing
import numpy as np

x_train = np.array([['男', '北京', '已婚'],
                    ['男', '上海', '未婚'],
                    ['女', '广州', '已婚']])
x_test = np.array([['男', '北京', '未婚']])


def auto_coder(X):
    for i in range(X.shape[1]):
        X[:, i] = preprocessing.LabelEncoder().fit_transform(X[:, i])
    X = X.astype(int)
    return X

x_train_num = auto_coder(x_train)
print('转换为数值型后的训练集为: \n', x_train_num)

oe_transformer = preprocessing.OneHotEncoder().fit(x_train_num)
print('生成规则后的独热编码转换器为: \n', oe_transformer)

print('独热编码后的训练集为: \n',
      oe_transformer.transform(x_train_num).toarray())

x_test_num = auto_coder(x_test)
print('独热编码后的测试集为: \n',
      oe_transformer.transform(x_test_num).toarray())

数据预处理——缺失值的插补

import numpy as np
from sklearn.impute import SimpleImputer

imp = SimpleImputer(missing_values = np.nan, strategy = 'mean')
X = np.array([[0,4],[np.NaN,5],[np.NaN,0],[3,7]])

print('插值模型:', imp.fit(X))
print('差不第一列均值后的数据: \n', imp.transform(X))

数据预处理——生成多项式特征

import numpy as np
from sklearn.preprocessing import PolynomialFeatures

poly = PolynomialFeatures(2)
X = np.array([[0,4],[1,5],[2,6],[3,7]])

print('多项式模型:', poly.fit(X))
print('多项式转换后特征: \n', poly.transform(X))

2,降维

PCA

from sklearn import datasets

iris = datasets.load_iris()
x = iris.data

print('iris数据集前十行为: \n', x[: 10])
print('iris数据集的维度为:', x.shape)

from sklearn.decomposition import PCA

pca = PCA(n_components= 3).fit(x)
print('指定特征数的PCA模型为: \n', pca)
pcal = PCA(n_components= 0.95).fit(x)
print('指定方差百分比的PCA模型为: \n', pcal)
pca2 = PCA(n_components= 'mle').fit(x)
print("指定MLE算法的PCA模型为: \n", pca2)

print('各项特征的方差为:', pca.explained_variance_)
print('降维后的特征的方差占比为:',pca.explained_variance_ratio_)

x_pca = pca.transform(x)
print('指定特征数的降维结果前十行数据为: \n', x_pca[: 10])

x_pcal = pcal.transform(x)
print('指定方差百分比的降维结果前十行数据为: \n', x_pcal[: 10])

x_pca2 = pca2.transform(x)
print('MLE算法的降维结果前十行数据为: \n', x_pca2[: 10])

ICA

import numpy as np
from scipy import signal

np.random.seed(0)
n_samples = 2000
time = np.linspace(0,8,n_samples)

waft1 = np.sin(2*time)
waft2 = np.sign(3*time)
waft3 = signal.sawtooth(2*np.pi*time)
print('正弦信号为: \n', waft1,
      '方波信号为: \n', waft2,
       '锯齿信号为: \n', waft3)

waft = np.c_[waft1,waft2,waft3]
waft += 0.2*np.random.normal(size= waft.shape)
waft /= waft.std(axis = 0)
arr = np.array([[1,1,1],[0.5,2,1.0],[1.5,1.0,2.0]])
mix_waft = np.dot(waft,arr.T)
print('混淆信号为: \n', mix_waft)

from sklearn.decomposition import FastICA
ica = FastICA(n_components= 3).fit(mix_waft)
print('ICA模型为: \n', ica)

ica_mixing = ica.mixing_
print('ICA使用的混淆矩阵: \n', ica_mixing)

import matplotlib.pyplot as plt

waft_ica = ica.transform(mix_waft)
waft_pca = PCA(n_components= 3).fit(mix_waft)
plt.figure(figsize= [12,6])
plt.rcParams['font.sans-serif'] = 'SimHei'
plt.rcParams['axes.unicode_minus'] = False
models = [mix_waft, waft, waft_ica, waft_pca]
names = ['混淆信号','实际源信号','ICA复原信号','PCA复原信号']
colors = ['red','steelblue','orange']

for i, (model, name) in enumerate(zip(models,names), 1):
    plt.subplot(4,1,i)
    plt.title(name)
    for sig, color in zip(model.T,colors):
        plt.plot(sig, color = color)
    plt.subplots_adjust(0.09,0.04,0.94,0.94,0.26,0.46)
    plt.show()

LDA

from sklearn import datasets

iris = datasets.load_iris()
x = iris.data

print('iris数据集前十行为: \n', x[: 10])
print('iris数据集的维度为:', x.shape)

from sklearn.decomposition import PCA

pca = PCA(n_components= 3).fit(x)
print('指定特征数的PCA模型为: \n', pca)
pcal = PCA(n_components= 0.95).fit(x)
print('指定方差百分比的PCA模型为: \n', pcal)
pca2 = PCA(n_components= 'mle').fit(x)
print("指定MLE算法的PCA模型为: \n", pca2)

print('各项特征的方差为:', pca.explained_variance_)
print('降维后的特征的方差占比为:',pca.explained_variance_ratio_)

x_pca = pca.transform(x)
print('指定特征数的降维结果前十行数据为: \n', x_pca[: 10])

x_pcal = pcal.transform(x)
print('指定方差百分比的降维结果前十行数据为: \n', x_pcal[: 10])

x_pca2 = pca2.transform(x)
print('MLE算法的降维结果前十行数据为: \n', x_pca2[: 10])

import numpy as np
from scipy import signal

np.random.seed(0)
n_samples = 2000
time = np.linspace(0,8,n_samples)

waft1 = np.sin(2*time)
waft2 = np.sign(3*time)
waft3 = signal.sawtooth(2*np.pi*time)
print('正弦信号为: \n', waft1,
      '方波信号为: \n', waft2,
       '锯齿信号为: \n', waft3)

waft = np.c_[waft1,waft2,waft3]
waft += 0.2*np.random.normal(size= waft.shape)
waft /= waft.std(axis = 0)
arr = np.array([[1,1,1],[0.5,2,1.0],[1.5,1.0,2.0]])
mix_waft = np.dot(waft,arr.T)
print('混淆信号为: \n', mix_waft)

from sklearn.decomposition import FastICA
ica = FastICA(n_components= 3).fit(mix_waft)
print('ICA模型为: \n', ica)

ica_mixing = ica.mixing_
print('ICA使用的混淆矩阵: \n', ica_mixing)

from sklearn.discriminant_analysis import LinearDiscriminantAnalysis

y = iris.target
lda = LinearDiscriminantAnalysis(n_components= 2).fit(x, y)
print('LDA模型为: \n', lda)

pca = PCA(n_components= 2).fit(x)
print('PCA模型为: \n', pca)

print('LDA模型方差百分比为:', lda.explained_variance_ratio_)
print('LDA模型类标签为:', lda.classes_)

target_name = iris.target_names
x_lda = lda.transform(x)
x_pca = pca.transform(x)

plt.figure()
plt.rcParams['font.sans-serif'] = 'SimHei'
plt.rcParams['axes.unicode_minus'] = False
colors = ['navy','turquoise','darkorange']
markers = ['*','.','d']
lw = 2
for color,i,target_name,marker in zip(colors,[0,1,2],
                                      target_name,markers):
    plt.scatter(x_lda[y ==i,0],x_lda[y ==i,1],
                alpha=.8, color=color,label=target_name,
                marker=marker)
plt.legend(loc = 'best',shadow = False, scatterpoints = 1)
plt.title('LDA降维结果')
plt.show()

因果推理与因果学习原理与代码实战案例讲解 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
因果推理与因果学习原理与代码实战案例讲解作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：因果关系发现、因果推断、因果学习、机器学习、统计方法1.背景介绍1.1问题的由来在现实世界的数据分析中，我们经常面临这样的挑战：从观察数据中识别出潜在的原因与效果之间的关联，并理解这些关联背后的实际机制。传统的预测建模关注于基于输入变量对输出变量进行预测，
信息检索简介——文本处理、搜索引擎、数据挖掘、机器学习、推荐系统等 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介2005年8月17日至9月3日在美国加利福尼亚州伯克莱纳举行了SIGIR国际会议（中文全称“计算机信息retrieval国际会议”），这是信息检索领域的顶级会议之一。该会议由ACM主办，主题涵盖了包括文本处理、搜索引擎、数据挖掘、机器学习、推荐系统等多个热门方向。此次会议是第一次将信息检索作为一个学科，并取得重大突破。本文试图对SIGIR进行一个完整的介绍，阐述
Flask入门基础1 浅清陌 Flask flask python 后端
1Flask简介Flask诞生于2010年，是Arminronacher（阿明·罗纳彻）用Python语言基于Werkzeug工具箱编写的轻量级Web开发框架。Flask本身相当于一个内核，其他几乎所有的功能都要用到扩展（邮件扩展Flask-Mail，用户认证Flask-Login，数据库Flask-SQLAlchemy），都需要用第三方的扩展来实现。比如可以用Flask扩展加入ORM、窗体验证工
C++封装python调用库技术大白 c++开发语言
传结构体中间用空字符串问题使用callback传输结构体，中间出现\0字符，使用std::vector类型voidPyProcessInterface::ProcessContent(constchar*buff,UINT32size,boolfromSelf){if(callback){std::vectordataVec(buff,buff+size);callback(std::move(d
Git 学习笔记笑衬人心。 git 学习笔记
Git简介Git是一个分布式版本控制系统，用于跟踪文件更改，协作开发软件项目。特点：分布式：每个开发者本地都有完整仓库。高效：分支和合并操作快速。安全：数据通过哈希存储，不易被篡改。安装GitWindows:下载地址：https://git-scm.com/安装后可使用GitBash。macOS:brewinstallgitLinux:sudoaptupdatesudoaptinstallgitG
React Native 鸿蒙化学习指南
ReactNative鸿蒙化学习指南随着鸿蒙系统的不断发展，越来越多的开发者开始关注如何将ReactNative应用适配到鸿蒙平台上。本文将为大家提供一份详细的ReactNative鸿蒙化学习指南，帮助大家快速上手。一、版本信息与配套环境（一）当前适配版本当前ReactNative鸿蒙版本基于社区RN0.72.5进行适配，发布版本信息如下名称版本号react-native-harmony.tgz0
R 语言简介：数据分析与统计的强大工具 Mikhail_G python 数据分析大数据 r语言开发语言
大家好!在如今这个数据驱动的时代，数据分析与统计分析对于各个领域都变得至关重要。而R语言，作为一款专为数据分析和统计而设计的编程语言，以其强大的功能和灵活性，成为了众多数据分析师、研究人员以及统计学家的首选工具之一。什么是R语言?R是一种开源的编程语言和软件环境，主要用于统计计算、数据分析、图形表示以及机器学习等领域。它是由RossIhaka和RobertGentleman于1995年开发的，之后
22种创新思路！今年必将是特征选择爆发的一年小唯啊小唯人工智能注意力机制特征选择
2025深度学习发论文&模型涨点之——特征选择特征选择是机器学习和数据挖掘领域中一个非常重要的步骤。它指的是从原始特征集合中挑选出对目标变量有较强预测能力的特征子集。在实际的数据集中，往往包含众多特征，但并非所有特征都对模型的性能有正面影响。例如在房价预测任务中，原始特征可能包括房屋的面积、房间数量、所在小区、周边配套设施等众多内容。通过特征选择，可以剔除一些无关的或者冗余的特征，比如可能存在的重
量化价值投资入门：Fama-French三因子模型详解与实战应用量化价值投资入门到精通 ai
量化价值投资入门：Fama-French三因子模型详解与实战应用关键词：量化投资、Fama-French三因子模型、价值投资、因子投资、资产定价、Python实现、投资组合管理摘要：本文深入解析Fama-French三因子模型的理论基础、数学原理和实际应用。作为现代金融学最重要的资产定价模型之一，三因子模型通过市场因子、规模因子和价值因子解释股票收益差异。我们将从模型起源开始，详细讲解其数学表达和
Python操作百度网盘指南 weixin_47233946 编程 python 开发语言
##介绍百度网盘是中国流行的云存储服务，通过API可以实现自动化操作。本指南介绍如何使用Python操作百度网盘，包括上传、下载、管理文件等功能。##准备工作###1.获取百度网盘开发者权限1.访问[百度开发者中心](https://pan.baidu.com/union/home)2.注册开发者账号并创建应用3.获取API密钥（AppKey和SecretKey）###2.安装必要的Python库
python读取sas数据集_SASpy模块，利用Python操作SAS
SASpy模块打通了Python与SAS之间的连接。有了SASpy模块，我们就能够在Python中操控SAS。本文将首先介绍SASpy模块的一些基本方法，最后通过一个聚类分析的例子，来展示如何在Python中调用SAS的机器学习过程，以及对聚类结果的可视化。SASpy模块特点1、需要Python3.X及以上，SAS9.4及以上，需要Java环境；2、无论是本地SAS还是远程服务器上的SAS，都可以
从数据抓取到分析：用Python爬虫获取、清洗与可视化数据程序员威哥 python 爬虫 c++
在数据科学领域，数据的获取、清洗与分析是整个数据处理过程中的关键步骤。随着互联网上数据的不断增多，使用Python爬虫抓取网站数据并进行分析已成为数据科学家和分析师的常见任务。本篇文章将通过具体的实例，展示如何使用Python从零开始抓取数据，清洗数据，并进行数据分析和可视化。1.数据抓取：用Python爬虫获取网页数据1.1选择爬虫工具Python提供了多个强大的爬虫框架和库，常用的工具包括：r
从 “啃书焦虑” 到 “项目通关”：NLP 学习的破局之道木旭林晖自然语言处理学习人工智能
嘿，你好。在CSDN上潜水这么久，我总能看到很多像你我当年一样，怀揣着NLP大厂梦的同学。我猜，你的收藏夹里一定塞满了“NLP必读清单”，书架上可能还放着那本厚得像砖头一样的《统计学习方法》或者“龙书”。每天深夜，你可能都在跟一个又一个复杂的数学公式死磕。什么最大熵模型、什么CRF（条件随机场）的推导……你觉得自己离“精通”越来越近，但心里却越来越慌。为什么慌？因为你打开招聘软件，看到JD（职位描
go语言学习第5章：函数余厌厌厌 golang go 开发语言学习
第5章：函数函数是编程中不可或缺的一部分，它封装了一段可重复使用的代码，用于执行特定的任务。在Go语言中，函数同样扮演着重要的角色。本章将详细介绍Go语言中函数的定义、调用、参数传递、返回值处理以及一些高级特性，如闭包和匿名函数。一、函数的定义与调用（一）函数的定义在Go语言中，函数的定义使用func关键字。基本语法如下：func函数名(参数列表)返回值列表{//函数体}函数名：函数的名称，用于调
GO 语言学习之函数唯独不开心 golang 学习 go 开发语言
函数我们一直都在使用，但是还是有很多细节的内容需要深入了解一下，方便后续的编码实践。函数定义：func函数名([参数列表])[返回值]{函数体}funcadd(aint,bint)int{returna+b}基本概念：函数签名（FunctionSignature）：包含函数名、参数列表（参数的类型和顺序）以及返回值类型。在示例中add(aint,bint)int就是函数签名。它定义了函数的外部接口
Python基础（吃洋葱小游戏） aaiier python pygame 开发语言
下面我将为你设计一个"吃洋葱小游戏"的Python实现方案，使用Pygame库开发。这个游戏模拟吃洋葱的过程，玩家需要收集不同种类的洋葱以获得高分，同时避免吃到辣椒。吃洋葱小游戏-Python实现方案1.游戏设计概念游戏目标：玩家控制角色吃掉尽可能多的洋葱获得高分核心机制：洋葱从屏幕上方随机下落玩家左右移动角色接住洋葱不同洋葱有不同分值（普通洋葱+10，红洋葱+20，紫洋葱+50）辣椒会扣减生命值
AD20学习笔记——BOM表输出 Fz@ EDA学习学习笔记
BOM表输出脚本链接GitHub上-lianlian33/InteractiveHtmlBomForAD网盘链接链接：https://pan.baidu.com/s/1uGpwDyWKNgzghY5EH1Aj8A?pwd=72tx提取码：72tx1、下载文件并解压2、复制文件路径3、将脚本导入AD①点击设置中的ScriptingSystem中的GlobalProjects，选择从文件夹安装。②粘贴
模拟工作队列 - 华为OD机试真题(JavaScript卷) 什码情况算法面试 javascript 数据结构华为od
华为OD机试题库《C++》限时优惠9.9华为OD机试题库《Python》限时优惠9.9华为OD机试题库《JavaScript》限时优惠9.9针对刷题难，效率慢，我们提供一对一算法辅导，针对个人情况定制化的提高计划（全称1V1效率更高）。看不懂有疑问需要答疑辅导欢迎私VX：code5bug题目描述让我们来模拟一个工作队列的运作，有一个任务提交者和若干任务执行者，执行者从1开始编号。提交者会在给定的时
数据分类 - 华为OD机试真题(JavaScript 题解) 什码情况华为od javascript 开发语言数据结构算法机试
华为OD机试题库《C++》限时优惠9.9华为OD机试题库《Python》限时优惠9.9华为OD机试题库《JavaScript》限时优惠9.9针对刷题难，效率慢，我们提供一对一算法辅导，针对个人情况定制化的提高计划（全称1V1效率更高）。看不懂有疑问需要答疑辅导欢迎私VX：code5bug题目描述对一个数据a进行分类，分类方法为：此数据a（四个字节大小）的四个字节相加对一个给定的值b取模，如果得到的
odrive软件的版本 m0_55305757 stm32 电机嵌入式硬件 odrive
odrive软件的版本0.4.0通信方面引入一个fibre变复杂了（节点还是手工生成的），cpp程序开始变多了。（sensorless我看到变成独立文件了）pythontool开始使用pip安装形式。0.5.0开始支持spi的encoder，as5047之类0.5.1据说之后的版本controlloop开始变化0.5.2开始应该是大修改了//RequiredtouseOC4forADCtrigge
说说自己Python 代码优化实践 chilavert318 大数据 linux 运维 python
今年上半年在外省做一个大数据相关的项目，在review项目组成员的代码时，发现一段处理大数据集的模块存在明显性能瓶颈：10万条数据的清洗流程耗时近20分钟，CPU占用率却始终在30%以下。深入分析后发现，看似简洁的Python代码背后，隐藏着诸多可以优化的细节——这并非个例，我们的程序在追求代码可读性时，往往忽略了Python特有的性能陷阱。今天抽点时间，从我实践中的代码就python开发，从内存
ROS学习笔记5：常用API和模块导入
前言本人ROS小白，利用寒假时间学习ROS，在此以笔记的方式记录自己每天的学习过程。争取写满15篇(5/15)。环境：Ubuntu20.04、ROS1：noetic环境配置：严格按照下方学习链接的教程配置，基本一次成功。学习链接：【Autolabor初级教程】ROS机器人入门对应链接文档：ROS机器人入门课程《ROS理论与实践》笔记绝大部分代码使用Python语言编写。本期关键词：初始化，话题服务
【深度学习|学习笔记】什么是正则化？如何理解正则化？L0、L1、L2正则化的起源、发展、原理、应用和对比详解，附代码。努力毕业的小土博^_^ 深度学习学习笔记深度学习学习笔记人工智能机器学习
【深度学习|学习笔记】什么是正则化？如何理解正则化？L0、L1、L2正则化的起源、发展、原理、应用和对比详解，附代码。【深度学习|学习笔记】什么是正则化？如何理解正则化？L0、L1、L2正则化的起源、发展、原理、应用和对比详解，附代码。文章目录【深度学习|学习笔记】什么是正则化？如何理解正则化？L0、L1、L2正则化的起源、发展、原理、应用和对比详解，附代码。前言一、什么是正则化？为什么需要它？✅
一个简单测试Deepseek吞吐量的脚本,国内环境可跑谢平康深度学习 pytorch 人工智能
一个简单测试Deepseek吞吐量的脚本,这里用DeepSeek-R1-Distill-Qwen-32B,支持单卡409024G可跑,具体看你的硬件情况做调整,理论支持所有的模型,看你需要,可以修改模型名称,重点是pip使用国内的源,模型下载用阿里的ModelScope,无障碍下载,使用.最后可以生成一个txt与html报表.前提是你安装了python与python-venv,你可以不用venv来
OpenCV图像添加水印
一、前言在数字图像处理中，为图片添加水印是一项常见且重要的技术。无论是版权保护、品牌宣传还是防止未经授权的使用，水印都能发挥重要作用。OpenCV作为一款强大的计算机视觉库，提供了丰富的功能来实现各种水印效果。本教程将详细介绍如何使用OpenCV为图像添加文字水印和图片水印。二、环境准备在开始之前，请确保已安装以下环境：Python3.xOpenCV库（可通过pipinstallopencv-py
Redis布隆过滤器详解枸杞配码 redis 数据库缓存
1.布隆过滤器是什么redis的布隆过滤器其实有点像我们之前学习过的hyperloglog深入理解redis——新类型bitmap/hyperloglgo/GEO，它也是不保存元素的一个集合，它也不保存元素的具体内容，但是能判定这个元素是否在这个集合中存在（hyperloglog是判定集合中存在的不重复元素的个数）。1）它是由一个初值都为零的bit数组和多个哈希函数构成，用来快速判断某个数据是否存
Ast解析Python代码示例 X1A0RAN python 开发语言
#-*-coding:utf-8-*-#@Desc:Ast代码解析示例importastclassCodeParse():def__init__(self):self.visited_nodes=set()#解析装饰器defparse_decorator(self,decorator):returnast.dump(decorator)#解析函数defparse_func(self,node,st
Python编程实战：爬虫与数据可视化的全过程草莓味儿柠檬
本文还有配套的精品资源，点击获取简介：本项目通过Python编程实现网络数据爬取和数据可视化，适合初学者深入了解Python。我们将涵盖基础语法、网络爬虫技术、数据处理、可视化技术、文件操作和错误处理等关键知识点，最终完成从爬取各省降水量数据到可视化展示的全过程。1.Python基础语法使用Python作为一门流行的编程语言，因其简洁和易读性被广泛应用于网络爬虫、数据处理和可视化等领域。本章将帮助
C51单片机控制OLED显示屏反白显示SPI通信例程草莓味儿柠檬
本文还有配套的精品资源，点击获取简介：本文档详细介绍0.96英寸OLED显示屏、C51系列单片机、SPI接口及反白显示技术的原理与应用，并提供一套完整的例程源码，指导开发者如何使用C51单片机通过SPI接口控制OLED显示屏实现反白显示效果。文档内容包括硬件连接、初始化SPI、配置OLED显示参数、绘制像素和实现反白显示等关键步骤，旨在帮助初学者学习嵌入式系统开发，并理解相关硬件和软件工作流程。1
01背包问题的一维数组解法
核心思想：fori:=1toNdoforj=Vdowntoc[i]doiff[j-c[i]]+w[i]>f[j]thenf[j]=f[j-c[i]]+w[i];背包问题九讲-P010-1背包问题在讲背包问题的时候老师说这是一个老鸟中的老鸟总结的，很全面也很简洁易懂，在此把内容贴上来，供大家一起交流学习。感谢原作者！题目有N件物品和一个容量为V的背包。第i件物品的费用是c[i]，价值是w[i]。求解
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，

Python数据预处理和PCA、ICA、LDA降维的方法(实验代码)

1.标准差标准化

数据预处理——标准差标准化

数据预处理——离差标准化

数据预处理——非线性转换

数据预处理——归一化

数据预处理——二值化

数据预处理——独热编码

数据预处理——缺失值的插补

数据预处理——生成多项式特征

2,降维

PCA

ICA

LDA

你可能感兴趣的:(学习笔记,python,学习,matplotlib,conda)