htshinichi

【机器学习实战】降维方法的sklearn实现----PCA和LDA

利用sklearn库来给PCA和LDA做一个比较。首先先了解一下这两个库，然后通过(iris)鸢尾花数据集来进行实践操作。

【PCA】

主要参数：

n_components
int, float, None or string
这个参数类型有int型，float型，string型，默认为None。
它的作用是指定PCA降维后的特征数(也就是降维后的维度)。
若取默认(None)，则n_components==min(n_samples, n_features)，即降维后特征数取样本数和原有特征数之间较小的那个；
若n_components}设置为‘mle’并且svd_solver设置为‘full’则使用MLE算法根据特征的方差分布自动去选择一定数量的主成分特征来降维；
若 0< n_components <1 并且svd_solver设置为‘full’，则n_components为主成分方差的阈值；
若n_components ≥1 ，则降维后的特征数为n_components；
若svd_solver设置为‘arpack’，则n_components不能等于n_features。
copy
bool (default True)
在运行算法时，将原始训练数据复制一份。参数为bool型，默认是True，传给fit的原始训练数据X不会被覆盖；若为False，则传给fit后，原始训练数据X会被覆盖。
whiten
bool, optional (default False)
是否对降维后的数据的每个特征进行归一化。参数为bool型，默认是False。
svd_solver
string {‘auto’, ‘full’, ‘arpack’, ‘randomized’}
指定奇异值分解SVD的方法，参数为string类型，可选择‘auto’，‘full’，
‘arpack’，‘randomized’。默认是‘auto’。‘auto’适用于输入数据大于500 × 500且要提取的成分低于最小维数数据的80%。
注：前面的PCA方法那篇中，对PCA算法的描述是用特征值分解方法，
由于特征分解是奇异值分解SVD的一个特例，实际应用时可以基于奇异
值分解来实现。

主要属性：

components_
array, shape (n_components, n_features)
降维后各主成分方向，并按照各主成分的方差值大小排序。
explained_variance_
array, shape (n_components,)
降维后各主成分的方差值，方差值越大，越主要。
explained_variance_ratio_
array, shape (n_components,)
降维后的各主成分的方差值占总方差值的比例，比例越大，则越主要。
singular_values_
array, shape (n_components,)
奇异值分解得到的前n_components个最大的奇异值。

主要方法:

fit(X,y=None)
用训练数据X训练模型，由于PCA是无监督降维，因此y=None。
transform(X,y=None)
对X进行降维。
fit_transform(X)
用训练数据X训练模型，并对X进行降维。相当于先用fit(X)，再用transform(X)。
inverse_transform(X)
将降维后的数据转换成原始数据。

【LinearDiscriminantAnalysis】

主要参数：

solver
string, optional
求LDA超平面特征矩阵使用的方法，参数类型为string，可选‘svd’、‘lsqr’和‘eigen’，默认选‘svd’。
‘svd’：奇异值分解，不计算协方差矩阵，因此适用于具有大量特征的数据集；
‘lsqr’：最小二乘法，可与正则化一起使用；
‘eigen’：特征值分解，可与正则化一起使用，适用于特征数不多的数据集。
shrinkage
string or float, optional
正则化参数，可以增强LDA分类的泛化能力。若是只用LDA降维，可以不用。参数类型为string或float(0~1之间)，默认是None。
None：不进行正则化；
‘auto’：用Ledoit-Wolf引理自动决定是否使用正则化；
float(0~1之间)：给定正则化参数
正则化只在solver选择‘lsqr’，‘eigen’时有用。
priors
array, optional, shape (n_classes,)
类别权重，用于分类问题时。若是只用LDA降维，可以不用。参数类型为array，大小为类别个数n_classes。
n_components
int, optional
它的作用是指定LDA降维后的特征数(也就是降维后的维度)。参数类型为int，默认为None，1 ≤ n_components < n_classes-1。若是不做降维，则不设置，用默认即可。

主要属性：

coef_
array, shape (n_features,) or (n_classes, n_features)
特征系数

intercept_
array, shape (n_features,)
偏置

covariance_
array-like, shape (n_features, n_features)
协方差矩阵

explained_variance_ratio_
array, shape (n_components,)
降维后的各主成分的方差值占总方差值的比例，比例越大，则越主要。只在solver选择‘svd’和‘eigen’的时候有用。

主要方法:

与PCA的类似，不过多了predict(X)、decision_function(X)等用于分类问题的方法。

【实践】

导入库：

##用于3D可视化
from mpl_toolkits.mplot3d import Axes3D
##用于可视化图表
import matplotlib.pyplot as plt
##用于做科学计算
import numpy as np
##用于做数据分析
import pandas as pd
##用于加载数据或生成数据等
from sklearn import datasets
##导入PCA库
from sklearn.decomposition import PCA
##导入LDA库
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis

导入数据集：

这次实践就使用iris(鸢尾花)数据集。

iris = datasets.load_iris()
iris_X = iris.data   ##获得数据集中的输入
iris_y = iris.target ##获得数据集中的输出，即标签(也就是类别)
print(iris_X.shape)
print(iris.feature_names)
print(iris.target_names)

输出为：

(150, 4)
['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
['setosa' 'versicolor' 'virginica']

可以看出，iris数据集共有150个样本，每个样本有四个特征(四维)，分别是萼片长度(sepal length)，萼片宽度(sepal width)，花瓣长度(petal length)，花瓣宽度(petal width)。
标签有三种，分别是setosa，versicolor和virginica。

降维：

【PCA】

##加载PCA模型并训练、降维
model_pca = PCA(n_components=3)
X_pca = model_pca.fit(iris_X).transform(iris_X)
print(iris_X.shape)
print(iris_X[0:5])
print(X_pca.shape)
print(X_pca[0:5])

输出为:

(150, 4)
[[ 5.1  3.5  1.4  0.2]
 [ 4.9  3.   1.4  0.2]
 [ 4.7  3.2  1.3  0.2]
 [ 4.6  3.1  1.5  0.2]
 [ 5.   3.6  1.4  0.2]]
(150, 3)
[[-2.68420713  0.32660731 -0.02151184]
 [-2.71539062 -0.16955685 -0.20352143]
 [-2.88981954 -0.13734561  0.02470924]
 [-2.7464372  -0.31112432  0.03767198]
 [-2.72859298  0.33392456  0.0962297 ]]

可以发现原本为四维的样本变为了三维的。让我们分别看看四维和三维时的方差分布。
四维时：

model_pca = PCA(n_components=4)
X_pca = model_pca.fit(iris_X).transform(iris_X)
print("各主成分方向：\n",model_pca.components_)
print("各主成分的方差值：",model_pca.explained_variance_)
print("各主成分的方差值与总方差之比：",model_pca.explained_variance_ratio_)
print("奇异值分解后得到的特征值：",model_pca.singular_values_)
print("主成分数：",model_pca.n_components_)

输出为：

各主成分方向：
 [[ 0.36158968 -0.08226889  0.85657211  0.35884393]
 [ 0.65653988  0.72971237 -0.1757674  -0.07470647]
 [-0.58099728  0.59641809  0.07252408  0.54906091]
 [ 0.31725455 -0.32409435 -0.47971899  0.75112056]]
各主成分的方差值： [ 4.22484077  0.24224357  0.07852391  0.02368303]
各主成分的方差值与总方差之比： [ 0.92461621  0.05301557  0.01718514  0.00518309]
奇异值分解后得到的特征值： [ 25.08986398   6.00785254   3.42053538   1.87850234]
主成分数： 4

三维时：

model_pca = PCA(n_components=3)
X_pca = model_pca.fit(iris_X).transform(iris_X)
print("降维后各主成分方向：\n",model_pca.components_)
print("降维后各主成分的方差值：",model_pca.explained_variance_)
print("降维后各主成分的方差值与总方差之比：",model_pca.explained_variance_ratio_)
print("奇异值分解后得到的特征值：",model_pca.singular_values_)
print("降维后主成分数：",model_pca.n_components_)

输出为：

降维后各主成分方向：
 [[ 0.36158968 -0.08226889  0.85657211  0.35884393]
 [ 0.65653988  0.72971237 -0.1757674  -0.07470647]
 [-0.58099728  0.59641809  0.07252408  0.54906091]]
降维后各主成分的方差值： [ 4.22484077  0.24224357  0.07852391]
降维后各主成分的方差值与总方差之比： [ 0.92461621  0.05301557  0.01718514]
奇异值分解后得到的特征值： [ 25.08986398   6.00785254   3.42053538]
降维后主成分数： 3

我们可以看出从四维降到三维，也就是将四维时，主成分方差值(方差值与总方差之比)最小的那个成分给去掉了。选取的是前三个最大的特征值。
由于降到了三维，我们可以看看用图来看看三维的点的情况。

fig = plt.figure(figsize=(10,8))
ax = Axes3D(fig,rect=[0, 0, 1, 1], elev=30, azim=20)
ax.scatter(X_pca[:, 0], X_pca[:, 1], X_pca[:, 2], marker='o',c=iris_y)

我们也可以通过固定elev的值，改变azim的值来看看将这些点投影到各个平面的情况。

fig = plt.figure(figsize=(10,8))
##固定elev=0，改变azim为0，90，180，270
ax = Axes3D(fig,rect=[0, 0, 1, 1], elev=0, azim=0)
ax.scatter(X_pca[:, 0], X_pca[:, 1], X_pca[:, 2], marker='o',c=iris_y)
plt.show()

得到四个图像，可以发现是按这样旋转得到的：

fig = plt.figure(figsize=(10,8))
##固定elev=90，改变azim为0，90，180，270
ax = Axes3D(fig,rect=[0, 0, 1, 1], elev=90, azim=0)
ax.scatter(X_pca[:, 0], X_pca[:, 1], X_pca[:, 2], marker='o',c=iris_y)
plt.show()

另得到四个图像，发现是按这样旋转得到的：

我们还可以在看看降维到二维的情况。

model_pca = PCA(n_components=2)
X_pca = model_pca.fit(iris_X).transform(iris_X)
print("降维后各主成分方向：\n",model_pca.components_)
print("降维后各主成分的方差值：",model_pca.explained_variance_)
print("降维后各主成分的方差值与总方差之比：",model_pca.explained_variance_ratio_)
print("奇异值分解后得到的特征值：",model_pca.singular_values_)
print("降维后主成分数：",model_pca.n_components_)

输出为：

降维后各主成分方向：
 [[ 0.36158968 -0.08226889  0.85657211  0.35884393]
 [ 0.65653988  0.72971237 -0.1757674  -0.07470647]]
降维后各主成分的方差值： [ 4.22484077  0.24224357]
降维后各主成分的方差值与总方差之比： [ 0.92461621  0.05301557]
奇异值分解后得到的特征值： [ 25.08986398   6.00785254]
降维后主成分数： 2

我们可以看出从降到二维，其实就是取了方差值(方差值与总方差之比)最大的前两个主成分。继续画图看看。

fig = plt.figure(figsize=(10,8))
plt.scatter(X_pca[:, 0], X_pca[:, 1],marker='o',c=iris_y)
plt.show()

和上面有一张从上往下投影的图对应上了，也就是通过降维将那个轴对应的主成分给去掉了。

【LDA】

##载入LDA模型，设置n_components=3
model_lda = LinearDiscriminantAnalysis(n_components=3)
X_lda = model_lda.fit(iris_X, iris_y).transform(iris_X)
print("降维后各主成分的方差值与总方差之比：",model_lda.explained_variance_ratio_)
print("降维前样本数量和维度：",iris_X.shape)
print("降维后样本数量和维度：",X_lda.shape)

输出为：

降维后各主成分的方差值与总方差之比： [ 0.99147248  0.00852752]
降维前样本数量和维度： (150, 4)
降维后样本数量和维度： (150, 2)

我们可以发现并不是按照我设置的维度降维的，而是直接降到了2维。这是因为LDA1的n_component需满足1 ≤ n_components ≤ n_classes-1的情况，而这里n_classes为3，因此n_component无论取3还是4都是降维到2。

因此下面这段代码的结果和上面是一样的：

model_lda = LinearDiscriminantAnalysis(n_components=2)
X_lda = model_lda.fit(iris_X, iris_y).transform(iris_X)
print("降维后各主成分的方差值与总方差之比：",model_lda.explained_variance_ratio_)
print("降维前样本数量和维度：",iris_X.shape)
print("降维后样本数量和维度：",X_lda.shape)

得到的各主成分方差值与总方差之比就是前两个主成分。
看看降维后的图像：

参考：
1.http://www.cnblogs.com/pinard/p/6243025.html
2.http://www.cnblogs.com/pinard/p/6249328.html
3.http://scikit-learn.org/stable/auto_examples/decomposition/plot_pca_vs_lda.html#sphx-glr-auto-examples-decomposition-plot-pca-vs-lda-py

代码存放于：https://github.com/htshinichi/ML_practice/tree/master

Java突击小练习--利用正则表达式来简易的校验邮箱与手机号格式 CJH~ java 正则表达式 mysql
//校验邮箱publicclassTestEmail{publicstaticvoidmain(String[]args){Scannerinput=newScanner(System.in);//*号代表任意数量，放在0-9a-zA-Z后面，代表可以写任意数量的字母和数字//@是邮箱的符号，接在刚刚那串的后面//|代表或，也就是说@后可以跟着qq或163或sina中的任意字符串，代表哪家邮箱//
C 结构体基础练习题噜噜soeur c语言开发语言
这些题目都是我自己练过挑选出来的，有错误请指出哦谢谢定义一个名为“Student”的结构体，其中包含成员的name（姓名）、age（年龄）和totalMarks（总分）。编写一个C程序来输入两个学生的数据，显示他们的信息，并找到总分的平均值。#includestructStudent{charname[50];intage;floattotalMarks;};intmain(){//Declare
Java基础语法练习41（泛型以及自定义泛型）橙序研工坊小白Java的成长 java 开发语言
目录一、泛型：用来表示数据类型的一种类型（在不知道定义为啥数据类型的时候用泛型来代替）1.入门示例代码如下：2.泛型的基本声明：3.泛型的实例化：二、自定义泛型类三、自定义泛型接口四、自定义泛型方法五、泛型的继承和通配符六、练习题一、泛型：用来表示数据类型的一种类型（在不知道定义为啥数据类型的时候用泛型来代替）一句话：泛型是待定的数据类型1.入门示例代码如下：publicclassGeneric0
牛客练习赛128（下）筱姌牛客比赛算法 c++BFS DFS 图论动态规划
Cidoai的平均数对题目描述登录—专业IT笔试面试备考平台_牛客网运行代码#include#includeusingnamespacestd;intmain(){intn,k;cin>>n>>k;inttotalAns=0;intrSum=0;vectorex,weights;for(inti=0;i>a>>b;if(bf(rSum+1,0);for(inti=0;i=ex[i];--j){f[
牛客练习赛135——小柒的逆序对(2) KyollBM 算法数据结构
这里还得说一下，调换一个排列中任意两个不同的数，该排列的逆序数奇偶会改变题目：思路：这道题的数据给的很大，如果我们用树状数组维护前缀和都没用，但是我们观察到英文字符只有26个，那我们可以开一个二维数组g[i][j]表示ij字符对有多少个如何维护这个数组呢，其实也很简单，遍历s每个字符c，同时开一个数组储存26个字符对于字符c，先遍历26个字符y，将g[y][c]加上y的个数，结束后再将c的数量加一
Google Earth Engine——导入无云 Sentinel-2 图像和NDVI计算此星光明 GEE教程训练 sentinel 人工智能 gee ndvi 归一化植被指数波段运算遥感
目录搜索和导入无云Sentinel-2图像Sentinel-2的背景打开GEE界面定义您感兴趣的领域查询Sentinel-2图像的存档过滤图像集合将图像添加到地图视图定义真彩色可视化参数探索影像定义假色可视化参数从波段组合中导出指数NDVI锻炼本实验的目的是介绍GoogleEarthEngine处理环境。在本练习结束时，您将能够搜索、查找和可视化范围广泛的遥感数据集。在第一个练习中，我们将重点关注
C++每日一练——day 1 「已注销」 #C++每日一练 C++c++
年轻人，你渴望拥有C++练习题吗？？？从这篇博文开始，我每天都会更新一个C++主要知识点题目，并附上解析！~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~Dayone——解密题目描述给你这样一个任务：解密一份被加密过的文件。经过研究，你发现了加密文件有如下加密规律（括号中是一个“原文一>密文”的例子）
每日一练—C++专项练习 7.24 weixin_42095973
1、已知：类A中一个成员函数说明如下：voidSet(A&a);其中，A&的含义是（）A、指向类A的指针为aB、将a的地址赋值给变量SetC、a是类A对象的引用，用来作函数Set()的参数D、变量A与a按位与作为Set()的参数选择C。2、下面哪个语句无法通过编译?A、if(x>y);B、if(x=y)&&(x!=0)x+=y;C、if(x!=y)scanf("%d",&x);elsescanf(
JavaScript的学习6——jQuery 十五春会
文章目录jQuery选择器按ID查找按tag查找按class查找按属性查找组合查找多项选择器练习层级选择器子选择器（ChildSelector）过滤器（Filter）表单相关练习查找和过滤操作DOM修改Text和HTML修改CSS显示和隐藏DOM获取DOM信息操作表单修改DOM结构添加DOM删除节点练习事件鼠标事件键盘事件其他事件事件参数取消绑定事件触发条件浏览器安全限制练习动画show/hide
FLASK，ORM(mysql)，12条查询练习语句毛毛是一只狗《Python专栏》flaskORM
ORM查询语句练习，创表数据在flask课件里，在我资源里可以下载查询所有用户数据查询有多少个用户查询第1个用户查询id为4的用户[3种方式]查询名字结尾字符为g的所有数据[开始/包含]查询名字不等于wang的所有数据[2种方式]查询名字和邮箱都以li开头的所有数据[2种方式]查询password是123456或者email以itheima.com结尾的所有数据查询id为[1,3,5,7,9]的用
CSDN每日一练文盲老顾算法每日一练
每日一练不会做的题目n边形划分K树盗版解锁密码小豚鼠搬家清理磁盘空间待更新未能完全通过case的题目拯救爱情环形单向链表硬币的面值（CSDN已修改用例数据，2023-2-14）小计不会做的题目n边形划分练习题地址https://edu.csdn.net/skill/program/28790?practiceId=19348927题目名称：n边形划分时间限制：1000ms内存限制：256M题目描述
【go语言圣经】习题答案第一章 flying_elephant 研发管理 go
自己写了点gopl的练习题，发个答案大家共勉一下。有问题也请大佬指教。第一章练习题答案1.11.2打印命令行参数1.4打印重复出现的某行代码及其出现位置1.5替换gif图像颜色1.7使用io.Copy代替read方法get网页内容1.8为请求连接增添HTTPS前缀1.9获取HTTP返回的状态码1.11对每个URL执行两遍请求，查看两次时间是否有较大的差别，并且每次获取到的响应内容是否一致1.12修
python语言字符串练习题微__凉习题集 python 开发语言 numpy
第1关：求字符串的长度任务描述本关需要你编写一个程序，输出字符串的长度。相关知识len()方法描述：Python中的len()方法返回对象（字符、列表、元组等）的长度。####编程要求comment:<>(“编程要求”部分说一下本关要解决的问题的具体要求，并给出相应代码的框架，以及要求学生填写的那一块)命令行随机输入一个字符串，输出其长度测试举例：测试输入：1234预期输出：4importmath
java字符串练习题_java练习题——字符串阿呆java java
一.动手动脑之String.equals()方法：判断s1和s2的内容相同s1.equals(s2)。判断s1和s2的地址相同s1==s2。二.整理String类的Length()、charAt()、getChars()、replace()、toUpperCase()、toLowerCase()、trim()、toCharArray()使用说明1、length()字符串的长度2、charAt()截
C语言：5.20程序练习题异步的告白 C语言初学 c语言开发语言
打印一个菱形图案。程序分为两部分：上半部分和下半部分。上半部分打印一个逐渐增大的星号图案，下半部分打印一个逐渐缩小的星号图案。#includeintmain(){introw=5;//定义行数intt=2;for(inti=row;00;k--){putchar('');}for(intg=t-1;g>0;g--){putchar('*');}t=t+2;printf("\n");}t=t-4;f
python字符串练习题 DDD小小小宇宙 python例题 python java windows
python字符串练习题：1.有变量name="aleXleNb"完成如下操作：移除name变量对应的值两边的空格,并输出处理结果name="aleXleNb"s1=name.strip()print(s1)将name变量对应的值中所有的空格去除掉,并输出处理结果name="aleXleNb"s1=name.replace('','')print(s1)判断name变量是否以“al”开头,并输出结
AI大模型：教育行业的革新引擎 AI360labs_atyun 人工智能 AI deepseek
凌晨两点，高中生小林对着数学卷子抓耳挠腮。她轻触桌面的全息投影，AI助手“DeepSeek-R1”立刻扫描题目：“这道几何题需要先构建辅助线，还记得昨天练习的相似三角形判定法吗？”随即调出3D动态演示，讲解着自己的解题思路。指导小林轻松愉快的完成了复杂的作业。我们再试想一下：深夜两点，某重点中学教师仍在伏案批改作业‌这在以前可能是教师职业的常态，但是随着AI的普及。借助DeepSeek大模型，教师
java基础之选择结构（if）、循环结构（for、while）篇 Rookie_lyj java基础 java 开发语言后端
前言本章主要是对选择结构（if-else）、循环结构（for、while）的练习一、选择结构判断瑞年题目要求：闰年的条件是能被4整除，但不能被100整除；或能被400整除。思路：输入要判断的年份添加条件（条件1：能被4整除，但不能被100整除，条件2：能被400整除）数据结果publicclasstest{publicstaticvoidmain(Stringargs[]){Scannerscan
动手深度学习笔记（二十九）5.5. 读写文件落花逐流水 pytorch实践 pytorch pytorch
动手深度学习笔记（二十九）5.5.读写文件5.深度学习计算5.5.读写文件5.5.1.加载和保存张量5.5.2.加载和保存模型参数5.5.3.小结5.5.4.练习5.深度学习计算5.5.读写文件到目前为止，我们讨论了如何处理数据，以及如何构建、训练和测试深度学习模型。然而，有时我们希望保存训练的模型，以备将来在各种环境中使用（比如在部署中进行预测）。此外，当运行一个耗时较长的训练过程时，最佳的做法
算法练习——双指针算法(更新中) *TQK* 算法练习 c++学习算法双指针
一、介绍双指针算法双指针（或称为双索引）算法是一种高效的算法技巧，常用于处理数组或链表等线性数据结构。它通过使用两个指针来遍历数据，从而减少时间复杂度，避免使用嵌套循环。双指针算法在解决诸如查找、排序、去重等问题时非常有效。1.双指针算法的基本思想双指针算法的核心思想是通过两个指针（通常是索引）来遍历数组或链表，而不是使用嵌套循环。这两个指针可以是：快慢指针：一个指针移动速度比另一个快。左右指针：
mysql练习夏炎正好眠 MySQL mysql 数据库
创建数据库db_ck，再创建表t_hero，将四大名著中的主要人物都插入这个表中，将实现过程中sql提交上上来1、创建数据库db_ckmysql>createdatabasedb_ck;2、创建表t_heromysql>usedb_ckDatabasechangedmysql>createtablet_hero(->idintprimarykeyauto_increment,->namevarch
异常控制流学习笔记——fork函数和wait函数 Lunapius
初步理解异常控制流中调用fork函数和wait函数的错误处理在计算机系统中，异常有中断、陷阱、故障和终止四种类别，具体的内容我们不在此处展开，但是无论如何，当异常出现时，计算机系统都会对其进行处理，其大致流程如下图所示：作为初学者，我们平常练习时所编写的代码其实是极为朴素简单的，在代码中加入进行错误处理也不会导致程序难以阅读。但实际上，我们日常生活、工作生产中使用的大部分程序其实都是非常复杂的。当
java实验报告_java实验一实验报告赵阿萌 java实验报告
Java实验报告一：Java开发环境的熟悉20135315宋宸宁实验要求：1.使用JDK编译、运行简单的Java程序2.使用Eclipse编辑、编译、运行、调试Java程序实验内容(一)命令行下Java程序开发(二)Eclipse下Java程序开发、调试(三)练习(通过命令行和Eclipse两种方式实现，在Eclipse下练习调试程序)5.实现求正整数1-N之间所有质数的功能，并进行测试。实验过程
2025年北京市海淀区信息奥赛真题解析（小学组）热爱编程的通信人 c++白名单信息学奥赛
欢迎大家订阅我的专栏：算法题解：C++与Python实现！本专栏旨在帮助大家从基础到进阶，逐步提升编程能力，助力信息学竞赛备战！专栏特色1.经典算法练习：根据信息学竞赛大纲，精心挑选经典算法题目，提供清晰的代码实现与详细指导，帮助您夯实算法基础。2.系统化学习路径：按照算法类别和难度分级，从基础到进阶，循序渐进，帮助您全面提升编程能力与算法思维。适合人群：准备参加蓝桥杯、GESP、CSP-J、CS
C语言每日一练——day_3（快速上手C语言） Run_Teenage C语言入门练习题 c语言开发语言
引言针对初学者，每日练习几个题，快速上手C语言。第三天。（会连续更新）采用在线OJ的形式什么是在线OJ？在线判题系统（英语：OnlineJudge，缩写OJ）是一种在编程竞赛中用来测试参赛程序的在线系统，也可以用于平时的练习。详细内容可以看一下这篇博客：关于C/C++语言的初学者在哪刷题，怎么刷题-CSDN博客https://blog.csdn.net/2401_88433210/article/
C语言每日一练——day_4 Run_Teenage C语言入门练习题 c语言开发语言
引言针对初学者，每日练习几个题，快速上手C语言。第四天。（连续更新中）采用在线OJ的形式什么是在线OJ？在线判题系统（英语：OnlineJudge，缩写OJ）是一种在编程竞赛中用来测试参赛程序的在线系统，也可以用于平时的练习。详细内容可以看一下这篇博客：关于C/C++语言的初学者在哪刷题，怎么刷题-CSDN博客https://blog.csdn.net/2401_88433210/article/
hive-3.1.3部署文档 CXH728 hive hadoop 数据仓库
提前准备一个正常运行的hadoop集群java环境hive安装包下载地址：https://archive.apache.org/dist/hive/hive-3.1.3/apache-hive-3.1.3-bin.tar.gzmysql安装包1、内嵌模式由于内嵌模式使用场景太少（基本不用），所以仅练习安装查看基础功能[root@master~]#tarxfapache-hive-3.1.3-bin
python小练习，计算并显示正整数 n 的所有因子及因子的个数，其中 n 的值键盘输入。 D.Leo python
计算并显示正整数n的所有因子及因子的个数，其中n的值键盘输入。n=eval(input('请输入正整数n='))a=[]print('%d的因子为：'%n)foriinrange(1
lambda表达式Stream流学习十—Stream操作练习题头真的好重好重Y java lambda stream
lambda表达式Stream流学习十—Stream操作练习题，map、sorted、collect、filter、forEach、max、min一，map与reduce复习/*1)给定一个数字列表,如何返回一个由每个数平方构成的列表呢,给定[1,2,3,4,5],应该返回[1,4,5,16,25]map—接收Lambda,将元素转换为其他形式或提取信息,接收一个函数作为参数,该函数会被应用到每个
C++上机实验|继承与派生编程练习皖山文武 C++语言程序设计教程 c++开发语言
1.实验目的(1)掌握派生与继承的概念与使用方法(2)运用继承机制对现有的类进行重用。(3)掌握继承中的构造函数与析构函数的调用顺序,(4)为派生类设计合适的构造函数初始化派生类。(5)深入理解继承与组合的区别。2.实验内容设计一个人员类person和一个日期类date,由人员类派生出学生类student和教师类professor,学生类和教师类的数据成员birthday为日期类。3.参考代码#i
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比

【机器学习实战】降维方法的sklearn实现----PCA和LDA

【PCA】

主要参数：

主要属性：

主要方法:

【LinearDiscriminantAnalysis】

主要参数：

主要属性：

主要方法:

【实践】

导入库：

导入数据集：

降维：

你可能感兴趣的:(练习)