wxxka

matlab在线性代数中的应用

chapter1

function test1

format rat
a=[1,-2,-1,0,2;
    -2,4,2,6,-6;
    2,-1,0,2,3;
    3,3,3,3,4];
%求a的最大无关组
b=rref(a)

function test2

format rat
a=[2 2 -1;
   2 -1 2;
   -1 2 2];
%求a的最大无关组
b=[1 4;
    0 3;
    -4 2];
c=rref([a,b]);
% 
% c =
% 
%        1              0              0              2/3            4/3     
%        0              1              0             -2/3            1       
%        0              0              1             -1              2/3     
%
b1=2/3*a(:,1)-2/3*a(:,2)-1*a(:,3)
b2=4/3*a(:,1)+1*a(:,2)+2/3*a(:,3)

chapter2

function test3

format rat
a=[2 1 -5 1;
   1 -3 0 -6;
   0 2 -1 2;
   1 4 -7 6];
%求a的最大无关组
b=[8;
    9;
    -5;
    0];

solution =a\b
%    3             -4             -1              1  %solution'

另一种解法---solve函数

function test3_1
format long
syms a b c d
eqn = [2*a+b-5*c+d == 8;
    a-3*b-6*d==9;
    2*b-c+2*d==-5;
    a+4*b-7*c+6*d==0
    ]
[a,b,c,d] = solve(eqn,[a,b,c,d]);
[a,b,c,d]

function test4
format rat
a=[2 4;
   3 -5;
   1 2;
   2 1];
%求a的最大无关组
b=[11;
    3;
    6;
    7];

solution =a\b
%    830/273        113/91   %solution'     
a*solution
%
% ans =
% 
%      232/21    
%      265/91    
%      116/21    
%     1999/273  
format long
a*solution
% 
% ans =
% 
%   11.047619047619046
%    2.912087912087914
%    5.523809523809523
%    7.322344322344321

从上面的结果，看出，并不能很好求出结果，对于求得结果，后两个等式基本不满足

function test4_1
format long
syms a b
eqn = [2*a + 4*b == 11;
    3*a-5*b==3;
    a+2*b==6;
    2*a+b==7];
[a,b] = solve(eqn,[a,b]);
[a,b]

只求解前三个等式

function test4_2
format rat
a=[2 4;
   3 -5;
   1 2;];
%求a的最大无关组
b=[11;
    3;
    6];

solution =a\b
%   3.090909090909089   1.254545454545454%solution'     
a*solution
%
% ans =
% 
%       56/5     
%        3       
%       28/5       
format long
a*solution
% 
% ans =
% 
%   11.199999999999994
%    2.999999999999996
%    5.599999999999997

欠定方程

function test5_2

format rat
a=[1 -1 -1 1;
   1 -1 1 -3;
   1 -1 -2 1];
%求a的最大无关组
b=[0;
    1;
    -1/2];

solution =a\b
% solution =
% 
%        0       
%       -1/2     
%        1/2     
%        1/39831333786592880

利用最大线性无关组

function test5

format rat
a=[1 -1 -1 1;
   1 -1 1 -3;
   1 -1 -2 1];
%求a的最大无关组
b=[0;
    1;
    -1/2];
c=[a,b];
d=rref(c)
% solution =
% 
%        0       
%       -1/2     
%        1/2     
%        1/39831333786592880

% d =
% 
%        1             -1              0              0              1/2     
%        0              0              1              0              1/2     
%        0              0              0              1              0    

% a-b=0.5;
% c=0.5;
% d=0;

function test5_1
format long
syms a b c d
eqn = [a-b-c+d == 0;
    a-b+c-3*d==1;
    a-b-2*c+d==-0.5];
[a,b c d] = solve(eqn,[a,b c d]);
[a,b c d]
% ans =
%  
% [ 1/2, 0, 1/2, 0]

function test6_1

x=str2sym('[a+sin(d),b;1/c,d]');
y=det(x)
%det(x)%返回x的行列式
%  
% x=str2sym('[a+sin(d),b;1/c,d]');
% y=det(x)
%  
% y =
%  
% (a*c*d - b + c*d*sin(d))/c

function test6
syms a b c d
x=[a+sin(d),b;1/c,d];
y=det(x)
%det(x)%返回x的行列式
% y =
%  
% (a*c*d - b + c*d*sin(d))/c

function test7
a=[2/3,sqrt(2);3,1];
b=sym(a)
% 
% a=[2/3,sqrt(2);3,1];
% a
% 
% a =
% 
%        2/3         1393/985   
%        3              1       
% 
% b=sym(a)
%  
% b =
%  
% [ 2/3, 2^(1/2)]
% [   3,       1]

function test8
a=[2/3,sqrt(2);3,1];
b=sym(a)
% 
% a=[2/3,sqrt(2);3,1];
% a
% 
% a =
% 
%        2/3         1393/985   
%        3              1       
% 
% b=sym(a)
%  
% b =
%  
% [ 2/3, 2^(1/2)]
% [   3,       1]
b(2,2)=str2sym('log(9)')
% 
% b(2,2)=str2sym('log(9)')
%  
% b =
%  
% [ 2/3, 2^(1/2)]
% [   3,  log(9)]

function test9
format rat
a=[0 1 1 -1;
    1 0 -1 1;
    1 -1 0 1;
    -1 1 1 0];
[p,d]=eig(a)
format short 
p,d
% p =
% 
%       -1/2          390/1351       780/989        780/3691  
%        1/2         -390/1351       780/3691       780/989   
%        1/2         -390/1351       780/1351      -780/1351  
%       -1/2        -1170/1351         0              0       
% 
% 
% d =
% 
%       -3              0              0              0       
%        0              1              0              0       
%        0              0              1              0       
%        0              0              0              1       
% 
% 
% p =
% 
%    -0.5000    0.2887    0.7887    0.2113
%     0.5000   -0.2887    0.2113    0.7887
%     0.5000   -0.2887    0.5774   -0.5774
%    -0.5000   -0.8660         0         0
% 
% 
% d =
% 
%    -3.0000         0         0         0
%          0    1.0000         0         0
%          0         0    1.0000         0
%          0         0         0    1.0000

function test9_1

a=str2sym('[0 1 1 -1;1 0 -1 1;1 -1 0 1;-1 1 1 0]');
[p,d]=eig(a)
% p =
%  
% [  1, 1, 1, -1]
% [ -1, 1, 0,  0]
% [ -1, 0, 1,  0]
% [  1, 0, 0,  1]
%  
%  
% d =
%  
% [ -3, 0, 0, 0]
% [  0, 1, 0, 0]
% [  0, 0, 1, 0]
% [  0, 0, 0, 1]
%

多元分析

综述：多元分析，是多变量统计分析方法。多变量统计分析的基本出发点：变量之间的相关性，不能简单地把每个变量结果进行汇总。

聚类分析

聚类分析，可以分为两类。一个是面对很多样本，如何将这些样本进行聚类分析，分几个类别，每个类别有不同的特点，这称为Q型聚类分析，就是样本聚类分析；另一个是，每个样本都有很多变量属性，这些属性并不是相互独立的，有的变量之间的相关性较强，即，有的变量可以归为一类，有的单独是一类，这是样本各个评价指标的变量分析，称为R型聚类分析。

聚类分析基本概念

相似性度量：

样本的相似性度量：样本有多个属性，每个属性可以视为一个坐标轴，那么含有n个属性的样本都能用n维空间中的一个点表示，这样，一个样本用一个点表示，自然而然，样本之间的相似性，可以用点与点之间的距离作为衡量。（从这里容易看出，对于样本的各个属性，要使用标准化或者归一化操作去除量纲，消除单位不同带来的影响，防止大数据吃掉小数据）下面给出距离的定义

常用的有类平均法

例题

对样本的属性进行聚类分析，变量聚类法，R型聚类

变量的相似性度量：相关系数，余弦夹角

变量聚类法：

例子

1													
0.366	1												
0.242	0.233	1											
0.28	0.194	0.59	1										
0.36	0.324	0.476	0.435	1									
0.282	0.262	0.483	0.47	0.452	1								
0.245	0.265	0.54	0.478	0.535	0.663	1							
0.448	0.345	0.452	0.404	0.431	0.322	0.266	1						
0.486	0.367	0.365	0.357	0.429	0.283	0.287	0.82	1					
0.648	0.662	0.216	0.032	0.429	0.283	0.263	0.527	0.547	1				
0.689	0.671	0.243	0.313	0.43	0.302	0.294	0.52	0.558	0.957	1			
0.486	0.636	0.174	0.243	0.375	0.296	0.255	0.403	0.417	0.857	0.852	1		
0.133	0.153	0.732	0.477	0.339	0.392	0.446	0.266	0.241	0.054	0.099	0.055	1	
0.376	0.252	0.676	0.581	0.441	0.447	0.44	0.424	0.372	0.363	0.376	0.321	0.627	1

上面的数据文件名称edata10_2.txt;

clc, clear, close all
a=textread('data10_2.txt');%读取下三角相关系数  
d=1-abs(a); %进行数据变换,把相关系数转化为距离
d=tril(d);  %提出d矩阵的下三角部分
b=nonzeros(d);%去掉d中的零元素
b=b';  %化成行向量
z=linkage(b,'complete'); %按最长距离法聚类  
y=cluster(z,'maxclust',2)   %把变量划分成两类
ind1=find(y==1);ind1=ind1'  %显示第一类对应的变量标号
ind2=find(y==2);ind2=ind2'  %显示第二类对应的变量标号
figure
h=dendrogram(z); %画聚类图
set(h,'Color','k','LineWidth',1.3)  %把聚类图线的颜色改成黑色，线宽加粗

综合运用Q&&R聚类方法

上面的数据，命名为anli10_1.txt

5.96 	310 	461 	1557 	931 	319 	44.36 	2615 	2.20 	13631 
3.39 	234 	308 	1035 	498 	161 	35.02 	3052 	.90 	12665 
2.35 	157 	229 	713 	295 	109 	38.40 	3031 	.86 	9385 
1.35 	81 	111 	364 	150 	58 	30.45 	2699 	1.22 	7881 
1.50 	88 	128 	421 	144 	58 	34.30 	2808 	.54 	7733 
1.67 	86 	120 	370 	153 	58 	33.53 	2215 	.76 	7480 
1.17 	63 	93 	296 	117 	44 	35.22 	2528 	.58 	8570 
1.05 	67 	92 	297 	115 	43 	32.89 	2835 	.66 	7262 
.95 	64 	94 	287 	102 	39 	31.54 	3008 	.39 	7786 
.69 	39 	71 	205 	61 	24 	34.50 	2988 	.37 	11355 
.56 	40 	57 	177 	61 	23 	32.62 	3149 	.55 	7693 
.57 	58 	64 	181 	57 	22 	32.95 	3202 	.28 	6805 
.71 	42 	62 	190 	66 	26 	28.13 	2657 	.73 	7282 
.74 	42 	61 	194 	61 	24 	33.06 	2618 	.47 	6477 
.86 	42 	71 	204 	66 	26 	29.94 	2363 	.25 	7704 
1.29 	47 	73 	265 	114 	46 	25.93 	2060 	.37 	5719 
1.04 	53 	71 	218 	63 	26 	29.01 	2099 	.29 	7106 
.85 	53 	65 	218 	76 	30 	25.63 	2555 	.43 	5580 
.81 	43 	66 	188 	61 	23 	29.82 	2313 	.31 	5704 
.59 	35 	47 	146 	46 	20 	32.83 	2488 	.33 	5628 
.66 	36 	40 	130 	44 	19 	28.55 	1974 	.48 	9106 
.77 	43 	63 	194 	67 	23 	28.81 	2515 	.34 	4085 
.70 	33 	51 	165 	47 	18 	27.34 	2344 	.28 	7928 
.84 	43 	48 	171 	65 	29 	27.65 	2032 	.32 	5581 
1.69 	26 	45 	137 	75 	33 	12.10 	810 	1.00 	14199 
.55 	32 	46 	130 	44 	17 	28.41 	2341 	.30 	5714 
.60 	28 	43 	129 	39 	17 	31.93 	2146 	.24 	5139 
1.39 	48	62 	208	77 	34	22.70 	1500 	.42 	5377 
.64 	23 	32 	93 	37 	16 	28.12 	1469	.34	5415 
1.48 	38 	46 	151 	63 	30 	17.87 	1024 	.38 	7368

R型聚类分析---分析样本所含变量之间的相关性，避免多重线性性对分析的影响

%%
%变量聚类 R-聚类
%% 第一种聚类方法
clc, clear, close all
%a=readmatrix('anli10_1.txt');
a=load('anli10_1.txt');

b=zscore(a); %数据标准化%去除量纲影响
%对每一列进行标准化（每一列表示的是相同的属性）
% Z = zscore(X) returns the z-score for each element
%of X such that columns of X are centered to have 
%mean 0 and scaled to have standard deviation 1. 
%Z is the same size as X.
% If X is a vector, then Z is a vector of z-scores.
% If X is a matrix, then Z is a matrix of
%the same size as X, and each column of Z has mean 0 
%and standard deviation 1.

z=linkage(b','average','correlation');  %按类平均法聚类
figure
h=dendrogram(z);  %画聚类图
set(h,'Color','k','LineWidth',1.3)  %把聚类图线的颜色改成黑色，线宽加粗
T=cluster(z,'maxclust',6)  %把变量划分成6类
for i=1:6
    tm=find(T==i);  %求第i类的对象
    fprintf('第%d类的有%s\n',i,int2str(tm')); %显示分类结果
end


%% 采用另一种聚类度量方法--相关系数距离
clc, clear, close all
%a=readmatrix('anli10_1.txt');
a=load('anli10_1.txt');
b=zscore(a); %数据标准化%去除量纲影响

r=corrcoef(b) %计算相关系数矩阵
%r=corrcoef(b)输入矩阵b,n*m,n个样本的m个属性矩阵
%%输入的b每一列表示同一个属性
%输出r是m*m矩阵，表示列与列之间的相关系数，
%即每个属性之间相关系数
% %corrcoef示例
% x = randn(6,1);
% y = randn(6,1);
% A = [x y 2*y+3];
% R = corrcoef(A)

d=tril(1-r); d=nonzeros(d); %另外一种计算距离方法
z=linkage(d');  %按类平均法聚类
figure
h=dendrogram(z);  %画聚类图
set(h,'Color','k','LineWidth',1.3)  %把聚类图线的颜色改成黑色，线宽加粗
T=cluster(z,'maxclust',6)  %把变量划分成6类
for i=1:6
    tm=find(T==i);  %求第i类的对象
    fprintf('第%d类的有%s\n',i,int2str(tm')); %显示分类结果
end

下面，紧接着，进行样本聚类分析，即Q型聚类分析

主成分分析

主成分分析，利用已知的m维属性的样本数据X，找到m维方向向量C，时X*C的方差最大（差异化最大，方差表示差异化，方差越大，差异化越大，差异越大，表明找到了已知的m维变量的最大变异），单位化使求得的结果C有意义。

由上，求得的便叫作主成分。一般，求一个主成分不够，还要求几个，并且保证求得的主成分互相正交（这是m维空间，必能求到m个互相正交的单位向量）

数据data10_5.txt

7	26	6	60	78.5
1	29	15	52	74.3
11	56	8	20	104.3
11	31	8	47	87.6
7	52	6	33	95.9
11	55	9	22	109.2
3	71	17	6	102.7
1	31	22	44	72.5
2	54	18	22	93.1
21	47	4	26	115.9
1	40	23	34	83.8
11	66	9	12	113.3
10	68	8	12	109.4

代码如下

clc,clear
%a=readmatrix('data10_5.txt');
a=load('data10_5.txt');
[m,n]=size(a);
x0=a(:,[1:n-1]); y0=a(:,n); 
r=corrcoef(x0)  %计算相关系数矩阵

clc,clear
%输入数据
a=load('data10_5.txt');
[m,n]=size(a);
x0=a(:,[1:n-1]); y0=a(:,n); 
xd=zscore(x0);  %对设计矩阵进行标准化处理
yd=zscore(y0);  %对y0进行标准化处理
r=corrcoef(x0)  %计算相关系数矩阵

%% 直接做最小二乘法线性回归
%左除计算回归系数%线性%下面的左除自带的是最小二乘法
hg1=[ones(m,1),x0]\y0;   %计算普通最小二乘法回归系数

%变成行向量显示回归系数,其中第1个分量是常数项，
%其它按x1,...,xn排序
hg1=hg1'
%输出最小二乘法结果结果
fprintf('y=%f',hg1(1)); %开始显示普通最小二乘法回归结果
for i=2:n
    if hg1(i)>0  
       fprintf('+%f*x%d',hg1(i),i-1);
    else
       fprintf('%f*x%d',hg1(i),i-1)
    end
end
fprintf('\n')  

%% 最小二乘法+pca主成分分析回归
xd=zscore(x0);  %对设计矩阵进行标准化处理
yd=zscore(y0);  %对y0进行标准化处理
[vec1,lamda,rate]=pcacov(r) %vec1为r的特征向量，lamda为r的特征值，rate为各个主成分的贡献率
f=repmat(sign(sum(vec1)),size(vec1,1),1); %构造与vec1同维数的元素为±1的矩阵
vec2=vec1.*f %修改特征向量的正负号，使得特征向量的所有分量和为正
contr=cumsum(rate) %计算累积贡献率，第i个分量表示前i个主成分的贡献率%根据这个，确定主成分个数是3
df=xd*vec2;  %计算所有主成分的得分
num=input('请选项主成分的个数:')   %通过累积贡献率交互式选择主成分的个数%输入3
hg21=df(:,[1:num])\yd  %主成分变量的回归系数,这里由于数据标准化，回归方程的常数项为0
hg22=vec2(:,1:num)*hg21  %标准化变量的回归方程系数
hg23=[mean(y0)-std(y0)*mean(x0)./std(x0)*hg22, std(y0)*hg22'./std(x0)]  %计算原始变量回归方程的系数
%% 开始显示主成分回归结果
fprintf('y=%f',hg23(1)); 
for i=2:n
    if hg23(i)>0
        fprintf('+%f*x%d',hg23(i),i-1);
    else
        fprintf('%f*x%d',hg23(i),i-1);
    end
end
fprintf('\n')

%% 下面计算两种回归分析的剩余标准差
rmse1=sqrt(sum((hg1(1)+x0*hg1(2:end)'-y0).^2)/(m-n))   %拟合了n个参数
rmse2=sqrt(sum((hg23(1)+x0*hg23(2:end)'-y0).^2)/(m-num)) %拟合了num个参数

显著性检验---置信区间--置信度

确定特征成分个数:1.累计贡献率2.选择的主成分对原始变量的贡献值---相关系数

输入数据--》标准化--》相关系数作为变量相似性度量--》pca主成分提取

原始数据文件见上

clc, clear, close all
%a=readmatrix('anli10_1.txt');
a=load('anli10_1.txt');
a=zscore(a);
r=corrcoef(a)
[vec1,lamda,rate]=pcacov(r) %vec1为r的特征向量，lamda为r的特征值，rate为各个主成分的贡献率
f=repmat(sign(sum(vec1)),size(vec1,1),1); %构造与vec1同维数的元素为±1的矩阵
vec2=vec1.*f %修改特征向量的正负号，使得特征向量的所有分量和为正
contr=cumsum(rate) %计算累积贡献率，第i个分量表示前i个主成分的贡献率
%根据这个，确定主成分个数是4
%每个主成分占一列
% df=a*vec2;  %计算所有主成分的得分
vec1(:,1:4)
df=a*vec2(:,1:4);  %计算前四个主成分的得分
tf=df*rate(1:4)/100
[stf,ind]=sort(tf,'descend')
[stf,ind]

因子分析

数据文件anli10_3.txt

43.31	7.39	8.73	54.89	15.35
17.11	12.13	17.29	44.25	29.69
21.11	6.03	7	89.37	13.82
29.55	8.62	10.13	73	14.88
11	8.41	11.83	25.22	25.49
17.63	13.86	15.41	36.44	10.03
2.73	4.22	17.16	9.96	74.12
29.11	5.44	6.09	56.26	9.85
20.29	9.48	12.97	82.23	26.73
3.99	4.64	9.35	13.04	50.19
22.65	11.13	14.3	50.51	21.59
4.43	7.3	14.36	29.04	44.74
5.4	8.9	12.53	65.5	23.27
7.06	2.79	5.24	19.79	40.68
19.82	10.53	18.55	42.04	37.19
7.26	2.99	6.99	22.72	56.58

得分和负债水平的相关系数和对应置信水平

得分与负债水平的回归方程及对应显著水平

clear
%% 0%导入数据
a = load('anli10_3.txt'); 
n=size(a,1);%获得样本个数
x=a(:,[1:4]); y=a(:,5); %分别提出自变量x1...x4和因变量y的值
%% 1标准化
x=zscore(x); %数据标准化
%% 2计算相关系数矩阵
r=corrcoef(x)  %求相关系数矩阵
%% 3%计算初等载荷矩阵
%计算相关系数矩阵的特征值和对应特征向量
%vel是特征向量，val是特征值，con1是贡献率
[vec1,val,con1]=pcacov(r)  %进行主成分分析的相关计算
f1=repmat(sign(sum(vec1)),size(vec1,1),1);
vec2=vec1.*f1;     %特征向量正负号转换
f2=repmat(sqrt(val)',size(vec2,1),1); 
a=vec2.*f2   %求初等载荷矩阵

%factoran computes the maximum likelihood 
%estimate (MLE) of the factor loadings matrix Λ 
%in the factor analysis model
%x=μ+Λf+e
%如果指标变量多，选取的主因子个数少，
%可以直接使用factoran进行因子分析
%% 4选择初等载荷矩阵
%num=input('请选择主因子的个数：');  %交互式选择主因子的个数
num=2;
%本题选择2个主因子
am=a(:,[1:num]);  %提出num个主因子的载荷矩阵
[bm,t]=rotatefactors(am,'method', 'varimax') %am旋转变换,bm为旋转后的载荷阵

bt=[bm,a(:,[num+1:end])];  %旋转后的载荷阵,前两个旋转，后面不旋转
con2=sum(bt.^2)       %计算因子贡献
check=[con1,con2'/sum(con2)*100] %未旋转和旋转后的贡献率对照
rate=con2(1:num)/sum(con2) %计算因子贡献率
con=cumsum(rate)
%贡献-贡献率-累计贡献率%贡献率数据
[con2(1:num)',rate',con']

%% 计算因子得分，进行综合评价
coef=inv(r)*bm          %计算得分函数的系数
score=x*coef           %计算各个因子的得分
weight=rate/sum(rate)  %计算得分的权重

Tscore=score*weight'   %对各因子的得分进行加权求和，即求各企业综合得分

[STscore,ind]=sort(Tscore,'descend')      %对企业进行排序%得分F
display=[score(ind,:)';STscore';ind']' %显示排序结果


[ccoef,p]=corrcoef([Tscore,y])    %计算F与资产负债的相关系数
[d,dt,e,et,stats]=regress(Tscore,[ones(n,1),y]);%计算F与资产负债的方程
d,stats  %显示回归系数，和相关统计量的值
%Model statistics, returned as a numeric vector 
%including the R2 statistic, the F-statistic and its p-value, 
%and an estimate of the error variance.

%% 利用regress求解线性回归方程
%计算F1与x1-x4的方程
[d_f1,dt,e,et,stats_f1]=regress(score(:,1),[ones(n,1),x]);
d_f1,stats_f1
%计算F2与x1-x4的方程
[d_f2,dt,e,et,stats_f2]=regress(score(:,2),[ones(n,1),x]);
d_f2,stats_f2
% format short
%计算F与F1/F2的方程
[d_ff,dt,e,et,stats_ff]=regress(Tscore,[ones(n,1),score]);
d_ff,stats_ff

判别分析

判别分析，根据样本的属性，推断样本的类别，类似于无监督分类模型

典型相关性分析

从表24知，u和v之间的相关系数是0.5537

如上，得到u和v解释本组原始变量的比率分别是0.5818、0.3721

表2-1

典型相关系数

x-u，y-v

x-v，y-u相关系数

anli10_5_1.txt

1.00	0.49	0.53	0.49	0.51	0.33	0.32	0.20	0.19	0.30	0.37	0.21
0.49	1.00	0.57	0.46	0.53	0.30	0.21	0.16	0.08	0.27	0.35	0.20
0.53	0.57	1.00	0.48	0.57	0.31	0.23	0.14	0.07	0.24	0.37	0.18
0.49	0.46	0.48	1.00	0.57	0.24	0.22	0.12	0.19	0.21	0.29	0.16
0.51	0.53	0.57	0.57	1.00	0.38	0.32	0.17	0.23	0.32	0.36	0.27
0.33	0.30	0.31	0.24	0.38	1.00	0.43	0.27	0.24	0.34	0.37	0.40
0.32	0.21	0.23	0.22	0.32	0.43	1.00	0.33	0.26	0.54	0.32	0.58
0.20	0.16	0.14	0.12	0.17	0.27	0.33	1.00	0.25	0.46	0.29	0.45
0.19	0.08	0.07	0.19	0.23	0.24	0.26	0.25	1.00	0.28	0.30	0.27
0.30	0.27	0.24	0.21	0.32	0.34	0.54	0.46	0.28	1.00	0.35	0.59
0.37	0.35	0.37	0.29	0.36	0.37	0.32	0.29	0.30	0.35	1.00	0.31
0.21	0.20	0.18	0.16	0.27	0.40	0.58	0.45	0.27	0.59	0.31	1.00

function anli10_5_fuben
clear
%% 数据导入
r = load('anli10_5_1.txt');  %读入相关系数矩阵
%% 根据公式（81）求m1和m2
n1=5; n2=7; num=min(n1,n2);
s11=r([1:n1],[1:n1]);  %提出X与X的相关系数
s12=r([1:n1],[n1+1:end]); %提出X与Y的相关系数
s21=s12'; %提出Y与X的相关系数
s22=r([n1+1:end],[n1+1:end]); %提出Y与Y的相关系数

m1=inv(s11)*s12*inv(s22)*s21; %计算矩阵M1，式（81）
m2=inv(s22)*s21*inv(s11)*s12; %计算矩阵M2，式（81）

%% 求m1、m2特征值特征向量
[vec1,val1]=eig(m1); %求M1的特征向量vec1和特征值val1

for i=1:n1
    vec1(:,i)=vec1(:,i)/sqrt(vec1(:,i)'*s11*vec1(:,i)); 
    %特征向量归一化，满足a's1a=1
    vec1(:,i)=vec1(:,i)*sign(sum(vec1(:,i))); 
    %特征向量乘以1或－1，保证所有分量和为正
end
val1=sqrt(diag(val1));    %计算特征值的平方根
[val1,ind1]=sort(val1,'descend');  %按照从大到小排列
a=vec1(:,ind1(1:num))    %取出X组的系数阵
% 典型相关系数
dcoef1=val1(1:num)    %提出典型相关系数%%************

[vec2,val2]=eig(m2);  
for i=1:n2
    vec2(:,i)=vec2(:,i)/sqrt(vec2(:,i)'*s22*vec2(:,i));
    vec2(:,i)=vec2(:,i)*sign(sum(vec2(:,i))); 
end
val2=sqrt(diag(val2));    %计算特征值的平方根
[val2,ind2]=sort(val2,'descend');  %按照从大到小排列
b=vec2(:,ind2(1:num))    %取出Y组的系数阵
% 典型相关系数
dcoef2=val2(1:num)    %提出典型相关系数

%% x/y与u、v之间的相关系数
x_u_r=s11*a     %x,u的相关系数
y_v_r=s22*b     %y,v的相关系数
x_v_r=s12*b    %x,v的相关系数
y_u_r=s21*a    %y,u的相关系数

%% u和v分别解释x、y的比率
%u解释x组变量--v解释y组变量
mu=sum(x_u_r.^2)/n1   %x组原始变量被u_i解释的方差比例
mv=sum(x_v_r.^2)/n1   %x组原始变量被v_i解释的方差比例%sum(mv)
nu=sum(y_u_r.^2)/n2   %y组原始变量被u_i解释的方差比例%sum(nu)
nv=sum(y_v_r.^2)/n2   %y组原始变量被v_i解释的方差比例
fprintf('X组的原始变量被u1~u%d解释的比例为%f\n',num,sum(mu));
fprintf('Y组的原始变量被v1~v%d解释的比例为%f\n',num,sum(nv));

典型相关性分析步骤

matlab求解，u=u(x1,x2,x3,x4,x5,x6) ,u=(u1,u2)

v=v(y1,y2,y3,y4),v=(v1,v2)

clear
%导入数据
load x
load y
%数据预处理
p=size(x,2);q=size(y,2);
x=zscore(x);y=zscore(y);   %标准化数据
n=size(x,1);  %观测数据的个数
%下面做典型相关分析
%a1,b1返回的是典型变量的系数，
%r返回的是典型相关系数
%u1,v1返回的是典型变量的值，
%stats返回的是假设检验的一些统计量的值
[a1,b1,r,u1,v1,stats]=canoncorr(x,y)
%根据上面输出的stats，判断怎么利用获得的a1、b1、u1、v1的值，
%下面修正a1,b1每一列的正负号,使得a,b每一列的系数和为正
%对应的，典型变量取值的正负号也要修正
a=a1.*repmat(sign(sum(a1)),size(a1,1),1) %集合1典型标准化相关系数%u=u(x1,x2,x3,x4,x5,x6) 
b=b1.*repmat(sign(sum(b1)),size(b1,1),1) %集合2典型相关系数
u=u1.*repmat(sign(sum(a1)),size(u1,1),1) 
v=v1.*repmat(sign(sum(b1)),size(v1,1),1)
%% 计算x/y与u/v之间的相关系数
x_u_r=x'*u/(n-1)   %计算x,u的相关系数%集合1典型载荷
y_v_r=y'*v/(n-1)   %计算y,v的相关系数%集合2典型载荷
x_v_r=x'*v/(n-1)   %计算x,v的相关系数%集合1交叉载荷
y_u_r=y'*u/(n-1)   %计算y,u的相关系数%集合2交叉载荷
%% 典型相关系数的平方
val=r.^2             %典型相关系数的平方，M1或M2矩阵的非零特征值
%% x组原始变量
ux=sum(x_u_r.^2)/p   %x组原始变量被u_i解释的方差比例
ux_cum=cumsum(ux)    %x组原始变量被u_i解释的方差累积比例
vx=sum(x_v_r.^2)/p   %x组原始变量被v_i解释的方差比例
vx_cum=cumsum(vx)    %x组原始变量被v_i解释的方差累积比例
[ux',ux_cum',val',vx',vx_cum']
%% y组原始变量
vy=sum(y_v_r.^2)/q   %y组原始变量被v_i解释的方差比例
vy_cum=cumsum(vy)    %y组原始变量被v_i解释的方差累积比例
uy=sum(y_u_r.^2)/q   %y组原始变量被u_i解释的方差比例
uy_cum=cumsum(uy)    %y组原始变量被u_i解释的方差累积比例
[vy',vy_cum',val',uy',uy_cum']

x.txt

1.03	0.42	50	2.15	1.23	1.64
1.34	0.13	131	0.33	-0.27	-0.64
1.07	0.4	48	1.31	0.49	0.09
-0.43	0.19	20	0.87	3.57	1.8
-0.53	0.25	32	-0.09	-0.33	-0.84
-0.11	0.07	27	0.68	-0.12	0.87
0.35	0.06	31	0.28	-0.3	-0.16
-0.5	0.27	38	-0.78	-0.12	1.61
0.31	0.25	43	0.49	-0.09	-0.06
-0.28	0.84	37	-0.79	-0.49	-0.98
0.01	-0.14	24	0.37	-0.4	-0.49
0.02	-0.47	28	0.03	0.15	0.26
-0.47	0.03	45	-0.76	-0.46	-0.75
-0.45	-0.2	34	-0.45	-0.34	-0.52
0.72	-0.83	13	0.05	-0.09	0.56
0.37	-0.54	21	-0.11	-0.24	-0.02
0.01	0.38	40	-0.17	-0.4	-0.71
-0.81	-0.49	22	-0.38	-0.21	-0.59
-0.24	-0.91	18	-0.05	-0.27	0.61
-0.53	-0.77	27	-0.45	-0.18	1.08

y.txt

45623.05	2.5	8439	16.27
52256.67	1.3	18579	21.5
46551.87	1.13	10445	11.92
28146.76	1.38	7813	15
38670.43	0.12	8980	26.71
26316.96	1.37	6609	11.07
45330.53	0.56	6070	12.4
45853.89	0.28	7896	13.93
35964.64	0.74	6497	8.97
55832.61	-0.12	13149	9.22
33334.62	0.63	6222	11.63
24633.27	0.59	5573	16.39
39258.78	-0.69	9034	22.43
38201.47	-0.34	7083	18.53
16524.32	0.44	5323	12.22
31855.63	-0.02	6019	11.88
22528.8	-0.16	9069	15.7
21831.94	-0.15	5497	13.56
19966.36	-0.15	5344	12.43
19225.71	-0.16	4233	10.16

将上面的数据存到mat文件里即可，再导入load

对于matlab中的典型相关分析函数canoncorr(x,y)

chi-squared statistic：卡方统计量

[A,B] = canoncorr(X,Y) computes the sample canonical coefficients for the n-by-d1 and n-by-d2 data matrices X and Y. X and Y must have the same number of observations (rows) but can have different numbers of variables (columns). A and B are d1-by-d and d2-by-d matrices, where d = min(rank(X),rank(Y)). The jth columns of A and B contain the canonical coefficients, i.e., the linear combination of variables making up the jth canonical variable for X and Y, respectively. Columns of A and B are scaled to make the covariance matrices of the canonical variables the identity matrix (see U and V below). If X or Y is less than full rank, canoncorr gives a warning and returns zeros in the rows of A or B corresponding to dependent columns of X or Y.

[A,B,r] = canoncorr(X,Y) also returns a 1-by-d vector containing the sample canonical correlations. The jth element of r is the correlation between the jth columns of U and V (see below).

[A,B,r,U,V] = canoncorr(X,Y) also returns the canonical variables, scores. U and V are n-by-d matrices computed as

U = (X-repmat(mean(X),N,1))*A
V = (Y-repmat(mean(Y),N,1))*B

[A,B,r,U,V,stats] = canoncorr(X,Y) also returns a structure stats containing information relating to the sequence of d null hypotheses that the (k+1)st through dth correlations are all zero, for k = 0:(d-1). stats contains seven fields, each a 1-by-d vector with elements corresponding to the values of k, as described in the following table:

Wilks
Wilks' lambda (likelihood ratio) statistic

df1
Degrees of freedom for the chi-squared statistic, and the numerator degrees of freedom for the F statistic
df2
Denominator degrees of freedom for the F statistic
F
Rao's approximate F statistic for H(k)0
pF
Right-tail significance level for F
chisq
Bartlett's approximate chi-squared statistic for H(k)0 with Lawley's modification
pChisq
Right-tail significance level for chisq
stats has two other fields (dfe and p) which are equal to df1 and pChisq, respectively, and exist for historical reasons.

典型相关分析五部分：

1.指标相关性corrcoef

2.典型相关系数及检验

3.典型相关模型

4.典型结构分析

5.典型冗余分析与解释能力

你可能感兴趣的:(线性代数,matlab,python)

Python高效编程技术大全：从解释器到异步编程竹石文化传播有限公司
本文还有配套的精品资源，点击获取简介：《Python高性能编程技术》旨在指导开发者深入理解Python的性能优化方法。本书涵盖了从解释器机制、数据结构和内置函数的优化，到使用Numpy、Pandas、多线程和多进程进行数值计算和数据处理，再到并发编程和性能分析等全面技术，帮助开发者提升代码执行效率和处理各种性能挑战。1.Python解释器性能分析Python作为一门解释型语言，其性能受到解释器行为
Python day15
@浙大疏锦行Pythonday15.内容：复习日本周主要的内容是一些常见的机器学习流程以及其中的部分内容标签编码以及连续特征的处理：归一化和正态化等。图像的绘制：热力图、Shap图等的绘制超参数优化算法：网格搜索、贝叶斯以及启发式算法模拟退火、遗传算法等不平衡数据集的处理：过采样以及欠采样。
Python Day16 赵英英俊 Python训练 python
@浙大疏锦行Pythonday16内容：numpy数组的创建以及相关操作numpy的索引理解SHAP值代码：importnumpyasnpa=np.array([[1,2],[3,4],[5,6]])b=np.array([[7,8],[9,10],[11,12]])效果：
【OCR炼丹】解析HIT-OR3C数据集online部分Python版完整代码
最近开始炼手写体汉字识别方面的丹，网上找了下数据集，主要有：中科院自动化研究所开源的CASIA数据集（下载链接地址）哈工大开源的HIT-OR3C数据集（下载链接地址）这俩数据集的存储形式与之前接触过的一些共有数据集的保存形式有很大的区别，对于C、C++不是很熟用Python较多的我来说踩了不少的坑（还都是CSDN、知乎、Google都搜不到的巨坑），造福下后来人吧。首先，明确一点，由于博主此次研究
如何解决AttributeError: ‘NoneType‘ object has no attribute问题
如何解决AttributeError:‘NoneType’objecthasnoattribute问题问题背景与概述在Python项目开发和调试过程中，经常会碰到这样一个异常信息：AttributeError:'NoneType'objecthasnoattribute'foo'这意味着你尝试访问或调用某个对象的属性／方法foo，但此时对象本身是None，从而触发了AttributeError。本
day---python变量的概念小白进阶中 python
变量的概念python是面向对象的，解释型和弱类型。变量：里面盛放的值随时可以发生变化，声明变量实际上是给内存要空间。给你赋什么值就是什么类型*字母数字下划线不能用下划线开头。多个变量需要打印时候用–逗号value表示一个值，sep=“”表示之间用空格分隔，可以自己改成别的。end=“\n”就是转义字符，默认是\n在字符串里面有\n就可以换行。默认的追加。name='小白'age=18gender
Python自动化神器：Faker库生成逼真测试数据的10种高级技巧
Python自动化神器：Faker库生成逼真测试数据的10种高级技巧fromfakerimportFakerimportpandasaspdimportjsonfromdatetimeimportdatetime#创建一个Faker实例fake=Faker('zh_CN')#使用中文本地化#生成基本个人信息defgenerate_user():return{"name":fake.name(),"
Python day18 赵英英俊 Python训练 python
@浙大疏锦行pythonday18.内容：昨天学习了聚类算法的一些基本内容，今天继续学习相关知识分析簇的特征和相关含义（使用可视化来进行分析，也可以使用ai）代码：shap.initjs()#初始化SHAP解释器explainer=shap.TreeExplainer(model)shap_values=explainer.shap_values(x1)#这个计算耗时shap_values.sha
【完全掌握】PyPDF2/PyPDF4深度指南：Python轻松实现PDF读取与操作的15个高级技巧莫比乌斯@卷技术技巧 #文档处理扩展 python pdf 服务器
【完全掌握】PyPDF2/PyPDF4深度指南：Python轻松实现PDF读取与操作的15个高级技巧1.PDF库基础了解1.1PyPDF2与PyPDF4的关系与选择PyPDF2是一个历史悠久的PythonPDF处理库，而PyPDF4是其改进和维护的分支版本：#安装PyPDF2pipinstallPyPDF2#或安装PyPDF4（推荐）pipinstallPyPDF4PyPDF4相比PyPDF2有以
【华为OD机试真题 2025C卷】161、机器人可活动的最大网格点数目 | 机试真题+思路参考+代码解析（C++、Java、Py、C语言、JS） KFickle 最新华为OD机试(C++Java Py C JS)+OJ 华为od 机器人 c++华为OD机试真题 java 机器人可活动的最大网格点数目 c语言
文章目录一、题目题目描述输入输出样例1二、代码与思路参考C++代码Java代码Python代码C语言代码JS代码订阅本专栏后即可解锁在线OJ刷题权限个人博客首页：KFickle专栏介绍：最新的华为OD机试真题，使用C++，Java，Python，C语言，JS五种语言进行解答，每个题目都包含解题思路，五种语言的解法，每日持续更新中，订阅后支持开通在线OJ测试刷题！！！一次订阅永久享受更新，有代码问题
零基础Python入门（1）——手把手安装PyCharm并打印Hello World 名字都被谁用了 Python入门 python pycharm 开发语言
一、Python开发环境全攻略1.1Python的"身份证"——版本选择指南Python目前主流版本分为2.x和3.x两大分支，官方已于2020年正式停止对Python2的维护。对于新手，我们强烈建议选择Python3.10及以上版本。这个版本区间既保留了经典语法特性，又支持最新语法糖（如模式匹配），同时具备良好的第三方库兼容性。版本号小知识：3.10.6中的3表示大版本10代表功能版本6是维护版
用ESP8266和MicroPython打造WiFi智能遥控小车：从入门到实战
项目概述：WiFi控制的创新体验在物联网技术飞速发展的今天，传统遥控小车早已无法满足创客们的探索欲望。本文将介绍一个基于ESP8266和MicroPython的WiFi遥控小车项目，通过两个ESP8266模块实现无线通信，让你摆脱传统遥控器的束缚，体验物联网控制的乐趣。核心功能亮点WiFi无线控制：无需传统射频模块，通过WiFi网络实现远程操控双ESP8266架构：一个作为车载接收端，一个作为手持
PyCharm高效入门指南：快速提升Python开发效率 famenzhiling python pycharm ide
1.引言PyCharm简介：JetBrains开发的Python集成开发环境（IDE），适用于专业开发者和初学者。为什么选择PyCharm：高效代码编辑、智能工具集成和强大的调试功能。目标读者：Python新手或有其他IDE经验但想快速上手PyCharm的用户。2.安装与初始配置下载与安装：访问JetBrains官网下载PyCharmCommunity（免费版）或Professional（付费版）
Postman + Newman + Jenkins 接口自动化测试 Thomas Kant 自动化测试 postman newman jenkins allure
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】Postman
Python 装饰器使用详解
文章目录0.引言1.什么是装饰器？2.装饰器的基本语法3.装饰器的工作原理4.常见装饰器应用场景4.1.日志记录4.2.权限校验4.3.缓存5.多重装饰器的执行顺序6.装饰器的高级用法6.1.带参数的装饰器6.2.使用`functools.wraps`6.3.类装饰器7.图示说明7.1.单一装饰器的执行流程2.多重装饰器的执行流程3.带参数装饰器的执行流程总结8参考资料0.引言Python装饰器(
豆包教你如何用Python向女生表白 51reboot
一年一度的考试大会又拉开了帷幕其中的一个重头戏就是python了不知道正处于手机前的你为python又掉了多少头发呢but！！！python绝不只是你脱发的工具善于使用你将收获多多比如你知道如何利用python向女生表白吗如果不知道少年，你可要当心啦考试很危险的呢后记：某年月日，某许愿池推文：震惊！某旦python考试题新鲜出炉，考题震惊十几亿中国人！原因竟是。。。待豆包点开推文：一看考试题，嘿哈
python ffmpeg pipe_如何使用python从ffmpeg输出管道？ weixin_39611725 python ffmpeg pipe
我正在尝试将FFmpeg的输出用管道输送到Python中。我正在从一个视频采集卡读取图像，我成功地使用dshow从命令行将其读入输出文件。我正在尝试从卡抓取图像到我的OpenCv代码，以便能够进一步处理数据。不幸的是，当我通过管道输出图像时，我只得到视频的显示，如链接所示：link:s000.tinyupload.com/?file_id=15940665795196022618.我使用的代码如下
python ffmpeg pipe,管道的ffmpeg的输入和输出在python 呼呼啦啦就瘸了 python ffmpeg pipe
I'musingffmpegtocreateavideo,fromalistofbase64encodedimagesthatIpipeintoffmpeg.Outputtingtoafile(usingtheattachedcodebelow)worksperfectly,butwhatIwouldliketoachieveistogettheoutputtoaPythonvariableins
Linux+Python实战课堂：笔记、练习与应用
本文还有配套的精品资源，点击获取简介：本压缩包提供全面的Linux学习资源和Python编程练习，旨在帮助初学者和IT从业者深入理解Linux系统及其技能，并通过Python编程练习巩固相关技能。涵盖Linux基础概念、文件系统、命令行操作、文本编辑器使用、用户和组管理、软件管理、进程监控、网络配置以及系统性能监控等多个方面。同时，包含Python基础语法、函数与模块、面向对象编程、文件操作、异常
线性代数小述（三）天宫风子线性代数决策树机器学习
线性代数小述（三）byAmamiyaFuko此去经年返，安知胡不归？前言FU⭐️KO首先需要对上一篇的线性组合的概念做一个更正，然后是考虑行列式相关的内容。目录1.线性组合2.行列式-行列式运算的定义-拉普拉斯展开线性组合线性组合是对一个向量的分解。考虑一个二维空间，若某一向量与两个向量在同在该空间中，且这两个向量是线性无关的（不平行的），则必然有这个向量对于后两个向量的线性组合表示，如Av1ˇ+
Python脚本批量修复文件时间戳，根据文件名或拍摄日期 3D_DLW 储存服务器 python 图片整理修改时间批处理脚本拍摄时间
实现以下功能更正文件的修改时间批量修改指定文件夹中的特定后缀的文件根据文件名中的日期修改（优先）根据jpg文件属性中的拍摄日期修改根据mp4文件属性中的创建媒体日期修改模拟运行（DryRun）模式依赖若需要基于jpg文件属性中的拍摄日期修改，需要python的piexif包pipinstallpiexif若需要基于mp4文件属性中的创建媒体日期修改，需要ffmpegsudoaptinstallff
深入Python闭包内存泄漏：从原理到实战修复指南清水白石008 Python题库 python python 开发语言
深入Python闭包内存泄漏：从原理到实战修复指南引言：闭包与内存管理的双重挑战在Python编程中，闭包（Closure）作为函数式编程的重要特性，被广泛应用于装饰器、回调函数等场景。然而，当闭包与类实例结合使用时，若处理不当极易引发内存泄漏问题。本文将通过一个典型案例，深入剖析闭包导致内存泄漏的机理，并演示从检测到修复的完整流程，最终提炼出防御性编程的最佳实践。一、内存泄漏闭包案例实录1.1典
matlab时域采样与频域采样,实验二：时域采样与频域采样.doc weixin_39905624 matlab时域采样与频域采样
实验二：时域采样与频域采样实验二：时域采样与频域采样1.实验目的时域采样理论与频域采样理论是数字信号处理中的重要理论。要求掌握模拟信号采样前后频谱的变化，以及如何选择采样频率才能使采样后的信号不丢失信息；要求掌握频率域采样会引起时域周期化的概念，以及频率域采样定理及其对频域采样点数选择的指导作用。2.实验原理与方法对模拟信号以间隔T进行时域等间隔理想采样，形成的采样信号的频谱是原模拟信号频谱以采样
Python装饰器与闭包：实战应用与深入理解
背景简介本章深入探讨了Python装饰器与闭包的核心概念，展示了它们在实际编程中的灵活应用和强大功能。装饰器的魔力：保持元数据与链式应用在Python中，装饰器是一种修改或增强函数行为的强大工具，它能够让我们在不改变原始函数代码的情况下，为其添加新功能。保持函数的元数据是装饰器的一个重要特性，它确保了装饰后的函数保持其身份和文档字符串信息。这对于代码的可读性和维护性至关重要。当需要将多个装饰器应用
python闭包的应用场景_简单谈谈Python中的闭包 weixin_39587113 python闭包的应用场景
Python中的闭包前几天又有人留言，关于其中一个闭包和re.sub的使用不太清楚。我在脚本之家搜索了下，发现没有写过闭包相关的东西，所以决定总结一下，完善Python的内容。1.闭包的概念首先还得从基本概念说起，什么是闭包呢？来看下维基上的解释:在计算机科学中，闭包(Closure)是词法闭包(LexicalClosure)的简称，是引用了自由变量的函数。这个被引用的自由变量将和这个函数一同存在
网络爬虫——python爬取豆瓣评论 SSeaflower 爬虫 python 开发语言
网络爬虫——python爬取豆瓣评论一、网络爬虫概述1.1网络爬虫定义网络爬虫，又被称为网络蜘蛛（WebSpider）、网络机器人等。它根据网页地址（URL）爬取网页内容，网页地址（URL）就是我们在浏览器中输入的网站链接。例如：https://www.baidu.com；https://movie.douban.com/。网络爬虫不仅能够复制网页信息和下载音视频，还可以做到网站的模拟登录和行为链
Python 中的深拷贝、浅拷贝与等号赋值：理解对象复制的本质小羊苏八 python 开发语言
目录1.等号赋值（=）2.浅拷贝（copy.copy()）3.深拷贝（copy.deepcopy()）4.不可变对象与可变对象5.性能对比6.实际应用场景7.总结前言在Python中，对象的复制是一个常见的操作，但很多人对深拷贝、浅拷贝和等号赋值之间的区别感到困惑。本文将通过详细的示例和解释，帮助你深入理解这三种操作的本质和应用场景。1.等号赋值（=）在Python中，等号赋值是最基本的对象操作之
Python中的分支结构小羊苏八 #python python 开发语言
文章目录前言一、Python分支结构概述二、if语句详解三、if-else语句详解四、if-elif-else语句详解五、嵌套分支结构六、分支结构的注意事项七、实际应用场景八、总结前言在Python编程的世界里，分支结构如同现实中的道路岔口，根据不同的条件引导程序流向不同的执行路径。它是构建复杂逻辑、实现智能决策的关键所在。本文将带你全面了解Python的分支结构，从基础语法到实际应用，让你轻松掌
标题 “Python 网络爬虫 —— selenium库驱动浏览器 WeiJingYu. python 爬虫 selenium
一、Selenium库核心认知Selenium库是Web应用程序测试与自动化操作的利器，能驱动浏览器（如Edge、Firefox等）执行点击、输入、打开、验证等操作。与Requests库差异显著：Requests库仅能获取网页原始代码，而Selenium基于浏览器驱动程序工作，浏览器可渲染网页源代码，借此能轻松拿到渲染后的数据信息（如JS动态加载内容），完美解决Requests库无法处理的动态页面
Python网络爬虫实现selenium对百度识图二次开发以及批量保存Excel WeiJingYu. python 爬虫 selenium
一.百度识图自动上传图片fromseleniumimportwebdriverfromselenium.webdriver.edge.optionsimportOptionsfromselenium.webdriver.common.byimportByedge_options=Options()edge_options.binary_location=r"C:\ProgramFiles(x86)
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S