Fisher分类器Matlab

Fisher分类器用于解决二类线性可分问题。

Fisher准则基本原理:找到一个最合适的投影轴,使两类样本在该轴上投影之间的距离尽可能远,而每一类样本的投影尽可能紧凑,从而使分类效果为最佳。

Fisher分类器Matlab_第1张图片


例如上图中:通过将方块点和圆点向w1投影,然后再在设置合适的阈值即可将方块和圆点分离。

Fisher分类器Matlab_第2张图片

 

Matlab程序如下:

[html]  view plain  copy
  1. %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%  
  2. %By Shelley from NCUT,April 2nd 2011  
  3. %Email:[email protected]  
  4. %本m文件实现fisher算法,并对两个二维正态分布随机序列  
  5. %进行训练,进而可在屏幕上任意取点,程序可输出属于第一类  
  6. %还是第二类  
  7. %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%  
  8.   
  9. %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%  
  10. %分别产生x轴和y轴都为正态分布的随机序列  
  11. %假设x轴和y轴序列相互独立,可产生二维正态分布随机序列  
  12. %w1、w2分别用来保存两个训练集的横坐标和纵坐标  
  13. %用normrnd函数产生正态分布函数  
  14. %normrnd(mean,omega,[row,column])  
  15. %mean:均值;omega:标准差  
  16. %row:产生随机序列的行数;column:产生随机序列的列数  
  17. %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%  
  18.  X1 = normrnd(40,10,[200,1]);  
  19.  Y1 = normrnd(40,10,[200,1]);  
  20.  w1=[X1, Y1];  
  21.  X2 = normrnd(5 ,10,[100,1]);  
  22.  Y2 = normrnd(0 ,10,[100,1]);  
  23.  w2=[X2, Y2];  
  24.    
  25. %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%  
  26. %以下部分为fisher算法的实现  
  27. %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%  
  28. %计算样本均值  
  29. m1=mean(w1)';  
  30. m2=mean(w2)';  
  31. %s1、s2分别代表表示第一类、第二类样本的类内离散度矩阵  
  32. s1=zeros(2);  
  33. [row1,colum1]=size(w1);  
  34. for i=1:row1  
  35.     s1 = s1 + (w1(i,:)'-m1)*(w1(i,:)'-m1)';  
  36. end;  
  37. s2=zeros(2);  
  38. [row2,colum2]=size(w2);  
  39. for i=1:row2  
  40.     s2 = s2 + (w2(i,:)' - m2)*(w2(i,:)' - m2)';  
  41. end;  
  42. %计算总类内离散度矩阵Sw  
  43. Sw=s1+s2;  
  44. %计算fisher准则函数取极大值时的解w  
  45. w=inv(Sw)*(m1-m2);  
  46. %计算阈值w0  
  47. ave_m1 = w'*m1;  
  48. ave_m2 = w'*m2;  
  49. w0 = (ave_m1+ave_m2)/2;  
  50. %画出两类训练样本点  
  51. figure(1)  
  52. plot(X1,Y1,'.r',X2,Y2,'.b');%画出两类样本点  
  53. hold on;grid;  
  54. %画出取极大值时的解w  
  55. x = [-40:0.1:40];  
  56. y = x*w(2)/w(1);  
  57. plot(x,y,'g')  
  58. %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%  
  59. %以下为测试部分  
  60. %利用ginput随机选取屏幕上的点(可连续取10个点)  
  61. %程序可根据点的位置自动地显示出属于那个类  
  62. %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%  
  63. for i=1:10  
  64.    
  65.   
  66.   [x,y]=ginput(1);  
  67.    plot(x,y,'m*');  
  68.    sample=[x,y];  
  69.     holdall  
  70.     if(sample*w- w0>0)  
  71.         disp('it belong to the first class');  
  72.     else  
  73.         disp('it belong to the second class');  
  74.     end;  
  75. end  
  76. %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%  




代码二:

[html]  view plain  copy
  1. function fisher  
  2. x1=[0.2331 1.5207 0.6499 0.7757 1.0524 1.1974  
  3.     0.2908 0.2518 0.6682 0.5622 0.9023 0.1333  
  4.     -0.5431 0.9407 -0.2126 0.0507 -0.0810 0.7315  
  5.     0.3345 1.0650 -0.0247 0.1043 0.3122 0.6655  
  6.     0.5838 1.1653 1.2653 0.8137 -0.3399 0.5152  
  7.     0.7226 -0.2015 0.4070 -0.1717 -1.0573 0.2099];  
  8. x2=[2.3385 2.1946 1.6730 1.6365 1.7844 2.0155  
  9.     2.0681 2.1213 2.4797 1.5118 1.9692 1.8340  
  10.     1.8704 2.2948 1.7714 2.3939 1.5648 1.9329  
  11.     2.2027 2.4568 1.7523 1.6991 2.4883 1.7259  
  12.     2.0466 2.0226 2.3757 1.7987 2.0828 2.0798  
  13.     1.9449 2.3801 2.2373 2.1614 1.9235 2.2604];  
  14. x3=[0.5338 0.8514 1.0831 0.4164 1.1176 0.5536  
  15.     0.6071 0.4439 0.4928 0.5901 1.0927 1.0756  
  16.     1.0072 0.4272 0.4353 0.9869 0.4841 1.0992  
  17.     1.0299 0.7127 1.1024 0.4576 0.8544 1.1275  
  18.     0.7705 0.4129 1.0085 0.7676 0.8418 0.8784  
  19.     0.9751 0.7840 0.4158 1.0315 0.7533 0.9548];  
  20. %将x1,x2,x3变为列向量  
  21. x1=x1(:);  
  22. x2=x2(:);  
  23. x3=x3(:);  
  24. %计算第一类的样本均值向量  
  25. m1(1)=mean(x1);  
  26. m1(2)=mean(x2);  
  27. m1(3)=mean(x3);  
  28. %计算第一类样本类内散度矩阵S1  
  29. S1=zeros(3,3);  
  30. for i=1:36  
  31.     S1=S1+[-M1(1)+X1(I)-m1(2)+x2(i)-m1(3)+x3(i)]'*[-m1(1)+x1(i)-m1(2)+x2(i)-m1(3)+x3(i)];  
  32. end  
  33. x4=[1.4010 1.2301 2.0814 1.1655 1.3740 1.1829  
  34.     1.7632 1.9739 2.4152 2.5890 2.8472 1.9539  
  35.     1.2500 1.2864 1.2614 2.0071 2.1831 1.7909  
  36.     1.3322 1.1466 1.7087 1.5920 2.9353 1.4664  
  37.     2.9313 1.8349 1.8340 2.5096 2.7198 2.3148  
  38.     2.0353 2.6030 1.2327 2.1465 1.5673 2.9414];  
  39. x5=[1.0298 0.9611 0.9154 1.4901 0.8200 0.9399  
  40.     1.1405 1.0678 0.8050 1.2889 1.4601 1.4334  
  41.     0.7091 1.2942 1.3744 0.9387 1.2266 1.1833  
  42.     0.8798 0.5592 0.5150 0.9983 0.9120 0.7126  
  43.     1.2833 1.1029 1.2680 0.7140 1.2446 1.3392  
  44.     1.1808 0.5503 1.4708 1.1435 0.7679 1.1288];  
  45. x6=[0.6210 1.3656 0.5498 0.6708 0.8932 1.4342  
  46.     0.9508 0.7324 0.5784 1.4943 1.0915 0.7644  
  47.     1.2159 1.3049 1.1408 0.9398 0.6197 0.6603  
  48.     1.3928 1.4084 0.6909 0.8400 0.5381 1.3729  
  49.     0.7731 0.7319 1.3439 0.8142 0.9586 0.7379  
  50.     0.7548 0.7393 0.6739 0.8651 1.3699 1.1458];  
  51. x4=x4(:);  
  52. x5=x5(:);  
  53. x6=x6(:);  
  54. %计算第二类的样本均值向量m2  
  55. m2(1)=mean(x4);  
  56. m2(2)=mean(x5);  
  57. m2(3)=mean(x6);  
  58. %计算第二类样本类内散度矩阵S2  
  59. S2=zeros(3,3);  
  60. for i=1:36  
  61.     S2=S2+[-m2(1)+x4(i)-m2(2)+x5(i)-m2(3)+x6(i)]'*[-m2(1)+x4(i)-m2(2)+x5(i)-m2(3)+x6(i)];  
  62. end  
  63. %总类内散度矩阵  
  64. Sw=zeros(3,3);  
  65. Sw=S1+S2;  
  66. %样本类间散度矩阵Sb  
  67. Sb=zeros(3,3);  
  68. Sb=(m1-m2)'*(m1-m2);  
  69. %最优解W  
  70. W=S^-1*(m1-m2)'  
  71. %将W变为单位向量以方便计算投影  
  72. W=W/sqrt(sum(W.^2));  
  73. %计算一维Y空间中的各类样本均值M1及M2  
  74. for i=1:36  
  75.     y(i)=W'*[x1(i) x2(i) x3(i)]';  
  76. end  
  77. M1=mean(y)  
  78. for i=1:36  
  79.     y(i)=W'*[x4(i) x5(i) x6(i)]';  
  80. end  
  81. M2=mean(y)  
  82. %利用当P(w1)与P(w2)已知的公式计算wo  
  83. p1=0.6;p2=0.4;  
  84. W0=-(M1+M2)/2+(log(p2/p1))/(36+36-2);  
  85. %计算将样本投影到最佳方向上以后的新坐标  
  86. X1=[x1*W(1)+x2*W(2)+x3*W(3)]';  
  87. X2=[x4*W(1)+x5*W(2)+x6*W(3)]';%计算投影得到的长度  
  88. XX1=[W(1)*X1;W(2)*X1;W(3)*X1];  
  89. XX2=[W(1)*X2;W(2)*X2;W(3)*X2];%得到新坐标  
  90. %绘制样本点  
  91. figure(1)  
  92. plot3(x1,x2,x3,'r*') %第一类  
  93. hold on  
  94. plot3(x4,x5,x6,'bp') %第二类  
  95. legend('第一类点','第二类点')  
  96. title('Fisher线性判别函数')  
  97. W1=5*W;  
  98. %画出最佳方向  
  99. line([-W1(1),W1(1)],[-W1(2),W1(2)],[-W1(3),W1(3)],'color','b');  
  100. %判别已给点的分类  
  101. a1=[1,1,5,0.6]';  
  102. a2=[1.2,1.0,0.55]';  
  103. a3  

你可能感兴趣的:(Matlab)