1.最小二乘拟合
最小二乘拟合是一种数学上的近似和优化,利用已知的数据得出一条直线或者曲线,使之在坐标系上与已知数据之间的距离的平方和最小。
2.RANSAC算法
参见王荣先老师的博文 http://www.cnblogs.com/xrwang/archive/2011/03/09/ransac-1.html
3,直线拟合
建立模型时利用直线的一般方程AX+BY+C=0,随机选取两点构建直线模型,计算每个点到此直线的TLS(Total Least Square),TLS小于一定阈值时的点为符合模型的点,点数最多时的模型即为最佳直线模型。再根据此时的直线参数画出最终拟合直线。
4.椭圆拟合
建立模型时利用椭圆的定义方程:dist(P,A)+dist(P,B)=DIST,其中P为椭圆上一点,A和B为椭圆两焦点。随机选取三点A,B,P构建椭圆模型,计算每个点到此两焦点的距离和与DIST的差值,差值小于一定阈值时的点为符合模型的点,点数最多时的模型即为最佳椭圆模型,再根据符合条件的点,利用椭圆一般方程Ax2+Bxy+Cy2+Dx+Ey+F=0 和得到符合点进行系数拟合,根据函数式画出最终拟合椭圆。
5.matlab代码
(1)最小二乘拟合
%% %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% % FILENAME LSF.m % FUNCTION Input points with mouse,Least-squares fit of lines to % 2D points % DATE 2012-10-12 % AUTHOR zhangying %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% clc; %% 鼠标输入点,enter键结束 axis([-10 10 -10 10]); [x,y]=ginput; %读取坐标直到按下回车键,返回坐标点的x,y坐标 num=length(x); %计算点的个数 %% 直接用最小二乘进行拟合 %通过最小化误差的平方和寻找数据的最佳函数匹配 [p1,s1]=polyfit(x,y,1); %n=1为直线拟合 x,y为数据点,n为多项式阶数,返回p为幂次从高到低的多项式系数向量 [p2,s2]=polyfit(x,y,num-2); %n>1为曲线拟合,找到次数为n的多项式,对于数据点集(x,y),满足差的平方和最小 [p3,s3]=polyfit(x,y,num-1); %x必须是单调的。矩阵s用于在polyval中来估计误差。 xcurve=-10:2:10; %在这些点处求多项式的值 p1curve=polyval(p1,xcurve); %多项式曲线求值,返回对应自变量xcurve在给定系数P的多项式的值 p2curve=polyval(p2,xcurve); p3curve=polyval(p3,xcurve); %% 画图 plot(xcurve,p1curve,'g-',xcurve,p2curve,'b-',... xcurve,p3curve,'r-',x,y,'*'); title('不同次数的最小二乘拟合'); legend('degree 1','degree num-2','degree num-1','points');
(2)基于RANSAC的直线拟合
%% %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% % FILENAME RANSACF.m % FUNCTION RANSAC fit of lines to 2D points % DATE 2012-10-11 % AUTHOR zhangying %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% clc; clear; %% 随机点生成 g_NumOfPoints = 500; % 点数 g_ErrPointPart = 0.4; % 噪声 g_NormDistrVar = 1; % 标准偏差 % 生成随机点 theta = (rand(1) + 1) * pi/6; R = ( rand([1 g_NumOfPoints]) - 0.5) * 100; DIST = randn([1 g_NumOfPoints]) * g_NormDistrVar; Data = [cos(theta); sin(theta)] * R + [-sin(theta); cos(theta)] * DIST; Data(:, 1:floor(g_ErrPointPart * g_NumOfPoints)) = 2 * [max(abs(Data(1,:))), 0; 0, max(abs(Data(2,:)))] *... (rand([2 floor(g_ErrPointPart * g_NumOfPoints)]) - 0.5); plot(Data(1, :), Data(2, :), '.', 'Tag', 'DATA'); hold on; %% RANSAC拟合 % 拟合模型初始化 nSampLen = 2; %设定模型所依据的点数 nIter = 50; %最大循环次数 dThreshold = 2; %残差阈值 nDataLen = size(Data, 2); %数据长度 RANSAC_model = NaN; %跳过缺失模型 RANSAC_mask = zeros([1 nDataLen]); %全0矩阵,1表示符合模型,0表示不符合 nMaxInlyerCount = -1; %% 主循环 for i = 1:nIter % 抽样,选取两个不同的点 SampleMask = zeros([1 nDataLen]); while sum( SampleMask ) ~= nSampLen ind = ceil(nDataLen .* rand(1, nSampLen - sum(SampleMask))); %rand产生随机数,ceil向离它最近的大整数圆整 SampleMask(ind) = 1; end Sample = find( SampleMask ); %找出非零元素的索引值,即建立模型的点 %% 建立模型,并查找符合模型的点 ModelSet = feval(@TLS, Data(:, Sample)); %计算所有符合模型的点的最小二乘 for iModel = 1:size(ModelSet, 3) CurModel = ModelSet(:, :, iModel); %当前模型对应的直线参数 CurMask =( abs( CurModel * [Data; ones([1 size(Data, 2)])])< dThreshold);%到直线距离小于阈值的点符合模型,标记为1 nCurInlyerCount = sum(CurMask); %计算符合直线模型的点的个数 %% 选取最佳模型 if nCurInlyerCount > nMaxInlyerCount %符合模型的点数最多的模型即为最佳模型 nMaxInlyerCount = nCurInlyerCount; RANSAC_mask = CurMask; RANSAC_model = CurModel; end end end %% 画最佳模型的拟合结果 MinX=min(Data(1, :)); MaxX=max(Data(1, :)); MinX_Y=-(RANSAC_model(1).*MinX+RANSAC_model(3))./RANSAC_model(2); MaxX_Y=-(RANSAC_model(1).*MaxX+RANSAC_model(3))./RANSAC_model(2); plot([MinX MaxX],[MinX_Y MaxX_Y],'r-'); title('ransac在噪声情况下的直线拟合'); %% 用RANSAC方法拟合原理 % RANSAC算法的输入是一组观测数据,一个可以解释或者适应于观测数据的参数化模型,一些可信的参数。 % RANSAC通过反复选择数据中的一组随机子集来达成目标。被选取的子集被假设为局内点,并用下述方法进行验证: % 1.有一个模型适应于假设的局内点,即所有的未知参数都能从假设的局内点计算得出。 % 2.用1中得到的模型去测试所有的其它数据,如果某个点适用于估计的模型,认为它也是局内点。 % 3.如果有足够多的点被归类为假设的局内点,那么估计的模型就足够合理。 % 4.然后,用所有假设的局内点去重新估计模型,因为它仅仅被初始的假设局内点估计过。 % 5.最后,通过估计局内点与模型的错误率来评估模型。 % 这个过程被重复执行固定的次数,每次产生的模型要么因为局内点太少而被舍弃,要么因为比现有的模型更好而被选用。 %% 问题分析 % 1.关于画直线:根据抽取的两点画最终直线,结果不稳定,每次运行后的直线都会有很大偏差。 % 程序中已经计算出了直线的参数,根据Ax+By+C=0,可以选择数据点中最左边的点和最右边的点确定最终直线,比较稳定。 % 2.调用函数A时,若有函数B做参数,则在函数B前加@,函数B的参数则另外传送,通过feval可将函数的执行方式统一起来。 % 3.关于随机点生成:rand的使用灵活多变。
%% %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% % FILENAME TLS.m % FUNCTION Calculate Total Least Squares of input data % DATE 2012-10-11 % AUTHOR unkown %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %% Total Least Squares TLS(Data) %Return: [a,b,c] - line in a * x + b * y + c = 0 form % where a ^ 2 + b ^ 2 = 1 % TLS(X,Y) - approximates ALL points in array by one line function line = TLS(Data) if any( size(Data) == 0) Line = [0, 0, 0]; return; end X = Data(1, :); Y = Data(2, :); len = length(X); if size(X) ~= size(Y) X = X'; end M = [ mid(X .^ 2) - mid(X) ^ 2, sum(X .* Y) / len - mid(X) * mid(Y);... sum(X .* Y) / len - mid(X) * mid(Y), mid(Y .^ 2) - mid(Y) ^ 2]; [ev,tmp] = eig(M); ind = 2; if ErrFunc(X, Y, ev(:, 1)) < ErrFunc(X, Y, ev(:, 2)) ind = 1; end line = [ev(1,ind), ev(2,ind),... -ev(1,ind) * mid(X) - ev(2,ind) * mid(Y)]; return; % Help function, calculates an error function e = ErrFunc(X,Y,L) maxE = 0; e = 0; c = -L(1) * mid(X) - L(2) * mid(Y); for i = 1:length(X) e = e + ( L(1) * X(i) + L(2) * Y(i) + c )^2; if (L(1) * X(i) + L(2) * Y(i) + c )^2 > maxE maxE = (L(1) * X(i) + L(2) * Y(i) + c )^2; end; end return; % Middle value of vector X function l = mid(X) if length(X) > 0 l = sum(X) / length(X); else l = 0; end; return;
(3)基于RANSAC的椭圆拟合
%% %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% % FILENAME ellipsefit.m % FUNCTIPN Least-squares fit of ellipse to 2D points % DATE 2012-10-12 % AUTHOR zhangying %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %% clc; clear; %% 生成 带噪声的椭圆 % 参数初始化 g_NumOfPoints = 500; % 点数 g_ErrPointPart = 0.4; % 噪声 g_NormDistrVar = 3; % 标准偏差 a=10;b=20; %长轴短轴 angle=60; %倾斜角 %% 椭圆生成 beta = angle * (pi / 180); alpha = linspace(0, 360, g_NumOfPoints) .* (pi / 180); X = (a * cos(alpha) * cos(beta)- b * sin(alpha) * sin(beta) )+wgn(1,length(alpha),g_NormDistrVar^2,'linear'); Y = (a * cos(alpha) * sin(beta)+ b * sin(alpha) * cos(beta) )+wgn(1,length(alpha),g_NormDistrVar^2,'linear'); Data=[X;Y]; plot(Data(1, :), Data(2, :), '.', 'Tag', 'DATA'); hold on; %% RANSAC椭圆拟合 %椭圆一般方程:Ax2+Bxy+Cy2+Dx+Ey+F=0 %F=@(p,x)p(1)*x(:,1).^2+p(2)*x(:,1).*x(:,2)+p(3)*x(:,2).^2+p(4)*x(:,1)+p(5) %% 参数初始化 nSampLen = 3; %设定模型所依据的点数 nDataLen = size(Data, 2); %数据长度 nIter = 50; %最大循环次数 dThreshold = 2; %残差阈值 nMaxInlyerCount=-1; %点数下限 A=zeros([2 1]); B=zeros([2 1]); P=zeros([2 1]); %% 主循环 for i = 1:nIter SampleMask = zeros([1 nDataLen]); while sum( SampleMask ) ~= nSampLen ind = ceil(nDataLen .* rand(1, nSampLen - sum(SampleMask))); %抽样,选取nSampLen个不同的点 SampleMask(ind) = 1; end Sample = find( SampleMask ); %找出非零元素的索引值,即建立模型的点 %% 建立模型,存储建模需要的坐标点,焦点和过椭圆的一个点 %椭圆定义方程:到两定点之间距离和为常数 A(:,1)=Data(:,ind(1)); %焦点 B(:,1)=Data(:,ind(2)); %焦点 P(:,1)=Data(:,ind(3)); %椭圆上一点 DIST=sqrt((P(1,1)-A(1,1)).^2+(P(2,1)-A(2,1)).^2)+sqrt((P(1,1)-B(1,1)).^2+(P(2,1)-B(2,1)).^2); xx=[]; nCurInlyerCount=0; %初始化点数为0个 %% 是否符合模型? for k=1:g_NumOfPoints CurModel=[A(1,1) A(2,1) B(1,1) B(2,1) DIST ]; pdist=sqrt((Data(1,k)-A(1,1)).^2+(Data(2,k)-A(2,1)).^2)+sqrt((Data(1,k)-B(1,1)).^2+(Data(2,k)-B(2,1)).^2); CurMask =(abs(DIST-pdist)< dThreshold); %到直线距离小于阈值的点符合模型,标记为1 nCurInlyerCount =nCurInlyerCount+CurMask; %计算符合椭圆模型的点的个数 if(CurMask==1) xx =[xx,Data(:,k)]; end end %% 选取最佳模型 if nCurInlyerCount > nMaxInlyerCount %符合模型的点数最多的模型即为最佳模型 nMaxInlyerCount = nCurInlyerCount; Ellipse_mask = CurMask; Ellipse_model = CurModel; Ellipse_points = [A B P]; Ellipse_x =xx; end end %% 由符合点拟合椭圆 %椭圆一般方程:Ax2+Bxy+Cy2+Dx+Ey+F=0 F=@(p,x)p(1)*x(:,1).^2+p(2)*x(:,1).*x(:,2)+p(3)*x(:,2).^2+p(4)*x(:,1)+p(5)*x(:,2)+p(6); p0=[1 1 1 1 1 1]; x=Ellipse_x'; pr=nlinfit(x,zeros(size(x,1),1),F,p0); % 拟合系数,最小二乘方法 xmin=min(x(:,1)); xmax=max(x(:,1)); ymin=min(x(:,2)); ymax=max(x(:,2)); %% 画点作图 plot(Ellipse_points(1,:),Ellipse_points(2,:),'r*'); hold on; plot(Ellipse_x(1,:),Ellipse_x(2,:),'yo'); hold on; ezplot(@(x,y)F(pr,[x,y]),[-1+xmin,1+xmax,-1+ymin,1+ymax]); title('RANSAC椭圆拟合'); legend('样本点','抽取点','符合点','拟合曲线') %% 问题分析 % 1.关于如何生成随机点:在标准椭圆基础上,添加高斯白噪声--wgn(); % 2.关于如何建立椭圆模型: % 方案一:椭圆一般方程:Ax2+Bxy+Cy2+Dx+Ey+F=0,认为由5个点确定一个椭圆,则用5个点代入方程式去做椭圆拟合,结果大多数 % 情况下画出双曲线,放弃; % 方案二:利用椭圆定义:到两定点之间距离和为常数2a,选择平面内3个点,两个焦点,一个过椭圆的点,确定椭圆。 % 3.关于如何筛选符合条件的点:此时计点到椭圆距离过于复杂,用定义,到两焦点距离和与2a相差小于一定阈值,则符合。 % 4.关于拟合函数:使用nlinfit,对于输入参数的维数有要求,需要x为N*P维,y为n*1维,注意是列向量。 % 5.关于如何画椭圆:与一般的画图指定X和Y不同,此时要画的是函数图形,在网上查到,先建立函数F,再利用 % ezplot(@(x,y)F(pr,[x,y]))可画出函数图形。 % 6.数据为随机产生,程序每次运行结果会不一样,在B(:,1)=Data(:,ind(2));时有时会数组越界出错,但单步调试时没问题, % 原因还未找到。 %%
6.学习经验
(1)不能太依赖于现有函数,要多自己想算法,即便借用别人的函数,也要弄清楚原理及调用方式;
(2)matlab函数库不熟悉,要多用help;
(3)编写程序时要先总体规划好程序架构,模块化,条理清楚,自己要懂得自己程序的每一步原理。
(4)理论的力量是无穷的,要在理论深入理解的基础上进行代码优化。