有一系列的数据点 { x i , y i } \{x_i, y_i\} {xi,yi},我们知道这些数据点近似的落在一个圆上,根据这些数据估计这个圆的参数就是一个很有意义的问题。今天就来讲讲如何来做圆的拟合。圆拟合的方法有很多种,最小二乘法属于比较简单的一种。今天就先将这种。
我们知道圆方程可以写为:
( x − x c ) 2 + ( y − y c ) 2 = R 2 (x - x_c)^2 + (y - y_c)^2 = R^2 (x−xc)2+(y−yc)2=R2
通常的最小二乘拟合要求距离的平方和最小。也就是
f = ∑ ( ( x i − x c ) 2 + ( y i − y c ) 2 − R ) 2 f =\sum \left (\sqrt{(x_i - x_c)^2 + (y_i - y_c)^2} - R\right )^2 f=∑((xi−xc)2+(yi−yc)2−R)2
最小。这个算起来会很麻烦。也得不到解析解。所以我们退而求其次。
f = ∑ ( ( x i − x c ) 2 + ( y i − y c ) 2 − R 2 ) 2 f = \sum \left((x_i - x_c)^2 + (y_i - y_c)^2 - R^2\right )^2 f=∑((xi−xc)2+(yi−yc)2−R2)2
这个式子要简单的多。我们定义一个辅助函数:
g ( x , y ) = ( x − x c ) 2 + ( y − y c ) 2 − R 2 g(x, y) = (x - x_c)^2 + (y - y_c)^2 - R^2 g(x,y)=(x−xc)2+(y−yc)2−R2
那么上面的式子可以表示为:
f = ∑ g ( x i , y i ) 2 f = \sum g(x_i, y_i)^2 f=∑g(xi,yi)2
按照最小二乘法的通常的步骤,可知 f f f 取极值时对应下面的条件。
KaTeX parse error: No such environment: align at position 8: \begin{̲a̲l̲i̲g̲n̲}̲ \frac{\partial…
先来化简 ∂ f ∂ R = 0 \frac{\partial f}{\partial R} = 0 ∂R∂f=0
KaTeX parse error: No such environment: split at position 8: \begin{̲s̲p̲l̲i̲t̲}̲ \frac{\partial…
我们知道半径 R R R 是不能为 0 的。所以必然有:
∑ g ( x i , y i ) = 0 \sum g(x_i, y_i)= 0 ∑g(xi,yi)=0
这是个非常有用的结论。剩下的两个式子:
KaTeX parse error: No such environment: gather at position 8: \begin{̲g̲a̲t̲h̲e̲r̲}̲ \begin{split} …
也就是下面两个等式:
KaTeX parse error: No such environment: gather at position 8: \begin{̲g̲a̲t̲h̲e̲r̲}̲ \sum x_i g(x_i…
这里设:
u i = x i − x ˉ u c = x c − x ˉ v i = y i − y ˉ v c = y c − y ˉ u_i = x_i - \bar x\\ u_c = x_c - \bar x\\ v_i = y_i - \bar y\\ v_c = y_c - \bar y ui=xi−xˉuc=xc−xˉvi=yi−yˉvc=yc−yˉ
其中:
x ˉ = ∑ x i / N y ˉ = ∑ y i / N \bar x = \sum x_i / N\\ \bar y = \sum y_i /N xˉ=∑xi/Nyˉ=∑yi/N
那么简单的推导一下,就会发现:
KaTeX parse error: No such environment: gather at position 8: \begin{̲g̲a̲t̲h̲e̲r̲}̲ \sum u_i g(u_i…
其实都不需要推导,这个变量替换只不过是修改了坐标原点的位置。而我们的等式根本就与坐标原点的具体位置无关。所以必然成立。
这两个式子展开写是这样的:
∑ ( ( u i − u c ) 2 + ( v i − v c ) 2 − R 2 ) u i = 0 ∑ ( ( u i − u c ) 2 + ( v i − v c ) 2 − R 2 ) v i = 0 \sum \left({(u_i - u_c)^2 + (v_i - v_c)^2} - R^2\right) u_i = 0\\ \sum \left({(u_i - u_c)^2 + (v_i - v_c)^2} - R^2\right) v_i = 0 ∑((ui−uc)2+(vi−vc)2−R2)ui=0∑((ui−uc)2+(vi−vc)2−R2)vi=0
进一步展开:
∑ ( u i 3 − 2 u i 2 u c + u i u c 2 + u i v i 2 − 2 u i v i v c + u i v c 2 − u i R 2 ) = 0 ∑ ( u i 2 v i − 2 u i v i u c + v i u c 2 + v i 3 − 2 v i 2 v c + v i v c 2 − v i R 2 ) = 0 \sum \left({u_i ^3 - 2 u_i^2 u_c + u_i u_c ^2 + u_i v_i^2 - 2 u_i v_i v_c + u_i v_c^2} - u_i R^2 \right) = 0\\ \sum \left({u_i ^2 v_i - 2 u_i v_i u_c + v_i u_c ^2 + v_i^3 - 2 v_i^2 v_c + v_i v_c^2} - v_i R^2 \right) = 0 ∑(ui3−2ui2uc+uiuc2+uivi2−2uivivc+uivc2−uiR2)=0∑(ui2vi−2uiviuc+viuc2+vi3−2vi2vc+vivc2−viR2)=0
我们知道 $ \sum u_i = 0$, ∑ v i = 0 \sum v_i = 0 ∑vi=0。所以上面两个式子是可以化简的。
∑ ( u i 3 − 2 u i 2 u c + u i v i 2 − 2 u i v i v c ) = 0 ∑ ( u i 2 v i − 2 u i v i u c + v i 3 − 2 v i 2 v c ) = 0 \sum \left({u_i ^3 - 2 u_i^2 u_c + u_i v_i^2 - 2 u_i v_i v_c} \right) = 0\\ \sum \left({u_i ^2 v_i - 2 u_i v_i u_c + v_i^3 - 2 v_i^2 v_c} \right) = 0 ∑(ui3−2ui2uc+uivi2−2uivivc)=0∑(ui2vi−2uiviuc+vi3−2vi2vc)=0
为了简化式子,我们定义几个参数:
S u u u = ∑ u i 3 S v v v = ∑ v i 3 S u u = ∑ u i 2 S v v = ∑ v i 2 S u v = ∑ u i v i S u u v = ∑ u i 2 v i S u v v = ∑ u i v i 2 S_{uuu} = \sum {u_i ^3} \\ S_{vvv} = \sum {v_i ^3} \\ S_{uu} = \sum {u_i ^2} \\ S_{vv} = \sum {v_i ^2} \\ S_{uv} = \sum {u_i v_i} \\ S_{uuv} = \sum {u_i^2 v_i} \\ S_{uvv} = \sum {u_i v_i ^2} Suuu=∑ui3Svvv=∑vi3Suu=∑ui2Svv=∑vi2Suv=∑uiviSuuv=∑ui2viSuvv=∑uivi2
那么上面的式子可以写为:
S u u u c + S u v v c = S u u u + S u v v 2 S u v u c + S v v v c = S u u v + S v v v 2 S_{uu} u_c + S_{uv}v_c = \frac{S_{uuu} +S_{uvv}}{2} \\ S_{uv} u_c + S_{vv} v_c =\frac{S_{uuv} + S_{vvv}} {2} Suuuc+Suvvc=2Suuu+SuvvSuvuc+Svvvc=2Suuv+Svvv
至此,就可以解出 u c u_c uc 和 v c v_c vc 了。
u c = S u u v S u v − S u u u S v v − S u v v S v v + S u v S v v v 2 ( S u v 2 − S u u S v v ) v c = − S u u S u u v + S u u u S u v + S u v S u v v − S u u S v v v 2 ( S u v 2 − S u u S v v ) u_c = \frac{S_{uuv} S_{uv} - S_{uuu} S_{vv} - S_{uvv} S_{vv} + S_{uv} S_{vvv}}{2 (S_{uv}^2 - S_{uu} S_{vv})} \\ v_c = \frac{-S_{uu} S_{uuv} + S_{uuu} S_{uv} + S_{uv} S_{uvv} - S_{uu} S_{vvv}} {2 (S_{uv}^2 - S_{uu} S_{vv})} uc=2(Suv2−SuuSvv)SuuvSuv−SuuuSvv−SuvvSvv+SuvSvvvvc=2(Suv2−SuuSvv)−SuuSuuv+SuuuSuv+SuvSuvv−SuuSvvv
那么:
x c = u c + x ˉ y c = v c + y ˉ x_c = u_c + \bar x\\ y_c = v_c + \bar y xc=uc+xˉyc=vc+yˉ
还剩下个 R R R 没求出来, 也很简单。
∑ g ( x i , y i ) = 0 ∑ ( ( x i − x c ) 2 + ( y i − y c ) 2 − R 2 ) = 0 \sum g(x_i, y_i) = 0 \\ \sum \left((x_i - x_c)^2 + (y_i - y_c)^2 - R^2\right) = 0 ∑g(xi,yi)=0∑((xi−xc)2+(yi−yc)2−R2)=0
所以:
R 2 = ∑ ( ( x i − x c ) 2 + ( y i − y c ) 2 ) / N R^2 = \sum {\left((x_i - x_c)^2 + (y_i - y_c)^2\right)} / N R2=∑((xi−xc)2+(yi−yc)2)/N
好了。下面给出个代码,这个代码的具体公式和我这里给出的有一点小差异,但是原理是相同的。
/**
* 最小二乘法拟合圆
* 拟合出的圆以圆心坐标和半径的形式表示
* 此代码改编自 newsmth.net 的 jingxing 在 Graphics 版贴出的代码。
* 版权归 jingxing, 我只是搬运工外加一些简单的修改工作。
*/
typedef complex POINT;
bool circleLeastFit(const std::vector &points, double ¢er_x, double ¢er_y, double &radius)
{
center_x = 0.0f;
center_y = 0.0f;
radius = 0.0f;
if (points.size() < 3)
{
return false;
}
double sum_x = 0.0f, sum_y = 0.0f;
double sum_x2 = 0.0f, sum_y2 = 0.0f;
double sum_x3 = 0.0f, sum_y3 = 0.0f;
double sum_xy = 0.0f, sum_x1y2 = 0.0f, sum_x2y1 = 0.0f;
int N = points.size();
for (int i = 0; i < N; i++)
{
double x = points[i].real();
double y = points[i].imag();
double x2 = x * x;
double y2 = y * y;
sum_x += x;
sum_y += y;
sum_x2 += x2;
sum_y2 += y2;
sum_x3 += x2 * x;
sum_y3 += y2 * y;
sum_xy += x * y;
sum_x1y2 += x * y2;
sum_x2y1 += x2 * y;
}
double C, D, E, G, H;
double a, b, c;
C = N * sum_x2 - sum_x * sum_x;
D = N * sum_xy - sum_x * sum_y;
E = N * sum_x3 + N * sum_x1y2 - (sum_x2 + sum_y2) * sum_x;
G = N * sum_y2 - sum_y * sum_y;
H = N * sum_x2y1 + N * sum_y3 - (sum_x2 + sum_y2) * sum_y;
a = (H * D - E * G) / (C * G - D * D);
b = (H * C - E * D) / (D * D - G * C);
c = -(a * sum_x + b * sum_y + sum_x2 + sum_y2) / N;
center_x = a / (-2);
center_y = b / (-2);
radius = sqrt(a * a + b * b - 4 * c) / 2;
return true;
}
下图是个实际测试的结果。对这种均匀分布的噪声数据计算的结果还是很准确的。
但是当数据中有部分偏向某一个方向的干扰数据时。结果就不那么乐观了。下图就很说明问题。
数据点中有 20% 是干扰数据。拟合出的圆就明显被拽偏了。
之所以出现这个问题就是因为最小二乘拟合的平方项对离群点非常敏感。解决这个问题就要用其他的拟合算法,比如用距离之和作为拟合判据。等我有空了再写一篇博客介绍其他几种方法。