选主元的高斯消元法
朴素的高斯消元法是将矩阵A和单位矩阵放在一起,通过行操作(或者列操作)将A变为单位矩阵,这个时候单位矩阵就是矩阵A的逆矩阵。从上到下将A变为上三角矩阵的复杂度为O( n 3 n^3 n3),再从下往上将上三角矩阵变化为单位矩阵复杂度为O( n 3 n^3 n3),因此总共的复杂度为O( n 3 n^3 n3) 。
还有一种做法是按照高斯消元接线性方程组的方式求解n次线性方程组,这样复杂度为O( n 4 n^4 n4),因此我们采用上面的方法。
上面的方法虽然可以有效的解决问题,但是在计算机中计算除法的时候如果除数太小将会产生较大的误差,因此我们就需要主动采取措施。一个简单的方法就是选择主元,即找一个最大的每次将要去消除其他行的行首元素。根据查找范围的不同又分为全选主元和列选主元两种。全选主元顾名思义就是在当前行下方所有元素中寻找最大的元素,然后将其行和列置换到合适的位置。这个操作是O( n 2 n^2 n2)的,但是可以有效避免除数过小的问题。这里简单起见采用的是列选主元:在当前列中选择一个最大的元素将其置换到当前行。
实现代码:
#include
#include
#include
using namespace std;
typedef vector<vector<double> > Matrix;
typedef vector<double> Line;
void Multi(Matrix &A,Matrix &B)
{
int n=A.size();
for(int i=0;i<n;++i)
{
for(int j=0;j<n;++j)
{
double tmp=0;
for(int k=0;k<n;++k)
{
tmp+=A[i][k]*B[k][j];
}
printf("%6.3f ",tmp);
}
printf("\n");
}
}
void Show(Matrix &A)
{
int n=A.size();
for(int i=0;i<n;++i)
{
for(int j=0;j<n;++j)
{
printf("%6.3f ",A[i][j]);
}
printf("\n");
}
}
void Gaussian(Matrix A,Matrix& B)
{
int n=A.size();
Line x(n,0); x[0]=1; B.push_back(x);
for(int i=1;i<n;++i)
{//将B初始化为单位矩阵
x[i-1]=0; x[i]=1;
B.push_back(x);
}
for(int i=0;i<n-1;++i)
{//从上往下将矩阵转化为上三角矩阵
int mark=i;
for(int j=i+1;j<n;++j)
{//查找当前列中最大的元素
if(abs(A[mark][i]) < abs(A[j][i]))
{
mark=j;
}
}
if(mark != i)
{//如果最大元素不是当前元素
for(int j=i;j<n;++j)
{//对两行元素进行交换
swap(A[i][j],A[mark][j]);
}
for(int j=0;j<n;++j)
{//对B矩阵进行同样的操作
swap(B[i][j],B[mark][j]);
}
}
for(int j=i+1;j<n;++j)
{//将后面行的第i列元素全部消去
double tmp=A[j][i]/A[i][i]; //避免重复计算除数
for(int k=i;k<n;++k)
{//A矩阵第i列前面都是0,不需要操作
A[j][k]-=A[i][k]*tmp;
}
for(int k=0;k<n;++k)
{//B矩阵进行一模一样的操作
B[j][k]-=B[i][k]*tmp;
}
}
}
for(int i=n-1;i>0;--i)
{//从后往前将上三角矩阵转换为单位矩阵
for(int j=i-1;j>=0;--j)
{//将前面行的第i列元素全部消去
double tmp=A[j][i]/A[i][i];
A[j][i]=0;//其他列的元素不变
for(int k=n-1;k>=0;--k)
{
B[j][k]-=B[i][k]*tmp;
}
}
for(int k=0;k<n;++k)
{//将A对角线元素变为1,对B进行同样的操作
B[i][k]/=A[i][i];
}
}
for(int k=0;k<n;++k)
{//对B的第一行进行操作
B[0][k]/=A[0][0];
}
}
int main()
{
Matrix A,B;
int n; double tmp;
//读入矩阵
printf("请输入矩阵的大小:");
scanf("%d",&n);
printf("请输入%d*%d的矩阵:\n",n,n);
for(int i=0;i<n;++i)
{
Line x;
A.push_back(x);
for(int j=0;j<n;++j)
{
scanf("%lf",&tmp);
A[i].push_back(tmp);
}
}
Gaussian(A,B);
printf("Inverse Matrix:\n");
Show(B);
printf("A X B:\n");
Multi(A,B);
return 0;
}
运行结果:
LU分解法
LU分解可以看做是高斯消元的一个变化的应用,不同的地方在于它将每次高斯消元的步骤都保存了下来。可以这样做的原因是我们对矩阵的行操作都可以看做我们给矩阵左乘了一个矩阵。例如,我们在高斯消元的过程中有如下操作: R i − R j ∗ C ( i > j ) Ri-Rj*C (i>j) Ri−Rj∗C(i>j),相当于左乘初等矩阵 P [ i , j ] = − c P[i,j]=-c P[i,j]=−c,我们将这些信息保存下来就能得到 P n − 1 ∗ P n − 2 ∗ . . . ∗ P 1 ∗ U = A P_{n-1}*P_{n-2}*...*P_1*U=A Pn−1∗Pn−2∗...∗P1∗U=A,其中U是上三角矩阵,也就是我们高斯消元以后得到的矩阵。根据矩阵运算的结合律我们将初等矩阵合并为矩阵 L L L,得到 L ∗ U = A L*U=A L∗U=A,这里面的 L , U L,U L,U均为三角矩阵,然后利用三角矩阵解方程组将会非常容易。例如我们需要求解 A X = B AX=B AX=B,即就是求解 L U X = B LUX=B LUX=B,我们令 Y = U X Y=UX Y=UX,则解两个含有三角阵的方程就可以解决问题。
观察 L , U L,U L,U矩阵,我们发现可以将他们合并,而且可以在原矩阵中原地操作,因此空间复杂度为 O ( 1 ) O(1) O(1)。而且对矩阵的LU分解可以重复多次运算,我们可以借此将对矩阵求逆的过程转换为 A A − 1 = E AA^{-1}=E AA−1=E,求解A的n个n元方程组。复杂度为LU分解 O ( n 3 ) O(n^3) O(n3)加上n次求解方程组 n ∗ O ( n 2 ) n*O(n^2) n∗O(n2),因此总共的复杂度为 O ( n 3 ) O(n^3) O(n3)。
实现代码:
#include
#include
#include
using namespace std;
typedef vector<vector<double> > Matrix;
typedef vector<double> Line;
void Multi(Matrix &A,Matrix &B)
{
int n=A.size();
for(int i=0;i<n;++i)
{
for(int j=0;j<n;++j)
{
double tmp=0;
for(int k=0;k<n;++k)
{
tmp+=A[i][k]*B[k][j];
}
printf("%6.3f ",tmp);
}
printf("\n");
}
}
void Show(Matrix &A)
{
int n=A.size();
for(int i=0;i<n;++i)
{
for(int j=0;j<n;++j)
{
printf("%6.3f ",A[i][j]);
}
printf("\n");
}
}
Line LUWork(Matrix& A,Line& Z)
{
int n=A.size();
//解LY=Z
Line Y(n);
for(int i=0;i<n;++i)
{
double sum=0;
for(int j=0;j<i;++j)
{
sum+=A[i][j]*Y[j];
}
Y[i]=Z[i]-sum;
}
//解UX=Y
Line X(n);
for(int i=n-1;i>=0;--i)
{
double sum=0;
for(int j=n-1;j>i;--j)
{
sum+=A[i][j]*X[j];
}
X[i]=(Y[i]-sum)/A[i][i];
}
return X;
}
void LU(Matrix A,Matrix &B)
{
int n=A.size();
for(int i=0;i<n-1;++i)
{//对A矩阵进行LU分解
for(int j=i+1;j<n;++j)
{//Gaussian消元
A[j][i]/=A[i][i]; //将初等矩阵的值直接存放在当前行首(因为会变成0,没有什么作用)
for(int k=i+1;k<n;++k)
{
A[j][k]-=A[i][k]*A[j][i];
}
}
}
//解n次n元方程组
Line Z(n,0); Z[0]=1; B.push_back(LUWork(A,Z));
for(int i=1;i<n;++i)
{
Z[i-1]=0; Z[i]=1;
B.push_back(LUWork(A,Z));
}
//将B进行转置,因为我们求的是B的每一列的值,我们却是以行的方式加入数组的
for(int i=0;i<n;++i)
{
for(int j=0;j<i;++j)
{
swap(B[i][j],B[j][i]);
}
}
}
int main()
{
Matrix A,B;
int n; double tmp;
//读入矩阵
printf("请输入矩阵的大小:");
scanf("%d",&n);
printf("请输入%d*%d的矩阵:\n",n,n);
for(int i=0;i<n;++i)
{
Line x;
A.push_back(x);
for(int j=0;j<n;++j)
{
scanf("%lf",&tmp);
A[i].push_back(tmp);
}
}
LU(A,B);
printf("Inverse Matrix:\n");
Show(B);
printf("A X B:\n");
Multi(A,B);
return 0;
}
运行结果
我们还可以通过 A − 1 = A ∗ ∣ A ∣ A^{-1}=\frac{A^*}{|A|} A−1=∣A∣A∗来求矩阵的逆,但是通过下面的讨论我们发现求|A|的复杂度至少也是 O ( n 3 ) O(n^3) O(n3)的,还需要求解 A ∗ A^* A∗。因此这种方式不实用。
采用高斯消元,将其转换为上三角后利用行列式的性质:上三角行列式的值等于对角线元素的乘积求出行列式的值。
实现代码
#include
#include
#include
using namespace std;
typedef vector<vector<double> > Matrix;
typedef vector<double> Line;
double Gaussian(Matrix A)
{
int n=A.size();
for(int i=0;i<n-1;++i)
{//从上往下将矩阵转化为上三角矩阵
int mark=i;
for(int j=i+1;j<n;++j)
{//查找当前列中最大的元素
if(abs(A[mark][i]) < abs(A[j][i]))
{
mark=j;
}
}
if(mark != i)
{//如果最大元素不是当前元素
for(int j=i;j<n;++j) {//对两行元素进行交换
swap(A[i][j], A[mark][j]);
}
}
for(int j=i+1;j<n;++j)
{//将后面行的第i列元素全部消去
double tmp=A[j][i]/A[i][i]; //避免重复计算除数
for(int k=i;k<n;++k)
{//A矩阵第i列前面都是0,不需要操作
A[j][k]-=A[i][k]*tmp;
}
}
}
double ret=1.0;
for(int i=0;i<n;++i)
{
ret*=A[i][i];
}
return ret;
}
int main()
{
Matrix A,B;
int n; double tmp;
//读入行列式
printf("请输入行列式的大小:");
scanf("%d",&n);
printf("请输入%d*%d的行列式:\n",n,n);
for(int i=0;i<n;++i)
{
Line x;
A.push_back(x);
for(int j=0;j<n;++j)
{
scanf("%lf",&tmp);
A[i].push_back(tmp);
}
}
printf("行列式的值为:%.f\n",Gaussian(A));
return 0;
}
运行结果:
我们还可以利用行列式的性质:行列式等于任意行(列)各个元素与其代数余子式的乘积的和。这样进行递归求解,得到递归式 T ( n ) = n T ( n − 1 ) + n T(n)=nT(n-1)+n T(n)=nT(n−1)+n,复杂度为 O ( n ! ) O(n!) O(n!)
单纯LU分解的时间复杂度其实就是高斯消元的时间复杂度。 T ( n ) = 2 [ ( n − 1 ) n + ( n − 2 ) ∗ ( n − 1 ) + . . . . ] = 2 [ ∑ i = 1 n i ( i − 1 ) = ∑ i = 1 n i 2 − ∑ i = 1 n i ] T(n)=2[(n-1)n+(n-2)*(n-1)+....]=2[\sum_{i=1}^n i(i-1)=\sum_{i=1}^n i^2 - \sum_{i=1}^n i] T(n)=2[(n−1)n+(n−2)∗(n−1)+....]=2[∑i=1ni(i−1)=∑i=1ni2−∑i=1ni]根据求和公式 T ( n ) = 2 [ n ( n + 1 ) ( 2 n + 1 ) 6 − n ( n + 1 ) 2 ] = 2 n 3 3 − 2 n 3 = O ( 2 n 3 3 ) T(n)=2[\frac{n(n+1)(2n+1)}{6}-\frac{n(n+1)}{2}]=\frac{2n^3}{3}-\frac{2n}{3}=O(\frac{2n^3}{3}) T(n)=2[6n(n+1)(2n+1)−2n(n+1)]=32n3−32n=O(32n3)。
如果使用LU分解解多个系数相同的n元方程组的时候可以将复杂度均摊。