线性方程组有很多种解法,可以最简单的直接代入消元计算,但是运算量较大,且过程复杂不直观。
高斯消元法目的是预处理方程组的系数矩阵,将系数矩阵变换为上三角矩阵,这样整个方程就变得清晰直观很多,即使不借助计算机,也是可以很简单的手算出结果。
原方程:
高斯消元后的方程,这样最下行的方程只是一个简单的一元一次方程,倒数第二行是二元一次,依次倒着求解,整个过程变得清晰直观。(全部元素带撇“ ' ”, 是因为消元涉及大量的对换两行元素的运算,所以方程的书写顺序是在不断被改变的,只是为了保持美观和一致,仍采用下标1234n的写法)
而列主元高斯消元法,是为了克服高斯消元法的”除法bug“的改进版本, 因为消元过程中用到了除法,对于计算机来说,如果一个很小的值作为分母,则其在迭代中产生的误差,在做除法后会被放大很多倍。如0.0001与0.0002的误差小,但是1/0.0001与1/0.0002的误差巨大。列主元思想,就顺应而生,在消元前,把列中最大的元素所在行放到矩阵的最上方,那么就可以让较大值做分母,从而避免了误差被除法放大的问题。
def get_max_row_in_column(matrix_a, j):
""" 获取第j列中最大元素的所在行数
此方法将被反复调用,所以每次运算时,不是从整个系数矩阵a中找最大行数,
而是从可能已经做过几次消元的系数矩阵a的(j, j)子矩阵(尚未进行消元操作的部分)中寻找最大行数 """
max_item = abs(matrix_a[j][j])
max_row = j
for i in list(range(j, matrix_a.shape[0])):
if abs(matrix_a[i][j]) > abs(max_item):
max_item = matrix_a[i][j]
max_row = i
return max_row
def swap_row_in_matrix_a(matrix_a, max_row, i):
""" 在系数矩阵a中交换某两行的元素 """
for j in (list(range(i, matrix_a.shape[1]))):
temp = matrix_a[i][j]
matrix_a[i][j] = matrix_a[max_row][j]
matrix_a[max_row][j] = temp
def swap_row_in_matrix_b(matrix_b, max_row, i):
""" 在值矩阵b中交换某两行的元素 """
temp = matrix_b[i][0]
matrix_b[i][0] = matrix_b[max_row][0]
matrix_b[max_row][0] = temp
def method_elimination_gauss(matrix_a, matrix_b):
""" 高斯消元法主循环 """
for i in list(range(0, matrix_a.shape[0])): # 逐行处理矩阵数据
max_row = get_max_row_in_column(matrix_a, i) # 在当前系数矩阵的(i, i)子矩阵中获取第一列中最大元素所在行数,准备进行交换
swap_row_in_matrix_a(matrix_a, max_row, i) # 将最大元素所在行数交换至(i, i)子矩阵的第一行
swap_row_in_matrix_b(matrix_b, max_row, i) # 同时交换值矩阵b的元素,使方程的系数与值保持对应关系
for k in list(range(i + 1, matrix_a.shape[0])):
if matrix_a[i][i] != 0: # 此时从系数矩阵的(i, i)子矩阵中获取的[i][i]元素已经是该列中绝对值最大的数,若为0,则奇异
scale_factor = (-matrix_a[k][i]/matrix_a[i][i]) # 计算接下来消元需要用到的比例因子
else:
print('该矩阵奇异,无法求解方程组')
sys.exit(0)
for j in list(range(i, matrix_a.shape[1])):
matrix_a[k][j] = scale_factor * matrix_a[i][j] + matrix_a[k][j] # 消元,高斯消元法的核心之处
matrix_b[k][0] = scale_factor * matrix_b[i] + matrix_b[k][0] # 对b进行同样的”消元“
def solve_equation(matrix_a, matrix_b):
""" 求解消元后的上三角方程 """
x = np.zeros((matrix_a.shape[0], 1))
if matrix_a[-1][-1] != 0:
x[-1] = matrix_b[-1] / matrix_a[-1][-1]
else: # 若此上三角方程的系数矩阵的最后一行最后一列元素为0,说明矩阵奇异,无数解
print('该矩阵奇异,无法求解方程组')
sys.exit(0) # 强制退出
for i in list(range(matrix_a.shape[0] - 2, -1, -1)): # 从上三角方程最后一行开始解方程,倒着计算
sum_a = 0
for j in list(range(i + 1, matrix_a.shape[0])):
sum_a += matrix_a[i][j] * x[j]
x[i] = (matrix_b[i] - sum_a) / matrix_a[i][i]
return x
import numpy as np
import function as fun
# 为保证程序的连续性,一下两个矩阵均采用numpy库的矩阵形式输入,而不以数组形式输入
# 方程的系数矩阵a
matrix_a = np.array([[0.4096, 0.1234, 0.3678, 0.2943],
[0.2246, 0.3872, 0.4015, 0.1129],
[0.3645, 0.1920, 0.3781, 0.0643],
[0.1784, 0.4002, 0.2786, 0.3927]])
# 方程的值矩阵b
matrix_b = np.array([[1.1951],
[1.1262],
[0.9989],
[1.2499]])
# 输出结果
print("原系数矩阵a:")
print(matrix_a, "\n")
print("原值矩阵b:")
print(matrix_b, "\n")
fun.method_elimination_gauss(matrix_a, matrix_b)
print("消元后的系数矩阵a")
print(matrix_a, "\n")
print("消元后的值矩阵b")
print(matrix_b, "\n")
print("最终求解结果:")
print(fun.solve_equation(matrix_a, matrix_b))
测试结果:
function文件完整代码
import sys
import numpy as np
def get_max_row_in_column(matrix_a, j):
""" 获取第j列中最大元素的所在行数
此方法将被反复调用,所以每次运算时,不是从整个系数矩阵a中找最大行数,
而是从可能已经做过几次消元的系数矩阵a的(j, j)子矩阵(尚未进行消元操作的部分)中寻找最大行数 """
max_item = abs(matrix_a[j][j])
max_row = j
for i in list(range(j, matrix_a.shape[0])):
if abs(matrix_a[i][j]) > abs(max_item):
max_item = matrix_a[i][j]
max_row = i
return max_row
def swap_row_in_matrix_a(matrix_a, max_row, i):
""" 在系数矩阵a中交换某两行的元素 """
for j in (list(range(i, matrix_a.shape[1]))):
temp = matrix_a[i][j]
matrix_a[i][j] = matrix_a[max_row][j]
matrix_a[max_row][j] = temp
def swap_row_in_matrix_b(matrix_b, max_row, i):
""" 在值矩阵b中交换某两行的元素 """
temp = matrix_b[i][0]
matrix_b[i][0] = matrix_b[max_row][0]
matrix_b[max_row][0] = temp
def method_elimination_gauss(matrix_a, matrix_b):
""" 高斯消元法主循环 """
for i in list(range(0, matrix_a.shape[0])): # 逐行处理矩阵数据
max_row = get_max_row_in_column(matrix_a, i) # 在当前系数矩阵的(i, i)子矩阵中获取第一列中最大元素所在行数,准备进行交换
swap_row_in_matrix_a(matrix_a, max_row, i) # 将最大元素所在行数交换至(i, i)子矩阵的第一行
swap_row_in_matrix_b(matrix_b, max_row, i) # 同时交换值矩阵b的元素,使方程的系数与值保持对应关系
for k in list(range(i + 1, matrix_a.shape[0])):
if matrix_a[i][i] != 0: # 此时从系数矩阵的(i, i)子矩阵中获取的[i][i]元素已经是该列中绝对值最大的数,若为0,则奇异
scale_factor = (-matrix_a[k][i]/matrix_a[i][i]) # 计算接下来消元需要用到的比例因子
else:
print('该矩阵奇异,无法求解方程组')
sys.exit(0)
for j in list(range(i, matrix_a.shape[1])):
matrix_a[k][j] = scale_factor * matrix_a[i][j] + matrix_a[k][j] # 消元,高斯消元法的核心之处
matrix_b[k][0] = scale_factor * matrix_b[i] + matrix_b[k][0] # 对b进行同样的”消元“
def solve_equation(matrix_a, matrix_b):
""" 求解消元后的上三角方程 """
x = np.zeros((matrix_a.shape[0], 1))
if matrix_a[-1][-1] != 0:
x[-1] = matrix_b[-1] / matrix_a[-1][-1]
else: # 若此上三角方程的系数矩阵的最后一行最后一列元素为0,说明矩阵奇异,无数解
print('该矩阵奇异,无法求解方程组')
sys.exit(0) # 强制退出
for i in list(range(matrix_a.shape[0] - 2, -1, -1)): # 从上三角方程最后一行开始解方程,倒着计算
sum_a = 0
for j in list(range(i + 1, matrix_a.shape[0])):
sum_a += matrix_a[i][j] * x[j]
x[i] = (matrix_b[i] - sum_a) / matrix_a[i][i]
return x
demo源码链接如下
github地址:https://github.com/method_elimination_gauss
gitee地址:https://gitee.com/darlingxyz/method_elimination_gauss