有时候对数据的分析处理,需要进行曲线拟合,python提供了丰富的工具,其中scipy中的curve_fit可以用来进行幂数拟合或者指数拟合等各种类型的拟合。
先定义好要拟合的函数形式target_func,然后调用函数popt, pcov = curve_fit(target_func, xdata, ydata)可以返回target_func中的参数,参数存储在popt数组中。
拟合度R²衡量的是拟合函数整体的拟合度,R²最大值为1,越接近于1,说明函数的拟合度越好,公式表达为R²=1-SSres/SStot。SSres为残差平方和,SStot为去掉均值后的平方和。
计算过程如下:
如下代码给定了一组x,y数据,使用函数 y = a * x^b 来拟合这组数据,并计算拟合度R²。最后打印出了拟合函数的参数a、b,及拟合度R²
from scipy.optimize import curve_fit
import numpy as np
xdata = [0.1738, 0.0325, 0.0135, 0.0058, 0.0028]
ydata = [11.313, 15.953, 21.599, 33.212, 54.098]
### define the fit functions, y = a * x^b ###
def target_func(x, a, b):
return a*(x**b)
### curve fit ###
popt, pcov = curve_fit(target_func, xdata, ydata)
### Calculate R Square ###
calc_ydata = [target_func(i, popt[0], popt[1]) for i in xdata]
res_ydata = np.array(ydata) - np.array(calc_ydata)
ss_res = np.sum(res_ydata**2)
ss_tot = np.sum((ydata - np.mean(ydata))**2)
r_squared = 1 - (ss_res / ss_tot)
### Output results ###
print "a = %f b = %f R2 = %f"%(popt[0], popt[1], r_squared)
print ydata, calc_ydata
输出结果为:a = 2.761469 b = -0.499174 R2 = 0.965864, 即 y = 2.76 * x^(-0.499),拟合度高达96.6%。