最小二乘法计算系数

需求:计算一个城市的行车平均时速和低速时长占比的关系(y:低速时长占比,x:平均时速)
公式 y=k*x^b(k乘x的b次方,markdown好难用啊,怎么写公式)
当时想到的一个方法是用scipy的leastsq方法来拟合出k与b
scipy.optimize.leastsq(func, x0, args=()),这里只介绍leastsq的三个参数,详细各参数的使用方法请参考scipy官网
func:一个函数,用来计算误差的
x0:ndarray。从哪里开始计算最小化
args:tuple, optional。这个参数很好用,把func里需要用到的其他参数都放在这里就可以
主体代码如下,如果涉及到多个城市,可能要分城市获取不同的系数,方法下面也会说到

#!/bin/python
#载入模块
import numpy as np
import string
from scipy.optimize import leastsq
#命名一个函数,计算y
def func(p,x):
  k,b = p 
  return k*np.power(x,b)
def error():
  print(s)  #只是用来看循环了几次,如果只要运算结果的话,并无实际作用
  return func(p,x)-y
def jisuanAB(file_x,file_y):
  #获取城市编码,我把城市编码写在文件名上,用“_”连接,获取城市编码时需要再分开
  city = file_x.split('_')[0]  
  output= open('xishu.txt',+a)  #写到这个文件里
  x = []
  fx = open(file_x,'r')  #读第一个参数中的文档
    for line in fx:
      line = line.strip()
      lines = line.atof(line)
      x.append(lines)  #以上代码是为了将文件中的内容转化为list,进而转化为array
  fx.close  #对于初学者来说,关闭文件很重要,不然一直会占着内存,最终会报错
  y =[]
fy = open(file_y,'r')
  for line in fy:
    line = line.strip()
    lines = line.atof()
    y.append(lines)
fy,close
#讲x,y转化为ndarry,之后的leastsq主函数中会用到
Xi = np.array((x))
Yi = np.array((y))
P0 = [100,2] #从哪里开始计算最小误差
Para=leastsq(error,p0,args=(Xi,Yi,s))  #使用leastsq计算系数
k,b=Para[0]  #Para的输出结果,第0 个索引位就是the solution,详见官网
output.write(city+'\t'+str(k) +'\t' +str(b)+'\n')
print city,k,b

#代码从这里开始,写一个字典,里边存上x和y
if __name__ == '__main__':
    file_map = {}
    Lista=[1,2,3,4,5,6,7,8,9,10]
    for i in Lista:
        file_x = str(i) +  "_pingjunshisu.txt"
        file_y = str(i) +  "_zhanbi.txt"
        if file_x not in file_map:
            file_map[file_x] = file_y
 
# 运行下面的代码,可生成最后的结果        
for file_x in file_map:
  jisuanAB(file_x, file_map[file_x])
  

你可能感兴趣的:(最小二乘法计算系数)