曲线拟合器Curve Fitting Toolbox

matlab数据分析之曲线拟合器Curve Fitting Toolbox


文章目录

  • matlab数据分析之曲线拟合器Curve Fitting Toolbox
  • 参数拟合
  • 一、Select Model Type
  • 二、Center and Scale Data
  • 三、Specify Fit Options and Optimized Starting Points
    • 拟合方法与算法
    • 有限差分参数
    • 拟合收敛准则
    • 系数参数
  • Optimized Starting Points and Default Constraints


参数拟合

参数拟合涉及查找适合数据的一个或多个模型的系数(参数)。假设数据本质上是统计数据,可以分为两个部分:

data = deterministic component + random component//确定性成分+随机成分 

确定性成分由参数模型给出,随机成分通常被描述为与数据相关的误差,即:

data = parametric model + error

该模型是自变量(预测变量)和一个或多个系数的函数。误差表示数据中遵循特定概率分布(通常为高斯分布)的随机变化。变化可能来自许多不同的来源,但当您处理测量数据时,它们总是以某种程度存在。系统变异也可能存在,但它们可能导致拟合模型不能很好地代表数据。模型系数通常具有物理意义。
Curve Fitting Toolbox™ 参数化库模型在以下部分中进行了描述

一、Select Model Type

曲线拟合器Curve Fitting Toolbox_第1张图片

二、Center and Scale Data

Curve Fitter 应用程序中的大多数拟合在“拟合选项”窗格中提供“居中”和“缩放”选项。当您选择此选项时,应用程序会重新拟合模型,使数据居中并按比例缩放。在命令行中,使用 fitoptions 函数并将 Normalize 选项设置为“on”。要缓解不同尺度变量的数值问题,请规范化输入数据(也称为预测数据)。

例如,假设您的表面拟合输入是范围为 500-4500 r/min 的发动机转速和范围为 0-1 的发动机负载百分比。然后,center 和 scale 通常会提高拟合度,因为两个输入之间的尺度差异很大。但是,如果您的输入采用相同的单位或相似的比例(例如,地理数据的东距和北距),则中心和比例的用处不大。当您使用此选项对输入进行归一化时,与原始数据相比,拟合系数的值会发生变化。如果您正在拟合曲线或曲面来估计系数,或者系数具有物理意义,请清除中心和比例复选框。 Curve Fitter 应用程序中的绘图始终使用原始比例,无论中心和比例状态如何。在命令行中,要在拟合之前居中和缩放数据,请使用 fitoptions 函数和 options.Normal 指定为“on”来创建选项结构。然后,使用具有指定选项的拟合函数。

三、Specify Fit Options and Optimized Starting Points

可以在拟合选项窗格中以交互方式指定拟合选项。除插值(Interpolant )和平滑样条线(Smoothing Spline)外,所有拟合都具有可配置的拟合选项。可用选项取决于所选的拟合(即线性、非线性或非参数拟合)。

  • 此处描述的选项可用于非线性模型。
  • 下系数约束和上限系数约束是多项式(Polynomial)拟合的拟合选项窗格中唯一可用的拟合选项。
  • 非参数拟合(即插值(Interpolant)、平滑样条曲线(Smoothing Spline)和局部加权(Lowess)拟合)没有“高级选项”。

此处显示了单项指数拟合的拟合选项窗格。系数约束值适用于人口普查数据。
曲线拟合器Curve Fitting Toolbox_第2张图片

拟合方法与算法

  • 方法 Method
    • 应用会根据您使用的拟合度自动选择“方法”值。对于线性拟合和非线性拟合,方法值分别为线性最小二乘法和非线性最小二乘法。
  • 鲁棒Robust 使用鲁棒最小二乘拟合方法的选项
    • Off — 不使用鲁棒拟合(默认)。
    • On — 拟合默认稳健方法(双平方权重)。
    • LAR — 通过最小化最小绝对残差 (LAR) 进行拟合。
    • 双平方(Bisquare ) —通过最小化残差的平方和进行拟合,并使用双平方权重减少异常值的权重。在大多数情况下,此选项是坚固安装的最佳选择。
  • 算法
    • Trust-Region 此选项是默认算法,如果指定系数下限或上限约束,则必须使用此选项。
    • Levenberg-Marquardt 如果信任区域算法不能产生合理的拟合,并且您没有系数约束,请尝试 Levenberg-Marquardt 算法。

有限差分参数

DiffMinChange — 有限差分雅可比系数的最小变化。默认值为 10-8。
DiffMaxChange — 有限差分雅可比系数的最大变化。默认值为 0.1。

请注意,DiffMinChange 和 DiffMaxChange 适用于:

  • 任何非线性自定义方程,即您编写的非线性方程
  • 曲线拟合工具箱 DiffMinChange 和 DiffMaxChange提供的某些非线性方程

不适用于任何线性方程。

拟合收敛准则

MaxFunEvals — 允许的最大函数(模型)计算数。默认值为 600。
MaxIter — 允许的最大拟合迭代次数。默认值为 400。
TolFun — 用于涉及函数(模型)值的停止条件的终止容差。默认值为 10-6。
TolX — 用于涉及系数的停止条件的端接容差。默认值为 10-6。

系数参数

Coefficients — 要拟合的未知系数的符号
StartPoint — 系数起始值。默认值取决于拟合。对于 Rational、Weibull 和自定义拟合,默认值是在 [0 1] 范围内随机选择的。对于“拟合类型”库中的所有其他非线性模型,起始值取决于数据集并通过启发式计算。
Lower - 拟合系数的下限。 App 仅将这些边界与置信域拟合算法结合使用。 “拟合选项”窗格中大多数拟合的默认下限是 -Inf,这表示系数不受约束。但是,一些模型具有有限的默认下限。例如,对于高斯拟合,App 会限制宽度参数,使其不能小于 0。
Upper — 拟合系数的上限。 App 仅将这些边界与置信域拟合算法结合使用。 “拟合选项”窗格中所有拟合的默认上限为 Inf,这表明系数不受约束。

Optimized Starting Points and Default Constraints

下表显示了拟合类型窗格中拟合的默认系数起点和约束。如果对起点进行了优化,则会根据当前数据集启发式计算它们。随机起点在区间 [0 1] 上定义,线性模型不需要起点。如果模型没有约束,则系数既没有下限也没有上限。您可以通过在“适合选项”窗格中提供自己的值来覆盖默认起点和约束。
曲线拟合器Curve Fitting Toolbox_第3张图片

你可能感兴趣的:(matlab,算法,人工智能,matlab,数据分析,线性回归)