墨@#≯

关于最小二乘拟合与正则化的探讨

说明

最小二乘法是一个应用领域很广，且很常用的数学工具，所以网上关于最小二乘法的文章资料有很多(在参考资料中附上了几篇读者可以进一步参考)。本博文想要探讨该话题的出发点源于上一篇博文：车载毫米波雷达的上车安装与标定问题_墨@#≯的博客-CSDN博客，文中有提到使用最小二乘法来拟合道路边沿，进而确定雷达安装的角度误差并完成雷达水平角的标定，于是想要对最小二乘法做一些有益的学习和解释。

最小二乘法背后的拟合思想(欠拟合、过拟合现象及其解决)可以一直延伸到机器学习领域(最小二乘拟合是机器学习最基础的内容之一)，囿于本人现阶段的学识水平，本博文目前只对最小二乘法做初步的探讨。

Blog

20230917 博文第一次撰写

一、最小二乘法的基本概念

最小二乘法是一个数学工具。是指：一种在现有(观测)数据的基础上基于 最小化误差的平方和 的原则进行函数拟合的方法。这句话用数学语言来描述就是：

假设有n组观测数据：（xi, yi），(i = 1,2,3,4…n)，我们现在要求得一个函数：

(1.1)

式中，是事先选定的一组线性无关的函数，是待定系数(k = 0，1,2,3… m)。使得：

(1.2)

L的值最小。这便是最小二乘法以及它要解决的问题。

在得到该拟合后的函数后，我们也就得到了一条曲线，这条曲线可以被用来做很多事情：比如做误差估计、做预测、求路沿斜率以做标定用(上一篇雷达安装与标定博文中的内容)、求目标运动轨迹的曲率(毫米波雷达SOR中一般也要求雷达可以输出目标运动轨迹的曲率)、以及基于车载传感器做自由空间映射(Freespace)时，如果有路沿我们可以用以拟合路沿(当然，这和前面求路沿的斜率其实是一件事… 我这里只是想强行引出Freespace这个词：基于车载环境感知传感器的Freespace算是一个比较新的概念？我后续会出一期调研的博文聊聊这个话题)，等等。

*需要注意的是*

1、事实上，基于离散的点做曲线拟合方法(基准)可以有很多，比如你可以使得拟合得到的曲线到各观测点(待拟合点)的距离之和最小，或者使各观测点到拟合曲线的最大距离取最小值等等，甚至你自己可以提出一些拟合的基准。但是，最小二乘法(使得各观测点到拟合曲线的偏差的平方和最小)这个基准被证明是误差符合高斯分布时的最佳线性无偏估计,该方法下得到的估测误差也是呈正态分布的(高斯最早证明了，关于最小二乘拟合这个方法的发明，高斯和勒让德之间有一段蛮有意思的历史故事，感兴趣的可以去搜索了解。)

2、做拟合时，我们一般是用多项式进行拟合，所以f(x)实际上应该是：

(1.3)

（多项式是曲线的“最小单元”？有点类似三角函数sin（x）是各种波形的“最小单元”）

3、最小二乘法拟合得到的函数(以及曲线)其实只对用来拟合的观测点以及观测点对应的观测区间负责，如果想要用以预测观测区间之外的点，那么有两个很重要的条件：a.观测区间外的点和观测点之间是要有连续性关系的；b.所拟合的多项式阶数一定要选正确(避免出现欠拟合或者过拟合的情况)。

4、曲线拟合最关键的在于拟合曲线的多项式阶数的选取。

5、关于第3、4点，我会在后文用仿真结果来作出解释。

二、拟合函数求解方法

2.1 代数求解方法

由前述式(1.2)，我们可以得到：

式中，Y为n*1大小列向量，对应观测点的y值，X为n*m大小的矩阵，W为代求系数向量，大小为m*1，m的大小对应所选阶数的值。该式对W求偏导并使其为0(极值点)，便可得到W的解析解。

(2.2)

于是：

(2.3)

由该式得到的系数构造对应的多项式函数，进而可得到拟合的曲线。（不过需要说明的是，从公式可以看到，该W值可以被求解的充分条件是是可逆的，也即X的列向量之间应该是线性无关的）。

2.2 使用Matlab自带的函数

如此通用且具备确定计算公式和解的方法自然很容易写成函数，使用时直接调用即可。Matlab自带的做最小二乘拟合的函数为：polyfit与polyval。这两函数更多的使用细节读者可以去Matlab的帮助文档里阅读，这里给出这两函数实现拟合最基本的输入输出以及使用方法(凑字数..)。

[P，S，mu] = polyfit(x,y,n)；用以输入观测值和想要拟合的阶数，该函数可以输出拟合得到的系数值。

输入：x和y为观测点对应的坐标值，n表示设定的拟合函数最高的阶数值。

输出：P为拟合后多项式的系数(按降幂排序，从x^n的系数到x^0的系数，所以该数组一共会有n+1个值)。mu为可选输出项，其值为一个含两个元素的向量，mu(1)为输入x的均值，mu(2)为x的标准差。S为可选输出项，是一个结构体，细节读者可以看帮助文档。一般使用时输出P即可。

[y,delta] = polyval(P，x，S，mu)；用以输入系数和想要查看的坐标值x，得到该套多项式系数下在这些坐标值x下的y值。

输入：P为ployfit得到的多项式系数，x为在该系数下想要计算的点的横坐标值(这个值可以是观测区间乃至观测区间以外的所有值)，S和mu为可选输入项，对应前述polyfit的可选输出项。

输出：y为在系数P和x值下该拟合得到的函数纵坐标值，delta为可选输出项，其值为每个x值输出y值的标准误差，大小等于x，一般地，y±delta的区间置信度(当我们用这条曲线去做区间内的值的预测时)为68%，y±2*delta的区间置信度为95%，具体的可以看帮助文档。一般在使用时输出y即可。需要注意的是，如果在polyfit中要求输出mu这个参数，那么在使用polyval计算y时也需要将之放在输入参数里，否则会有一些问题。

三、仿真与讨论

本章通过仿真来实践最小二乘拟合问题，并做一些有益的探讨。本章的仿真和行文思路大概是：设计一个函数，并生成坐标点 ----> 对坐标点加噪声 ----> 用最小二乘法拟合这些加噪声后的点(设计不同的迭代次数，并将之与原始函数做比较) ----> 讨论欠/过拟合问题 ----> 讨论过拟合问题的解决办法。

3.1 仿真结果及其讨论

本次仿真选用了三阶函数：y = 4.*x.^3 + 3.*x.^2 + 2.*x + 1 作为原始曲线，并在[-1 1]区间内均匀选取了50个点加SNR为15dB的高斯白噪声作为观测点。结果如下图所示：

图3.1 原始曲线&加噪声后的观测点

为方便后续关于欠/过拟合问题的说明，我选取了区间[-1 0]内的观测点作为“训练集”进行拟合，并将[0 1]内的观测点作为判断是否过拟合的“验证集”。

当使用最高三阶多项式的函数进行拟合时，效果如下：

图3.2 使用最高3阶多项式函数进行拟合时的拟合结果

由上图可以看到，效果还OK，特别是[-1 0]区间内的拟合效果(只是选取了该区间内的观测数据进行拟合)。当使用最高1阶多项式的函数进行拟合时，效果如下：

图3.3 使用最高1阶多项式函数进行拟合时的拟合结果

从图中可以看到，不管是[-1 0]区间还是[0 1]区间，拟合的效果是很差的，这便是所谓的欠拟合现象。当使用最高5阶多项式的函数进行拟合时，得到的拟合结果如下：

图3.4 使用最高5阶多项式函数进行拟合时的拟合结果1

从上图可以看到，[0 1]区间内已经完全背离了，不具备“预测”效果。但是[-1 0]区间的拟合结果其实很好：

图3.5 使用最高5阶多项式函数进行拟合时的拟合结果2

甚至看起来比原始曲线更贴近观测点，这便是过拟合现象：很符合“训练”数据，但是对于测试集来说差很远。

仿真中我也尝试了基于公式(2.3)进行拟合，效果一样(不管是设置在几阶之下)，下图为3阶下的两种方法拟合结果对比：

图3.6 基于公式(2.3)的拟合与Matlab自带函数的拟合结果对比

函数的实现其实很简单(不管是基于公式(2.3)写函数，还是基于Matlab自带的函数进行仿真)，读者可以参考本文随附的参考代码。

*对前述结果进行小结*

1、实践了最小二乘拟合法(分别基于Matlab自带的函数以及基于公式(2.3)自写函数)。

2、最小二乘拟合法最关键的在于阶数的选取，这从前面不同阶下的仿真结果对比可以看出：只有当使用三阶函数时拟合的效果最好。当阶数选取不对时，会产生欠拟合或过拟合现象。

3、最小二乘拟合从某种程度上来说只对拟合区间内的内容负责。只有当观测区域外的区间与观测数据之间具备特定的关系(比如同为某一个函数)且拟合时所使用的阶数比较好地契合了这个函数时，拟合曲线对区间外的数据拟合效果较好。

4、以上结论闭环了第一章中的注意点。

3.2 关于过拟合问题

3.2.1 过拟合问题的原因探讨

最小二乘拟合应用在说明中提到的道路边沿拟合，或者雷达检测目标轨迹的曲率计算时，一般不会存在欠/过拟合问题，因为我们事先知道要拟合的东西是什么：我们一般用一阶多项式函数(直线)去拟合做标定时的路沿，用二阶多项式函数拟合目标运动轨迹。欠或者过拟合现象主要出现在我们无法确定应该使用多高的阶数去拟合观测数据时的情况，这两个概念现阶段主要的适用领域还是机器学习，关于计算机我了解不多，本小节对这两个概念只做一点简单解释。

我们用作拟合的数据是观测数据，这些数据并不是完全真实的、正确的，它是有噪声(各种原因导致数据失真)的，此时如果阶数过高，会导致拟合得到的曲线完全符合观测数据，也即曲线把噪声等错误信息也学进去了，这便是过拟合。

产生过拟合问题的本质大概可以归纳为：模型太过复杂(阶数太高)、数据精度不够、数据数量不够。以下对这几个原因进行仿真验证。

3.2.2 针对前述原因的仿真验证

按照前面的结论，这里假设提高SNR，看看过拟合的现象是否得到有效改善(从之前的15dB，改成50dB)：

图3.7 不同SNR的观测数据下，5阶多项式函数的拟合结果对比

可以看到，过拟合的现象消失了(得到很大改善)！同时，也试验一下在SNR同为15dB的前提下，增加[-1 0]区间内的点数，从原来的25个点增加到100个点，继续用5阶多项式进行拟合：

图3.8 不同“训练”(观测)点数下的拟合结果1

在相同的SNR下，增加[-1 0]区间内的点数并只使用该区间内的观测点进行拟合时，对过拟合现象的改善并不明显。当我们把观测(训练)区间扩大时，应该才有效果，下图的仿真中我们并没有增加全区域内的点数，但是把“训练”区间扩大，从[-1 0]的基础上往外增加了10个点，得到的仿真结果如下：

图3.9 不同“训练”(观测)点数下的拟合结果2

从图中可以看到，得益于观测区间的扩大(带来的点数的增多)，此时的过拟合现象也消失(得到很大改善)了。阶数过高引起的过拟合现象已经在上一节中有充分的说明和证明，本节不做赘述。综上，我们仿真论证了可以通过增加数据精度以及基于扩展训练区间的方式增加数据量来抑制过拟合现象。

3.2.3 正则化问题讨论

但是，一般来说，数据精度和数据量是我们做拟合时没法控制的(我们只是拿到给的观测数据去做拟合，数据的精度和数量我们没法控制)，此时，我们只能通过控制模型的复杂度来解决过拟合问题。

控制模型复杂度来降低过拟合对应到曲线拟合最直接的方法自然就是降低多项式的阶数。可是，降低到多少才是合适的？(会不会导致欠拟合？)，有没有一种方法，在我们不改变阶数的前提下，通过控制比如高阶项的系数来缓解过拟合问题？(因为由于模型太过高阶导致的过拟合现象其本质就是不应该有这些高阶项，其系数应该越小越好)

人们针对该问题发明了正则化的方法：通过在最小二乘的平方和最小准则中引入正则化项来控制多项式的系数：

(3.1)

式中，就是我们引入的正则化项(λ为正则化值，W代表的还是多项式的系数)。正则化是指在原有约束关系的基础上增加各类范数(所谓的惩罚项)来配合约束。向量范数是我们用来表征向量空间中距离的一种方式，我们有各种范数的定义，比如1-范数，是将向量中各值的绝对值相加，2-范数，是将向量中各值的平方和相加后再开方。我们也可以由(3.1)推导得到W的解析解，比如对于2-范数，我们可以得到：

(3.2)

推导的方法与前文类似，在该公式的指导下，分别对原始的3阶多项式函数进行3阶和6阶下的拟合并与没有正则化下的情况进行对比：

图3.10 正则化前后对比1(最高阶为3阶)

图3.11 正则化前后对比2(最高阶为6阶)

仿真中，λ的值取为0.001(读者可以基于我提供的代码进行不同系数下的仿真对比)，从上面两图的结果来看，正则化后，效果得到明显改善。

总之，在正则化后，由于所选阶数过高而导致的过拟合问题可以得到有效缓解，机器学习领域中如何去更好地设计该正则化项是研究的重点之一。

四、总结

最小二乘拟合法是一个很常用(且很通用)的数学工具，本博文介绍了最小二乘拟合的相关概念与原理，随后分别基于代数求解和Matlab自带函数两种方式仿真实践了该方法，并做了一些有益的讨论，特别是关于过拟合问题。

本文内容相对简单，不过通读本文后应付一些相关的拟合问题应该难度不大。关于本话题更深入的一些探讨读者可以进一步搜寻相关资料，在后续的工作和学习中如果有涉及到该问题我也会不定期对本文做补充。

五、参考资料

1、最小二乘拟合，L1、L2正则化约束_matlab l2正则化代码_there2belief的博客-CSDN博客

2、详解岭回归与L2正则化_岭回归和正则化_胤风的博客-CSDN博客

3、深度学习基础算法系列（3）-正则化之L1/L2正则化 - 知乎 (zhihu.com)

六、参考代码

关于最小二乘拟合法的探讨博文相对应的代码资源-CSDN文库

Oracle创建表空间、删除、状态、重命名、修改、增加、移动水煮白菜王 Oracle oracle 数据库
目录Oracle基本学习笔记创建表空间1.表空间创建格式3.表空间状态属性4.重命名表空间5.修改表空间数据文件的大小6.删除表空间的数据文件7.修改表空间中数据文件的状态8.表空间中数据文件的移动Oracle基本学习笔记创建表空间需要使用CREATETABLESPACE语句。其基本语法如下:CREATE[TEMPORARYIUNDO]TABLESPACEtablespacename[DATAFI
godot在_process()函数实现非阻塞延时触发逻辑小沙盒 godot godot javascript 游戏引擎
extendsNode2D#用于累加delta的变量varelapsed_time=0#设定计时周期，单位为秒varinterval=3func_process(delta):#累加delta到elapsed_timeelapsed_time+=delta#检查是否达到了设定的时间间隔ifelapsed_time>=interval:#执行每3秒要做的逻辑print("每3秒执行一次的逻辑被触发"
【推荐项目】044-中医门诊管理系统蜗牛 | ICU 推荐项目 java 前端框架毕设 spring mybatis
044-中医门诊管理系统介绍javaspringbootvuejs中医门诊管理系统为了帮助您更清晰地整理中医门诊管理系统的功能，我将按照您提供的角色和功能进行归类和整理。以下是整理后的功能列表：角色划分核心管理员医生药师用户（普通患者）管理端功能（核心管理员）统计用户统计（按注册时间、活跃度等）药物销售统计处方统计咨询统计用户管理用户列表（查看、编辑、删除）用户角色分配用户权限管理医生管理医生列表
【Python 第五篇章】数据类型蜗牛 | ICU Python 专栏 python windows 开发语言
一、列表详解list.append(x)在列表末尾添加一个元素。list.extend(iterable)用可迭代对象的元素扩展列表。list.insert(i,x)在指定位置插入元素，第一个参数是插入元素的索引，第二个是值。list.remove(x)从列表中删除第一个值为x的元素。list.pop([i])移除列表中给定位置的条目，并返回该条目。如果未指定索引号，则a.pop()将移除并返回列
python catia catalog文件_Python封装的获取文件目录的函数卢新生 python catia catalog文件
获取指定文件夹中文件的函数，网上学习时东拼西凑的结果。注意，其中文件名如1.txt，文件路径如D:\文件夹\1.txt；direct为第一层子级importos#filePath输入文件夹全路径#mode#1递归获取所有文件名;#2递归获取所有文件路径;#3获取direct文件名;#4获取direct文件路径;#5获取direct文件名和direct子文件夹名;#6获取direct文件路径和dir
git subtree 管理项目子模块芥末的无奈 git git subtree
使用场景当项目越来越庞大之后，不可避免的要拆分成多个子模块，我们希望各个子模块有独立的版本管理，并且由专门的人去维护，这时候我们可以使用git的subtree功能常用命令gitsubtreeadd--prefix=--squash添加子仓库gitsubtreepull--prefix=--squash拉取更新子仓库gitsubtreepush--prefix=推送修改到子仓库如何使用1.创建带su
【实用工具】autoreconf 命令是做什么的？Mac 上怎么安装？ AI天才研究院实用工具箱 macos linux bash Autotools c
目录autoreconf命令是做什么的？Mac上怎么安装？有没有其他常用的Autotools命令？如何使用Autotools工具集生成可执行文件？autoreconf命令是做什么的？Mac上怎么安装？autoreconf命令是用于自动生成GNUAutotools构建系统所需的文件，包括configure脚本、Makefile.in文件等。它通常在源代码包中提供，用于帮助用户在不同的平台上配置、编译
2.10 Spring Boot定时任务：@Scheduled与Quartz对比分析 Sendingab spring boot 后端 java
SpringBoot定时任务：@Scheduled与Quartz对比分析一、核心特性对比特性**@Scheduled**Quartz依赖复杂度内置于Spring（零配置）需额外依赖与配置任务持久化不支持（内存存储）支持（数据库持久化）动态任务管理仅静态配置支持运行时增删改查分布式支持需自行实现原生集群支持调度策略固定速率/延迟Cron表达式/日历触发错误处理简单异常捕获完善的重试与错误日志机制性能
Python：每日一题之错误票据努力的敲码工蓝桥杯每日一题 python 蓝桥杯
题目描述某涉密单位下发了某种票据，并要在年终全部收回。每张票据有唯一的ID号。全年所有票据的ID号是连续的，但ID的开始数码是随机选定的。因为工作人员疏忽，在录入ID号的时候发生了一处错误，造成了某个ID断号，另外一个ID重号。你的任务是通过编程，找出断号的ID和重号的ID。假设断号不可能发生在最大和最小号。输入描述输入描述要求程序首先输入一个整数N(N<100)表示后面数据行数。接着读入N行数据
探索未知，从脚下开始：国内高清卫星影像地图全攻略夜雨声超烦大数据云计算
在数字化飞速发展的今天，地图早已不再是传统的纸质模样，高清卫星影像地图正为我们打开一扇扇新世界的大门。今天，就来给大家分享一下国内有哪些好用的高清卫星影像地图平台。星图云开放平台：专业级的高清视界超高清分辨率：星图云开放平台拥有全国0.8米分辨率的影像地图，部分重点城市更是达到了惊人的0.5米，这种精度让我们仿佛能看清地面上的每一块砖石。历史影像回溯：它不仅提供当下最新鲜的影像，还能让你回溯历史，
由 Mybatis 源码畅谈软件设计（五）：ResultMap 的循环引用方圆想当图灵由 Mybatis 源码畅谈软件设计 mybatis 代码规范
本节我们来了解Mybatis是如何处理ResultMap的循环引用，它的解决方案非常值得在软件设计中参考。另外作为引申，大家可以了解一下Spring是如何解决Bean的循环注入的。以单测org.apache.ibatis.submitted.permissions.PermissionsTest#checkNestedResultMapLoop为例，它对应表结构和表中的数据为：createtabl
springMVC RestFul接口设计模式详解，包括前后端设计详解。@GetMapping、@PostMapping、@PutMapping@DeleteMapping@PathVariable 漫慢丶 springmvc restful 设计模式 java
目录1、什么是RestFul接口设计模式2、使用该接口设计模式后端还需要配置什么3、使用该接口设计模式前端需要注意什么4、Controller具体实现方式1、什么是RestFul接口设计模式RestFul这是一种springmvc接口的设计模式，用来区别不同类型的请求，来匹配控制器处理映射。例如请求URL为/test/那么中根据Get、put、post等请求方式，就可以具体映射到对应的控制器方法。
批量共享，一步到位的软件神器维度哥批量共享
今天介绍一个可以一键共享文件夹的软件神器，更厉害的是可以批量设置共享并编辑共享和安全权限。批量共享一键批量共享文件夹这个软件下载之后打开就能直接使用，不需要安装。选择好文件之后设置访问权限以及共享权限，就可以直接共享给别人了。可以根据需求自己增删系统用户。也可以选择指定的用户进行共享。这里可以方便你更好的查看、管理共享用户和对应的权限。在共享设置里，如果不清楚怎么设置，可以全选设置即可。如果还有一
CSS入门指南：从零开始学习网页开发——（一）简介 GIS小白吃 css 学习前端
一、什么是CSS？CSS（CascadingStyleSheets，层叠样式表）是一种用于描述网页的外观和布局的样式表语言。它通过定义网页元素的样式（如颜色、字体、边距等）来与HTML内容分离，提升了网页的可维护性和设计的灵活性。CSS的核心目的是增强网页的表现力。早期的网页仅使用HTML来进行内容的展示，但由于HTML只能描述内容的结构，页面设计和内容变得难以管理。于是，CSS作为一种辅助技术应
git submodule管理的仓库怎么删除子仓库绛洞花主敏明 git
删除Git子模块需要执行一系列步骤，以确保从项目中彻底移除子模块及其相关配置。以下是详细的步骤：1.取消初始化子模块运行以下命令以取消子模块的初始化，这会从.git/config文件中移除子模块的配置：gitsubmoduledeinit-f-f参数用于强制执行，避免因子模块目录中有未提交的更改而导致命令失败。2.删除子模块目录从工作目录中删除子模块的文件夹：rm-rf3.从.gitmodules
学习笔记09——并发编程之线程基础码代码的小仙女高级开发必备技能学习笔记 python
线程基础1.1进程与线程的区别，Java中线程的实现（用户线程与内核线程）进程是操作系统分配资源的基本单位，而线程是CPU调度的基本单位。每个进程有独立的内存空间，而同一进程内的线程共享内存.可以从资源分配、切换开销、通信方式和独立性四个方面来比较两者的区别资源分配进程：操作系统分配资源（如内存、文件句柄等）的基本单位，拥有独立的地址空间。线程：隶属于进程，共享进程的资源（如内存、文件等），是CP
学习笔记10——并发编程2线程安全问题与同步机制码代码的小仙女高级开发必备技能 java知识学习笔记
线程安全问题与同步机制线程安全的本质问题线程安全问题源于多线程环境下对共享资源（数据或状态）的非原子性、非可见性、非有序性访问，导致程序行为不符合预期。主要表现如下：竞态条件（RaceCondition）：多个线程对同一资源进行非原子操作，导致结果依赖线程执行顺序。示例：两个线程同时执行count++（非原子操作，实际包含读-改-写三步）。内存可见性问题：线程修改共享变量后，其他线程无法立即看到最
linux: make & autoconf & automake & autoreconf & aclocal mzhan017 gcc linux build
文章目录参考make首先需要写一个makefileMakefile包含的内容targetvariable两步走语法\规则定义操作隐式规则先决条件order-onlyforceFORCE变量变量的高级功能陷阱建议使用变量时，加括号/大括号变量的替换$$@$indentationmaybenon-portableautoconfM4shautomakeconfigure参考http://savanna
【高级RAG技巧】使用二阶段检索器平衡检索的效率和精度深度学习机器大语言模型深度学习入门人工智能语言模型
一传统方法之前的文章已经介绍过向量数据库在RAG（RetrievalAugmentedGenerative）中的应用，本文将会讨论另一个重要的工具-Embedding模型。一般来说，构建生产环境下的RAG系统是直接使用Embedding模型对用户输入的Query进行向量化表示，并且从已经构建好的向量数据库中检索出相关的段落用户大模型生成。但是这种方法很明显会受到Embedding模型性能的影响，比
Dify 工作流组件完全开发指南程序员查理 AI web前端 javascript javascript 前端 react.js
1.如何添加新的工作流节点组件1.1添加新节点的步骤要在Dify工作流中添加一个新的节点类型，需要完成以下步骤：1.1.1更新节点类型枚举首先，在app/components/workflow/types.ts文件中的BlockEnum中添加新节点类型：exportenumBlockEnum{//现有节点类型//...//添加新节点类型NewNodeType='new-node-type',}1.
AI大模型零基础金融人如何一周自学大模型，从零基础到入门，看这篇就够了！冻感糕人~ 人工智能金融 AI大模型 LLM 大模型技术大模型学习路线大模型基础
前几天参加了字节跳动在上海举办的火山引擎Force原动力大会，OpenAI也连续开了12天发布会，最近堪称科技界的春晚了。如果说2022年ChatGPT横空出世把人工智能的发展带上了一个新的台阶，那么2024年末，大模型对工作、生活的全面“侵入”让我们越来越接近库兹韦尔所描述的那个奇点时刻。作为金融民工，我们想通过这篇文章讲讲从用户的角度如何一周快速掌握大模型，以及为什么我建议每一个金融从业人员（
Java学习笔记——并发编程（三） __________习惯 java java
一、wait和notifywait和notify原理Owner线程发现条件不满足，调用wait方法，即可进入WaitSet变为WAITING状态BLOCKED和WAITING的线程都处于阻塞状态，不占用CPU时间片BLOCKED线程会在Owner线程释放锁时唤醒WAITING线程会在Owner线程调用notify或notifyAll时唤醒，但唤醒后并不意味着立刻获得锁，仍需进入EntryList重
C语言开发以及维护用到的工具简介 812503533 蓦然回首---再看C语言 c语言编辑器开发语言
C语言作为一门经典的编程语言，广泛应用于系统编程、嵌入式开发、操作系统内核等领域。经过第一部分的介绍，已经可以实现一些最简单的功能了，比如文字版本的计算器，猜数字小游戏，通过调整输出格式从而输出优美的图形等等，那么在未来的实际使用中，使用一些什么工具去进行c语言的编辑，查看，编译，运行等等，本文将做简单的介绍，后续再慢慢完善相关的内容。1、编辑器所有语言在编写的时候使用的工具就叫做编辑器，C语言程
C 语言中的数组详解 812503533 c语言 java 开发语言
在C语言中，数组是一种非常基础且常用的数据结构。数组是存储一组相同类型元素的集合，允许我们以统一的方式访问和操作这些元素。C语言中的数组不仅在编程中使用广泛，而且它的灵活性和效率使得它成为了许多算法实现的基础。本篇文章将深入分析C语言中的一维数组，包括定义、存储方式、操作方式、常见问题等等，所有的数据结构都可以从这几个方面来学习。1.数组的定义与存储方式1.1一维数组的定义数组的定义方式包括数组大
C语言回调函数 812503533 c语言 java 开发语言
前文函数指针中说到了，函数指针的一个重要作用就是实现回调函数，那么什么是回调函数，回调函数有什么作用，在那些场景下使用，具体应该怎么使用，本文就分享下这块的知识。1、回调函数简介回调函数（CallbackFunction）是指将一个函数作为参数传递给另一个函数，然后在适当的时候由被调用的函数执行该回调函数。回调函数是实现事件驱动编程、异步编程和灵活接口设计的核心工具。回调函数通常用于实现高阶函数，
Linux tcpdump -any抓的包转换成标准的pcap 812503533 linux tcpdump 网络协议 tcp/ip
在Linux中使用tcpdump-any抓包并转换为标准pcap文件时出现额外字段，通常与链路层协议头部的差异以及pcap文件格式的兼容性有关。以下是详细原因和解决方案：一、问题原因分析-any选项的局限性tcpdump-any会自动猜测链路层协议类型（如Ethernet、IEEE802.11、PPP等），但可能因环境复杂导致误判。例如：在混合网络（如同时包含有线和无线流量）中，自动检测可能失败。
暮然回首--再看C语言--常量与宏定义 812503533 蓦然回首---再看C语言 c语言
常量与宏定义在C语言中，常量和宏定义是非常重要的概念。它们有助于提高程序的可读性、可维护性，并且能够避免重复代码。常量是指在程序运行期间其值不发生变化的变量，而宏定义是一种预处理指令，用于定义常量或代码片段，在编译阶段进行替换。一、常量常量是指在程序执行过程中其值不可改变的量。在C语言中，我们可以使用const关键字来声明常量。常量分为以下几种类型：常量整数：例如constinta=5;常量浮点数
关于Jquery基本内容一 gloria123_ jquery 前端 javascript
jQuery(jQ)html+css+js1jQ是一个js库,封装了大量的特定的集合(函数和方法)如animate()、css()、show()等2使用jQ大大提高开发效率,简化dom操作常见的js库jQueryYUIDojoExtJszeptojQuery选择器$(selector)筛选方法parent()$(“li”).parent()children(selector)$(“ul”).chi
关于tomcat gloria123_ tomcat java
**web应用服务器安装在服务端的服务产品，在web服务器上放置一些允许客户端直接访问的资源，启动服务，客户端通过ip+端口号即可以访问web应用服务器上的资源下载tomcat压缩包并解压后：tomcat:bin目录:存放启动和停止服务等的脚本mac电脑通过命令sudoshstartup.sh来启动，windows系统通过bat可以手动启动conf目录：存放tomcat服务器配置文件web.xml
推荐开源项目：EXP Godot 对话系统 v1.2.0 田桥桑Industrious
推荐开源项目：EXPGodot对话系统v1.2.0Godot-Dialog-SystemADialogSystemAddonfortheGodotEngine.项目地址:https://gitcode.com/gh_mirrors/go/Godot-Dialog-System上帝之城的创作者们，欢迎探索EXPGodotDialogSystem——一个专为Godot3.2稳定版打造的对话管理系统，由
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在