山上有风景

机器学习实战---线性回归（更好的使用正规方程求解）

回顾梯度下降和正规方程：https://www.cnblogs.com/ssyfj/p/12788147.html

一：正规方程解法（最小二乘法）

（一）加载数据

import numpy as np
import matplotlib.pyplot as plt

def loadDataSet(filename):
    dataSet = np.loadtxt(filename)
    m,n = dataSet.shape
    data_X = dataSet[:,0:n-1]
    data_Y = dataSet[:,n-1]
    return data_X,data_Y

（二）使用正规方程求解参数向量

def standRegres(data_X,data_Y):
    XTX = data_X.T@data_X
    XT = data_X.T
    if np.linalg.det(XTX) == 0: #linalg.det用于求解方阵行列式，如果求解的行列式值=0，则不可以求逆
        print("data X cann`t inverse")
        return
    W = np.linalg.inv(XTX)@XT@data_Y
    return W

（三）载入数据，测试结果

data_X,data_Y = loadDataSet("ex0.txt")
W = standRegres(data_X,data_Y)

plt.figure()
plt.scatter(data_X[:,1].flatten(),data_Y.flatten(),c="green",marker="o")

x = np.linspace(0,1,100)
print(W)
y = W[0]+W[1]*x
plt.plot(x,y)

plt.show()

二：局部加权避免欠拟合

补充：高斯分布https://www.cnblogs.com/ssyfj/p/12940077.html

解释见机器学习实战。通过W矩阵的对角线上设置不同的数值，表示对不同的数据样本数值不同的权重（与支持向量机中的核类似）。

对于预测值距离标签值越近的点，我们设置的权重越大，越远设置越小。这里我们使用的是高斯核：其对应的权重如下：

从公式中，我们可以看到k，即方差影响了高斯分布的收敛速度，当k越小时，下降速度越快，因此考虑的样本数（局部、附近）也就越少，故而对于当前局部样本数据点的拟合直线也就越符合当前的局部数据点（而非全局）。当我们迭代访问完成全部数据后，会发现拟合的模型为折线，而非直线，因为折线的每一段都是对局部样本集的最好拟合，而直线是对全局数据点的拟合。

所以当我们设置的k值越小，高斯收敛越快，涉及的局部样本点越少，折线段数越多，导致对全局样本的拟合程度超过我们预期的拟合模型，变为过拟合，所以合理的选取k值，是一个重要的问题。

（一）导入数据

import numpy as np
import matplotlib.pyplot as plt

def loadDataSet(filename):
    dataSet = np.loadtxt(filename)
    m,n = dataSet.shape
    data_X = dataSet[:,0:n-1]
    data_Y = dataSet[:,n-1]
    return data_X,data_Y

（二）实现局部加权函数预测每个样本点的结果

def lwlr(testPoint,data_X,data_Y,k=1.0):    #求解当前样本点的权重W，从而获取当前样本点的预测值
    m,n = data_X.shape
    W = np.eye(m)

    for i in range(m):  #对每一个样本点都求解其权重
        diff = testPoint - data_X[i,:]  #样本点差距，是个向量，还要进行处理
        W[i,i] = np.exp([email protected]/(-2*k**2))

    XTWX = data_X.T@W@data_X
    XT = data_X.T
    if np.linalg.det(XTWX) == 0: #linalg.det用于求解方阵行列式，如果求解的行列式值=0，则不可以求逆
        print("data X cann`t inverse")
        return
    W = np.linalg.inv(XTWX)@XT@W@data_Y
    return [email protected]  #返回当前样本点的预测值

（三）测试函数

def lwlrTest(testPoint,data_X,data_Y,k=1.0):
    yPred = np.zeros(data_Y.shape)
    
    for i in range(data_X.shape[0]):
        yPred[i] = lwlr(testPoint[i], data_X, data_Y, k)

    return yPred

（四）绘制图像

data_X,data_Y = loadDataSet("abalone.txt")
yPred = lwlrTest(data_X,data_X,data_Y,1.0)
#注意：因为绘制折线图是从左向右逐步绘制的，所以我们的数据需要进行排序处理，将data_X和yPred进行排序之后处理
SortIdx = data_X[:,1].argsort(0)    #小到大排序，获取索引
Sort_X = data_X[SortIdx]

plt.figure()
plt.scatter(data_X[:,1].flatten(),data_Y.flatten(),c="green",marker="o")
plt.plot(Sort_X[:,1].flatten(),yPred[SortIdx].flatten(),c="r")

plt.show()

（五）当k分别为1，0.01，0.003时的拟合结果

（六）预测鲍鱼年龄

import numpy as np
import matplotlib.pyplot as plt

def loadDataSet(filename):
    dataSet = np.loadtxt(filename)
    m,n = dataSet.shape
    data_X = dataSet[:,0:n-1]
    data_Y = dataSet[:,n-1]
    return data_X,data_Y

def lwlr(testPoint,data_X,data_Y,k=1.0):    #求解当前样本点的权重W，从而获取当前样本点的预测值
    m,n = data_X.shape
    W = np.eye(m)

    for i in range(m):  #对每一个样本点都求解其权重
        diff = testPoint - data_X[i,:]  #样本点差距，是个向量，还要进行处理
        W[i,i] = np.exp([email protected]/(-2*k**2))

    XTWX = data_X.T@W@data_X
    XT = data_X.T
    if np.linalg.det(XTWX) == 0: #linalg.det用于求解方阵行列式，如果求解的行列式值=0，则不可以求逆
        print("data X cann`t inverse")
        return
    W = np.linalg.inv(XTWX)@XT@W@data_Y
    return [email protected]  #返回当前样本点的预测值

def lwlrTest(testPoint,data_X,data_Y,k=1.0):
    yPred = np.zeros(data_Y.shape)
    for i in range(data_X.shape[0]):
        yPred[i] = lwlr(testPoint[i], data_X, data_Y, k)

    return yPred

误差计算

def rssError(yArr,yHatArr):
    return ((yArr-yHatArr)**2).sum()

训练集中的拟合程度（误差查看）

data_X,data_Y = loadDataSet("abalone.txt")

yPred01 = lwlrTest(data_X[0:99],data_X[0:99],data_Y[0:99],0.1)
print(rssError(data_Y[0:99],yPred01))

yPred1 = lwlrTest(data_X[0:99],data_X[0:99],data_Y[0:99],1)
print(rssError(data_Y[0:99],yPred1))

yPred10 = lwlrTest(data_X[0:99],data_X[0:99],data_Y[0:99],10)
print(rssError(data_Y[0:99],yPred10))

测试集拟合程度（误差查看）

yPred01 = lwlrTest(data_X[100:199],data_X[0:99],data_Y[0:99],0.1)
print(rssError(data_Y[100:199],yPred01))

yPred1 = lwlrTest(data_X[100:199],data_X[0:99],data_Y[0:99],1)
print(rssError(data_Y[100:199],yPred1))

yPred10 = lwlrTest(data_X[100:199],data_X[0:99],data_Y[0:99],10)
print(rssError(data_Y[100:199],yPred10))

总感觉这样测试有问题....,因为实际中测试中还是使用了测试集数据去拟合数据

三：缩减系数法

岭回归等同于就是L2正则化，而对于L2正则化的问题

就是约束问题：

同样lasso回归，也是L1正则化，通过约束项依旧可以达到缩减系数的目的。所以说常用的缩减系数法包括岭回归和lasso回归两种方法.

一般缩减系数常用于大量系数中，对于书籍后面乐购估价（不想做）中，由于选取特征过少，所以结果和最小二乘法几乎一致，没有缩减必要性

四：岭回归

岭回归和LASSO回归（一）

岭回归和LASSO回归（二）

（一）数据导入

import numpy as np
import matplotlib.pyplot as plt

def loadDataSet(filename):
    dataSet = np.loadtxt(filename)
    m,n = dataSet.shape
    data_X = dataSet[:,0:n-1]
    data_Y = dataSet[:,n-1]
    return data_X,data_Y

（二）岭回归算法实现

def ridgeRegres(data_X,data_Y,lam=0.2): #计算回归系数
    XTX = data_X.T@data_X
    new_dataX = XTX+np.eye(data_X.shape[1])*lam

    if np.linalg.det(new_dataX) == 0:
        print("can`t inverse")
        return
    W = np.linalg.inv(new_dataX)@data_X.T@data_Y
    return W

（三）测试不同lamda选取

def ridgeTest(data_X,data_Y):   #查看lamda选择值的表现
    #数据归一化
    newData_X = (data_X - np.mean(data_X,0))/np.var(data_X,0)
    newData_Y = data_Y - np.mean(data_Y,0)

    lamdaNums = 30
    W = np.zeros((lamdaNums,newData_X.shape[1]))
    print(W.shape)
    for i in range(lamdaNums):
        Wi = ridgeRegres(newData_X,newData_Y,np.exp(i-10))
        W[i] = Wi.T
    return W

（四）绘制lamda选取图像

data_X,data_Y = loadDataSet("abalone.txt")
W = ridgeTest(data_X,data_Y)

plt.figure()
plt.plot(W)
plt.show()

当λ为0时，结果跟普通意义的多元线性回归的最小二乘解完全一样；
在λ较小时，各个回归系数比较大；
当λ增大时，各个回归系数取值迅速减小，即从不稳定趋于稳定。
上图中类似喇叭形状的岭迹图，一般存在多重共线性。（因为有8个特征值，所以回归系数之也有8个，对应8条曲线）

λ选择：一般通过观察，选择喇叭口附近的值，此时各个回归系数趋于稳定，而且预测值与实际值的平方误差不太大。
但是也不能选太大的λ，因为，上图中，貌似随着λ的增大，回归系数的取值大小趋于稳定，但是实际对应的平方误差已经非常大了。
为了定量地找到最佳参数值，还需要进行交叉验证。另外，要判断哪些变量对结果预测最有影响力，可以观察上图中对应系数的大小

建议使用交叉验证进行比较获取λ取值比较好

（五）总结

Ridge回归在不抛弃任何一个变量的情况下，缩小了回归系数，使得模型相对而言比较的稳定，但这会使得模型的变量特别多，模型解释性差。

有没有折中一点的办法呢？即又可以防止过拟合，同时克服Ridge回归模型变量多的缺点呢？有，这就是下面说的Lasso回归。

（六）补充岭回归和最小二乘法区别

https://www.zhihu.com/question/28221429?sort=created

五：lasso回归

Lasso回归和岭回归的同和异

Lasso回归使得一些系数变小，甚至还是一些绝对值较小的系数直接变为0，因此特别适用于参数数目缩减与参数的选择，因而用来估计稀疏参数的线性模型。

但是Lasso回归有一个很大的问题，导致我们需要把它单独拎出来讲，就是它的损失函数不是连续可导的，由于L1范数用的是绝对值之和，导致损失函数有不可导的点。

也就是说，我们的最小二乘法，梯度下降法，牛顿法与拟牛顿法对它统统失效了。那我们怎么才能求有这个L1范数的损失函数极小值呢？

接下来介绍两种全新的求极值解法：坐标轴下降法（coordinate descent）和最小角回归法（ Least Angle Regression， LARS）。

....

太烦了，以后用到再说（https://www.cnblogs.com/wmx24/p/9555219.html）

六：实现前向逐步线性回归

（一）代码实现

import numpy as np
import matplotlib.pyplot as plt

def loadDataSet(filename):
    dataSet = np.loadtxt(filename)
    m,n = dataSet.shape
    data_X = dataSet[:,0:n-1]
    data_Y = dataSet[:,n-1]
    return data_X,data_Y

def rssError(yArr,yHatArr): #求解平方和误差
    return ((yArr-yHatArr)**2).sum()

def stageWise(data_X,data_Y,eps=0.01,numIt = 100):   #后两个传参是缩放系数和迭代次数
    #数据归一化
    newData_X = (data_X - np.mean(data_X,0))/np.var(data_X,0)
    newData_Y = data_Y - np.mean(data_Y,0)
    newData_Y = np.array([newData_Y]).T #注意：这里一定需要进行转置，否则后面的求解平方误差会出错
    m,n = data_X.shape
    #初始化我们要返回的权重矩阵，与迭代次数和特征数有关
    ReturnW = np.zeros((numIt,n))
    ws = np.zeros((n,1))
    # print(rssError())
    wsTest = ws.copy()  #设置副本
    wsMax = ws.copy()   #设置副本
    for i in range(numIt):  #按要求进行次数迭代，下面对每一个特征都进行一遍处理(但是每一次只更新最优的那个特征）
        print(ws.T)
        lowestError = np.inf  # 设置最低误差为正无穷　　本轮迭代中对因变量变化最大（使得预计值与真实值越接近）的这个特征值的系数；
        for j in range(n):  #对每一个特征都进行一遍处理
            for k in [-1,1]:    #进行增大或者减少比较平方误差
                wsTest = ws.copy()  #不对原始数据修改
                wsTest[j] += eps*k  #进行指定特征值的增加和减少
                yTest = newData_X@wsTest   #获取更新了特征值以后的预测值
                rssErr = rssError(newData_Y,yTest)
                if rssErr < lowestError:    #注意：由于使用的是副本，所以对于k,是对增加、减少、不变这三个方向进行对比，获取最小平方误差
                    lowestError = rssErr    #更新最小损失
                    wsMax = wsTest  #临时存储当前最优权值
        print(lowestError)
        ws = wsMax.copy()   #通过一轮迭代，上面对所有特征进行了一遍处理（增加、减少、不变），来获取目前最优（平方误差最小）权重向量
        ReturnW[i,:] = ws.T #记录这一次的结果（每一次结果的平方误差都会）　　获取的都是本轮变化量最大的值
    return ReturnW

data_X,data_Y = loadDataSet("abalone.txt")
print(data_X)
print(data_Y)
returnW = stageWise(data_X,data_Y,0.001,5000)

plt.figure()
plt.plot(returnW)
plt.show()

增加迭代次数如0.001，5000，可以得到和最小二乘近似的结果。

（二）结论

returnW = stepWise(data_X,data_Y,0.01,200)

可见w1和w6对目标值无影响，这两个特征值可以不需要，减少步长。

逐步线性回归优点：构建一个模型后，利用本算法找出重要的特征，及时停止对不重要特征的收集

站在巨人的肩膀！字节跳动的这份高并发架构设计的太牛了，不愧是一线大厂（附完整版PDF）跟着我学Java Java 程序员面试 pdf 数据库 java 架构职场和发展
前言我们知道，高并发代表着大流量，高并发系统设计的魅力就在于我们能够凭借自己的聪明才智设计巧妙的方案，从而抵抗巨大流量的冲击，带给用户更好的使用体验。这些方案好似能操纵流量，让流量更加平稳得被系统中的服务和组件处理。来做个简单的比喻吧。从古至今，长江和黄河流域水患不断，远古时期，大禹曾拓宽河道，清除淤沙让流水更加顺畅；都江堰作为史上最成功的的治水案例之一，用引流将岷江之水分流到多个支流中，以分担水
OpenAI API - Streaming(流) 的概念与基本使用田园里的猫 OpenAI API 人工智能 chatgpt python node.js
前言此篇文章旨在通过对OpenAIAPI中Streaming(流)概念的介绍和示例，来帮助大家更好的理解和使用Streaming(流)这个功能，我之所以把Streaming(流)拿出来单独写一篇，是因为Streaming(流)方式的开发，能让我们对返回结果有更多的操作空间更多的创意空间，让我们产品有更好的体验目录1.基本概念2.主要在哪些API中使用3.流的工作原理4.基本使用示例5.应用场景示例
记账本app的需求分析 Shen Planck
记账本应用程序的需求分析包括对应用程序的功能和性能进行评估，以确定应用程序的设计和开发应该包含哪些内容。首先，应对记账本应用程序的用户进行用户调研，以了解用户的使用需求。这可以包括访问用户的使用情况，以及他们希望记账本应用程序具有哪些功能。其次，应确定记账本应用程序的目标市场，以确定应用程序的设计应该如何进行。这可能会考虑该应用程序的使用者人群，以及应用程序的使用场景。随后，应分析记账本应用程序的
Docker 数据卷与文件挂载 huingymm docker 容器运维
Docker数据卷与文件挂载的区别与管理指南在Docker中，数据卷（Volume）和文件挂载（BindMount）是两种常用的数据持久化方式。它们的主要目的是将容器内的数据保存到主机上，以便在容器重启或删除后数据不会丢失。本文将详细介绍数据卷和文件挂载的区别、使用方法以及管理技巧。目录数据卷与文件挂载的区别数据卷的使用创建数据卷挂载数据卷查看数据卷删除数据卷文件挂载的使用挂载主机目录挂载单个文件
PX4垂起（Tiltrotor）偏航控制研究 zhao23333 PX4
PX4垂起（Tiltrotor）偏航控制研究PX4垂起（Tiltrotor）偏航控制研究1.问题描述2.过渡过程中为什么没有偏航角度控制问题1：为什么在过渡阶段固定翼位置控制没有起作用？问题2：关于virtual_attitude_setpoint的使用问题3：为什么过渡状态姿态角给定值是固定的姿态控制给出的？3.如何修改固件使倾转旋翼在过渡状态也控制角度PX4垂起（Tiltrotor）偏航控制研
StockTV 全球股票、外汇、期货、加密货币 API 接口文档详解 CryptoRzz python 金融数据分析 java websocket
概述StockTV提供了全球范围内的股票、外汇、期货和加密货币的实时数据接口，支持HTTP和WebSocket两种对接方式。本文将详细介绍如何使用StockTV的API接口获取实时数据，并重点介绍印度数据源的使用。接口文档1.获取Key在使用StockTV的API接口之前，您需要先获取一个Key。请通过以下方式联系我们获取Key：联系我们获取Key2.调用API在调用API时，请将获取到的Key添
Redis大key 不7夜宵 redis bootstrap 数据库
Redis大key基本概念，影响Redis大key指在Redis中存储了大量数据的键，它会对Redis的性能和内存管理产生影响。大key的定义与value的大小和元素数量有关，但这个定义并不是绝对的，而是相对的，具体取决于系统的使用场景和性能要求。大key通常有以下两种情况：Value存储占用空间大集合类型的Key中元素过多![[Pastedimage20250227151208.png]]造成的
多模态大模型常见问题 cv2016_DL 多模态大模型人工智能语言模型自然语言处理机器学习 transformer
1.视觉编码器和LLM连接时，使用BLIP2中Q-Former那种复杂的Adaptor好还是LLaVA中简单的MLP好，说说各自的优缺点？Q-Former（BLIP2）：优点：Q-Former通过查询机制有效融合了视觉和语言特征，使得模型能够更好地处理视觉-语言任务，尤其是在多模态推理任务中表现优秀。缺点：Q-Former结构较为复杂，计算开销较大。MLP（LLaVA）：优点：MLP比较简单，计算
Spring Boot 项目 90% 存在这 15 个致命漏洞，你的代码在裸奔吗？风象南原创随笔 java spring boot 后端 web安全系统安全
文章首发公众号【风象南】SpringBoot作为一款广泛使用的Java开发框架，虽然为开发者提供了诸多便利，但也并非无懈可击，其安全漏洞问题不容忽视。本文将深入探讨SpringBoot常见的安全漏洞类型、产生原因以及相应的解决方案，帮助开发者更好地保障应用程序的安全。1.SQL注入漏洞漏洞描述：当应用程序使用用户输入的数据来构建SQL查询时，如果没有进行适当的过滤或转义，攻击者就可以通过构造恶意的
「MySQL」日期时间格式化函数 DATE_FORMAT() 的使用详解 m0_74823827 mysql adb android
目录一、DATE_FORMAT()语法二、格式化字符串详解三、常见日期时间格式组合四、业务场景五、总结一、DATE_FORMAT()语法DATE_FORMAT()是MySQL中用于格式化日期时间的函数：语法：DATE_FORMAT(date,format_string)date：需要格式化的日期化时间值，一般是需要被格式化的日期时间类型(datetime类)，但也可以是日期时间形式的字符串form
大语言模型微调和大语言模型应用的区别？ AI Echoes 人工智能深度学习 deepseek 机器学习算法
大语言模型微调和大语言模型应用的区别？关键要点微调大型语言模型（LLM）是调整预训练模型以适应特定任务或领域的过程，研究表明这能显著提升性能。大型语言模型应用是指将LLM用于实际问题解决或任务执行，如聊天机器人或文本生成。微调和应用的不同在于：微调是准备阶段，应用是最终使用；使用微调模型通常在特定领域表现更好，而预训练模型更适合通用任务。什么是微调大型语言模型？微调大型语言模型是指取一个已经预训练
【零基础入门】一篇弄懂nn.Sequential以及ModuleList的使用（呕心沥血版）十二月的猫 PyTorch深度学习 pytorch 零基础入门
个人主页：十二月的猫-CSDN博客系列专栏：《PyTorch科研加速指南：即插即用式模块开发》CSDN博客十二月的寒冬阻挡不了春天的脚步，十二点的黑夜遮蔽不住黎明的曙光目录1.前言2.Sequential类的使用2.1序列容器简单注入2.2序列容器字典注入2.3序列容器函数注入2.4序列容器修改2.5序列容器删除3.nn.ModuleList()的使用3.1定义模型3.2使用模型4.总结1.前言《
MySQL 中 int (1) 和 int (10) 的区别详解阿贾克斯的黎明游戏开发 mysql 数据库
目录MySQL中int(1)和int(10)的区别详解在MySQL数据库的使用过程中，我们创建数据表时经常会用到整数类型，比如int。而细心的开发者可能会注意到，int后面可以跟一个数字，像int(1)和int(10)，这两者到底有什么区别呢？今天我们就来深入探讨一下。在MySQL中，int类型后面括号里的数字M，代表的是显示宽度，最大取值为255。需要明确的是，这个显示宽度和该类型可以存储的范围
HTML语言的贪心算法宇瞳月包罗万象 golang 开发语言后端
HTML语言的贪心算法：理论与实践引言在编程和算法研究中，贪心算法是一种广泛应用的解决问题的方法。它通过对每一阶段选择最优解的方式来构建整个问题的解决方案。贪心算法不一定能在所有情况下得到最优解，但在许多实际问题中，它能够提供一个足够好的近似解。本文将探讨贪心算法的基本概念、典型应用、优缺点，并结合HTML语言的特点，提出一些具体的实现示例和思考。一、贪心算法的基本概念贪心算法是一种求解最优化问题
IDC权威认证！永洪科技入选 IDC「GBI图谱」，点亮生成式 BI 价值灯塔永洪科技科技人工智能 BI 大数据数据分析
大数据市场正在稳步前进，生成式AI已成为厂商服务的重点方向，其发展离不开数据底座建设和数据工程管理，反过来AI也会帮助开发运维人员、业务人员和管理层更好地使用、查询数据。IDC调研数据显示，在生成式AI的驱动下，未来5年企业在数据管理和数据分析基础设施建设的投资增长率将分别达到8.7%和9.2%。近日，国际咨询机构IDC发布了《中国数据智能市场生态图谱V5.0》，在这一领域，永洪科技以其创新前沿的
深入理解 JSON.stringify：优雅输出 JSON 数据天天进步2015 前端开发 json
在JavaScript开发中，JSON数据的处理是一项基础且关键的技能。JSON.stringify()方法作为将JavaScript对象转换为JSON字符串的标准工具，其功能远不止于简单的数据转换。本文将深入探讨JSON.stringify()的使用技巧、参数配置以及常见陷阱，帮助开发者更优雅地处理JSON数据输出。基础用法JSON.stringify()的基本语法如下：JSON.stringi
Linux进程间通信：消息队列与msgget函数使用详解无形小手
本文还有配套的精品资源，点击获取简介：本文深入介绍了Linux消息队列的创建和操作方法，包括msgget()、msgsnd()和msgrcv()三个核心函数。介绍了通过消息队列实现进程间通信的基础实验步骤和关键要点，如键值计算、消息发送和接收，以及进程间通信时常见的权限控制、消息顺序、类型匹配和同步问题。通过学习这些内容，开发者能够更好地理解和掌握如何在项目中实现高效的进程间通信。1.Linux消
麒麟服务器操作系统Redis部署手册太极淘麒麟操作系统管理工具服务器 redis 运维
软件简介Redis****介绍REmoteDIctionaryServer(Redis)是一个由SalvatoreSanfilippo写的key-value存储系统，是跨平台的非关系型数据库。Redis是一个开源的使用ANSIC语言编写、遵守BSD协议、支持网络、可基于内存、分布式、可选持久性的键值对(Key-Value)存储数据库，并提供多种语言的API。Redis通常被称为数据结构服务器，因为
如何使用LangChain流式处理工具事件 fgayif langchain java 前端 python
在AI开发中，实时处理和监听事件是一项关键能力，特别是在处理复杂的模型和工具链时。本文将向您展示如何使用LangChain框架流式处理自定义工具中的事件，以便更好地监控和调试模型的内部状态。技术背景介绍LangChain是一个用于构建和操作语言模型的工具库，其中astream_events()方法能帮助我们监听和处理来自模型的事件流。了解如何正确地配置这些事件对于调试和高级应用至关重要，尤其是在运
RabbitMQ--topic模式浮休383 rabbitmq 分布式
目录1.topic模式2.通配符的使用3.举例4.生产者代码示例5.消费者代码示例1.topic模式Topic模式与Direct模式相比，他们都可以根据Routingkey把消息路由到对应的队列上，但是Topic模式相较于Direct来说，它可以基于多个标准进行路由。也就是在队列绑定Routingkey的时候使用通配符。使我们相较于Direct模式灵活性更大。2.通配符的使用 "*"
使用LocalAI进行文本嵌入的实战指南 bavDHAUO python
技术背景介绍文本嵌入是一种将文本片段转换为高维向量的技术，可以用于自然语言处理任务中的相似性计算、信息检索等应用。LocalAI提供了一种本地化的嵌入解决方案，允许开发者在本地环境中运行和测试嵌入模型。通过在本地部署LocalAI服务，您可以避免依赖外部API，享受更快的响应速度和更好的数据隐私。核心原理解析LocalAIEmbedding类主要负责与本地运行的LocalAI服务通信，进行文本嵌入
嵌入式系统中的状态机模式 boringhex.top MCU 嵌入式设计模式
在嵌入式系统中，状态机模式是一种常用的设计模式，通过定义系统的不同状态及其转换规则，帮助开发者更好地管理系统的行为和状态变化。本文将详细讲解状态机模式，并结合实例深入分析，帮助读者深入理解这一模式在嵌入式系统中的应用。状态机模式概述状态机模式（StateMachinePattern）是一种行为型设计模式，它允许对象在其内部状态改变时改变其行为。状态机模式通过将状态封装为独立的类，使得对象在不同状态
【MATLAB】不掉发的小刘 MATLAB matlab 开发语言
数学计算与运算基础数学函数函数名功能示例sin(x)正弦函数sin(pi/2)→1cos(x)余弦函数cos(0)→1sqrt(x)平方根sqrt(4)→2exp(x)指数函数exp(1)→e≈2.718log(x)自然对数log(e)→1abs(x)绝对值abs(5)→5线性代数函数名功能示例A\b解线性方程组Ax=bA=21;11,b=3;2,x=A\b→x=1;1det(A)矩阵行列式det
线性代数介绍 ZhuBin365 其它机器学习线性代数人工智能
线性代数介绍线性代数是数学的一个重要分支，它研究向量空间、线性变换和线性方程组。其概念抽象，应用广泛，是现代科学技术中不可或缺的数学工具。本篇将详细解释线性代数中的核心概念，包括行列式、矩阵、向量与向量空间、线性方程组、特征值与特征向量以及二次型，力求深入浅出，帮助读者全面理解。一、行列式(Determinants)行列式是线性代数中一个fundamental的概念，它是一个将方阵映射到一个标量的
头条原创文章一键转换剪映生成视频 Mr数据杨 Python 视频剪辑 python moveipy 图文转视频西瓜视频剪映
随着技术的进步，平台逐渐为创作者提供了更多便捷的功能来增强内容的表达效果。近期，某平台新增了一个实用功能，允许用户将自己发布的文章通过后台的视频生成工具一键转换为短视频。然而，这一功能的使用存在一些限制，比如仅支持原创文章，并且生成的视频只能在该平台发布，暂时无法同步至其他社交平台。尽管如此，通过对生成视频的观察与分析，可以发现其处理方式与剪映等主流视频编辑软件有相似之处，这为进一步扩展视频的应用
python中如何组织项目工程文件晓风残月淡 python爬虫 python 开发语言项目工程文件
一、项目工程文件目录一个典型的Python项目工程目录结构可以帮助你更好地组织代码、资源和测试，从而使得项目更加清晰和易于维护。my_project/│├──my_project/#项目的主代码包│├──__init__.py#包初始化文件│├──module_1.py#示例模块1│└──module_2.py#示例模块2│├──tests/#测试代码目录│├──__init__.py#测试包初始
JavaScript基础-API 和 Web API 難釋懷前端 javascript 开发语言
在现代Web开发中，API（应用程序接口）是连接不同软件组件或系统之间的桥梁。对于前端开发者来说，JavaScript与WebAPI的结合使用尤为重要，它使得我们可以访问浏览器提供的各种功能和服务，从而构建出交互性更强、用户体验更好的网页应用。本文将介绍API的基本概念，重点探讨WebAPI及其在JavaScript中的应用。一、什么是API？API全称为“ApplicationProgrammi
鸿蒙开发：自定义一个Toast egzosn
前言代码案例基于Api13。系统的toast已经可以满足大部分的场景了，而且使用起来也是十分的简单，可以修改很多的可配置属性，简单的使用代码如下：登录后复制promptAction.showToast({message:"toast提示"})1.但是偏偏有一点实现不了，那就是圆角度数的设置，还有就是和icon结合使用的场景也无法满足，为了更好的适配UI的设计图，那么自定义一个Toast是在所难免的
小白零基础学数学建模系列-引言与课程目录川川菜鸟数学建模小白到精通系列数学建模
目录引言一、我们的专辑包含哪些内容？第一周：数学建模基础与工具第二周：高级数学建模技巧与应用第三周：机器学习基础与数据处理第四周：监督学习与无监督学习算法第五周：神经网络二、学完本专辑能收获到什么？三、适合什么样的人群学习？四、如何学习本专辑？课程目录第1周：数学建模基础与工具第1天：数学建模入门介绍第2天：数学建模工具介绍第3天：线性回归与曲线拟合第4天：线性规划第5天：动态规划第2周：高级数学
AWS WAF实战指南：从入门到精通 ivwdcwso 安全 aws 网络云计算 WAF 安全
1.引言AmazonWebServices(AWS)WebApplicationFirewall(WAF)是一款强大的网络安全工具，用于保护Web应用程序免受常见的Web漏洞攻击。本文将带您从入门到精通，深入探讨AWSWAF的实际应用策略，并提供具体案例，帮助您更好地保护您的Web应用程序。2.AWSWAF基础2.1什么是AWSWAF？AWSWAF是一种Web应用程序防火墙，可以帮助保护您的Web
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文

机器学习实战---线性回归（更好的使用正规方程求解）

回顾梯度下降和正规方程：https://www.cnblogs.com/ssyfj/p/12788147.html

一：正规方程解法（最小二乘法）

（一）加载数据

（二）使用正规方程求解参数向量

（三）载入数据，测试结果

二：局部加权避免欠拟合

补充：高斯分布https://www.cnblogs.com/ssyfj/p/12940077.html

（一）导入数据

（二）实现局部加权函数预测每个样本点的结果

（三） 测试函数

（四）绘制图像

（五）当k分别为1，0.01，0.003时的拟合结果

（六）预测鲍鱼年龄

误差计算

训练集中的拟合程度（误差查看）

测试集拟合程度（误差查看）

三：缩减系数法

同样lasso回归，也是L1正则化， 通过约束项依旧可以达到缩减系数的目的。所以说常用的缩减系数法包括岭回归和lasso回归两种方法.

四：岭回归

岭回归和LASSO回归（一）

岭回归和LASSO回归（二）

（一）数据导入

（二）岭回归算法实现

（三）测试不同lamda选取

（四）绘制lamda选取图像

建议使用交叉验证进行比较获取λ取值比较好

（五）总结

（六）补充岭回归和最小二乘法区别

五：lasso回归

Lasso回归和岭回归的同和异

Lasso回归和岭回归的同和异

六：实现前向逐步线性回归

（一）代码实现

（二）结论

你可能感兴趣的:(机器学习实战---线性回归（更好的使用正规方程求解）)

（三）测试函数

同样lasso回归，也是L1正则化，通过约束项依旧可以达到缩减系数的目的。所以说常用的缩减系数法包括岭回归和lasso回归两种方法.