Sherry_Yue

小白入门线性回归：原理+代码

参考了好多大佬的博客、知乎、视频，链接列在文章末尾。

一、什么是回归

与回归算法相对应的是分类算法，简而言之，回归就是预测一系列连续的值，分类就是预测一系列离散的值。

那么如何把机器学习中的回归算法应用于日常生活呢？以下用一个简单的例子来说明：
通过市场调查，我们得到一些房屋面积和价格的相关数据。我们想知道，如果给一个新的房屋面积，能否根据已知的数据来预测其对应价格是多少呢？如图：

为了解决这个问题，我们引入线性回归模型。

二、一元线性回归

首先，我们画出已知数据的散点图1：

其次，我们模拟出一条直线，让已知的数据点尽量落在直线上或直线周围。如散点图2：

最后，我们求出这条直线模型对应的函数公式，然后代入x=130，即可求得其预测价格f(x)。

而线性模型公式在这个例子中就是一条直线： $f(x_i)=wx_i+b$ 。其中，w为系数，b为截距。

我们现在知道，线性回归就是要找一条直线，并且让这条直线尽可能地拟合图中的数据点。

那么如何得到w和b从而构造这个公式呢？估计如果让1000个人来画这条线就会有1000种画法，比如说散点图3和散点图4：

所以，我们需要一个评判标准，来评判哪条直线才是最好的。
由此，我们引入损失函数来作为评判标准。

三、损失函数

接上面的散点图3 和散点图4 两种拟合情况。对于散点图3的拟合直线 $y = 0.7925 x + 15.353$ ，以及散点图4的拟合直线 $y = 1.2452 x - 25$ ，到底哪一条直线才最“合适”呢？
由此我们引入残差，说白了就是真实值和预测值间的差值（也可以理解为差距、距离）。即算一下实际房价和根据拟合直线的预测房价之间的差距（距离）就行了。
当把所有实际房价和预测房价的差距（距离）算出来然后做个加和，我们就能量化预测房价和实际房价之间的残差。

例如下图散点图5中有很多红色小竖线，每一条就是实际房价和预测房价的差距（距离）。

残差公式：
$e=y_i-f(x_i)$
其中，f(x)是预测房价，y是真实房价。

损失函数/残差平方和/均方误差（MSE）/欧氏距离之和：
$J(w,b)=\sum_{i=1}^{m}{(y_i-f(x_i))^2}=\sum_{i=1}^{m}{(y_i-wx_i-b)^2}$
其中，J是损失函数，m表示样本个数， $f(x_i)$ 是预测值， $y_i$ 是真实值。

总结，损失函数是衡量回归模型误差的函数，也就是我们要的“直线”的评价标准。
这个函数的值越小，说明直线越能拟合我们的数据。

好了，到这里，我们通过损失函数公式，结合散点图3参数 w=0.7925, b=15.353 ，和散点图4参数 w=1.2452, b=-25 。算得散点图3的损失函数J要小于散点图4的损失函数J。所以，可以说明，散点图3拟合的直线要比散点图4拟合的直线更“合适”。

但是，我们不应该止步于此，我们要找的不是两者之间的更优解，而应该是所有拟合直线中的最“合适”。
由此，我们引出最小二乘法。

四、最小二乘“参数估计”

在线性回归中，最小二乘法就是试图找到一条直线，使所有样本到直线上的欧式距离之和最小。

这套路，不就是已知函数 $J(w,b)=\sum_{i=1}^{m}{(y_i-f(x_i))^2}=\sum_{i=1}^{m}{(y_i-wx_i-b)^2}$ ，它有两个自变量w和b，我们要求解w和b，使得这个函数的值最小。求解w和b的过程，美名其曰线性回归模型的最小二乘“参数估计”。

其求解过程无非就是微积分中，将J(w,b)分别对w和b求导，然后令其导数为0，便可得到w和b的最优解。此处过程略去，得到：
$w=\frac{\sum_{i=1}^{m}{y_i(x_i-\bar{x})}}{\sum_{i=1}^{m}{x_i^2}-\frac{1}{m}(\sum_{i=1}^{m}{x_i})^2}$
$b=\frac{1}{m}\sum_{i=1}^{m}{(y_i-wx_i)}$
其中， $\bar{x}=\frac{1}{m}\sum_{i=1}^{m}{x_i}$ 为x的均值。

把这边解得的w和b代入预测公式 $f(x_i)=wx_i+b$ ，即成功得到最合适的一元线性回归模型了。

五、多元线性回归

敲醒，线性回归哪有那么简单。上面都是拿一元线性回归举的例子。可是我们生活中更常见的是多元问题。
就比如还拿那个房价预测举例，常识可知，房价怎么可能单单看房屋面积就决定，肯定还要考虑很多其他属性，如房间数量、楼间距、离学校距离等等等等。
所以现在依旧是m个样本做预测，但每个样本不止一个属性，而是由d个属性描述。由此，我们引入多元线性回归。

仿照一元线性回归公式 $f(x_i)=wx_i+b$ ，我们得到多元线性回归公式：
$f(x_i)=w_1x_{i1}+w_2x_{i2}+...+w_dx_{id}+b$
其中， $w_1\sim w_d$ 表示d个属性每个的参数（权重）； $x_{i1}\sim x_{id}$ 表示第i个样本，每个属性（d个）的取值，i的范围为1到m。

我们把它改写成更高大上的向量形式：
$f(x_i)=w^Tx_i+b$
其中， $w=\begin{bmatrix}w_1\\w_2\\\vdots\\w_d\end{bmatrix}$ ， $w^T=\begin{bmatrix}w_1 & w_2 &\cdots & w_d\end{bmatrix}$ ， $x_i=\begin{bmatrix}x_{i1}\\x_{i2}\\\vdots\\x_{id}\end{bmatrix}$

六、多元线性回归损失函数

同理，仿照一元线性回归的损失函数 $J(w,b)=\sum_{i=1}^{m}{(y_i-f(x_i))^2}=\sum_{i=1}^{m}{(y_i-wx_i-b)^2}$ ，我们得到多元线性回归的损失函数（向量表示）：
$J(\widehat{w})=(y-X\widehat{w})^T(y-X\widehat{w})$
下面来解释这个公式：
已知： $w=\begin{bmatrix}w_1\\w_2\\\vdots\\w_d\end{bmatrix}$ ， $w^T=\begin{bmatrix}w_1 & w_2 &\cdots & w_d\end{bmatrix}$ ， $x_i=\begin{bmatrix}x_{i1}\\x_{i2}\\\vdots\\x_{id}\end{bmatrix}$ 。
其中 $\widehat{w}$ ：把w和b吸入向量形式 $\widehat{w}=\begin{bmatrix}w\\b\end{bmatrix}=\begin{bmatrix}w_1\\w_2\\\vdots\\w_d\\b\end{bmatrix}$ 。
其中 $X$ ：把数据集表示为一个 $m\times(d+1)$ 大小的矩阵 $X$ ，其中每行对应一个样本，该行前d个元素对应于样本的d个属性值，最后一个元素恒置为1。
$X=\begin{bmatrix}x_{11} & x_{12} & \cdots & x_{1d} & 1 \\x_{21} & x_{22} & \cdots & x_{2d} & 1\\ \vdots & \vdots & \ddots & \vdots & \vdots\\x_{m1} & x_{m2} & \cdots & x_{md} & 1\end{bmatrix}=\begin{bmatrix}x_1^T & 1\\x_2^T & 1\\ \vdots & \vdots \\x_m^T & 1\end{bmatrix}$
其中 $y$ ： $y=\begin{bmatrix}y_1\\y_2\\\vdots\\y_m\end{bmatrix}$ 。
所以，
$\begin{aligned}y-X\widehat{w}&=\begin{bmatrix}y_1\\y_2\\\vdots\\y_m\end{bmatrix}-\begin{bmatrix}x_{11} & x_{12} & \cdots & x_{1d} & 1 \\x_{21} & x_{22} & \cdots & x_{2d} & 1\\ \vdots & \vdots & \ddots & \vdots & \vdots\\x_{m1} & x_{m2} & \cdots & x_{md} & 1\end{bmatrix}\begin{bmatrix}w_1\\w_2\\\vdots\\w_d\\b\end{bmatrix} \\&=\begin{bmatrix}y_1-w_1x_{11}-w_2x_{12}-w_dx_{1d}-b\\ y_2-w_1x_{21}-w_2x_{22}-w_dx_{2d}-b\\\vdots\\y_m-w_1x_{m1}-w_2x_{m2}-w_dx_{md}-b\end{bmatrix} \\&=\begin{bmatrix}y_1-\sum_{i=1}^{d}{w_ix_{1i}}-b\\y_2-\sum_{i=1}^{d}{w_ix_{2i}}-b\\\vdots\\y_m-\sum_{i=1}^{d}{w_ix_{mi}}-b\end{bmatrix}_{m\times{1}}\end{aligned}$
所以 $y-X\widehat{w}$ 的平方在矩阵中即为 $(y-X\widehat{w})^T(y-X\widehat{w})$ ，即得到损失函数/欧氏距离之和： $J(\widehat{w})=(y-X\widehat{w})^T(y-X\widehat{w})$ 。

七、多元线性回归最小二乘法

用损失函数 $J(\widehat{w})=(y-X\widehat{w})^T(y-X\widehat{w})$ 对 $\widehat{w}$ 求导，并等于0。
这次的解方程并没有像一元线性回归那么简单，我们需要分情况讨论：

第一种情况：当 $X^TX$ 为满秩矩阵或正定矩阵时
得到 $\widehat{w}$ 的最优解： $\widehat{w}=(X^TX)^{-1}X^Ty$
其中， $X^TX)^{-1}$ 是 $X^TX)$ 的逆矩阵。
令 $\widehat{x_i}=\begin{bmatrix}x_i\\1\end{bmatrix}$ ，得到最终学得的最合适的多元线性回归模型为 $f(\widehat{x_i})=\widehat{x_i}^T(X^TX)^{-1}X^Ty$ 。

第二种情况：当 $X^TX$ 不为满秩矩阵时
现实任务中我们会遇到大量变量（对应大量待算属性，大量未知的w），其数目甚至超过了样本数目，导致 $X$ 的列数多于行数， $X^TX$ 显然不满秩。
此时可以解出多个 $\widehat{w}$ ，它们都能使均方误差最小化。到底选择哪一个解作为输出呢？将由学习算法的归纳偏好决定，常见的做法是引入正则化项（说白了就是损失函数公式最后加一个 $\lambda$ 项，不详细展开了）。

八、对数线性回归模型

以上部分介绍了一元线性回归模型和多元线性回归模型。
我们现在把模型公式来做个总结，把线性回归模型简写为： $y=w^Tx+b$ 。
其通过训练样本得出最优的w和b，从而对给定的新的样本x进行值y的预测，其实际上是在试图让模型预测值 $w^Tx+b$ 不断逼近真实值 $y$ 。

那我们是否可令模型预测值 $w^Tx+b$ 不断逼近真实值 $y$ 的“衍生物”呢？比如说，现在真实值 $y$ 扩大为指数族中的任一分布。
那就可将预测值的对数作为线性模型逼近的目标，这样得到的模型称为“对数线性回归”： $ln\space y=w^Tx+b$ 。它实际上是在试图让模型预测值 $e^{w^Tx+b}$ 不断逼近真实值 $y$ 。
它形式上仍是线性回归，但实质上已是在求取输入空间到输出空间的非线性函数映射。这里的对数起到了将线性回归模型的预测值与真实标记联系起来的作用。

九、广义线性模型

我们可以变换上面的“对数线性回归”公式为 $y=e^{w^Tx+b}$ 。
但若真实值 y 不为指数族中的分布，而变为更一般的分布呢？
这样得到的模型，我们称为“广义线性模型”： $y=g^{-1}(w^Tx+b)$ 。
其中，函数 $g(\cdot)$ 称为“联系函数”，其单调可微。
很显然，对数线性回归是广义线性模型在 $g(\cdot)=ln(\cdot)$ 时的特例。

十、pytorch实现一元线性回归

1. 网络结构

继承pytorch提供的nn.Module()类。通过把nn.Linear()绑定到类实例属性，以及实现forward()方法实现前向传播：

class LinearRegression(torch.nn.Module):
    """
    Linear Regressoin Module, the input features and output 
    features are defaults both 1
    """
    def __init__(self):
        super().__init__()
        self.linear = torch.nn.Linear(1,1)
        
    def forward(self,x):
        out = self.linear(x)
        return out

2. 优化算法选择SGD优化

self.optimizer = torch.optim.SGD(self.model.parameters(), lr=self.learning_rate)

3. 损失函数选择为MSE

self.loss_function = torch.nn.MSELoss()

4. 构建数据

构建一个类似于线性函数的数据集，即y=kx+b，并且添加一个扰动噪声：

import torch 
import matplotlib.pyplot as plt

def create_linear_data(nums_data, if_plot=False):
    """
    Create data for linear model
    Args:
        nums_data: how many data points that wanted
    Returns:
        x with shape (nums_data, 1)
    """
    x = torch.linspace(0, 1, nums_data)
    x = torch.unsqueeze(x, dim=1)
    k = 2
    y = k * x + torch.rand(x.size())

    if if_plot:
        plt.scatter(x.numpy(), y.numpy(), c='b')
        plt.show()
    data = {"x": x, "y": y}
    return data

训练测试集（100个样本）

测试数据集（20个样本）

5. 网络训练

训练网络的顺序为：读取数据—数据送入网络—得到网络输出—用输出与标签计算损失—最小化损失—更新梯度。
下列代码在训练网络过程中，同时动态绘出了每隔500个epoch的线性模型函数拟合情况：

def train(self, data, model_save_path="model.pth"):
    """
    Train the model and save the parameters
    Args:
        model_save_path: saved name of model
        data: (x, y) = data, and y = kx + b
    Returns:
        None
    """
    x = data["x"]
    y = data["y"]

    fig = plt.figure(figsize=(10, 10))
    current_fig = 0

    for epoch in range(self.epoches):
        prediction = self.model(x)
        loss = self.loss_function(prediction, y)

        self.optimizer.zero_grad()
        loss.backward()
        self.optimizer.step()

        if epoch % 500 == 0:
            print("epoch: {}, loss is: {}".format(epoch, loss.item()))
            current_fig += 1
            plt.subplot(4, 5, current_fig)
            plt.scatter(x.numpy(), y.numpy(), c='b')
            plt.plot(x.numpy(), prediction.detach().numpy(), color="r")

    plt.show()
    torch.save(self.model.state_dict(), "linear.pth")

代码最后一行torch.save()保存了模型的参数，用于测试阶段使用。
训练逐渐拟合线性回归函数的过程：

训练拟合过程

6. 模型测试

模型测试阶段需要读取训练阶段保存的参数，并重新赋值给网络：

def test(self, data, model_path="linear.pth"):
    """
    Reload and test the model, plot the prediction
    Args:
        model_path: the model's path and name
        data: (x, y) = data, and y = kx + b
    Returns:
        None
    """
    x = data["x"]
    y = data["y"]
    self.model.load_state_dict(torch.load(model_path))
    prediction = self.model(x)
    loss = self.loss_function(prediction, y)
    print("loss of test is: {}".format(loss.item()))

    plt.scatter(x.numpy(), y.numpy(), c='b', marker='x')
    plt.plot(x.numpy(), prediction.detach().numpy(), color="r")
    plt.show()

测试结果
并且得到损失值如下：

7. 完整代码

import torch
import matplotlib.pyplot as plt


def create_linear_data(nums_data, if_plot=False):
    """
    Create data for linear model
    Args:
        nums_data: how many data points that wanted
    Returns:
        x with shape (nums_data, 1)
    """
    x = torch.linspace(0, 1, nums_data)
    x = torch.unsqueeze(x, dim=1)
    k = 2
    y = k * x + torch.rand(x.size())

    if if_plot:
        plt.scatter(x.numpy(), y.numpy(), c='b')
        plt.show()
    data = {"x": x, "y": y}
    return data


class LinearRegression(torch.nn.Module):
    """
    Linear Regressoin Module, the input features and output
    features are defaults both 1
    """

    def __init__(self):
        super().__init__()
        self.linear = torch.nn.Linear(1, 1)

    def forward(self, x):
        out = self.linear(x)
        return out


class Linear_Model():
    def __init__(self):
        """
        Initialize the Linear Model
        """
        self.learning_rate = 0.001
        self.epoches = 10000
        self.loss_function = torch.nn.MSELoss()
        self.create_model()

    def create_model(self):
        self.model = LinearRegression()
        self.optimizer = torch.optim.SGD(self.model.parameters(), lr=self.learning_rate)

    def train(self, data, model_save_path="model.pth"):
        """
        Train the model and save the parameters
        Args:
            model_save_path: saved name of model
            data: (x, y) = data, and y = kx + b
        Returns:
            None
        """
        x = data["x"]
        y = data["y"]

        fig = plt.figure(figsize=(10, 10))
        current_fig = 0

        for epoch in range(self.epoches):
            prediction = self.model(x)
            loss = self.loss_function(prediction, y)

            self.optimizer.zero_grad()
            loss.backward()
            self.optimizer.step()

            if epoch % 500 == 0:
                print("epoch: {}, loss is: {}".format(epoch, loss.item()))
                current_fig += 1
                plt.subplot(4, 5, current_fig)
                plt.scatter(x.numpy(), y.numpy(), c='b')
                plt.plot(x.numpy(), prediction.detach().numpy(), color="r")

        plt.show()
        torch.save(self.model.state_dict(), "linear.pth")

    def test(self, data, model_path="linear.pth"):
        """
        Reload and test the model, plot the prediction
        Args:
            model_path: the model's path and name
            data: (x, y) = data, and y = kx + b
        Returns:
            None
        """
        x = data["x"]
        y = data["y"]
        self.model.load_state_dict(torch.load(model_path))
        prediction = self.model(x)
        loss = self.loss_function(prediction, y)
        print("loss of test is: {}".format(loss.item()))

        plt.scatter(x.numpy(), y.numpy(), c='b', marker='x')
        plt.plot(x.numpy(), prediction.detach().numpy(), color="r")
        plt.show()


if __name__ == '__main__':
    linear = Linear_Model()
    data_train = create_linear_data(100, True)
    linear.train(data_train)
    data = create_linear_data(20, True)
    linear.test(data)

十一、sklearn实现多元线性回归

案例：波士顿房价预测
网上关于个这个的资料和代码实在是太多了，这边列出几个网址，这篇文章里就不详细讲了，套路都是一样的。

【机器学习】线性回归sklearn实现 - AI_developer - 博客园
https://blog.csdn.net/qq_28827635/article/details/84481414
https://my.oschina.net/u/2245781/blog/1855834
https://github.com/TalkEveryX/Linear_Model/blob/master/boston_housing.py

十二、参考资料

https://blog.csdn.net/alw_123/article/details/82193535
https://blog.csdn.net/alw_123/article/details/82825785
化简可得：用人话讲明白线性回归LinearRegression
人人都会机器学习：线性回归模型原理及推导
王伟同学：线性回归：这可能是机器学习中最简单的一个模型了
线性回归（Linear Regression）
https://blog.csdn.net/pxhdky/article/details/82388964
周志华《机器学习》
机器学习入坑者：线性回归模型与pytorch实现
https://zhuanlan.zhihu.com/p/59401172

Promise入门 m0dw javascript 前端开发语言
文章目录为什么使用PromisePromise介绍为什么使用Promise在ES5中使用回调函数来处理异步任务，当多个异步任务有依赖关系时(如下定时器的层层嵌套)，就需要回调函数互相嵌套，当嵌套结构多了后，就出现了回调地狱的问题，难以维护setTimeout(function(){console.log('a1');setTimeout(function(){console.log('a2');s
存档python爬虫、Web学习资料
1python爬虫学习学习Python爬虫是个不错的选择，它能够帮你高效地获取网络数据。下面为你提供系统化的学习路径和建议：1.打好基础首先要掌握Python基础知识，这是学习爬虫的前提。比如：变量、数据类型、条件语句、循环等基础语法。列表、字典等常用数据结构的操作。函数、模块和包的使用方法。文件读写操作。推荐通过阅读《Python编程：从入门到实践》这本书或者在Codecademy、LeetCo
Python爬虫入门到实战（3）-对网页进行操作荼蘼爬虫
一.获取和操作网页元素1.获取网页中的指定元素tag_name()方法：获取元素名称。text()方法：获取元素文本内容。click()方法():点击此元素。submit()方法():提交表单。send_keys()方法：模拟输入信息。size()方法:获取元素的尺寸可进入selenium库文件夹下的webdriver\remote\webelement.py中查看更多的操作方法,2.在元素中输入
语音识别开源项目推荐：GitHub热门仓库盘点 AGI大模型与大数据研究院 AI大模型应用开发实战语音识别开源 github ai
2024年必看！GitHub热门语音识别开源项目全解析：从入门到实战关键词语音识别(ASR)、开源项目、GitHub、Whisper、FunASR、PaddleSpeech、深度学习摘要想象一下：开车时只需说一句话就能自动发消息，听英文演讲时实时获得中文翻译，给视障人士读文本时精准转换——这些场景的背后，语音识别（AutomaticSpeechRecognition,ASR）技术正在改变我们与机器
MySQL入门学习-查询优化.EXPLAIN
在MySQL中，'EXPLAIN'命令用于获取查询执行计划的信息。一、关于'EXPLAIN'的一些常见查询优化方面的特点、使用方法、与其他比较及高级应用：1.特点：-提供查询执行计划的详细信息，帮助了解查询的执行方式。-可以用于优化查询性能，找出潜在的性能问题。-适用于各种类型的查询，包括简单查询和复杂查询。2.使用方法：-在查询语句前添加'EXPLAIN'关键字，例如：'EXPLAINSELEC
靠声音赚钱的六大方式，靠声音赚钱配音就业圈
在当今这个数字化与多媒体蓬勃发展的时代，声音作为一种独特而强大的媒介，正以前所未有的方式创造价值与财富。配音兼职接单推荐公众号，配音新手圈，声优配音圈，新配音兼职圈，配音就业圈，鼎音副业，有声新手圈，每天更新各种的配音任务，新手小白也可以接单。1、配音新手圈这是一个公众号配音新手圈里面每天更新配音任务(只要有手机就可以接单，对经验无要求)，都是适合没有基础的人去做的，每天都会发布新任务。适合新入门
分布式文件存储（GlusterFS）入门指南，有一定难度！！ ubuntu 努力一点948 分布式gluster 分布式 ubuntu linux 服务器运维人工智能 gpu算力
以下有免费的4090云主机提供ubuntu22.04系统的其他入门实践操作地址：星宇科技|GPU服务器高性能云主机云服务器-登录相关兑换码星宇社区---4090算力卡免费体验、共享开发社区-CSDN博客兑换码要是过期了，可以私信我获取最新兑换码！！！之所以推荐给大家使用，是因为上面的云主机目前是免费使用的，不需要大家再去安装虚拟机，部署虚拟机，环境都搭配好了，非常适合新手入门，减少搭建的时间，把时
【狂神说JAVA】JVM快速入门-1 Jackson Cortex jvm java
链接http://player.bilibili.com/player.html?aid=76728711&bvid=BV1iJ411d7jS&cid=131232435&page=1http://player.bilibili.com/player.html?aid=76728711&bvid=BV1iJ411d7jS&cid=131232435&page=1内容一、探究JVM0、面试题谈谈对J
Android UI 组件系列（五）：CheckBox、RadioButton 与 Switch 控件详解
博客专栏：Android初级入门UI组件与布局源码：通过网盘分享的文件：Android入门布局及UI相关案例链接:https://pan.baidu.com/s/1EOuDUKJndMISolieFSvXXg?pwd=4k9n提取码:4k9n引言在Android开发中，用户与应用的交互往往离不开各种“选择”操作，例如：注册表单中选择兴趣爱好（可多选）设置界面中切换通知、Wi-Fi开关（开/关状态）
PyCharm高效入门指南：从零开始掌握Python开发利器软考和人工智能学堂 Python开发经验强化学习 PyCharm
引言PyCharm是JetBrains公司推出的一款强大的Python集成开发环境(IDE)，被全球数百万Python开发者所青睐。无论你是Python初学者还是经验丰富的开发者，掌握PyCharm都能显著提升你的开发效率。本文将带你从零开始，全面了解PyCharm的核心功能和使用技巧。1.PyCharm的安装与配置1.1下载与安装首先访问JetBrains官网下载PyCharm。PyCharm有
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama（一）开源技术探险家开源模型-实际应用落地 #深度学习自然语言处理语言模型
一、前言在AI大模型百花齐放的时代，很多人都对新兴技术充满了热情，都想尝试一下。然而，实际上要入门AI技术的门槛非常高。除了需要高端设备，还需要面临复杂的部署和安装过程，这让很多人望而却步。在这样的背景下，Ollama的出现为广大开发者和爱好者提供了一条便捷的道路，极大地降低了应用机器学习的门槛。Ollama的优势在于其极致的简化。通过这个平台，用户可以轻松下载、运行和管理各种机器学习模型，而无需
王阳明心外无物，是一种先后观，不是主客观2022-05-08 仁也
王阳明心外无物，是一种先后观，不是主客观王阳明说的心外无物，不是在所谓的主客观层面上说的，不是说心之外就没有客观世界存在，如果你从主客观的层面来解读心学，其实是走偏了。【原文】爱问：“‘知止而后有定’，朱子以为‘事事物物皆有定理’，似与先生之说相戾。”【仁也详解】徐爱问：“知止而后有定”，朱熹认为是事事物物都有定理的意思，这个好像和先生的说法相悖？徐爱这里问的，还是“四书”中的入门书《大学》里面的
面试实战，问题一，讲一下Springboot的作用
SpringBoot框架的主要作用和功能SpringBoot是由Pivotal团队开发的一个开源Java框架，旨在显著简化基于Spring框架的应用程序开发过程。它通过提供一系列自动化工具和约定，帮助开发者快速构建独立、生产就绪的应用程序。下面我将逐步介绍其主要作用和核心功能，确保回答清晰易懂。主要作用简化Spring应用程序开发：SpringBoot的核心目标是降低Spring框架的入门门槛和配
李航老师-统计学习小三爷_df1b
三个准则1.作为入门选手，不要每章都看2.不要从零造轮子去实现算法，太浪费时间3.必须能手推公式章节目录##统计学习概论-统计学习的目的是对数据进行==预测与分析==-统计学习的前提是同类数据具有一定的统计规律性-统计学习的方法-监督学习(supervisedlearning)-非监督学习(unsupervisedlearning)-半监督学习(semi-supervisedlearning)-强
快速入门Robocorp：用Python构建和操作工作流 jaioyfpo python 开发语言
快速入门Robocorp：用Python构建和操作工作流引言在现代开发环境中，自动化是提高效率和降低成本的关键。Robocorp作为一个强大的平台，它帮助您使用Python构建和操作工作流，无论在何地运行都可以保持无缝连接和高扩展性。本文将带领您快速入门Robocorp的基本安装和设置，并展示如何使用ActionServer进行项目的创建和管理。主要内容1.安装和设置要开始使用Robocorp，首
Selenium+Java 自动化测试入门到实践：从环境搭建到元素操作 yy鹈鹕灌顶 selenium java 测试工具
在自动化测试领域，Selenium凭借其强大的跨浏览器兼容性和灵活的API，成为Web应用测试的首选工具。而Java作为一门稳定且广泛应用的编程语言，与Selenium结合能构建出高效、可维护的自动化测试框架。本文将从环境搭建开始，逐步介绍Selenium+Java的核心用法，帮助新手快速上手。一、环境搭建：让工具跑起来1.安装Java开发环境Selenium的Java客户端需要依赖JDK，建议安
Shell脚本编程：从入门到精通的实战指南 Monkey的自我迭代 Linux linux ssh
一、Shell与Shell脚本概述Shell是用户与操作系统内核之间的命令解释器，它接收用户输入的命令并转换为系统调用，是Unix/Linux系统的核心交互界面。Shell脚本(ShellScript)则是将一系列Shell命令组织成文本文件，通过解释器批量执行的自动化工具，广泛应用于系统管理、日志分析和软件部署等领域。主流Shell类型：Bash(Bourne-AgainShell)：Linux
第二阶段-第二章—8天Python从入门到精通【itheima】-133节（SQL——DQL——基础查询） Patrick_kafka sql python 数据库开发语言学习 android 程序人生
目录133节——DQL：基础查询1.学习目标2.基础数据查询：select3.进行过滤的基础数据查询：where4.代码演练5.小节总结6.关于MySQL和SQL的DDL、DML、DCL、DQL的最底层逻辑MySQL与SQL的底层逻辑：从磁盘到内存的数据流解析一、DDL（数据定义语言）：构建数据大厦的蓝图二、DML（数据操作语言）：数据流动的三重关卡三、DCL（数据控制语言）：权限的多维管控四、D
第二阶段-第二章—8天Python从入门到精通【itheima】-134节（SQL——DQL——分组聚合） Patrick_kafka sql 数据库 mysql 大数据开发语言 python pycharm
目录134节——DQL：分组聚合1.学习目标2.分组聚合3.论MySQL中GROUPBY和WHERE的异同MySQL中GROUPBY和WHERE的异同：一、相同点：都是“筛数据”的工具二、不同点：筛的时机和对象完全不一样1.作用时机不同：先筛行，再分组2.作用对象不同：筛单行vs筛分组3.不能混搭的“规矩”三、一句话总结4.小节总结编辑好了，又一篇博客和代码写完了，励志一下吧，下一小节等等继续：1
新年逼自己一把，学会使用DeepSeek R1：从「翻车」到「封神」实战无数碎片寻妳杂谈人工智能
DeepSeekR1的发布就像是一颗闪亮的星星，瞬间照亮了整个AI领域。它不仅颠覆了我们对传统指令模型的认知，更带来了全新的推理能力，让我们在日常工作、学习中都能高效利用AI。然而，要想完全发挥R1的潜力，你必须掌握一些使用技巧，避免那些让AI“翻车”的错误。接下来，我们将通过一些经典案例和实用技巧，帮助你从入门到精通，让DeepSeekR1成为你工作中的得力助手。1.DeepSeekR1模型的独
数据结构--双向链表专题：从入门到进阶想成为高手499 C++数据结构链表
双向链表可以说是链表家族中非常重要的一员，它不仅具备单链表的一些优点，还解决了单链表在节点删除和插入时存在的部分效率问题。本文将从双向链表的结构、实现及其与顺序表的比较等多个方面深入讲解双向链表，并提供相应的代码示例。一、双向链表的结构双向链表是相对于单链表的另一种链表结构，区别在于每个节点除了包含指向下一个节点的指针，还包含指向前一个节点的指针。因此，双向链表支持双向遍历，不论从头到尾还是从尾到
Python 线程优先队列 PriorityQueue - Python零基础入门教程猿说编程
目录一.Python线程队列Queue分类二.Python线程优先队列PriorityQueue简介三.Python线程优先队列PriorityQueue函数介绍四.Python线程优先队列PriorityQueue使用五.猜你喜欢零基础Python学习路线推荐:Python学习目录>>Python基础入门在线程队列Queue/线程队列LifoQueue文章中分别介绍了先进先出队列Queue和先进
JavaScript 基础语法与核心概念实战：从变量到定时器 Elieal javascript 开发语言 ecmascript
JavaScript作为前端开发的核心语言，其基础语法和数据类型是入门的关键。本文将通过实际代码示例，详解JavaScript的变量、数据类型、复合类型及常用交互功能，帮助初学者快速掌握核心概念。一、变量与基本数据类型变量是存储数据的容器，JavaScript中通过var（ES5）、let/const（ES6）声明。基本数据类型是构建复杂程序的基础，包括以下5种：//基本数据类型示例vara=10
Kubernetes存储入门付出不多 kubernetes 容器云原生
目录一，Kubernetes存储概念1，volume的概念2，volume的类型二，配置volume存储1，通过emprydir共享数据2，使用hostpath挂载宿主机文件3，使用nfs挂载至容器三，配置pv持久卷1，pv回收策略2，pv访问策略3，pv的配置方式4，PersistentVolumeclaim(Pvc，持久卷声明)5，创建基于hostpath的pv6，创建基于nfs的pv一，Ku
数据结构入门：像整理收纳一样简单！今天你睡了嘛数据结构数据结构
在我们生活中，经常会面对这样的问题：“我要怎么整理我的衣柜？”“电脑里照片太多了，怎么归类才方便查找？”其实，程序员也有类似的烦恼。他们不整理衣柜，而是“整理数据”。而这门关于如何“收纳”和“使用”数据的学问，就叫做数据结构。一、数据结构的基本概念1、数据数据是信息的载体，是数字、字符以及所有能输入到计算机中并被计算机程序识别和处理的符号的集合。数据是计算机程序加工的原料。2、数据元素数据元素是数
从入门到精通，拼多多返利软件完全指南日常购物技巧呀
很多人认为省钱就意味着要降低生活品质，但高省APP却用实际行动证明了这一观点的错误。它汇聚了众多优质商家和商品，通过严格的筛选机制确保每一件商品都符合高品质的要求。同时，它还提供了丰富的返利和优惠活动，让消费者在享受品质生活的同时也能节省开支。高省APP，你的品质生活保障者，让你的每一分钱都花得物超所值。在探索省钱之道的旅途中，不得不提的另一宝藏——高省APP高省APP：省钱赚钱两不误的电商新宠高
7.机器学习-十大算法之一拉索回归（Lasso）算法原理讲解以山河作礼。 #机器学习算法机器学习算法回归
7.机器学习-十大算法之一拉索回归（Lasso）算法原理讲解一·摘要二·个人简介三·前言四·原理讲解五·算法流程六·代码实现6.1坐标下降法6.2最小角回归法七·第三方库实现7.1scikit-learn实现（坐标下降法）：7.2scikit-learn实现（最小角回归法）：一·摘要拉索回归（LassoRegression）是一种线性回归的正则化形式，它通过引入L1范数惩罚项来实现模型的稀疏性，从
机器学习算法之回归算法福葫芦机器学习回归算法
一、回归算法思维导图二、算法概念、原理、应用场景和实例代码1、线性回归1.1、概念‌‌线性回归算法是一种统计分析方法，用于确定两种或两种以上变量之间的定量关系。‌线性回归算法通过建立线性方程来预测因变量（y）和一个或多个自变量（x）之间的关系。其基本形式为y=wx+e，其中w是权重，x是自变量，e是误差项。1.2、算法原理线性回归算法的核心在于找到最佳的拟合直线，使得预测值与实际值之间的误差最小。
【教程4＞第9章＞第8节】通过FPGA实现RGB图像转换为CMYK图像——verilog实现与MATLAB辅助验证 fpga和matlab #fpga开发 CMYK RGB 教程4 verilog
本课程学习成果预览(FPGA测试结果通过MATLAB显示)目录1.软件版本2.通过FPGA实现RGB图像转CMYK3.RGB图像转CMYK的测试3.1步骤一：生成测试样本3.2步骤二：通过testbench调用X2.bmp3.3步骤三：vivado仿真3.4步骤四：MATLAB辅助验证4.视频操作步骤演示欢迎订阅FPGA/MATLAB/Simulink系列教程《★教程1:matlab入门100例》
站外SEO入门：三分钟掌握核心概念与基础操作 SEO_juper SEO Google 数字营销 seo 谷歌数字营销谷歌seo seo优化
站外SEO是您在网站之外所做的一切，以帮助它在SERP中排名更高。站内SEO侧重于内容、网站结构和技术改进，而站外SEO着眼于从外部建立信誉。有很多方法可以到达那里，从建立链接到社交媒体，再到获得那些令人垂涎的品牌提及。站外SEO对你意味着什么？通过站外SEO，您可以尝试为自己或您的企业获得信任和信誉。这个策略的很大一部分涉及链接建设，这涉及让其他网站链接回你的网站。这样做可以向搜索引擎表明您的内
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟