Francis_chang

学习笔记之高斯过程回归（含代码）：连续无限空间上建模的超级武器

在这个万物皆可“Machine Learning”的时代，各个研究领域都想和“ML”沾点边,好像论文里有了“…with machine learning”、“learning based…”便能立即高大上起来。不过确实很多传统领域的问题都被大佬们解决的差不多了，为了毕业，我也不能免俗，也想在研究中结合一点机器学习的东西。

机器学习只是一个宏观的概念，下面还包含很多种不同的方法需要根据各自的研究情况具体确定。我这里用到的是一个相对小众的算法，相比于神经网络、KNN、朴素贝叶斯、SVM等都不那么出名，不过它的能力却是非常巨大的。它就是高斯过程（Gaussian processes）。有感于介绍高斯过程回归的文章写得不够明晰，看完还是一头雾水，亦或是没有结合代码，算法理解始终流于纸面。因此接下来我会用最通俗易懂的方式讲解并配以详细的代码解释，同时知道想学习高斯过程的小伙伴光看我这一篇文章是不够的，因此文中送出多重“福（链）利（接）”，都是我在学习过程中觉得相当不错的文章。

图片转载自https://yugeten.github.io/posts/2019/09/GP/

一、深入高斯过程回归之前你需要了解的一些名词

1.什么叫“回归”（regression）

首先我们从命名开始认识一个事物。我们先来说回归，学过一点机器学习的都知道有监督学习的两大任务就是分类（classification）和回归（regression）。用一句话来简单概括回归就是：回归就是找到一个函数来尽可能表示一组数据输入与输出之间的关系。对于线性模型，常用 $Y=X^Tw$ 来描述其输入输出关系。回归就是通过这一等式把输出 $Y$ 与实际观测值进行比较，并用其结果不断地更新权重矩阵 $w$ 以求输出最大限度的接近实际值。

2.什么叫“高斯过程”（Gaussian Process）

A Gaussian process is a probability distribution over possible functions that fit a set of points.

如果有人突然问你什么叫高斯过程，回他这句话就好了。详细一点的说明便是对于一组给定的数据点，或许存在无限多个函数可以用来拟合，高斯过程就是给每个函数（权重）分配一个概率值，这个概率分布的均值便代表了这个数据最有可能的表征，同时它通过置信区间将不确定性也表示出来。

通过图能看得更清晰一点。红色的点是给定的，但连接他们的线（函数）并不只有这一根，其中深蓝色的代表可能性最高的一条，淡蓝色的部分代表在这一区域内有无数条线段的组成可能，并且所有这些线（函数）的分布服从高斯分布。

有人或许会问，为什么不放书本里的定义？好，我把原文中的定义放在下面。

A Gaussian process is a collection of random variables, any finite number of which have a joint Gaussian distribution.

你品，你细品，对于初识高斯过程的人这句话读完可能是一脸懵逼，脑海中什么都没留下，完全不如“一群函数的概率分布服从高斯分布”来的简洁明了。但是定义毕竟是定义，这么写自然有他的道理，我们接下来就详细解释为什么高斯过程这么定义。

OK, 到目前为止我们弄清楚了“高斯过程”+“回归”。而高斯过程回归便是GP（高斯过程缩写GP，下同）在回归问题上的应用，当然也可以用于分类问题，不过这就不在本文讨论的范畴了，有兴趣的同学建议阅读"Gaussian Processes for Machine Learning"。

二、一切的一切还得从贝叶斯推论讲起

1. 贝叶斯线性回归

相信学习机器学习的小伙伴一定会有感而发，这个贝叶斯就是概率论和统计学的祖宗，到哪都离不开它。的确，今天的故事也因他而起。

首先我们回到前面讲的输入输出模型，我们将其表示为 $Y=X^Tw$ 。一般来说，估计值总是会与实际值有一定的差别，我们将这个差别表示成 $\varepsilon$ ，于是系统模型就变为 $Y=X^Tw+\varepsilon$ 。这是一个可加性的噪声（additive noise），同时我们假设其服从正态分布(至于为什么能这么假设，只能说大自然就是这么神奇，很多东西都服从正态分布)：
$\varepsilon \sim N(0, \sigma_n^2)$ 知道了噪声的概率分布，又有这个系统模型，于是我们就得到了“似然”（likelihood）。似然就是在给定参数的条件下的观察值所服从的概率分布或满足的概率密度函数，记为 $P (y ∣ X, w)$ ，由于这些数据集都是独立的，因此 $P(y|X,w)=\prod_{i=1}^n P(y_i|x_i,w)=\prod_{i=1}^n \frac{1}{\sqrt{2\pi}\sigma_n}exp(-\frac{(y_i-x_i^Tw)^2}{2 \sigma_n^2})$
和正态分布的形式一对照便知， $P (y ∣ X, w)$ 也服从正态分布。其实这很好理解，相当于一个常数 $X^Tw$ 加上了一个服从均值为0，方差为 $\sigma_n^2$ 的高斯分布的随机变量，结果显然还是高斯分布： $\sim N(X^Tw, \sigma_n^2I)$

到这里都还没和贝叶斯推论产生关系，别急，接下来就是重头戏。贝叶斯推论就是后验正比于似然乘先验，既然似然我们已经求得，接下来就是先验了。于是我们再次假设权重w的概率分布也服从高斯分布： $\sim N(0, \Sigma_p)$
根据贝叶斯公式： $p(w|y,X)=\frac{p(y|X,w)p(w)}{p(y|X)}$
可得 $p(w|y,X)\propto exp(-\frac{1}{2 \sigma_n^2}(y-X^Tw)^T(y-X^Tw))exp(-\frac{1}{2}w^T\Sigma_p^{-1}w)$
经过一番有些繁杂的变化后，得出后验分布 $\sim N(\frac{1}{\sigma_n^2}A^{-1}Xy, A^{-1})$ 其中 $\sigma_n^{-2}XX^T+\Sigma_p^{-1}$ 。
至此我们得出了权重矩阵的概率分布，那这有什么用呢？好问题！还记得我们之前讲过高斯过程的定义吗，就是一系列权重矩阵（函数）服从高斯分布，那现在不就得到了这个结论嘛，当然还有些后续步骤还没完。但我们已经可以通过这个后验概率来预测其他未知数组 $x_*$ 了， $f_*=x_*^Tw$
$f_* \sim N(\frac{1}{\sigma_n^2}x_*^TA^{-1}Xy, x_*^TA^{-1}x_*)$
很显然这也是一个高斯分布，因为是后验乘一个常数，通过这层关系我们就完成了一次回归任务。

2.核函数的诞生

到这里高斯过程回归就结束了吗？并没有，因为之前处理的数据还都只是低维的，我们需要将其映射至高维空间甚至无限维空间中。这是因为很多时候低维的数据并不能表现出数据之间的一些特征关系，而高维数据往往要有价值的多。我们把这个映射过程记为 $\phi(x):\mathbb{R}^D\rightarrow \mathbb{R}^N$ 。于是上面的线性系统模型就改写为 $f(x)=\phi(x)^Tw$ ,那么加入新的数据之后的预测分布就变为 $f_*|x_*,X,y\sim N(\frac{1}{\sigma_n^2}\phi(x_*)^TA^{-1}\Phi y, \phi(x_*)^TA^{-1}\phi(x_*))$ ，式中 $\Phi$ 是训练集中所有 $\phi(x)$ 的汇总。
由于对A求逆很麻烦，尤其是当维度变得很大时，因此我们对上式做了变形：
$f_*|x_*,X,y\sim N(\phi_*^T\Sigma_p\Phi(K+\sigma_n^2I)^{-1}y, \phi_*^T\Sigma_p\phi_*-\phi_*^T\Sigma_p\Phi(K+\sigma_n^2I)^{-1}\Phi^T\Sigma_p\phi_*)$

其中 $\phi(x_*)=\phi_*$ , $K=\Phi^T\Sigma_p\Phi$

这部分推导其实还是有点复杂的，还涉及到Woodbury求逆公式，推荐大家看B站的这个视频，有详细推导过程白板推导高斯过程。

这么一个庞然大物看着挺吓人的，但是仔细一比对就会发现其中有一个形如 $\Phi^T\Sigma_p\Phi$ 经常出现，我们令 $k(x,x')=\phi(x)^T\Sigma_p\phi(x')$ , 那其他的就都可以写成 $k (x, x)$ 、 $k (x^{'}, x^{'})$ 之类的，我们给这个式子起个名字叫“covariance function or kernel”，这就是大名鼎鼎的核函数。到这儿，高斯过程回归才算完结，而这种结合了贝叶斯推论+“kernel trick”的推导方法由于是从权重矩阵w的视角出发的，因此也称为 Weight-space View。
更多关于从贝叶斯线性回归到高斯过程的请参考这里

三、凡事都有第二种思维方式

之前的权重视角我们从线性模型出发，利用贝叶斯推论证明了为何高斯过程是“高斯”过程（就是这些权重矩阵为何服从高斯分布），现在我们从已有经验出发，再从function的角度来看待这一问题，看能否得到相同的结果。

高斯分布描述的是一组数据（向量）的信息，用均值和协方差矩阵确定
高斯过程描述的是拟合一组随机变量的函数的分布，用均值函数和协方差函数确定

对于一个随机过程 $f (x)$ 来说，既然它服从高斯分布，那它就有均值和协方差。我们将这一点记为 $f(x)\sim \mathcal{GP}(m(x),k(x,x'))$

其中 $m(x)=\mathbb{E}[f(x)]$ , $k(x,x')=\mathbb{E}[f(x)-m(x)][f(x')-m(x')]$ 。这个协方差矩阵又被称为核函数。

通常我们取 $m (x) = 0$ ，让均值保持在0，也是方便计算。那接下来协方差矩阵的选取就得说道说道了。首先我们来看看协方差矩阵的构成特点——如果两个数据相距越近，则关联性越大；相反，离的越远的两个点，关联性越小，不确定性则越大。这才有了文章最开头的动图，在多元高斯分布中，如果我确定了一点不动，则其他点的概率分布同样服从高斯分布（条件概率的性质），但是离得近的点抖动幅度没那么大，象征着确定性较高，离得远的点抖动就很剧烈，象征不确定性较高。
图中红色点代表已知的点，蓝色的是待预测的数据点，蓝色竖线表示不确定性的范围。

在有了这些认识后，我们将核函数选取为 $k(x,x')=\sigma^2exp(-\frac{1}{2l^2}(x-x')^2)$ 这个式子说明了一个问题，如果我们有了两个数据，便可以确定一个高斯过程。式子中的 $\sigma$ 和 $l$ 叫做超参数，关于这两者取值对核函数的影响会在后面代码部分单独展现。

现在回到我们的高斯过程函数 $f (x)$ 上面来，显然我们对未知的数据较为感兴趣，我们来对函数做个小动作，将其分为两个部分 $f$ , $f_*$ ，其中前者是训练集的输出，后者是测试集的输出，那根据我们GP的定义有
$\begin{bmatrix} f \\ f_* \end{bmatrix}\sim N(0,\begin{bmatrix} K(X,X) &K(X,X_*) \\ K(X_*,X) & K(X_*,X_*)\end{bmatrix})$
当然，这是无噪声版的，现实中一般会在左上角那个系数后面加上 $\sigma_n^2I$ 作为观测噪声。紧接着，我们就运用多元高斯分布的另一个重要性质——边缘性（Marginalisation）！啥意思？简单来说就是下面这张图
如果两个随机变量服从多元高斯分布，那么其中任意一个变量自身也服从高斯分布，并且均值方差和多元高斯分布时完全对应，协方差矩阵的主对角线上是两个随机变量的方差，副对角线上是两者的协方差。同样，如果我们把两个随机变量扩展到无限维，同样不影响对我们想要预测的数据的预测，这就是高斯过程回归的强大之处。

于是乎我们就得到了所要预测函数集的均值和协方差函数：
$\mu_*=K_*^TK^{-1}y \quad(4)$ $\Sigma_*=K_{**}-K_*^TK^{-1}K_* \quad(5)$
相信聪明的你们都能看懂各个符号缩写对应的原式子，我就偷个懒不打了，打公式真是太累了。。。

至此高斯过程回归的推导理解就告一段落了，接下来就该讲讲如何implementation了。
本节参考链接：
Gaussian Process, not quite for dummies
看得见的高斯过程：这是一份直观的入门解读

四、只有代码才是真正理解的关键

废话不多说，直接上代码（Numpy 实现）

import numpy as np
import matplotlib.pyplot as plt
#作图函数
def plot_gp(mu, cov, X, X_train=None, Y_train=None, samples=[]):
    X=X.ravel()
    mu=mu.ravel()
    uncertainty = 1.96*np.sqrt(np.diag(cov))#95%的置信区间
    
    plt.fill_between(X, mu+uncertainty, mu-uncertainty, alpha=0.1)
    plt.plot(X, mu, label='Mean')
    for i, sample in enumerate(samples):
        plt.plot(X, sample, lw=2, ls='--',label=f'Sample{i+1}') #lw is the width of curve
    if X_train is not None:
        plt.plot(X_train, Y_train, 'rx')
    plt.legend()

上面这段先编写好作图函数，方便接下来的可视化

def kernel(X1, X2, l=1.0, sigma_f=1.0):
    '''
    Args:
        X1: Array of m points
        X2: Array of n points
    returns:
        cov(m x n).
        '''
    sqdist = np.sum(X1**2,1).reshape(-1,1)+np.sum(X2**2,1)-2*np.dot(X1,X2.T)
    #X1**2就是X1中所有数都平方，sum(x,1)表示每一行看作一个向量，竖着相加。结果是mx1
    return sigma_f**2*np.exp(-0.5/l**2*sqdist)

定义好核函数，这里采用的是RBF kernel： $k(x_i,x_j)=\sigma_f^2exp(-\frac{1}{2l^2}(x_i-x_j)^T(x_i-x_j))$ 并取两个超参数 $\sigma_f=l=1$

# finite number of points
X=np.arange(-5,5,0.2).reshape(-1,1)

mu = np.zeros(X.shape)
cov = kernel(X,X)

samples = np.random.multivariate_normal(mu.ravel(), cov, 3)

plot_gp(mu, cov, X, samples=samples)

从随机生成的数组中选取三组样本，均值为0，协方差由核函数计算得到，这三组样本构成了先验。

from numpy.linalg import inv

def posterior_predictive(X_s, X_train, Y_train, l=1.0, sigma_f=1.0, sigma_y=1e-8):
    
    K = kernel(X_train, X_train, l, sigma_f)+sigma_y**2*np.eye(len(X_train))      
    K_s = kernel(X_train, X_s, l, sigma_f)                                       
    K_ss = kernel(X_s, X_s, l, sigma_f)+1e-8*np.eye(len(X_s))                    
    K_inv = inv(K)
                                                               
    #公式4
    mu_s = K_s.T.dot(K_inv).dot(Y_train)
    #公式5
    cov_s = K_ss-K_s.T.dot(K_inv).dot(K_s)    
                                                               
    return mu_s, cov_s

求后验，主要是利用了上面的公式（4）、（5）。 $X_s$ 就是 $X_*$ ，即需要预测的数据点，X_train和Y_train分别是训练集的输入输出。l、sigma_f和sigma_y则是三个超参数，值都给定了。

X_train = np.array([-4, -3, -2, -1, 1]).reshape(-1,1)
Y_train = np.sin(X_train)

mu_s, cov_s = posterior_predictive(X, X_train, Y_train)

samples = np.random.multivariate_normal(mu_s.ravel(), cov_s, 3)
plot_gp(mu_s, cov_s, X, X_train=X_train, Y_train=Y_train, samples=samples)

以下示例从后验预测中提取三个样本，并将它们与均值，置信区间和训练数据一起绘制。在无噪声模型中，训练点的方差为零，从后验提取的所有随机函数都经过训练点。

最后再来让我们一起看看超参数的取值会给图形带来什么样的变化

import matplotlib.pyplot as plt

params = [
    (0.3,1.0,0.2),
    (3.0,1.0,0.2),
    (1.0,0.3,0.2),
    (1.0,3.0,0.2),
    (1.0,1.0,0.05),
    (1.0,1.0,1.5),
]

plt.figure(figsize=(10, 5))

for i,(l,sigma_f,sigma_y) in enumerate(params):
    mu_s, cov_s = posterior_predictive(X,X_train, Y_train, l=l, 
                                       sigma_f=sigma_f,
                                      sigma_y=sigma_y)
    plt.subplot(3,2,i+1)
    plt.subplots_adjust(top=2)
    plt.title(f'l={l}, sigma_f = {sigma_f}, sigma_y = {sigma_y}')
    plot_gp(mu_s, cov_s, X, X_train=X_train, Y_train=Y_train)

这里每次只变动一个参数的值，观察这个参数对预测曲线的影响，如下图所示

本节参考自Gaussian processes

最后，感谢您能一直阅读（翻到）这里。原创码字不易，只希望这篇文章能够帮到大家，让后来人学习的更容易一些。文章难免有不正之处，望各位不吝赐教。

开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama（一）开源技术探险家开源模型-实际应用落地 #深度学习自然语言处理语言模型
一、前言在AI大模型百花齐放的时代，很多人都对新兴技术充满了热情，都想尝试一下。然而，实际上要入门AI技术的门槛非常高。除了需要高端设备，还需要面临复杂的部署和安装过程，这让很多人望而却步。在这样的背景下，Ollama的出现为广大开发者和爱好者提供了一条便捷的道路，极大地降低了应用机器学习的门槛。Ollama的优势在于其极致的简化。通过这个平台，用户可以轻松下载、运行和管理各种机器学习模型，而无需
机器学习之——认识机器学习 -睡到自然醒~ golang 重构开发语言
首先，什么是机器学习？参照百度百科的讲解，“机器学习是一门多领域交叉学科，设计概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习能力，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。”什么意思呢？也就是说，机器学习是一门跨领域的学科，是一种能够让机器模仿人类学习能力的一种学科。在Andrew的课程中，提到了几个机器学习的定义：1，A
Epoch 老兵发新帖人工智能
在深度学习和机器学习中，Epoch（轮次或周期）是一个核心训练概念，指模型在整个训练数据集上完成一次完整遍历的过程。以下是关于Epoch的详细解析：一、核心定义基本含义Epoch表示模型将所有训练数据完整学习一次的过程。例如：若训练集有10,000个样本，则1个Epoch即模型用这10,000个样本训练一轮。与相关概念的关系Batch（批次）：数据集被分割成的小组（如每批32个样本）。Iterat
Python --- day 10 Opencv模块的使用 AnAn__kang python opencv 开发语言
系列文章目录前言今天博主带大家进入Opencv的学习，这是一个专门针对处理图像和视频的一个模块，大家以理解为主，增强自己的编程思维，再后续我们训练模型时会大批量的处理图片时会经常用到这个模块。1OpenCV介绍OpenCV（开放源代码计算机视觉库）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成，用于图像处理、计算机视觉领域的算法实现。1.1OpenCV优势**开源免费：**完全
机器学习数据预处理阶段为什么需要——归一化处理
参考：https://www.cnblogs.com/bjwu/p/8977141.html通常，在DataScience中，预处理数据有一个很关键的步骤就是数据的标准化。这里主要引用sklearn文档中的一些东西来说明，主要把各个标准化方法的应用场景以及优缺点总结概括，以来充当笔记。提升模型精度在机器学习算法的目标函数(例如SVM的RBF内核或线性模型的l1和l2正则化)，许多学习算法中目标函数
车辆云端威胁情报共享系统的多维解析与发展路径百态老人大数据人工智能
第一部分：内容本质提取原始内容描述了一个闭环网络安全体系：“车辆实时上传异常行为日志至安全运营中心（VSOC），云端通过机器学习分析攻击模式并下发全局防御策略”。其核心架构包含：数据采集层：车辆端持续收集异常行为日志数据，包含CAN总线通信模式、网络流量特征及驾驶行为数据传输层：通过V2X通信协议和OTA更新通道实现车云双向通信分析层：安全运营中心(VSOC)采用CNN-BiSRU等深度学习模型进
过拟合、欠拟合及其解决方案；梯度消失、梯度爆炸；循环神经网络进阶 Ryan_sz1
1、过拟合、欠拟合及其解决方案过拟合、欠拟合机器学习或者训练深度神经网络的时候经常会出现欠拟合和过拟合这两个问题，但是，一开始我们的模型往往是欠拟合的，也正是因为如此才有了优化的空间，我们需要不断的调整算法来使得模型的表达能拿更强。但是优化到了一定程度就需要解决过拟合的问题了。也就是说欠拟合是模型表达能力不够，达不到很好的表达效果。而过拟合是在训练集的范围内表达能力过强，导致完全拟合了训练集。解决
数字人系统：AI界的超级巨星，你准备好了吗？优秘智能UMI 数字人人工智能深度学习计算机视觉机器学习自然语言处理语言模型图像处理
在这个日新月异的科技时代，每一个创新的火花都可能点燃一场变革的燎原之火。今天，我们要聊的，正是那颗在AI领域熠熠生辉的璀璨新星——优秘数字人系统。它不仅仅是技术的飞跃，更是对未来生活方式的深刻重塑，一场关于人机交互、智能共生的美好预演。技术原理：深度解析与智能构建的奥秘1.深度学习：智能的基石数字人系统的核心技术之一在于深度学习。深度学习是一种模仿人脑神经网络结构和功能的机器学习技术，通过构建多层
聚焦基础研究突破，北电数智联合复旦大学等团队提出“AI安全”DDPA方法入选ICML CSDN资讯人工智能安全数据要素大数据
近日，由北电数智首席科学家窦德景教授牵头，联合复旦大学和美国奥本大学等科研团队共同研发，提出一种DDPA（DynamicDelayedPoisoningAttack）新型对抗性攻击方法，为机器学习领域的安全研究提供新视角与工具，相关论文已被国际机器学习大会（ICML2025）收录。ICML由国际机器学习学会（IMLS）主办，聚焦深度学习、强化学习、自然语言处理等机器学习前沿方向，是机器学习与人工智
阿里云态势感知和安骑士有什么区别？阿腾云
阿里云态势感知和安骑士均是阿里云云盾安全产品，态势感知属于安全管理类的产品，安骑士数据服务器安全类产品，阿里云百科网来详细说下阿里云态势感知和安骑士之间的区别：态势感知和安骑士的区别简单来说，安骑士是检测云服务器漏洞的，态势感知提供安全类的大数据分析服务。态势感知：安全大数据分析平台，通过机器学习和结合全网威胁情报，发现传统防御软件无法覆盖的网络威胁，溯源攻击手段、并且提供可行动的解决方案。安骑士
「日拱一码」035 机器学习——调参过程可视化胖达不服输「日拱一码」机器学习人工智能调参过程可视化神经网络 python 模型可解释性
目录超参数搜索的3D曲面可视化交互式3D可视化神经网络学习率的3D可视化SVM超参数的3D决策边界可视化超参数优化的3D动画超参数搜索的3D曲面可视化##超参数搜索的3D曲面可视化importnumpyasnpimportmatplotlib.pyplotaspltfrommpl_toolkits.mplot3dimportAxes3Dfromsklearn.datasetsimportmake_
数据质量是机器学习项目的核心痛点，AI技术能提供智能化解决方案。 zzywxc787 python pandas numpy 人工智能自动化运维 AI编程
一、数据质量诊断系统（Python实现）importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.clusterimportKMeansfromsklearn.ensembleimportIsolationForestfromtensorflow.keras.modelsimportSequentialfromte
7.机器学习-十大算法之一拉索回归（Lasso）算法原理讲解以山河作礼。 #机器学习算法机器学习算法回归
7.机器学习-十大算法之一拉索回归（Lasso）算法原理讲解一·摘要二·个人简介三·前言四·原理讲解五·算法流程六·代码实现6.1坐标下降法6.2最小角回归法七·第三方库实现7.1scikit-learn实现（坐标下降法）：7.2scikit-learn实现（最小角回归法）：一·摘要拉索回归（LassoRegression）是一种线性回归的正则化形式，它通过引入L1范数惩罚项来实现模型的稀疏性，从
机器学习算法之回归算法福葫芦机器学习回归算法
一、回归算法思维导图二、算法概念、原理、应用场景和实例代码1、线性回归1.1、概念‌‌线性回归算法是一种统计分析方法，用于确定两种或两种以上变量之间的定量关系。‌线性回归算法通过建立线性方程来预测因变量（y）和一个或多个自变量（x）之间的关系。其基本形式为y=wx+e，其中w是权重，x是自变量，e是误差项。1.2、算法原理线性回归算法的核心在于找到最佳的拟合直线，使得预测值与实际值之间的误差最小。
7篇1章7节：机器学习算法解读，与数值预测回归模型构建 MD分析用R探索医药数据科学机器学习算法回归 r语言数据挖掘
机器学习是当今数据分析和人工智能的核心工具之一，其算法广泛应用于分类、回归、排序和推荐等领域。本篇将详细讲解机器学习的四大经典算法类型，并以回归问题为例深入探讨数值预测的关键步骤，包括数据准备、线性回归模型构建、模型预测及误差评估，帮助读者更系统地理解和掌握机器学习的基础知识及实际应用。一、机器学习的算法在数据科学和人工智能的浪潮中，机器学习算法成为了解决各种数据问题的关键工具。机器学习主要处理四
支持向量机SVM 李昊哲小课 sklearn 人工智能机器学习支持向量机算法机器学习 sklearn 人工智能数据挖掘
支持向量机SVM一、支持向量机算法支持向量机（SupportVectorMachine，SVM）是一种用于分类和回归分析的机器学习算法。分类场景举例（更容易理解）假设现在有一个二维平面上散落着一些点，这些点分为两类，一类是红色的圆形点，另一类是蓝色的方形点。我们的任务就是找到一条直线，能够把这两类点尽可能准确地分开。支持向量机算法做的事情就和这个类似。算法核心思想它不是随便找一条能分开两类数据的直
高斯混合模型（GMM）中的协方差矩阵类型与聚类形状关系详解码字的字节机器学习机器学习人工智能高斯混合模型 GMM
高斯混合模型（GMM）简介高斯混合模型（GaussianMixtureModel,GMM）是概率统计与机器学习交叉领域的重要模型，其核心思想是通过多个高斯分布的线性组合来描述复杂数据分布。与单一高斯分布不同，GMM能够捕捉数据中的多模态特性，这使得它在处理真实世界非均匀分布数据时展现出独特优势。从数学形式上看，一个包含K个分量的GMM可表示为：其中(\pi_k)是第k个高斯分量的混合系数（满足(\
机器学习初学者理论初解 Mikhail_G 机器学习人工智能
大家好!为什么手机相册能自动识别人脸？为什么购物网站总能推荐你喜欢的商品？这些“智能”背后，都藏着一位隐形高手——机器学习（MachineLearning）。一、什么是机器学习？简单说，机器学习是教计算机从数据中自己找规律的技术。就像教孩子认猫：不是直接告诉他“猫有尖耳朵和胡须”，而是给他看100张猫狗照片，让他自己总结出猫的特征。传统程序vs机器学习传统程序：输入规则+数据→输出结果（例：按“温
Embedding与向量数据库玖月初玖大模型应用开发基础人工智能 embedding 数据库
1.Embedding是什么EmbeddingModel是一种机器学习模型，它的核心任务是将离散的、高维的符号（如单词、句子、图片、用户、商品等）转换成连续的、低维的向量（称为“嵌入”或“向量表示”），并且这个向量能有效地捕捉原始符号的语义、关系或特征。1.1通俗理解EmbeddingModel是让计算机“理解”世界的核心工具，把“文字、图片、音频”等信息变成一串有意义的数字我们称之为“向量”。类
2023年第10期(NeuroImage)：DomainATM：多中心医学图像数据标准化工具箱影浮科技ImageFlow
基本信息1.标题：DomainATM:Domainadaptationtoolboxformedicaldataanalysis.2.期刊：NeuroImage3.IF/JCR/分区：7.4/Q1/中科院一区4.DOI：10.1016/j.neuroimage.2023.119863目录1、导读2、背景动机3、研究目的4、工具箱介绍5、测试试验6、局限不足1导读域适应（DA）是基于机器学习的现代医
在NLP深层语义分析中，深度学习和机器学习的区别与联系
在自然语言处理（NLP）的深层语义分析任务中，深度学习与机器学习的区别和联系主要体现在以下方面：一、核心区别特征提取方式机器学习：依赖人工设计特征（如词频、句法规则、TF-IDF等），需要领域专家对文本进行结构化处理。例如，传统情感分析需人工定义“情感词库”或通过词性标注提取关键成分。深度学习：通过神经网络自动学习多层次特征。例如，BERT等模型可从原始文本中捕获词向量、句法关系甚至篇章级语义，无
迁移学习：知识复用的智能迁移引擎 | 从理论到实践的跨域赋能范式大千AI助手人工智能 Python #OTHER 迁移学习人工智能机器学习算法神经网络大模型迁移
让AI像人类一样“举一反三”的通用学习框架本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义与基本概念迁移学习（TransferLearning）是一种机器学习范式，其核心思想是：将源领域（SourceDomain）学到的知识迁移到目标领域（TargetDomain），以提升目标任务的性能
AI原生应用中的用户画像构建：从理论到实践全解析
AI原生应用中的用户画像构建：从理论到实践全解析关键词：用户画像、AI原生应用、特征工程、机器学习、个性化推荐、数据隐私、模型优化摘要：本文全面解析AI原生应用中用户画像构建的全过程，从基础概念到核心技术，再到实际应用和未来趋势。我们将用通俗易懂的方式讲解用户画像如何像"数字身份证"一样工作，深入探讨特征提取、模型构建等关键技术，并通过实际案例展示用户画像在推荐系统、精准营销等场景中的应用。文章还
Python爬虫【四十五章】爬虫攻防战：异步并发+AI反爬识别的技术解密程序员_CLUB Python入门到进阶 python 爬虫人工智能
目录引言：当爬虫工程师遇上AI反爬官一、异步并发基础设施层1.1混合调度框架设计1.2智能连接池管理二、机器学习反爬识别层2.1特征工程体系2.2轻量级在线推理三、智能决策系统3.1动态策略引擎3.2实时对抗案例四、性能优化实战4.1全链路压测数据4.2典型故障处理案例五、总结：构建智能化的爬虫生态系统Python爬虫相关文章（推荐）引言：当爬虫工程师遇上AI反爬官在大数据采集领域，我们正经历着技
万字长文，解读大模型技术原理（非常详细）零基础入门到精通，收藏这一篇就够了
大模型是指具有大规模参数和复杂计算结构的机器学习模型。本文从大模型的发展历程出发，对大模型领域的各个技术细节进行详细解读，供大家在了解大模型基本知识的过程中起到一定参考作用。一、大模型的定义大语言模型作为一个被验证可行的方向，其“大”体现在训练数据集广，模型参数和层数大，计算量大，其价值体现在通用性上，并且有更好的泛化能力。这些模型通常由深度神经网络构建而成，拥有数十亿甚至数千亿个参数。大模型的设
TensorFlow为AI人工智能航空航天领域带来变革 AI原生应用开发人工智能 tensorflow python ai
TensorFlow为AI人工智能航空航天领域带来变革关键词：TensorFlow、人工智能、航空航天、机器学习、深度学习、神经网络、自主系统摘要：本文探讨了TensorFlow这一强大的机器学习框架如何推动航空航天领域的创新。我们将从基础概念入手，逐步深入分析TensorFlow在航天器导航、卫星图像处理、飞行器自主决策等关键应用场景中的实现原理。通过实际代码示例和架构图解，展示TensorFl
多语言文本分类在AI应用中的实践 AI原生应用开发人工智能分类数据挖掘 ai
多语言文本分类在AI应用中的实践关键词：多语言文本分类、自然语言处理、机器学习、深度学习、BERT、迁移学习、跨语言模型摘要：本文深入探讨多语言文本分类在AI领域的应用实践。我们将从基础概念出发，逐步讲解其核心原理、技术架构和实现方法，并通过实际案例展示如何构建一个高效的多语言文本分类系统。文章将涵盖从传统机器学习方法到最先进的深度学习技术，特别关注跨语言迁移学习在实际业务场景中的应用。背景介绍目
从零开始构建AI原生应用的认知架构 AI原生应用开发 AI-native 架构 ai
从零开始构建AI原生应用的认知架构关键词：AI原生应用、认知架构、机器学习、知识图谱、神经网络、智能决策、系统设计摘要：本文深入探讨如何从零开始构建AI原生应用的认知架构。我们将从基本概念出发，逐步解析认知架构的核心组件，包括知识表示、推理机制和学习能力等。通过生动的比喻和实际代码示例，帮助读者理解如何设计一个能够模拟人类认知过程的AI系统。文章还将介绍当前最先进的认知架构模型，并展望未来发展趋势
Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring 论文阅读钟屿论文阅读计算机视觉人工智能
用于动态场景去模糊的深度多尺度卷积神经网络摘要针对一般动态场景的非均匀盲去模糊是一个具有挑战性的计算机视觉问题，因为模糊不仅来源于多个物体运动，还来源于相机抖动和场景深度变化。为了去除这些复杂的运动模糊，传统的基于能量优化的方法依赖于简单的假设，例如模糊核是部分均匀或局部线性的。此外，最近的基于机器学习的方法也依赖于在这些假设下生成的合成模糊数据集。这使得传统的去模糊方法在模糊核难以近似或参数化的
基于Paillier同态加密算法的金融数据安全共享机制研究【附数据】
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域：金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具：Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容：金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include