Lehyu

PRML读书笔记(二)

二值变量

伯努利分布

对于 x∈{0,1},p(x=1|μ)=μ ， x 的概率分布有

B e r n (x | μ) E [x] v a r [x] = = = μ x (1 - μ) 1 - x μ μ (1 - μ)

假设一个数据集 D={x1,x2,…,xN} ， xi 服从伯努利分布，并且独立同分布，那么

p (D | μ) = \prod n = 1 N μ x n (1 - μ) 1 - x n (1)

我们能够通过最大化似然函数来求解 μ ，

ln p (D | μ) \partial ln p \partial μ \Rightarrow μ M L \Rightarrow μ M L = = = = \sum n = 1 N x n ln μ + (1 - x n) ln (1 - μ) 0 1 N \sum n = 1 N x n m N

由于 xi∈{0,1} ，如果设 D 中 m 个值为1的观测值，那么上式可以写成

\Rightarrow μ M L = m N

假设我们抛一枚有损的硬币 p(x=1|μ)=μ 可以不为0.5，如果 D 有3个观测值，而且全部为1，即头部向上，那么我们由最大似然函数得到的结果就是 μML=1 ，如果我们用这个值去预测以后的结果，明显准确率会十分差，这就是所谓的过拟合。

二项分布

假设我们已经知道观测值中总共有 m 个值为1的观测值，那么对 m 的概率分布有

B i n (x | N, μ) = (N m) μ m (1 - μ) N - m (2)

(N m) E [m] v a r [m] = = = N ! ( N - m ) ! m ! N μ N μ (1 - μ)

以上关于期望与方差的计算可以重新计算，或者用第一章习题1.10的结论直接得出。

贝塔分布

前面我们知道最大似然函数会容易过拟合，那么可以用贝叶斯分析来减小这个问题，但是之前我们先介绍一下贝塔分布

B e t a (μ | a, b) = Γ ( a + b ) Γ ( a ) Γ ( b ) μ a - 1 (1 - μ) b - 1 (3)

Γ (x) E [μ] v a r [μ] = = = \int \infty 0 μ x - 1 exp - μ d μ a a + b a b ( a + b ) 2 ( a + b + 1 )

其中 a,b 是超参数，当 a,b 取不同值时，分布图如下所示：

贝叶斯分析

贝叶斯公式： p(y|x)∝p(x|y)p(y)

为了使过程简化，我们希望后验概率 p(y|x) 与先验概率 p(y) 有同样的形式，这个先验被称为共轭先验(conjugate prior)。对于抛硬币问题(服从伯努利分布)，由式(2)我们知道似然函数 p(m|N,μ)∝μm(1−μ)N−m ，那么我们可以取贝塔分布作为共轭先验，那么

p (μ | m, l, a, b) m + l \Rightarrow p (μ | m, l, a, b) \Rightarrow p (x = 1 | D) \propto = = = = = = μ m + a - 1 (1 - μ) l + b - 1 N Γ ( a + b + l + m ) Γ ( a + m ) Γ ( b + l ) μ a + m - 1 (1 - μ) b + l - 1 \int 10 p (x = 1 | μ) p (μ | D) d μ \int 10 μ p (μ | D) d μ E [μ | D] a + m a + m + b + l

假设我们设 a=1,b=1 ， D 有三个观测值，并且都为1，那么在贝叶斯分析中去预测为 45 ，直觉上至少要比最大似然函数的预测 1 要靠谱。

当 N 越来越大时，先验知识就会被逐渐弱化， limN→∞a+ma+m+b+l≃mN ，最大后验与最大似然具有相同的预测值。但是对于数据量较少的应用，使用最大后验往往会比最大似然要好。

而且最大后验能够充当下一次观测数据的先验知识，从而达到顺序学习(sequential learning)，能够更好的应用于大规模数据。比如我们将 D 划分数据集大小为 N0,N1 的两个子数据集 D0,D1 ，刚开始我们观测到数据集 D1 ，先验知识为 p(μ|a0,b0) ，那么对于数据集 D0 的后验为

p (μ | m 0, l 0, a 0, b 0) = = Γ ( a 0 + b 0 + l 0 + m 0 ) Γ ( a 0 + m 0 ) Γ ( b 0 + l 0 ) μ a 0 + m 0 - 1 (1 - μ) b 0 + l 0 - 1 B e t a (μ | a 0 + m 0, b 0 + l 0)

然后我们观测到数据集

D1 ，此时以

D0 的后验作为其先验，那么同理我们有

p (μ | m 1, l 1, m 0, l 0, a 0, b 0) = = = Γ ( a 0 + b 0 + l 0 + m 0 + l 1 + m 1 ) Γ ( a 0 + m 0 + m 1 ) Γ ( b 0 + l 0 + l 1 ) μ a 0 + m 0 + m 1 - 1 (1 - μ) b 0 + l 0 + l 1 - 1 B e t a (μ | a 0 + m 0 + m 1, b 0 + l 0 + l 1) B e t a (μ | a 0 + m, b 0 + l)

这个优点能够使我们更容易的训练大规模数据。

在贝叶斯学习中，当我们观测的数据越来越多的时候，后验分布的不确定性就会越来越小。
todo

多元变量

前面一节我们介绍的是变量只有两个状态(要么是1，要么是0)，当变量有多个状态的时候，我们可以扩展成 x=(0,…,1,…,0)T,∑Kk=1xk=1,p(xk)=μk ，那么

p (x | μ) = \prod k = 1 K μ x k k

其中

μ=(μ1,…,μK)T,∑Kk=1μk=1 ，同之前的伯努利分布一样，对于

D={x1,…,xN} 的似然函数有

p (D | μ) = = = \prod n = 1 N \prod k = 1 K μ x n k k \prod k = 1 K μ \sum N n = 1 (x n k) k \prod k = 1 K μ m k k

求其最大值与二值变量是基本类似的，只是多了一个约束条件 ∑Kk=1μk=1 ，我们可以用拉格朗日乘子法来进行求解

L (μ, λ) \partial L \partial μ k \Rightarrow m k μ k + λ \Rightarrow μ k \partial L \partial λ \Rightarrow λ \Rightarrow μ k = = = = = = = \sum k = 1 K m k ln μ k + λ (\sum k = 1 K μ k - 1) 00 - m k / λ 0 - N - m k N

多项式分布

M u l t (m 1, m 2, \dots, m K | μ, N) (N m 1 m 2 \dots K) \sum k = 1 K m k = N = = (N m 1 m 2 \dots K) \prod k = 1 K μ m k k N ! m 1 ! m 2 ! \dots m K !

　狄利克雷(Dirichlet)分布

多项分布的共轭先验是狄利克雷分布，如下

p (μ | α) D i r (μ | α) α 0 \propto = = \prod k = 1 K μ α k - 1 k Γ ( α 0 ) Γ ( α 1 ) \dots Γ ( α K ) \prod k = 1 K μ α k - 1 k \sum k = 1 K α k

那么多项分布的后验

p (μ | D, α) p (μ | D, α) \propto = p (D | μ) p (μ | α) \propto \prod k = 1 K μ α k + m k - 1 k Γ ( α 0 + N ) Γ ( α 1 + m 1 ) \dots Γ ( α K + m K ) \prod k = 1 K μ α k + m k - 1 k

以上都是离散变量的分布，下面介绍连续型变量中最常用的分布，高斯(Gaussian)分布

高斯分布

对于单一变量： N(x|μ,σ2)=12πσ2√exp{−(x−μ)22σ2}

对于D维向量 x ： N(x|μ,Σ)=1(2π)D/2|Σ|1/2exp{−12(x−μ)TΣ−1(x−μ)} ，其中 μ,Σ 分别是D维均值向量和 D×D 协方差矩阵， |Σ| 是协方差矩阵的行列式。

对于单一变量，使其熵最大化的分布是高斯分布(PRML p54)，这个性质同样适用于多元(multivariate)高斯分布。中心极限定理告诉我们独立同分布的随机变量序列的和近似高斯分布。

下面考虑一下高斯分布的几何形态

Δ 2 = (x - μ) T Σ - 1 (x - μ)

概率相等的点分布在一个 x 空间的曲面上。需要注意的是 Σ 是一个对称矩阵，那么其特征向量形成一个正交向量集

Σ u i u T i u j \Rightarrow Σ \Rightarrow Σ - 1 \Rightarrow y i = u T i (x - μ) Δ 2 \Rightarrow y = (y 1, \dots, y D) T y = = = = = = λ i u i I i j \sum i = 1 D λ i u T i u i \sum i = 1 D 1 λ i u i u T i \sum i = 1 D y 2 i λ i U (x - μ)

其中:

U 第i行为

uTi ，

UTU=I

对于当前的高斯分布，协方差矩阵的特征值 λi 必须严格正(全部大于0)，否则不能够合适地规范化，之后我们可能会遇到有些特征值为0的高斯分布，这些分布能够限制在更低的维度空间上。

之前我们考虑的是高斯分布的几何形态，由第一章p18我们知道 p(y)=px(g(y))|g′(y)|,x=g(y) ，那么先求高斯分布 x 关于 y 的导数

y i J i j | J | 2 = = = u T i (x - μ) \partial x i \partial x j = U i j | U T U | = | I | = 1

而对称矩阵的行列式等于其特征值的连乘：

|Σ|1/2=∏Dj=1λ1/2j ，那么

p (y) = p (x) | J | = \prod j = 1 D 1 2 π λ j - - - - \sqrt exp {- y 2 j 2 λ j}

多元高斯分布的期望与协方差

E [x] E [x x T] c o v [x] = = z = x - μ = o d d = = = z = x - μ = o d d = = y i = u i T z = = = = 1 ( 2 π ) D / 2 | Σ | 1 / 2 \int x exp {- 1 2 (x - μ) T Σ - 1 (x - μ)} d x 1 ( 2 π ) D / 2 | Σ | 1 / 2 \int (z + μ) exp {- 1 2 z T Σ - 1 z} d z 1 ( 2 π ) D / 2 | Σ | 1 / 2 \int μ exp {- 1 2 z T Σ - 1 z} d z μ 1 ( 2 π ) D / 2 | Σ | 1 / 2 \int x x T exp {- 1 2 (x - μ) T Σ - 1 (x - μ)} d x 1 ( 2 π ) D / 2 | Σ | 1 / 2 \int (z + μ) (z + μ) T exp {- 1 2 z T Σ - 1 z} d z 1 ( 2 π ) D / 2 | Σ | 1 / 2 \int (μ μ T + z z T) exp {- 1 2 z T Σ - 1 z} d z μ μ T + 1 ( 2 π ) D / 2 | Σ | 1 / 2 \int z z T exp {- 1 2 z T Σ - 1 z} d z μ μ T + 1 ( 2 π ) D / 2 | Σ | 1 / 2 \sum i = 1 D \sum j = 1 D u i u T j \int exp {- \sum k = 1 D y 2 k 2 λ k} y i y j d y μ μ T + \sum i = 1 D λ i u i u T i μ μ T + Σ E [(x - E [x]) (x - E [x]) T] Σ

μ,Σ 共同控制了高斯分布的形态，在D维空间中，一般情况下，

μ 有D个参数，而

Σ 有

D(D+1)/2 个参数(对称矩阵)，那么为了决定一个高斯分布的形态我们要有

D(D+3)/2 个参数。对于低维空间来说这个参数是可以接受的；但是对于非常大的

D ，计算量就会变得十分昂贵(协方差的逆矩阵)。

一个方法是限制协方差矩阵的形态：1. Σ=diag(σ2i) ，此时只有 2D 个参数；2. Σ=σ2I ，此时有 D+1 个参数。

由上图知道，虽然限制协方差矩阵的形态能够使计算协方差矩阵的逆更加快速，但是这也限制了高斯函数的分布从而影响高斯分布拟合数据的能力。

条件高斯分布与边缘高斯分布

条件高斯分布与边缘高斯分布的推导可以参考PRML p86。

x μ Σ Λ = = = = (x a x b) (μ a μ b) (Σ a a Σ b a Σ a b Σ b b) (Λ a a Λ b a Λ a b Λ b b)

p(x)=p(xa,xb) ，当我们固定 xb 就得到 xa 关于 xb 的条件概率

- 1 2 (x - μ) T Σ - 1 (x - μ) = - 1 2 (x a - μ a) T Λ a a (x a - μ a) - 1 2 (x a - μ a) T Λ a b (x b - μ b) - 1 2 (x b - μ b) T Λ b a (x a - μ a) - 1 2 (x b - μ b) T Λ b b (x b - μ b)

由上面的推导我们知道，当 xb 固定时，上式是关于 xa 的二项式，因此 p(xa|xb) 是干死分布。下面介绍知道一个高斯分布的指数的二项式之后，求它的期望与协方差矩阵。

- 1 2 (x - μ) T Σ - 1 (x - μ) = - 1 2 x T Σ - 1 x + x T Σ - 1 μ + c o n s t

上式的const是指与 x 无关的项。根据上式我们就得到 p(xa|xb) 的均值与协方差矩阵

- 1 2 (x - μ) T Σ - 1 (x - μ) \Rightarrow Σ - 1 a | b \Rightarrow Σ - 1 a | b μ a | b \Rightarrow μ a | b = = = = = - 1 2 (x a - μ a) T Λ a a (x a - μ a) - 1 2 (x a - μ a) T Λ a b (x b - μ b) - 1 2 (x b - μ b) T Λ b a (x a - μ a) - 1 2 (x b - μ b) T Λ b b (x b - μ b) - 1 2 x T a Λ a a x a + x T a (Λ a a μ a a - Λ a b (x b - μ b)) + c o n s t Λ a a Λ a a μ a a - Λ a b (x b - μ b) μ a a - Λ - 1 a a Λ a b (x b - μ b)

条件高斯分布 p(xa|xb) 的均值是 xb 的线性函数

至于边缘函数则可以由积分求得: p(xa)=∫p(xa,xb)dxb ，与条件高斯分布的推导基本类似都是，详细请看书P88，下面只给出结果

E [x a] c o v [x a] = = μ a Σ a a

高斯条件分布 p(y|x) 的均值是 x 的线性函数那么，

p (x) p (y | x) \Rightarrow p (y) \Rightarrow p (x | y) Σ = = = = = N (x | μ, Λ - 1) N (y | A x + b, L - 1) N (y | A μ + b, L - 1 + A Λ - 1 A T) N (y | Σ {A T L (y - b) + Λ μ}, Σ) (Σ + A L A) - 1

需要注意的是，书中的推导是先求出 p(x,y) ，然后再根据高斯条件分布与高斯边缘分布的结论直接得出 p(y),p(x|y)

高斯分布的最大似然

X={x1,…,xN},{xn} 独立同分布。

ln p (X | μ, Σ) \Rightarrow \partial ln p \partial μ = 0 0 \Rightarrow μ M L \Rightarrow \partial ln p \partial Σ = 0 0 \Rightarrow Σ M L = = = = = - N D 2 ln (2 π) - N 2 ln | Σ | + 1 2 \sum n = 1 N (x n - μ) T Σ - 1 (x n - μ) - 1 2 \sum n = 1 T {Σ - 1 (x n - μ) + {(x n - μ) Σ - 1} T} 1 N \sum n = 1 N x n - N 2 Σ - 1 - 1 2 \sum n = 1 T {(x n - μ) (x n - μ) T (- Σ - 2)} 1 N \sum n = 1 N (x n - μ M L) (x n - μ M L) T

由于 μML 不依赖于 ΣML ，可以先求 μML 再求 ΣML 。

E [μ M L] p (x, y) = p (x) p (y) E [μ M L] p (x m, x n) = p (x n) p (x m), p (x) \sim N (x | μ, σ 2) E [Σ M L] = \Rightarrow = \Rightarrow = E [1 N \sum n = 1 N x n] E [x + y] = E [x] + E [y] 1 N \sum n = 1 N E [x n] = μ E [x n x m] = μ 2 + σ 2 I n m N - 1 N Σ

顺序估计(sequential estimation)

首先对于高斯分布的均值(mean)估计： μML=1N∑Nn=1xn

μ N M L = = = = 1 N \sum n = 1 N x n 1 N x N + 1 N \sum n = 1 N - 1 x n 1 N x N + N - 1 N μ N - 1 M L μ N - 1 M L + 1 N (x N - μ N - 1 M L)

在我们估计了 N−1 个观测值的

你可能感兴趣的:(机器学习)

量子计算+AI：未来AI Agent的计算范式 AI天才研究院计算 ChatGPT DeepSeek RL 强化学习 agent agi 推理模型智能驾驶
量子计算+AI：未来AIAgent的计算范式关键词：量子计算，人工智能，AIAgent，量子算法，量子机器学习，量子优化，量子数据处理摘要：量子计算和人工智能（AI）的结合正在改变AIAgent的计算范式。通过量子计算的超强算力和独特性质，AIAgent在数据处理、算法优化和决策能力方面展现出巨大潜力。本文将详细探讨量子计算与AI结合的核心概念、算法原理、系统架构，并通过实际案例展示量子AIAge
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据 java python javascript kotlin golang 架构人工智能
深度学习、模型架构、可拓展性、神经网络、机器学习1.背景介绍深度学习作为人工智能领域最前沿的技术之一，在图像识别、自然语言处理、语音识别等领域取得了突破性的进展。深度学习模型的成功离不开其强大的学习能力和可拓展性。本文将深入探讨深度学习算法的原理、模型架构设计以及可拓展性的关键要素，并通过代码实例和实际应用场景，帮助读者理解如何搭建可拓展的深度学习模型架构。2.核心概念与联系深度学习的核心概念是人
机器学习之向量化珠峰日记 AI理论与实践机器学习人工智能
文章目录向量化是什么为什么要向量化提升计算效率简化代码与增强可读性适配模型需求怎么做向量化数据预处理特征提取特征选择向量构建机器学习与深度学习中向量化的区别数据特征提取方式机器学习深度学习模型结构与复杂度机器学习深度学习计算资源需求机器学习深度学习数据规模适应性机器学习深度学习向量化是什么向量化是把数据转化为向量形式进行表示与处理的过程。在机器学习与深度学习的范畴内，现实中的各类数据，像文本、图像
从零精通机器学习：线性回归入门吴师兄大模型 0基础实现机器学习入门到精通机器学习线性回归人工智能 python 算法回归开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
聊聊Python都能做些什么 ·零落· Python入门到掌握 python 开发语言
文章目录一、Python简介二、Python都能做些什么1.Web开发2.数据分析和人工智能3.自动化运维和测试4.网络爬虫5.金融科技三、Python开源库都有哪些1.Web开发2.数据分析和科学计算3.机器学习和深度学习4.网络爬虫5.自动化和测试6.其他常用库四、相关链接一、Python简介Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。它最初由GuidovanRossu
基于改进ISODATA算法的负荷场景曲线聚类（matlab代码）电力程序小学童聚类 matlab ISODATA算法风电光伏
目录1主要内容聚类中心选取步骤核方法2部分代码3程序结果4程序链接1主要内容程序复现文献《基于机器学习的短期电力负荷预测和负荷曲线聚类研究》第三章《基于改进ISODATA算法的负荷场景曲线聚类》模型，该方法不止适用于负荷聚类，同样适用于风光等可再生能源聚类，只需要改变聚类的数据即可，该方法的通用性和可创新性强。该代码实现一种基于改进ISODATA算法的负荷场景曲线聚类方法，代码中，主要做了四种聚类
《基于机器学习的负荷曲线聚类算法对比与改进：K-L-isodata的创新性研究》 TWHiwhjig 机器学习算法聚类
基于机器学习的负荷曲线聚类包括kmeansisodata和改进的L-isodata以及在其基础上再次进行改进的K-L-isodata(有创新性)，四者通过评价指标进行了对比精品代码可修改性极高有参考文献ID:93150688324967700自律的电气人基于机器学习的负荷曲线聚类是一种基于数据分析和模式识别的技术，它可以帮助我们对系统的负荷变化进行分类和理解。在负荷曲线聚类的研究中，K-means
机器学习Pandas_learn4 XW-ABAP 机器学习机器学习 pandas 人工智能
importpandasaspddefcalculate_goods_covariance():#定义商品销售数据字典goods_sales_data={"时期":["一期","二期","三期","四期"],"苹果":[15,16,3,2],"橘子":[12,14,16,18],"石榴":[11,8,7,1]}#将字典转换为DataFrame对象goods_dataframe=pd.DataFra
如何使用Python对Excel、CSV文件完成数据清洗与预处理？ Python 集中营 python数据分析应用 python excel 开发语言
在数据分析和机器学习项目中，数据清洗与预处理是不可或缺的重要环节。现实世界中的数据往往是不完整、不一致且含有噪声的，这些问题会严重影响数据分析的质量和机器学习模型的性能。Python作为一门强大的编程语言，提供了多种库和工具来帮助我们高效地完成数据清洗与预处理任务，其中最常用的库包括Pandas、NumPy、SciPy等。本文将详细介绍如何使用Python对Excel和CSV格式的数据文件进行清洗
理解深度学习1-简介 shangjg3 PyTorch深度学习实战深度学习人工智能
人工智能（AI）旨在打造模仿智能行为的系统。它覆盖了众多方法，涵盖了基于逻辑、搜索和概率推理的技术。机器学习是AI的一个分支，它通过对观测数据进行数学模型拟合来学习决策制定。这个领域近年来迅猛发展，现在几乎（虽不完全准确）与AI同义。深度神经网络是一类机器学习模型，将其应用到数据上的过程称为深度学习。目前，深度网络是最强大和最实用的机器学习模型之一，常见于日常生活中。我们常常用自然语言处理（Nat
【Java】已解决：`java.sql.SQLSyntaxErrorException: SQL` 屿小夏 java sql 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
AIGC带来数据革命：R语言如何成为数据科学家的秘密武器？程序边界 AIGC r语言开发语言
文章目录一、R语言的基础特性1.1R语言的起源与发展1.2R语言的核心优势二、R语言在AIGC中的应用场景2.1数据预处理与清洗2.2文本分析与生成2.3机器学习与模型构建2.4数据可视化与报告生成三、R语言在AIGC中的具体案例3.1金融数据分析与预测3.2医疗数据分析与建模3.3社交媒体数据分析与情感分析四、R语言在AIGC中的未来展望4.1与深度学习框架的集成4.2与云计算平台的集成4.3与
运维Tips | Ubuntu 24.04 安装配置 samba 文件共享全栈工程师修炼指南企业IT运维实践运维 ubuntu linux 服务器
[知识是人生的灯塔，只有不断学习，才能照亮前行的道路]Ubuntu24.04安装配置samba文件共享描述：我们将Ubuntu24.04作为机器学习的工作站，往往需要将Ubuntu24.04中的数据或者代码共享给我们其他使用Windows系统的小伙伴，此时我们可以使用SAMBA，开辟出一个文件共享目录供大家进行数据交换使用。SAMBA是什么?在Linux中，SAMBA是一个开源的软件套件，它提供了
人工智能与机器学习入门：基尼系数（Gini Index）和基于熵（Entropy）基尼系数基于熵机器学习入门
在决策树应用一文中，在构建决策分类树应用决策算法时，介绍了基尼系数（GiniIndex）和基于熵（Entropy）两种算法。本文通过实例来更加深入的介绍一下这两个算法。仍然以简单的数据为例：id喜欢颜色是否有喉结身高性别1绿否165女2蓝是170男3粉否172女4绿是175男基尼系数分别对喜欢颜色是否有喉结求基尼系数如下：喜欢的颜色id喜欢颜色性别1绿女2蓝男3粉女4绿男对于姓别女分类而言，数据如
构建未来智能：在Mojo模型中自定义模型架构的艺术 2401_85761003 mojo 架构
构建未来智能：在Mojo模型中自定义模型架构的艺术在深度学习的世界里，模型架构的设计往往决定了算法的性能和适用性。Mojo模型，作为一个假想中的高级机器学习框架，允许用户实现自定义的模型架构来解决特定的问题。本文将深入探讨如何在Mojo模型中实现自定义模型架构，并提供详细的步骤和代码示例，以帮助读者掌握这一强大的技术。自定义模型架构的重要性灵活性自定义模型架构提供了设计适合特定问题需求的模型的灵活
最新计算机专业毕设论文选题大全基于BeautifulSoup的毕业设计详细题目100套优质毕设项目分享(源码+论文)✅ 会写代码的羊毕设选题课程设计 beautifulsoup 毕业设计毕业设计题目毕设题目 python 网络爬虫
文章目录前言最新毕设选题（建议收藏起来）基于BeautifulSoup的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费
如果我想成为一名大数据和算法工程师，我需要学会哪些技能，获取大厂的offer 红豆和绿豆杂谈大数据算法
成为一名大数据和算法工程师并获取大厂Offer，需要掌握一系列核心技能，并具备丰富的项目经验与扎实的理论基础。以下是详细的技能要求和建议：---###**1.数学与理论基础**-**数学知识**：掌握线性代数、微积分、概率论和统计学，这些是设计和理解算法的基础。-**机器学习理论**：深入理解常见机器学习算法（如线性回归、逻辑回归、决策树、随机森林、SVM、K-means等），了解其原理、优缺点及
关于非线性优化小记文弱_书生乱七八糟算法
非线性优化（NonlinearOptimization）1.什么是非线性优化？非线性优化是指目标函数或约束条件中至少有一个是非线性的优化问题。它广泛应用于工程、经济、人工智能、机器学习等领域，用于求解最优解的问题。非线性优化通常可以表示为以下数学形式：min⁡xf(x)或max⁡xf(x)\min_{x}f(x)\quad\text{或}\quad\max_{x}f(x)xminf(x)或xmax
麦萌短剧技术解构《我跑江湖那些年》：从“仇恨驱动型算法”到“多方安全计算的自我救赎” 短剧萌算法安全
《我跑江湖那些年》以慕青青的复仇与蜕变为主线，展现了分布式系统中的信任崩塌与对抗性博弈的模型优化。本文将从机器学习视角拆解这场“江湖算法”的技术隐喻，探讨如何在数据污染的困境中实现参数净化。1.初始训练集：暴力采样与特征空间坍缩慕青青（Agent_M）的成长环境可视为一个高偏差训练集：数据污染事件：村主任（Node_V）通过恶意共识算法（如嫉妒驱动的PoW机制），煽动村民（Sub_Nodes）对果
学习pytorch 阿什么名字不会重复呢学习 pytorch 人工智能
学习PyTorch是一个很好的选择，尤其是如果你对深度学习和机器学习感兴趣。以下是一个详细的学习计划，可以帮助你系统地掌握PyTorch的基本概念和应用。学习计划概览学习周期：8周（每周约4-5小时）目标：掌握PyTorch基础，能够实现简单的深度学习模型。第1周：基础知识目标：了解深度学习的基础知识，掌握Python和NumPy基础。任务：学习Python基础（数据类型、控制流、函数、类）。资源
【机器学习-基础知识】统计和贝叶斯推断人类发明了工具 ML&DL学习分享机器学习概率论人工智能
1.概率论基本概念回顾1.概率分布定义：概率分布（ProbabilityDistribution）指的是随机变量所有可能取值及其对应概率的集合。它描述了一个随机变量可能取的所有值以及每个值被取到的概率。对于离散型随机变量，使用概率质量函数来描述。对于连续型随机变量，使用概率密度函数来描述。举例说明：投掷一颗六面骰子，每个面上的数字（1到6）都有相同的概率（1/6）出现，这就是一个简单的概率分布例子
AI驱动的代码重构与优化技术 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
AI驱动的代码重构与优化技术概述什么是AI驱动的代码重构与优化？AI驱动的代码重构与优化技术，是指利用人工智能，特别是机器学习和深度学习的算法，对软件代码进行自动分析和改进的技术。这种技术能够通过学习大量的代码样本，识别出代码中的模式、问题和改进点，从而自动完成代码的重构和优化。重构的定义重构（Refactoring）是改进代码内部结构而不改变外部行为的过程。其目的通常是为了提高代码的可读性、可维
机器学习Pandas_learn3 XW-ABAP 机器学习 pandas
frompandasimportDataFrameimportnumpypaints={"车名":["奥迪Q5L","哈弗H6","奔驰GLC"],"最低报价":[numpy.nan,9.80,numpy.nan],"最高报价":[49.80,23.10,58.78]}goods_in=DataFrame(paints,index=[1,2,3])print(goods_in)goods_in_n
机器学习中输入输出Tokens的概念详解爱吃土豆的程序员机器学习基础机器学习人工智能 Tokens
随着深度学习技术的快速发展，大语言模型（LargeLanguageModels,LLMs）已经成为自然语言处理（NLP）领域的一个热点研究方向。这些模型不仅能够生成高质量的文本，还能在多种任务中展现出卓越的表现，比如机器翻译、问答系统、文本摘要等。在大语言模型的工作流程中，Tokens的概念扮演着至关重要的角色。本文将详细介绍大语言模型如何使用Tokens，以及如何计算Tokens的数量。什么是T
【sklearn 01】人工智能概述 @金色海岸人工智能 sklearn python
一、人工智能，机器学习，深度学习人工智能指由人类制造出的具有智能的机器。这是一个非常大的范围，长远目标是让机器实现人工智能，但目前我们仍处在非常初始的阶段，甚至不能称为智能机器学习是指通过数据训练出能完成一定功能的模型，是实现人工智能的手段之一，也是目前最主流的人工智能实现方法深度学习则是机器学习的分支，超过8层的神经网络模型就叫深度学习，深度即层数。深度学习目前在语音、图像等领域取得很好的效果
【AI】使用Python实现机器学习小项目教程丶2136 AI 人工智能 python 机器学习
引言在本教程中，我们将带领您使用Python编程语言实现一个经典的机器学习项目——鸢尾花（Iris）分类。通过这个项目，您将掌握机器学习的基本流程，包括数据加载、预处理、模型训练、评估和优化等步骤。论文AIGC检测，降AIGC检测，AI降重，三连私信免费获取：ReduceAIGC9折券！DetectAIGC立减2元券！AI降重9折券！目录引言一、项目背景与目标二、开发环境准备2.1所需工具2.2环
AI人工智能中的概率论与统计学原理与Python实战：Python实现概率模型 AI天才研究院 AI实战 AI大模型企业级应用开发实战大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着人工智能技术的不断发展，概率论与统计学在人工智能领域的应用越来越广泛。概率论与统计学是人工智能中的基础知识之一，它们在机器学习、深度学习、自然语言处理等领域都有着重要的作用。本文将介绍概率论与统计学的核心概念、算法原理、具体操作步骤以及Python实现方法，并通过具体代码实例进行详细解释。2.核心概念与联系2.1概率论与统计学的区别概率论是一门数学学科，它研究随机事件发生的可能性。
技术解析麦萌短剧《月光下的你》：从「时间序列的对抗扰动」到「加密身份的收敛证明」萌萌短剧重构
《月光下的你》以十六年的时间跨度展开一场关于「数据污染」与「身份验证」的深度博弈，本文将用机器学习视角拆解这场跨越时空的模型纠偏实验。1.数据污染事件：十六年前的对抗攻击许芳菲（Agent_Xu）的遭遇可视为时间序列上的对抗样本注入：标签篡改攻击：许清清（Adversary_XuQing）通过伪造标签（Label_Tampering）将Agent_Xu与傅临州（Node_Fu）强行关联，触发道德约
机器学习 [白板推导]（三）[线性分类] 神齐的小马机器学习分类人工智能
4.线性分类4.1.线性分类的典型模型硬分类：输出结果只有0或1这种离散结果；感知机线性判别分析Fisher软分类：会输出0-1之间的值作为各个类别的概率；概率生成模型：高斯判别分析GDA、朴素贝叶斯，主要建模的是p(x⃗,y)p(\vec{x},y)p(x,y)概率判别模型：逻辑回归，主要建模的是p(y∣x⃗)p(y|\vec{x})p(y∣x)4.2.感知机4.2.1.基本模型模型：f(x
Ollama 基本概念 Mr_One_Zhang 学习Ollama ai
Ollama是一个本地化的、支持多种自然语言处理（NLP）任务的机器学习框架，专注于模型加载、推理和生成任务。通过Ollama，用户能够方便地与本地部署的大型预训练模型进行交互。1.模型（Model）在Ollama中，模型是核心组成部分。它们是经过预训练的机器学习模型，能够执行不同的任务，例如文本生成、文本摘要、情感分析、对话生成等。Ollama支持多种流行的预训练模型，常见的模型有：deepse
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他