KangRoger

《Deep Learning》(3)-概率和信息论

- 1 为什么需要概率
- 2随机变量
- 3 概率分布
  - 31 离散变量和概率质量函数
  - 32 连续变量和概率密度函数
- 4边际概率
- 5 条件概率
- 6 条件概率的链式法则
- 7独立和条件独立
- 8 期望方差和协方差
- 9常用概率分布
  - 伯努利分布
  - 多项分布
  - 高斯分布
  - 指数和拉普拉斯分布
  - 狄拉克分布和经验分布
  - 混合分布
- 10常用函数的有用特性
- 11贝叶斯准则
- 12连续变量的一些技术细节
- 13信息论
- 14构造概率模型

概率论是表示不确定的数学基础。它提供了表示表示不确定的方法和求解不确定表达式的公理。在人工智能领域，概率论主要有两种用途。1、概率论告诉我们人工智能怎么推论，因此我们可以设计算法计算或近似由概率论推导出来的公式。2、可以使用概率论和统计在理论上分提出的AI系统的行为。

概率论是许多科学和工程的基础工具。这一节确保一些数学不扎实的软件工程师可以理解本书的数学。

3.1 为什么需要概率？

计算机科学的许多分支处理的实体都是确定的。程序员可以安全的假设CPU将会完美无瑕地执行机器指令。硬件引起的问题太少了，以至于许多软件应用在设计时不用考虑它的发生。对比许多计算机工程师在相对稳定确定的环境下工作，机器学习使用概率论可能会让人惊讶。

机器学习处理的的事情是不确定的，有时还需要处理随机（非不确定）事情。而不确定性和随机性来自许多方面。总结一下，大概来自三个方面：
1、系统模型固有的随机性：例如，大部分量子论的解释，把原子内的微粒当做不确定的。例如洗牌，理论上我们假设了牌真正的随机洗过了。
2、不完整的观察：即使系统是确定的，但是我们也不能观察到所有影响系统行为的变量。
3、不完整的建模：当我们建模是，要舍弃一些信息。舍弃的信息导致模型预测的不确定性。

在许多实践中，更倾向于使用简单不确定的规则，也不去使用确定复杂的规则。例如，“鸟会飞，设计起来很简答”；但是真正正确的表述应该是“鸟当中，除了没有学会飞的幼鸟、生病的鸟、受伤的失去飞翔能力的鸟……，才会飞”。

概率论原本是描述事情发生的频率的。例如，在抽扑克游戏中，我们说一定概率 p 抽到某张牌，那么抽很多次，会大概有 p 比例的次数抽到这张牌；这是可以重复的实验。有些是不能重复的，例如一个医生说病人有40%的可能性患有流感，我们不能重复多次得到病人的拷贝来验证。这时需要信度degree of belief，1代表病人确定患有流感，0代表病人一定没有流感。
在上面两个例子中，第一种事件以一定概率发生，叫做频率概率frequentist probability。后一种，定性的准确性（例如诊断为流感情况下，诊断准确性的概率）叫做贝叶斯概率Bayesian probability。

如果要列出关于不确定性共有的特性，那么就是把贝叶斯概率和频率概率当做一样。例如，选手手中的牌已知，计算他赢得扑克游戏的概率；这和病人有某种症状，他患有某种病的概率计算方法相同。

概率论可以看做逻辑处理不确定性的拓展。在确定了命题A的真伪后，逻辑学为我们推导基于命题A的情况下，命题B的真伪；而概率论命题B真或伪可能性的大小。

3.2随机变量

随机变量是可以随机取一些值的变量。经常在变量右下角加上数字下标来表示随机变量可能的取值。例如， x1,x2 是随机变量x可能取的值。如果是向量的话，x是随机变量， x 是它可能取得值。

随机变量可能连续，可以能离散。离散随机变量状态有有限种，这些状态可以和数字无关。连续随机变量和一个实数相关联。

3.3 概率分布

概率分布是用来描述变量怎么分布在各个状态的。描述变量分布的方式要取决于这个变量是离散，还是连续。

3.3.1 离散变量和概率质量函数

离散变量的概率分布用概率密度函数（probability mass function, PDF），经常用 P 表示。

概率质量函数把一个状态映射为这个状态出现的概率。例如 x=x 用 P(x) 表示；如果其值为1，表示一定是等于 x ，如果值为零，表示一定不等于 x 。 P(x) 可以这样写 P(x=x) ，或者 x∼P(x)

如果有多个变量，其联合分布 P(x=x,y=y) 表示 x=x,y=y 的概率，也常常简写为 P(x,y) 。

关于离散随机变量 x 的概率质量函数 P 满足一下性质：
1、 P 要覆盖 x 可能取值的所有状态。
2、 ∀x∈x,0≤P(x)≤1
3、 ∑x∈xP(x)=1

3.3.2 连续变量和概率密度函数

连续变量的分布使用概率密度函数（Probability density function, PDF）来 p 表示，它满足
1、 p 必须覆盖变量 x 状态的所有范围
2、 ∀x∈x,0≤p(x) ，注意并不要求 p(x)≤1
3、 ∫p(x)dx=1

概率密度函数并没有给出这个状态出现的概率，它乘以一个区间表示状态在这个区间的概率 p(x)δx
例如在区间 [a,b] 的概率 ∫[a,b]p(x)dx 。

假设 x 在区间 [a,b] 上服从均匀分布，用函数 u(x;a,b) 表示。对于 x∉[a,b] ， u(x;a,b)=0 ；对于 x∈[a,b] , u(x;a,b)=1b−a 。这样的均匀分布，还可以用 x∼U(a,b) 表示。

3.4边际概率

我们知道关于变量集合的概率分布，有时我们还想知道在这个变量集合子集合上的概率分布。这样的概率分布叫做边际概率分布（Marginal Probability）。

离散变量时， P(x,y) ，可以使用求和准则得到

\forall x \in x, P (x = x) = \sum y P (x = x, y = y)

可以把 P(x,y) 写成行和列的形式，那么求一行的和（或一列的和）就可以求得上式。

对于连续变量，使用积分代替求和

p (x) = \int p (x, y) d y

3.5 条件概率

条件概率是在某事件已经发生情况下，另一个事件发生的概率。例如 x=x 已经发生时， y=y 的概率为

P (y = y | x = x) = P ( y = y , x = x ) P ( x = x )

注意，上式中

P(x=x)>0

3.6 条件概率的链式法则

联合概率函数，可以分解为只有一个变量的概率分布函数

P (x (1), \dots, x (n)) = P (x (1)) \prod i = 2 n P (x (i) | x (1), \dots, x (i - 1))

可能看起来不太直观，直观一点为：

P (x (1), \dots, x (n)) = P (x (1)) P (x (2) | x (1)) P (x (3) | x (1) x (2)) \dots

这是条件概率的链式法则。将上面定义应用两次

P (a, b, c) = P (a | b, c) P (b, c)

P (b, c) = P (b | c) P (c)

P (a, b, c) = P (a | b, c) P (b | c) P (c)

3.7独立和条件独立

如果两个变量独立，那么它们的联合概率等于它们概率的乘积。即 x,y 独立

\forall x \in x, y \in y, p (x = x, y = y) = p (x = x) p (y = y)

可以用

x⊥y 表示。

x,y 在给定 z 是条件独立

\forall x \in x, y \in y, z \in t e x t r m z, p (x = x, y = y | z = z) = p (x = x | z = z) p (y = y | z = z)

可以用

x⊥y|z 表示。

3.8 期望，方差和协方差

函数 f(x) 关于概率分布 P(x) 的期望可以用求和或积分求得：

E x \sim P [f (x)] = \sum x P (x) f (x)

或

E x \sim P [f (x)] = \int P (x) f (x) d x

期望是线性运算，例如

E x [α f (x) + β g (x)] = α E x [f (x)] + β E x [g (x)]

其中

α,β 不依赖

方差用来描述变量的波动大小的，定义如下：

V a r (f (x)) = E [(f (x) - E [f (x)]) 2]

如果方差比较小，说明

f(x) 聚集在其期望附近。方差的平方根叫做标准差。

协方差用来描述两个变量的线性依赖关系的强弱，定义如下

C o v (f (x), g (x)) = E [(f (x) - E [f (x)]) (g (y) - E [g (y)])]

如果协方差绝对值比较大，说明两个变量同时距离均值比较远。如果取值为正，说明两者同时变大；如果为负，说明两者一个变大，另外一个变小。其他衡量方法，例如相关系数，是把分布标准化，用来衡量它们之间相关性的大小。

协方相关和依赖有关系，但是它们是不同的概念。有关系，是因为两个独立的变量的方差为零；如果两个变量的协方差不为零，那么它们有依赖。独立和协相关是两个不同的属性。如果两个变量协方差为零，那么它们一定没有线性依赖关系。独立的要求更高，因为独立不仅仅要求非线性相关；零协方差只表示非线性相关。

例如从在区间 [−1,1] 上均匀分布上去一点 x ，在集合 (−1,1) 中取一个数 s 。假设 y=sx ， s 决定符号，而 x 决定幅度。显然 x,y 相关，但是 Cov(x,y)=0 。

向量 x∈Rn 的协方差矩阵是一个 n×n 的矩阵

C o v (x) i, j = C o v (x i, x j)

协方差矩阵的对角就是方差

C o n (x i, x i) = V a r (x i)

3.9常用概率分布

介绍几个常见的概率分布

伯努利分布

伯努利分布式一个二项分布，它只有一个变量表示等于1的概率： ϕ∈[0,1]

P (x = 1) = ϕ

P (x = 0) = 1 - ϕ

综合一下为：

P (x = x) = ϕ x (1 - ϕ) 1 - x

期望和方差为：

E x [x] = ϕ

V a r x (x) = ϕ (1 - ϕ)

多项分布

伯努利分布只有2个状态，多项分布状态可以大于2个。
伯努利分布和二项分布在离散变量分布中常常用到，因为离散变量状态可以统计。连续变量状态时，上面两个分布就不适用了。

高斯分布

高斯分布也叫作标准分布：

N (x; μ, σ 2) = 1 2 π σ 2 - - - - - \sqrt exp (- 1 2 σ 2 (x - μ) 2)

分布有两个参数

μ∈R 和

σ∈(0,∞) 控制，前者是均值，后者是方差:

E(x)=μ,Var(x)=σ2 .

还有一种形式

N (x; μ, β) = β 2 π - - - \sqrt exp (- 1 2 β (x - μ) 2)

在应用中常常使用高斯分布。在缺少先验知识情况下，使用高斯分布是一个明智的选择。因为：
1、我们要估计的分布可能就接近高斯分布。
2、在方差大小相同情况下，高斯分布包含的不确定性最大（即信息量最大）。

上面是单变量的高斯分布，把它扩展到多维叫做多方差标准分布，要用到正定对称矩阵 Σ

N (x; μ, Σ) = 1 ( 2 π ) n d e t ( Σ ) - - - - - - - - - - \sqrt exp (- 1 2 (x - μ) T Σ - 1 (x - μ))

μ 是分布的均值，这时是个矩阵。 Σ 是分布的协方差矩阵。还可以写成

N (x; μ, β - 1) = d e t ( β ) ( 2 π ) n - - - - - - \sqrt exp (- 1 2 (x - μ) T β (x - μ))

经常把协方差矩阵变为对角矩阵。还有一个更简单的isotropic高斯分布，它的协方差矩阵为单位矩阵乘以一个标量。

指数和拉普拉斯分布

在深度学习中，我们经常想要一个在 x=0 处有尖点（sharp point）的概率分布，指数分布（exponential distribution）就能满足这一点

p (x; λ) = λ 1 x \geq 0 exp (- λ x)

其中 1x≥0 表示当 x 为负数时，概率为零。

一个近似相关的拉普拉斯分布（Laplace distribution）可以让我们在点 μ 有锐点

Laplace (x; μ, γ) = 1 2 γ exp (- | x - μ | γ)

狄拉克分布和经验分布

在一些实例中，我们希望把概率分布的的所有质量（mass）都聚集到一个点，这时可以使用狄拉克分布 δ(x)

p (x) = δ (x - μ)

δ(x) 在非零点，其值为0，但是它积分还是1。狄拉克分布不是普通的函数，它是泛化函数（generalized function）。可以这样认为：狄拉克函数把其他地方所有的质量都一点点集中到了0处。它在 x=0 时值无限大，因为积分为1。

还有一个更常用的有狄拉克组成的分布，叫做经验分布

p^(x) = 1 m \sum i = 1 m δ (x - x (i))

狄拉克分布是定义在连续变量上的。

我们可以把狄拉克分布看做，从训练集中采样一些样本，使用采样的样本训练训练模型。

混合分布

常常联合几个概率分布来定义新的概率分布。经验分布就是狄拉克分布组合而来。

在使用联合混合分布时，那个分布起作用可以用多项分布控制

P (x) = \sum i P (c = i) P (x | c = i)

其中 P(c) 就是一个多项分布。

混合模型中，可以引出一个概念：潜在变量（latent variable）。潜在变量使我们不能直接观察到的变量，在上面的混合模型中 c 就是一个例子。潜在变量通过联合概率分布和 x 产生联系 P(x,c)=P(x|c)P(c) ，分布 P(c) 并不能直接观察到，但是我们还是可以定义 P(x)

非常重要和常用的联合模型是高斯混合模型，其中 p(x|c=i) 是高斯的。每个组成部分有单独的均值 μ(i) 和方差 Σ(i) ；在一些混合模型中，可能有对变量有更多限制。

除了均值和方差，高斯混合分布指定了每个 i 的先验分布（prior probability） αi=P(c=i) 。先验是指在观察到 x 以前已经知道 c 。一个对比， P(c|x) 是后验概率，因为它在观察到 x 后才计算。高斯混合模型是常用的近似密度，因为任何平滑的密度都可以被多变量高斯混合模型近似。

3.10常用函数的有用特性

logistic sigmoid

σ (x) = 1 1 + exp ( - x )

常常用来生成伯努利分布，因为它的输出范围是 (0,1) 。

softplus

ζ (x) = l o g (1 + exp (x))

softpuls常常为标准分布生成

β 或

σ ，因为它的输出范围是

(0,∞)

softpuls使用 max(0,x) 变化而来的，是它的平滑版本。

下面性质很有用，希望你能记住

σ (x) = exp ( x ) exp ( x ) + exp ( 0 ) d d x = σ (x) (1 - σ (x)) 1 - σ (x) = σ (- x) log (σ (x) = - ζ (- x) d d x ζ (x) = σ (x) \forall x \in (0, 1), σ - 1 (x) = log x 1 - x \forall x > 0, ζ - 1 (x) = log (exp (x) - 1) ζ (x) = i n t x - \infty σ (y) d y ζ (x) - ζ (- x) = x

3.11贝叶斯准则

已知 P(y|x) ，想知道 P(x|y) ；如果知道 P(x) ，可以使用贝叶斯准则计算

P (x | y) = P ( x ) P ( y | x ) P ( y )

P(y) 可以通过 P(y)=∑xP(y|x)P(x) 计算得来。
贝叶斯准则使用计算条件概率的。

3.12连续变量的一些技术细节

对于两个连续变量 x,y ，有如下关系 y=g(x) ，这里 g 是连续、可逆、可谓分的变换。现在来找 py(y) 和 px(x) 的关系。

| p y (g (x)) d y | = | p x (x) d x |

可以得到

p y (y) = p x (g - 1 (y)) \partial x \partial y

另一种形式

p x (x) = p y (g (x)) \partial g ( x ) \partial x

在高维空间中，微分泛化为雅克比矩阵的行列式 Ji,j=∂xi∂yj

p x (x) p y (g (x)) | det (\partial g ( x ) \partial x) |

3.13信息论

衡量一个事件的信息量，应该有一下准则：
1、发生概率越大的事件包含信息量越小。
2、发生可能性越小的事件，包含信息量越大。
3、相互独立的事件，信息量可以相加

定义自信息（self-information）, x=x

I (x) = - log P (x)

自信息只是定义单个事件，衡量一个概率分布的信息量使用香农熵（Shannon entropy）

H (x) = E x \sim P [I (x)] = - E x \sim P [log P (x)]

有两个关于 x 的分布 P(x) 、 Q(x) ，衡量两个分布的不同，可以使用相对熵（Kullback-Leibler divergence）

D K L (P | | Q) = E x \sim p [log P ( x ) Q ( x )] = E x \sim p [log P (x) - log Q (x)]

在机器学习中，常常这样使用： P 是真实分布，从中抽取一些符号，用来估计分布得到 Q ，要做的就是最小化 DKL 。

DKL 有许多有用的特性，用的最多的就是非负性。它用来衡量两个分布的距离，用一个分布估计另一个分布，最小化它们之间的 DKL 即可。注意， DKL 不是非负的。 DKL(P||Q)≠DKL(Q||P) ，在使用时要注意用哪个。

它和交叉熵相关，交叉熵为 H(P,Q)=H(P)+DKL(P||Q) ，缺少左边部分，变为：

H (P, Q) = - E x \sim P log Q (x)

最小化和 Q 相关的交叉熵等价于最小化KL距离，因为 Q 和 H(P) 无关，忽略它。

3.14构造概率模型

机器学习中的概率分布经常和许多变量相关。但是这些概率分布常常只和几个变量直接相关。使用单一函数构造概率分布效率低下，这时可以把概率分布划分为几个相关因子，之后再相乘。例如有三个变量 a,b,c ， a 影响 b ， b 影响 c ，但是在给定 b 时 a,c 不相关。可以这样描述这个分布

p (a, b, c) = p (a) p (b | a) p (c | b)

这个因式分解可以极大减少描述分布的参数。

可以用图来描述这样的因式分解：顶点的集合通过边来互相连接。当用图来表示概率的因式分解时，叫做构造概率模型后图模型。

主要有两种类型的构造概率模型：有向模型的和无向模型。两种类型都是使用图，顶点表示一个变量，通过边相关联的两个变量表示这两个变量在概率分布中有直接关系。

有向模型：图中的边是有向。如下图

关联的顶点的概率和它的父节点变量相关，父节点定义为 PaG(xi)

p (x) = \prod i p (x i | P a G (x i))

无向模型使用无向表示，它表示因式分解时使用一系列函数；这些函数和有向模型不同，它们不是任何形式的概率分布。几个顶点的集合叫做圈（clique），一个圈在一用变量 ϕ(i)(C(i)) 表示，它表示函数而不是分布。每个函数的输出大于0，但是并不保证其积分等于1。可以除以 Z 归一化，归一化后的概率分布为：

p (x) = 1 Z \prod i ϕ (i) (C (i))

如下图

概率分布为：

p (a, b, c, d, e) = 1 Z ϕ (1) (a, b, c) ϕ (2) (b, d) ϕ (3) (c, e)

深入理解Socket套接字原理 Princesk web应用测试学习 websocket tcp/ip python
Socket套接字原理1、什么是Socket在计算机领域，套接字Socket作为计算机之间进行通信的固定的约定方式之一存在。这种太抽象了，我举个例子，我们要是用笔记本电脑前需要先对电脑供电，那供电就有两种方式电线插座供电和电池供电，电网有电就用插座供电，电网没电就用笔记本的自带的电池供电。那么这个供电的工具（电池或者电线插座）就是套接字Socket。Socket起源于Linux系统，我们都知道Li
2023-03-14《第4章如何用OKR激励个体》读书笔记4.1 会思考的南瓜
在OKR的语境中，挑战性体现在即使全身心投入、全力以赴地工作，O也只能完成60%-70%，才是常态。如何才能设置出有挑战性的目标？约翰·洛克（著有《人类理解论》）认为，目标本身就具有激励作用，正确的目标能把人的需要转变为动机，激励人们自觉地朝着一定的方向努力，并最终完成预设的任务。目标设置的5项原则(1)目标要清晰，也就是符合SMART原则中的具体、可衡量以及时间导向。(2)目标要兼顾难度和重要性
C++学习笔记day3 既白765 c++学习
继承：好处：减少重复代码语法：class子类：继承方式父类子类也称为派生类，父类也称为基类。继承中的对象模型：父类中所有的非静态成员都会被子类继承。利用开发人员命令提示工具查看对象模型：跳转盘符C：跳转文件路径cd具体路径下查看命名cl/d1reportSingleClassLayout类名文件名继承中的构造和析构顺序：先构造父类再构造子类先析构子类再析构父类继承中同名成员处理方式：访问子类同名成
C++DAY02笔记
Printf格式化输出（printf）(printformat)函数的原型intprintf(格式化字符串，表达式1，表达式2······)，作用是显示格式串中的内容，并且在该字符串指定的位置插入要显示的值。格式化字符串：1.普通字符-》直接输出。2.转换说明-》以%开头的字符，表示一个占位符，会以表达式的值替换占位符。（常见的转换说明：%d:以整数的形式解释这片内存空间，并十进制的方式输出；%f
学《梁宁产品思维30讲》有槽——微信为什么成为了今天的微信神秘的尹先生
缘起：朋友圈的高分评价文档由搜狗录音助手录制并转写，简单整理后发出，纯属一时兴起吐槽发出。搜狗录音提供了11个小时的免费的转写时长，相比于科大讯飞，搜狗在互联网产品的运营上面的确是更能够讨我们这些C端客户的芳心。他至少让我完整地试一下，如果我觉得效果真的非常好，我才会花这个钱，而讯飞那个就太急功近利了，一两分钟的体验真白瞎了我们去下载APP，希望他们能够换一批运营，关于有道云笔记、讯飞系列的对比吐
得到三周年直播收获简记张照浩
好久没有节奏性的学习得到了，我体会的结论是--一旦停止，前功尽弃，此言不虚啊~哈哈。学的少，进步的少，这就是我的代价。幸好在中午看到朋友分享海报，点进了得到三周年的直播，信息量很大，干货满满，当时没有记笔记，复盘一下，固化下知识，也便于今后再学习。我理解的这场直播为什么会有的原因如下：1、强化仪式感和节奏感。2、正向引导，尊重付出，给予反馈和获得感。3、价值吸引，强化品牌影响力，做推广。4、践行价
不可多得的风味小吃——读杨勇的《家园四书》（笔记4）潜2023
身为亳州人，谁不喜欢了解亳州事？读杨勇先生（雅不知）的《家园四书》，相当于走进了亳州，了解她的过去和现在。《家园四书》总共有四部分组成，每一部分都是一道亳州风味的小吃，让你了解亳州的同时，更能咀嚼出她的美。《历史书：明月前身》写了亳州诸多历史人物。写得厚重大气，篇篇有铮铮铁骨，文笔刚劲有力，也不乏诙谐，偶有文白相间之处，读来很有韵味，像作者的书法，需得细细地品。它是亳州的肉夹馍，咔吱一口咬下去，满
Matlab学习笔记：矩阵基础
MATLAB学习笔记：矩阵基础作为MATLAB的核心，矩阵是处理数据的基础工具。矩阵本质上是一个二维数组，由行和列组成，用于存储和操作数值数据。在本节中，我将详细讲解矩阵的所有知识点，包括创建、索引、运算、函数等，确保内容通俗易懂。我会在关键地方添加MATLAB代码示例，帮助你直观理解。最后，我会总结本课重点，并引出下一节“逻辑基础”的内容。一、什么是矩阵？在MATLAB中，矩阵是一个二维数组，元
ROS个人笔记
写在前面：由于个人原因距离上次学习ROS已经过去了2周时间，本以为时间不算长，但还是忘记了好多。因此写下这篇笔记，主要是记录学习过程中的概念性问题，程序代码可能会写，但是不是主要。1.ROS是什么：是一个生态系统，首先他是一个操作系统。统筹各种资源如通信，开发等。2.在以往开发时一旦工程庞大起来往往会对数据流通的耦合十分苦恼，因此ROS提供的通信方式为松耦合式的：节点Node。另外大工程时的另外一
20180818《遇见心想事成的自己》读书笔记苗苗聊成长
读书时间：20180813-20180818此书主要分为两部分，第一部分是心想事成的秘密，第二部分是秘密后的秘密。看到这两个主题就想起，曾经有些时候，也会期盼着能够心想事成，让自己在困境中突围，然而往往不管用，上天总是不会给到你想要的东西。看了此书才恍然大悟，原来心想事成也有方法，也讲套路。秘密后的秘密，才是核心。在这个快餐式的时代，很多时候我们只学一些表面上的术，就想达成所愿，化解一切难题，往往
HCIP第一、二章笔记整理 aaaBsBsBsB 笔记网络 tcp/ip
第一章：TCP协议的扩展一、面向连接点到点：TCP通讯中仅存在通讯双方，无第三方。连接性质：非物理链路上的连接，而是逻辑上的连接。二、TCP的报文结构核心字段：包括源端口号（16位）、目标端口号（16位）、序列号（32位）、确认应答号（32位）、首部长度（4位）、保留位（6位）、标记位（如SYN、ACK、RST等）、窗口大小（16位）、校验和（16位）、紧急指针（16位）、选项（可变长度）及数据。
HCIP第一天课程笔记整理搞IT的马哥 IP 网络网络协议 tcp/ip 服务器
HCIP----huawei认证高级工程师抽象语言先转化成编码编码一定要转化成二进制（为什么一定要转化成二进制？）二进制信号转化成电信号处理电信号（协议等同于标准，目的就是提升服务）（1876年电话诞生，1946年第一台电子计算机诞生）OSI参考模型---OSI/RM---ISO（国际标准化组织）---1979年颁布开放式系统互联参考模型（应表会传网数物）应用层---提供各种应用服务，将抽象语言转
小红书增加曝光率晓谈小红书_46f9
小红书目前来说的话，主要是依靠内容口碑模式，社群类型营销，笔记，类似于大众电商类型，但是我个人觉得小红书更有优势，以下是我发过的一些操作推广小技巧可以了解下。推广大致大家都大同小异，我只能给予一些适当帮助，如有推广业务需求可以随时私聊我。以下是我个人一些增加曝光率一些方式1：过硬的内容加上适当的曝光，点赞，评论，收藏，转发，等于文章的热度与曝光率2：内容过硬的同时，文章也需要注意一下排版，底色，文
CA复习功课陈小铃子 linux 运维服务器云原生
RHCSA复习笔记（完善版）一、文件管理创建文件/目录：touch[文件名]：创建空文件或更新现有文件时间戳。mkdir[目录名]：创建目录。常用选项：-p递归创建多级目录。查看文件/目录：ls[选项][文件/目录]：列出目录内容。常用选项：-l详细列表，-a显示隐藏文件，-h人性化大小显示。cat[文件名]：查看文件内容（小文件），无法翻页。less[文件名]：分页查看文件内容，支持搜索（/），
《自由人生》读书笔记 2 西红柿阿达
原文:问题：“人生有何意义？”其实这个问题是容易解答的。人生的意义全是各人自己寻出来，造出来的：高尚、卑劣、清贵、污浊、有用、无用……全靠自己的作为。生命本身不过是一件生物学的事实，有什么意义可说？生一个人与一只猫、一只狗，有什么分别？人生的意义不在于何以有生，而在于自己怎样生活。你若情愿把这六尺之躯葬送在白昼做梦之上，那就是你这一生的意义。你若发愤振作起来，决心去寻求生命的意义，去创造自己的生命
【MoodVine】DeepSeek聊天持久化（2）：Spring AI + Redis实现对话记忆管理一只鱼吖【西瓜和晚霞】MoodVine spring redis java
在上一篇文章中，我们介绍了如何引入SpringAI，本文将深入探讨如何实现聊天记录的持久化存储。一、初始方案：内存存储的局限性在项目初期，我们使用简单的内存存储实现聊天记录管理：创建ChatController@RestController@RequestMapping("/chat")publicclassChatController{privatefinalOllamaChatModeloll
C练题笔记之：牛客-HJ012.字符串反转
题目：描述接受一个只包含小写字母的字符串，然后输出该字符串反转后的字符串。（字符串长度不超过1000）输入描述：输入一行，为一个只包含小写字母的字符串。输出描述：输出该字符串反转后的字符串。示例1输入：abcd复制输出：dcba结果：解题思路：获取字符串，用双指针，一头一尾开始交换，直至到中间。代码：#include#includeintmain(){charstr[1024]={};scanf(
STM32F4-ETH通信（lwip）——学习笔记_stm32 lwip 2401_84010497 程序员嵌入式
7、CSMA/CD冲突检测：8、MAC子层：MAC数据包、MAC数据包格式、MAC地址：MAC地址由48位数字组成，它是网卡的物理地址，在以太网传输的最底层，就是根据MAC地址来收发数据的。部分MAC地址用于广播和多播，在同一个网络里不能有两个相同的MAC地址。PC的网卡在出厂时已经设置好了MAC地址，但也可以通过一些软件来进行修改，在嵌入式的以太网控制器中可由程序进行配置。数据包中的DA是目标地
日更92/365：我为什么要写作？富足的徐欢
我为什么要写作？这是真是一个好问题，若在做一件事情之前，知道自己的目标动机和需求，才能排序，分配好自己的时间。余生我想把写作当成我的习惯，因为在写作上面我可以有下面三个方面的提升：1.整理笔记有时，我们听完一堂课，会感觉到心潮澎湃，可是若没有把它整理成笔记或写践行清单，假以时日，这些没有被运用或链接的知识信息会在大脑处抹去。所以整理笔记是最优的辅助学习方法。2.梳理情绪相信大家都有这种体验，当我们
解决修改android手机设置中字体大小后系统布局混乱的方法 f44148db1e8c
均属于笔记，仅供个人参考，有问题欢迎指正重写getResources方法@OverridepublicResourcesgetResources(){//returnsuper.getResources();//解决修改android手机设置中字体大小后系统布局混乱的方法，重构getResources，修改系统倍数对应用内sp的影响；Resourcesres=super.getResources(
机器学习数据预处理阶段为什么需要——归一化处理
参考：https://www.cnblogs.com/bjwu/p/8977141.html通常，在DataScience中，预处理数据有一个很关键的步骤就是数据的标准化。这里主要引用sklearn文档中的一些东西来说明，主要把各个标准化方法的应用场景以及优缺点总结概括，以来充当笔记。提升模型精度在机器学习算法的目标函数(例如SVM的RBF内核或线性模型的l1和l2正则化)，许多学习算法中目标函数
读书笔记||《焦虑者自救手册》（二）徐小胖杂谈
书名：《焦虑者自救手册》阅读进度：43-83页阅读时间：30分钟阅读思考问题：1、关于忧虑的5种积极信念2、列举一个你的忧虑案例，用以上的五种积极信念进行分析，看看你赞成哪种或者哪几种信念？3、对忧虑进行审判时，我们通常需要扮演哪三种角色？4、用你自己忧虑的一个例子，分别用辩方律师和公诉律师的角度，为它辩护，写下证词。5、最终经过以上辩护，你将得出怎样的判决？金句摘抄：1、如果你对某件事感到忧虑，
李航老师-统计学习小三爷_df1b
三个准则1.作为入门选手，不要每章都看2.不要从零造轮子去实现算法，太浪费时间3.必须能手推公式章节目录##统计学习概论-统计学习的目的是对数据进行==预测与分析==-统计学习的前提是同类数据具有一定的统计规律性-统计学习的方法-监督学习(supervisedlearning)-非监督学习(unsupervisedlearning)-半监督学习(semi-supervisedlearning)-强
京东618大额券怎么领？京东有大额优惠券吗？直返APP淘客项目
京东618购物节：解锁APP直返大额券，畅享购物狂欢京东618购物节，这场年度购物盛宴，无疑是每一位消费者心中的期盼。在这场盛宴中，大额优惠券如同宝藏一般，等待着精明的你去发掘。而掌握领取大额券的秘诀，将让你的购物之旅更加畅快淋漓，尤其是当你充分利用京东APP的优势时。一、如何在京东APP轻松领取大额券？月入十万必看！都在挣钱！推荐几个月入几千到几万的靠谱副业项目！（公众号：善士思维笔记）返利就用
“重复”定义函数的睿智(Python/与ai助手“智普清言”深度交流) 梦幻精灵_cq 笔记学习
镜像双胞谬重复，定制便捷巧活工。笔记模板由python脚本于2025-07-1612:16:30创建，本篇笔记适合至少通晓一门语言，熟悉基本编程范式的coder翻阅。学习的细节是欢悦的历程博客的核心价值：在于输出思考与经验，而不仅仅是知识的简单复述。Python官网：这里，才python前沿。英文原版，原汁原味，才是寻根溯源的正统。地址：https://www.python.org/F
偶拾《退让》，一阙仿七律带出的文化思考(中文诗创作) 梦幻精灵_cq 笔记学习
礼貌温言沐春风，谦让理解通彼此。笔记模板由python脚本于2025-07-0111:29:03创建，本篇笔记适合喜欢中文仿古七言诗的coder翻阅。学习的细节是欢悦的历程博客的核心价值：在于输出思考与经验，而不仅仅是知识的简单复述。Python官网：这里，才python前沿。英文原版，原汁原味，才是寻根溯源的正统。地址：https://www.python.org/Free：大咖
阿里通义千问Qwen3深夜升级：架构革新+性能碾压俊哥V AI AI新闻热点由AI辅助创作 AI 人工智能
（以下借助DeepSeek-R1&Grok3辅助整理）北京时间2025年7月22日凌晨，阿里云通义千问团队发布了Qwen3旗舰模型的最新更新——Qwen3-235B-A22B-Instruct-2507-FP8。这一更新不仅在性能上实现了突破，还标志着开源大模型技术架构的重大进化。本报告基于官方发布信息、社区反馈以及相关分析，全面解读该更新的技术细节、性能表现、社区反应及未来展望。一、技术架构与战
2022年第六次一周小结（09.11-09.17）龚宇佳
上周总结：1.阅读28h。第一，上周整理了《深度思维》剩余笔记，目前整本书的笔记都整理完成。第二，开始阅读黄奇帆的《分析与思考》，之前看过他的《结构性改革》，两本书有相似的地方，但值得一看。第三，继续精读《态度改变与社会影响》，需要思考和做笔记的比较多，因此进度比我想得要慢，上周没有达成计划目标。2.写作2h。上周继续保持日更。3.语言学习12.5h。I.粤语学习方面。模仿电影《回魂夜》，且听黄子
【软考速通笔记】系统架构设计师⑱——大数据架构设计理论与实践小康师兄系统架构设计师笔记系统架构大数据 Lanbda Kappa 数据湖批处理
文章目录一、前言二、传统数据库遇到的问题2.1问题的根源2.2传统解决方法三、大数据基础3.1大数据处理技术3.2大数据利用过程3.3大数据处理系统面临的挑战3.4大数据具有的属性和特征四、Lanbda架构4.1批处理层4.2加速层4.3服务层五、Kappa架构5.1实时层5.2服务层六、Lambda和Kappa对比七、其他一、前言笔记目录大纲请查阅：【软考速通笔记】系统架构设计师——导读关注【小
Here-Document的`＜＜` 与 `＜＜-` 与 `＜＜＜` 多解说笔记250722 kfepiza #Linux #控制台命令行 Shell bash cmd 等笔记 linux bash
Here-Document的poem.txt静夜思床前明月光疑是地上霜FORMATTED#2.空格敏感的配置catconfig.ymlindentation:level:4#必须4空格SPACE何时用tabs.txt重要制表符:→这里Tab会被保留但行首Tab会被移除TABS#2.空格缩进的环境#（如Python脚本）技术原理图解HereDocumentquery.sqlSELECT*FROM${
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在