简之

『统计学』第四部分：回归分析和卡方检验

『回归分析』

『线性回归中的平方误差』

如上图，线性回归的平方误差如下：

$SE_{line} = (y_1 - (mx_1 + b))^2 + (y_2 - (mx_2 + b))^2 + ... + (y_n - (mx_n + b))^2$

$\;$

『线性回归公式的推导』

根据前面得到的线性回归的平方误差，对公式做进一步推导：
$\begin{aligned} SE_{line} &= (y_1 - (mx_1 + b))^2 + (y_2 - (mx_2 + b))^2 + ... + (y_n - (mx_n + b))^2 \\ &= y_1^2 - 2y_1(mx_1 + b) + (mx_1 + b)^2 \\ &\quad + y_2^2 - 2y_2(mx_2 + b) + (mx_2 + b)^2 \\ &\quad + ... \\ &\quad + y_n^2 - 2y_n(mx_n + b) + (mx_n + b)^2 \\ & = (y_1^2 + y_2^2 + ... + y_n^2) -2mb(x_1 + x_2 + ... + x_n) -2b(y_1 + y_2 + ... + y_n) \\ &\quad + m^2(x_1^2 + x_2^2 + ... + x_n^2) + 2mb(x_1 + x_2 + ... + x_n) + nb^2 \end{aligned}$

利用均值来做替换，得到：

$SE_{line} = n\overline {y^2} - 2mn\overline {xy} - 2bn\overline y + m^2n\overline {x^2} + 2mbn\overline x + nb^2$

下面画出 $SE_{line}$ 对m和b的曲面：

要求使得 $SE_{line}$ 最小的m和b，可以对m和b求偏导，在最低点处导数为零。

$-2n\overline{xy} + 2mn\overline{x^2} + 2bn\overline x = 0$

$-2n\overline y + 2mn\overline x + 2bn = 0$

化简可以得到：
$m\overline {x^2} + b\overline x = \overline{xy}$

$m\overline {x} + b = \overline{y}$

比较最佳拟合直线的方程： $y = m x + b$ ，我们可以发现：

x和y的均值落在最佳拟合直线上，这里确定拟合直线的一个点 $(\overline x, \overline y)$ 。

两点确定一条直线，我们还需要确定一个点，将第一个式子化成 $m x + b$ 的形式，得到：

$m{\overline x^2 \over \overline x} + b = {\overline{xy} \over \overline x}$

这就得到最佳拟合直线上的另外一个点的坐标 $({\overline x^2 \over \overline x}, {\overline{xy} \over \overline x})$ 。

于是我们就确定最佳拟合直线上的两个点： $(\overline x, \overline y)$ 和 $({\overline x^2 \over \overline x}, {\overline{xy} \over \overline x})$

接下来求出m和b：

${\overline y - {\overline{xy} \over \overline x} \over \overline x - {\overline x^2 \over \overline x}} = {\overline x · \overline y - \overline {xy} \over (\overline x)^2 - \overline {x^2}}$

$\overline y - m \overline x$

下面来看个例子，我们去拟合下面三个点：
得到：

${3\over 7}，b = 1$

所以：

${3\over 7}x + 1$

『决定系数 $R^2$ 』

对于直线的拟合程度，我们当然可以计算出具体有多少误差，但是还有一种对直线拟合程度更有意义的估计：

首先提个问题：y的波动程度有多少百分比能被 x 的波动程度所描述？

这里，我们可以先求出y的总波动：

$SE_{\overline y} = (y_1 - \overline y)^2 + (y_2 - \overline y)^2 + ... + (y_n- \overline y)^2$

我们想求出 $x$ 波动所描述的百分占比，但是这个百分比不太好衡量，其实可以换个思路，看看y有什么波动没有被x的波动所描述？

于是我们考虑一下，总波动中有多少没有被回归线所描述，对此我们已经有了衡量，就是直线的平方误差，这个误差是没有被回归线描述的。于是我们得到：

${SE_{Line} \over SE_{\overline Y}}$

表示总波动中有多少百分比没有被x的波动所描述，或者说，没有被回归线所描述。

那么，回到前面的问题，我们想知道“多少百分比由x的波动描述”这一问题，只需要看剩下的就行了。于是得到：

$r^2 = 1 - {SE_{Line} \over SE_{\overline Y}}$

这告诉我们总波动有多少百分比被直线所描述，或者说被x的波动描述，这个数字称作决定系数，记做 $r^2$ 。

$r^2$ 越接近于1，则y的波动很多都被x的波动描述，说明直线拟合的好。

『协方差和回归线』

协方差的定义为：两随机变量离各自均值距离之积的期望值。

$c o v (X, Y) = E [(X - E [X]) (Y - E [Y])]$

其实，协方差就是表示两变量多大程度上一同变化。

如何理解这句话？
假设总体中有一个点（随机变量的一个实例），也就是从总体中抽取的一个样本：X = 1，Y = 3，已知 $E [X] = 0$ ， $E [Y] = 4$ ， $X - E [X] = 1 - 0 = 1, Y - E [Y] = 3 - 4 = - 1$ ，这表示，对于这个样本，从X和Y中抽取一个样本后，X高于期望值，Y低于期望值，如果对于总体，情况都是如此，那么协方差就会得到负数，一个上升另一个就下降，一个下降另一个就上升，如果两者同时上升，同时下降，那么就是正协方差，同步程度确定协方差的大小。

我们来看一下如何将协方差的定义同最小二乘回归联系起来。

下面对协方差的定义做些变化：

$\begin{aligned} Cov(X, Y) &= E[(X - E[X])(Y - E[Y])] \\ & = E[XY - XE[Y] - E[X]Y + E[X]E[Y]] \\ & = E[XY] - E[XE[Y]] - E[E[X]Y] + E[E[X]E[Y]] \\ & = E[XY] - E[X]E[Y] - E[X]E[Y] + E[X]E[Y] \\ & = E[XY] - E[X]E[Y] \end{aligned}$

其中， $E [X Y]$ 可以用X、Y积的样本均值 $\overline{XY}$ 近似， $E [X]$ 可以用 $\overline X$ 近似， $E [Y]$ 可以用 $\overline Y$ 近似，那么两随机变量的协方差可以用 $\overline{XY} - {\overline X}· {\overline Y}$ 表示，这就是回归线斜率的分子部分。

回归线的斜率如下：

$\hat m = {\overline {xy} - \overline x · \overline y \over \overline {x^2} - (\overline x)^2} = {Cov(X, Y) \over Var(X)}$

这样就将协方差的定义同最小二乘回归联系起来。

『 $\chi^2$ 分布』

面对一个新的分布，首先，我们提出人生的终极三问：

你是谁？
从哪里来？
到哪里去？

下面我们就从这三个方面来了解一下 $\chi^2$ 分布：

（1）第一个问题， $\chi^2$ 分布是个啥？

若n个相互独立的随机变量 $\xi_1，\xi_2，...，\xi_n$ 均服从标准正态分布（也称独立同分布于标准正态分布），则这n个服从标准正态分布的随机变量的平方和

$∑_{i=1}^nξ^2_i$

构成一个新的随机变量，其卡方分布规律称为 $\chi^2$ 分布（chi-square distribution），其中参数n称为自由度，正如正态分布中均值或方差不同就是另一个正态分布一样，这里卡方分布自由度不同就是另一个分布。记为 $\sim \chi^2(k)$ 。卡方分布是由正态分布构造而成的一个新的分布，当自由度n很大时， $\chi^2$ 分布近似为正态分布。

如下图，从一个标准正态分布中采样样本，并取平方，得到的是自由度为1的卡方分布： $Q_1 = \chi^2_1$ ；

从两个独立的标准正态分布中采样样本，并取平方和，得到的是自由度为2的卡方分布： $Q_2 = \chi^2_2$ ；

下面看一下 $\chi^2$ 分布的图像：

随着自由度的增加，卡方分布的曲线逐渐右移，这里可以直观的解释一下：
因为卡方分布是由标准正态分布采样来的，根据正态分布的曲线，采样到0附近的概率最大，所以当自由度很小时，卡方分布在靠近0的地方概率就很大，但是随着自由度的增加，卡方分布的随机变量变成了很多样本点的平方和，当然得到0的概率逐渐减小，均值逐渐增大，所以卡方分布的曲线逐渐右移，当自由度n很大时， $\chi^2$ 分布近似为正态分布。

（2）第二个问题， $\chi^2$ 分布从哪里来？

从前面的介绍就可以知道了， $\chi^2$ 分布是从正态分布中采样来的分布，同其他分布一样，肯定是这种分布在自然界中普遍存在，并且可以用来解决一些问题，所以统计学家才会去研究这种分布的性质，构造一些通用的“模板”（统计学的第一部分提到了这个概念），来供我们使用。

这样，自然而然地引入第三个问题，这玩意儿到底可以用来干啥？

（3）第三个问题， $\chi^2$ 分布有什么用？（到哪里去？）

首先，简短地概括： $\chi^2$ 分布用于检验理论分布同观测结果吻合得有多好。

所以，这个分布的用处就是，衡量离期望值的误差有多大。

所以，在下面这种情况下，可以使用 $\chi^2$ 分布：

以特定概率分布为某种情况进行建模时，事物长期结果较为稳定，能够清晰进行把握。但是期望与事实存在差异怎么办？偏差是正常小幅度波动引起的或者是建模错误，如何来判别？此时，可以利用卡方分布分析结果，排除可疑结果。【事实与期望不符合的情况下，使用卡方分布进行检验】

通常，对我们我们来说，使用 $\chi^2$ 分布时，同正态分布和t分布一样，只要知道如何查 $\chi^2$ 分布表就可以了，下面看一下如何使用：

如图，我们想要求 $Q_2 > 2.41$ 的概率：

从表格中可以查到：自由度为2的 $\chi^2$ 分布 $Q_2$ 的值大于2.41的概率为0.3，所以如下图所示：阴影部分的面积就是0.3。

『卡方检验』

卡方检验是一种基于卡方分布的常用的统计（显著性）检验，其统计量在原假设成立时服从卡方分布。

在不明确说明的情况下，卡方检验默认指代皮尔森卡方检验，根据样本数据推断总体分布与期望分布是否有显著差异，或推断分类变量间是否相互关联或彼此独立。

皮尔森卡方检验：拟合优度检验
$\;$
假设实验中从总体中随机取样得到的 n 个观察值被划分为 k 个互斥的分类，这样每个分类都有一个对应的实际观察次数 $x_{i}({\displaystyle i=1,2,...,k})$ 。研究人员会对实验中各个观察值落入第 i 个分类的概率 ${p_{i}}$ 的分布提出零假设，从而获得了对应所有第 i 分类的理论期望次数 ${m_{i}=np_{i}}$ 以及限制条件：
$\;$
${\sum _{i=1}^{k}{p_{i}}=1}$ 以及 ${\sum _{i=1}^{k}{m_{i}}=\sum _{i=1}^{k}{x_{i}}=n}$ 。
$\;$
皮尔森提出，在上述零假设成立以及 n 趋向 $\infty$ 的时候，以下统计量的极限分布趋向 $\chi^{2}$ 分布：
$\;$
${X^{2}=\sum _{i=1}^{k}{\frac {(x_{i}-m_{i})^{2}}{m_{i}}}=\sum _{i=1}^{k}{\frac {x_{i}^{2}}{m_{i}}}-n}$
$\;$
皮尔森首先讨论零假设中所有分类的理论期望次数 $m_{i}$ 均为足够大且已知的情况，同时假设各分类的实际观测次数 $x_{i}$ 均服从正态分布。皮尔森由此得到当样本容量 n 足够大时， $X^{2}$ 趋近服从自由度为 $(k - 1)$ 的 $\chi^{2}$ 分布。

不同的卡方检验使用不同的计算公式计算统计量，卡方检验都假设其使用的统计量服从卡方分布。

对分类数据进行分析的统计方法主要是利用卡方分布，也被称作卡方检验。

卡方检验的应用主要表现在两个方面，分别是拟合优度检验和独立性检验，前者用于单变量，后者用于双变量。

1、分类数据与卡方统计量

数据类型一般可分为无序类别数据、有序类别数据和数值型数据，在处理无序类别数据和有序类别数据时需要特别注意，当你用一个数字去代替某一类别时，需时刻记得数字之间的间隔不能反映类别之间的差距，在有序类别中仅可以用来比较大小，在无序类别中仅仅是一个代号而已。

我们常用类别出现的频数对分类数据进行分析，而卡方检验正可以对这类数据进行分析。

卡方检验其实是测定两个分类变量之间的相关程度，它是利用类别变量的观测值频数与期望值频数进行构建的：

$\chi^2 = \sum {(f_o - f_e)^2 \over f_e}$

其中： $f_o$ 代表观察值频数， $f_e$ 代表期望值频数；

可以看到，卡方统计量其实反映了观察值频数和期望值频数之间的差距，当差距较小时，统计量的值也会变小。所以卡方检验正是通过计算卡方统计量与临界值进行比较来确定相关的显著性的。

2、拟合优度检验

拟合优度检验很简单，它符合假设检验的的基本理论，所以使用的流程与之前的假设检验是一样，我们来看一个例子，你就知道它在说什么：

例1：

泰坦尼克沉船事件：当时船上2208人，男性1738人，女性470人，海难发生后，幸存者718人，其中男性374人，女性344人，我们想知道幸存状况是否与性别有关。

总结为下表：

-	男性	女性	总数
船上	1738	470	2208
幸存	374	344	718

这个问题在机器学习上会是另外一种问法：性别对预测是否存活的贡献有多大，其实二者想表达的东西是一样的，因为只涉及到一个变量，所以是一个单变量分析的方法：

我们想知道幸存状况是否与性别有关，所以要去做假设检验：

$H_0：$ 幸存状况与性别无关；
$H_1：$ 幸存状况与性别有关；

这里设定显著性水平是5%。

首先，我们已经知道了观察频数：男性374人，女性470人，那期望频数如何计算呢，这里需要提到我们的假设条件，我们的原假设是：存活与性别无关。这意味着在存活的人中，男女存活的比例应该与总人数中男女比例是一样的。所以，男性期望频数： $\over 2208} = 565$ 。女性的期望频数： $\over 2208} = 153$ ，如下：

-	男性	女性	总数
船上	1738	470	2208
幸存	374	344	718
Expected	565	153	718

下面构造卡方统计量：

$\chi^2 = \sum {(f_o - f_e)^2 \over f_e} = {(374 - 565)^2 \over 565} + {(344 - 153)^2 \over 153} = 303 + 19.82 = 322.82$

由于度为分类变量类型个数-1，所以，这里服从自由度为1的卡方分布。

我们查得此状态下的p值远小于0.025，所以存活状况与性别显著性相关。

例2：

我正考虑购入一家餐厅，我询问目前的店主，店内每天顾客数的分布是怎样的？于是他给了我这样一个分布：

Day	M	T	W	T	F	S
店主(%)	10	10	15	20	30	15
观测值	30	14	34	45	57	20

我有些怀疑，想检验他给我的分布和我观测的数据是否吻合，于是我得到一周内的观测值，要看是否吻合，所以，我需要进行假设检验：

$H_0：$ 店主的分布是正确的；
$H_1：$ 店主的分布是错误的；

显著性水平是5%。

我要根据这些数据计算出一个统计量，且统计量近似服从卡方分布。

思路： 根据特定自由度的卡方分布，计算卡方统计量，我想知道得到这样或更极端结果的概率是否小于5%，如果该概率小于5%，我将拒绝零假设，也就是拒绝店主的分布。如果卡方统计量得到如此极端或更极端的概率大于显著性水平 $\alpha$ ，我就不能拒绝它，没有理由认为店主在撒谎。

假设店主的分布是正确的，在此前提下，观测值预计会得到多少呢？我们得到下面的期望值：

Day	M	T	W	T	F	S	总计
店主(%)	10	10	15	20	30	15	100
观测值	30	14	34	45	57	20	200
Expected	20	20	30	40	60	30	200

下面计算卡方统计量：

由于这里只是近似卡方分布，所以我们写作 $X^2$ 。

$X^2 = {(30 - 20)^2 \over 20} + {(14 - 20)^2 \over 20} + {(34 - 30)^2 \over 30} + {(45 - 40)^2 \over 40} + {(57 - 60)^2 \over 60} + {(20 - 30)^2 \over 30} = 11.44$

我们先求出5%概率对应的临界 $\chi^2$ 值，如果我们这里求出的的结果比该临界值更极端，我们就拒绝零假设。

下面求临界 $\chi^2$ 值：

我们要先求出自由度，这里总共求了6次和，也许会误认为这里的自由度是6，其实，通过前5条信息就能求出第6条信息，n个像这样的数据点，对比观测值和预计值，自由度只有 $n - 1$ ，因为第n个数据点能够通过其它数据求出，因此，这里的自由度是5。

对于显著性水平是5%，自由度是5的卡方分布，查 $\chi^2$ 分布表：

查得临界 $\chi^2$ 值是11.07，在图中的位置如下：

结果至少达到11.07这么极端的概率是5%。

$\chi^2_c = 11.07$

而我们得到的结果11.44甚至比这更极端，可能性更小，其概率小于显著性水平，因此我们将拒绝店主给我们的分布。

3、独立性检验

拟合优度检验可以看作是独立性检验的特例，独立性检验通常对两个变量进行检验，查看这两个类别变量之间是否存在某种联系。

例1：

已知原料有不同的等级，而原料又来自不同的地区，我们关心等级与产地是否有关，对这两个变量关系的检验，就可以用到独立性检验，通常利用一种叫做列联表的方式呈现，所以也被称作列联分析，我们来看等级和产地的例子：

以上非合计的单元格就是观察频数，所以我们现在需要计算期望频数，我们以第一单元，即来自甲地区一级原料的期望数量为例：

首先一级原料占比： $162 / 500$ ，然后计算甲地区原料占比： $140 / 500$ ，那么原本甲地区一级原料应该是： $\over 500})({162 \over 500})*500 = 45.36$ ，依次类推得到计算的期望值：

构造统计量 $\chi^2 = \sum {(f_o - f_e)^2 \over f_e} = 19.82$ ，服从自由度 $(3 - 1) (3 - 1) = 4$ 的卡方分布，由于 $\chi^2 > \chi^2_{0.05}(4) = 9.4877$ ，所以可以认为原料登记受地区影响。

基于以上我们可以看到 $\chi^2$ 检验其实可以用来做变量初筛，而且它没有皮尔逊相关性的线性假设。

例2：

以最著名的皮尔森卡方检验为例，假设我们认为惯用手与性别无关，即原假设为惯用手与性别相互独立，并且我们得到的数据可以总结在一个列联表中：

-	男（期望）	女（期望）	总计
右	43（45.24）	44（41.76）	87
左	6（6.76）	4（6.24）	13
总计	52	48	100

其中的期望为在原假设下每种情况的期望次数，计算公式为：

$E_{i,j} = {{(\sum^c_{n_c=1}O_{i, n_c})·(\sum^r_{n_r=1}O_{n_r, j})} \over N}$

其中N为样本大小。

统计值的计算公式为：

$\chi^2 = \sum^r_{i=1}\sum^c_{j=1}{(O_{i,j} - E_{i,j})^2 \over E_{i,j}}$

根据上式可以计算本例中统计值为：

$\chi^2 = {(43-45.24)^2 \over 45.24} + {(44-41.76)^2 \over 41.76} + {(9-6.76)^2 \over 6.76} + {(4-6.24)^2 \over 6.24} = 1.777$

而自由度为 $(r - 1) (c - 1) = (2 - 1) (2 - 1) = 1$ 。

查表可得在统计量为1.777，自由度为1的情况下p-值是0.1825，大于0.05，无法拒绝原假设，即无法拒绝惯用手与性别独立的假设。

另外值得一提的一点是不仅有卡方检验使用卡方分布，许多著名的统计检验也假设其统计量在原假设成立的情况下服从卡方分布。

由此，可以看出：
卡方检验可以研究类别变量之间是否相互关联或彼此独立

参考文献：
[1] 卡方机器之心
[2] 卡方检验维基百科
[3] 分类数据与卡方检验知乎
[4] 统计可汗学院

如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
群体遗传分析（一）#学习笔记 kangroomoon
哈温的遗传平衡定律是基础，费、莱、霍的群体遗传学是数学基础和理论框架，木村资生的中性进化论深化了自然选择的概念。中性学说认为：分子水平上的遗传变异在很大程度上是中性的，变异程度主要由突变速率和有效群体大小决定。（通过观察值和理论值之间的差异性测验中性进化假说）群体遗传多态性与结构分析Locus：遗传座位，在群体中通常包含多个allele：等位基因，即遗传多态性。大多数的新突变是由于geneticd
几何分布的期望和方差公式推导_算法数学基础-统计学最基础之均值、方差、协方差、矩... weixin_39848097 几何分布的期望和方差公式推导均值定理六个公式概率论方差公式
我们天天都可以接触很多随机现象，比如每天的天气不一样气温是我们最直接的感受，我们很难预测明天的精确问题，但是这些随机现象又体现出了一定的规律性。比如上海7月份平均35度左右，冬天的平均温度在5度左右。所以35、5这些数字体现了某种稳定性。所以除了前面几章中讲到的分布律和概率密度函数可以表征随机变量外，还可以用一组数字来表达随机变量的一般特性。这就是我们今天要讲到的随机变量的数字特征。通过对数字特征
CTF 竞赛密码学方向学习路径规划 David Max CTF 学习笔记密码学 ctf 信息安全
目录计算机科学基础计算机科学概念的引入、兴趣的引导开发环境的配置与常用工具的安装WattToolkit（Steam++）、机场代理Scoop（Windows用户可选）常用Python库SageMathLinux小工具yafuOpenSSLMarkdown编程基础Python其他编程语言、算法与数据结构（可选）数学基础离散数学与抽象代数复杂性分析密码学的正式学习兴趣的培养做题小技巧系统学习需要了解并
深度学习算法，该如何深入，举例说明 liyy614 深度学习
深度学习算法的深入学习可以从理论和实践两个方面进行。理论上，深入理解深度学习需要掌握数学基础（如线性代数、概率论、微积分）、机器学习基础和深度学习框架原理。实践上，可以通过实现和优化深度学习模型来提升技能。理论深入数学基础线性代数：理解向量、矩阵、特征值和特征向量等，对于理解神经网络的权重和偏置矩阵至关重要。概率论：用于理解模型的不确定性，如Dropout等正则化技术。微积分：理解梯度下降等优化算
数学基础 -- 线性代数正交多项式之勒让德多项式展开推导 sz66cm 线性代数决策树算法
勒让德多项式展开的详细过程勒让德多项式是一类在区间[−1,1][-1,1][−1,1]上正交的多项式，可以用来逼近函数。我们可以将一个函数表示为勒让德多项式的线性组合。以下是如何推导勒让德多项式展开系数ana_nan的详细过程。1.勒让德展开的基本假设给定一个函数f(x)f(x)f(x)，我们希望将它表示为勒让德多项式的线性组合：f(x)=∑n=0∞anPn(x),f(x)=\sum_{n=0}^
数学基础 -- 线性代数之格拉姆-施密特正交化 sz66cm 线性代数机器学习人工智能
格拉姆-施密特正交化格拉姆-施密特正交化（Gram-SchmidtOrthogonalization）是一种将一组线性无关的向量转换为一组两两正交向量的算法。通过该过程，我们能够从原始向量组中构造正交基，并且可以选择归一化使得向量组成为标准正交基。算法步骤假设我们有一组线性无关的向量{v1,v2,…,vn}\{v_1,v_2,\dots,v_n\}{v1,v2,…,vn}，其目标是将这些向量正交化
数学基础 -- 线性代数之矩阵的迹 sz66cm 线性代数机器学习决策树
矩阵的迹什么是矩阵的迹？矩阵的迹（TraceofaMatrix）是线性代数中的一个基本概念，定义为一个方阵主对角线上元素的总和。矩阵的迹在许多数学和物理应用中都起着重要作用，例如在矩阵分析、量子力学、统计学和系统理论中。矩阵迹的定义对于一个n×nn\timesnn×n的方阵AAA：A=(a11a12⋯a1na21a22⋯a2n⋮⋮⋱⋮an1an2⋯ann)A=\begin{pmatrix}a_{1
数学基础 -- 线性代数之矩阵正定性 sz66cm 线性代数矩阵
线性代数中的正定性正定性在线性代数中主要用于描述矩阵的特性，尤其是在二次型与优化问题中有重要应用。正定矩阵的定义对于一个n×nn\timesnn×n的对称矩阵AAA，其正定性可以通过以下条件来判断：正定矩阵：如果对于任意非零向量x∈Rnx\in\mathbb{R}^nx∈Rn，二次型xTAxx^TAxxTAx都是正的，即：xTAx>0∀x∈Rn,x≠0x^TAx>0\quad\forallx\in
想学java，需要什么基础？吹来人间烟火
不需要什么基础，课程都是针对于零基础的同学，设计这个行业，本身入行门槛比较低，能力重于学历。真正科班出身的更是少数，大部分人都是通过找培训机构系统学习出来的，所以只要自己下定决心去学，就一定能学会的。另外，如果说普通人具备哪些能力可以更好地学习Java，那可以列出来三点。1、简单的英语读写能力；2、一定的数学基础；3、一定的计算机基础操作能力。Java是一门面向对象地编程语言，吸收了C++语言的各
数学基础 -- 线性代数之酉矩阵 sz66cm 量子计算线性代数
酉矩阵（UnitaryMatrix）酉矩阵是线性代数中一种重要的矩阵类型，特别在量子力学和信号处理等领域有广泛的应用。以下是酉矩阵的定义、性质以及使用和计算的例子。1.定义酉矩阵是一个复矩阵UUU，满足以下条件：U†U=UU†=IU^{\dagger}U=UU^{\dagger}=IU†U=UU†=I其中：U†U^{\dagger}U†是矩阵UUU的共轭转置矩阵，即UUU的转置矩阵再取元素的共轭。
深度学习奥秘解锁：AI大模型技能提升指南 AGI大模型老王人工智能深度学习语言模型算法大模型 AI大模型
文章目录每日一句正能量前言AI大模型学习的理论基础AI大模型的训练与优化AI大模型在特定领域的应用AI大模型学习的伦理与社会影响未来发展趋势与挑战后记**前言**随着人工智能技术的快速发展，AI大模型学习正成为一项备受关注的研究领域。为了提高模型的准确性和效率，研究者们需要具备深厚的数学基础和编程能力，并对特定领域的业务场景有深入的了解。通过不断优化模型结构和算法，AI大模型学习正为人类的生活和工
数学基础 -- 线性代数之伴随矩阵 sz66cm 线性代数矩阵
伴随矩阵1.代数余子式首先我们需要理解什么是代数余子式。对于一个n×nn\timesnn×n的方阵AAA，代数余子式MijM_{ij}Mij是指从矩阵AAA中删除第iii行和第jjj列后，剩下的子矩阵的行列式。假设有一个3×33\times33×3的矩阵：A=(a11a12a13a21a22a23a31a32a33)A=\begin{pmatrix}a_{11}&a_{12}&a_{13}\\a_
数学基础 -- 线性代数之矩阵的秩 sz66cm 线性代数矩阵机器学习
矩阵的秩：概念与应用1.概述矩阵的秩（Rank）是线性代数中的一个基本概念，它衡量了矩阵中行或列向量的线性无关性。矩阵的秩在解线性方程组、矩阵分解、确定线性变换的维度等方面起着重要作用。2.矩阵的秩的定义矩阵的秩可以从以下几个角度进行定义：行秩：矩阵的行秩是指矩阵中最大线性无关行向量的个数。列秩：矩阵的列秩是指矩阵中最大线性无关列向量的个数。在一个矩阵中，行秩和列秩总是相等的，因此我们通常将矩阵的
【ShuQiHere】从零开始实现逻辑回归：深入理解反向传播与梯度下降 ShuQiHere 代码武士的机器学习秘传逻辑回归算法机器学习
【ShuQiHere】逻辑回归是机器学习中一个经典的分类算法，尽管它的名字中带有“回归”，但它的主要用途是处理二分类问题。逻辑回归通过一个逻辑函数（Sigmoid函数）将输入特征映射到一个概率值上，然后根据这个概率值进行分类。本文将带你从零开始一步步实现逻辑回归，并深入探讨背后的核心算法——反向传播与梯度下降。逻辑回归的数学基础逻辑回归的目标是找到一个逻辑函数，能够将输入特征映射到一个(0,1)之
数学基础 -- 线性代数之行阶梯形 sz66cm 线性代数机器学习人工智能
行阶梯形行阶梯形（RowEchelonForm,REF）是线性代数中用于简化矩阵形式的一种方法，常用于求解线性方程组。矩阵经过行变换（如高斯消元法）后可以转换为行阶梯形，它具有以下特点：行阶梯形的定义零行在矩阵的底部：矩阵中如果存在一行全为零的行，这些行必须在矩阵的最下方。每一非零行的首个非零元素为1：这一元素称为该行的主元（leadingentry）。主元是从左到右的第一个非零元素，并且主元必须
【ShuQiHere】《机器学习的进化史『上』：从数学模型到智能算法的百年征程》 ShuQiHere 机器学习人工智能
【ShuQiHere】引言：概述机器学习的演进机器学习的发展史是一段从数学基础到智能算法的演进历程。从19世纪的数学探索，到20世纪的计算革命，再到21世纪的智能算法应用，机器学习模型的演化贯穿了科学进步的每个重要阶段。这篇博客将系统回顾这些模型的历史演进，展示它们之间的联系，并探讨其在现代应用中的重要性。线性回归：机器学习的起点背景故事：1805年的法国，年轻的数学家Adrien-MarieLe
数学基础 -- 线性代数之增广矩阵 sz66cm 线性代数机器学习
增广矩阵增广矩阵（AugmentedMatrix）是在求解线性方程组时常用的工具。它将线性方程组的系数矩阵与常数项合并在一起，形成一个扩展的矩阵，从而便于使用矩阵操作方法求解方程组。定义假设我们有一个线性方程组：a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2⋮am1x1+am2x2+⋯+amnxn=bm\begin{aligned}a_{11}x_1+a_
数学基础 -- 梯度下降算法 sz66cm 算法人工智能数学基础
梯度下降算法梯度下降算法（GradientDescent）是一种优化算法，主要用于寻找函数的局部最小值或全局最小值。它广泛应用于机器学习、深度学习以及统计学中，用于最小化损失函数或误差函数。梯度下降的基本概念梯度下降算法通过以下步骤工作：初始化参数：随机初始化模型的参数（如权重和偏差），也可以用特定的策略初始化。计算损失：对当前模型输出和实际目标值计算损失（如均方误差、交叉熵等）。计算梯度：计算损
数学基础 -- 线性代数之矩阵的可逆性 sz66cm 线性代数矩阵机器学习
矩阵的可逆性1.矩阵可逆的定义对于一个n×nn\timesnn×n的方阵AAA，如果存在一个矩阵BBB使得：A×B=B×A=InA\timesB=B\timesA=I_nA×B=B×A=In其中InI_nIn是n×nn\timesnn×n的单位矩阵（对角线上全为1，其他位置全为0），那么矩阵AAA是可逆的，并称矩阵BBB是矩阵AAA的逆矩阵，记作A−1A^{-1}A−1。2.矩阵不可逆的定义如果对
Logistic 回归零度° 机器学习回归数据挖掘人工智能
文章目录1.引言2.Logistic回归概述2.1定义与应用场景2.2与线性回归的区别3.原理与数学基础3.1Sigmoid函数3.2概率解释3.3极大似然估计4.模型建立4.1假设函数4.2成本函数4.3梯度下降法5.正则化5.1正则化的目的与类型5.1.1正则化的目的5.1.2正则化的类型5.2L1和L2正则化5.2.1L1正则化5.2.2L2正则化6.多分类问题6.1一对多(OvA)6.2一
数学基础 -- 线性代数之行列式不变性推导 sz66cm 线性代数
行列式不变性的推导我们要证明：给矩阵的一行（或列）加上另一行（或列）的倍数，这种操作不会改变行列式的值。问题描述假设我们有一个矩阵AAA，其大小为3×33\times33×3，如果我们将其第1行加上第2行的倍数，得到新的矩阵A′A'A′。我们需要证明矩阵AAA的行列式和矩阵A′A'A′的行列式是相等的。给定矩阵AAA如下：A=(a11a12a13a21a22a23a31a32a33)A=\begi
数学基础（四）几两春秋梦_ 数学基础算法人工智能机器学习
一、特征值与特征向量特征空间：特征向量的应用：特征值表达了重要程度且和特征向量所对应，那么特征值大的就是主要信息了，基于这点我们可以提供各种有价值的信息。二、SVD矩阵分解基变换：特征值分解：SVD：离散型随机变量概率函数（概率质量函数）：连续型随机变量似然函数
深度学习如何入门？科学的N次方深度学习
入门深度学习需要系统性的学习和实践经验积累，以下是一份详细的入门指南，包含了关键的学习步骤和资源：预备知识：•编程基础：熟悉Python编程语言，它是深度学习领域最常用的编程语言。确保掌握变量、条件语句、循环、函数等基本概念，并学习如何使用Python处理数据和文件操作。•数学基础：理解线性代数（矩阵运算、向量空间等）、微积分（导数、梯度求解等）、概率论与统计学（期望、方差、概率分布、最大似然估计
2018-02-19 471503Liwufeng
四十岁之后就经常算不清楚自己多大岁数，到底44还是45或者46真的不能不假思索脱口而出。是小学数学基础没打好，还是心理学上说的“可以回避”？所以今天记上一笔，2018年2月19日，45周岁。中年人的生日我相信没人由衷想为自己又长一岁而庆贺
计算机等级考试：信息安全技术知识点二 ting_liang 计算机网络
1、信息技术的飞速发展，对人类社会产生了重要影响，其主流是积极的，但也客观存在一些负面影响，这些负面影响有:信息泛滥、信息污染、信息犯罪。2、1949年，香农发表了著名的《保密系统的通信理论》的论文，把密码学置于坚实的数学基础上，标志着密码学作为一门学科的形成。3、数字签名的过程使用的是签名者的私有密钥，验证数字签名时，使用的是签名者的公有密钥。4、已知最早的代换密码是由JuliusCaesar发
数学分析视频+书籍等 dllglvzhenfeng 计算机考研机试创新程序猿的数学人工智能算法信奥青少年趣味编程数学分析
数学分析（数学基础分支）数学分析（数学基础分支）_百度百科《数学分析（一）》专题《数学分析（一）》专题_哔哩哔哩_bilibili北京某高校《数学分析（二）》：第一讲~第五讲北京某高校《数学分析（二）》：第一讲~第五讲_哔哩哔哩_bilibili北京某高校《数学分析（二）》：第六讲~第八讲（未完待续）北京某高校《数学分析（二）》：第六讲~第八讲_哔哩哔哩_bilibili北京某高校《微观数学》之《
【人工智能学习思维脉络导图】 AK@ 人工智能人工智能学习
曾梦想执剑走天涯，我是程序猿【AK】目录知识图谱1.基础知识2.人工智能核心概念3.实践与应用4.持续学习与进展5.挑战与自我提升6.人脉网络知识图谱人工智能学习思维脉络导图1.基础知识计算机科学基础数学基础（线性代数、微积分、概率论和统计学）编程语言（Python、R等）2.人工智能核心概念机器学习监督学习无监督学习强化学习深度学习神经网络卷积神经网络（CNN）循环神经网络（RNN）自然语言处理
智力题还是水有毒 (智力唤醒、简单代码、公平性) BABYMISS
前言：群里发现一个很有意思的问题一、智力题？？！有1000瓶水，其中有一瓶有毒，小白鼠只要尝一点带毒的水24小时内就会死亡，至少要多少只小白鼠才能在24小时内鉴别出哪瓶水有毒？【题目肯定经不起吃瓜大众的推敲，我们还是按出题人的思路来！】二、思路对不起，刚开始跑偏了。自诩数学基础好、生活经验丰富的我，思绪飘过二叉树、布隆过滤器，在奥卡姆剃刀指引下，最终回归最基础的二进制(如果是1024瓶水，保证不跑
小学奥数全套试卷百度云资源，pdf可打印电子版地址更新全网优惠分享君
奥数，全称为奥林匹克数学竞赛，是一项极富挑战性的数学竞赛活动。它旨在发现和培养数学人才，提高他们的数学水平，并为国家培养出优秀的数学后备力量。在奥数竞赛中，学生需要掌握扎实的数学基础，灵活运用数学知识，解决各种复杂的数学问题。为了帮助小学生更好地学习奥数，我们整理了一份小学奥数全套试卷百度云资源，pdf可打印电子版。这份资源包含了小学奥数各年级的试卷，题型全面，难度适中，适合小学生练习和提高自己的
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo