cshgiser

统计-参数估计-假设检验-总结二

- 参数估计—区间估计
- - 三大分布
  - - 卡方分布(Gamma分布的特例)
    - t分布
    - F分布
  - 求估计区间
- 假设检验
- - 参数检验
  - 拟合优度检验

通往统计-参数估计-假设检验-总结一

参数估计—区间估计

以某一范围提供对参数 $\theta$ 的估计。寻找统计量 $\theta_1^*(x_1,x_2,...,x_n)$ 和 $\theta_2^*(x_1,x_2,...,x_n)$ 满足 $\theta_1^*<\theta_2^*$ ；确定样本 $x_1,x_2,...,x_n$ 之后，就将 $\theta$ 估计在区间 $[\theta_1^*(x_1,x_2,...,x_n),\theta_2^*(x_1,x_2,...,x_n)]$

满足上述要求的区间有很多，但具体估计的时候有优良性要求。

$\theta$ 应尽可能大的在区间 $[\theta_1^*(x_1,x_2,...,x_n),\theta_2^*(x_1,x_2,...,x_n)]$ 内，也即： $p(\theta_1^*(x_1,x_2,...,x_n)\leq\theta\leq\theta_2^*(x_1,x_2,...,x_n))$ 尽可能大
估计精度要尽可能高，即： $\theta_2^*(x_1,x_2,...,x_n)-\theta_1^*(x_1,x_2,...,x_n)$ 尽可能小。

实际上两者是冲突的，因此要引入置信区间的概念。
置信系数：给定一个很小的数 $\alpha>0$ 若对 $\theta$ 的任意值均有 $p(\theta_1^*(x_1,x_2,...,x_n)\leq\theta\leq\theta_2^*(x_1,x_2,...,x_n))=1-\alpha$ 称区间估计 $[\theta_1^*,\theta_2^*]$ 的置信系数为 $1-\alpha$

置信水平：如果 $p(\theta_1^*(x_1,x_2,...,x_n)\leq\theta\leq\theta_2^*(x_1,x_2,...,x_n))=1-\alpha$ ，而 $\beta<1-\alpha$ ；则 $\beta$ 均可称为 $[\theta_1^*,\theta_2^*]$ 的置信水平。

例如 $1-\alpha=0.95$ ，说明 $\theta$ 落在区间 $[\theta_1^*,\theta_2^*]$ 的概率等于0.95，置信水平为95%，或者比95%小的数，比如90%，当置信水平达到了95%，自然也达到了90%，置信水平越高，估计的区间也越大，如果区间是正无穷至负无穷，那置信水平也达到了100%，但此时是没有意义的。

三大分布

在学习三大分布之前，需要知道 $\Gamma$ 函数（Gamma函数），区分Gamma函数和Gamma分布。
Gamma分布的背景来自于对泊松分布的推导。

例如一个站台的呼叫数，它只与时间间隔有关，而与时间（刻）本身无关，设 $\xi(t)$ 为 $t_0,t_0+t)$ 内到达的呼叫数，则t时间间隔内到达k个呼叫数的概率 $p(\xi(t)=k)=\frac{(\lambda t)^k}{k!}e^{-\lambda t}$ ，服从泊松分布。记 $\tau_r$ 为第r个呼叫达到的时刻，根据泊松分布函数推导可以得到该自变量服从Gamma分布。
Gamma分布的密度函数：
$g(r,\lambda,t)=\frac{\lambda^rt^{r-1}e^{-\lambda t}}{\Gamma(r)}$

其中，r取整数时， $\Gamma(r)=(r-1)!$
$\Gamma(r)=\int_0^\infty t^{r-1}e^{-t}dt$
为gamma函数（ $\lambda=1$ , 对 t 进行了积分）

卡方分布(Gamma分布的特例)

自由度为n卡方分布： $\chi_n^2=\Gamma(\frac{n}{2},\frac{1}{2})=\frac{(1/2)^{n/2}y^{n/2}e^{-\frac{1}{2}y}}{\sqrt{\pi}}$

他的期望为n，方差为2n

Gamma分布的特例，其中 $r=\frac{n}{2}$ ， $\lambda=\frac{1}{2}$

补充：若 $\xi ~ N(\mu, \sigma^2)$ ，则 $\eta=\xi^2$ 服从自由度为1的卡方分布。

t分布

$f(x;n)=\frac{\Gamma((n+1)/2)}{\sqrt{n\pi}\Gamma(n/2)}(1+\frac{x^2}{n})^{-(n+1)/2}$

他的期望为0，方差为 $n / (n - 2)$

对应抽样分布：设总体服从正态分布， $x_1,x_2,...,x_n$ 为样本， $\bar X$ 记为样本均值， $S$ 记为方差，则：随机变量 $\frac{\sqrt n(\bar X-\mu)}{S}$ 服从自由度为n的t分布

F分布

$f(x;m,n)=\frac{n^{\frac n2}n^{\frac n2}\Gamma{(n/2+m/2)}}{\Gamma{(n/2)}\Gamma{(n/2)}}(m+nt)^{-\frac{m+n}{2}}t^{n/2-1}$

他的期望为 $n / (m - 2) (m > 2)$ 方差为: $\frac{2m^2(n+m-2)}{n(m-2)^2(m-4)}$

对应抽样分布：两个总体X和Y，分别服从正态分布，所抽样本量分别为n和m。则随机变量 $\frac{S_X^2}{S_Y^2}/\frac{\sigma_1^2}{\sigma_2^2}$ 服从自由度为n-1,m-1的F分布

求估计区间

求置信区间的方法：枢轴变量法。

寻找一个与要估计参数 $g(\theta)$ 有关的统计量 $T=T(x_1,x_2,...,x_n)$ ，一般是其优良点估计量。
设法寻找包含统计量 $T$ 以及待估参数 $g(\theta)$ 的随机变量 $S(T,g(\theta))$ 。要求 $S(T,g(\theta))$ 的分布与 $\theta$ 无关， $S$ 为枢轴变量。这个变量是服从某种已知分布的，如正态分布、t分布或者F分布等等
对于给定的 $1-\alpha$ ，按照 $p(a\le S(T,g(\theta))\le b)=1-\alpha$ ，求出a和b，这里求a和b实际上就是看分布的上下分位数
再由 $a\le S(T,g(\theta))\le b$ 解出来 $\theta_1^*(T)\le g(\theta)\le \theta_2^*(T)$ 。则 $[\theta_1^*(T),\theta_2^*(T)]$ 即为估计量的一个置信系数 $1-\alpha$ 的区间估计。

常见的枢轴变量：

构造标准正态变量——某一变量服从正态分布（实际上自然界很多现象都服从正态分布），且其方差已知，对 $\mu$ 估计，他的优良估计连为 $\bar X$ ，可以构造随机变量 $\frac{\sqrt n(\bar X-\mu)}{\sigma}$ ，该变量服从标准正态分布，上下分位易求
t分布变量——还是上例，如果方差未知的情况呢？ $\frac{\sqrt n(\bar X-\mu)}{\sigma}$ 的分布无从可知，因为分母含有未知变量。此时构造变量 $\frac{\sqrt n(\bar X-\mu)}{S}$ ，S为样本标准差；那这个变量服从 $t_{n-1}$ 分布，上下分位也易求得
卡方分布变量——举个非正态分布的例子。对于指数总体参数 $1/\lambda$ 的区间估计，以 $2n\lambda\bar X$ 作为枢轴变量。这个变量是服从 $\chi_{2n}^2$ 的分布，也易求上下分位
……

区间估计达到预先设定的置信系数要求，就需要把关注点转移到精度要求之上，无穷大的估计区间，再准也是没有意义的。

以正态分布方差已知，估计均值的例子为例:

$p(\theta_1^*(x_1,x_2,...,x_n)\leq\theta\leq\theta_2^*(x_1,x_2,...,x_n))=1-\alpha$

$p(\theta_1^*(x_1,x_2,...,x_n)\leq\frac{\sqrt n(\bar X-\mu)}{\sigma}\leq\theta_2^*(x_1,x_2,...,x_n))=1-\alpha$

$u_{1-\alpha/2}\leq\frac{\sqrt n(\bar X-\mu)}{\sigma}\leq u_{\alpha/2}$

$\frac{\sigma u_{1-\alpha/2}}{\sqrt n}-\bar X\leq-\mu\leq \frac{\sigma u_{\alpha/2}}{\sqrt n}-\bar X$

$\bar X-\frac{\sigma u_{\alpha/2}}{\sqrt n}\leq\mu\leq \bar X-\frac{\sigma u_{1-\alpha/2}}{\sqrt n}$

$\bar X-\frac{\sigma u_{\alpha/2}}{\sqrt n}\leq\mu\leq \bar X+\frac{\sigma u_{\alpha/2}}{\sqrt n}$
估计精度：
$\beta=\frac{2\sigma u_{\alpha/2}}{\sqrt n}$

如果要求估计精度达到 $\beta$ ，那相应样本容量n就要增大，大于多少也易求。

假设检验

参数检验

例如，在元件寿命服从指数分布的假定下，要通过对抽出若干个元件进行测试所得到的数据去判定“元件平均寿命不小于5000小时”是否成立问题。

原假设： $H_0:1/\lambda\geq5000$
对立假设： $H_1:1/\lambda<5000$

任何一个假设的检验都需要用到样本，如上例中服从指数分布，用样本去判断这个假设，首先要表达出平均，也就是对这个指数分布的均值进行估计。在这个检验中，只要样本的均值满足： $\bar X\ge C$ （C为一个适当的数），就可以接受原假设.

则，能让原假设被接受的样本符合：
$A=\{(x_1,x_2,...,x_n):x_1+x_2+...+x_n\ge nC\}$
这是一个样本集，也称 接受域；
同样，A的互补集为 拒绝域

给定的常数C是临界值，但无论给出什么临界值，都避免不了犯错误。（1）在原假设为真情况下，样本落在了拒绝域内，拒绝了原假设，出现第一类错误：弃真错误。（2）原假设非真，但样本落在了接受域内，从而接受原假设，出现第二类错误：取伪错误。由于样本的随机性，错误总是不可避免，只能尽可能降低犯错概率。

对于上例中，原假设被否定概率用 $\beta_\phi(\lambda)$ 表示：
$\beta_\phi(\lambda)=P_\lambda(\bar Xβϕ(λ)=Pλ(Xˉ<C)$

表示的是样本落在拒绝域内的概率。

上例中，由于 $2n\lambda\bar X$ ~ $\chi_{2n}^2$ ，则有：
$\beta_\phi(\lambda)=P_\lambda(\bar Xβϕ(λ)=Pλ(Xˉ<C)=K2n(2nλC)$

可见，这个概率（样本落在拒绝域，也即均值小于5000小时）随 $\lambda$ 增大而增加， $\lambda$ 越大， $1/\lambda$ 越小，越小于5000小时，样本落在小于5000小时的概率就越大。作为一个合理的假设， $\lambda$ 越大，就应该用更大的概率否定原假设。

功效函数 是假设检验的重要概念：

$\beta_\phi(\theta_1,\theta_2,...,\theta_k)=P_{\theta_1,\theta_2,...,\theta_k}(deny-H_0)$
功效函数是未知参数的函数。当 $\theta_1,\theta_2,...,\theta_k$ 属于对立假设时，我们希望 $\beta_\phi(\theta_1,\theta_2,...,\theta_k)$ 尽可能大（拒绝原假设的概率尽可能大）

发生两类错误的概率：
（1）原假设正确但被否了。用 $\alpha_{1\phi}(\theta_1,\theta_2,...,\theta_k)$ 表示。
如果 $\theta_1,\theta_2,...,\theta_k\in H_0$
$\alpha_{1\phi}(\theta_1,\theta_2,...,\theta_k)=\beta_\phi(\theta_1,\theta_2,...,\theta_k)$
如果 $\theta_1,\theta_2,...,\theta_k\notin H_0$
$\alpha_{1\phi}(\theta_1,\theta_2,...,\theta_k)=0$

（2）原假设错误，但被接受。用 $\alpha_{2\phi}(\theta_1,\theta_2,...,\theta_k)$ 表示。
如果 $\theta_1,\theta_2,...,\theta_k\in H_0$
$\alpha_{2\phi}(\theta_1,\theta_2,...,\theta_k)=0$
如果 $\theta_1,\theta_2,...,\theta_k\notin H_0$

$\alpha_{2\phi}(\theta_1,\theta_2,...,\theta_k)=1-\beta_\phi(\theta_1,\theta_2,...,\theta_k)$
检验水平 ：一个常数 $\alpha$ （ $0\le\alpha\le1$ ），对任何的 $\theta_1,\theta_2,...,\theta_k\in H_0$ ，都有 $\beta_\phi(\theta_1,\theta_2,...,\theta_k)\le\alpha$ ，称该检验为原假设在水平 $\alpha$ 的检验。

原假设认为 $\theta_1,\theta_2,...,\theta_k\in H_0$ ，如果对任意的参数取值 $\theta_1,\theta_2,...,\theta_k\in H_0$ ，都能保证犯错误的概率小于某个数 $\alpha$ ，那我们接受它的意愿就更有说服力了， $\alpha$ 取得小，犯第一类错误的概率很小。也即原假设正确下，所有可能的样本组合，能拒绝原假设的概率很小。反过来看，如果样本的所有可能组合，拒绝原假设的概率很小，设定某一水平，如果概率小于这个水平，是可以认为原假设正确的。

重要的假设检验：
（1）正态均值检验
$x_1,x_2,...,x_n$ 为正态总体抽取的样本，讨论 $\theta$ 的假设检验问题：
$H_0:\theta\ge\theta_0;H_1:\theta<\theta_0$
$\sigma^2$ 已知时
选择 $\bar X$ 作为参数 $\theta$ 的估计量，设定检验 $\phi$ ：当 $\bar X\ge C$ 时，接受原假设，当 $\bar X< C$ 时，否定原假设。
要给定常数C使之具有水平 $\alpha$ ，按照功效函数定义，在此检验下拒绝原假设的概率为：

$\beta_\phi(\theta)=P_{\theta}(\bar Xβϕ(θ)=Pθ(Xˉ<C)=Pθ(σn (Xˉ−θ)<σn (C−θ))=ϕ(σn (C−θ))=α$

将C带入功效函数：
$\beta_\phi(\theta)=\phi(\frac{\sqrt n(\theta_0-\theta)}{\sigma}-u_\alpha)$

从上式知， $\beta_\phi$ 与参数 $\theta$ 、水平 $\alpha$ 以及标准差 $\theta$ 均有关：

拟合优度检验

理论分布已知，对分布检验
对分布的假设：
$H_0$ ： $p(X=a_i)=p_i$ , i=1,2,…,k

从总体中抽出容量n的样本或进行n次观察，得到样本 $X_1,X_2,...,X_n$ ，根据样本检验 $H_0$ ， $np_i$ 为 $a_i$ 的理论样本数量，统计 $a_i$ 出现的次数为 $v_i$ （实际统计的样本数量），为观察值。

显然，差异越小越乐于接受它。
皮尔逊的拟合优度 $\chi^2$ 统计量：

$Z=\sum\frac{np_i-v_i}{np_i}$

假设成立，在样本量很大时， $Z$ 服从自由度 $k - 1$ 的 $\chi^2$ 的分布。

拟合优度 对这个检验，计算得到一定水平下的临界值为 $Z_0$ ，显然当统计量Z满足 $Z>Z_0$ 时否定原假设。在原假设为真时， $P(Z>Z_0)$ 的概率就是犯错误的概率。定义拟合优度：
$P(Z_0)=P(Z>Z_0|H_0)=1-K_{k-1}(Z_0)$
拟合优度越大， $Z_0$ 越小，犯错误的概率越低，表示理论与实际符合的越好。

例一家工厂早中晚三班，每班8小时，发生一些事故，早班6次，中班3次，晚班6次，怀疑事故发生与班次有关。
$H_0$ （事故与班次无关） $p_i=1/3$ ，i =1，2，3

试验15次，可计算拟合优度统计量：
$Z_0=((5-6)^2+(3-6)^2+(5-6)^2)/5=1.2$
$\chi_{2}(1.2)=0.451$ ，拟合优度 $p(Z_0)=0.549$
在一定准则下考虑是否拒绝原假设。

理论分布未知

总体X只取有限个值，其概率： $p(X=a_i)=p_i(\theta_1,\theta_2,...,\theta_r)$ ，其中， $\theta_1,\theta_2,...,\theta_r$ 为未知参数。
设对X进行n次观察，以 $v_i$ 记为X出现的次数。
假设： $H_0: p(X=a_i)=p_i(\theta_1,\theta_2,...,\theta_r)$ ，对参数 $\theta_1,\theta_2,...,\theta_r$ 的某一组值 $\theta_1^0,\theta_2^0,...,\theta_r^0$ 成立。

首先，要确定参数 $\theta_1,\theta_2,...,\theta_r$ ，确定参数后才能进行拟合优度的检验。这一步为参数估计部分，利用样本数据对参数进行估计：采用极大似然法。（离散分布极大似然估计公式） $L=\frac{n!}{v_1!\cdot v_2!... \cdot v_k!}P_1^{v_1}\cdot P_2^{v_2}\cdot...\cdot P_k^{v_k}$ 解方程求取极大似然估计值
以估计值为参数真值，计算理论概率。在一定条件下，若原假设成立，当样本很大时， $Z$ 统计量分布趋向于 $\chi_{k-1-r}^2$ .
若以 $Z_0$ 记为算出来的具体统计量，算出 $Z_0$ 的拟合优度 $Z_0>\chi_{k-1-r}^2(\alpha)$ 时，否定原假设

列联表检验统计量

记 $u_i$ =p(属性A在水平i); $v_j$ =p(属性B在水平j); $p_{ij}$ =p(属性A在水平i且属性B在水平j)。假设： $H_0$ ： $p_{ij}=u_iv_j$ , i=1,2,…a; j = 1,2,…,b.
根据极大似然法，求得 $\hat u_i=\frac{n_{i\cdot}}{n}$ ; $\hat v_j=\frac{n_{j\cdot}}{n}$
由此可得 $\hat p_{ij}=\frac{n_{i\cdot}n_{j\cdot}}{n^2}$

第(i,j)得理论值： $np_{ij}=\frac{n_{i\cdot}n_{j\cdot}}{n}$

统计量 $Z=\sum_i^a\sum_1^b\frac{(n\cdot n_{ij}-n_{i\cdot}n_{j\cdot})^2}{n\cdot n_{i\cdot}n_{j\cdot}}$

例文化水平与支出
纵轴A，123表示教育水平高中低；横轴B，12表示支出水平高低。

	1	2	3	sum
1	63	37	60	160
2	16	17	8	41
sum	79	54	68	201

计算统计量 $Z_0$ 为7.2078，拟合优度p=0.0207，过低，拒绝原假设：收入与文化消费无关。收入高者，文化指出偏低。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
非对称加密算法————RSA理论及详情 hu19930613
转自：https://www.kancloud.cn/kancloud/rsa_algorithm/48484一、一点历史1976年以前，所有的加密方法都是同一种模式：（1）甲方选择某一种加密规则，对信息进行加密；（2）乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称"密钥"），这被称为"对称加密算法"（Symmetric-keyalgorithm）。这种加密模式有一个最大弱点
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
【加密算法基础——对称加密和非对称加密】 XWWW668899 网络安全服务器笔记
对称加密与非对称加密对称加密和非对称加密是两种基本的加密方法，各自有不同的特点和用途。以下是详细比较：1.对称加密特点密钥:使用相同的密钥进行加密和解密。发送方和接收方必须共享这个密钥。速度:通常速度较快，适合处理大量数据。实现:算法相对简单，计算效率高。常见算法AES(高级加密标准)DES(数据加密标准)3DES(三重数据加密标准)RC4(流密码)应用场景文件加密磁盘加密传输大量数据时的加密2.
【算法练习】IDEA集成leetcode插件实现快速刷 2401_84102892 2024年程序员学习算法 intellij-idea leetcode
============点击右侧边leetcode->设置->配置地址、用户名、密码、存放目录、文件模板用户名要登录后在账号信息里看模板代码1.codefilename!velocityTool.camelC
【加密算法基础——RSA 加密】 XWWW668899 网络服务器笔记 python
RSA加密RSA（Rivest-Shamir-Adleman）加密是非对称加密，一种广泛使用的公钥加密算法，主要用于安全数据传输。公钥用于加密，私钥用于解密。RSA加密算法的名称来源于其三位发明者的姓氏：R:RonRivestS:AdiShamirA:LeonardAdleman这三位计算机科学家在1977年共同提出了这一算法，并发表了相关论文。他们的工作为公钥加密的基础奠定了重要基础，使得安全通
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
高性能javascript--算法和流程控制海淀萌狗
-for,while和do-while性能相当-避免使用for-in循环，==除非遍历一个属性量未知的对象==es5:for-in遍历的对象便不局限于数组，还可以遍历对象。原因：for-in每次迭代操作会同时搜索实例或者原型属性，for-in循环的每次迭代都会产生更多开销，因此要比其他循环类型慢，一般速度为其他类型循环的1/7。因此，除非明确需要迭代一个属性数量未知的对象，否则应避免使用for-i
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
JVM源码分析之堆外内存完全解读 HeapDump性能社区
概述广义的堆外内存说到堆外内存，那大家肯定想到堆内内存，这也是我们大家接触最多的，我们在jvm参数里通常设置-Xmx来指定我们的堆的最大值，不过这还不是我们理解的Java堆，-Xmx的值是新生代和老生代的和的最大值，我们在jvm参数里通常还会加一个参数-XX:MaxPermSize来指定持久代的最大值，那么我们认识的Java堆的最大值其实是-Xmx和-XX:MaxPermSize的总和，在分代算法
《算法》四学习——1.1节进阶的Farmer 算法算法笔记
前言买了一本算法4，每天看一点，对每个小结来个学习总结，输出驱动输入。本篇笔记针对第一章基础1.1基础编程模型1.1节总结了相关的语法、语言特性和书中将会用到的库。笔记自己在编码中容易遗漏的点&&优先级比||高在开发中习惯了加括号，所以没注意到这点，教材上也有但是忘记了二分查找中计算mid=left+(right-left)/2这样计算可以有效避免(left+right)/2溢出答疑java无穷大
排序路小白同学
1.冒泡排序冒泡算法是一种基础的排序算法，这种算法会重复的比较数组中相邻的两个元素。如果一个元素比另一个元素大（小），那么就交换这两个元素的位置。重复这一比较直至最后一个元素。这一比较会重复n-1趟，每一趟比较n-j次，j是已经排序好的元素个数。每一趟比较都能找出未排序元素中最大或者最小的那个数字。这就如同水泡从水底逐个飘到水面一样。冒泡排序是一种时间复杂度较高，效率较低的排序方法。其空间复杂度是
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分

统计-参数估计-假设检验-总结二