胡牧之.

MATLAB2016笔记（九）：概率统计（概率密度、统计作图、统计特征、累积概率分布、随机变量产生）

文章目录

一、产生随机变量
- （一）二项分布随机数据的产生 binornd
- （二）正态分布随机数据的产生 normrnd
- （三）常见分布随机数据的产生
二、概率密度计算
- （一）通用函数概率密度值 pdf / ksdensity
- （二）专用函数概率密度值
三、累积概率分布
- （一）通用函数累积概率值 cdf / ksdensity
- （二）专用函数累积概率值
四、统计特征
- （一）平均值、中位数、忽略NaN的中位数、几何平均数、调和平均数
- （二）数据比较普通排序sort、按行排序sortrows、求解值域大小range
- （三）期望（即算术平均值mean）
- （四）方差 var、标准差 std
- （五）协方差 cov、相关系数 corrcoef
五、统计作图
- （一）正整数频率表 tabulate
- （二）累积分布函数图形 cdfplot
- （三）最小二乘拟合直线 lsline
- （四）绘制正态分布概率图形 normplot
- （五）样本数据的箱线图 boxplot
- （六）参考线绘制 refline / refcurve
- （七）样本概率图形 capaplot / capability
- （八）正态拟合直方图 histfit

一、产生随机变量

（一）二项分布随机数据的产生 binornd

$P\{X=k\}=(_{n}^{k})p^k(1-p)^{n-k}$

binornd函数可以产生二项分布随机数据，其格式如下：

R=binornd(N,P) N,P为二项分布参数，N,P可以是大小相同的向量、矩阵或多维数组；R与N,P具有相同的大小

R=binornd(N,P,m,n,...) 当N,P为标量时，可以由m,n...控制输出的个数以及维数
R=binornd(N,P,[m,n,...]) 与上功能相同

根据实践，发现当仅有参数m，且N、P为标量时，输出结果为m*m的随机数矩阵

（二）正态分布随机数据的产生 normrnd

$f(x)=\frac{1}{\sqrt{2\pi}\sigma}exp(-\frac{(x-\mu)^2}{2\sigma^2})$

normrnd函数可以产生正态分布随机数据，其格式如下：

R = normrnd(mu,sigma) 
R = normrnd(mu,sigma,m,n,...) 
R = normrnd(mu,sigma,[m,n,...]) 

具体用法与binornd一致

（三）常见分布随机数据的产生

需要时再查询帮助文档

二、概率密度计算

（一）通用函数概率密度值 pdf / ksdensity

1.pdf函数

pdf函数计算概率密度，其格式如下：

y = pdf('name',x,A)
y = pdf('name',x,A,B)
y = pdf('name',x,A,B,C)
y = pdf('name',x,A,B,C,D) name为分布函数名，A、B、C、D为参数的值（不同分布的参数个数不同），函数将返回在x处的概率密度值
y = pdf(obj,x) obj为高斯联合分布对象

知乎——高斯过程与高斯分布

2.ksdensity函数
对单变量或多变量的核平滑化函数估计，在连续分布样本上表现最好
使用ksdensity函数求取一般函数/数据的概率密度函数，该函数的调用格式如下：

[f,xi] = ksdensity(x)
[f,xi] = ksdensity(x,pts)
[f,xi] = ksdensity(x,pts,Name,Value) x为待统计的向量；xi为计算概率密度的点；f为得到的概率密度；Name和Value为可选属性及其属性值
[f,xi,bw] = ksdensity(___) bw，核平滑化窗口的带宽
ksdensity(___)
ksdensity(ax,___) ax指定绘制位置坐标轴对象

（二）专用函数概率密度值

需要时再查询帮助文档

三、累积概率分布

（一）通用函数累积概率值 cdf / ksdensity

1.cdf函数
使用cdf函数可以计算随机变量 $\leq X$ 的概率之和（累积概率和），其调用格式如下：

y = pdf('name',x,A)
y = pdf('name',x,A,B)
y = pdf('name',x,A,B,C)
y = pdf('name',x,A,B,C,D) name为分布函数名，A、B、C、D为参数的值（不同分布的参数个数不同）
y = pdf(obj,x) obj为高斯联合分布对象

参数含义与pdf一致

2.ksdensity函数
ksdensity函数默认求取概率密度值，如果要计算累积概率分布，需要设置其属性function的取值为cdf

（二）专用函数累积概率值

需要时再查询帮助文档

四、统计特征

（一）平均值、中位数、忽略NaN的中位数、几何平均数、调和平均数

1.平均值——mean函数
平均数，数据之和除以数据个数，其具体用法如下：

M = mean(A) 若A为向量，返回一个值；若A为矩阵，返回每列的均值
M = mean(A,dim) 返回沿着对应维度的均值，例如A为矩阵时，dim为2可以返回每行的均值
M = mean(___,outtype) 以特定数据类型返回均值
M = mean(___,nanflag) nanflag为一个选项，为‘includenan’，均值计算包括NaN；‘omitnan’，均值计算不包括NaN

2.中位数——median函数
中位数，按顺序排列的一组数据中居于中间位置的数，若观察值有偶数个，通常取中间两个数的平均值作为中位数
其具体用法如下

M = median(A)
M = median(A,dim)
M = median(___,nanflag)

参数含义与mean函数相同

3.忽略NaN的中位数——nanmedian函数

m = nanmedian(X)
m = nanmedian(X,DIM)

参数含义同上

4.几何平均数——geomean函数
$G=\sqrt[n]{X_1\times X_2\times ...\times X_n }=\sqrt[n]{\prod_{i=1}^{n}X_i}$

其具体用法如下：

m = geomean(x)
geomean(X,dim)

参数含义同上

5.调和平均数——harmmean函数

调和平均数（harmonic mean）又称倒数平均数，是总体各统计变量倒数的算术平均数的倒数
$H_n=\frac{1}{\frac{1}{n}\sum_{i=1}^{n}\frac{1}{x_i}}=\frac{n}{\sum_{i=1}^{n}\frac{1}{x_i}}$

其用法如下

m = harmmean(X)
harmmean(X,dim)

参数含义同上

（二）数据比较普通排序sort、按行排序sortrows、求解值域大小range

数据排序是指由数据比较引发的各种数据操作，常见的操作包括普通排序（sort）、按行排序（sortrows）、求解值域大小（range）

1.普通排序——sort函数
其用法如下

B = sort(A) 如果A是向量，直接排序；若A是矩阵，仅对列排序
B = sort(A,dim) 沿着对应维度进行排序，例如A为矩阵时，dim为2可以对每行进行排序
B = sort(___,direction) direction为选项，控制具体排序方法，'ascend'（默认）为递增，'descend'为递减
[B,I] = sort(___)  I与A大小相同，表示排序后的元素在A中的索引值

2.按行排序——sortrows函数

其用法如下

B = sortrows(A) A为矩阵，对A的不同行按ASCII码字典序排序（默认递增）：比较相同列，进行排序，相等再比较下一列，
B = sortrows(A,column) 对特定的列进行比较，若有两行的对应列均相等，则保持相对位置不变
[B,index] = sortrows(___) 返回排序后每一行原来的行号

3.求解值域大小——range函数
range函数将返回最大值与最小值之间的差值

其用法如下

range(X)   range会忽略NaN
y = range(X,dim)

参数含义同上

（三）期望（即算术平均值mean）

（四）方差 var、标准差 std

1.方差——var函数
总体方差： $\sigma^2=\frac{\sum(X-\mu)^2}{N}$
样本方差： $s^2=\frac{\sum(X-\bar{X})^2}{n-1}$
其用法如下

V = var(A)  
V = var(___,w) w默认为0，结果为样本方差，即除以(n-1)；w=1时为总体方差，除以N；w还可以为权值数组，要求w与A大小相同
V = var(___,dim)
V = var(___,w,dim)
V = var(___,nanflag)

其余参数与之前一致

2.标准差——std函数

标准差是方差的算术平方根，标准差能反映一个数据集的离散程度

其用法如下

S = std(A)
S = std(A,w)
S = std(A,w,dim)
S = std(___,nanflag)

参数含义同上

（五）协方差 cov、相关系数 corrcoef

1.协方差——cov函数
在概率论和统计学中，协方差用于衡量两个变量的总体误差,而方差是协方差的一种特殊情况，即当两个变量是相同的情况
$C o v (X, Y) = E [(X - E (X)) (Y - E (Y))] = E (X Y) - 2 E (X) E (Y) + E (X) E (Y) = E (X Y) - E (X) E (Y)$
$Cov(X,Y)=\frac{\sum_{i=1}^{n}(X_i-\bar{X})(Y_i-\bar{Y})}{n-1}$

如果 $X$ 与 $Y$ 是统计独立的，那么二者之间的协方差就是 $0$ ，因为两个独立的随机变量满足 $E (X Y) = E (X) E (Y)$
但 $X$ 与 $Y$ 的协方差为 $0$ ，二者并不一定是统计独立的

其用法如下

C = cov(A) 当A为向量时，cov(A)与var(A)结果相同；若A为n*m的矩阵，将返回n*n的协方差矩阵，C(i,j)表示第i个变量（第i列）与第j个变量的协方差
C = cov(A,B)
C = cov(___,w) w可为0或1，含义与之前相同
C = cov(___,nanflag)

2.相关系数——corrcoef函数
$r(X,Y)=\frac{Cov(X,Y)}{\sqrt{Var(X)Var(Y)}}$

其用法如下

R = corrcoef(A) 
R = corrcoef(A,B) 格于协方差相同

[R,P] = corrcoef(___) P值矩阵用于测试被观测现象没有关系的假设（原假设），如果 P 的非对角线元素小于显著性水平（默认值为 0.05），则 R 中的相应相关性被视为显著。如果 R 包含复数元素，则此语法无效。

[R,P,RL,RU] = corrcoef(___) 这些矩阵包含每个系数的 95% 置信区间的下界和上界。如果 R 包含复数元素，则此语法无效

___ = corrcoef(___,Name,Value) Name为参数，value为该参数对应的值，用于控制输出
								如：corrcoef(A,'alpha',0.1) ，置信区间为90%
	      							corrcoef(A,'rows','complete')，省略 A 的包含一个或多个NaN值的行

五、统计作图

（一）正整数频率表 tabulate

其具体用法如下

tbl = tabulate(x) 若x为数值数组，tbl也将为数值矩阵；如果x是分类变量、字符数组或字符串单元数组，tbl也将为单元数组
	tbl的第一列为x中的值，第二列为每类值的总个数，第三列为每类值所占百分比
tabulate(x)

（二）累积分布函数图形 cdfplot

其具体用法如下

cdfplot(X) X为向量，F(X)的定义就是值小于等于X的元素的个数占比
h = cdfplot(X) 返回cdf曲线的句柄
[h,stats] = cdfplot(X) stats为一个结构体，包含了一些样本的特征

evrnd，极值分布
evcdf，极值累积分布函数

（三）最小二乘拟合直线 lsline

Least-squares line
其具体用法如下

lsline 为当前轴上的散点图叠加最小二乘拟合直线；实线、虚线和点线图不会被视作散点图，会被忽略
lsline(ax) 在ax轴上处理
h = lsline(___) 返回由最小二乘线句柄组成的列向量

（四）绘制正态分布概率图形 normplot

正态概率图介绍
其具体用法如下

normplot(x) x就是待分析的数据，用于可视化检验正态性，当x是矩阵时，对每一列显示一条直线；
h=normplot(x)h返回由直线的句柄组成的列向量

正态概率图，其纵坐标为累积概率，是非等距刻度，横坐标为分位数或数值，为等距刻度

通过绘制抽样点在概率纸上的实际位置，观察其偏离直线的程度，就可以判断抽样数据是否符合正态分布了

（五）样本数据的箱线图 boxplot

在箱线图中，箱子的中间有一条线，代表了数据的中位数。
箱子的上下底，分别是数据的上四分位数（Q3）和下四分位数（Q1），这意味着箱体包含了50%的数据。因此，箱子的高度在一定程度上反映了数据的波动程度。
上下边缘则代表了该组数据（不包含离群值）的最大值和最小值。
有时候箱子外部会有一些点，可以理解为数据中的“异常值”。

知乎——箱线图介绍

CSDN——boxplot用法

boxplot帮助文档

其具体用法如下

boxplot(x) 若x是矩阵，对每一列作箱线图
boxplot(x,g) g为分组变量，使用g中包含的一个或多个分组变量创建箱线图，boxplot为具有相同的一个或多个g值的各组x值创建一个单独的箱子
boxplot(ax,___) 在ax指定的坐标轴上作图
boxplot(___,Name,Value) 使用由一个或多个Name,Value对组参数指定的附加选项创建箱线图，例如指定箱子样式或顺序

（六）参考线绘制 refline / refcurve

绘制参考线

在 $M A T L A B$ 中可以使用 $re f l in e$ 和 $re f c u r v e$ 函数分别绘制一条参考直线与一条参考曲线

1.refline——叠加参考直线
refline帮助文档

其具体用法如下

refline(m,b) m为斜率，b为截距
refline(coeffs) coeffs是一个双元系数向量，向图中添加直线:y=coeffs(1)*x+coeffs(2)
refline 没有输入参数时就相当于最小二乘拟合lsline
refline(ax,___) 在ax指定坐标区的图上添加一条参考线
hline = refline(___) 使用上述任一语法中的输入参数，返回参考线对象 hline。在创建参考线后，使用 hline 修改其属性

2.refcurve——叠加参考曲线
refcurve帮助文档

其具体用法如下

refcurve(p) 将系数为p的多项式参考曲线添加到当前轴，p为向量
refcurve 在没有输入参数的前提下，沿着x轴作一条直线
refcurve(ax,p) 使用在axes（一个Axes对象）中指定的绘图轴
hcurve = refcurve(...) 用法同refline

（七）样本概率图形 capaplot / capability

样本概率图形绘制函数capaplot
其具体用法如下

p = capaplot(data,specs) data为数据向量，specs为双元素向量，表示一个范围；假定数据为正态分布
					   	 最终将返回p，表示数据落入specs所表示范围的概率；并绘制图像，将specs部分置为阴影
[p,h] = capaplot(data,specs) h由图像句柄元素所组成

capability函数：计算数据的均值和方差等
capability帮助文档

（八）正态拟合直方图 histfit

正态拟合直方图绘制函数histfit
其具体用法如下

histfit(data) data为向量，直方图中竖条区域（bin）个数为data中元素个数的平方根
histfit(data,nbins) 指定bin为nbins
histfit(data,nbins,dist) 根据dist来进行密度函数的拟合，默认为normal
h = histfit(___) 返回句柄向量 h，其中 h(1) 是直方图的句柄，h(2) 是密度曲线的句柄

Python商务数据分析——Matplotlib 数据可视化学习笔记爱吃代码的小皇冠 python numpy matplotlib pandas 学习笔记数据分析
一、Matplotlib基础认知1.1库功能与定位核心作用：将数据可视化展示，提升数据直观性与说服力应用场景：绘制折线图、饼图、柱状图等2D/3D图表双接口模式：MATLAB风格：通过pyplot函数快速绘图（自动管理图形对象）面向对象：显式创建Figure和Axes对象（适合复杂绘图）1.2核心对象架构容器类：图(Figure)、坐标系(Axes)、坐标轴(Axis)、刻度(Tick)基础类：线
PyEcharts教程（010）：天猫订单数据可视化项目文理棵 Python数据分析信息可视化 python 数据分析
文章目录1、读取数据2、数据处理3、重复值查看4、缺失值查看5、PyEcharts可视化5.1各个省份的订单量5.2时间序列分析5.3每天订单量统计可视化6、数据下载1、读取数据1️⃣读取数据：importpandasaspdfrompyechartsimportoptionsasoptsfrompyecharts.chartsimportMap,Timeline,Bar,Line,Piedata
equine在神经网络中建立量化不确定性 struggle2025 神经网络人工智能深度学习
一、软件介绍文末提供程序和源码下载众所周知，用于监督标记问题的深度神经网络（DNN）可以在各种学习任务中产生准确的结果。但是，当准确性是唯一目标时，DNN经常会做出过于自信的预测，并且无论测试数据是否属于任何已知标签，它们也总是进行标签预测。EQUINEwascreatedtosimplifytwokindsofuncertaintyquantificationforsupervisedlabel
C2远控篇&Golang&Rust&冷门语言&Loader加载器&对抗优势&减少熵值特征
#C2远控-ShellCode-认知&环境1.创建工程时关闭SDL检查2.属性->C/C++->代码生成->运行库->多线程(/MT)如果是debug则设置成MTD3.属性->C/C++->代码生成->禁用安全检查GS4.关闭生成清单属性->链接器->清单文件->生成清单选择否#C2远控-ShellCode-分析&提取ShellCode的本质其实就是一段可以自主运行的代码。它没有任何文件结构，它不
nnv开源神经网络验证软件工具
一、软件介绍文末提供程序和源码下载用于神经网络验证的Matlab工具箱，该工具箱实现了可访问性方法，用于分析自主信息物理系统（CPS）领域中带有神经网络控制器的神经网络和控制系统。二、相关工具和软件该工具箱利用神经网络模型转换工具（nnmt）和闭环系统分析、混合系统模型转换和转换工具（HyST）以及CONTINUOUSReachabilityAnalyzer（CORA）三、无需安装即可执行NNV可
Oracle 递归 + Decode + 分组函数实现复杂树形统计进阶(第二课) AI、少年郎数据库 ORACLE 分组求和自动递归树形数据统计
在上篇文章基础上，我们进一步解决层级数据递归汇总问题——让上级部门的统计结果自动包含所有下级部门数据（含多级子部门），并新增请假天数大于3天的统计维度。通过递归CTE、DECODE函数与分组函数的深度结合，实现真正意义上的树形结构数据聚合。一、业务需求升级：层级汇总与新增统计维度核心目标递归汇总：上级部门数据包含所有直属/非直属下级部门数据（如集团总部需汇总技术研发部、产品运营部及其子部门数据）新
C# VB.NET取字符串中全角字符数量和半角字符数量专注VB编程开发20年 c#.net 开发语言 VB.NET 字符串
C#VB.NET中Tuple轻量级数据结构和固定长度数组-CSDN博客https://blog.csdn.net/xiaoyao961/article/details/148872196下面提供了三种统计字符串中全角和半角字符数量的方法，并进行了性能对比。性能对比（处理100万次"Hello，世界！123４５６"）方法执行时间（毫秒）相对性能方法三：位运算~150100%方法二：字符遍历~2506
文本生成新纪元：解锁大模型的企业级应用密码
数字化浪潮席卷各行业的当下，文本生成技术正经历着翻天覆地的变革，这场变革的幕后功臣正是大模型。今天，咱们就来深入探讨大模型在文本生成领域的奥秘，看看它如何赋能企业，又该怎样规避风险，实现价值最大化。技术跃迁：从笨拙规则到智能生成回首往昔，文本生成依靠规则模板与关键字替换，虽能实现基础自动化，却如机械舞者，动作生硬、缺乏灵动。业务稍有变动，规则需全面重构，耗时费力。随着N-gram等统计机器学习方法
YOLOv11: AN OVERVIEW OF THE KEY ARCHITECTURAL ENHANCEMENTS目标检测论文精读（逐段解析）昵称是6硬币 (持续更新)YOLO 深度学习计算机视觉人工智能目标检测图像处理
YOLOv11:ANOVERVIEWOFTHEKEYARCHITECTURALENHANCEMENTS目标检测论文精读（逐段解析）论文地址：https://www.arxiv.org/abs/2410.17725RahimaKhanamandMuhammadHussainUltralytics公司发布CVPR2024论文写的比较简单，比较核心的改进包括：C3K2高效特征提取机制。对C2f模块的改进
实数系的基本定理_11、实数的连续性(1) weixin_39953102 实数系的基本定理
实数的连续性定理，图片来自网络。实数集合的连续性(简称实数的连续性或者实数的稠密性、实数的完备性)是实数系的一个基本特征,它是微积分学的坚实的理论基础.人们从不同的角度来描述和刻画实数集的完备性,得到了一连串的有关实数的连续性定理,其中包括:确界存在定理,闭区间套定理,单调有界收敛定理,聚点定理,有限覆盖定理,柯西准则,致密性定理等.定理1.1(确界存在定理,简称“确”)有上界数集必有上确界，有下
【CATIA的二次开发35】对象Selection部分属性介绍江树月华 CATIA VBA二次开发 CATIA的VBA二次开发 CATIA VBA CATIA宏 CATIA VBA
在CATIAV5的VBA开发中，Selection对象是用户交互的核心组件，用于管理用户在图形区域或特征树中的选择操作。Selection对象是CATIAVBA中的中央交互枢纽，充当用户界面与程序逻辑之间的桥梁。它代表当前在图形区域或特征树中被选中的元素集合，是自动化操作的基础。一、Selection对象属性和方法二、属性分类概览属性类型作用域主要用途ApplicationObject全局获取当前
【CATIA的二次开发36】对象Selection选择集管理部分方法介绍01 江树月华 CATIA VBA二次开发 CATIA的VBA二次开发 CATIA VBA CATIA宏 CATIA VBA
在CATIAV5的VBA开发中，Selection对象是用户交互的核心组件，用于管理用户在图形区域或特征树中的选择操作。Selection对象是CATIAVBA中的中央交互枢纽，充当用户界面与程序逻辑之间的桥梁。它代表当前在图形区域或特征树中被选中的元素集合，是自动化操作的基础。一、Selection对象属性和方法二、方法分类概览分类方法核心功能选择集管理Add,Remove,Remove2,Cl
R语言与C语言混合编程：在R语言中调用C语言函数数据探索 r语言 c语言开发语言 R语言
R语言与C语言混合编程：在R语言中调用C语言函数介绍：R语言是一种用于统计分析和数据可视化的高级编程语言，而C语言是一种通用的、强大的编程语言。在某些情况下，我们可能需要在R语言中调用C语言函数以提高性能或实现特定的功能。本文将介绍如何在R语言中调用C语言函数的方法，并提供相应的源代码示例。步骤：为了在R语言中调用C语言函数，我们需要执行以下步骤：编写C语言函数：首先，我们需要编写我们想要在R中调
倾向得分匹配的stata命令_R语言系列1：倾向得分匹配 weixin_39995108 倾向得分匹配的stata命令
1PSM简介倾向评分匹配(PropensityScoreMatching，简称PSM)是一种统计学方法，用于处理观察研究(ObservationalStudy)的数据。在观察研究中，由于种种原因，数据偏差(bias)和混杂变量(confoundingvariable)较多，倾向评分匹配的方法正是为了减少这些偏差和混杂变量的影响，以便对实验组和对照组进行更合理的比较。这种方法最早由PaulRosen
R语言倾向性匹配得分（PSM）分析后端工程实践 r语言 java 开发语言 R语言
R语言倾向性匹配得分（PSM）分析倾向性匹配得分（PropensityScoreMatching,PSM）是一种常用的统计方法，用于处理观察研究中的选择性偏倚。它通过建立一个倾向性得分模型，将受试者分为处理组和对照组，以实现类似于随机对照试验的效果。本文将介绍如何使用R语言进行倾向性匹配得分分析，并提供相应的源代码。导入所需的R包在进行PSM分析之前，首先需要导入所需的R包。常用的包包括Match
Python爬虫实战：研究sanitize库相关技术 ylfhpy 爬虫项目实战 python 爬虫网络开发语言安全 sanitize
1.引言1.1研究背景与意义在当今数字化时代，互联网已成为人们获取信息、交流互动的重要平台。随着Web2.0技术的发展，用户生成内容(UGC)、社交媒体嵌入、第三方插件等功能极大丰富了网页的内容和交互性，但也带来了严峻的安全挑战。根据Web应用安全联盟(WAS)的统计数据，2025年全球范围内因网页安全漏洞导致的数据泄露事件超过15万起，造成的经济损失高达250亿美元。其中，跨站脚本攻击(XSS)
Python爬虫实战：研究xmltodict库相关技术 ylfhpy 爬虫项目实战 python 爬虫开发语言 xmltodict
1.引言1.1研究背景与意义气象数据在农业生产、交通规划、灾害预警等多个领域具有重要应用价值。传统的气象数据获取方式主要依赖于气象部门发布的统计信息，存在更新不及时、数据维度有限等问题。随着互联网技术的发展，气象网站提供了丰富的实时气象数据，但这些数据通常以HTML、XML等非结构化或半结构化形式存在，难以直接利用。因此，开发高效的数据采集与解析系统具有重要的现实意义。1.2国内外研究现状网络爬虫
Python爬虫实战：研究difflib库相关技术 ylfhpy 爬虫项目实战 python 爬虫 easyui 开发语言前端 difflib
1.引言1.1研究背景与意义在信息爆炸的数字时代，互联网每天产生海量文本内容。据统计，全球新闻网站日均发布文章超过300万篇，社交媒体平台产生的文本信息量更以亿级单位增长。这种信息过载带来了内容同质化、抄袭剽窃等问题，给新闻媒体行业、学术研究领域和搜索引擎优化等带来了挑战。文本相似度分析作为自然语言处理的重要分支，能够有效识别内容间的相似程度，具有重要的应用价值：新闻媒体行业：通过检测新闻抄袭和重
面向隐私保护的机器学习：联邦学习技术解析与应用 Blossom.118 机器学习与人工智能机器学习人工智能深度学习 tensorflow python 神经网络 cnn
在当今数字化时代，数据隐私和安全问题日益受到关注。随着《数据安全法》《个人信息保护法》等法律法规的实施，企业和机构在数据处理和分析过程中面临着越来越严格的合规要求。然而，机器学习模型的训练和优化往往需要大量的数据支持，这就产生了一个矛盾：如何在保护数据隐私的前提下，充分利用数据的价值进行机器学习模型的训练和优化？联邦学习（FederatedLearning）作为一种新兴的隐私保护技术，为解决这一问
人工智能-基础篇-10-什么是卷积神经网络CNN（网格状数据处理：输入层，卷积层，激活函数，池化层，全连接层，输出层等） weisian151 人工智能人工智能 cnn 神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专为处理网格状数据（如图像、视频、音频）设计的深度学习模型。它通过模拟生物视觉机制，从原始数据中自动提取多层次的特征，最终实现高效的分类、检测或生成任务。1、核心概念与原理1、生物视觉启发局部感受野：模仿人类视觉皮层神经元仅响应局部区域刺激的特性，每个神经元关注输入数据的局部区域（如图像的一小块区域）。权值共享：同一
3 大语言模型预训练数据-3.2 数据处理-3.2.2 冗余去除——2.SimHash算法文本去重实战案例：新闻文章去重场景
SimHash算法文本去重实战案例：新闻文章去重场景一、案例背景与目标二、具体实现步骤与示例1.**待去重文本示例**2.**步骤1：文本预处理与特征提取**3.**步骤2：特征向量化与哈希映射**4.**步骤3：特征向量聚合**5.**步骤4：降维生成SimHash值**6.**步骤5：计算汉明距离与去重判断**三、工程化实现代码（Python简化示例）四、案例总结与优化点一、案例背景与目标假设
CNN-GRU混合模型学习笔记 weixin_54372988 cnn gru 学习
GRU学习笔记CNN：卷积神经网络GRU（GateRecurrentUnit），门控循环单元CNN：卷积神经网络3个组成部分：1.卷积层——提取图像局部特征2.池化层——降维（防止过拟合）3.全连接层——输出结果一个卷积核扫完整张图片，得到每个小区域的特征值具体应用中通常有多个卷积核CNN可能有多层结构，如LeNet-5：卷积层–池化层–卷积层–池化层–卷积层–全连接层处理时间序列（1D序列）：（
TVFEMD-CPO-TCN-BiLSTM多输入单输出模型微光-沫年 matlab 回归机器学习
47-TVFEMD-CPO-TCN-BiLSTM多输入单输出模型适合单变量，多变量时间序列预测模型（可改进，加入各种优化算法）时变滤波的经验模态分解TVFEMD时域卷积TCN双向长短期记忆网络BiLSTM时间序列预测模型另外以及有TCN-BILSTMTCN-LSTMTCN-BiLSTM-ATTENTION等！（此不包含在内，另算的！）Matlab代码！
CPO-CNN-GRU-Attention、CNN-GRU-Attention、CPO-CNN-GRU、CNN-GRU四模型多变量时序预测对比 Matlab科研辅导帮 cnn gru 人工智能
✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。个人主页：Matlab科研工作室个人信条：格物致知，求助可私信。内容介绍多变量时序预测在诸多领域扮演着至关重要的角色，例如金融、气象和工业控制等。近年来，深度学习方法在时序预测任务中取得了显著的进展。本文旨在系统地比较四种基于卷积神经网络（CNN）和循环神经网络（GRU）的不同架构，包
C++数值算法深度解析：accumulate与max_element 景彡先生 C++进阶 c++算法服务器
在C++标准库中，数值算法（NumericAlgorithms）提供了高效处理数值数据的工具。本文将深入解析两个核心数值算法——accumulate（累加求和）与max_element（最大值查找）的底层原理、核心特性及最佳实践，帮助开发者掌握这些“数据统计利器”的正确使用方式。一、accumulate：通用累加器1.1底层原理与实现迭代累加：对[first,last)区间内的元素执行累积操作，初
[插电式混合动力车辆][交替方向乘子法（ADMM）结合CVX]插电式混合动力车辆的能源管理：基于凸优化算法用于模型预测控制MPC研究（Matlab代码实现）程序辅导帮算法 matlab 人工智能
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️赠与读者1概述2运行结果3参考文献4Matlab代码、数据、文章⛳️赠与读者‍做科研，涉及到一个深在的思想系统，需要科研者逻辑缜密，踏实认真，但是不能只是努力，很多时候借力比努力更重要，然后还要有仰望星空的创新点和启发点。当哲学课上老师问你什么是科学，什么是电的时
Flutter多设备之响应式布局 harmonyos
Flutter多设备之响应式布局参考鸿蒙原生响应式布局场景，保持相似体验。布局能力使用场景使用说明断点将窗口宽度划分为不同的范围（即断点），监听窗口尺寸变化，当断点改变时同步调整页面布局。依赖扩展库：breakpoint媒体查询媒体查询支持监听窗口宽度、横竖屏、深浅色、设备类型等多种媒体特征，当媒体特征发生改变时同步调整页面布局。直接使用FlutterSDK中MediaQuery，无需额外适配栅格
数据分析案例-全球表面温度数据可视化与统计分析艾派森数据分析信息可视化 python 数据分析数据挖掘
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍
心跳报文 - Linux C++网络编程（二十八）生活需要深度 linux内核网络编程
一：前面学习的总结核心架构浓缩总结实现的功能：（1）服务器按照包头包体格式正确的接收客户端发送过来的数据包；（2）根据手动的包的不同来执行不同的业务处理逻辑；（3）把业务处理产生的结果数据包返回客户端；咱们用到的主要技术（1）epoll高并发通讯技术（2）线程池技术来处理业务逻辑（3）线程之间的同步技术包括互斥量、信号量其他技术：信号，日志打印，fork()子进程，守护进程借鉴了哪些官方nginx
Linux【7】------Linux系统编程（进程间通信IPC） Invinciblenuonuo linux 多进程进程间通信
文章目录1信号1.1信号类型1.2信号含义1.3信号产生按键硬件异常调用接口发送指令内核检测1.4信号处理默认捕捉忽略1.5信号阻塞1.6信号挂起2消息队列2.1概念2.2创建消息队列2.3访问消息队列2.4控制消息队列3共享内存3.1申请共享内存3.2共享内存映射3.3控制共享内存3.4信号量3.5操作信号量1信号信号是一种异步通信方式同步通信同步指的是当进程发起一个请求，但是该请求并未马上响应
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，

MATLAB2016笔记（九）：概率统计（ 概率密度、统计作图、统计特征、累积概率分布、随机变量产生）

文章目录

一、产生随机变量

（一）二项分布随机数据的产生 binornd

（二）正态分布随机数据的产生 normrnd

（三）常见分布随机数据的产生

二、概率密度计算

（一）通用函数概率密度值 pdf / ksdensity

（二）专用函数概率密度值

三、累积概率分布

（一）通用函数累积概率值 cdf / ksdensity

（二）专用函数累积概率值

四、统计特征

（一）平均值、中位数、忽略NaN的中位数、几何平均数、调和平均数

（二）数据比较 普通排序sort、按行排序sortrows、求解值域大小range

（三）期望（即算术平均值mean）

（四）方差 var、标准差 std

（五）协方差 cov、相关系数 corrcoef

五、统计作图

（一）正整数频率表 tabulate

（二）累积分布函数图形 cdfplot

（三）最小二乘拟合直线 lsline

（四）绘制正态分布概率图形 normplot

（五）样本数据的箱线图 boxplot

（六）参考线绘制 refline / refcurve

（七）样本概率图形 capaplot / capability

（八）正态拟合直方图 histfit

你可能感兴趣的:(MATLAB工具学习,概率密度,统计作图,统计特征,累积概率分布,随机变量产生)

MATLAB2016笔记（九）：概率统计（概率密度、统计作图、统计特征、累积概率分布、随机变量产生）

（二）数据比较普通排序sort、按行排序sortrows、求解值域大小range