月光不染是非

PKU 概率论+数理统计+建模期中考复习总结

计算条件概率
计算概率（放回与不放回）
生成随机数算法
- Linear Congruential Method
- 判断是否是full period
Uniformity (test of frequency)
- 1.Chi-Square test
- - method
  - reminder
  - example
- 2.Kolmogorov-Sminov test
- - method
  - example
Independence (test of autocorrelation)
- Runs test
Acceptance-rejection method
- method
- - 方法1：建议函数使用指数分布
  - 方法2：双指数分布生成正态分布
  - 方法3：
- 使用Acceptance-Rejection method对连续型随机变量有效，证明处处都有 $P(X≤x)=F_X(x)$
Empirical distribution 经验分布
- The Empirical Distribution Procedure
- Ungrouped data
- - condition
  - method
  - construction method
  - 生成U去寻找x
- grouped data
- - condition
  - construction method
  - example
  - How about discrete empirical distribution?
- 经验分布的优点与缺点
- example
Maximum Likelihood Estimator 最大似然估计
判断数据是否相互独立

计算条件概率

【作业题】
Suppose that Die-Hardly-Ever battery has an exponential time-to-failure
distribution with a mean of 48 months. At 60 months, the battery is still operating.

What is the probability that this battery is going to die in the next 12 months?
What is the probability that the battery dies in an odd year of its life?
If the battery is operating at 60 months, compute the expected additional months of life.

【重点】条件概率+指数分布无记忆性
即 $P (x > s + t ∣ x > t) = P (x > s)$

计算概率（放回与不放回）

Suppose that a man has k keys, one of which will open a door. Compute
the expected number of keys required to open the door for the following two cases:
a. The keys are tried one at a time without replacement.（不放回）
b. The keys are tried one at time with replacement.（放回）

生成随机数算法

Linear Congruential Method

判断是否是full period

【作业题】可能考察是否full period
$R_i=\frac{X_i}{m}<1$

Uniformity (test of frequency)

检验样本是否服从均匀分布

对前提进行假设
$F re q u e n cy$
$H_0:R_i's~U(0,1)$
$H_1:R_i's not U(0,1)$

在测试前要说明清楚，显著性水平
$\alpha=P(type\ one\ error)=p(reject\ H_0|H_0 is\ true)$

1.Chi-Square test

卡方检验的期望值 $E_i$ 要求 $E_i≥5$ 【这个是为了确保近似分布是合理的】

method

检验是否服从 $U (0, 1)$ 如下，

将[0,1]分成k个等长子区间(对应Reminder的Equal probability)
计算 $O_j$ ，其为样本数据 $R_i$ 落在子区间 $(\frac{j-1}{k},\frac{j}{k}]$ 的频次
$E_j=E(O_j)=\frac{n}{k}$ 观测值在j区间的期望
计算卡方 ${X_0}^2=\sum_{j=1}^{k}{\frac{(O_j-E_j)^2}{E_j}}$
Reject Ho if ${X_0}^2>X_{k-1,\alpha}^2$

reminder

example

Using appropriate test, check whether the numbers are uniformly distributed: 0.594, 0.928, 0.515, 0.055, 0.507, 0.351, 0.262, 0.797, 0.788, 0.442, 0.097, 0.798, 0.227, 0.127, 0.474, 0.825, 0.007, 0.182, 0.929, 0.852.

即判断数据是否服从均匀分布。

int main(){
#ifdef local
    freopen("data.txt", "r", stdin);
//  freopen("data.txt", "w", stdout);
#endif
    int n = 20;
    rep(i, 1, n){
        cin >> a[i];
    }
    sort(a+1, a+n+1);
    rep(i, 1, n){
        cout << " " << a[i];
    }    
}

排序可得（共20个数据）
0.007 0.055 0.097 0.127 0.182 0.227
0.262 0.351 0.442 0.474
0.507 0.515 0.594
0.788 0.797 0.798 0.825 0.852 0.928 0.929

要求期望Ei是大于5的，所以应该分为4个区间。如下

2.Kolmogorov-Sminov test

KS检测，主要用于检测数据是否符合某种分布

method

Rank $R_{(1)}≤R_{(2)}≤...≤R_{(N)}$
compute $D^+=\max_{1≤i≤N}\{\frac{i}{N}-R_{(i)}\}$
$D^-=\max_{1≤i≤N}\{R_{(i)}-\frac{i-1}{N}\}$
compute $D=max(D^+, D^-)$
拒绝 $H_0$ if $D>D_{\alpha}(N)$

example

即判断数据是否服从均匀分布。

Independence (test of autocorrelation)

Runs test

Acceptance-rejection method

This method uses an auxiliary function t(x) that is everywhere ≥ the density f(x) of the RV X we want to simulate
接受-拒绝采样，这个方法使用一个辅助函数 $t (x)$ ， $t (x)$ 函数满足处处 $t (x) \geq f (x)$ ， $f (x)$ 是随机变量X的概率密度函数，X就是我们想要进行模拟的随机变量。

显然，处处 $t (x) \geq 0$

引入 $t (x)$ 去求解 $c$

不妨，令 $r(x)=\frac{t(x)}{c}$ ，其一定为概率密度

我们必须选择 $t$ ，以此能更轻松的从 $r (x)$ 概率密度函数中采样。

method

从概率密度r(x)中产生Y
产生均匀分布U(0, 1)变量U，其独立于Y
这意味着我们必须使用其他的随机变量
当 $U≤\frac{f(Y)}{t(Y)}$ 时，则令 $X = Y$ ，否则就回到第一步重新产生Y。

例题 Problem 7: Give an algorithm for generating a standard normal random variable X ∼ N(0,1).
(Hint: if we can generate from the absolute value |X|, then by symmetry we can obtain X by independently generating a rv U (for sign) that is ±1 with probability 1/2 and setting X = U|X|.)

方法1：建议函数使用指数分布

（1）前提准备
首先，根据已知分布的概率密度函数f(x)，产生服从此分布的样本X

$f(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}} (-\inftyf(x)=2π 1e−2x2(−∞<x<+∞)$

但根据题目提示，我们仅能产生|X|，不过同理，不妨设随机变量Z， $Z = ∣ X ∣$ ，由X的概率密度函数我们可以知道Z的概率密度函数
$f_Z(z)=\frac{2}{\sqrt{2Π}}e^{-\frac{z^2}{2}} (z≥0)$
此时再找一个建议函数（辅助函数），即随机变量Y，其服从指数分布，故我们可得其概率密度函数
$f_Y(y)=\lambda e^{-\lambda y} (y>0)$
(2)我们首先得确定建议函数的参数 $\lambda$ 与Acceptance-rejection method的参数c（在Acceptance-rejection method算法中我们希望c能接近1）

$c * g (x) \geq f (x)$ ，g(x)为建议函数

$\frac{cf_Y(u)}{f_Z(u)}=\frac{c\lambda e^{-\lambda u}} {\frac{2}{\sqrt{2\pi}}e^{-\frac{u^2}{2}}}= \frac{c\lambda\sqrt{2\pi}}{2}e^{\frac{1}{2}(u-\lambda)^2-\frac{\lambda^2}{2}}$
易得
$\frac{c\lambda\sqrt{2\pi}}{2}e^{\frac{1}{2}(u-\lambda)^2-\frac{\lambda^2}{2}}≥c\frac{\lambda\sqrt{2\pi}}{2}e^{-\frac{\lambda^2}{2}}$

不妨令 $\lambda=1$ ， $c=\frac{2}{\sqrt{2\pi}}e^{\frac{1}{2}}$
(这么令代入便于计算)
即可以满足 $\frac{cf_Y(u)}{f_Z(u)}≥1$
此时确定可以将 $f_Y(u)$ 作为我们的建议函数（辅助函数）
$t(y)=cf_Y(y)$
(课件中使用t(x)代表建议函数，故此用t表示)

（3）由（2）已将建议函数 $t(y)=cf_Y(y)$ 找好，接下来我们从中进行采样

【第一个是为了得到样本Y】

生成随机变量U1，其服从U(0,1)的均匀分布，从中生成u1，从而获得采样点y
$y=F^{-1}(u1)=-ln(1-u_1)$ (这个可由指数分布的分布函数去进行求逆变换得到)

【第二个是为了得到样本U】

再生成一个随机变量U2，其也服从U(0, 1)的均匀分布，从中得到u2，且随机变量U1和U2相互独立
if $u1≤\frac{f_Z(y)}{cf_Y(y)}$
则该采样点可以取到，（接受）Z=y
否则就拒绝回到（3）的开始重新进行采样。

（4）综上，我们产生了Z，其满足 $Z = ∣ X ∣$ ，但我们实际求解的是X

因此，再生成一个随机变量U3，其服从U(0, 1)的均匀分布，从中得到u3，且随机变量U3是独立于U1、U2
$m=\begin{cases} +1& \text{u3 ≤ 0.5}\\ -1& \text{u3 > 0.5} \end{cases}$
故 $X = m * Z$ 即为采样所得服从N(0,1)标准正态分布

方法2：双指数分布生成正态分布

产生两个相互独立服从参数为1的指数分布的随机变量Y1、Y2
$Y1=-ln(U_1)$
and $Y2=-ln(U_2)$
当 $Y_2≥\frac{(Y_1-1)^2}{2}$ 时，令 $Z|=Y_1$ 否则就回到第一步重新进行采样
生成随机变量U，其服从均匀分布U(0, 1)
$Z=\begin{cases} |Z|& \text{U ≤ 0.5}\\ -|Z|& \text{U > 0.5} \end{cases}$

方法3：

生成随机变量Y，其服从参数为1的指数分布；生成随机变量U1，并令 $Y = - l n (U 1)$
生成随机变量U2
若 $U2≤e^{-\frac{(Y-1)^2}{2}}$ 则令|Z|=Y，否则则回到第一步
生成U3，若U3≤0.5则Z=|Z|；若U3>0.5，则Z=-|Z|

注意第3步， $U2≤e^{-\frac{(Y-1)^2}{2}}$ ，可得
$ln(U2)≥(Y-1)^2/2$
就可以简化 $- l n (U 2)$ 是服从参数为1的指数分布。

使用Acceptance-Rejection method对连续型随机变量有效，证明处处都有 $P(X≤x)=F_X(x)$

设，事件A为接受事件，由Acceptance-Rejection method可知，当A发生时，可将采样Y去代替X，即X=Y
$左边=P(X≤x)=P(Y≤x|A)=\frac{P(Y≤x,A)}{P(A)}$

对Y进行采样，得到y，可以取Y作为X的概率如下，
$P(A|Y=y)=P(U≤\frac{f(y)}{t(y)})=\frac{f(y)}{t(y)}$
t(y)为建议分布的概率密度函数
U服从U(0, 1)的均匀分布，故概率如上。
则 $0≤\frac{f(y)}{t(y)}≤1$
即 $f (y) \leq t (y)$
取r(y)为Y的概率密度函数
$P(A\ and\ Y ≤ x)=\int_{-\infty}^xP(A\ and\ Y ≤x|Y=y)r(y)dy$
由区间知Y≤x必然成立，故
$P(A\ and\ Y ≤ x)=\int_{-\infty}^xP(A\ and\ Y ≤x|Y=y)r(y)dy\\= \int_{-\infty}^xP(A|Y=y)r(y)dy\\ =\int_{-\infty}^x\frac{f(y)}{t(y)}*\frac{t(y)}{c}dy\\ =\frac{1}{c}\int_{-\infty}^xf(y)dy\\ =\frac{1}{c}F(x)$

又因为 $P(A)=\int_R P(A|Y=y)r(y)dy\\ =\frac{1}{c}\int_R f(y)dy=\frac{1}{c}$ 即 $P(A)=\frac{1}{c}$

已知， $=P(X≤x)=P(Y≤x|A)=\frac{P(Y≤x,A)}{P(A)}$

将 $P(A\ and\ Y ≤ x)=\frac{1}{c}F(x)$ 带入

将 $P(A)=\frac{1}{c}$ 带入

解得， $P (X \leq x) = F (x)$ ，综上得证。

Empirical distribution 经验分布

连续型经验分布是分段线性不是阶梯式

The Empirical Distribution Procedure

重点：数据是否已经被分组

Ungrouped data

condition

当原始的数据已知且有具体的值的时候

method

这里我们可以使用插值法。

首先我们得到的是一组未经处理的数据，不妨设有n个

然后，根据数值由小到大对其进行排序，

最小的值到 $\frac{1}{n-1}]$
接下来的值放到 $[\frac{1}{n-1}, \frac{2}{n-1}]$
继续上述类似操作
最大值分配到1上

这样，每个值都会和一个区间相对应

construction method

定义一个连续的、分段线性的分布函数F
将Xi单调递增排序，Xi表示第i小(Xi就是排序过的数值)，此时可以得到F函数如下
$\begin{cases} 0& ,\text{if $x⎩ ⎨ ⎧0n+1i−1+(n−1)(X(i+1)−X(i))x−Xi1,if x<X(1),if Xi≤x<X(i+1), ∀i<n−1,if X(n)<x$

生成U去寻找x

grouped data

condition

我们没有独立的数据样本点的时候，仅知道每组数据间隔中有多少数据，即

$n_j$ 个点在区间 $a_{j-1},a_j],j=0,,,,,k$
$\sum n_j=n$
令 $G(a_j)=(n_1+...+n_j)/n,j≥1,G(a_0)=0$
分配 $a_j$ 到 $G(a_j), G(a_{j+1})]$ ，剩下的数据也如上处理
最后将0值分配给任意x

construction method

example

How about discrete empirical distribution?

Data Are Not Grouped
对于数值x，定义p(x)为值为x的数值个数占所有数值个数的比例
Only Grouped Data Are Available
定义一个概率函数，使得一个区间内所有数值的概率之和为该区间数值个数占所有数值个数之比

经验分布的优点与缺点

优点

使用当前数据
易于操作

缺点

无法得到观察值范围外的数据
看起来不规则

example

Data have been collected on service times at a drive-in-bank window at the Shady Lane National Bank. The data are summarized into intervals as follows:

Set up a table like examples which has been discussed in class, for generating service
times by the table-lookup method. Generate five values of service time using random
numbers 0.9473, 0.0823, 0.3561, 0.2482, and 0.8831.

首先判断grouped or ungrouped - 显然是grouped 即没有独立的样本点，只有区间样本数
要算概率、累计概率、斜率、最后根据概率估算x

Interval Seconds	Frequency	probability	cumulative pro	Slope
15-30	10	$\frac{1}{15}$	$\frac{1}{15}$	225
30-45	20	$\frac{2}{15}$	$\frac{1}{5}$	$\frac{225}{2}$
45-60	25	$\frac{1}{6}$	$\frac{11}{30}$	90
60-90	35	$\frac{7}{30}$	$\frac{3}{5}$	$\frac{900}{7}$
90-120	30	$\frac{1}{5}$	$\frac{4}{5}$	150
120-180	20	$\frac{2}{15}$	$\frac{14}{15}$	450
180-300	10	$\frac{1}{15}$	1	1800

由图可知：
$X_0=15,X_1=30,X_2=45,...,X_7=300$

计算斜率：
$a_i=\frac{X_i-X_{i-1}}{CumulativeP(X_i)-CumulativeP(X_{i-1})}$
$a1=\frac{30-15}{\frac{1}{15}}=225$
$a2=\frac{45-30}{\frac{2}{15}}=\frac{225}{2}$
其余斜率求解方法相同，接下来根据概率求解x值

如 $F (x) = 0.9473$

易知， $F(x)>\frac{14}{15}$

$x = 180 + (0.9473 - 0.9333) * 1800 = 205.14$

其余同理。

Maximum Likelihood Estimator 最大似然估计

例题: Consider the shifted (two-parameter) exponential distribution, which has
density function
$f(x)=\begin{cases} \frac{1}{\beta} e^{-(x-\gamma)/\beta}& \text{if $x≥\gamma$}\\ 0& \text{otherwise} \end{cases}$
for $\beta > 0$ and any real number $\gamma$ . Given a sample $X_1,X_2,X_3,...,X_n$ of IID random values
from this distribution, find formulas for the joint MLEs $\hat{\gamma}$ and $\hat{\beta}$ .

求解如下:

可得最大似然函数 $L(\gamma, \beta)=\frac{1}{{\beta}^n}exp[-\sum_{i=1}^n(X_i-\gamma)/\beta]$
上式必然满足 $X_i≥\gamma$ 对于所有的 $i$
两侧同时取对数
$l(\gamma,\beta)=ln(L(\gamma,\beta))=-nln(\beta)-[\sum_{i=1}^n(X_i-\gamma)/\beta]\\ =-nln(\beta)-\frac{1}{\beta}\sum_{i=1}^{n}X_i+n\frac{\gamma}{\beta}$
我们已知， $\beta>0$ ，想要越大的 $n\frac{\gamma}{\beta}$ ， $\gamma$ 就得越大

例如 $\gamma=X_{(1)}$ ，我们就等于要最大化 $g(\beta)$ $g(\beta)=-nln(\beta)-\frac{1}{\beta}\sum_{i=1}^{n}X_i+n\frac{x_{(1)}}{\beta}$
综上可解得， $\hat{\beta}=\overline{X}(n)-X_{(1)}$
也可写作 $\hat{\beta}=\overline{X}(n)-\hat{\gamma}$ 但 $\gamma是有\ \hat{}$

要注意，尽管我们需要尽可能大的 $\gamma$ ，但是也要满足 $X≥\gamma$ ，也就是最大的 $\gamma$ 也只能取得最小的 $X_i$
$X_{(1)}=min\{X_1,X_2,...,X_n\}$

判断数据是否相互独立

Python 机器学习基础之学习基础环境搭建仙魁XAN Python 机器学习基础+实战案例 python 学习开发语言机器学习 machine learning
Python机器学习基础之学习基础环境搭建目录Python机器学习基础之学习基础环境搭建一、简单介绍二、什么是机器学习三、python环境的搭建1、Python安装包下载2、这里以下载Python3.10.9为例3、安装Python3.10.94、检验python是否安装成功，win+R快捷打开运行，输入cmd，打开cmd四、Pycharm环境搭建1、下载Pycharm安装包2、安装Pycharm
【机器学习】主成分分析法（PCA）若兰幽竹机器学习机器学习信息可视化人工智能
【机器学习】主成分分析法（PCA）一、摘要二、主成分分析的基本概念三、主成分分析的数学模型五、主成分分析法目标函数公式推导（`梯度上升法`求解目标函数）六、梯度上升法求解目标函数第一个主成分七、求解前n个主成分及PCA在数据预处理中的处理步骤（后续实现）一、摘要本文主要讲述了主成分分析法（PCA）的原理和应用。PCA通过选择最重要的特征，将高维数据映射到低维空间，同时保持数据间的关系，实现降维和去
深入探索 PyTorch 在语音识别中的应用 Zoro｜ PyTorch Deep Learning 机器学习 pytorch 语音识别人工智能
深入探索PyTorch在语音识别中的应用在本篇博客中，我将分享如何使用PyTorch进行语音识别任务，重点围绕环境配置、数据预处理、特征提取、模型设计以及模型比较展开。本文基于最近一次机器学习作业（HW2）的任务内容，任务目标是对语音信号进行逐帧音素预测，从而完成多类别分类任务。一、介绍任务背景任务目标：利用深度神经网络对语音信号进行逐帧音素预测。音素定义：音素是语音中能够区分单词的最小语音单位。
MNIST数据集&手写数字识别 Zoro｜ keras tensorflow 人工智能机器学习
TensorFlow是一个开源的机器学习框架，由Google开发并发布。它提供了一种基于数据流图的编程模型，用于构建和训练机器学习模型。TensorFlow的核心概念是张量（Tensor）和流图（Graph）。张量是TensorFlow中的基本数据单位，可以理解为多维数组，可以是标量、向量、矩阵或更高维度的数组。流图是由一系列操作（Operation）和张量组成的。操作定义了计算和转换张量的方式。
【从零开始学习计算机科学】软件工程（四）结构化需求分析与面向对象需求分析贫苦游商学习软件工程需求分析 ER图 DFD 数据字典数据流图
【从零开始学习计算机科学】软件工程（四）结构化需求分析与面向对象需求分析结构化需求分析数据模型E-R图基于E-R图的建模过程功能模型分层DFD简介基于DFD的建模原则DFD建模流程DFD的建模中的核心过程分层DFD的改进DFD建模中的注意事项行为模型STD建模的过程数据字典结构化分析总结面向对象需求分析OOAOA的过程时序图状态图面向对象需求建模总结结构化需求分析结构化分析（SA，Structur
OpenLSD是一个自适应开源数据集，旨在支持逻辑综合中的多种机器学习任务。数据集
2024-11-14，由中国科学院计算技术研究所、鹏城实验室和北京大学等联合创建OpenLSD数据集，目的为逻辑综合过程中的机器学习任务提供一个自适应的数据集生成框架。该数据集的核心研究问题是如何在逻辑综合的三个基本步骤——布尔表示、逻辑优化和技术映射中，通过机器学习方法提升效率和质量。一、研究背景：逻辑综合是电子设计自动化（EDA）流程中的关键环节，它负责将高级设计规范转化为门级网络列表。近年来
AI模型技术前沿与跨场景应用实践智能计算研究中心其他
内容概要当前AI模型技术正呈现多维度突破与跨领域融合的特征。从技术演进角度看，可解释性模型与量子计算框架的协同发展正在突破传统黑箱限制，而联邦学习、自适应优化等技术则为复杂场景建模提供了新的方法论支撑。应用层面，TensorFlow与PyTorch框架在医疗影像诊断、金融时序预测等领域的实战案例，验证了深度学习模型在垂直行业的泛化能力。值得关注的是，工具链整合已成为技术落地的关键环节，MXNet与
【Python】测试数据生成工具 --- Faker pythonfaker数据分析
Faker库介绍Faker是一个强大的库，能够帮助开发者和测试人员生成大量的假数据，但这些数据看起来却非常真实。它支持生成多种类型的数据，如姓名、地址、公司名称、电子邮件等，甚至能够根据不同国家的特定文化生成相应的数据。Faker的应用不仅限于测试，它还广泛应用于数据分析、机器学习训练集的准备以及任何需要大量样本数据的场景。Faker安装前提：已安装python、pip安装命令如下：pipinst
未来5年AI人工智能与信息技术领域发展趋势海宁不掉头发人工智能软件工程人工智能人工智能软件工程笔记 chatgpt
未来五年人工智能与信息技术领域发展趋势深度解析一、人工智能与神经网络技术的突破路径（一）算法架构的范式革新深度神经网络正经历从量变到质变的演进。以Transformer为核心的序列建模技术持续迭代，字节跳动云雀模型通过动态结构优化，在保持语言理解能力的同时将参数量压缩至GPT-4的1/10，推理速度提升3倍。更值得关注的是类脑计算的突破，中国科学院自动化研究所提出"基于内生复杂性"的类脑神经元模型
深度学习框架PyTorch——从入门到精通（4）数据转换 Fansv587 Torch框架学习深度学习 pytorch 人工智能 python 经验分享
转换（Transforms）很多时候，数据并不总是以训练机器学习算法所需的最终处理形式出现。所以我们需要使用变换对数据进行一些处理，使其适合训练。所有TorchVision数据集都有两个参数——transform来修改特征，target_transform来修改标签——接受包含转换逻辑的可调用项。torchvision.transform模块提供了几个开箱即用的转换。FashionMNIST数据集
机器学习线性回归学习心得_线性回归为机器学习的初学者解释 weixin_26750481 机器学习 python 人工智能逻辑回归深度学习
机器学习线性回归学习心得Datasciencewiththekindofpoweritgivesyoutoanalyzeeachandeverybitofdatayouhaveatyourdisposal,tomakesmart&intelligentbusinessdecisions,isbecomingamust-havetooltounderstandandimplementinyouror
统计机器学习 (Statistical Machine Learning) 原理与代码实例讲解 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
统计机器学习(StatisticalMachineLearning)原理与代码实例讲解1.背景介绍统计机器学习是现代人工智能和数据科学的核心领域之一。它结合了统计学和计算机科学的理论与方法，通过数据驱动的方式来构建预测模型和决策系统。统计机器学习不仅在学术研究中占据重要地位，还在工业界有广泛应用，如推荐系统、图像识别、自然语言处理等。2.核心概念与联系2.1统计学与机器学习的关系统计学关注数据的收
使用独立Ironpython 脚本运行Ansys electronics进行建模（二）————脚本自动打开项目并自动运行加点油。。。。 Ironpython电机建模 python 自动化
参考文档官方文档——Maxwellhelp—2022R1官方文档——MaxwellScriptingGuide代码实现功能通过Pycharm运行脚本，来自动打开已有程序，进行运行importsyssys.path.append(r"F:\ProgramFiles\AnsysEM\v221\Win64")sys.path.append(r"F:\ProgramFiles\AnsysEM\v221\W
【python 机器学习】sklearn数据集的使用人才程序员 python 机器学习 sklearn 人工智能深度学习神经网络目标检测
文章目录sklearn数据集的使用1.`sklearn`内置数据集2.导入`sklearn`数据集3.加载和使用Iris数据集3.1加载数据3.2查看数据3.3使用数据集进行分类任务4.加载和使用Digits数据集4.1加载数据4.2查看数据4.3使用数据集进行分类任务5.加载和使用BreastCancer数据集5.1加载数据5.2查看数据5.3使用数据集进行分类任务6.总结sklearn数据集的
消融实验（Ablation Study） xwhking 深度学习机器学习深度学习消融实验
消融实验（AblationStudy）定义：消融实验是一种科学研究方法，通过逐步移除模型、算法或系统中的某个组件（如模块、层、特征、数据等），观察其对整体性能的影响，从而验证该组件的必要性和有效性。其名称来源于医学领域的“消融术”（切除部分组织以研究功能），在计算机视觉、机器学习和深度学习中被广泛用于分析模型设计。为什么要做消融实验？1.验证组件的有效性核心目的：确认模型中某个设计（如注意力机制、
【Conda与Pip的完美融合】在Conda环境中优雅使用pip指南 2401_85702623 conda pip python
标题：【Conda与Pip的完美融合】在Conda环境中优雅使用pip指南Conda是一个强大的包管理器和环境管理器，广泛用于Python社区，尤其是在数据科学和机器学习领域。尽管Conda本身可以处理大多数包的安装和管理，但有时我们可能仍需使用pip来安装特定的Python包。本文将详细解释如何在Conda环境中使用pip，包括配置、安装包、环境管理等，确保您可以充分利用这两个工具的优势。1.C
量子计算+AI：未来AI Agent的计算范式 AI天才研究院计算 ChatGPT DeepSeek RL 强化学习 agent agi 推理模型智能驾驶
量子计算+AI：未来AIAgent的计算范式关键词：量子计算，人工智能，AIAgent，量子算法，量子机器学习，量子优化，量子数据处理摘要：量子计算和人工智能（AI）的结合正在改变AIAgent的计算范式。通过量子计算的超强算力和独特性质，AIAgent在数据处理、算法优化和决策能力方面展现出巨大潜力。本文将详细探讨量子计算与AI结合的核心概念、算法原理、系统架构，并通过实际案例展示量子AIAge
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据 java python javascript kotlin golang 架构人工智能
深度学习、模型架构、可拓展性、神经网络、机器学习1.背景介绍深度学习作为人工智能领域最前沿的技术之一，在图像识别、自然语言处理、语音识别等领域取得了突破性的进展。深度学习模型的成功离不开其强大的学习能力和可拓展性。本文将深入探讨深度学习算法的原理、模型架构设计以及可拓展性的关键要素，并通过代码实例和实际应用场景，帮助读者理解如何搭建可拓展的深度学习模型架构。2.核心概念与联系深度学习的核心概念是人
机器学习之向量化珠峰日记 AI理论与实践机器学习人工智能
文章目录向量化是什么为什么要向量化提升计算效率简化代码与增强可读性适配模型需求怎么做向量化数据预处理特征提取特征选择向量构建机器学习与深度学习中向量化的区别数据特征提取方式机器学习深度学习模型结构与复杂度机器学习深度学习计算资源需求机器学习深度学习数据规模适应性机器学习深度学习向量化是什么向量化是把数据转化为向量形式进行表示与处理的过程。在机器学习与深度学习的范畴内，现实中的各类数据，像文本、图像
从零精通机器学习：线性回归入门吴师兄大模型 0基础实现机器学习入门到精通机器学习线性回归人工智能 python 算法回归开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
聊聊Python都能做些什么 ·零落· Python入门到掌握 python 开发语言
文章目录一、Python简介二、Python都能做些什么1.Web开发2.数据分析和人工智能3.自动化运维和测试4.网络爬虫5.金融科技三、Python开源库都有哪些1.Web开发2.数据分析和科学计算3.机器学习和深度学习4.网络爬虫5.自动化和测试6.其他常用库四、相关链接一、Python简介Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。它最初由GuidovanRossu
基于改进ISODATA算法的负荷场景曲线聚类（matlab代码）电力程序小学童聚类 matlab ISODATA算法风电光伏
目录1主要内容聚类中心选取步骤核方法2部分代码3程序结果4程序链接1主要内容程序复现文献《基于机器学习的短期电力负荷预测和负荷曲线聚类研究》第三章《基于改进ISODATA算法的负荷场景曲线聚类》模型，该方法不止适用于负荷聚类，同样适用于风光等可再生能源聚类，只需要改变聚类的数据即可，该方法的通用性和可创新性强。该代码实现一种基于改进ISODATA算法的负荷场景曲线聚类方法，代码中，主要做了四种聚类
《基于机器学习的负荷曲线聚类算法对比与改进：K-L-isodata的创新性研究》 TWHiwhjig 机器学习算法聚类
基于机器学习的负荷曲线聚类包括kmeansisodata和改进的L-isodata以及在其基础上再次进行改进的K-L-isodata(有创新性)，四者通过评价指标进行了对比精品代码可修改性极高有参考文献ID:93150688324967700自律的电气人基于机器学习的负荷曲线聚类是一种基于数据分析和模式识别的技术，它可以帮助我们对系统的负荷变化进行分类和理解。在负荷曲线聚类的研究中，K-means
机器学习Pandas_learn4 XW-ABAP 机器学习机器学习 pandas 人工智能
importpandasaspddefcalculate_goods_covariance():#定义商品销售数据字典goods_sales_data={"时期":["一期","二期","三期","四期"],"苹果":[15,16,3,2],"橘子":[12,14,16,18],"石榴":[11,8,7,1]}#将字典转换为DataFrame对象goods_dataframe=pd.DataFra
高亮动态物体——前景提取与动态物体检测器（opencv实现） WenJGo AI学习之路 Python之路 opencv 计算机视觉人工智能深度学习神经网络
目录代码说明1.导入库2.创建背景建模对象3.打开视频源4.逐帧处理视频5.应用背景建模获得前景掩码6.形态学操作去除噪声6.1定义形态学核6.2开运算去除噪点6.3膨胀操作填补前景区域空洞7.轮廓检测识别动态物体8.绘制轮廓和边界框9.显示处理结果10.退出控制与资源释放整体代码效果展示代码说明主要功能是通过背景建模检测视频中的运动目标。其工作流程如下：读取视频帧；利用MOG2算法生成前景掩码；
如何使用Python对Excel、CSV文件完成数据清洗与预处理？ Python 集中营 python数据分析应用 python excel 开发语言
在数据分析和机器学习项目中，数据清洗与预处理是不可或缺的重要环节。现实世界中的数据往往是不完整、不一致且含有噪声的，这些问题会严重影响数据分析的质量和机器学习模型的性能。Python作为一门强大的编程语言，提供了多种库和工具来帮助我们高效地完成数据清洗与预处理任务，其中最常用的库包括Pandas、NumPy、SciPy等。本文将详细介绍如何使用Python对Excel和CSV格式的数据文件进行清洗
理解深度学习1-简介 shangjg3 PyTorch深度学习实战深度学习人工智能
人工智能（AI）旨在打造模仿智能行为的系统。它覆盖了众多方法，涵盖了基于逻辑、搜索和概率推理的技术。机器学习是AI的一个分支，它通过对观测数据进行数学模型拟合来学习决策制定。这个领域近年来迅猛发展，现在几乎（虽不完全准确）与AI同义。深度神经网络是一类机器学习模型，将其应用到数据上的过程称为深度学习。目前，深度网络是最强大和最实用的机器学习模型之一，常见于日常生活中。我们常常用自然语言处理（Nat
【Java】已解决：`java.sql.SQLSyntaxErrorException: SQL` 屿小夏 java sql 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
AIGC带来数据革命：R语言如何成为数据科学家的秘密武器？程序边界 AIGC r语言开发语言
文章目录一、R语言的基础特性1.1R语言的起源与发展1.2R语言的核心优势二、R语言在AIGC中的应用场景2.1数据预处理与清洗2.2文本分析与生成2.3机器学习与模型构建2.4数据可视化与报告生成三、R语言在AIGC中的具体案例3.1金融数据分析与预测3.2医疗数据分析与建模3.3社交媒体数据分析与情感分析四、R语言在AIGC中的未来展望4.1与深度学习框架的集成4.2与云计算平台的集成4.3与
【pytorch(cuda)】基于DQN算法的无人机三维城市空间航线规划（Python代码实现） wlz249 python pytorch 算法
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️赠与读者1概述一、研究背景与意义二、DQN算法概述三、基于DQN的无人机三维航线规划方法1.环境建模2.状态与动作定义3.奖励函数设计4.深度神经网络训练5.航线规划四、研究挑战与展望2运行结果3参考文献4Python代码实现⛳️赠与读者‍做科研，涉及到一个深在的
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发

PKU 概率论+数理统计+建模 期中考复习总结

目录

计算条件概率

计算概率（放回与不放回）

生成随机数算法

Linear Congruential Method

判断是否是full period

Uniformity (test of frequency)

1.Chi-Square test

method

reminder

example

2.Kolmogorov-Sminov test

method

example

Independence (test of autocorrelation)

Runs test

Acceptance-rejection method

method

方法1：建议函数使用指数分布

方法2：双指数分布生成正态分布

方法3：

使用Acceptance-Rejection method对连续型随机变量有效，证明处处都有 P ( X ≤ x ) = F X ( x ) P(X≤x)=F_X(x) P(X≤x)=FX​(x)

Empirical distribution 经验分布

The Empirical Distribution Procedure

Ungrouped data

condition

method

construction method

生成U去寻找x

grouped data

condition

construction method

example

How about discrete empirical distribution?

经验分布的优点与缺点

example

Maximum Likelihood Estimator 最大似然估计

判断数据是否相互独立

你可能感兴趣的:(概率论,机器学习,建模,数学建模)

PKU 概率论+数理统计+建模期中考复习总结

使用Acceptance-Rejection method对连续型随机变量有效，证明处处都有 $P(X≤x)=F_X(x)$