Cyril_KI

光伏发电量和用电量的概率预测研究综述（2）

前言

由于本篇综述实在太长，故分为三部分，此乃第二部分。第一部分：光伏发电量和用电量的概率预测研究综述（1）

3. Forecasting techniques

由于本文主要涉及概率预测，本节专门介绍这些特定的预测方法。

虽然在SPF中，时间序列方法（如ARIMA）和基于人工智能（AI）的方法（如人工神经网络）都被认为是统计方法，但在负荷预测中，通常会对统计方法和基于人工智能的方法进行区分。

最后，本文只是列举了概率预测的一些常用方法。

3.1. Statistical approach

下面分别介绍参数化和非参数化方法。

3.1.1. Parametric

3.1.1讲述参数化方法。

参数方法依赖于将已知密度函数拟合到预测误差，通过围绕确定性预测假设密度函数。对于统计方法，这些确定性预测通过诸如ANN或ARIMA的众所周知的方法来实施。然而，这些方法超出了本文的范围，感兴趣的读者可以参考[15]，[16]，[26]获得更多信息。由于参数方法依赖于确定性模型，因此本节非常简短。然而，为了说明这种方法是如何工作的，David等人[70]提供了一个合适的例子。他们的模型基于广义自回归条件异方差（GARCH）模型，该模型估计非常数方差。假设该模型的误差是正态的，然后，相应地建模以构建预测间隔。
总结：对于统计方法，参数化的体现是ANN或者ARIMA等，但不在本文讨论范围之内。

表一：

3.1.2. Nonparametric

3.1.2讲述非参数方法。

分位数回归。
从表1中可以看出，构建非参数PDF的最常用方法是QR。这种方法是由Koenker&&Bassett[71]在1978年引入的，他们认为假设正态性或任何其他分布是很不现实的，因为一些错误可能导致偏离这些分布，为了建立非参数方法，Koenker和Bassett意识到中位数可以定义为由于中位数的对称定义而导致绝对残差最小化的解决方案，这就得来第0.5个分位数。实际上，QR是基于调查中的每个 $\tau$ 分位数定义回归模型并将它们组合以创建概率预测。

令 $\tilde{X}$ 为一个随机响应变量， $X$ 为预测变量，令 $\tilde{x}$ 和 $x$ 为随机变量的实现，令 $F(\tilde{x}|X=x)=P(\tilde{X} \leq \tilde{x}|X=x)$ 为累积分布函数，则阶数 $\tau,q_{\tau}(x)$ 的条件分位数可以定义为：

$q_{\tau}(x)=F^{-1}(\tilde{x}|X=x)=inf \{\tilde{x} \in R,F(\tilde{x}|X=x)\geq \tau \}$
其中 $\tau \in[0, 1]$ 。如前所述，中值可以定义为绝对残差的最小化，它可以通过求解以下最小化问题来推广以获得其他分位数[67]：

$q_{\tau}(x)=argmin\ E\{L{\tau}(\tilde{X}_{\tau}, x)|X=x\}$
其中 $L{\tau}(\tilde{X}_{\tau}, x)$ 是式（2.45）中定义的弹球损失函数。值得注意的是，QR也可以用作后处理技术，从点预测技术中获取密度函数。另一个重要的注意事项是，由于每个分位数是独立预测的，因此可能发生分位数交叉，这违反了单调性[72]。
$\tilde{q}_{\tau_{i}}(x)\leq\tilde{q}_{\tau_{i+1}}(x)\forall\ i,...,\tau\ quantiles,so\ that\ \tau_{i}\leq\tau_{i+1}$
已经提出了许多方法来规避这种情况，例如单调重新排列或联合估计[72]。感兴趣的读者可参考[71]，[73]，[67]以获取更多信息。

分位数回归森林。
另一种用于构建非参数密度函数的方法是分位数回归森林（QRFs），它建立在随机森林（RFs）上，这是Breiman在2001年开发的一种回归集成学习方法[74]。QRFs最初由Meinshausen于2006年提出[67]，旨在存储有关观测的所有信息，并能够基于该信息构建条件分布，与RF相反，其中只有某个节点中观测值的均值被储存了。
随机森林参考：决策树与随机森林(从入门到精通)

QRF的工作原理如下[67]：首先，与RF类似，生长k个树 $T(\theta_{t})$ ，其中 $\theta_{t}$ 是随机参数向量，它控制着树T和t=1,…,k,的分支的每个分裂点处的变量，与RF的不同之处在于所有信息（而不仅仅是平均值）都存储起来。

对于预测器X的某个实现x来说，下一步是分别为i∈{1，…，n}的每个树和每个观察计算观测值权重 $w_{i}(x,\theta_{t})$ 和 $w_{i}(x)$ 。这些权重定义如下：

$w_{i}(x, \theta_{t})=\frac{1\{X_{i}\in R_{\zeta_{(x,\theta)}}\}}{\#\{j:X_{j}\in R_{\zeta_{x,\theta}}\}}\\ w_{i}(x)=k^{-1}\sum_{t=1}^{k}w_{i}(x, \theta_{t})$
其中Rℓ(x,θ)是空间S的矩形子集，其中X对于每个叶子ℓ=1,…,L.此外，每个只有一个叶子ℓ因此也是x∈Rℓ,然后可以将其定义为树T(θ)的ℓ(x,θ)。

之后 $\tilde{F}(\tilde{x}|X=x)$ 可以插入式（3.1）代替 $F(\tilde{x}|X=x)$ 来获得分位数 $\tilde{q}_{\tau}(x)$ 。一旦构建和训练了随机森林，就可以从树上得到来自测试数据集的观察结果，之后将在每个分裂点处对其进行比较并指向最相似分支的方向，随后可以估计输出。从某种意义上说，这可以与最近邻居方法进行比较，本节稍后将对此进行说明。

高斯过程。
在第4节中相对较少的方法是使用高斯过程（GP），在Rasmussen和Williams[75]的书中广泛讨论。这种非参数和概率方法基于贝叶斯定理，其定义如下：

$p(\theta|y)=\frac{p(\theta,y)}{p(y)}=\frac{p(y|\theta)p(\theta)}{p(y)}$
这里 $\theta$ 是一组未知参数，y={y1,…,yn}，p(y|θ)表示给定模型参数θ在数据y上的PDF，p(θ)是先验，表示对模型参数的先验信念参数和p(θ|y)后验分布，是我们观察y后p(θ)的更新版本。换句话说，目的是在观察新数据时更新我们对先验的信念。以这种方式，可以以概率方式学习参数θ，其中PDF表示伴随这些参数的不确定性。

GP的定义表明它是随机变量的集合，并且这些随机变量的任何子集都具有联合多元高斯分布，其具有均值μ和协方差矩阵K[75]。更直观地，可以想象GP是某个函数f的表示，例如，观察x1和x2，生成输出f(x1)和f(x2)，然后假设它们是根据N(μ,K)的联合高斯分布。然而，这不必限于两个观察，因此我们可以将该概念扩展到任意数量的输入x={x1，…，xn}，使得协方差矩阵K可以定义为[76]：

其中 $k(x_{i},x_{j})$ 是协方差函数或内核，表示任何输入x之间的相关性。有关内核的更多信息，请参阅[75]。另外，我们可以将平均函数定义为μ(x)，以便多元高斯分布相当于：

在进行新观察的情况下，例如x*，可以首先通过定义新的联合分布来计算后验分布。

随后，我们可以根据计算后验分布


有关使用GP进行多步预测的更多信息，感兴趣的读者可参考Girard等人[77]的文章。同样，感兴趣的读者可以参考Roberts等人[76]有关时间序列建模情况下GP的更多信息。

自举法。
自举法由Efron[78]在1979年提出，作为一种从随机样本 $X=(X_{1},X_{2},…,X_{n})$ 中估计随机变量R(X,F)的概率分布的方法，这些随机样本来自一个未知的父分布F。由于其简单性，自举方法在许多研究领域得到广泛应用，它包括三个步骤。第一，一个样本的概率密度函数 $\tilde{F}$ 是由 $X_{i}$ 的n个实现构成，即 $x_{1},x_{2},…,x_{n}$ 。第二，通过从 $\tilde{F}$ 替换绘制，创建大小为n的随机样本，即自举样本 $X_{i}^{*}=(X_{1}^{*},x_{2}^{*},...,x_{n}^{*})$ ，其中 $X_{i}^{*}=x_{i}^{*}$ 。最后，R(X,F)的分布可以通过自举分布来近似，其中经常使用MC，因为它允许以有效的方式良好地近似父分布，虽然自举的缺点是所需数据的数量和随之而来的计算负担。
自举法参考：机器学习之Ensemble（Bagging、AdaBoost、GBDT、Stacking）

限上限估算（LUBE）方法。
Khosravi等人[79]在2011年介绍了下限上限估算（LUBE）方法，因为他们认为，用于构建预测区间的普遍方法是值得怀疑的。作者认为这些方法主要基于最小化预测误差，而非改进预测区间的质量，即，如式（2.38），（2.40），（2.41）所定义的PICP，PINAW和CWC。这是预测区间的关键特征。

LUBE方法从构建具有两个输出而不是一个输出的几个神经网络（NN）开始，一个是预测区间的上限，另一个是下限。可以利用传统的学习方法在训练数据集上训练神经网络并获得初始参数和权重，或者也可以随机分配这些参数和权重。选择具有最低PINAW的，同时满足PICP的候选者，作为最佳结构，之后初始化NN权重和优化算法，例如粒子群优化（PSO）[64]。随后，该最佳结构用于构建训练数据集的预测区间，计算CWC。如果在几次迭代之后CWC不再改进，则利用NN的最佳参数集来测试测试数据集，并且可以创建相应的预测区间。
梯度提升。
梯度提升（GB）由弗里德曼[80]于2001年提出，其目的是将弱学习器（即具有有限预测信息的自变量）线性组合到单个预测模型中。与其他提升方法类似，预测模型在初始猜测函数（通常是数据集的均值）和适合后续残差的函数的情况下迭代地建立，称为提升。这意味着模型通过学习先前模型的误差来改进自身，前者模型是难以拟合的实例，之后所有模型都被赋予权重并组合成一组预测变量。然后可以将最终模型表述如下[80]：

$\hat{F}(x)=\hat{f}_{0}(x)+\sum_{m=1}^{M}\hat{f}_{m}(x)$
其中 $\hat{f}_{0}(x)$ 是初始猜测， $\hat{f}_{m}(x)$ 是提升m处的残差模型，M是提升的总数。在训练阶段，目的是根据可微分损失函数 $L(\hat{x},F(x))$ 找到描述误差的函数，例如，在式（2.45）中的分位数损失函数。根据[80]，每次提升根据最陡下降的梯度：

$\hat{f}_{m}(x)=-\rho_{m}g_{m}(x)$
其中：

GB的一个有趣的特征是执行内在变量选择，以及为每个分位数训练τ个不同模型以获得密度函数的可能性。值得注意的是，存在这种方法的扩展，例如Bühlmann提出的扩展，其中只选择了d-预测变量中的一个预测变量，感兴趣的读者可参考[80]，[81]。
GB参考：机器学习之Ensemble（Bagging、AdaBoost、GBDT、Stacking）

核密度估计。
核密度估计（KDE） 是一种非参数方法，用于估算从未知密度F中抽取的随机变量的密度 $\hat{F}$ ，由Rosenblatt[82]和Parzen[83]独立提出。想象一下，从前面提到的密度F中绘制一个样本(x1,x2,…,xn)，然后将它们组织到直方图中的箱子（区域）中。根据样本之间的距离，直方图具有多个比其他区域更高的箱子（区域），例如，如果图形的值彼此接近并且分辨率是粗略的，则这些图形将被添加到相同的箱子（区域）中。这意味着直方图是非平滑的，并且核密度估计器旨在通过在每个点上施加具有特定宽度的核函数，来平滑每个样本点xi的贡献，其中i∈{1,…,n}。核密度估计器的公式如下：

其中K(⋅)是核函数，h>0是带宽，这是一个平滑参数。核K(⋅)必须是积分为零且具有零均值的函数，例如均匀，三角形或正态的。选择h时需要特别注意，因为将参数设置得太低导致了欠平滑的KDE，其中基础分布的噪声使 $\hat{F}$ 变形。另一方面，将h设置得太高意味着来自基础分布F的信息将丢失。确定最佳带宽hopt的常用方法是通过最小化渐近平均积分平方误差（AMISE）。AMISE可以表示如下[82]。

$AMISE=\frac{1}{2hN}+\frac{h^4}{36}\int_{-\infty}^{\infty}|F^{n}(x)|^2dx$
值得注意的是，AMISE（h）取决于基础分布F的二阶导数，这是人们想要确定的分布，因此是未知的。然而，可以证明，可以使用更高的导数来表达类似的表达，并且在F可以被假定为正态之前，这仅需要进行两次或三次。然而，这不属于本文的范围，感兴趣的读者可参考[82-84]。

k-最近邻（k-NN）。
k-最近邻（k-NN）是一种相对简单的机器学习方法，它依赖于将观察结果与训练样本中k个类似的过去观察结果进行比较，以创建概率分布[85]。该算法计算观测和过去观测之间的超空间中的距离，例如欧氏距离，以确定最接近当前观测的k个邻居。例如，如果k=1，算法将简单地选择最近的邻居。

k的值需要相对较高，以便降低总噪声，并且可以通过交叉验证选择或凭经验选择。此外，通常将更多权重分配给更接近当前观察的过去观察，例如，通过给每个邻居赋予1/d的权重，其中d是观察与邻居之间的距离。

k-NN需要考虑的一个关键方面是，由于维数灾难，维度需要保持相对较小。这意味着搜索空间随着维度的增加呈指数增长并产生显著的稀疏性，直到观察的簇变得太远并且统计显著性明显降低。
KNN参考：最简单的分类算法之一：KNN（原理解析+代码实现）

模拟集成法。
模拟集成（AnEn）由Delle Monache等人[86]在2013年提出，它可以看作是一种混合方法，因为它结合了NWP预测，NWP过去预测和光伏发电量测量。在假设过去预测的误差可能与当前NWP预测的误差相似的情况下，该算法搜索了与当前预测相似的气象变量的预测，从而显示了与k-NN的许多相似之处。然后，使用与当前NWP预测相似的过去预测相关的测量功率产生来构建密度函数。相似性或距离的表述如下[86]：

其中 $\hat{F}_{t}$ 和At分别是确定性NWP模型t时间的当前和模拟过去预测；N是物理变量的个数，wi是它们的权重， $\sigma_{\hat{F_{i}}}$ 是它们各自时间序列的标准差， $\tilde{t}$ 代表了计算距离时时间窗口的一半的宽度。所以，j是计算距离时时间窗口的宽度，权重wi可以在训练集上最小化CRPS计算得到（定义如式2.43）。算完距离后，就可以构建一个排序，包含n个来构建密度函数。
Delle Monache等[86]指出AnEn与基于NWP的集成相比的优势在于，AnEn仅需要物理模型运行一次，而NWP集成需要多次运行并具有扰动以构建密度函数。潜在的缺点是没有对NWP预测进行后处理，这些预测倾向于存在偏差。

3.2. Physical approach

3.2节讲述物理方法。

通过物理方法，通常的做法是假设描述错误的密度函数。其原因在于物理方法允许在非参数方法方面的变化较小，因为在那种情况下需要应用统计方法形式的后处理。这通常被称为混合方法，并在第3.3节中详细说明。

3.2.1. Parametric

参数化方法。

参数方法依赖于将预测方法的误差建模，在这种情况下是物理模型，作为特定密度函数，例如，法线，β或伽马。这可以通过几种方式实现。例如，Lorenz等人[8]将预测误差建模为正态分布，随后评估误差是否依赖于晴空指数和太阳天顶角。然后将该依赖性建模为四阶多项式，之后可以估计未来的误差。

另一种方法是由Fonseca Jr.等人[87]提出，其中假设正态分布和拉普拉斯分布，之后计算预测区间限制，其中可以以某个预定概率找到预测。

3.2.2. Nonparametric

非参数化方法。

如前所述，非参数方法的可能方法几乎没有变化。实际上，目前正在使用一种方法，称为集成预测。该方法依赖于NWP模型的多次运行，但在初始和边界条件下的微小扰动，被设计为在统计上相同。通过这种方式，产生了若干确定性预测，之后可以从这些预测中构建密度预测。这种方法的缺点是运行NWP模型在计算上要求很高，尤其是几次带有扰动的运行。

3.3. Hybrid approach

3.3节讲述混合方法。

如前所述，NWP模型构建概率预测的密度函数的能力有限。同样，基于天空图像的预测也缺乏生成PDF的能力。因此，存在混合方法，其中物理方法的后处理通过统计方法完成，以便消除偏差并构建密度函数。

楚等人[88]提出了一种基于天空图像和五种统计模型的混合方法，即四个ANN和一个支持向量机（SVM），分别用于预测平均DNI和相关标准偏差并对变异周期进行分类。在假设这些是正态分布的情况下，利用方差来构建预测区间。

另一个例子是Sperati等人[89]的工作，他们利用欧洲中期天气预报中心（ECMWF）集合预报系统（EPS）对NWP模型进行集成预测，之后使用NN来减少偏差并创建PDF，以及其他两种后处理技术，将在下一节中详细说明。

总结：

4. Review sorted on temporal horizon

本节回顾了有关PSPF和PLF的最新研究，并结合其他几项对预测领域至关重要的研究。该部分根据预测范围进行组织，因为时间范围是模型的突出特征。此外，这种划分允许我们以比例如基于参数或非参数划分的更高分辨率来辨别彼此的研究。此外，表1提供了本文正在综述的研究的概述，并按照其发表年份的时间顺序排序。

4.1. Intra-hour

小时内的。

小时预测通常基于统计方法，尽管在PSPF的情况下，它也可以通过天空图像来实现，如图1所示。关于负荷预测，小时内预测相当罕见，即消费数据的分辨率比较粗狂。然而，智能表计的最新发展允许以更高的时间分辨率进行测量，这就允许降低时间范围。

太阳能。迄今为止，最短预测提前期的研究是Torregrossa等人[90]所做的工作。他们认为，由于太阳辐照度在亚秒级时间范围内变化极大，因此有必要找到太阳辐照度的边界，这可能有助于智能电网的实时控制。他们所提出的方法，称为动态区间预测器（DIP），其工作前提是可以在太阳辐照度的导数和确定性预测误差之间找到显著的相关性，并且可以基于上述相关性估计预测区间。该方法的一个优点是它不依赖于确定性预测模型。然而，对Torregrossa等人的评估不佳，这是因为他们声称“在PV预测领域呈现的所有工作都假设了高斯创新”，而他们指的是Bacher等人[91]，其中QR已用于构建非参数预测区间。然而，作者提出了一种创新方法，其工作时间分辨率为250和750毫秒，提前期为2-6秒，在覆盖概率方面表现出良好的性能。根据分辨率和范围，PICP介于97.94％和99.92％之间。利用一种度量来量化预测区间的宽度，但不幸的是，没有如式（2.40）所定义的PINAW。作者没有考虑所有观测结果，而是排除了超出预测区间的预测。

作为上述工作的延续，斯科拉里等人[92]通过应用两项主要改进提高DIP模型的性能。首先，作者发现将误差定义为预测和测量之间的绝对误差产生了比相对误差更真实的结果，因为后者在低测量交流电（AC）功率时可能会产生误导。其次，它们将测量的交流功率的导数与确定性预测误差之间的相关性聚类为交流功率本身的函数。作者继续表明，绝对误差确实比相对误差表现得更好，前一种方法使PICP始终高于标称置信水平。最后，他们展示了聚类的包含导致更好的性能，最显著的是导致提前时间分别为100毫秒到500毫秒的PINAW（0.0055-0.24％）和CWC（0.055-0.24％）。

上述研究的作者继续研究[93]中的（非常）短时间范围。类似地，通过k均值算法进行聚类，以根据解释变量的值将晴空指数的观测分组到特定聚类中。然而，与之前的研究相反，本文没有考虑导数。对原始和差异化的晴空指数时间序列进行聚类，其中后者用于进一步对原始时间序列进行固定。在聚类之后，可以为每个聚类计算预测区间。为了保证计算性能，上述计算，即预测间隔的聚类和计算，都可以离线完成。在运行模型时，将解释变量的观察结果与聚类进行比较，并返回对应于最近聚类的预测区间。结果显示模型的有效性：对于500ms的预测范围和分辨率，所提出的模型实现了96.1％和98.2％之间的PICP，0.047％和0.27％之间的PINAW以及0.047％和0.27％之间的CWC，具体取决于季节。当预测范围增加并且时间分辨率降低至1分钟时，该模型实现了PICP在96.9％和97.8％之间，PINAW在3.26％和10.5％之间，CWC在0.3.26％和10.5％之间，也取决于季节。最后，对于5分钟的预测范围和时间分辨率，发现PICP介于96.1％和96.7％之间，PINAW介于6.70％和17.9％之间，CWC介于6.70％和17.9％之间。值得注意的是，这里的PICP结果是在95％的标称置信水平下实现的，因此可以认为是有效的。

Wan等人[94]提出了一种预测丹麦10千瓦光伏系统发电的方法，预测范围为5分钟，时间分辨率相同。所使用的方法基于QR和极端学习机（ELM），它是前馈NN的一种形式。ELM的优点是随机选择输入权重，并且在一个步骤中学习隐藏节点和输出之间的权重。因此，它有效地类似于线性系统，这显著减少了训练时间。在覆盖率方面取得了良好的结果，得分为-0.0222，同时优于所有基准模型，即持久性，基于引导程序的NN（BNN）和颗粒计算（GC）。

Chu等人[88]使用混合方法预测直接正常辐照度（DNI），其预测前置时间为5-20分钟，时间分辨率为1分钟。该方法基于天空图像，SVM和ANN子模型，旨在产生实时预测间隔。首先，基于红色强度和蓝色强度的比率分析天空图像，因为云像素倾向于具有比晴空像素更高的红色强度。然后，利用SVM将天空图像和DNI时间序列分为两类：具有高和低可变性的天。最后，针对两个类别训练了两个人工神经网络：一个预测辐照度，另一个预测标准偏差，假设正态分布。结果显示，与基准模型相比，在所有前沿的CWC方面表现出色，即持久性和BNN，最显着的是在具有高变异性的日子，其中CWC在0.554和8.733之间。

Chai等人[95]通过将时间序列分割成具有下限和上限的统一时间窗口，并利用所有获取的粒度时间序列作为随机向量前向链路（RVFL）网络的输入，来解决构建高度可变时间序列的预测间隔的问题。预测提前期为10分钟，分辨率为1分钟。与LUBE方法类似，作者认识到可以通过增加预测间隔宽度来实现更高的覆盖概率，即高可靠性。因此，他们通过PSO最小化平均覆盖误差和得分来解决这个问题。结果显示，PICP和PINAW分别为91.20%和16.94％，并且与作者早先提出的模型相比，显示出在高变异性期间可靠性显着提高。

为了预测太阳辐照度，David等人[70]提出在正态假设下，结合参数的递归估计使用ARMA和GARCH模型以参数方式构建预测区间。预测范围为10分钟，与分辨率相似。由于时间序列应该是平稳的，作者使用晴空指数而不是GHI。参数的递归估计基于递归最小二乘（RLS）并且用于结合诸如飓风的短期模式，其对辐照度具有深远影响。结果表明，与持久性集合相比，CRPS的改善率为7.8%至25.1%。然而，作者指出，尽管假设了正态分布，但这不是一个有效的假设，这反过来又导致它在某些条件下过于自信。

Golestaneh等人[44]采用另一种与QR结合的ELM。对于PSPF，提前时间长达一小时。作者选择ELM是因为它具有极快的学习机制，并利用PSO确定输出节点相对于技能分数的最佳权重。此外，每天的预测窗口限于特定时间，其数量在全年保持不变。作为基准，应用了持久性，气候学，混合智能算法（HIA）和自举ELM（BELM），其中HIA源于PWPF的改进以发现非参数预测密度。作为案例研究，两个独立的站点进行了调查，分析时间为10分钟和1小时。此外，利用k折交叉验证来确定参与的滞后数的最佳值。结果表明，基准分子BELM和持久性在分位数分数方面表现良好但缺乏可靠性，在BELM的情况下偏差高达20％。此外，气候学和HIA在锐度和可靠性方面表现不佳，而所提出的方法在具有可接受的锐度的同时实现了高可靠性。定量地，所提出的方法在分位数得分方面提高了4％到14％的性能而不是持久性。

Boland[96]应用耦合自回归和动力系统（CARDS）来预测法属西印度群岛三个地点的太阳辐射，利用这些地点之间的部分相关性来改善预测，评估为10分钟和每小时。然而，发现最高分辨率的相关性不显著，而小时但是在每小时时间尺度上显著。该方法的工作原理如下：首先，通过使用傅里叶级数对功率谱进行建模，之后从数据中减去模型的贡献，留下随后用CARDS方法建模的残差序列。由于相关性，作者在每小时的时间尺度上考虑了单个站点的滞后测量，以及其他两个站点的测量。然后，在假设误差是正态分布的情况下，采用类似的方法用自回归条件异方差（ARCH）模型对方差进行建模。遗憾的是，没有使用概率性能指标来评估所提出方法的性能。

为了构建光伏发电预测的概率预测，Wang和Jia[97]提出了一种基于径向基函数（RBF）的非参数模型用于确定性预测，LUBE方法用于预测区间。预测范围是一小时，时间分辨率为15分钟。为了改进模型的训练，作者根据类似的日期方法组织了历史数据，其中样本是基于季节类型，日间类型和大气温度构建的。后者的相似性基于欧氏距离计算。选择RBF网络是因为它是前馈网络，因此不需要反向传播方法来训练它，这提高了学习速度。尽管本文中使用的方法很有前景，但没有使用概率性能指标。

Chu和Coimbra[98]旨在利用k-NN预测DNI，预测范围为5-20分钟，分辨率为1分钟。在这种情况下，k被设置为30，并且基于预测与观测之间的距离对邻居进行加权。如第3.1.2节所述，k-NN的一个关键方面是尽可能地降低维数，因此作者使用滞后DNI观测作为内生输入，并将滞后DHI和天空图像特征作为外生输入。结果表明，k-NN集成优于持续集合和具有高斯分布假设的k-NN。作者报告，标称置信水平为90%，PICP介于0.93和0.96之间，PINAW介于0.22和0.57之间，持续5分钟，PICP介于0.91和0.93之间，PINAW介于0.31和0.70之间，持续20分钟。该模型在CRPS方面也优于基准，据报道，在5分钟的时间范围内达到0.031-0.098，在20分钟的时间内达到0.049-0.137。不幸的是，目前尚不清楚上述结果的单位是W/m2还是kW/m2，因为前者会产生非常令人印象深刻的结果，尽管这些不符合报告的RMSE。

负荷。如前所述，用一小时甚至一天的时间来预测电力需求是相当不寻常的。因此，本节仅综述在此范围内进行的两项研究。第一个是Bracale等人[99]的研究中，结合贝叶斯推理（BI）方法的随机时间序列被用来创建15分钟和24-48小时的范围的概率预测。此外，根据时间序列是否差异（正态分布）（Weibull或Log-Normal分布），利用若干密度函数来构建单个国内负载的预测间隔和五个国内负载的总和。所提出的模型使用测量和参数的先前PDF以及ARIMA对平均值的预测来通过BI导出先前PDF的共轭分布，以便建立国内负荷的预测后验分布。结果显示，与概率持续性相比，改善了27-31％。此外，结果表明，假设正态分布的方法提供了最好的可靠性，与理想可靠性的最大偏差小于3％。

第二个是Guan等人[100]的研究，以时间分辨率5分钟预测每小时范围的负荷，即随后的一小时内每5分钟有12个预测。为了实现这一点，作者将负荷数据分解为不同频率的三个分量，用于三个小波NN（WNN）。另外，使用日历变量作为WNN的输入，以帮助它们识别负载数据的周期性模式。然后通过混合卡尔曼滤波器训练WN-N，其具有可用于导出预测间隔的创新协方差作为输出之一。根据协方差，在正态分布的假设下，方差估计可以通过频率的正交性获得并加在一起，以确定总体方差。虽然没有使用概率性能指标来评估预测区间，但作者表明，正态性假设仅在去除尾部后才有效，因为它们比高斯分布更重。

4.2. Intra-day

在日内范围内预测太阳能和电力需求是常见的，因为通常存在能源交易的两个市场：日内和日前。因此，这两个方面的日内预测对于平衡生产和消费很重要。正如我们将要揭示的那样，本节中将要讨论的大多数方法都依赖于统计方法，因为物理模型在时间分辨率方面往往过于粗糙。

太阳能。Bracale等人[101]提出了一种与AR线性模型相结合的BI方法，其中上述研究[99]是一个延续，以预测1-3小时范围和1小时的时间分辨率的光伏发电功率。然而，在这项研究中，作者利用改进的Gamma分布来模拟清晰度指数分布，其中唯一未知的是下一时间步的平均清晰度指数，这是由AR模型估计的。然而，没有使用概率度量来评估预测区间。

本综述中分析的少数研究中使用卫星观测的研究之一是Bilionis等人[102]的研究。其中他们采用递归高斯过程（rGP）。作为第一步，为了降低卫星图像的维数，他们采用因子分析（FA），即概率主成分分析（PCA）的泛化方法。减少维数的一般想法是构造两个地图：缩小和重建地图，其中前者具有不会丢失太多信息的情况下尽可能小的尺寸。随后，作者应用rGP来学习减少输入空间的动态，以执行迭代预测，提前期为8小时，分辨率为30分钟。尽管由于减小的动力学的非线性，预测密度不再是高斯分布，但是仍然可以应用数值方法来产生预测密度。结果表明，所提出的基于卫星的方法在提前一步预测方面的表现略差于基于地面的模型，但在更大的时间范围内表现优于它，平均CRPS为0.18，尽管尚不清楚哪个单位CRPS在这种情况下。

Grantham等人[103]提出了一种统计方法，用于预测范围和分辨率为一小时的太阳辐照度全密度。该方法基于CARDS模型结合自举和太阳位置图，旨在展示如何将确定性预测转化为非参数概率预测。作者指出，辐照度取决于周期性，自回归和误差分量，后者被认为是由太阳位置引起的。因此，通过绘制样本内预测的残差与太阳小时角和太阳高度的关系，作者组织了方差的系统变化。应该注意的是，Lorenz等人[8]采用了类似的方法，尽管Lorenz等人。假设正态分布，而Grantham等人采取非参数方法。为了评估性能，作者使用了CRPS，其显示出比基准集合提高了10%。此外，所提出的方法产生比基准模型更窄的预测间隔，结合更高的覆盖率。

为了对PV具有高渗透率的配电网络进行风险评估，Tao等人[104]提出了一个框架，其中利用动态贝叶斯网络（DBN）进行概率预测。但是，由于该论文的主要重点是进行风险评估，因此没有注意以任何方式评估概率预测。

AlHakeem等人[105]提出了广义回归NN（GRNN），其权重和偏差由PSO优化以执行确定性预测，而bootstrap用于构建预测区间。然而，首先通过小波变换（WT）对测量输出功率的时间序列进行预处理以降低噪声并使时间序列稳定。预测范围是每小时分辨率为1-6小时。有趣的是，不是使用大量数据训练GRNN，而是使用预测前15天的每小时数据。除了分解的时间序列之外，还向GRNN提供辐照度和温度。在GRNN产生每个频率的预测之后，重建小波并且可以应用自举。不幸的是，只有确定性的评价指标用于评估预测，尽管显示预测间隔的图显示这些指标相当宽。

Bessa等人[106]进行的一项有趣的研究，作者提出了一种方法，将矢量自回归（VAR）和VAR与外因投入（VARX）框架的分布式PV生产测量相结合，以时间范围为6小时，分辨率为一小时的水平进行预测。两个聚集水平用于测量数据：家庭水平，即低电压（LV）和二级水平，即中压（MV）/LV（MV/LV）。该方法首先通过利用晴空生成来对测量的太阳能进行归一化，以便稳定时间序列。然后，建立模型，使得它们结合特定站点的太阳能测量结合相邻站点的滞后测量，因此它们使用时间和空间信息。但是，没有给出关于所使用的站点之间的相关性的细节。此外，RLS用于估计模型的参数，随后减少所需的数据量。最后，部署GB以选择预测变量并构建预测密度。结果显示，在CRPS方面，VAR模型的二级水平相对于AR基准的改善在1.4％至5.9％之间，而VARX模型在基准水平上的改善率高达16.4％。然而，VAR模型在家庭层面上的CRPS改善范围在-2.8％和4.6％之间，这是因为一些分位数表现不佳，正如作者所解释的那样，他们表示在某些情况下来自分布式传感器的信息减少了预测技巧。作者认为这是一个有趣的结果，因为“点预报技术的改进并未转化为某些分位数预测的改进”，这与[107]的作者在风电预测案例中的评论形成鲜明对比。

由Liu等人[108]完成的研究是利用NWP集合在日内范围上生成非参数概率预测，是少数研究之一，尽管也进行了提前一天和提前两天的预测。在该论文中，使用了天气研究和预测（WRF）模型，因为它能够以高分辨率进行模拟，这是时间分辨率为30分钟的原因。为了创建集成预报，作者采用滞后平均预测（LAF）方法，该模型产生三个单独的预测：日内，日前和2日前。第二天，WRF生成相同提前期的预测，并将当天的日内预测与前一天的提前预测相结合，以创建一个整体。在这项研究中，共有三个成员用于创建整体，尽管作者指出，包含更多成员可能会改善结果。此外，LAF方法计算具有不同初始条件和不同初始时间的每个成员。结果表明，经验覆盖率通常比名义覆盖率低20％~30％，这可能是由于WRF模型对GHI的过高估计（如作者所指出的那样）。但是，应该注意的是，预测区间的覆盖概率应该高于标称置信水平，因为否则它们是无效的并且应该被丢弃[65]。

根据2014年全球能源预测竞赛（GEFCom2014），Nagy等[109]提出了一种基于四种集成技术的方法，即投票，装袋，增强和堆叠，因为之前的研究表明，使用多个预测器往往会产生更好的结果。比赛的组织者提供了大量的数据，如表1所示。建立了两个模型，以每小时分辨率构建一个日内范围的完整预测密度：一个QRF和一个堆叠的投票RF-GB决策树（GBDT）。结果表明，在比赛过程中弹球损失的表现逐渐提高，最终结果为0.006-0.009，在比赛中排名第二。最后，作者指出，堆叠RF-GB导致太阳能和风能预测的最佳结果，但该模型训练非常耗时，但没有提到具体细节。

与之前的研究相似，Juban等[110]发表的论文也参与了GEFCom2014。然而，Juban等人的目标是为概率预测创建一个通用框架，并应用于风能，太阳能和价格预测。他们提出的框架按以下步骤解决问题：首先，建立了多QR（MQR）框架。其次，通过前向逐步程序选择最相关的预测因子。然后，通过径向基函数（RBF）生成特征，以便映射上述输入数据中的非线性关系。最后，作者提出了一种基于ADMM算法的优化方法，以最小化分位数损失函数，结合所有分位数和所有输入和输出上的ℓ2正则化，以便拟合可用于预测每个分位数的一组参数。虽然拟议的框架并未在PSPF竞赛中取得高分，但其弹球损失为0.0086，排名第五，真正的价值在于框架的一般性，导致风能，太阳能和价格预测的前五名排名。

张等人[111]应用高斯条件随机场（GCRF）以小时分辨率预测一步太阳能发电。使用GCRF是因为它们允许对空间和时间相关性进行建模，并将此特性应用于加利福尼亚州的一个城市。此外，作者还研究了GCRF在丢失数据时（例如在设备故障或通信问题的情况下）仍能表现得相对较好。结果表明，就RMSE和MAE而言，当缺少中等或大量数据时，所提出的模型显着优于ARX基准。由于GCRF能够提供预测密度，在不存在缺失数据的情况下，作者提出了不同季节的几个标准差的PICP。在冬季，GCRF没有设法达到足够高的PICP以被认为是有效的，但在今年余下时间就是这种情况，可能是由于天气变化增加。不幸的是，没有采用其他概率度量。

Aryaputera等人[112]采取了不同的方法，在他们的研究中，作者旨在比较贝叶斯模型平均（BMA）和集合模型输出统计（EMOS）在预测新加坡日内累积太阳辐照度时的表现。由于这些是后处理技术，因此从ECMWF，日本气象厅（JMA）和韩国气象厅（KMA）检索了预报。作为第一步，作者发现偏斜正常的PDF最适合这两种方法。接下来，线性回归用于BMA和EMOS以消除偏差，并且使用穷举搜索（ES）方法确定最佳训练天数。为了评估预测的质量，作者研究了可靠性图和CRPS。在可靠性方面，具有偏斜正常PDF的BMA表现最佳，因为它显示出相对较窄的预测间隔和低误差。此外，该方法也达到了最低的CRPS，值为292Wh/m2。

Takeda[113]采用了一种有趣的方法来预测日本大面积的太阳能发电。在确定自下而上策略（即分别预测光伏发电机并随后汇总）之后，与直接策略相比，可以MAE将降低3%，其中人们立即预测整个总量[52]。然而，作者还发现智能电表不够普及，因此公用事业公司无法准确跟踪每小时的光伏发电量。因此，通过天气观测和预报以及每月购买的光伏发电量来估算当地的光伏发电。此外，月度装机容量也被视为外因输入。为了能够预测和分析，使用了与状态空间模型（SSM）组合的集合卡尔曼滤波器（EnKF）。作者认为，将SSM与EnKF结合使用的原因是人工神经网络或MLR等统计方法无法提供有关电力消费结构变化的任何深刻的理解。此外，EnKF能够估计非线性SSM。得到的CRPS为24.06GWh，比MAE低5.6GWh，表明与确定性预测相比，集成的结果是合适的。

负荷。Almeida和Gama[114]提出了一种基于NN构建预测区间的方法，其提前期为0-24小时且具有每小时分辨率。作者使用了45个不同类型消费者所连接的变电站的总负荷需求。他们认为，由于存在许多不同的负荷配置文件，因此需要对这些配置文件进行聚类以提高预测性能。聚类是通过Kulback-Leibler距离进行的，因为欧几里德距离在处理较不稳定的数据（如住宅负荷）时会造成困难。为了创建非参数预测区间，采用了两种不同的方法。第一种是双扰动和组合方法（DPC），其中使用轻微扰动的数据进行预测。第二种方法是共形预测（CP），它假设数据是相同且独立分布的（i.i.d.），查看过去的数据以确定未来预测的置信水平。多层感知器（MLP）的输入是压延变量和负载曲线的过去值，属于某个簇。从结果看来，DPC方法在所有簇上显示出比CP更一致的PINAW性能，平均为20%。此外，可靠性图表明，在负载需求变化很大的集群的情况下，覆盖概率显着降低。不幸的是，在没有提到PICP达到63%和96%的信心水平的情况下，给出了一个说明PICP的情节。

未完待续！！

你可能感兴趣的:(paper,光伏,负荷预测,太阳能预测,论文阅读)

PyTorch基础知识讲解（一）完整训练流程示例苏雨流丰机器学习 pytorch 人工智能 python 机器学习深度学习
文章目录Tutorial1.数据处理2.网络模型定义3.损失函数、模型优化、模型训练、模型评价4.模型保存、模型加载、模型推理Tutorial大多数机器学习工作流程涉及处理数据、创建模型、优化模型参数和保存训练好的模型。本教程向你介绍一个用PyTorch实现的完整的ML工作流程，并提供链接来了解这些概念中的每一个。我们将使用FashionMNIST数据集来训练一个神经网络，预测输入图像是否属于以下
机器学习中的贝叶斯网络：如何构建高效的风险预测模型 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术文章目录机器学习中的贝叶斯网络：如何构建高效的风险预测模型1.背景介绍2.基本概念术语说明2.1马尔科夫随机场（MarkovRandomField）2.2条件随机场（ConditionalRandomField，CRF）2.3变量elimination算法2.4贝叶斯网络3.核心算法原理和具体操作步骤以及数学公式讲解3.1原理介绍1.贝叶斯网络基础2.贝叶斯网络构建风险
机器臂运动控制算法工程师面试道亦无名面试算法人工智能机器学习
大厂的经验总结：一、基础概念理解请解释机器臂运动学正解和逆解的概念，并分别说明其用途。正解：已知机器臂各关节的角度（或位移），通过运动学模型计算出机器臂末端执行器在笛卡尔空间中的位置和姿态。用途在于可以根据给定的关节驱动值，预测末端的实际位置，用于运动仿真、路径验证等，比如在工业生产前模拟机器臂的动作是否能准确到达加工位置。逆解：已知机器臂末端执行器在笛卡尔空间中的期望位置和姿态，求解出各关节应处
AI进化论：从图灵测试到智能革命的临界点 A达峰绮人工智能数据处理经验分享 AIGC AI人工智能
智能觉醒的起源密码（1943-2010）在曼彻斯特维多利亚大学的实验室里，1948年"Baby"计算机完成人类首个存储程序运行实验时，艾伦·图灵正在构思《计算机器与智能》。这篇划时代论文提出的"模仿游戏"测试，为人工智能奠定了哲学基础。1956年达特茅斯会议上，麦卡锡正式提出"人工智能"概念，当时学界乐观预测"二十年内机器将完成人类所有工作"。神经网络的发展轨迹充满戏剧性：1958年罗森布拉特发明
AI时代个人财富增长实战指南：从零基础到精通变现的完整路径 A达峰绮人工智能
（本文基于人工智能技术发展规律，结合互联网经济底层逻辑，为普通从业者构建系统性AI应用框架）一、建立AI认知基础：技术理解与工具掌握技术分类认知人工智能工具分为四大功能模块：自然语言处理（文本生成、对话交互）、计算机视觉（图像视频处理）、数据分析（预测建模）、自动化控制（流程优化）。建议新手首先掌握语言类工具的基础操作，逐步扩展到其他领域。工具操作逻辑通用AI工具通常包含三大核心功能模块：输入界面
Java常用集合与映射的线程安全问题深度解析 QQ828929QQ java 安全开发语言
Java常用集合与映射的线程安全问题深度解析一、线程安全基础认知在并发编程环境下，当多个线程同时操作同一集合对象时，若未采取同步措施，可能导致以下典型问题：数据竞争：多个线程同时修改数据导致结果不可预测状态不一致：部分线程看到集合的中间状态内存可见性：线程本地缓存与主内存数据不同步死循环风险：特定操作引发无限循环（如JDK7的HashMap扩容）二、典型非线程安全集合问题分析1.ArrayList
Python 数据分析实战：宠物经济行业发展洞察萧十一郎@ python python 数据分析宠物
目录一、案例背景二、代码实现2.1数据收集2.2数据探索性分析2.3数据清洗2.4数据分析2.4.1宠物用品用户满意度分析2.4.2宠物用品销售与价格关系分析2.4.3宠物经济行业未来发展预测三、主要的代码难点解析3.1数据收集3.2数据清洗-销售数据处理3.3数据分析-宠物用品用户满意度分析3.4数据分析-宠物用品销售与价格关系分析3.5数据可视化四、可能改进的代码4.1数据收集改进4.2数据清
史上最贵iPhone，苹果首款折叠iPhone预计售价超1.6万佳晓晓 django 智能手机 harmonyos pygame scikit-learn
史上最贵iPhone！苹果首款折叠屏手机售价超1.6万，能否颠覆折叠屏市场？一、天价折叠屏：苹果的“奢侈品”战略2025年3月，苹果首款折叠屏iPhone的定价传闻引爆科技圈。据英国巴克莱银行分析师蒂姆·龙（TimLong）预测，这款机型起售价将高达2300美元（约合人民币16637元），远超当前旗舰机型iPhone16ProMax的1199美元，成为苹果史上最贵智能手机。而供应链分析师郭明錤此前
搜广推校招面经五十三 Y1nhl 搜广推面经 python 机器学习人工智能推荐算法搜索算法算法
小红书推荐算法一、ESMM(EntireSpaceMulti-TaskModel)ESMM（EntireSpaceMulti-TaskModel）是一种用于解决推荐系统中多任务学习问题的模型。它由阿里巴巴团队提出，主要用于处理点击率（CTR）和转化率（CVR）的联合预测问题。1.1.背景在推荐系统中，CTR和CVR是两个重要的指标：CTR（Click-ThroughRate）：用户点击广告的概率。
物理学不存在了？诺贝尔物理学奖颁给了人工智能资讯新鲜事人工智能
2024年10月8日，瑞典皇家科学院宣布，将2024年诺贝尔物理学奖授予美国普林斯顿大学教授约翰·J·霍普菲尔德（JohnJ.Hopfield）和加拿大多伦多大学教授杰弗里·E·辛顿（GeoffreyE.Hinton），以表彰他们“在人工神经网络机器学习方面的基础性发现和发明”。辛顿在接受电话采访时表示：“完全没想到”。实话实说，在结果出来前，大家也都没想到。因为在外界预测里，今年的诺贝尔物理学奖
用故事与视觉化打造“高光“统计报告：5个实战技巧梦想画家数据分析工程数据工程分析工程
你是否有过这样的经历？花费数小时整理的数据报告，却被同事评价为"又厚又臭"？别担心，这绝不是你的错——90%的统计报告都毁在不会讲故事。本文将带你用叙事经济学+视觉设计思维，把冷冰冰的数据变成让人欲罢不能的"数据故事会"，掌握让数据开口说话的秘密。1.别让数据成了"睡美人"：唤醒它的故事基因想象你正在给董事会讲一个悬疑剧：“去年Q2销售额神秘下滑（悬念），我们像福尔摩斯一样追查线索（行动），发现竟
蒙特卡罗树搜索算法依赖游戏树，也就是游戏的状态空间和可选动作的构成。游戏树是游戏设计者为了实现对战或博弈的目的 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介20世纪末到21世纪初，计算机科学和互联网科技迅速发展。在这些新兴领域中，蒙特卡罗方法是一个显著的研究热点。蒙特卡罗方法源自物理学和数学领域，其目的是模拟物理系统的随机运动，从而解决很多数学、物理等领域的问题。蒙特卡loor方法被广泛应用于各类模拟、预测、优化、控制等领域。在计算机领域，蒙特卡罗方法也扮演了重要角色。现如今，计算性能已经足够强大，人们可以轻松地进
【论文阅读】PERSONALIZE SEGMENT ANYTHING MODEL WITH ONE SHOT s1ckrain 计算机视觉论文阅读计算机视觉人工智能
PERSONALIZESEGMENTANYTHINGMODELWITHONESHOT原文摘要研究背景与问题：SAM是一个基于大规模数据预训练的强大提示框架，推动了分割领域的发展。尽管SAM具有通用性，但在无需人工提示的情况下，针对特定视觉概念（如自动分割用户宠物狗）的定制化研究尚不充分。方法提出：提出了一种无需训练的SAM个性化方法，称为PerSAM。仅需单次数据（一张带参考掩码的图像），即可在新
Linux信号：一场内核与用户空间的暗战芯作者 DD：日记 linux
在Linux系统的黑暗森林中，每个进程都是小心翼翼的猎人。当一束神秘的信号光划过天际，内核瞬间变身信号调度大师，在进程的生死簿上书写着命运。这场跨越用户空间与内核态的博弈，远比表面看到的更加惊心动魄。一、信号诞生的量子纠缠当Ctrl+C的闪电划破终端的宁静，内核的tty驱动层率先捕捉到这个量子扰动。键盘中断处理程序像精密的外科手术刀，准确地将SIGINT信号注入当前前台进程的task_struct
硬件练习生系列（六）——LDO设计自学心得炸洋芋Zy. 硬件工程嵌入式硬件单片机
一、LDO稳压原理LDO（LowDropoutRegulator，低压差线性稳压器）是一种线性稳压电路，其核心功能是将输入电压转换为稳定的输出电压，且输入与输出之间的压差（DropoutVoltage）非常低（通常在几百毫伏以内）。1.基本结构LDO主要由以下关键模块组成：调整元件（PassElement）：通常为PNP或PMOS晶体管，负责调节输入到输出的电流。误差放大器（ErrorAmplif
AI预测体彩排3新模型百十个定位预测+胆码预测+杀和尾+杀和值2025年3月21日第25弹 GIS小天体彩排3 人工智能机器学习彩票算法
前面由于工作原因停更了很长时间，停更期间很多彩友一直私信我何时恢复发布每日预测，目前手头上的项目已经基本收尾，接下来恢复发布。当然，也有很多朋友一直咨询3D超级助手开发的进度，在这里统一回复下。由于本人既精通编程+大数据分析，也热衷于彩票研究，所以很多彩友通过一些渠道找到了我。目前，加我的已有不少彩友，分成了3类人群：第一类：平时不懂数据分析，买彩全靠瞎猜乱蒙，这些朋友希望借助我的技术和方法来给他
COMP 5076 Problem Solving in the Digital Age 后端
COMP5076ProblemSolvingintheDigitalAgeAssignment1–Wizard-of-OzPaperPrototypeUniSASTEMTheUniversityofSouthAustralia2025SP2Warning:ThismaterialhasbeenreproducedandcommunicatedtoyoubyoronbehalfoftheUniver
CVPR2025 | 对抗样本&智能安全方向论文汇总 | 持续更新中~ 四口鲸鱼爱吃盐文献阅读安全 transformer 深度学习对抗样本神经网络视觉语言模型后门攻击
汇总结果来源：CVPR2025AcceptedPapers若文中出现的论文链接和GitHub链接点不开，则说明还未公布，在公布后笔者会及时添加.若笔者未及时添加，欢迎读者告知.文章根据题目关键词搜索，可能会有遗漏.若笔者出现遗漏，欢迎告知.部分文章还未公布正文，只有名称.MindtheGap：通过查询更新分析检测正在进行中的黑盒对抗攻击MindtheGap:DetectingBlack-boxAd
AlphaFolding填补蛋白质动态结构预测空白！复旦大学等提出4D扩散模型，成果入选AAAI 2025 HyperAI超神经 ScienceAI 人工智能深度学习机器学习扩散模型蛋白质结构 AI4S 4D
蛋白质的功能很大程度上取决于其3D结构。19世纪中期，科学界普遍认为蛋白质结构是固定的、刚性的，类似「锁与钥匙」模型(lock-and-keymodel)，即蛋白质与配体的结合是由固定的三维结构决定的。然而，当DanielKoshland提出酶与底物结合时会发生构象变化的观点后，传统思维开始受到挑战。1980年代，分子动力学模拟(MolecularDynamics,MD)兴起，首次从计算角度揭示了
时间序列分析的军火库：AutoTS、Darts、Kats、PaddleTS、tfts 和 FancyTS解析赛卡大数据人工智能深度学习 python 概率论数学建模
引言：时间序列分析的现代挑战时间序列分析在多个领域中扮演着关键角色，包括工程、金融、气象、工业预测等。随着开源工具的快速发展，开发者可以通过多种库快速实现时间序列预测与分析。本文将对AutoTS、Darts、Kats、PaddleTS、tfts和FancyTS六大主流库进行详细解析，并提供代码示例，帮助你根据实际需求选择最佳工具。核心库技术解析与场景化实践1.AutoTS：自动化时间序列预测技术亮
GS-SLAM论文阅读笔记-MGSO zenpluck GS论文阅读论文阅读笔记
前言MGSO首字母缩略词是直接稀疏里程计(DSO)，我们建立的光度SLAM系统和高斯飞溅(GS)的混合。这应该是第一个前端用DSO的高斯SLAM，不知道这个系统的组合能不能打得过ORB-SLAM3，以及对DSO会做出怎么样的改进以适应高斯地图，接下来就看一下吧！GishelloG^s_ihelloGishello我是红色文章目录前言1.背景介绍2.关键内容2.1SLAMmodule2.2Dense
大模型在冠心病风险预测及临床方案制定中的应用研究 LCG元围术期危险因子预测模型研究人工智能机器学习 python
目录一、引言1.1研究背景与目的1.2国内外研究现状1.3研究方法与创新点二、大模型预测冠心病风险原理与方法2.1数据收集与预处理2.1.1数据来源2.1.2数据清洗与整理2.2特征工程2.2.1特征提取2.2.2特征选择与优化2.3模型选择与训练2.3.1常用模型介绍2.3.2模型训练过程三、术前风险预测与手术方案制定3.1术前风险预测指标与模型应用3.2基于风险预测的手术方案制定3.3案例分析
CCF CSP 历年真题 C语言版满分代码集合 (至2021.9 持续更新中 JY_0329 CCF c语言开发语言 csp ccf 算法
CCFCSP历年真题C语言版满分代码集合（全部原创）2021-9-1数组推导2021-9-2非零段划分2021-4-1灰度直方图2021-4-2领域均值2020-12-1期末预测之安全指数2020-12-2期末预测之最佳阈值2020-9-1称检测点查询2020-9-2风险人群筛查2020-6-1线性分类器2020-6-2稀疏向量2019-12-1报数2019-12-2回收站选址2019-9-1小明
基于Matlab_simulink仿真相关控制算法、优化算法相关帮助代做，原理讲解 985计算机硕士仿真模型 matlab 算法开发语言
Matlab/simulink仿真相关控制算法、优化算法相关帮助代做，原理讲解：1.优化算法相关：蚁群优化算法，遗传优化算法等2.控制器相关：ADRC控制，鲁棒控制，神经网络控制，MPC等3.神经网络相关：BP神经网络，RBF神经网络，LSTM神经网络等文章目录1.优化算法相关蚁群优化算法（ACO）2.控制器相关ADRC控制3.神经网络相关BP神经网络1.构建光伏系统模型1.1光伏电池模型1.2控
ACI EP Learning Whitepaper 1. ACI EP组件 m0_54931486 思科 ACI 网络思科 ACI Endpoint ACI fabric Nexus EP 学习
1.ACIEndpointACI网络架构的Endpoint表整合了传统MAC地址表和ARP表的功能。其核心机制是通过硬件层直接学习数据包的源MAC地址与IP地址映射关系，摒弃了传统ARP协议依赖广播请求获取下一跳MAC地址的模式。这种设计优化体现在两方面：1）减少控制面ARP流量处理带来的资源消耗；2）基于终端实际流量即可实时感知主机IP/MAC地址的拓扑迁移，无需依赖GARP通告即可实现终端移动
图像识别技术与应用课后总结（20）一元钱面包人工智能
图像分割概念图像分割是把图像中不同像素划分到不同类别，预测目标轮廓，属于细粒度分类。比如将图像里不同物体、背景等区分开来，就像把一幅画里的各个元素精准归类。应用场景人像抠图：能精准分离人物和背景，用于图片编辑、影视制作等，比如去除照片背景换背景。医学组织提取：在医学影像（如CT、MRI图像）中分离出不同组织，辅助疾病诊断、手术规划等。遥感图像分析：分析卫星或航空遥感图像时，区分土地、植被、建筑等不
【机器学习】模型拟合 CH3_CH2_CHO 什么？！是机器学习！！机器学习人工智能欠拟合过拟合
1、欠拟合1.1现象欠拟合是机器学习和统计建模中的一种常见问题，表现为模型无法充分捕捉数据中的潜在规律和模式。无论是训练数据还是测试数据，模型的预测误差都居高不下。在实际应用中，欠拟合的模型往往显得过于简单和粗糙，无法对数据进行有效的拟合和描述。1.2原因模型过于简单是导致欠拟合的主要原因：例如，使用直线去拟合具有明显曲线趋势的数据，或者使用低阶多项式去拟合高阶的复杂函数关系。这种情况下，模型的表
服务器相关的硬件知识猿小喵运维服务器数据库
网卡：网卡是计算机网络中用于实现计算机之间通信的硬件设备。它工作在OSI模型的第二层（链路层），通过电缆或无线信号与网络设备（如交换机、路由器）连接，带有芯片，可插拔。网卡的接口分为电口（如RJ45接口，用于连接网线）和光口（用于连接光模块和光纤）。根据传输协议，网卡可分为以太网卡、FC（FibreChannel）网卡和iSCSI网卡。以太网卡是最常见的类型，用于普通网络通信；FC网卡主要用于存储
使用LLM自动化生成微电网Simulink模型 MC数据局自动化运维
使用LLM自动化生成微电网Simulink模型！⚡在构建微电网仿真模型时，我们通常需要手动拖拽模块、设置参数，耗费大量时间。现在，通过结合LLM（如GPT-4）与MATLAB脚本，我们可以自动生成完整的微电网Simulink模型！微电网模型核心功能：光伏功率生成：通过正弦波模拟白天和夜晚光伏输出的动态变化。电池管理系统（BMS）：基于净功率实现电池的充放电控制，动态更新SOC（电池状态）。⚡负载建
基于Wasm的边缘计算Pandas：突破端侧AI的最后一公里——让数据分析在手机、IoT设备上飞驰 Eqwaak00 Pandas 人工智能 wasm 边缘计算 pandas 架构深度学习
引言：边缘计算的算力觉醒在智能家居设备每秒产生数万条传感器数据、手机App需要实时分析用户行为的今天，传统云计算模式面临高延迟、隐私风险、带宽成本三大挑战。本文将揭示如何通过WebAssembly（Wasm）+Pandas的技术组合，在边缘设备上实现零云端依赖的实时数据分析，并通过智慧工厂设备预测性维护案例，展示从理论到工程的全链路实现。一、技术架构设计1.1边缘计算范式演进mermaid：gra
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1