望百川归海

通过机器学习预测电网平均总负荷

文章目录

- 0 概述
- 1 研究动机
- 2 相关工作
- 3 统计学处理
- - 3.1 数据预处理
  - 3.2 季节性分析
- 4 算法
- - 4.1 支持向量回归SVR
  - 4.2 聚类Clustering
  - 4.3 神经网络Neural Networks
  - 4.4 高斯过程回归 Gaussian Process Regression
- 5 实施
- 6 实验结果
- 7 未来方向
- 8 结论
- 参考文献

0 概述

该研究基于比利时Elia 电网公司的公开数据，该数据给出了过去几年以 15 分钟为间隔测量的 Elia 电网的总负荷。此处将使用机器学习方法提前一天预测平均总负荷。以上成果可用于实际的生产生活中，电力公司可以使用该预测值来产生足够的发电量，以避免电网中断和电力损失，并根据未来的负荷构建动态定价方案。

1 研究动机

负荷预测对于输电运营商来说是一项至关重要的任务，电力系统的管理是一项复杂的任务，并且在很大程度上依赖于对未来电力需求的了解。可以准确预测负荷的模型对于能源生产至关重要，因为根据预测的负荷可以确定应该运行哪些设备以满足需求，更好地满足机组组合优化。若不能产生足够的能量会导致电网故障，若供过于求会导致能源和资源的浪费。
负荷预测带来的一个经济效益是能够根据总需求对电力进行定价。能源市场的去中心化和激烈竞争使得输电运营商能够以具有竞争的价格来定价电力变得至关重要。这些价格会随着电力需求而波动，高峰期的特点是电价高，非高峰期的价格也较低。动态确定这些时间段何时发生以及这些时间段内的电力需求可以帮助制定基于需求的具有竞争力和公平性的定价方案。
过去，人们采用各种预测方法来预测未来负荷，包括计量经济学方法、基于回归的模型和统计学习算法。这些方法取得了不同程度的成功，但仍有很大的改进空间。我们的目标是将机器学习算法应用于负荷预测问题。此外，我们将使用时间序列分析方法对数据集进行缩放和去趋势化，为学习算法做好准备。

2 相关工作

Taylor 等人在（[1]）中发现电力负荷时间序列中存在季节性模式，我们的研究将对 Elia 数据集中的季节性模式进行统计分析，并将该信息用于其中一种机器学习方法，研究证明该机器学习方法可以减少预测误差。
Chen等人在（[2]）中也采用了一种机器学习方法来预测未来负荷，它使用支持向量机（SVM）来预测未来的电力负荷。通过从过去几天的需求中形成特征向量来合并时间序列信息，并使用它们来预测未来几天的负荷。在我们的研究中，将像本研究一样使用SVM进行预测，但将从日内电力负荷而不是从多天数据中构建特征向量。
最后，研究中也包含了有 Ahmed 在 ([3]) 中的工作，它凭经验证明了在应用机器学习算法进行预测之前进行统计预处理时间序列数据的好处。证明了数据归一化、对数缩放、趋势去除可以提高判别学习算法的性能，在我们的方法中，我们将在应用机器学习方法之前对数据进行对数缩放并去除趋势分量，并将季节性信息用于基于聚类的学习算法。

3 统计学处理

首先介绍一些将在整篇文章中使用的符号：
xTrain - 按时间顺序组成 2008-2016 年的负荷时间序列。每个向量都是 96 维的，因为每十五分钟测量一次电网上的总负荷。
yTrain - xTrain 中样本对应的第二天平均总负荷。平均总负荷是指第二天所有 96 个负荷值的平均值。
xTest , yTest - 除 2017 年外，其他的与训练数据集相同。
训练和测试集中的最后一个样本需要提取下一年的负荷值，这是作为预处理的一部分完成的。我们在图 1 中绘制了相应时间段内的 yTrain 值。从图中可以看出，除了负荷的大数值外，似乎还有显着的趋势和季节性分量。以下预处理步骤将解决这些问题，使数据更易于学习。
图 1 2008-2017 平均总负荷图

3.1 数据预处理

预处理阶段有 2 个步骤：
（1）对数缩放
时间序列包含非常大的数值，这会阻碍学习器有效学习的能力并使问题计算密集。为解决以上问题，在学习之前，xTrain、yTrain 和 xTest 中的值将通过自然对数进行缩放。
（2）趋势消除
消除目标值中的趋势可以提高预测准确度。为此，我们首先通过对 yTrain 数据集执行最小二乘线性回归来估计趋势。将 yTrain 中的值视为按时间顺序排列的值序列。回归的自变量是从序列开始算起的天数，因变量是该特定日期的 yTrain 值。一旦计算出回归线，我们从 yTrain 中的每个值中减去回归预测值，从而获得去趋势的时间序列。xTrain值不受影响。

3.2 季节性分析

根据之前的研究和观察，图 1 中 yTrain 的图，我们认为时间序列包含显着的季节性成分。为了验证该猜想，我们继续对季节性行为进行统计测试。
首先，我们在图 2 中显示 yTrain 的滞后相关图，其中绘制了 yTrain 的值与其前一天的值。这张图使我们能够确定基础时间序列是否是随机的。如果它是随机的，那么滞后图不应显示任何模式或有意义的子结构。然而，根据该图，我们可以观察到一个显着的线性趋势，这表明可能是由季节性引起的某些潜在的模式。
现在我们有了季节性成分的证据，我们将使用相关图（图3）来确定季节的周期。相关图根据时间滞后绘制自相关因子，其中自相关因子是在某个给定时间滞后下 yTrain 与自身的协方差除以 yTrain 的方差。在数学上，对于时间滞后为 k 的 yTrain 自相关因子rk 的估计可以表示为：

我们让 n = |yTrain| ，假设值 yTrain 是独立同分布的。自相关因子的均值和方差分别为 -1/n 和 1/n 。这些可用于查找 95% 和 99% 置信区间，它们在相关图上显示为水平线。
从相关图中我们可以观察到，2008 - 2016 年图上的滞后一年和 2016 年图上的滞后一周都产生超过 99% 置信区间的自相关因子。此外，我们构建了周期图（图4），可用于识别频域中时间序列的重要周期。通过检查周期图，我们观察到每周和每年频率的峰值，这表明这些时间滞后的时间序列有很强的相关性。根据这些统计检验的结果，我们可以得出结论，时间序列很可能包含显着的季节性成分。我们将使用每周和每年作为基于聚类的机器学习算法的季节性周期，这将在下一节中描述。

4 算法

主要利用四种机器学习算法进行学习，包括聚类、支持向量回归、神经网络和高斯过程回归。
除此之外，我们还尝试了其他机器学习算法来探索其在电力负荷预测上的能力，如逻辑回归、决策树、随机森林、XGboost机器学习算法，以及长短时记忆网络、门控递归单元神经网络等深度学习算法。该部分内容不作为研究的主要内容，后续可进行持续探索。

4.1 支持向量回归SVR

第一个基于机器学习的预测方法使用支持向量机回归 (SVR)。传统上支持向量机用于二元分类任务，并在高维度上找到欧几里得空间中的最佳超平面，将数据分为两类。该算法已经针对回归任务进行了修改，因此我们可以将其应用于当前的问题。我们使用核函数 k 代替其对偶公式中的内积项，k度量了高维向量空间中的内积的相似性，并允许 SVR 学习关于原始向量空间的非线性模式。
基于 SVR 算法的预测步骤：
算法输入：核函数 k 和误分类惩罚系数 C 以及训练和测试数据集。
数据预处理：将缩放和去趋势步骤应用于 xTrain 和 yTrain，如预处理部分所述，以获得实际训练集。
模型训练：然后将 SVR 与内核 k 和惩罚 C 与训练集一起使用以获得预测器 f。
预测：对于每个样本 x ∈ xTest，算法对进行缩放并应用 f 以获得其对应的预测值。然后将趋势分量加回到该预测值上，通过逆自然对数重新缩放以获得最终预测值。

4.2 聚类Clustering

第二个机器学习方法是聚类，并使用预处理部分中检验过的季节性信息。我们将季节长度视为样本的唯一类别的数量。集群个数k：聚类的集群个数使用了季节性分析得到的周期，具体就是将季节长度视为集群个数k，如周期为周，那么集群数目k=7,周期为年，那么k=365。
两种不同的聚类算法：第一种是自底向上的凝聚法层次聚类，距离采用离差平方和法(ward)计算，目的是最大化集群间的距离，以最小化集群内的总方差为目标合并集群。第二种聚类方法是 K-Means聚类，它使用欧几里德距离度量将一组向量聚类到 k 个集群中中，目标是最小化集群内平方和。
基于聚类算法的预测步骤：
算法输入：包括季节长度 s（有7和365，作为集群个数）、聚类算法的选择（K-Means 或ward凝聚层次聚类），以及训练和测试数据集。
数据预处理：将缩放和去趋势步骤应用于 xTrain 和 yTrain，如预处理部分所述，以获得实际训练集。
模型训练：在训练集上运行聚类簇数为s 的两种聚类算法，以获得一组集群及其对应的质心。
预测：对于测试集中的样本，找到与样本欧式距离最小的质心对应的集群。然后利用加权聚类分类得到其预测值。（利用加权距离和/距离和，得到临时预测值。权值为当前样本所属集群中个体预测目标值，距离为它们各自和样本之间的欧式距离。最后对该临时预测值进行加趋势，逆标准化，得到原始量纲的预测值。）

4.3 神经网络Neural Networks

第三种学习方法是神经网络，有一组输入神经元接收一个样本并将样本向量的值输出到后续的隐层神经元。这些隐层神经元采用其输入的线性组合，可能会添加一个偏置值，然后将激活函数应用于该计算的总和，并将获得的值沿传出边输出到其他神经元。以这种方式，值从输入层通过网络传播，直到它们到达输出层，在输出层，误差函数被应用于输出层神经元的输出值。然后通过著名的反向传播算法更新网络，该算法尝试通过调整网络权重来最小化获得的误差。
优化方法：我们使用的神经网络将使用随机梯度下降 (SGD) 进行训练，它从样本的子集而不是整个数据集估计梯度。以这种方式更新权重可以加快收敛速度。
降维方法：我们将使用主成分分析 (PCA) 来降低特征向量的维数。这样做的原因是训练集包含大约 3000多个样本，由于参数数量的原因，这对于训练具有 96 个输入神经元的网络来说太少了。因此，我们使用 PCA 将样本投影到较低维度的子空间中，同时保持最大的方差量，这会保留区分样本所需的信息，也减少了输入神经元的个数。
基于神经网络的预测步骤：
算法输入：由训练和测试数据集、隐藏神经元数量的正整数 h 和 PCA 的维度 d 组成（激活函数 sigmoid和误差函数平方损失是固定的，并且有一个隐藏层）。
数据预处理：首先对数缩放和去趋势 yTrain 以获得 Y’train 。对数缩放并将目标维度为 d 的 PCA 应用到 xTrain 以获得 X’ train，保留用于 PCA 的投影矩阵 W。
模型训练：在训练集 X’ train上运行神经网络算法，得到训练好的学习器。
预测：对于每个示例 x ∈ xTest，对 x 进行对数缩放以获得 x ˆ，然后通过使用公式 x0 = W ˆx 进行投影获得 x0。将神经网络应用于 x0 得到输出 y0 ，然后加入趋势分量并用逆自然对数重新缩放以获得预测值 y。

4.4 高斯过程回归 Gaussian Process Regression

第四种学习方法将使用高斯过程回归 (GPR)，这是一种主要用于回归任务的判别学习算法。
GPR预测算法如下
算法输入：由协方差函数 k 以及训练和测试数据集组成。
数据预处理：对 xTrain 和 yTrain 应用对数缩放和去趋势操作。
模型训练：然后在训练集上使用 GPR，得到预测器 f。
预测：然后对于每个样本 x ∈ xTest 应用对数归一化以获得 x0，并计算 y0 = f(x0)。然后将趋势分量加回到 y0 并应用逆自然对数以获得预测 y。

5 实施

该项目是用 Python 实现的，大量使用了 scikit-learn机器学习库、Numpy 数值计算库、Pandas 数据分析库、Pybrain 机器学习库、keras深度学习库。系统架构如下：
• Win10家庭版64位操作系统
• CPU处理器（Intel®Core™i5-6200U）
• 8GB 内存

6 实验结果

将四种基于机器学习的算法与计量经济学模型一起应用于预测 2017 年平均总负荷的任务中。对于每种算法，我们尝试了几种不同的参数，并在单个图上显示每种配置的结果。图 5、6、7、8 分别显示了SVR、聚类、GPR 和神经网络结果。
我们选择根据归一化均方根误差 (NRMSE) 来衡量性能，因为它是经过缩放的，并且允许在算法之间进行公平的比较。如果让 Ypred 和 Ytest 分别为 n 个预测值和对应的测试值，则 NRMSE 的函数可以表示为：

我们测量了所有算法及其各种配置的 NRMSE，并在表 1 中显示了结果和参数选择。
我们注意到，最低的 NRMSE值0.10558是通过 GPR 实现的。 GPR 超越聚类、SVR 和神经网络算法的事实证明了 GPR 在数据集不太大（例如，最多几千个示例和几十个维度）时在判别回归学习任务可实现高准确率。然而，除了预处理步骤之外，GPR 模型中没有使用有关季节性的信息。这表明季节性信息可能不是实现高准确率预测平均总负荷所必需的。但我们发现归一化和去趋势的预处理步骤对于机器学习方法的很重要，因此表明时间序列分析的思想与机器学习结合使用可以开发强大的预测模型。

7 未来方向

基于我们的结果，我们有强有力的证据表明基于机器学习的算法能够实现负荷预测问题的高准确率，因此我们相信进一步探索这一领域将是有益的。
一个直接的方向是尝试其他判别机器学习算法，如贝叶斯神经网络、k-最近邻、回归方法（岭、逻辑、贝叶斯）和决策树，并根据本文中的结果衡量它们的性能。
由于我们的算法通常有很多参数（SVR 有核函数和误差惩罚，GPR 有协方差函数），另一个方向可能是尝试改变参数，看看另一个选择是否会产生更低的错误率。
此外，多种算法可以与集成方法一起使用，历史上已经证明在某些情况下它们优于集成的组成算法。
此外，研究时间序列分析中的方法以及如何将它们与机器学习结合使用似乎也很有价值。在这一点上，有多种时间序列方法可用于更改和转换数据集，从而可以更深入地了解和分析负责生成数据的底层过程。一些方法包括了如噪声检测和去除、去季节性（尽管我们发现加法分解无效）和平滑（卡尔曼滤波、拉普拉斯算子）。将这些技术与学习算法一起使用可能会产生强大而准确的预测器，这些预测器的性能可能优于使用纯计量经济学或机器学习方法。
最后，将本文中使用的技术应用到从其他电力公司处收集其他电力负荷时间序列数据应用会很有用。我们认为，电力负荷时间序列具有某些共同点，例如季节性影响和趋势，并且本文中提出的预测方法至少会在此类数据集上取得一定程度的成功。天气数据也可以被收集并用于预测，其他研究人员已经证明这与电力使用密切相关。可以将获得的结果都可以与电力公司使用的结果进行比较，看看它们是否比工业中使用的结果更准确。还可以与现实世界的标准方法进行比较，以确定电力公司目前使用的预测方法是否可以改进。

8 结论

根据我们的经验结果，我们已经成功地证明了机器学习技术可以产生准确的预测器，用于提前一天预测 Elia 电网的平均总负荷。但季节性信息并没有帮助提高使用高斯过程回归的最准确分类器的性能，尽管季节性信息是基于聚类的方法的组成部分，也实现了相当低的错误率。然而，我们发现对数缩放和去趋势的负荷时间序列显着提高了模型的准确性。总的来说，我们相信我们的方法清楚地证明了利用时间序列和机器学习方法的价值，我们推测这将是未来负荷预测工作中不可或缺的一部分。该问题仍然是一个活跃的研究领域，远未解决，希望电力运营商继续寻求改进的预测方法，因为负荷预测具有重要的实用价值。

参考文献

【1】James W Taylor, Lilian M De Menezes, and Patrick E McSharry. A comparison of univariate methods for forecasting electricity demand up to a day ahead. International Journal of Forecasting, 22(1):1–16, 2006. 3
【2】Bo-Juen Chen, Ming-Wei Chang, and Chih-Jen Lin. Load forecasting using support vector machines: A study on eunite competition 2001. Power Systems, IEEE Transactions on, 19(4):1821–1830, 2004. 3
【3】Nesreen K Ahmed, Amir F Atiya, Neamat El Gayar, and Hisham El-Shishiny. An empirical comparison of machine learning models for time series forecasting. Econometric Reviews, 29(5-6):594–621, 2010. 3

Open AI在AI人工智能领域的技术安全防护体系 AI智能探索者 AI Agent 智能体开发实战人工智能安全网络 ai
OpenAI在AI人工智能领域的技术安全防护体系关键词：OpenAI、AI安全、技术防护、伦理框架、模型对齐、数据隐私、对抗攻击摘要：本文将深入探讨OpenAI在人工智能领域构建的多层次技术安全防护体系。我们将从基础概念出发，逐步解析OpenAI如何通过技术创新和系统设计来确保AI系统的安全性、可靠性和可控性。文章将涵盖从数据安全到模型对齐，从伦理框架到实际防护技术的全方位内容，帮助读者全面理解现
揭秘自然语言处理在AI人工智能领域的奥秘 AI智能探索者 AI Agent 智能体开发实战人工智能自然语言处理 easyui ai
揭秘自然语言处理在AI人工智能领域的奥秘关键词：自然语言处理、AI人工智能、语言理解、语言生成、语义分析摘要：本文深入探讨了自然语言处理（NLP）在AI人工智能领域的奥秘。首先介绍了自然语言处理的背景，包括目的、预期读者、文档结构和相关术语。接着阐述了自然语言处理的核心概念与联系，通过文本示意图和Mermaid流程图进行展示。详细讲解了核心算法原理和具体操作步骤，并用Python源代码进行阐述。分
Android15音频进阶之HIDL与宏代码调试(一百二十五) Android系统攻城狮 Android Audio工程师进阶系列音视频 Android15 Audio
简介：CSDN博客专家、《Android系统多媒体进阶实战》一书作者新书发布：《Android系统多媒体进阶实战》优质专栏：Audio工程师进阶系列【原创干货持续更新中……】优质专栏：多媒体系统工程师系列【原创干货持续更新中……】优质视频课程：AAOS车载系统+AOSP14系统攻城狮入门视频实战课
【LangChain编程：从入门到实践】AI 大模型检索增强生成 RAG 实践 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LangChain编程：从入门到实践-AI大模型检索增强生成RAG实践关键词：LangChain,RAG,大语言模型,检索增强生成,向量数据库,嵌入模型,提示工程1.背景介绍在人工智能和自然语言处理领域,大语言模型(LargeLanguageModels,LLMs)的出现无疑是一个重大突破。像GPT-3、GPT-4这样的模型展现出了惊人的语言理解和生成能力,为各种应用场景带来了无限可能。然而,这些
【华为OD机试真题 2025B卷】767、寻找最大价值的矿堆 | 机试真题+思路参考+代码解析（C++、Java、Py、C语言、JS） KJ.JK OJ+最新华为OD机试 (C++Java Py C JS)华为od c++java 华为OD机试真题 2025B卷 javascript c语言寻找最大价值的矿堆
文章目录一、题目题目描述输入输出样例1二、代码与思路参考C++语言思路C++代码Java语言思路Java代码Python语言思路Python代码C语言思路C代码JS语言思路JS代码作者：KJ.JK订阅本专栏后即可解锁在线OJ刷题权限专栏介绍：最新的华为OD机试题目总结，使用C++、Java、Python、C语言、JS五种语言进行解答，每个题目的思路分析都非常详细，支持在线OJ评测刷题！！！！订阅后
AI离全社会普及，只差一个计算中心？ a13163944010 人工智能
过去十年，人工智能（AI）大爆炸，并第一次走进普通人的生活。但蓬勃发展的AI却碰到一个空前棘手的问题：自2012年以来，AI算力需求6年增长30万倍，远超摩尔定律！人类现有的基础设施，已跟不上AI算力需求的增长。未来，该怎么办？【1】一百多年前，人类也曾面临同样的难题。1866年，德国西门子发明自激发电机，开启了人类的电力时代。此后十几年，虽然很多企业纷纷采用电能这种新的动力，但一台电机只能供应一
首次使用“非英伟达”芯片！OpenAI租用谷歌TPU，降低推理计算成本加百力科技知识财经研究人工智能 chatgpt
OpenAI近期开始租用谷歌TPU芯片，这是该公司首次大规模使用非英伟达芯片。除了OpenAI外、苹果、SafeSuperintelligence和Cohere等公司也一直租用谷歌云的TPU。英伟达的芯片主导地位正被侵蚀，OpenAI租用谷歌TPU，为首次大规模使用“非英伟达”芯片。周六，据媒体报道，作为全球最大的人工智能芯片客户之一，OpenAI近期开始租用谷歌的TPU芯片为ChatGPT等产品
AI人工智能神经网络马里亚纳海沟网人工智能神经网络深度学习笔记运维全文检索搜索引擎
**AI人工智能神经网络概述**神经网络是并行计算设备，它们试图构建大脑的计算机模型。背后的主要目标是开发一个系统来执行各种计算任务比传统系统更快。这些任务包括模式识别和分类，近似，优化和数据聚类什么是人工神经网络(ANN)人工神经网络(ANN)是一个高效的计算系统，其核心主题是借用生物神经网络的类比。人工神经网络也被称为人工神经系统，并行分布式处理系统和连接系统。ANN获取了大量以某种模式相互连
机器学习-- 聚类 SunsPlanter 机器学习机器学习聚类人工智能
什么是聚类？Clustering可以简单地说，对有标注的数据分类，就是逻辑回归（属于有监督分类），对无标注的数据分类，就是聚类（属于无监督分类）聚类是一种无监督学习技术，其目标是根据样本之间的相似性将未标记的数据分组。比如，在一个假设的患者研究中，研究人员正在评估一项新的治疗方案。在试验期间，患者每周会报告自身症状的频率以及严重程度。研究人员可以使用聚类分析将对治疗反应相似的患者归为同一类。图1展
FP16、BF16、INT8、INT4精度模型加载所需显存以及硬件适配的分析 herosunly 大模型精度 BF16 硬件适配
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了FP16、INT8、INT4精度模型加载占用显存大小的分析，希望对学习大
educoder机器学习 --- 神经网络木右加木 educoder 机器学习神经网络
第1关：神经网络基本概念１、Ｃ第2关：激活函数#encoding=utf8defrelu(x):'''x:负无穷到正无穷的实数'''#*********Begin*********#ifx<=0:return0else:returnx#*********End*********#第3关：反向传播算法#encoding=utf8importosimportpandasaspdfromsklearn.
智能办公与科研革命：ChatGPT+DeepSeek大模型在论文撰写、数据分析与AI建模中的实践指南 jwwkyjspt 机器学习 SCI论文人工智能 chatgpt 语言模型机器学习
随着人工智能技术的快速发展，大语言模型如ChatGPT和DeepSeek在科研领域的应用正在为科研人员提供强大的支持。这些模型通过深度学习和大规模语料库训练，能够帮助科研人员高效地筛选文献、生成论文内容、进行数据分析和优化机器学习模型。ChatGPT和DeepSeek能够快速理解和生成复杂的语言，帮助研究人员在撰写论文时提高效率，不仅生成高质量的文章内容，还能优化论文结构和语言表达。在数据分析方面
初学Spring AI 笔记笑衬人心。大模型学习 spring 人工智能笔记
目录SpringAI简介依赖与环境配置基础概念集成OpenAI（或其他LLM提供商）Prompt模板引擎Embedding与向量数据库SpringAIChatClient使用SpringAI和LangChain对比常见问题与建议SpringAI简介SpringAI是Spring团队推出的人工智能集成框架，旨在简化AI模型（如OpenAI、HuggingFace、Mistral、AzureOpenA
AI新高度——DEEPSEEK 数字隐士·赛博智者 ai
DeepSeek是由中国人工智能公司「深度求索」开发的一系列高性能大语言模型产品及相关技术体系，其定位为通用人工智能（AGI）探索者，目前已发展成为全球增长最快、性能领先的开源模型之一。下面是关于DeepSeek的详细介绍：一、DeepSeek的开发者与背景‌公司名称‌：杭州深度求索人工智能基础技术研究有限公司（成立于2023年）‌核心支持‌：由中国知名对冲基金「高毅资产」创立并提供资金与技术资源
【机器学习&深度学习】适合微调的模型选型指南一叶千舟深度学习【应用必备常识】深度学习人工智能
目录一、不同规模模型微调适用性二、微调技术类型对显存的影响三、选择建议（根据你的硬件）四、实际模型推荐五、不同模型适合人群六、推荐几个“非常适合微调”的模型七、推荐使用的微调技术八、场景选择示例场景1：智能客服（中文）场景2：法律问答（中文RAG）场景3：医学问答/健康咨询场景4：AI写作助手（中英文）场景5：代码补全/AI编程助手对比总结表九、不同参数模型特点9.1参数规模vs能力9.2微型模型
【机器学习&深度学习】本地部署 vs API调用：关键看显存！一叶千舟深度学习【应用必备常识】深度学习人工智能
目录一、本地部署VSAPI调用1.模型运行方式2.性能与速度3.成本4.隐私与安全5.何时选择哪种方式？二、为什么推荐本地部署？1️⃣零依赖网络和外部服务，更可靠稳定2️⃣无调用次数限制，更适合高频或批量推理3️⃣避免长期API费用，节省成本4️⃣保护用户隐私和数据安全5️⃣可自定义、深度优化6️⃣加载一次即可复用，低延迟高性能7️⃣离线可用（重要！）三、适合本地部署的情况四、本地部署条件4.1模
深度学习 vs 传统机器学习：哪个更适合你的项目？ AI大模型应用之禅深度学习机器学习人工智能 ai
深度学习vs传统机器学习：哪个更适合你的项目？关键词：深度学习、传统机器学习、特征工程、数据量、计算资源、项目选择、算法对比摘要：本文将用"炒菜"和"拼图"等生活案例，从核心原理、适用场景、资源需求等维度对比深度学习与传统机器学习。通过具体代码示例和真实项目场景分析，帮助开发者和企业决策者快速判断：你的项目该选深度学习还是传统机器学习？背景介绍目的和范围随着AI技术普及，"该用深度学习还是传统机器
Node.js特训专栏-实战进阶：11. Redis缓存策略与应用场景爱分享的程序员 Node.js 前端网络相关 javascript node.js 前端
欢迎来到Node.js实战专栏！在这里，每一行代码都是解锁高性能应用的钥匙，让我们一起开启Node.js的奇妙开发之旅！Node.js特训专栏主页专栏内容规划详情Redis缓存策略与应用场景：从理论到实战的高性能解决方案一、Redis基础概述1.1Redis核心特性Redis作为高性能内存数据库，具备以下关键优势：1.1.1内存极速读写读写性能：基于纯内存操作，读写操作在微秒级完成，实测单节点QP
Python 机器学习实战：泰坦尼克号生还者预测 (从数据探索到模型构建) 程序员阿超的博客 Python python 机器学习开发语言泰坦尼克号 Kaggle Scikit-learn 实战教程
引言：挑战介绍泰坦尼克号的沉没是历史上最著名的海难之一。除了其悲剧色彩，它还为数据科学提供了一个经典且引人入胜的入门项目。Kaggle平台上的“Titanic:MachineLearningfromDisaster”竞赛，要求我们利用乘客数据来预测哪些人更有可能在这场灾难中幸存。这是一个典型的二元分类问题：目标变量Survived只有两个值，0（遇难）或1（生还）。这个项目之所以经典，是因为它涵盖
【unity游戏开发——网络】网络协议、TCP vs UDP 本质区别向宇it 【unity游戏开发——网络】网络网络协议 unity 游戏引擎 c#tcp/ip udp
注意：考虑到热更新的内容比较多，我将热更新的内容分开，并全部整合放在【unity游戏开发——网络】专栏里，感兴趣的小伙伴可以前往逐一查看学习。文章目录一、网络协议概述二、OSI七层模型三、TCP/IP四层模型四、核心传输协议对比1、TCPvsUDP本质区别2、TCP关键机制详解2.1三次握手建立连接2.2四次挥手断开连接五、常见面试题精要六、总结1、TCP:2、UDP:专栏推荐完结一、网络协议概述
LLM大语言模型学习笔记（1） Arixs666 大语言模型语言模型笔记人工智能
1.概念大语言模型（LLM，LargeLanguageModel），也称大型语言模型，是一种旨在理解和生成人类语言的人工智能模型。LLM通常指包含数百亿（或更多）参数的语言模型，它们在海量的文本数据上进行训练，从而获得对语言深层次的理解。2.能力2.1涌现能力区分大语言模型（LLM）与以前的预训练语言模型（PLM）最显著的特征之一是它们的涌现能力。涌现能力是一种令人惊讶的能力，它在小型模型中不明显
【python数据分析】数据建模之Kmeans聚类斑点鱼 SpotFish python 数据建模聚类 python 数据分析
K-means聚类：最常用的机器学习聚类算法，且为典型的基于距离的聚类算法。K均值：基于原型的、划分的距离技术，它试图发现用户指定个数(K)的簇以欧式距离作为相似度测度Kmeans聚类案例分析：make_blobs聚类数据生成器#导入模块from sklearn.cluster import KMeansfromsklearn.datasetsimportmake_blobs#创建数据x,y_tr
【unity游戏开发——网络】网络游戏通信方案——强联网游戏（Socket长连接）、弱联网游戏（HTTP短连接）向宇it 【unity游戏开发——网络】网络 unity 游戏游戏引擎 c#编辑器 http
注意：考虑到热更新的内容比较多，我将热更新的内容分开，并全部整合放在【unity游戏开发——网络】专栏里，感兴趣的小伙伴可以前往逐一查看学习。文章目录一、联网游戏类型划分二、核心通信协议对比三、开发选择指南专栏推荐完结一、联网游戏类型划分类型通信特点代表游戏技术本质弱联网游戏按需连接，单次请求后立即断开消消乐、卡牌类（如《刀塔传奇》）短连接通信强联网游戏持续连接，实时双向数据交换《王者荣耀》《和平
Milvus向量数据库入门指南 longfei.li milvus 数据库人工智能
一、Milvus简介Milvus是一个开源的向量数据库，专为AI应用和向量相似度搜索而设计，以加速非结构化数据的检索。自2019年创建以来，Milvus专注于存储、索引和管理由深度神经网络和其他机器学习模型生成的海量嵌入向量。其能够处理万亿级别的向量索引任务。Milvus的核心优势在于其高效的索引机制，它支持多种索引类型，包括FLAT、IVF_FLAT、IVF_SQ8、IVF_PQ和HNSW等。这
常见机器学习算法与应用场景计算机软件程序设计知识科普机器学习算法人工智能
当然可以。下面是对常见机器学习算法的全面详细阐述，包括每种算法的基本原理、特点以及典型应用场景。1.监督学习（SupervisedLearning）1.1线性回归（LinearRegression）原理：通过拟合一条直线来表示输入和输出之间的关系，适用于预测连续值输出。特点：简单易懂，计算速度快，但只能捕捉线性关系。应用场景：房价预测股票价格预测销售额预测1.2逻辑回归（LogisticRegre
[论文阅读] 人工智能 + 软件工程 | 揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究张较瘦_ 前沿技术论文阅读人工智能软件工程
揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究论文：WhatMakesChatGPTEffectiveforSoftwareIssueResolution?AnEmpiricalStudyofDeveloper-ChatGPTConversationsinGitHubarXiv:2506.22390WhatMakesChatGPTEffectiveforSoftwareIssueRe
[论文阅读] 人工智能 + 软件工程 | 代码注释不一致问题研究：从数据革新到端到端解决方案张较瘦_ 前沿技术论文阅读人工智能软件工程
代码注释不一致问题研究：从数据革新到端到端解决方案原文：CCISOLVER:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyarXiv:2506.20558CCISolver:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyRe
【Scopus/Springer Nature/Google Scholar/EI/Scopus多库收录】2025年8-9月先进制造、信号处理、土木工程、环境资源、能源材料、教育技术领域的创新前沿努力毕业的小土博^_^ 学术会议推荐制造信号处理能源
【Scopus/SpringerNature/GoogleScholar/EI/Scopus多库收录】2025年8-9月先进制造、信号处理、土木工程、环境资源、能源材料、教育技术领域的创新前沿【Scopus/SpringerNature/GoogleScholar/EI/Scopus多库收录】2025年8-9月先进制造、信号处理、土木工程、环境资源、能源材料、教育技术领域的创新前沿文章目录【Sco
数字孪生：未来城市管理的革命性技术大有数据可视化信息可视化
一、数字孪生技术概述数字孪生技术是一种通过创建虚拟模型与物理实体之间实时交互的技术。它借助物联网、大数据、云计算、人工智能等前沿技术，实现对物理实体的精准映射与动态仿真。数字孪生的核心在于构建一个与物理世界相对应的虚拟模型，该模型能够实时反映物理实体的状态，并通过数据分析与模拟优化其性能。在城市管理领域，数字孪生技术为城市管理者提供了一种全新的视角和工具。城市是一个复杂的巨系统，涉及基础设施、交通
人类编程时代即将终结？OpenAI首席产品官预测AI将在今年底全面超越人类程序员前端javascript
ReactHook深入浅出CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读近日，OpenAI首席产品官KevinWeil在接受采访时表示，人工智能的发展速度远超预期，今年底就有可能在编程领域永久性地超越人类程序员。这一观点立即引发了行业热议，也让程序员们对未来产生了深刻的思考。人工智能的进展速度远超想象在与VarunMayya和TanmayBhat共同主持的YouTube节目《O
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&