努力学习的小青年

网络边缘的使能智能：联邦学习

摘要：

机器学习和无线技术的迅速发展正在为未来网络创造新的范式，人们期望通过大量数据集的推理获得更高程度的智能、并能够及时对当地响应作出反应。由于终端设备产生的海量数据，以及人们对隐私信息共享的日益关注，一个新的机器学习模型分支——联邦学习在人工智能和边缘计算的交叉领域应运而生。与传统的机器学习方法相比，联邦学习将模型直接带到设备中进行训练，将得到的参数发送到边缘服务器。该模型在设备上的本地副本带来了消除网络延迟和保护数据隐私的巨大优势。然而，要是联邦学习成为可能，我们需要应对新的挑战，这些挑战需要从根本上背离分布式优化标准方法。本文，我们的目标是提供一个联邦学习的综述。具体来说，我们首先研究联邦学习的基础，包括学习结构和鱼传统机器学习模型不同的特点。然后，我们列举几个在无线网络中部署联邦学习的关键问题。从算法设计、设备训练到通信资源管理等角度，展示为什么以及如何将技术联合起来促进全面实施。最后，对一些潜在的应用和未来的趋势进行展望。

关键词：联邦学习、边缘智能、学习算法、有效提出、隐私安全

1.简介

网络系统正在经历一个范式变换，从传统的云计算架构到移动边缘计算。云计算将计算资源聚集到一个数据中心，边缘计算将计算资源部署在网络边缘以满足应用程序（常见的、在不可靠网络连接、支持资源受限的节点）的需要。随着机器学习研究的蓬勃发展，通过整合机器学习算法到边缘节点，预计未来的网络将能够利用本地数据执行智能推理和管理多个活动。例如，学习手机用户的活动、从可穿戴设备中预测健康情况，或者利用智能家居设备检测偷窃。

但是，由于数据提出由终端设备产生，海量的数据数据集和对隐私信息的日益关注，用户不愿意将原始数据发送到边缘服务器参与任何模型的训练，即便最终对用户有利。为了应对这一难题，联邦学习出现了，它允许数据采集和计算在中央单元解耦。具体来说，不是在中央单元收集所有数据进行训练，联邦学习将模型直接带到终端设备进行训练，只将训练后的参数发送给边缘服务器。这个特征有很多优势，消除了大的通信开销和保留数据隐私，使得联邦学习与移动应用程序特别相关。这些特征也确定了联邦学习是智能移动边缘网络最有前途的因素之一。

然而，为了实现一个成功的联邦学习部署，面临些许挑战。联邦学习发生在移动边缘系统，一个服务器安排一系列终端设备进行训练，设备间不是独立同分布的、不平衡的数据集、通信资源有限。因此，这使得学习架构脆弱，解决这些问题需要从许多方面进行联合研究，包括：学习算法、系统设计、通信和信息理论。【10】讨论了当面对异构的数据集时，提高训练效率的可能方法。【6】研究了应用联邦学习的边缘网络端到端延迟、可靠性、和可扩展性。【8】探索了在网络边缘整合学习算法的挑战和解决方法。【9】讨论了一系列利用无线信道部署联邦学习的指导方针。经过不懈探索，成果显著：将在第4部分赘述。文章安排如下：第二章介绍基础框架和联邦学习的模型的特征。第三章介绍联邦学习实际部署的核心技术。第四章讨论讨论联邦学习潜在的应用和未来发展趋势。第五章，总结。

2.联邦学习：基础和特征

2.1基础架构

如图1所示，网络单元包括一个中央单元（通常部署在基站或者接入点的边缘服务器）和一些终端设备，它们一起有合作地学习一个模型。这个模型由工程师专为某一应用专门设计的，然后，服务器通过重复下面的步骤协调终端用户的学习过程：

Client selection：服务器选择符合要求的终端。例如当前存在无线连接的手机或者平板电脑进行一轮训练。
Broadcast：被选择的终端从服务器端下载最先的模型，包括权重和训练程序。
End-user computation：在一个周期内，每个被选择的终端执行本地计算，通常采用随机梯度下降（SGD）的方式，并上传最终参数到服务器。
Update aggregation：服务器从终端收集和更新——以训练参数或梯度的形式。或聚合——通常通过加权平均的方式聚合收集的结果。
Model update：服务器对模型进行更新。

经过大量的训练和更新交流（通常称为通信回合），全局统计模型收敛到最优形式，终端可以从这个协作学习模型中受益。

优点：联邦学习中，用户能够直接下载模型和执行训练，并将最终的训练参数反馈给服务器。用户终端避免了分享本地数据因此保护了隐私。此外，本地训练减少了原始数据的上传，原始数据规模很大上传将消耗大量的能量。最后，联邦学习与无线应用尤其相关。
挑战：联邦学习的缺点同样明显。由于训练发生在大量异构的实体中。例如：不同的终端有不同的处理能力和通信状态，学习效率比在数据中心要低。联邦学习环境下的通信可靠性差，安全性问题更严峻。

2.2显著特征

联邦学习与传统分布式学习的相同点：都由大量的终端执行计算，由中央实体负责协调终端之间的迭代。

联邦学习传统分布式学习的不同点：

Non-i.i.d dataset：联邦学习最显著的特点是每个终端设备都是高度个性话的，因此数据集非独立同分布。相互依赖的和非独立的的原因是用户的个性化、特定的地理环境、特定的时间阶段。因此，不同于传统场景中数据集是完全打乱和独立同分布的，联邦学习的非独立同分布架构导致每个设备从全局最小化转向局部最小化，需要重新考虑学习模型，并在过程中考虑这些不同。
Unbalanced data size：抛开非独立同分布，每个终端的数据集大小也不相同。因此，每个终端的训练程序也不同，因为一些终端的数据集较小可以短时间内完成训练，但是一些数据集大的终端需要耗费很多时间完成本地训练。此外，数据集大的终端可能对整个模型的贡献较大，因此如何在学习算法中衡量这些不同也十分重要。
Limited communication resources：由于终端设备与中央实体之间要进行通信，因此通信是不可靠的。此外，无线资源通常是有限的，每个循环选择合适署数量的用户进行通信是必要的。
Privacy/security issues：虽然联邦学习下不需要共享本地数据，这并不意味着隐私的绝对保护。事实上，可以从上传的参数中提取信息，并检索原始信息来近似扩展。此外，在联邦学习场景中，终端很容易被恶意攻击，黑客更容易向系统注意恶意信息。

值得注意的是，上述特征的一个显著特点是本质上跨学科，解决它们不仅需要机器学习，还需要分布式优化、安全性、差异隐私、公平性、压缩感知、系统、信息论、统计等方面的技术。事实上，许多最困难的问题都在这些领域的交叉点上，因此夸领域的研究与合作很是重要。

3.实际实施

3.1高效的学习算法

实现联邦学习的首要因素是一种高效的算法。由于数据集的非独立同分布，联邦学习的模型训练过程与传统的学习过程有很大的区别。具体来说，不同于分布计算（每个终端拥有一个统计独立的模型，名为经验主义损失函数），联邦学习由于数据集的个性化，每个终端有不同的经验主义损失函数。因此，局部最小值可能不同于全局最小值，学习算法应当重新设计以说明这一事实。此外，由于通信资源有限，服务器在每一轮通信中智能选择一部分用户进行更新，如何恰当地选择终端对整体学习效率也起着至关重要的作用。

3.1.1优化和模型聚合

由于用户数据集的非统计独立，在全局模型中对等的处理所以样本可能没有意义。因此，设计一个更加合理的目标函数是一个重要的研究方向。此外，目前最先进的训练是基于SGD的，以收敛慢著称。因此设计更有效率的算法对联邦学习很重要。此外，由于数量庞大，在训练全局模型时，每个设备可能只参与几轮，所以无状态算法的研究十分必要。

在聚合阶段，常用的算法是求平均的方法，一种根据数据集大小对收集到的参数自适应并行SGD加权求平均算法。虽然这种方法的有效性已经在不同模型中得到了证明，但仍不确定这是否是最优的聚合参数的方法，需要进一步研究。

3.1.2采样和用户选择

由于数据集架构不平衡和传输带宽的有限，每一轮数据的采样和用户的选择对全局学习的有效性很重要。具体地说，一方面，由于每个终端拥有属于自己特定的局部最小化经验主义损失函数，在局部花费大量的时间进行训练可能面临参数偏离全局最小化的风险。另一方面，由于全局通信比本地计算花费更多的时间，因此需要减少通信轮次。一次，怎样平衡局部计算和全局通信对联邦学习具有重要意义。每个局部训练的采样数据集大小需要根据全局训练阶段自适应调整。

在全局聚合阶段，由于可用带宽有限，边缘服务器只能从总体用户数中选择一部分。因此，选择终端设备对联邦学习很重要。在边缘系统中，考虑信道质量，选择信道质量最好的终端，可以有效提高学习效率，如图2所示。在终端选择阶段考虑更新的时效性也很重要。

3.2模型压缩

虽然在过去的十年间，硬件水平改善，移动终端的处理能力大幅提高，但仍受功率和存储方面的限制，这是深度学习和联邦学习部署过程中遇到的问题。归因于深度神经网络往往由大量的激活单元和连接组成，因此训练这样的模型必然要消耗大量的能量，和占用存储空间。另一方面，即便模型训练任务可以完成，但上传参数需要较高的传输功率和很宽的带宽，这会带来很高的通信成本。方法如下：

Architecture compression:从神经网络计算的角度看，通过修剪连接和压缩网络的大小减少成本。连接修剪的观点来自这样一个事实，即大多数连接权重通常是非常小的，简单来说，神经网络最有效的组成部分在结构上是稀疏的。因此，修剪一些权重较小的连接时可行的，并不会对精度产生很大影响，同时节省了存储空间。此外，在许多应用中，使用小型神经网络可以取得与大型神经网络同样好的性能，因此在终端直接减少神经网络的大小也是很好的办法。
Gradient compression:从通信的角度，牺牲模型精度来降低通信开销。具体来说，提出机器学习在实际应用中提出不需要非常高的准确度，将训练梯度进行量化和压缩。这样就可以减小数据包的大小，节省通信资源，便于服务器解码。需根据终端的性质平衡通信成本和训练准确度开选择适当的量化水平。

图3描述了一个完整的模型压缩过程，可以发现移除神经网络中一些权重较小的连接是可取的。此外，连接较少的神经元也可以移除。架构压缩将模型转换成稀疏形式，并获得与传统神经网络相同的性能。另一部分是梯度压缩，由于参数是连续的，需要用较长的字符串表示，这对无线传输不利。通过适当量化，上传的数据量将大幅减小，这减少发射功率、节省传输带宽、便于边缘服务器解码。为了缓和量化噪声的影响，需要对量化策略进行研究，以减少模型精度损失。由于存在发送失败和重传的可能，编解码之前和之后的参数可能在不同的时序出现，尽管如此，服务器仍然可以利用序列号在全局聚合之前重拍参数。

3.3先进的通信和网络技术

通信：MIMO、NOMA、Full duplex、URLLC、联合处理能力和通信效率设计。

网络：服务器是最大的潜在失败点，尤其是终端数量十分庞大时，服务器成为了瓶颈。因此，端到端（D2D）的通信和干扰管理机制，自组织网络对联邦学习的性能有很大的影响。

3.4隐私保护技术

虽然联邦学习不明确共享原始数据，但黑客仍有可能提高检索原始信息来近似拓展。尤其是当学习架构和参数没有完全被保护起来。例如在通信过程中，优化算法的更新参数被直接暴露在外，这将泄露隐私信息。联邦学习的隐私和安全问题存在几个致命的点，如下：

3.4.1终端侧的隐私保护

联邦学习中，终端需要反复上传它们的学习结果到服务器来进行全局聚合。由于可能某个实体在监听上传的参数来推断重要信息，这些终端可能不信任服务器。未解决这个问题，终端可使用如下技术：

Perturbation：加扰，终端在上传的数据中添加噪声，使用差分隐私来模糊某些敏感属性，直到第三方无法区分属性，从而无法恢复数据，保护用户隐私。
Dummy:假参数、假模型。

3.4.2服务器侧的隐私保护

收集完来自终端更新的参数后，服务器通常执行加权平均来生成一个新的模型。但是，当服务器广播聚合参数反馈给终端时，可能发生信息泄露。

Privacy-enabled aggregation:
Secure multi-party computation (SMC):

3.4.3学习框架的隐私保护

1）Homomorphic encryption

2）Back-door defender

4.潜在应用和未来趋势

5.结论

我们对联邦收入系统进行了概述。具体地说，我们阐述了联邦学习模型的基本架构和显著特征，特别是非i.i.d。不平衡的数据集，不可靠和有限的通信资源，以及隐私和安全问题，这些都是它与传统通信的区别。此外，我们还介绍了一些实用的方法，使联邦学习的实现成为移动边缘系统。其中，从算法设计、模型压缩和通信效率等方面强调了其重要性。最后，我们介绍了几个应用程序，它们最有可能从应用联邦学习中获益。综上所述，我们认为联邦学习是实现智能网络的一个基石，我们期待在这一领域会出现更多有趣的研究问题。

【机器学习笔记 Ⅱ】11 决策树模型巴伦是只猫机器学习机器学习笔记决策树
决策树模型（DecisionTree）详解决策树是一种树形结构的监督学习模型，通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程，通过不断提问（基于特征划分）逐步逼近答案。1.核心概念节点类型：根节点：起始问题（最佳特征划分点）。内部节点：中间决策步骤（特征判断）。叶节点：最终预测结果（类别或数值）。分支：对应特征的取值或条件判断（如“年龄≥30？”）。2.构建决策树的关键步骤(1)
【机器学习笔记 Ⅱ】10 完整周期
机器学习的完整生命周期（End-to-EndPipeline）机器学习的完整周期涵盖从问题定义到模型部署的全过程，以下是系统化的步骤分解和关键要点：1.问题定义（ProblemDefinition）目标：明确业务需求与机器学习任务的匹配性。关键问题：这是分类、回归、聚类还是强化学习问题？成功的标准是什么？（如准确率>90%、降低10%成本）输出：项目目标文档（含评估指标）。2.数据收集（DataC
【机器学习笔记Ⅰ】13 正则化代价函数
正则化代价函数（RegularizedCostFunction）详解正则化代价函数是机器学习中用于防止模型过拟合的核心技术，通过在原始代价函数中添加惩罚项，约束模型参数的大小，从而提高泛化能力。以下是系统化的解析：1.为什么需要正则化？过拟合问题：当模型过于复杂（如高阶多项式回归、深度神经网络）时，可能完美拟合训练数据但泛化性能差。解决方案：在代价函数中增加对参数的惩罚，抑制不重要的特征权重。2.
【机器学习笔记Ⅰ】6 多类特征巴伦是只猫机器学习机器学习笔记人工智能
多类特征（Multi-classFeatures）详解多类特征是指一个特征（变量）可以取多个离散的类别值，且这些类别之间没有内在的顺序关系。这类特征是机器学习中常见的数据类型，尤其在分类和回归问题中需要特殊处理。1.核心概念(1)什么是多类特征？定义：特征是离散的、有限的类别，且类别之间无大小或顺序关系。示例：颜色：红、绿、蓝（无顺序）。城市：北京、上海、广州（无数学意义的大小关系）。动物类别：猫
图像分割技术详解：从原理到实践 lanjieying
本文还有配套的精品资源，点击获取简介：图像分割是图像处理领域将图像分解为多个区域的过程，用于图像分析、特征提取等。文章介绍了图像分割的原理，并通过一个将图像划分为2*4子块的示例，展示了如何使用Python和matplotlib库中的tight_subplot函数进行图像分割和展示。文章还探讨了图像分割在不同领域的应用，以及如何在机器学习项目中作为数据预处理步骤。1.图像分割基本概念在图像处理领域
机器学习笔记——支持向量机 star_and_sun 机器学习笔记支持向量机
支持向量机参数模型对分布需要假设（这也是与非参数模型的区别之一）间隔最大化，形式转化为凸二次规划问题最大化间隔间隔最大化是意思：对训练集有着充分大的确信度来分类训练数据，最难以分的点也有足够大的信度将其分开间隔最大化的分离超平面的的求解怎么求呢？最终的方法如下1.线性可分的支持向量机的优化目标其实就是找得到分离的的超平面求得参数w和b的值就可以了注意，最大间隔分离超平面是唯一的，间隔叫硬间隔1.1
【机器学习&深度学习】多分类评估策略一叶千舟深度学习【理论】深度学习【应用必备常识】大数据人工智能
目录前言一、多分类3大策略✅宏平均（MacroAverage）✅加权平均（WeightedAverage）✅微平均（MicroAverage）二、类比理解2.1宏平均（MacroAverage）2.1.1计算方式2.1.2适合场景2.1.3宏平均不适用的场景2.1.4宏平均一般用在哪些指标上？2.1.5怎么看macroavg指标？2.1.6宏平均值低说明了什么？2.1.7从宏平均指标中定位模型短板
【机器学习笔记Ⅰ】7 向量化巴伦是只猫机器学习机器学习笔记人工智能
向量化（Vectorization）详解向量化是将数据或操作转换为向量（或矩阵）形式，并利用并行计算高效处理的技术。它是机器学习和数值计算中的核心优化手段，能显著提升代码运行效率（尤其在Python中避免显式循环）。1.为什么需要向量化？(1)传统循环的缺陷低效：Python的for循环逐元素操作，速度慢。代码冗长：需手动处理每个元素。示例：计算两个数组的点积（非向量化）a=[1,2,3]b=[4
大语言模型应用指南：ReAct 框架 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
大语言模型应用指南：ReAct框架关键词：大语言模型,ReAct框架,自然语言处理(NLP),模型融合,多模态学习,深度学习,深度学习框架1.背景介绍1.1问题由来近年来，深度学习技术在自然语言处理(NLP)领域取得了显著进展。尤其是大语言模型(LargeLanguageModels,LLMs)，如BERT、GPT系列等，通过在大规模无标签数据上进行预训练，获得了强大的语言理解和生成能力。然而，预
大语言模型原理基础与前沿基于语言反馈进行微调 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿基于语言反馈进行微调作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，自然语言处理（NLP）领域取得了显著的进展。大语言模型（LargeLanguageModels，LLMs）如GPT-3、BERT等在各项NLP任务上取得了令人瞩目的成绩。然而，如何进一步提高大语言模型的理
李宏毅2025《机器学习》第四讲-Transformer架构的演进
Transformer架构的演进与替代方案：从RNN到Mamba的技术思辨Transformer作为当前AI领域的标准架构，其设计并非凭空而来，也并非没有缺点。本次讨论的核心便是：新兴的架构，如MAMA，是如何针对Transformer的弱点进行改进，并试图提供一个更优的解决方案的。要理解架构的演进，我们必须首先明确一个核心原则：每一种神经网络架构，都有其存在的技术理由。CNN（卷积神经网络）：为
条件概率：不确定性决策的基石大千AI助手人工智能 Python #OTHER 决策树算法机器学习人工智能条件概率概率论
条件概率是概率论中的核心概念，用于描述在已知某一事件发生的条件下，另一事件发生的概率。它量化了事件之间的关联性，是贝叶斯推理、统计建模和机器学习的基础。本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、定义与公式设(A)和(B)是两个随机事件，且(P(B)>0)：条件概率(P(A\midB))表示
探索AI人工智能医疗NLP实体识别系统的架构设计 AI学长带你学AI 人工智能自然语言处理 easyui ai
探索AI人工智能医疗NLP实体识别系统的架构设计关键词：人工智能、医疗NLP、实体识别、系统架构、深度学习、自然语言处理、医疗信息化摘要：本文将深入探讨医疗领域NLP实体识别系统的架构设计。我们将从基础概念出发，逐步解析医疗文本处理的特殊性，详细介绍实体识别技术的核心原理，并通过实际案例展示如何构建一个高效可靠的医疗实体识别系统。文章还将探讨当前技术面临的挑战和未来发展方向，为医疗AI领域的从业者
人工智能动画展示人类的特征 AGI大模型与大数据研究院 AI大模型应用开发实战 java python javascript kotlin golang 架构人工智能
人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
《支持向量机（SVM）在医疗领域的变革性应用》 CodeJourney. 支持向量机算法机器学习
在医疗科技日新月异的今天，先进的数据分析与机器学习技术正逐渐成为提升诊疗水平、助力医学研究的关键力量。支持向量机（SVM），凭借其独特的优势，在医疗这片复杂且对精准度要求极高的领域崭露头角，带来诸多令人瞩目的应用成果。一、疾病诊断：癌症早期筛查的“火眼金睛”癌症，作为全球健康的“头号杀手”，早期诊断对提升患者生存率意义非凡。在乳腺癌筛查领域，SVM发挥着重要作用。医疗科研人员收集大量乳腺组织的影像
机器学习20-线性网络思考坐吃山猪机器学习机器学习人工智能线性网络
机器学习20-线性网络思考针对线性网络的基础问题，使用基础示例进行解释1-核心知识点1-线性模型家族的线性回归和逻辑回归分别是什么，线性模型家族还有没有其他的模型线性模型家族是一系列基于线性假设的统计模型，它们假设因变量和自变量之间存在线性关系。线性模型家族中的两个最常见模型是线性回归和逻辑回归。线性回归（LinearRegression）:线性回归是一种用于预测连续因变量的模型。它假设因变量yy
机器学习18-强化学习RLHF 坐吃山猪机器学习机器学习人工智能
机器学习18-强化学习RLHF1-什么是RLHFRLHF（ReinforcementLearningfromHumanFeedback）即基于人类反馈的强化学习算法，以下是详细介绍：基本原理RLHF是一种结合了强化学习和人类反馈的机器学习方法。传统的强化学习通常依赖于预定义的奖励函数来指导智能体的学习，而RLHF则通过引入人类的反馈来替代或补充传统的奖励函数。在训练过程中，人类会对智能体的行为或输
机器学习19-Transformer和AlexNet思考坐吃山猪机器学习机器学习 transformer 人工智能
Transformer和AlexNet思考关于Transformer和AlexNet发展的一些思考1-核心知识点Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？AlexNet的主要核心思路是什么，为什么表现那么好？现在有什么比AlexNet更优秀的算法2-思路整理1-Word2Vec的作用是什么，和Transformer的诞生有什么关系吗？Word2Vec的作用Word2
机器学习21-线性网络思考坐吃山猪机器学习机器学习人工智能线性网络
机器学习21-线性网络思考针对线性网络的发展问题，进行补充学习1-核心知识点1-传统机器学习针对线性分类算法求解的方式有哪些？请详细列举不同的算法对应的损失函数和计算思路在传统机器学习中，线性分类算法是一种非常重要的方法，用于将数据划分为不同的类别。以下是几种常见的线性分类算法，包括它们的损失函数和计算思路：1.感知机（Perceptron）损失函数感知机的损失函数是基于误分类点的，其目标是最小化
深度学习篇---简单果实分类网络
下面我将提供一个使用Python从零实现果实分类模型的完整流程，包括数据准备、模型构建、训练和部署，不依赖任何深度学习框架，仅使用NumPy进行数值计算。1.数据准备与预处理首先需要准备果实图像数据集，将其分为好果和坏果两类，并进行预处理：importosimportnumpyasnpfromPILimportImagefromsklearn.model_selectionimporttrain_
Python深度学习：3步实现AI人脸识别，效果堪比专业软件！小筱在线 python 人工智能 python 深度学习
引言：AI人脸识别的时代已经到来在当今数字化时代，人脸识别技术已经从科幻电影走进了我们的日常生活。从手机解锁到机场安检，从银行身份验证到智能门禁系统，这项技术正以前所未有的速度改变着我们的生活方式。而令人振奋的是，借助Python和深度学习技术，普通人也能构建出专业级的人脸识别系统。本文将带领您通过三个关键步骤，使用Python深度学习技术实现一个准确率高达99%的人脸识别系统。这个系统不仅原理简
Spring AI 第二讲之 Chat Model API 第五节HuggingFace Chat
HuggingFaceInferenceEndpoints允许您在云中部署和提供机器学习模型，并通过API对其进行访问。开始使用有关HuggingFaceInferenceEndpoints的更多详细信息，请访问此处。前提条件添加spring-ai-huggingface依赖关系：org.springframework.aispring-ai-huggingface获取HuggingFaceAPI
【推荐算法课程二】推荐算法介绍-深度学习算法盒子6910 运维视角下的广告业务算法推荐算法深度学习运维开发运维人工智能
三、深度学习在推荐系统中的应用3.1深度学习推荐模型的演化关系图3.2AutoRec——单隐层神经网络推荐模型3.2.1AutoRec模型的基本原理AutoRec模型是一个标准的自编码器，它的基本原理是利用协同过滤中的共现矩阵，完成物品向量或者用户向量的自编码。再利用自编码的结果得到用户对物品的预估评分，进而进行推荐排序。什么是自编码器？自编码器是指能够完成数据“自编码”的模型。无论是图像、音频，
【AI智能推荐系统】第二篇：深度学习在推荐系统中的架构设计与优化实践 DeepFaye 人工智能深度学习
第二篇：深度学习在推荐系统中的架构设计与优化实践提示语：“从Wide&Deep到Transformer，深度推荐模型如何突破性能瓶颈？本文将揭秘Netflix、淘宝都在用的深度学习推荐架构，手把手教你设计高精度推荐系统！”目录深度学习推荐系统的核心优势主流深度学习推荐架构解析2.1Wide&Deep模型2.2DeepFM与xDeepFM2.3神经协同过滤(NCF)2.4基于Transformer的
Python设置国内镜像教程 wh3933 python 开发语言
####引言Python是一种广泛使用的高级编程语言，用于各种编程任务，从简单的脚本到复杂的机器学习算法。在安装Python包时，通常需要从Python包索引（PyPI）下载。由于网络原因，直接从PyPI下载可能速度较慢，因此，使用国内的镜像源可以显著提高下载速度。本文将详细介绍如何在Python中设置国内镜像。####文章目的本篇文章旨在指导用户如何将Python的包管理工具`pip`的默认源切
机器学习宝典——第6章爱看烟花的码农机器学习人工智能
第6章：聚类算法(Clustering)你好，同学！欢迎来到无监督学习的世界。与监督学习不同，这里的我们没有“标准答案”（标签），我们的目标是在数据中发现隐藏的、内在的结构。聚类算法就是实现这一目标的核心工具，它试图将数据集中的样本划分为若干个不相交的子集，我们称之为“簇”(cluster)。本章我们将深入探讨三种最具代表性的聚类算法：K-均值(K-Means)、层次聚类(Hierarchical
【深度学习】神经网络剪枝方法的分类烟锁池塘柳0 机器学习与深度学习深度学习神经网络剪枝
神经网络剪枝方法的分类摘要随着深度学习模型，特别是大语言模型（LLM）的参数量爆炸式增长，模型的部署和推理成本变得异常高昂。如何在保持模型性能的同时，降低其计算和存储需求，成为了工业界和学术界的核心议题。神经网络剪枝（Pruning）作为模型压缩的关键技术之一，应运而生。本文将解析剪枝技术的不同分类，深入探讨其原理、优缺点。文章目录神经网络剪枝方法的分类摘要1为什么我们需要剪枝？2分类方法一：剪什
Python 图像分类入门超龄超能程序猿机器学习 python 分类开发语言
一、介绍图像分类作为深度学习的基础任务，旨在将输入图像划分到预定义的类别集合中。在实际的业务中，图像分类技术是比较常用的一种技术技能。例如，在安防监控中，可通过图像分类识别异常行为；在智能交通系统中，实现对交通标志和车辆类型的快速识别等。本文将通过安装包已有数据带你逐步了解使用Python进行图像分类的全过程。二、环境搭建在开始图像分类项目前，需要确保Python环境中安装了必要的库。主要包括：T
初始CNN(卷积神经网络) 超龄超能程序猿机器学习 cnn 人工智能神经网络
卷积神经网络（ConvolutionalNeuralNetwork，简称CNN）作为深度学习的重要分支，在图像识别、目标检测、语义分割等领域大放异彩。无论是手机上的人脸识别解锁，还是自动驾驶汽车对道路和行人的识别，背后都离不开CNN的强大能力一、CNN诞生的背景与意义在CNN出现之前，传统的图像识别方法主要依赖人工提取特征，例如使用SIFT（尺度不变特征变换）、HOG（方向梯度直方图）等算法。这些
R 语言安装使用教程小奇JAVA面试安装使用教程 r语言开发语言
一、R语言简介R是一种用于统计分析、数据挖掘和可视化的编程语言和环境。它在学术界和数据分析领域中广泛使用，拥有丰富的统计函数库和绘图功能。二、安装R语言2.1下载R安装包前往CRAN官网下载适合你操作系统的安装程序：官网地址：https://cran.r-project.org/2.2Windows安装下载.exe安装包；双击安装程序，按默认选项一路安装即可；安装完成后，可通过RGUI或命令行启动
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。