weixin_42707080

Edge AI边缘智能：Communication-Efﬁcient Edge AI: Algorithms and Systems（未完待续）

边缘设备的大规模部署产生了空前规模的数据，这为在网络边缘开发各种智能应用提供了机会。然而，由于不同的信道质量、网络拥挤和隐私问题，这些庞大的数据不可能全部从终端设备发送到云端进行处理。通过将人工智能模型的推理和训练过程推到边缘节点，边缘人工智能成为一个很有前途的替代方案。edge AI需要智能手机和智能汽车等边缘设备与无线接入点（AP）和基站(BS)的边缘服务器之间的密切合作，但这会导致大量的通信开销。在本文中，首先总结了基于边缘节点的分布式训练人工智能模型的通信效率算法，包括零阶、一阶、二阶和联邦优化（federated optimization）算法。然后，对edge AI系统的不同系统架构进行了分类，包括基于数据分区（Data partition based edge training systems）、基于模型分区（ Model partition based edge training systems）、基于计算卸载（Computation ofﬂoading based edge inference systems）和一般的边缘计算AI系统（General edge computing systems）。

文章目录

一、

一、Introduction

无线系统中的边缘节点可以包括边缘服务器、无线接入点和边缘设备，如下图所示。

将AI模型部署到边缘节点的合理方案是边缘节点协同合作来完成整个AI模型的训练和推理过程，如下图所示，采用联邦学习，利用多个边缘设备训练AI模型，每个设备只需要根据自己的数据样本计算一个局部模型，然后将计算结果发送到融合中心（fusion center），在那里对全局AI模型进行聚合和更新，然后新的AI模型将被传送回每个设备进行下一阶段的训练（传回去设备的是AI模型的相关参数）。

（Note: 训练过程的缺点：以协作的方式利用设备上的计算能力，但是，在模型更新过程中需要大量的通信开销。推理过程的缺点：一些计算密集型的AI推理任务只能通过边缘设备和边缘服务器之间的任务分割来完成，由于该任务需要要求大量计算，需要较多的边缘设备参与其中，分割的任务数也就多了，从而带来了沉重的通信成本。）

二、Motivations and Challenges

2.1 Motivations

5G的推出集中在联网事物的几个关键服务上：增强的移动宽带(eMBB)、超可靠的低延迟通信(URLLC)和大规模的机器类型通信(mMTC)。

6G网络的目标：从connected things到connected intelligence。6G的网络基础设施被设想为充分利用大规模分布式设备的潜力和在网络边缘生成的数据来支持智能应用程序[9]。

Training at network edges 要求协调大量边缘节点，协同构建机器学习模型。（Note:每个边缘节点通常只能访问一小部分训练数据，这是与基于云的模型训练的根本区别)。在边缘训练中，跨边缘节点的信息交换导致了很高的通信成本，尤其是在有限带宽的无线环境中。

Edge inference, i.e., performing inference of AI models at network edges，由于DNN（deep neural network）有大量的模型参数。因此在网络边缘部署DNN模型通常考虑的有model compression approaches， energy-efﬁcient processing of deep neural networks（减少设备功耗），coding techniques来进行数据转换（减少内存）

2.2 Performance Measurements and Unique Challenges of Edge AI

2.2.1 Performance Measurements

edge AI的关键指标主要有：1）model accuracy：模型精度可以通过收集更多的训练数据来提高

2）total latency：从大量数据中训练一个机器学习模型是非常耗时的。分布式训练的过程主要包括计算延迟和通信延迟。计算延迟与边缘节点的能力密切相关。通信延迟可能因传输的原始或中间数据的大小和网络连接的带宽而异。

3）computaion and communication cost：为了有效地训练模型，通常采用分布式架构，这将引入额外的跨节点信息交换通信成本。对于像DNN这样的高维模型，计算和通信成本会增长得非常高。计算成本受主要受目标训练模型的大小和所用设备的资源的影响；通信开销受原始输入数据的大小、传输方式和可用带宽的影响。

2.2.2 Requirements on the algorithms and system architectures

1、 Limited resources on edge nodes：包括limited computation, storage, and power resources and limited link bandwidth

2、Heterogeneous resources across edge nodes:每个边缘节点在硬件、网络和功率预算都是不一样的，即拥有不同的 communication, computation,storage and power capabilities。

3、Privacy and security constraints: Federated learning 可以在协同构建机器学习模型的同时保护数据隐私。

2.3 Communication Challenges of Edge AI

设L为每轮交换信息的总大小(bits)，r为通信速率（bits/s），N为通信轮数，T为每轮的总计算时间(s),则edge AI系统的总延时为：

1、从the learning algorithm的角度来看，“要传输什么”决定了每轮所需的通信开销和通信轮数，如根据不同场景设计不同的梯度算法，有损压缩技术如量化、修剪（ quantization and pruning ）等可以用来减少通信开销。

2、edge AI系统设计对跨边缘节点的通信范式设计的影响：从in-network computation的角度来研究全梯度的计算：通过聚集所有局部节点上局部计算的局部梯度，可以在一个集中节点上计算全梯度。（PS：What is in-network computation [20]?）

2.4 Related Works and Contributions

1、Algorithm level：加快算法收敛性、信息压缩技术（稀疏化，量化）可减少通信开销

2、System level: 数据分布 (e.g., distributed across edge devices), 模型参数 (e.g., partitioned and deployed across edge devices and edge servers), 计算框架 (e.g., MapReduce), and 通信机制(e.g.,aggregation at a central node)在不同的应用中是不同。对于训练AI模型的edge AI系统有：the data partition system and model partition system。对于部署AI模型的edge AI系统有：Computation ofﬂoading based edge inference systems and General edge computing systems.

三、Communication-efficient algorithms for edge AI

3.1 Communication-Efﬁcient Zeroth-Order Methods

零阶优化方法用于只有函数值可用，但导数信息难以计算获得，甚至没有很好定义的应用中，举例：（1）在强化学习中，在没有建立模型的基础上用于决策函数学习（what?）（2）用于DNN的黑盒对抗攻击(what?)，因为应用于现实生活中的DNN网络并不知道其内部参数。

对于具有中心协调中心的分布式设置，上行传输时只需要向中心节点传输一个函数值标量即可。

目前零阶优化方法应用的技术有：量化技术，将预测的梯度值量化成较小的bits来进行通信；each device communicates with its neighbors with some probability that is independent from others and the past, and this probability parameter decays to zero at a carefully tuned rate [153]（没看明白，有时间再来看下该文）

3.2 Communication-Efﬁcient First-Order Methods

梯度下降法的思想是用适当的步长迭代地更新与损失函数在该点的梯度方向相反的变量.

在设备间通信的梯度交换是其主要瓶颈之一，解决这一问题的一种方法是通过加快学习算法的收敛速度来减少通信次数。另一种方法是减少每轮的通信开销，包括梯度重用方法、量化、稀疏化和基于草图的压缩方法（ sketching based compression ）

1) Minimizing Communication Round：在一般情况下，设备在每次迭代时将其局部梯度上传到融合中心，通过加快算法的收敛速度来减少通信周期，如采用mini-batch SGD(通信成本随的mini-batch大小线性下降)；采用环形拓扑结构，每个设备只与直接相连的设备通信；调整学习速率来加快收敛。

影响算法的收敛速度：数据的统计异质性

2) Minimizing Communication Bandwidth：减少每个设备本地更新的大小

Gradient reuse：从理论上讲，在损失函数为强凸、凸或非凸光滑的情况下，LAG（ lazily aggregated gradient ）可以达到与BGD（batch gradient descent）相同阶数的收敛速度

Gradient quantization：标量量化方法被提出用少量比特压缩梯度来代替浮点表示法。但是在没有中心汇聚节点的去中心化网络下，一些标量量化方法会失败。梯度向量量化技术被提出来利用CNN梯度之间的相关性。向量量化[174]通过对一个向量的所有项进行联合量化，可以达到最优的率失真权衡； Grassmannian quantization ；Jiang等[175]提出了一种用于梯度压缩的非均匀量子化方法的 quantile sketch。Sketch是一种用概率数据结构近似输入数据的技术

Gradient sparsiﬁcation：梯度稀疏化背后的基本思想是根据一些标准只传播重要的梯度。这是基于在训练中许多梯度通常是非常小的观察：忽略低于预定义常数阈值的梯度；Adacomp的局部选择梯度残基；对超过阈值的梯度进行通信，而对剩余的梯度进行累积，直到达到阈值； momentum correction, local gradient clipping, momentum factor masking，warm-up training；局部误差校正使梯度按幅度稀疏化[178],为大规模RNN的应用提供了理论基础

3.3 Communication-Efﬁcient Second-Order Methods

一种方法是在中心节点上保持全局近似的逆海森矩阵，另一种方法是在每个设备上局部地解决二阶近似问题

发展近似二阶方法的一种常用方法是利用L-BGFS: Schraudolph等人[48]提出了一种不需要进行线性搜索的在线凸优化的随机L-BFGS;Moritz等人[50]提出了一种线性收敛的随机L-BFGS算法，该算法通过获得更稳定、更高精度的逆Hessian矩阵估计，但每轮需要更高的计算和通信开销

有效通信二阶方法的另一个主要思想是在每个设备上解决二阶近似问题：Shamir等人[51]提出了一种分布式近似牛顿型方法，命名为DANE，该方法使用全局聚集步长求解每个设备上的近似局部牛顿系统，该方法只需要与一阶分布式学习算法相同的通信带宽。随后，在[52]中提出的算法DiSCO通过分布式预条件共轭梯度法近似求解全局牛顿系统，在每一轮通信中求解更精确的二阶近似；Wang等人[53]提出了一种改进的近似牛顿法GIANT，通过在每个设备上的共轭梯度步进一步减少通信轮数，结果表明其性能优于DANE和DiSCO；在[54]中提出了一种新的自适应分布牛顿法，该方法通过在每轮中增加一个标量参数来补偿分布二阶近似的信息损失

3.4 Communication-Efﬁcient Federated Optimization

使用额外的本地计算来降低通信成本：联邦优化[15]是一个基于每个设备上的数据集迭代执行局部训练算法并聚合局部更新模型的框架，即，计算局部更新模型参数的平均值(或加权平均值)。该框架为数据提供了额外的隐私保护，并有可能减少从大量移动设备聚合更新的通信轮数（许多模型压缩方法来减小模型大小，无论是在局部训练过程中还是在局部训练后压缩模型参数，都可以进一步降低联邦优化的聚合通信成本）

1) Minimizing Communication Round：[55]提出了一种新的框架CoCoA：在每个通信轮中，每个移动设备执行基于本地数据集的双重优化方法的多个步骤，以换取更少的通信轮，然后计算更新的本地模型的平均值（强对偶性失效或对偶问题难以求解时会失效）；联邦平均(FedAvg)[18]算法是另一种通信效率高的联邦优化算法，它通过在每个设备上使用给定数量的SGD迭代和模型平均来更新本地模型，该算法只适用于每个设备上的数据样本来自相同的分布。在每轮通信中，每个设备以全局模型为初始点，执行给定数量的SGD步骤，并通过所有局部模型的加权平均得到聚合的全局模型。选择权值作为局部训练数据集的大小，该数据集对于非独立同分布(非iid)的数据分布和不平衡的移动设备数据分布具有很强的鲁棒性。

为了解决设备间的统计异质性，FedProx算法[56]通过在局部目标函数中添加一个最近项来限制局部更新模型接近全局模型，而不是在每一轮通信时用全局更新来初始化每个局部模型。

2) Minimizing Communication Bandwidth：

模型压缩的方法：

Quantization: 量化压缩DNNs的方法是用更少的比特表示权值，而不是采用32位浮点格式。[58]，[184]采用kmeans聚类方法对一个预先训练好的DNN的权值进行聚类。在训练阶段，已有研究表明，仅使用随机舍入的16位宽定点数表示法就可以训练DNNs[185]，这对分类精度几乎没有影响；在训练中学习二进制权值或激活，这在[59]，[60]，[61]中进行了深入的研究。这种方法允许大量的计算速度对设备由于按位操作。它还可以显著降低联邦学习中的通信成本，因为权值用1位表示。

Sketching: 在[62]中，HashedNet使用一个哈希函数勾画出神经网络的权值，并强制映射到同一个哈希桶的所有权值共享一个参数值。但它只适用于完全连接的神经网络；[63]将其扩展到CNNs，首先将滤波器权值转换到频域，然后使用低成本的哈希函数将相应的频率参数分组到哈希桶中。

Pruning: 网络剪枝通常通过根据某些标准删除连接、过滤器或通道来压缩DNNs。在[67]的工作中，提出了对一个预先训练好的网络的不重要的权值进行修剪，并对网络进行再训练，以调整剩余连接的权值，从而在不影响精度的情况下将AlexNet的参数数量减少9倍。在[27]中提出了深度压缩，将DNNs分为三个阶段进行压缩。，剪枝，训练量化和霍夫曼编码，这产生了相当紧凑的DNNs。Aghasi等[70]提出通过凸规划逐层修剪网络，这也表明整体性能下降可以由每一层重构误差的总和来约束。

Sparse regularization：通过在训练过程中在损失函数中加入正则化因子来诱导DNNs的稀疏性来实现学习紧凑型DNNs（无须预训练）[72-74]

Structural matrix designing:在压缩神经网络中，低秩矩阵分解的主要思想是将低秩矩阵分解技术应用于神经网络的权矩阵

在[76]中，为了加速卷积，每个卷积层都被一个低秩矩阵近似，并研究了不同的近似矩阵来提高性能。在[77]的工作中，提出了通过为一个预先训练好的CNN构造rank-one滤波器的低秩基来加速卷积层。

低秩的方法在训练阶段也得到了应用。在[78]中，利用低秩方法来减少在训练中学习的网络参数的数量。在[79]、[80]中也采用了低秩方法来学习可分离滤波器来加速卷积，通过增加额外的正则化来找到低秩滤波器。

另一种减少权矩阵参数数量的方法是利用结构化矩阵，Sindhwani等[81]提出学习DNNs的结构化参数矩阵，通过快速的矩阵向量积和梯度计算，也大大加快了推理和训练的速度。文献[82]提出在全连通层的权值矩阵上加入循环结构，在训练阶段和推理阶段加速计算。在[83]中，作者提出了一种自适应Fastfood变换来重新参数化全连通层的矩阵向量乘法，从而降低了存储和计算成本。

四、COMMUNICATION-EFFICIENT EDGE AI SYSTEMS

4.1 Architectures of Edge AI Systems

Data partition based edge training systems: 数据被大量地分布在许多边缘设备上，每个边缘设备只有整个数据集的一个子集。在训练期间，每个边缘设备持有一个完整AI模型的副本来计算一个本地更新。

Model partition based edge training systems: 每个节点并只有有AI模型一部分参数的副本。此外在每个边缘节点只能访问一组公共用户身份的部分数据属性时，如何在训练过程中保护数据隐私受到了广泛的关注。它通常被称为vertical federated learning [19]。为了保护数据的私密性，我们提出通过边缘设备和边缘服务器的协同作用，对设备进行简单的处理，并将中间值上传到功能强大的边缘服务器来训练模型。这是通过在设备上部署一小部分模型参数来实现的，并且在边缘设备上保留部分以避免用户数据的暴露。

Computation ofﬂoading based edge inference systems：启用低延迟的边缘AI服务，关键是要将经过训练的模型部署到接近最终用户的地方。有两类：将整个模型部署到边缘服务器上、对模型进行分区，然后跨边缘设备和边缘服务器进行部署。

General edge computing systems：mapreduce的框架通常会联合考虑分布式数据输入和分布式模型部署，以加速分布式训练或推理。编码技术在可伸缩的数据变换（scalable data shufﬂing ）[138]、[30]以及降低掉线率（ straggler mitigation ）[142]中起着关键作用。

4.2 Data Partition Based Edge Training Systems

每个设备通常有一个训练数据子集和一个机器学习模型的副本。训练可以通过执行本地计算和定期交换来自移动设备的本地更新来完成。该系统的主要优点是适用于大部分的模型体系结构，具有良好的可扩展性。主要缺点是模型大小和完成本地计算所需的操作受到每个设备的存储大小和计算能力的限制。

1) Distributed System Mode: 通信瓶颈来自于聚合来自移动设备和掉队设备的本地更新。挑战如下：

Fast aggregation via over-the-air computation：空中计算是利用无线多址信道的信号叠加特性来计算分布式数据函数的一种有效方法[189]。可以通过空中计算计算的函数称为nomographic function[190]，通过无线信道可聚合这些值。对于属于nomographic函数类的集合函数，我们可以通过利用空中计算来提高通信效率。

Yang等人[21]提出采用空中计算方法进行快速的模型聚合，聚合函数是来自分布式移动设备的更新的一个线性组合，它属于一组nomographic函数，通过研究无线多址信道的信号叠加特性，采用收发器设计，提高了无线多址信道的通信效率，降低了所需带宽；在[21]中考虑了节点设备选择和波束形成的设计问题，提出了稀疏和低秩优化方法，使所提出的空中计算具有良好的快速模型聚合性能。

空中计算对于快速聚合的效率也在[84]中得到了证明，它描述了通信和学习性能之间的两个权衡。第一个问题是接收信噪比测量的更新质量与提出的深衰落信道干信道反演策略所导致的模型参数截断比之间的权衡。第二个问题是接收信噪比与被利用数据的比例之间的权衡，即当数据均匀分布在设备上时，调度单元内部设备的比例。

Amiri和Gunduz[85]在空中计算的基础上，提出了一种梯度压缩和随机线性投影的方法，以减小由于信道带宽有限而导致的梯度维数，与基于计算和通信的独立方法相比，该方法具有更快的收敛速度。这项工作在[86]中进一步扩展到无线衰落信道。

Aggregation frequency control with limited bandwidth and computation resources：学习过程包括不同设备的局部更新和融合中心的全局聚合。我们可以在一个或多个本地更新的间隔内聚合本地更新，例如采用联合平均算法[18]。通过权衡本地设备上有限的计算资源和用于全局数据聚合的有限的通信带宽来仔细设计聚合频率。

Wang等[87]从理论角度给出了基于梯度下降的联邦学习的收敛边界。基于此收敛结果，作者提出了一种学习数据分布、系统动态和模型特征的控制算法，该算法可以实时动态确定全局聚集的频率，从而在固定资源预算下最小化学习损失。Zhou和Cong[88]建立了非凸损失函数K步平均的分布式随机梯度下降算法的收敛结果。文献[89]研究了从总运行时间而不是迭代次数上的收敛率，提出了一种自适应通信策略，该策略从低聚合频率开始，以节省通信成本，然后增加聚合频率，以达到低错误下限。

Data reshufﬂing via index coding and pliable index coding: 数据重组[196]、[197]是一种公认的提高机器学习算法统计性能的方法。

为了降低数据重组的通信成本，Lee等[90]提出了一种基于索引编码的编码重组方法。这种方法假设数据放置规则是预先指定的。在每项工作中更新少量的新数据点可以提高统计学习性能，这促使了基于可塑指数编码的半随机数据重组方法的提出[91]，以提高编码方案的设计效率。它声称每个设备的新数据不一定以特定的方式，每个数据在不超过c个设备上都是必需的(这称为c约束)。无线网络中也考虑了可塑数据重组问题[92]，在每一轮中，作者建议使用新数据点来最大限度地更新设备数量，而不是更新所有移动设备的新数据。结果表明，该方法以牺牲学习性能为代价，大大降低了通信成本。

Straggler mitigation via coded computing：在梯度计算过程中，一些设备可能会掉队，即，这些设备需要更多的时间来完成计算任务。

Tandon等人[93]通过在设备上仔细复制数据集，提出对计算出的梯度进行编码以迁移掉队者，而冗余数据的数量取决于系统中掉队者的数量。在[94]中，掉队者的容忍和沟通成本被联合考虑。因此，与[93]相比，分布式梯度计算的总运行时间进一步减少，除了将计算分配到数据集的子集之外，还将计算分配到梯度向量分量的子集上。Raviv等[95]采用了经典编码理论中的工具，即梯度编码在参数的适用范围和编码算法的复杂度方面都取得了良好的性能。Halbawi等人[96]使用Reed-Solomon编码使学习系统比[93]更健壮。缓解掉队者影响所需的通信负载和计算负载方面的性能在[97]中得到了进一步的改进。

大多数的掉队缓解方法都假定掉队的设备对学习任务没有贡献。相比之下，[98]提出利用非持久性掉队者，因为他们能够在实践中完成指定任务的某个部分。这是通过在每轮通信中从设备向融合中心传输多个本地更新来实现的，而不是每轮只传输一个本地更新。

此外，在[95]中提出了近似梯度编码，其中融合中心只需要近似计算整个梯度，而不需要精确计算，这大大减少了来自设备的计算，同时保持了系统对掉线者的容忍度。然而，这种近似的gradient方法与精确的gradient方法相比，通常会导致学习算法的收敛速度较慢[99]。当损失函数是平方损失时，在[100]中提出用低密度校验码(LDPC)编码数据矩阵的第二矩，以减轻掉队者的影响。他们还指出，基于矩编码的梯度下降算法可以看作是一种随机梯度下降法，这为该方法提供了获得收敛性保证的机会。考虑到一般的损耗函数，在[101]中提出使用低密度生成器矩阵(LDGM)代码将数据分配到设备。Bitar等人[99]提出了一种近似的梯度编码方案，基于成对均衡设计，将数据点冗余地分布到设备上，而忽略掉掉线的部分。建立了收敛保证，并通过数据冗余来提高收敛速度[99]。

2) Decentralized System Mode: 在去中心化模式下，通过直接交换信息而不需要中心节点，利用多个边缘设备对机器学习模型进行训练。众所周知的分散信息交换范式是 gossip communication protocol [199]，它通过随机唤醒一个节点作为中心节点来收集邻居节点的更新或将其本地更新广播给邻居节点。将 gossip communication protocol 集成到学习算法中，提出了 Elastic Gossip [102] and Gossiping SGD [103] [104] [105]。

分散机器学习的典型网络拓扑结构是全连接网络，其中每个设备直接与所有其他设备通信。在这个场景中，每个设备维护模型参数的一个本地副本，并计算将发送到所有其他设备的本地梯度。每个设备可以平均从其他设备接收到的梯度，然后执行本地更新。在每次迭代中，如果每个设备从相同的初始点开始，则所有设备上的模型参数都是相同的。这一过程与集中式服务器上的经典梯度下降过程基本相同，因此可以保证集中式设置下的收敛性。然而，这样一个完全连接的网络承受着沉重的通信开销，在设备数量上呈平方增长，而在集中设置的设备数量上，通信开销是线性增长的。因此，网络拓扑设计在缓解分散场景中的通信瓶颈方面起着关键作用。此外，分散算法的收敛速度也取决于网络的拓扑结构[106]。需要注意的是，分散的edge AI系统与分布式模式下的系统有着相同的问题，因为每个设备都扮演着融合中心的角色。

在[107]中观察到，拥有1000台设备的ErdosRenyi图拓扑可以与拥有3000台设备的标准全连通拓扑竞争，这表明，如果对拓扑进行精心设计，机器学习性能会更有效。考虑到不同的设备可能需要不同的时间来进行局部计算，Neglia等[108]分析了不同网络拓扑对分布式次梯度方法总运行时间的影响，从而确定了拓扑图的度，从而加快了收敛速度。他们还表明，稀疏网络有时会导致收敛时间的显著缩短。

用环形拓扑[109]，其中每个设备只与布置在逻辑环中的相邻设备通信。更具体地说，每个设备聚集并沿着环传递它的局部梯度，这样所有设备在末端都有一个完整梯度的副本。该方法已在分布式深度学习模型更新中得到应用[110]，[111]。然而，部署在环形拓扑结构上的算法对掉队者具有固有的敏感性[112]。为了缓解环拓扑中掉队者的影响，Reisizadeh等人[112]提出使用逻辑树拓扑进行通信，并在此基础上通过梯度编码技术减轻掉队者的影响。在树状拓扑结构中，有几个设备层，其中每个设备仅与其父节点通信。通过并发地将大量子节点的消息传输到多个父节点，与树拓扑的通信可能比与环拓扑的通信更有效。

4.3. Model Partition Based Edge Training Systems

在这样的系统中，每个节点持有部分模型参数，协同完成模型训练任务或推理任务。在训练过程中，模型划分的一个主要优点是每个节点都需要一个较小的存储空间。在该系统中，机器学习模型被分布在多个计算节点中，每个节点只评估模型参数的一部分更新。这种方法在机器学习模型太大而不能存储在单个节点的情况下特别有用[200]，[201]。在训练过程中，模型划分的另一个主要关注点是当每个节点上的数据属于不同对方时的数据隐私。然而，使用基于模型分区的架构进行模型训练也会在边缘设备之间造成沉重的通信开销。

• Model partition across a large number of nodes to balance computation and communication：已有文献[113]、[114]、[115]考虑了具有异构硬件和计算机能力的跨边缘节点的模型划分。在[113]中，提出了一种将计算图部署到边缘计算设备上的强化学习方法，然而，这种方法需要大量的时间和资源。为了避免基于强化学习方法的巨大计算成本，Harlap等[114]提出了PipeDream系统来自动确定DNNs的模型划分策略。此外，与使用单一机器或使用数据分区方法相比，注入多个小批量会使系统收敛得更快。虽然PipeDream强调边缘设备的硬件利用，但是每个设备应该维护多个版本的模型参数，以避免由于异步向后更新的参数过时而导致的优化问题。这阻碍了PipeDream扩展到更大的模型。为了解决这个问题，在[115]中提出了GPipe系统，该系统采用了新颖的batch-splitting and re-materialization技术，能够扩展到大型模型，而几乎不需要额外的通信开销。

• Model partition across the edge device and edge server to avoid the exposure of users’ data: 在实践中，强大的边缘服务器通常由服务提供商拥有，但是用户可能不愿意将他们的数据暴露给服务提供商进行模型培训。观察到一个DNN模型可以分成两个连续的层，这促使研究人员将设备的前几层部署在本地，其余的层部署在边缘服务器上，以避免暴露用户数据。Mao等[116]提出了一种隐私保护的深度学习体系结构，其中DNN的浅层部署在移动设备上，大部分部署在边缘服务器上。Gupta和Raskar[202]设计了一个跨多个代理的模型划分方法，即并将其扩展到具有少量标记样本的半监督学习情形。在华为Nexux 6P手机上对特定的DNN人脸识别模型进行了训练和评估，获得了满意的效果。在[117]中，提出了一种兼顾隐私和性能的分区方法ARDEN。移动设备上的模型参数是固定的，并引入差分隐私机制来保证移动设备上输出的隐私。在上传本地输出之前，故意添加噪声以提高DNN的鲁棒性，这对推理性能是有益的。

• Vertical architecture for privacy with vertically partitioned data and model: 在大多数行业中，数据通常是垂直划分的，即，每个所有者只持有部分数据属性。由于竞争、隐私和管理过程，数据隔离成为协作构建模型的严重瓶颈。因此，利用垂直分块数据[19]来保护隐私的机器学习受到了广泛的关注。在训练过程中，模型也被垂直分割，每个所有者持有一部分模型参数。因此，提出并研究了面向隐私保护的机器学习的垂直人工智能体系结构，其中每个节点都可以访问公共数据实例的不同特征并维护相应的模型参数子集。更糟糕的是，每个数据实例的标签只对属于一方的节点可用.

Vaidya和Clifton[118]提出了一种具有安全多方计算的垂直架构下的隐私保护kmeans算法。Kantarcioglu和Clifton[119]研究了垂直分区数据的安全关联规则挖掘问题。文献[120]考虑了线性回归模型，提出了基于半托管式第三方实现安全、可扩展训练的多方计算协议。对于隐私保护分类与支持向量机(SVM)，Yuetal。[121]考虑支持向量机的对偶问题，采用随机扰动策略，该策略只适用于三个以上的节点。文献[122]提出了一种基于决策树的隐私保护分类方法，该方法采用交换加密等安全多方计算过程来确定是否存在剩余属性，并对集合交集进行安全基数计算。对于逻辑回归的分类，由于目标函数的耦合和梯度的存在，使得问题变得更加困难。为了解决这个问题，Hardy等人[123]提出使用泰勒近似来受益于同态加密协议，而不暴露每个节点的数据。

4.4 Computation Ofﬂoading Based Edge Inference Systems

将整个推理任务卸载到一个边缘服务器上，称为基于服务器的边缘推理，如图6(a)所示。它特别适用于资源有限的物联网设备。在这种情况下，整个AI模型都部署在边缘服务器上，边缘设备应该将它们的输入数据上传到边缘服务器进行推理。对于延迟和隐私问题，另一种方法是只将部分任务转移到边缘服务器，边缘服务器根据边缘设备计算的中间值计算推理结果。我们将其称为如图6(b)所示的设备边缘联合推理。这种边缘设备和边缘服务器的协作可以通过在设备上执行简单的处理和在边缘服务器上执行其余部分来实现。

1) Server-Based Edge Inference: 数据传输的主要瓶颈是有限的通信带宽。在带宽受限的边缘AI系统中，为了减少上行链路传输的实时数据传输开销，一种有效的方法是在不影响推理精度的前提下减少设备传输的数据量。此外，为了提高边缘推理的通信效率，提出了多边缘服务器协作下行传输的方案。

• Partial data transmission: 为了实时实现基于云的移动机器人视觉定位，通过网络控制数据量是非常重要的。因此，Ding等人[124]采用了[125]提出的多机器人通信的数据压缩方法，即采用稀疏化方法对数据进行压缩。在基于云计算的协作3 d映射系统中,Mohanarajah等人[126]提出减少带宽需求通过发送只有关键帧,而不是所有的帧产生的传感器,和陈等。[127]提出了确定和卸载等对象检测利用启发式的关键帧选择关键帧的帧差异。当我们能够利用特定任务的结构和相关数据时，这些方法在降低通信成本方面很有用。

• Raw data encoding: 数据编码在压缩数据量中得到了广泛的应用。例如，传统的图像压缩方法(如JPEG)可以积极地压缩数据，但它们通常是从人-视觉的角度进行优化的，如果我们使用高压缩比，这将导致DNN应用程序中无法接受的性能下降。在此基础上观察,达到更高的压缩比,刘等人[128]提出优化数据编码方案从款基于频率分量的角度分析和纠正量化表,这是能够实现更高的压缩率比传统的JPEG方法没有退化图像识别的准确性。与使用标准的视频编码技术不同，在[129]中有人认为，数据收集和传输方案应该在视觉任务中联合设计，以利用预先训练的模型最大化端到端目标。具体来说，作者建议使用DNN将高维原始数据编码为一个稀疏的、潜在的表示，以实现有效的传输，这些数据稍后可以通过解码DNN在云中恢复。此外，该编码过程由一种增强学习算法控制，该算法将动作信息发送到设备进行编码，以最大限度地提高具有解码输入的预训练模型的预测精度，同时实现通信效率高的数据传输。这种新的数据编码思想是实现边缘人工智能系统实时推理的一种很有前途的解决方案。

• Cooperative downlink transmission: 协同传输[203]是一种通过多基站的主动干扰感知协调来提高通信效率的有效方法。文献[130]提出了将每个推理任务卸载到多个边缘服务器上，通过下行传输将输出结果协同传输给移动用户。智能反射面(intelligent reflection surface, IRS)[204]是一种提高无线通信网络频谱效率和能源效率的有效方法，在促进通信效率高的边缘推理方面具有广阔的应用前景[205]。它是通过一个平面阵列来重新配置无线传播环境，从而引起信号幅度和/或相位的变化。为了进一步提高[130]中合作边缘推理方案的性能，Hua等[131]提出了irs辅助边缘推理系统，并设计了任务选择策略，使上行链路和下行链路的传输功耗以及边缘服务器的计算功耗最小化。

2) Device-Edge Joint Inference: 对于许多设备上的数据，如医疗信息和用户行为，隐私是一个主要的问题。因此，通过在移动设备和强大的边缘服务器上部署分区的DNN模型，产生了边缘设备和边缘服务器协同的思想，可以称之为设备-边缘联合推理。通过在本地部署前几层，移动设备可以通过简单的处理来计算本地输出，并将本地输出传输到更强大的边缘服务器，而不会暴露任何敏感信息。

• Early exit: 在对DNNs进行分区时，可以使用Early exit来减少通信工作量，这是在[132]中提出的，其依据是观察到在网络的早期层获得的特征通常足以产生准确的推理结果。因此，如果能够对数据样本进行高可信度的推断，推理过程就可以提前退出。该技术已在[133]中用于云、边缘和设备上的分布式DNN推理。通过提前退出，每个设备首先执行DNN的前几层，如果设备的输出不满足精度要求，则将剩余的计算任务转移到边缘或云上。与将所有原始数据卸载到云中进行推理的传统方法相比，这种方法能够将通信成本降低20倍以上。最近，Li等[211]根据移动设备和边缘服务器之间的异构计算能力，联合设计模型分区策略，根据复杂的网络环境，联合设计早期退出策略，提出了按需低延迟推理框架。

• Encoded transmission and pruning for compressing the transmitted data: 在分层分布式体系结构中，主要的通信瓶颈是在分区点之间传输中间值，因为中间数据可能比原始数据大得多。为了减少中间值传输的通信开销，[134]中提出将网络划分在中间层，中间层的特征在无线传输之前进行编码以减少数据量。结果表明，在最后一个卷积层的末端对CNN进行分区，数据通信需求较少，再加上特征空间编码，可以显著减少通信工作量。最近，在[212]中提出了一种基于深度学习的端到端架构，命名为BottleNet++。通过共同考虑模型分区,功能压缩和传输,相比于只是传输中间数据没有压缩的模型，在减少不到2%的准确性下，BottleNet + +实现64 x带宽减少了加性高斯白噪声信道和256 x二进制消除信道压缩比特率。

网络修剪，已经被用于减少中间特征传输的通信开销。文献[135]提出了两步修剪方法，通过限制修剪区域来减少网络分区点的传输工作量。具体来说，第一步是减少网络的总计算量，第二步是压缩传输的中间数据。

• Coded computing for cooperative edge inference: 编码理论可以用来解决边缘人工智能系统中分布式推理的通信挑战。例如，Zhang和Simeone[136]考虑了移动边缘AI系统中的分布式线性推理，该模型被分割到几个边缘设备之间，这些边缘设备协同计算每个设备的推理结果。在[136]中显示，编码在降低总体计算加通信延迟方面是有效的。

4.5 General Edge Computing System

MapReduce[188]是一个通用的分布式计算框架，能够在训练和推理过程中对各种机器学习问题实现并行加速[213]。类mapreduce的分布式计算框架将分布式数据输入和分布式模型部署结合起来考虑。在[214]中，为了加速训练过程，基于MapReduce框架实现了卷积神经网络。Ghoting等人[215]提出了基于MapReduce框架的SystemML，以支持针对一类广泛的监督和非监督机器学习算法的分布式训练。[30]为支持基于mapreduce的分布式推理任务，提出了一种通信效率高的无线数据变换策略。

在图7所示的类mapreduce分布式计算框架中，一般分为三个阶段(即，一个map阶段，一个shuffle阶段，和一个reduce阶段)来完成一个计算任务。在map阶段，每个计算节点计算所分配数据的映射函数，同时生成许多中间值。在shuffle阶段，节点之间进行通信，以获得一些中间值来计算输出函数。随后，在reduce阶段，每个节点根据可用的中间值计算分配的输出函数。然而，在这样一个分布式计算框架中有两个主要的瓶颈。一个是在shuffle阶段的沉重的通信负载，另一个是由于不同节点上计算时间的可变性而导致的延迟。为了解决这些问题，编码被认为是一种很有前途的方法，它利用了网络边缘丰富的计算资源[137]。近年来，编码技术正在成为降低数据变换的通信成本以及通过减少掉队节点来降低计算延迟的研究热点，如下所述。

• Coding techniques for efﬁcient data shufﬂing: 类似于mapreduce的分布式计算框架中的数据变换编码技术最早在[138]中被提出，它考虑了一个有线场景，其中每个计算节点可以通过一个共享链接从其他节点获取中间值。在[29]中，作者将[138]的工作扩展到无线设置，在无线设置中，计算节点可以通过接入点彼此通信。提出了一种可扩展的数据变换方案，利用在设备之间放置中间值的特定重复模式，通过设备数量线性增长的因素来减少通信带宽。为了提高在数据转移阶段的无线通讯效率，通过建立干涉对准条件，在[30]中提出了一个低秩优化模型。低秩模型被对流函数差分(DC)算法进一步求解。[29]和[30]都考虑了具有中心节点的无线通信设置下的通信负载最小化问题。

也有一些工作是考虑在没有协调中心的无线通信场景下，如何减少数据变换中的通信负载。也就是说，计算节点之间可以通过共享的无线干扰信道进行通信。例如，在假设信道状态信息完美的情况下，[139]提出了一种基于侧信息抵消和零强迫来权衡大量计算节点以减少通信负载的波束形成策略，其性能优于基于[138]的编码TDMA广播方案。这项工作在[140]中进一步扩展，以考虑不完全信道状态信息。本文[141]针对计算结果提出了数据集缓存策略和编码传输策略。其目标是最小化以延迟(以秒为单位)而不是信道使用(以比特为单位)为特征的通信负载，后者在无线网络中更实用。在[142]中，作者指出，为了用大量的计算来交换通信负载，计算任务必须被划分为大量的子任务，这是不切实际的。因此，他们提出了通过节点协作来改善这种局限性，并设计了一种高效的任务分配方案。Prakash等人[143]研究了分布式图数据处理系统的编码计算，该系统利用图数据的结构，显著提高了与一般MapReduce框架相比的性能。

• Coding techniques for straggler mitigation: 另一个工作重点是通过编码技术解决分布式计算中的掉队问题。利用编码理论缓解掉队者的影响在[142]中首次针对有线网络提出。其主要思想是利用冗余计算节点执行计算子任务，只要收集到计算节点任意子集的局部计算结果，就可以正确地恢复计算结果。该工作扩展到无线网络[144]，在无线网络中，一次只能有一个本地计算节点将计算结果发送到融合中心。文献[145]提出了一种最小化总延迟的子任务分配方法，该方法由不同计算节点与融合中心之间的无线通信引起的延迟和不同设备计算时间变化引起的延迟组成。上述工作大部分集中在线性计算(如矩阵乘法)。然而，为了实现最先进的机器学习算法(如DNN)的分布式推理，需要考虑非线性计算。因此，文献[146]提出了一种基于学习的设计代码的方法，可以处理分布式非线性计算问题中的掉线问题。

五、总结

本文对通信挑战和解决方案进行了全面的调查，这些挑战和解决方案将在网络边缘支持大量支持人工智能的应用程序。具体来说，我们首先总结了用于边缘节点上分布式训练AI模型的通信效率算法，包括零阶、一阶、二阶和联邦优化算法。然后，我们将边缘人工智能系统的不同系统架构进行了分类，包括基于数据分区和基于模型分区的边缘训练系统。接下来，我们回顾了弥合计算卸载和边缘推断之间差距的工作。除了这些系统架构之外，我们还介绍了一般的边缘计算定义的AI系统。广泛讨论了这种体系结构中的通信问题和解决方案。

你可能感兴趣的:(Edge AI边缘智能：Communication-Efﬁcient Edge AI: Algorithms and Systems（未完待续）)

C语言中求余的作用 Ethan@LM c语言哈希算法开发语言
1.判断奇偶性求余运算常用于判断一个整数是否为偶数或奇数：偶数：n%2==0奇数：n%2!=0#includeintmain(){intnum=5;if(num%2==0){printf("%d是偶数\n",num);}else{printf("%d是奇数\n",num);}return0;}判断3的倍数：#includeintis_multiple_of_3(intn){returnn%3==0
YOLOv10改进，YOLOv10改进主干网络为GhostNetV3(2024年华为的轻量化架构，全网首发)，助力涨点挂科边缘 YOLOv10改进 YOLO 计算机视觉目标检测人工智能 python 深度学习
摘要GhostNetV3是由华为诺亚方舟实验室的团队发布的，于2024年4月发布。摘要：紧凑型神经网络专为边缘设备上的应用设计，具备更快的推理速度，但性能相对适中。然而，紧凑型模型的训练策略目前借鉴自传统模型，这忽略了它们在模型容量上的差异，可能阻碍紧凑型模型的性能提升。在本文中，通过系统地研究不同训练成分的影响，我们介绍了一种用于紧凑型模型的强大训练策略。我们发现，适当的重参数化和知识蒸馏设计对
软件工程的熵减：AI代码生成器如何降低系统复杂度前端
软件开发的世界，如同一个不断膨胀的宇宙。随着项目规模的增长，代码库日益庞大，系统复杂度也随之水涨船高。维护、扩展和协作的难度成倍增加，这如同物理学中的熵增原理一样，系统朝着混乱无序的方向发展。为了对抗这种“熵增”，我们需要寻找有效的手段，而AI代码生成器的出现，为我们提供了一种强大的武器。在传统的软件开发模式下，开发者花费大量时间处理重复性工作，例如编写大量的样板代码，这不仅效率低下，而且容易引入
一枚程序猿对AI的看法码畜sokach 人工智能
AI如何改变IT行业一、对软件开发的影响好的方面：对于程序员来说，AI可以帮你做一些简单重复的代码编写工作。比如，你要写一个功能，像登录页面的代码，以前你得一行一行敲，现在AI可以帮你写个大概，你只要修改修改，补充一些细节就行，能让你干活更快。这意味着你可以把更多时间花在设计软件更有趣、更复杂的部分，像做一个很酷炫的游戏功能，或者开发一个新的应用程序，让你能发挥更多创意，提升自己的技能。如果你是新
2024年AI浪潮：基础设施重构、模型演进与挑战并存前端
2024年，人工智能领域呈现出蓬勃发展的景象，投资持续增长、基础设施发生变革，技术应用加速落地。各大科技公司和初创企业纷纷涌入，试图在这一充满机遇的领域分一杯羹。本文将深入探讨2024年AI发展的三大核心趋势：AI基础设施的重构、模型发展的新趋势以及AI发展带来的挑战，并重点关注企业如何从AI投资中获得回报，以及AI智能体技术的巨大潜力。选择合适的AI代码生成器将成为企业提升效率的关键。AI基础设
软件安全工程：AI代码生成的风险评估与防御前端
随着软件开发需求的日益增长，提高开发效率成为重中之重。AI写代码工具的出现为软件开发带来了前所未有的机遇，它能够显著提高代码编写速度，降低开发成本。许多工具，例如ScriptEcho（轻微提及，避免过度广告），已经开始在软件开发领域发挥作用。然而，AI代码生成技术也带来了新的安全挑战，我们需要对这些风险进行全面的评估和防御，确保软件的安全性。本文将深入探讨AI代码生成的安全风险，并提出相应的防御策
小红书成立应用算法部：平衡生态与变现的战略之举前端
小红书近期将商业化、社区、电商算法部门整合，成立了全新的“应用算法部”，这一举动引发了业界广泛关注。这不仅体现了小红书对算法驱动增长的高度重视，也标志着其在平衡内容生态和商业变现之间迈出了关键一步。本文将深入探讨小红书成立应用算法部的战略意义及其对未来发展的影响，并分析其扁平化管理模式在其中的作用。作为一款以内容创作和分享为核心的平台，小红书对高效的AI写代码工具的需求日益增长，而算法的优化则成为
AI生成前端页面：解放前端开发，拥抱AI时代的高效前端
在数字时代，效率是企业和个人的核心竞争力。而对于前端开发人员来说，重复性工作和繁琐的代码编写常常成为效率提升的瓶颈。幸运的是，随着人工智能技术的飞速发展，一个新的时代已经到来——AI代码生成器（例如ScriptEcho）的出现，正以前所未有的方式改变着前端开发的格局。本文将探讨人工智能在日常应用中的广泛影响，并着重介绍如何利用AI技术，例如ScriptEcho，来提升前端开发效率，从而更好地应对当
华为OD机试C卷--手机App防沉迷系统（Java & JS & Python & C）飞码创造者华为OD机试题库华为od c语言 java javascript python
获取题库不需要订阅专栏，可直接私信我进入CSDN领军人物top1博主的华为OD交流圈观看完整题库、最新面试实况、考试报告等内容以及大佬一对一答疑。题目描述智能手机方便了我们生活的同时，也侵占了我们不少的时间。“手机App防沉迷系统”能够让我们每天合理地规划手机App使用时间，在正确的时间做正确的事。它的大概原理是这样的：1.在一天24小时内，可以注册每个App的允许使用时段2.一个时间段只能使用一
大端模式和小端模式蝌蚪123456 java开发
转载自http://blog.csdn.net/hackbuteer1/article/details/7722667在各种计算机体系结构中，对于字节、字等的存储机制有所不同，因而引发了计算机通信领域中一个很重要的问题，即通信双方交流的信息单元（比特、字节、字、双字等等）应该以什么样的顺序进行传送。如果不达成一致的规则，通信双方将无法进行正确的编/译码从而导致通信失败。目前在各种体系的计算机中通常
AI赋能职业发展：程序员的未来之路前端
程序员，这个充满挑战和机遇的职业，正站在技术浪潮的潮头。一方面，蓬勃发展的科技不断催生着新的编程语言、框架和技术，要求程序员持续学习，快速适应；另一方面，激烈的行业竞争也使得程序员需要不断提升自身技能，才能在竞争中脱颖而出。然而，AI技术的崛起为程序员的职业发展带来了新的希望，它不仅能提升效率，还能帮助程序员拓展技能，应对未来的挑战。本文将探讨AI技术，特别是像ScriptEcho这样的AI辅助工
「AI 中国」榜单揭晓，OpenBayes贝式计算入选「大模型最具潜力创业企业 TOP 10」
日前，「AI中国」机器之心2024年度评选正式揭晓，OpenBayes贝式计算有幸入选「大模型最具潜力创业企业TOP10」。作为专业的人工智能媒体与产业服务平台，机器之心于2017年发布了AI榜单「SyncedMachineIntelligenceAwards」，在随后的时间里，伴随AI的跨越式发展，机器之心的年度评选也逐渐成为了产业风向标之一，覆盖的领域、范围更加广泛，维度更加细化。机器之心20
高效员工培训：AI赋能企业发展新纪元前端
在当今竞争激烈的商业环境中，员工是企业最宝贵的资产。高效的员工培训不仅能提升员工技能，提高工作效率，更能增强企业核心竞争力，推动企业持续发展。然而，传统的员工培训模式往往存在效率低下、成本高昂、缺乏互动性等诸多问题。例如，传统的线下培训需要耗费大量时间和资源，难以满足员工个性化学习需求，培训效果评估也缺乏客观数据支撑。面对这些挑战，人工智能（AI）技术的应用为企业员工培训带来了革命性的变革，为构建
FORCE 原动力大会｜火山引擎边缘云亮点干货先知晓！人工智能边缘计算机器人
AI技术战场上，唯快不破？在经历了早期的热闹之后，AI大模型的能力和价值维度已经不再浮于表面。IDC最新发布的《中国智算服务市场（2023下半年）跟踪》报告显示，受国内生成式AI技术飞速发展的影响，GenAI（生成式AI）IaaS市场在2023年实现爆发式增长，在AI+云计算领域有双向积累的公司获得先发优势。火山引擎一跃成为GenAIIaaS领域市场份额最大的云厂商。只有真正实现大模型的深度融合，
开启智能创作新时代，GLM-4-Plus为你定制！人工智能
引言：为什么高效的内容创作如此重要？在当前竞争激烈的市场环境中，内容创作已成为品牌成功的重要支柱。无论是撰写营销文案、博客文章、社交媒体帖子，还是制作广告，优质的内容不仅能够帮助品牌吸引目标受众的注意力，还能有效促进产品和服务的转化。然而，创作高质量内容却常常需要投入大量时间和精力，这使得很多内容创作者感到力不从心。高效创作正成为现代内容创作者的迫切需求。如果你也为高效创作而苦恼，那么今天我们将为
探索AI API版本管理与流式传输实现 qwe54165a4wd 人工智能 java 数据库 python
在现代软件开发中，API版本管理是一个关键的主题，尤其是在涉及到AIAPI的场景。API版本的变更会影响到服务的稳定性和功能的兼容性。因此，理解API版本管理的基本原理和具体实现，对于开发者来说至关重要。技术背景介绍API版本管理涉及到如何在不破坏现有客户端代码的情况下，逐步引入新的功能和改进。这对于AI服务尤为重要，因为AI模型和算法的更新频率相对较高。本文将重点介绍AIAPI版本的管理原则，并
OpenBayes贝式计算创始人受邀参加第九届中国开源年会，分享 AI4S 前沿洞察
OpenSource，OpenLife，开源新生活！由开源社主办的第九届中国开源年会(COSCon'24)于2024年11月3日在北京圆满落幕。本届大会为期2天，以「开源新生活-OpenSource,OpenLife」为主题，汇聚了来自全国各地的技术精英、开源爱好者、行业领袖和媒体代表，共同见证了开源技术如何融入日常生活，推动社会进步。超过1,000余人次到达现场，在线直播观看人数总计120,92
洞见数据未来，StarRocks Summit Asia 2024 即将启幕！人工智能data
在AI时代，我们需要怎样的数据基础软件？数据量和数据类型的需求飞速上涨，我们不仅需要将历史上各种基础设施中的数据进行分析使用，还要关注性能、灵活性、性价比，以及确保单一可信数据源。这一切构成了当前大数据领域的核心难题。今年12月，StarRocksSummitAsia重磅启动！作为年度数据盛会，我们将从用户、平台方、业务领袖和技术极客等不同视角展开交流，携手共建未来的数据解决方案。本届峰会，我们将
加密DNS有什么用？域名dns服务器
在当今数字化高速发展的时代，网络安全和隐私保护成为人们日益关注的焦点。而加密DNS作为一种新兴的技术手段，正逐渐发挥着重要的作用。首先我们先来了解下什么是加密DNS，它究竟是什么？加密DNS（DomainNameSystem），简单来说，是一种对域名系统的查询和响应进行加密保护的技术。加密DNS的出现，使得用户的域名查询更加安全和隐私，减少了因DNS信息泄露而导致的各种网络安全风险。加密DNS有什
OpenVoiceV2：零样本跨语言语音克隆技术，支持多种风格控制智慧医疗 AIGC 语音识别人工智能语音克隆
1openvoicev2介绍语音克隆技术近年来取得了显著进展，但现有方法通常存在着局限性，例如无法灵活控制语音风格、需要大量多语言数据进行训练、生成速度慢等等。为了克服这些挑战，MyShell.ai团队推出了全新的语音克隆技术OpenVoiceV2，它能够在无需额外训练的情况下，仅凭少量参考音频，就能够克隆任何人的声音，并支持多种语音风格控制，以及快速高效的跨语言语音生成。论文地址：http://
2017-SIGGRAPH-Google,MIT-(HDRNet)Deep Bilateral Learning for Real-Time Image Enhancements WX Chen HDR技术深度学习神经网络机器学习
双边网格本质上是一个可以保存边缘信息的3维的数据结构。对于一张2维图片,在2维空间中增加了一维代表像素的强度slice操作(上采样)BilateralGuidedUpsampling这篇文章用双边网格实现图像的操作算子的加速。算法的核心思想是将一幅高分辨率的图像通过下采样转换成一个双边网格,在双边网格中每个格子就是一个图像的仿射变换算子,它的原理是在空间与值域相近的区域内,相似输入图像的亮度经算子
华为OD机试 - 手机App防沉迷系统（Python/JS/C/C++ 2024 D卷 100分）哪吒华为od python javascript 算法七日集训
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述智能手机方便了我们生活的同时，也侵占了我们不少的时间。“手机Ap
探索未来视频创作：Tune-A-Video项目深度解析刘通双Elsie
探索未来视频创作：Tune-A-Video项目深度解析Tune-A-Video[ICCV2023]Tune-A-Video:One-ShotTuningofImageDiffusionModelsforText-to-VideoGeneration项目地址:https://gitcode.com/gh_mirrors/tu/Tune-A-Video在数字艺术与人工智能的交汇点上，Tune-A-Vi
使用LangChain构建简单LLM翻译应用 fGVBSAbe langchain java 前端 python
技术背景介绍在本教程中，我们将学习如何使用LangChain构建一个简单的语言模型（LLM）应用程序，该应用程序用于将文本从英语翻译成其他语言。虽然这个应用程序比较简单，但它是学习LangChain的一个不错的开始，因为许多复杂功能都可以通过简单的提示和LLM调用构建。核心原理解析LangChain通过链式调用多个组件，使得复杂的语言处理任务变得简单易行。我们将使用LangChain的以下功能：语
Chatgpt国内镜像网站｜最容易懂的 ChatGPT 介绍与教学指南【2025年1月更新】
最新更新日期：2025年1月20日这是一份全方位的指南，帮助您轻松使用ChatGPT中文版，无需科学上网即可体验GPT-4的全部功能！在本文中，您将了解如何通过推荐的镜像网站访问ChatGPT中文版、注册使用的具体步骤，以及常见问题的解答。什么是ChatGPT中文版？ChatGPT中文版是OpenAI专为中文用户量身定做的智能对话工具，旨在提供更加顺畅且精准的中文交流体验。与国际版相比，ChatG
021：为什么是卷积呢？董董灿是个攻城狮计算机视觉保姆级教程人工智能计算机视觉 CNN
本文为合集收录，欢迎查看合集/专栏链接进行全部合集的系统学习。合集完整版请查看这里。卷积算法非常重要，但是为什么是卷积呢?在进一步学习之前，先看一看神经网络(或者叫一个AI模型)是如何完成一张图片的推理的。你肯定听说过阿尔法狗大战柯洁的故事，当时新闻一出，不知大家什么反应，反正我是被震撼到了：AI模型竟然学到了那么多的棋谱，而且人类在AI的面前毫无还手可言。但是，你有没有想过一个问题：阿尔法狗学会
AI Agent的技术选型：从个人项目到企业级应用人工智能机器学习
说实话，每次有人问我"开发AIAgent应该用什么技术栈？"，我都觉得挺难回答的。因为不同的场景，最佳的技术选择可能完全不同。今天就来聊聊我在不同项目中的技术选型经历，希望能给大家一些参考。从个人项目说起去年我开始研究AIAgent的时候，第一个练手项目是给自己做一个代码助手。需求很简单：能读懂我的项目代码，帮我重构和写测试。那时候，我的技术选型是这样的：模型选择：OpenAIGPT-3.5便宜，
软件工程的熵减：AI代码生成器如何降低系统复杂度前端
软件开发的世界，如同一个不断膨胀的宇宙。随着项目规模的增长，代码库日益庞大，系统复杂度也随之水涨船高。维护、扩展和协作的难度成倍增加，这如同物理学中的熵增原理一样，系统朝着混乱无序的方向发展。为了对抗这种“熵增”，我们需要寻找有效的手段，而AI代码生成器的出现，为我们提供了一种强大的武器。在传统的软件开发模式下，开发者花费大量时间处理重复性工作，例如编写大量的样板代码，这不仅效率低下，而且容易引入
2024年美国App Store下载榜单：AI代码生成器助力Temu蝉联冠军背后的秘密前端
2024年美国区AppStore下载榜单揭晓，Temu再次蝉联免费应用下载榜冠军，这已经是它连续两年取得的辉煌成就！紧随其后的是Threads和TikTok，而ChatGPT更是以黑马之姿超越Google，位列第四。这份榜单不仅反映了美国用户的应用偏好，更折射出2024年移动应用市场的几大关键趋势。本文将深入分析Temu、Threads、ChatGPT等热门应用的成功秘诀，并探讨未来AppStor
AI驱动的翻译工具：自动化处理 Univer Sheets 单元格内容翻译
背景随着工作和学习的全球化，跨语言的沟通变得尤为重要。对于使用电子表格进行数据处理和分析的用户来说，表格中的内容可能涉及不同的语言。尤其是在处理多语言数据时，翻译表格内容成为了一个高频的需求。传统的翻译方法可能需要手动复制粘贴，或者依赖外部工具，这样的方式既繁琐又浪费时间。为了解决这个问题，我们开发了一个基于AI的自动翻译工具——AICellTranslator，它能在UniverSheets中自
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息