librahfacebook

端边云协作推理相关论文总结

Papers About End-Edge-Cloud Collaborative Inference

文章目录

Papers About End-Edge-Cloud Collaborative Inference
- Part 1: Edge Computing
- Part 2: Model Compressing
- Part 3: Reinforcement Learning
- References

Part 1: Edge Computing

Neurosurgeon¹是一个轻量级的调度程序，可以在神经网络层的细粒度上自动划分移动设备和数据中心的DNN计算。基于DNN层的类型和配置，我们开发了一系列模型来预测其延迟和功耗，并创造了Neurosurgeon，来作为一个智能化地划分在移动设备和云之间的DNN计算的系统。Neurosurgeon配置移动设备和服务器，为DNN层类型的频谱生成性能预测模型。在部署阶段，它为每种层类型生成预测模型，对任意神经网络结构的每层延迟和能耗来进行建模；在运行时阶段，它基于每个层的类型和配置来预测每层的延迟和能耗代价，然后基于不同因素选择最好的划分点。
Edgent²是一个移动设备和边缘协同作用的DNN协同推理框架。它主要包含两个关键点：(1)自适应地将DNN计算划分在设备和边缘之间的DNN分区，利用不同的计算资源来进行实时的DNN推理；(2)利用BranchyNet的思想，通过在适当的中间DNN层添加分支提前退出来加速DNN推理，从而进一步降低计算延迟。Edgent由三个阶段组成：离线训练阶段、在线优化阶段和协作推理阶段。在离线训练阶段，Edgent主要执行两个初始化：(1)分析移动设备和边缘服务器来生成对不同类型DNN层的基于回归的性能预测模型；(2)训练带有不同退出点的DNN模型，使部分样本可以提前退出来加速DNN推理。在在线优化优化阶段，DNN优化器选择DNNs的最佳划分点和早期退出点，从而使精度最大化，同时保证端到端的延迟性能。在协作推理阶段，根据划分和早期退出计划，移动设备和边缘服务器执行网络层推理任务。
AdaComp³是一种用于压缩worker对服务器模型更新的最新算法，它结合了有效的梯度选择和学习率调整，适用于随机梯度下降的方法。它是在参数服务器模型(PS)中将随机梯度下降(SGD)分布到大量workers上的一种方法，即灵活地通过自适应压缩在边缘设备上进行分布式深度学习。其中，PS与其他每个节点通信来维护一个中心模型，其他节点都是workers，它们使用本地数据来计算中心模型的更新，并且在发送前更新都被压缩过。另外，边缘节点也扮演了监督者的角色，它包含了一个测试数据集用来计算中心模型的准确性。
本文⁴提出了一种基于深度的CNN模型输入分区方案，克服了目前行列和网格分区方案的困难之处，同时强调了当前卷积层的输入和输出深度在分布式执行实现过程中的加速作用。在该项工作中，我们分割了一个图像和一个过滤器，它们沿着深度维度分布在Fog资源中，我们还将所有的过滤器分配到资源中，使其分区是无损失的。
Task Scheduling⁵来优化加权数据传输时间，同时保证可承受的精度损失。我们基于端边云架构来描述一个边缘学习框架，对于每个终端设备，这里有一个或几个边缘服务器可以被访问。在数据被上传到云用来主神经网络训练前，需要被卸载到一个可访问边缘服务器来做预学习或预处理。另外，该边云学习系统将提供一个合适的调度方案来安排终端设备到一个边缘服务器，使在边缘服务器的资源可以被有效利用。其workflow由两个阶段组成，分别是调度处理阶段和边云系统的深度学习处理阶段。对于加权数据传输时间优化的任务调度算法，有两种算法：基于极值点线性规划解决方案的舍入算法和模拟退火重排算法。
Edge Intelligence⁶对边缘智能的最先研究成果进行了全面调查，首先回顾了在边缘运行的人工智能应用程序的背景和动机，然后提供了一个在边缘的深度学习模型训练/推理的总体架构、框架和出现的关键技术，最终讨论了在边缘智能上未来的研究机遇。边缘智能模型推理架构可以分为以下几种：（1）Edge-based（DNN模型推理在边缘服务器完成，预测结果将返回到设备中）；（2）Device-based（移动设备从边缘服务器获取DNN模型，并在本地执行模型推理）；（3）Edge-device（设备执行DNN模型到一个特定层后将中间数据发送到边缘服务器，边缘服务器将执行剩余层并将预测结果发送到设备上）；（4）Edge-cloud（设备主要负责输入数据收集，DNN模型则在边缘和云上执行）。
Edge-Cloud Model⁷是一个在边缘和云上协作的处理模型，来进行实时视频处理。所用到的技术主要包括：（1）划分（Splitting）：神经网络被划分到一个边缘分区和一个云分区；（2）压缩（Compression）：数据在被发送到云之前先在边缘被压缩；（3）通信差异（Differential communication）：只发送当前帧和先前帧的差异。验证中被评估的性能度量包括：（1）延迟（Latency）：处理图像和在边缘应用NN技术的时间；（2）压缩比（Compression ratio）：原始图像和压缩图像大小的比例；（3）精度（Accuracy）：原始神经网络检测到的图像中被应用技术后神经网络中检测到的比例。该验证旨在提供一个关于集合NN技术和正确配置意义的挑战和权衡。
分布式DNN架构⁸在设计过程中将传感目标和网络带宽限制看作第一要素，学习端到端如何表示原始传感数据，从而可以很好地适应传感设备和云之间的不同网络带宽。它利用边缘设备上的浅层神经网络动态地压缩有用数据，在数据中心的深层神经网络对其进行解压缩，并根据数据相关性向边缘编码器提供积极的反馈。其系统的主要组成部分为：(1)分布式边缘编码器；(2)物理网络链接；(3)集中式编码器；(4)预训练决策模型；(5)动态特征选择代理；(6)从数据中心到边缘设备的反馈。
NestDNN⁹作为一个将运行资源的动态性考虑在内的框架，对于移动视觉系统可支持资源感知性多租用的设备深度学习。它支持每个深度学习模型来提供灵活的资源和精度之间的权衡，并且在运行期间动态地为每个深度学习模型选择最优的资源和精度间的权衡，从而更好地适应系统可用运行资源的需求。NestDNN被划分成一个离线阶段和一个在线阶段，其中离线阶段由三部分组成，分别是模型剪枝、模型复原和模型分析，在线阶段则为每个应用程序选择最优的派生模型，然后分配最优的运行资源数量到每个所选的派生模型，从而最大化总体推理精度并最小化总体推理延迟。
Adapt CNNs¹⁰是一种用于能量受限的图像分类任务的自适应神经网络设计，所做工作的关键点是CNNs体系架构设置和网络选择问题被看作超参数来进行全局优化，并增强了贝叶斯优化到所设计空间的特性中，可以更快地到达邻近最优的区域，最优设计可以通过网格搜索被确定。我们考虑了以下两种情况：(1)所有的CNNs在移动系统上本地执行，其表示为local；(2)较少复杂的网络被部署在移动系统(边缘节点)，而更精确的网络在一个服务器上执行(远程执行)。自适应网络执行过程：给定一个要被分类的图像，神经网络 $N_1$ 总是要被首先执行，接下来一个决策函数 $k$ 被评估来决定从 $N_1$ 执行后的分类结果应当被返回作为最终结果，或者到下一个网络 $N_2$ 来被执行。一般来说，我们将决策函数 $k_{i,j}$ 表示为： $N_i(x) \rightarrow \{0,1\}$ ，从而来提供置信度反馈，以及决定在状态 $N_i(k_{i,j}=0)$ 退出或者在接下来的阶段 $N_j(k_{i,j}=1)$ 继续执行。

Part 2: Model Compressing

Pruning算法¹¹通过只学习重要连接而不影响精度，来减少神经网络所要求的内存和计算资源。该方法使用三个步骤来减去冗余连接：第一是训练网络来学习重要的连接；第二是减去不重要的连接；第三是重新训练该网络来微调剩余连接的权值。其剪枝过程由两个阶段组成，第一个阶段是：学习网络的拓扑结构，学习重要连接并移除不重要连接；第二个阶段是：重新训练稀疏网络，从而使剩余连接仍可以补偿已被移除的连接。剪枝和重训练阶段可以迭代式重复进行，从而进一步减少网络的复杂性。.
Deep Compression¹²由三个阶段组成：pruning(剪枝)、trained quantization(训练量化)和Huffman coding(霍夫曼编码)，它们一起工作来减少神经网络的存储要求并且不影响精度损失。一个三阶段步骤来减少神经网络所要求的存储，同时保持原有的精度。首先，我们通过移除冗余连接来修剪网络，只保持最有信息价值的连接。然后，权重被量化从而使多个连接共享相同的权重，于是只有codebook（有效权重）和索引需要被存储。最后，我们使用霍夫曼编码，来充分利用有效权重的偏置分布。
Channel Pruning¹³是一种用于加速深度神经网络的通道剪枝方法，它直接地减少特征映射宽度，将一个网络进行缩减。我们通过两个步骤来解决问题：(1)通道选择，选择最有代表性的通道，然后基于LASSO回归剪去冗余的通道；(2)特征映射重建，利用最小二乘法对剩余通道输出进行重构。对于优化问题的具体解决步骤，我们将其分解为 $\beta$ 子问题和 $W$ 子问题，前者固定 $W$ 值，求解 $\beta$ 来进行通道选择；后者固定 $\beta$ 值，利用选择好的通道求解 $W$ 来最小化重构误差。

Part 3: Reinforcement Learning

DQN¹⁴可以使用端到端的强化学习，直接从高维度传感输入中学习到成功的策略。Deep Q-network能够将深度神经网络与强化学习进行结合。我们考虑一类任务，代理可以通过一系列观察、行动和奖励来进行交互，代理的目标是以某种方式选择动作，来最大化累积未来奖励。我们使用深度卷积神经网络来接近最优action-value函数，在做过一个观察(s)和一个动作(a)后，由一个行为策略 $\pi=P(a|s)$ 来实现时间步骤t的最大化累积奖励。DQN中使用两个关键技术：(1)使用experience replay来随机化数据，从而消除观察序列中的相关性；(2)使用一种迭代式更新来调整action-value(Q)为只定期更新的目标值，从而降低了与目标的相关性。其Q-learning的更新公式为： $Q^*(s,a)=Q(s,a)+\alpha(r+\gamma \max \limits_ a'Q(s',a')-Q(s,a))$ 。
本文¹⁵我们使用一个递归网络来生成神经网络的模型描述，并利用强化学习来训练RNN，从而最大化在验证集上的生成架构的期望精度。它是一种基于梯度的方法来寻找良好的架构，使用一个递归网络作为控制器，在真实数据上训练指定网络会导致验证集上的准确性，然后使用准确性作为奖励信号，通过计算策略梯度来更新控制器。最终在下一个迭代过程中，控制器将对接收到的高精度架构有着更高的概率，随着时间推移控制器可以学习改进其搜索。

References

Kang Y, Hauswald J, Gao C, et al. Neurosurgeon: Collaborative intelligence between the cloud and mobile edge[C]//ACM SIGARCH Computer Architecture News. ACM, 2017, 45(1): 615-629. ↩︎
Li E, Zhou Z, Chen X. Edge intelligence: On-demand deep learning model co-inference with device-edge synergy[C]//Proceedings of the 2018 Workshop on Mobile Edge Communications. ACM, 2018: 31-36. ↩︎
Hardy C, Le Merrer E, Sericola B. Distributed deep learning on edge-devices: feasibility via adaptive compression[C]//2017 IEEE 16th International Symposium on Network Computing and Applications (NCA). IEEE, 2017: 1-8. ↩︎
Dey S, Mukherjee A, Pal A, et al. Partitioning of cnn models for execution on fog devices[C]//Proceedings of the 1st ACM International Workshop on Smart Cities and Fog Computing. ACM, 2018: 19-24. ↩︎
Huang Y, Zhu Y, Fan X, et al. Task scheduling with optimized transmission time in collaborative cloud-edge learning[C]//2018 27th International Conference on Computer Communication and Networks (ICCCN). IEEE, 2018: 1-9. ↩︎
Zhou Z, Chen X, Li E, et al. Edge Intelligence: Paving the Last Mile of Artificial Intelligence with Edge Computing[J]. arXiv preprint arXiv:1905.10083, 2019. ↩︎
Grulich P M, Nawab F. Collaborative edge and cloud neural networks for real-time video processing[J]. Proceedings of the VLDB Endowment, 2018, 11(12): 2046-2049. ↩︎
Chinchali S P, Cidon E, Pergament E, et al. Neural networks meet physical networks: Distributed inference between edge devices and the cloud[C]//Proceedings of the 17th ACM Workshop on Hot Topics in Networks. ACM, 2018: 50-56. ↩︎
Fang B, Zeng X, Zhang M. Nestdnn: Resource-aware multi-tenant on-device deep learning for continuous mobile vision[C]//Proceedings of the 24th Annual International Conference on Mobile Computing and Networking. ACM, 2018: 115-127. ↩︎
Stamoulis D, Chin T W R, Prakash A K, et al. Designing adaptive neural networks for energy-constrained image classification[C]//Proceedings of the International Conference on Computer-Aided Design. ACM, 2018: 23. ↩︎
Han S, Pool J, Tran J, et al. Learning both weights and connections for efficient neural network[C]//Advances in neural information processing systems. 2015: 1135-1143. ↩︎
Han S, Mao H, Dally W J. Deep compression: Compressing deep neural networks with pruning, trained quantization and huffman coding[J]. arXiv preprint arXiv:1510.00149, 2015. ↩︎
He Y, Zhang X, Sun J. Channel pruning for accelerating very deep neural networks[C]//Proceedings of the IEEE International Conference on Computer Vision. 2017: 1389-1397. ↩︎
Mnih V, Kavukcuoglu K, Silver D, et al. Human-level control through deep reinforcement learning[J]. Nature, 2015, 518(7540): 529. ↩︎
Zoph B, Le Q V. Neural architecture search with reinforcement learning[J]. arXiv preprint arXiv:1611.01578, 2016. ↩︎

强化学习 16G实践以下是基于CQL（Conservative Q-Learning）与QLoRA（Quantized Low-Rank Adaptation）结合的方案相关开源项目及资源，【ai技】行云流水AI笔记开源人工智能
根据你提供的CUDA版本（11.5）和NVIDIA驱动错误信息，以下是PyTorch、TensorFlow的兼容版本建议及环境修复方案：1.版本兼容性表框架兼容CUDA版本推荐安装命令（CUDA11.5）PyTorch11.3/11.6pipinstalltorchtorchvisiontorchaudio--extra-index-urlhttps://download.pytorch.org/
大模型RLHF强化学习笔记（一）：强化学习基础梳理Part1 Gravity! 大模型笔记大模型 LLM 算法机器学习强化学习人工智能
【如果笔记对你有帮助，欢迎关注&点赞&收藏，收到正反馈会加快更新！谢谢支持！】一、强化学习基础1.1Intro定义：强化学习是一种机器学习方法，需要智能体通过与环境交互学习最优策略基本要素：状态（State）：智能体在决策过程中需要考虑的所有相关信息（环境描述）动作（Action）：在环境中可以采取的行为策略（Policy）：定义了在给定状态下智能体应该选择哪个动作，目标是最大化智能体的长期累积奖
【RAG面试题】LLMs已经具备了较强能力,存在哪些不足点? 一叶千舟 AI面试题【RAG】RAG
目录LLMs核心不足点1、知识过时与静态性（LackofReal-Time&DynamicKnowledge）：2、幻觉与事实性错误（Hallucinations&FactualInaccuracies）：3、领域专业知识深度不足（LimitedDomain-SpecificExpertise）：4、缺乏透明度和可追溯性（LackofTransparency&Traceability）：5、上下文
RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用 ApacheDubbo spring 人工智能架构 Spring AI RAG
>夏冬,SpringAIAlibabaContributorRAG简介什么是RAG（检索增强生成）RAG（RetrievalAugmentedGeneration，检索增强生成）是一种结合信息检索和文本生成的技术范式。核心设计理念RAG技术就像给AI装上了「实时百科大脑」，通过先查资料后回答的机制，让AI摆脱传统模型的"知识遗忘"困境。️四大核心步骤1.文档切割→建立智能档案库核心任务:将海量文档
中国计算机学会（CCF）推荐学术会议-C（软件工程/系统软件/程序设计语言）：FPT 2025 爱思德学术 AI编程极限编程重构
FPT2025FPTisthepremierconferenceintheAsia-Pacificregiononfield-programmabletechnologies,reconfigurablecomputingdevicesandsystems.Field-programmabledevicesoffertheflexibilityofsoftwarewiththeperformanc
LLMs基础学习（八）强化学习专题（7）汤姆和佩琦 NLP 学习 Actor-Critic 算法
LLMs基础学习（八）强化学习专题（7）文章目录LLMs基础学习（八）强化学习专题（7）Actor-Critic算法基础原理算法流程细节算法优缺点分析算法核心总结视频链接：https://www.bilibili.com/video/BV1MQo4YGEmq/?spm_id_from=333.1387.upload.video_card.click&vd_source=57e4865932ea6c
强化学习-双臂老虎机 transuperb 强化学习人工智能
本篇文章模拟AI玩两个老虎机，AI需要判断出哪个老虎机收益更大，然后根据反馈调整对于不同老虎机的价值判断，如果把这个看作一个简单的强化学习的话，那么AI就是agent，两个老虎机就是environment，AI首先会对两台老虎机有一个预测值Q，预测哪一个的价值高，然后AI通过策略函数判断应该选择哪个老虎机，进行Action后根据Reward更新每个老虎机的价值Value，然后再进行下一次判断，直到
Chromium 136 编译指南 Ubuntu篇：环境搭建与源码获取（一）守城小轩浏览器开发指纹浏览器浏览器开发 chrome chrome devtools 超级浏览器
1.引言随着Web技术的飞速发展和应用场景的不断拓展，浏览器引擎的重要性日益凸显。Chromium作为现代浏览器生态系统的核心引擎，不仅驱动着全球超过70%的网络流量，更是众多知名浏览器如GoogleChrome、MicrosoftEdge、Opera以及新兴的Brave等产品的技术基石。其卓越的渲染性能、先进的安全机制和高度模块化的架构设计，使得越来越多的开发者希望基于Chromium进行深度定
ROS2 强化学习：案例与代码实战芯动大师 ROS2学习目标检测人工智能
一、引言在机器人技术不断发展的今天，强化学习（RL）作为一种强大的机器学习范式，为机器人的智能决策和自主控制提供了新的途径。ROS2（RobotOperatingSystem2）作为新一代机器人操作系统，具有更好的实时性、分布式性能和安全性，为强化学习在机器人领域的应用提供了更坚实的基础。本文将通过一个具体案例，深入探讨ROS2与强化学习的结合应用，并提供相关代码实现。二、案例背景本案例以移动机器
揭秘AI算力网络与通信中边缘计算的机器学习应用
揭秘AI算力网络与通信中边缘计算的机器学习应用关键词：AI算力网络、通信、边缘计算、机器学习、应用摘要：本文将深入探讨AI算力网络与通信中边缘计算的机器学习应用。我们会先介绍相关背景知识，接着解释核心概念，分析它们之间的关系，阐述核心算法原理和操作步骤，结合数学模型举例说明，通过项目实战展示代码实现与解读，探讨实际应用场景，推荐相关工具和资源，最后展望未来发展趋势与挑战。希望通过这篇文章，能让大家
解析AI算力网络与通信领域强化学习的算法 AI算力网络与通信 AI人工智能与大数据技术 AI算力网络与通信原理 AI人工智能大数据架构人工智能网络算法 ai
解析AI算力网络与通信领域强化学习的算法：从"快递员找路"到"智能网络大脑"关键词：AI算力网络、通信领域、强化学习、马尔可夫决策、资源调度摘要：本文将用"快递物流系统"的类比，带您理解AI算力网络与通信领域如何通过强化学习实现智能决策。我们会从核心概念讲起，逐步拆解强化学习在网络资源调度中的算法原理，结合Python代码实战，最后探索其在5G/6G、边缘计算等场景的应用。即使您没学过复杂数学，也
18、探索边缘计算与面向能力的架构 info6 边缘计算面向能力的架构 COA
探索边缘计算与面向能力的架构1.边缘计算的定义与特性边缘计算是指在数据生成或消费的上下文中进行计算。这种计算方式与云计算有着本质的区别，云计算将计算资源与物理上下文解耦，以便在不同的场景中高效共享。边缘计算则紧密耦合于物理环境，旨在提供即时响应，处理现实世界的数据。边缘计算的关键特性边缘计算具有以下几个关键特性：上下文中的计算：边缘计算强调与物理世界的联系，响应物理世界的数据，通常旨在提供即时响应
深入解析PCDN：边缘计算与内容分发的结合数据库
深入解析PCDN：边缘计算与内容分发的结合在当今数字化时代，互联网流量的快速增长对传统内容分发网络（CDN）提出了更高要求。为了优化宽带流量的分配、降低延迟并提升用户体验，PCDN（P2PCDN）应运而生，它结合了边缘计算与分布式内容分发技术，成为新一代网络加速方案。PCDN的核心原理PCDN的核心在于利用边缘节点的计算和存储能力，将内容分发下沉至靠近用户的终端设备。与传统的CDN依赖中心化服务器
AI时代下的架构设计：从传统到智能化的技术演进
作者：蓝葛亮发布时间：2025年6月关键词：架构设计、AI原生、微服务、云原生、MLOps文章目录第一章：AI架构设计概述第二章：AI原生应用架构模式第三章：微服务在AI系统中的演进第四章：云原生AI架构实践第五章：MLOps与LLMOps工程化第六章：边缘计算与AI融合架构第七章：数据架构的AI化转型第八章：AI架构安全与治理第九章：性能优化与可扩展性第十章：行业案例与最佳实践第一章：AI架构设
大模型——Dify：知识库与外部知识库不二人生大模型人工智能大模型 dify
Dify：知识库与外部知识库相比于AI大模型内置的静态预训练数据，知识库中的内容能够实时更新，确保LLM可以访问到最新的信息，避免因信息过时或遗漏而产生的问题。知识库与文档开发者可以通过此方式确保LLM不仅仅依赖于训练数据中的知识，还能够处理来自实时文档和数据库的动态数据，从而提高回答的准确性和相关性。https://docs.dify.ai/zh-hans/guides/knowledge-ba
AI 在自动驾驶路径规划中的深度强化学习优化 QuantumWalker 人工智能自动驾驶机器学习
```htmlAI在自动驾驶路径规划中的深度强化学习优化在当今快速发展的科技领域中，人工智能（AI）的应用正在不断拓展其边界。特别是在自动驾驶技术中，AI的应用已经从简单的感知和识别发展到了复杂的决策和控制阶段。其中，深度强化学习作为AI的一个重要分支，在自动驾驶路径规划中发挥着越来越重要的作用。一、深度强化学习简介深度强化学习是一种结合了深度学习和强化学习的机器学习方法。它通过让智能体在环境中进
knowledge-vue2项目（Electron）打包为PC桌面应用程序岂不闻 learn or imporve electron javascript 前端
1.使用nvm管理node版本不同的项目开发需要的node版本环境不一样,所以需要使用nvm进行版本管理。关键命令:（1）检查nvm版本号是否安装成功nvm-v（2）检查所有node版本号nvmls（3）安装指定node版本16nvminstall16.18.1（4）使用对应的node版本nvmuse16.18.1（5）检查当前node版本是否正确node-v相关参考博客：nvm安装(降低node
Selenium自动化测试实战：从入门到精通（附真实案例）
文章目录一、为什么选择Selenium？1.1环境准备三步走二、实战案例：电商网站登录测试2.1基础版脚本2.2进阶技巧三、高级应用：动态数据抓取四、文件上传的终极解决方案4.1改良版代码五、常见问题排雷指南六、最佳实践建议七、总结一、为什么选择Selenium？（敲黑板）在自动化测试领域，Selenium绝对是当之无愧的王者！它支持多种浏览器（Chrome/Firefox/Edge等）、跨平台运
深度学习学习指南努力的Lorre 深度学习人工智能
本帖子将以本书的逻辑和顺序做一个梳理：CS基础->AI算法->模型压缩->异构计算->AI框架->AI编译器《DeepLearningSystems》(https://deeplearningsystems.ai/)CS基础推荐书单所需的编程语言(C/C++、Python)就不多讲了，数据结构算法也是大学基础课程，不多赘述。对于操作系统需要多了解，推荐多看一看《深入理解计算机系统》(传说中的面试圣
Python Selenium打开Edge报错 SessionNotCreatedException: probably user data directory is already in use samiya python selenium edge
fromseleniumimportwebdriverdriver=webdriver.Edge()driver.get('https://www.baidu.com/')初学selenium就遇到报错，倒在第一步orzselenium.common.exceptions.SessionNotCreatedException:Message:sessionnotcreated:probablyus
k8s云原生技术栈(脑图) 晴空06 云原生 kubernetes 容器
Kubernetes(K8s)是一种开源的容器编排引擎，用于自动化应用程序容器的部署、扩展和操作。它由Google设计并捐赠给CloudNativeComputingFoundation（CNCF）进行维护。Kubernetes提供了一个强大的平台，用于构建和管理容器化应用程序的解决方案。K8s基础概念Kubernetes集群架构Master节点组件APIServerKubernetesAPI服务
大模型·知识蒸馏·学习笔记小先生00101 笔记人工智能神经网络机器学习自然语言处理深度学习语言模型
第一部分：核心概念入门1.1什么是知识蒸馏？核心问题:深度学习模型（如大型神经网络）虽然性能强大，但其巨大的参数量和计算需求使其难以部署到手机、嵌入式设备等资源受限的平台。核心思想:知识蒸馏是一种模型压缩和优化的技术，其灵感来源于“教师-学生”范式。我们先训练一个复杂但性能强大的“教师模型”，然后利用这个教师模型来指导一个轻量级的“学生模型”进行学习。生动的比喻(Hinton,2015):这个过程
【unitrix】 4.5 库文件介绍（readme.md） liuyuan77 我的unitrix库 rust
unitrix·单位算阵Unitrix:Normalizedphysicalunitmanagementand2Dgeometrycomputingthroughconstifiedmatrices.Deliverszero-costabstractionswithno_stdsupport.单位算阵：通过常量化矩阵实现物理量单位化与2D几何计算规范化。提供零成本抽象，支持no_std环境。Key
强化学习实战：从 Q-Learning 到 PPO 全流程荣华富贵8 程序员的知识储备2 程序员的知识储备3 人工智能算法机器学习
1引言随着人工智能的快速发展，强化学习（ReinforcementLearning,RL）凭借其在复杂决策与控制问题上的卓越表现，已成为研究与应用的前沿热点。本文旨在从经典的Q-Learning算法入手，系统梳理从值迭代到策略优化的全流程技术细节，直至最具代表性的ProximalPolicyOptimization（PPO）算法，结合理论推导、代码实现与案例分析，深入探讨强化学习的核心原理、算法演
基于CTDE MAPPO的无线通信资源分配强化学习实现 pk_xz123456 仿真模型深度学习算法 lstm 人工智能 rnn 深度学习开发语言
基于CTDEMAPPO的无线通信资源分配强化学习实现摘要本文提出了一种基于集中训练分散执行(CTDE)框架的多智能体近端策略优化(MAPPO)方法，用于解决无线通信网络中的资源分配问题。我们设计了一个多基站协作环境，其中每个基站作为独立智能体，通过分布式决策实现网络吞吐量最大化。实验结果表明，MAPPO算法在频谱效率和用户公平性方面显著优于传统启发式算法。1.引言1.1研究背景随着5G/6G通信技
大语言模型的通用局限性与全球技术演进止观止人工智能大语言模型语言模型人工智能自然语言处理
基于行业最新数据修订（2025Q2）一、知识截止期：全球模型的进化差异所有LLM都存在知识截止期（KnowledgeCut-off），即模型训练数据的时间上限。这在技术迭代飞快的软件开发领域尤为致命——2023年后发布的Python3.12新特性、React18的并发渲染等更新，旧模型可能完全遗漏。核心局限：传统LLM训练数据存在硬性断点（如GPT-4截止至2023年9月）模型知识截止期更新方案G
万级K8s集群背后etcd稳定性及性能优化实践「已注销」云计算容器 kubernetes etcd docker
背景与挑战随着腾讯自研上云及公有云用户的迅速增长，一方面，腾讯云容器服务TKE服务数量和核数大幅增长,另一方面我们提供的容器服务类型（TKE托管及独立集群、EKS弹性集群、edge边缘计算集群、mesh服务网格、serverlessknative）也越来越丰富。各类容器服务类型背后的核心都是K8s，K8s核心的存储etcd又统一由我们基于K8s构建的etcd平台进行管理。基于它我们目前管理了千级e
电脑小白速成：5分钟变高手晨曦543210 计算机基础
第一步：先搞懂这5个最常用的东西开关机按钮（别笑！90%的人不会正确关机）正确操作：点开始菜单→电源→关机（别直接按电源键！）进阶知识：长按电源键5秒=强制关机（死机时才用）文件管理（你的电脑像垃圾堆？）马上做：1.桌面右键→新建文件夹→改名「我的文件」2.把桌面上所有文档拖进去懒人技巧：按Ctrl+Shift+N秒建文件夹浏览器（别再装360了！）装这两个就够了：Chrome（直接下）Edge（
Google Maps×亚矩阵云手机：重构跨境场景的地理服务新范式云云321 矩阵智能手机重构自动化线性代数网络游戏
在全球化与数字化深度融合的当下，地理信息服务与云端虚拟化技术的结合正成为跨境业务的核心竞争力。GoogleMaps作为全球领先的地图服务提供商，凭借其精准定位、路径规划与场景化交互能力，已深度嵌入共享经济、跨境电商、本地化营销等领域。而亚矩阵云手机基于ARM虚拟化集群与边缘计算技术，通过动态IP绑定、虚拟定位与全球节点部署，为GoogleMaps的跨境应用提供了安全、高效、低延迟的底层支撑。本文将
深入理解RAG：大语言模型时代的知识增强架构小胡说技书 #大模型/智能体语言模型架构人工智能 python 大模型 RAG
在人工智能快速发展的今天，大语言模型（LLM）已经展现出令人惊叹的能力。然而，即使是最先进的模型也面临着知识更新滞后、事实性错误（幻觉）和专业领域知识不足等根本性挑战。检索增强生成（Retrieval-AugmentedGeneration，简称RAG）技术的出现，为解决这些问题提供了一个优雅而有效的方案。一、为什么需要RAG？从大模型的局限性说起1.1大语言模型的固有缺陷要理解RAG的价值，我们
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n

端边云协作推理相关论文总结

Papers About End-Edge-Cloud Collaborative Inference

文章目录

Part 1: Edge Computing

Part 2: Model Compressing

Part 3: Reinforcement Learning

References

你可能感兴趣的:(强化学习,模型压缩,Edge,Computing,边缘计算,模型压缩,强化学习)