迷雾总会解

机器学习-27-Network Compression( 网络压缩)

文章目录

- Network Pruning（修剪）
- - INTRODUCTION
  - Why Pruning
  - Lottery Ticket Hypothesis(大乐透假说)
  - Rethinking the Value of Network Pruning
  - Practical Issue
- Knowledge Distillation(知识蒸馏)
- - Student and Teacher
  - Ensemble（合奏）
  - Temperature
- Parameter Quantization（参数量化）
- - less bits
  - weight clustering
  - Binary Weights
- Architecture Design(架构设计)
- - Low rank approximation(低秩近似)
  - Depthwise Separable Convolution(深度可分离卷积)
- Dynamic Computation
- - Train multiple classifiers（训练大量的分类器(从小到大))
  - Classifiers at the intermedia layer(使用中间层输出)

Network Pruning（修剪）

INTRODUCTION

神经网络的参数很多，但其中有些参数对最终的输出结果贡献不大而显得冗余，将这些冗余的参数剪掉的技术称为剪枝。剪枝可以减小模型大小、提升运行速度，同时还可以防止过拟合。

剪枝分为one-shot和iteration剪枝：

one-shot剪枝过程：训练模型–> 评估神经元（或者kernel、layer）的重要性–>去掉最不重要的神经元–> fine-tuning–>停止剪枝。
iteration剪枝过程：训练模型–> 评估神经元（或者kernel、layer）的重要性–>去掉最不重要的神经元–> fine-tuning–>判断是不是要继续剪枝，如果是回到第二步（评估神经元的重要性），否则停止剪枝。

剪枝还分为结构化剪枝和非结构化剪枝：

结构化剪枝：直接去掉整个kernel的结构化信息；
非结构化剪枝：考虑每个kernel的每个元素，删除kernel中不重要的参数；也称为稀疏剪枝。

重要性判断：

那么怎么判断哪些参数是冗余或者不重要的呢？

对权重(weight)而言，我们可以通过计算它的l1,l2值来判断重要程度
对neuron而言，我们可以给出一定的数据集，然后查看在计算这些数据集的过程中neuron参数为0的次数，如果次数过多，则说明该neuron对数据的预测结果并没有起到什么作用，因此可以去除。

Why Pruning

那我们不禁要问，既然最后要得到一个小的network，那为什么不直接在数据集上训练小的模型，而是先训练大模型?

解释一

一个比较普遍接受的解释是因为模型越大，越容易在数据集上找到一个局部最优解，而小模型比较难训练，有时甚至无法收敛。
解释二

2018年的一个发表在ICLR的大乐透假设(Lottery Ticket Hypothesis)观察到下面的现象

Lottery Ticket Hypothesis(大乐透假说)

机器学习-27-Network Compression( 网络压缩)_第2张图片

我们先对一个network进行初始化（红色的weight），再得到训练好的network（紫色的weight），再进行pruned，得到一个pruned network

如果我们使用pruned network的结构，再进行随机初始化random init（绿色的weight），会发现这个network不能train下去
如果我们使用pruned network的结构，再使用原始随机初始化original random init（红色的weight），会发现network可以得到很好的结果

作者由此提出：可能神经元会不会被训练起来，与初始值有很大关系，是一种大乐透现象。

关于大乐透假说，更多的可以参考：

The Lottery Ticket Hypothesis: Finding Sparse, Trainable Neural Networks

《彩票假设》ICLR 2019 best paper 阅读笔记

Rethinking the Value of Network Pruning

作者通过数个网络和数据集的prune 测试，得到了三个观察和结论：

如果有一个确定的“压缩”模型，训练一个大网络不是必要的；
在prune算法中，我们所认为“重要”的权重，其实对裁剪的小模型来说，并不是那么有用；
对于最终的压缩小模型来说，通过prune算法得到的网络架构，比通过prune得到的“重要”的权重更加重要。

并得出一个最终结论：对于SOT的剪枝算法而言，使用裁剪的权重来fine-tune只能得到类似的或者更差的效果；对于通过剪枝算法得到的特定网络模型，可以直接随机初始化训练，而不用经历传统的裁剪管道（训练大网络，裁剪出权重，finetune小网络）。

同时，作者对彩票假说（Lottery Tickety Hypothesis）进行了对比，发现使用所谓最佳学习率的“中奖彩票”初始化，并未必随机初始化有更好的结果。

传统的prune算法有三个通道：（1）训练一个大模型；（2）按某指标来裁剪一个训练好的大模型；（3）finetune裁剪模型以获得因prune而损失的性能；
在传统的prune观念中，有两个“通识”：（1）训练大模型是必要的，可以从大模型中无损裁剪。一系列工作认为从大模型变小模型，要比直接训练一个小模型要好；（2）裁剪下来的权重和网络架构都是重要的。所以，裁剪算法大都会选择fine-tune而不是重头训练它。
本文提出，对于结构化裁剪，上述观点都不重要。对于统一裁剪（使用百分比，在每个layer上都裁剪百分比的channal数）的小网络，也是随机初始化重头训练效果来得好；对于使用Prune算法自动获得模型结构的小网络，仍需一个较大网络，最后随机初始化训练比较好。
但对于非结构化裁剪（权重系数化等），从头训练并不能达到较好的效果。

同时，作者认为，通过prune算法裁剪出来的模型可以为设计高效网络架构提供设计指导。

具体的可以参考:

Rethinking the Value of Network Pruning

【论文阅读笔记】Rethinking the value of Network Pruning

Rethinking the value of network pruning

机器学习-27-Network Compression( 网络压缩)_第3张图片

Practical Issue

如果我们现在进行weight pruning，进行weight pruning之后的network会变得不规则，有些neural有2个weight，有些neural有4个weight，这样的network是不好implement（实行）出来的；

GPU对矩阵运算进行加速，但现在我们的weight是不规则的，并不能使用GPU加速；

实做的方法是将pruning的weight写成0，仍然在做矩阵运算，仍然可以使用GPU进行加速；但这样也会带来一个新的问题，我们并没有将这些weight给pruning掉，只是将它写成0了而已

机器学习-27-Network Compression( 网络压缩)_第4张图片

实际上做weight pruning是很麻烦的，通常我们都进行neuron pruning，可以更好地进行implement，也很容易进行speedup

机器学习-27-Network Compression( 网络压缩)_第5张图片

Knowledge Distillation(知识蒸馏)

Student and Teacher

机器学习-27-Network Compression( 网络压缩)_第6张图片

训练一个大网络，用小网络（Student Net）学习大网络。并计算两者之间的cross-entropy，使其最小化，从而可以使两者的输出分布相近。

teacher提供了比label data更丰富的资料，比如teacher net不仅给出了输入图片和1很像的结果，还说明了1和7长得很像，1和9长得很像；所以，student跟着teacher net学习，是可以得到更多的information的。

为什么这样有用？因为小网络学的是一个基于大网络的 distillation 。不仅仅学到一个输出神经元的价值，而是多个神经元的输出。

Ensemble（合奏）

在实际生活中，设备往往放不下太多的model，这时我们就可以使用Knowledge Distillation的思想，使用student net来对teacher进行学习，在实际的应用中，我们只需要student net的model就好

机器学习-27-Network Compression( 网络压缩)_第7张图片

Temperature

那Student Net到底如何学习呢？首先回顾一下在多类别分类任务中，我们用到的是softmax来计算最终的概率，即

$y_i = \frac{exp(x_i)}{\sum_jexp(x_j)}$

但是这样有一个缺点，因为使用了指数函数，如果在使用softmax之前的预测值是 $x_1=100,x_2=10,x_3=1,x1=100,x_2=10,x_3=1$ ,那么使用softmax之后三者对应的概率接近于 $y 1 = 1, y 2 = 0, y 3 = 0 y 1 = 1, y 2 = 0, y 3 = 0$ ，那这和常规的label无异了，所以为了解决这个问题就引入了一个新的参数TT,称之为Temperature,即有:

$y_i = \frac{exp(x_i/T)}{\sum_j exp(x_j/T)}$

此时，如果我们令T=100T=100,那么最后的预测概率是 $y 1 = 0.56, y 2 = 0.23, y 3 = 0.21$ 。（不过李宏毅老师在视频里提到说这个方法在实际使用时貌似用处不大hhhh，感觉这个方法可以回答知乎上的 什么东西看起来很厉害但是没什么用? 哈哈哈哈哈哈哈哈哈哈或或）

机器学习-27-Network Compression( 网络压缩)_第8张图片

最后，关于Knowledge Distillation可以看下这篇文章【经典简读】知识蒸馏(Knowledge Distillation) 经典之作

Parameter Quantization（参数量化）

less bits

一个很直观的方法就是使用更少bit来存储数值，例如一般默认是32位，那我们可以用16或者8位来存数据

weight clustering

如下图所示，最左边表示网络中正常权重矩阵，之后我们对这个权重参数做聚类，比如最后得到了4个聚类，那么为了表示这4个聚类我们只需要2个bit，即用00,01,10,11来表示不同聚类。之后每个聚类的值就用均值来表示。这样的一个缺点就是误差可能会比较大。

机器学习-27-Network Compression( 网络压缩)_第9张图片

如图，只要保存各个参数的类别，以及类别对应的数值表就可以。

此外，还可以进行哈夫曼编码等压缩。

Binary Weights

Binary Weights是以一种更加极致的思路来对模型进行压缩，即每个节点只有1或-1来表示,则参数就可以用一个位来表示了。。比较具有代表性的论文如下：

BInary Connect
BInary Network
XNOR-Net

下面简单介绍一下Binary Connect的思路，如下图示，灰色节点表示使用binary weight的神经元，蓝色节点可以是随机初始化的参数，也可以是真实的权重参数。

第一步我们先计算出和蓝色节点最接近的二元节点，并计算出其梯度方向（红色剪头）。

机器学习-27-Network Compression( 网络压缩)_第10张图片

第二步，蓝色节点的更新方向则是按照红色箭头方向更新，而不是按照他自身的梯度方向更新。如下图示，梯度下降后，蓝色节点到了一个新的位置。

机器学习-27-Network Compression( 网络压缩)_第11张图片

最后在满足一定条件后(例如训练之最大epoch),用离得最近的Binary Weight作为结果。

机器学习-27-Network Compression( 网络压缩)_第12张图片

我们来看一下整个过程：

机器学习-27-Network Compression( 网络压缩)_第13张图片

结果还不错，可以看到把权重限制为+1或者-1相当于加上了正则化。

机器学习-27-Network Compression( 网络压缩)_第14张图片

Architecture Design(架构设计)

Low rank approximation(低秩近似)

下图是低秩近似的简单示意图，左边是一个普通的全连接层，可以看到权重矩阵大小为M×NM×N，而低秩近似的原理就是在两个全连接层之间再插入一层K。是不是很反直观？插入一层后，参数还能变少？

没错，的确变少了，我们可以看看新插入一层后的参数数量为: $N \times K + K \times M = K \times (M + N)$ ,因为 $,所以参数减少了。$

机器学习-27-Network Compression( 网络压缩)_第15张图片

但是低秩近似之所以叫低秩，是因为原来的矩阵的秩最大可能是 $m i n (M, N)$ ,而新增一层后可以看到矩阵 $U$ 和 $V$ 的秩都是小于等于 $K$ 的，我们知道 $r a n k (A B) \leq m i n (r a n k (A), r a n k (B))$ , 所以相乘之后的矩阵的秩一定还是小于等于 $K$ 。那么这样会带来什么影响呢？那就是原先全连接层能表示更大的空间，而现在只能表示小一些的空间了。

Depthwise Separable Convolution(深度可分离卷积)

如图，标准的CNN架构，其中两个通道，4个filter，一共有72个参数。

机器学习-27-Network Compression( 网络压缩)_第16张图片

而Depthwise Separable卷积分成了两步，如下图示。

首先是输入数据的每个通道只由一个二维的卷积核负责，即卷积核通道数固定为1，而不是像上面那样，每个卷积核的通道数和输入通道数保持一致。这样最后得到的输出特征图的通道数等于输入通道数。

因为第一步得到的输出特征图是用不同卷积核计算得到的，所以不同通道之间是独立的，因此我们还需要对不同通道之间进行关联。为了实现关联，在第二步中使用了 $1 * 1$ 大小的卷积核，通道数量等于输入数据的通道数量。另外 $1 * 1$ 卷积核的数量等于预期输出特征图的通道数，在这里等于4。最后我们可以得到和标准卷积一样的效果，而且参数数量更少： $3 * 3 * 2 + (1 * 1 * 2) * 4 = 26$ 。

机器学习-27-Network Compression( 网络压缩)_第17张图片

机器学习-27-Network Compression( 网络压缩)_第18张图片

下面我们算一下标准卷积和Depthwise Separable卷积参数数量大小关系：假设输入特征图通道数为II,输出特征图通道数为O,卷积核大小为k×k。

标准卷积参数数量= $k \times k \times I \times O$
Depthwise Separable卷积参数数量= $k \times k \times I + I \times O$
因为通常输出特征图的通道数O会设置的比较大，所以可以看到Depthwise Separable卷积的参数量会明显少于标准卷积。

机器学习-27-Network Compression( 网络压缩)_第19张图片

这样的卷积设计广泛运用在各种小网络上，如(附带paper)

SqueezeNet
MobileNet
ShuffleNet
Xception

Dynamic Computation

该方法的主要思路是如果目前的资源充足（比如你的手机电量充足），那么算法就尽量做到最好，比如训练更久，或者训练更多模型等；反之，如果当前资源不够（如电量只剩10%），那么就先算出一个过得去的结果。

那么如何实现呢？

机器学习-27-Network Compression( 网络压缩)_第20张图片

Train multiple classifiers（训练大量的分类器(从小到大))

比如说我们提前训练多种网络，比如大网络，中等网络和小网络，那么我们就可以根据资源情况来选择不同的网络。但是这样的缺点是我们需要保存多个模型，这在移动设备上的可操作性不高。

Classifiers at the intermedia layer(使用中间层输出)

这样的思路其实也挺直观的，就是比如说我们做分类任务，当资源有限时，我们可能只是基于前面几层提取到的特征做分类预测，但是一般而言这样得到的结果会打折扣，因为前面提取到的特征是比较细腻度的，可能只是一些纹理，而不是比较高层次抽象的特征。

机器学习-27-Network Compression( 网络压缩)_第21张图片

这里简单列出两个缺点：

前面的layer抽取的feature对于做分类效果不好（CNN的前面的隐藏层抽取的特征比较小，不适合分类）。也就是说,越靠近输入，预测结果越差
由于中间接了Classifier，会影响最终的分类结果，因为在训练的时候中间层就想要做分类，所以模型会促使参数在第一层就抽取大特征，这样会使得后面的结果变差。

解决方案： Multi-Scale Dense Networks for Resource Efficient Image Classification。

机器学习-27-Network Compression( 网络压缩)_第24张图片

实现使用K210单片机进行猫脸检测，并在检测到猫脸覆盖屏幕50%以上时执行特定操作 max500600 开发工具嵌入式单片机嵌入式硬件
要实现使用K210单片机进行猫脸检测，并在检测到猫脸覆盖屏幕50%以上时执行特定操作，以及通过WiFi上传图片到微信小程序，并在微信小程序中上传图片到开发板进行训练，可以按照以下步骤进行：1.硬件连接确保K210开发板连接好摄像头，并预留一个引脚用于拉高电平。另外，连接WiFi模块（如ESP8266）用于网络通信。2.猫脸检测使用K210的MaixPy库进行猫脸检测。以下是一个简单的猫脸检测示例代
如何防御暴力攻击（Brute Force Attack）? 安全防护
在不断变化的网络安全世界中，了解各种类型的攻击是保护自己或企业的第一步。其中一个常见的威胁是暴力攻击。让我们深入了解什么是暴力攻击，它是如何工作的，以及如何防止它。什么是暴力攻击顾名思义，暴力攻击依赖于暴力破解，这意味着它不利用任何软件漏洞或使用复杂的技术。相反，它依赖于纯粹的计算能力来彻底尝试所有的可能性。暴力攻击是一种反复试验的方法，用于获取诸如个人识别号码(PINs)、用户名、密码或其他类型
Cisco APIC 6.1(2g)F - 应用策略基础设施控制器 cisco
CiscoAPIC6.1(2g)F-应用策略基础设施控制器ApplicationPolicyInfrastructureController(APIC)请访问原文链接：https://sysin.org/blog/cisco-apic-6/查看最新版。原创作品，转载请保留出处。作者主页：sysin.org思科应用策略基础设施控制器(APIC)CiscoNX-OS网络操作系统软件CiscoNX-OS
简述web3.0前端开发的最简单三个步骤飞机号Mrsfu223 web3 区块链 python java 开发语言
Web3.0是互联网的下一代前沿技术，包括人工智能，大数据和区块链都是这项技术的核心，Web3.0为用户提供了更为智能的互联网服务体验，该技术的核心要素为去中心化，也就是摆脱中心化的权力控制，能够让数据和各项交易通过网络里的各项节点来维护和验证，并不是通过中心化的机构或服务器控制各项节点，Web3有车有中心化，有户权益性，去信任化，互操作性这些特点，可以拥有更大的操作空间和可能性。去中心化是基于区
人机交互：面部识别_14.面部识别在虚拟现实和增强现实中的应用 zhubeibei168 机器人及导航人机交互 vr ar 开发语言机器人导航与定位
14.面部识别在虚拟现实和增强现实中的应用14.1虚拟现实中的面部识别在虚拟现实（VR）环境中，面部识别技术可以显著提升用户体验，使其更加沉浸和自然。通过识别用户的面部表情，VR系统可以实时调整虚拟角色的行为，增强用户与虚拟世界的互动。14.1.1面部表情识别面部表情识别是虚拟现实中最常见的应用之一。通过摄像头捕捉用户的面部图像，使用计算机视觉算法识别出用户的表情，如微笑、惊讶、愤怒等，虚拟角色可
Huffman编码的Python的实现 childish_tree python 算法霍夫曼树数据压缩
Huffman编码的Python的实现基本原理及步骤Huffman编码是一种贪心算法，用于无损数据压缩。它基于字符在数据中出现的频率来构建编码，频率高的字符使用较短的编码，而频率低的字符使用较长的编码。这种方式的目的是减少数据的大小，因为最常见的字符使用最短的编码，从而在整体上减少了所需的位数。实现Huffman编码的原理如下：频率统计：如果输入数据是一个字符串，代码会遍历这个字符串，统计每个字符
计数排序算法及优化（java）爱吃土豆的程序员数据结构与算法（JAVA）算法 java 计数排序
1.1引言计数排序是一种非比较排序算法，它适用于一定范围内的整数排序。计数排序的核心思想是通过统计每个元素出现的次数来确定它们的位置，而不是通过比较来决定元素的顺序。本文将详细介绍计数排序的历史背景、工作原理，并通过具体案例来阐述其应用。此外，还将探讨计数排序的不同优化方案，并给出相应的Java代码示例。1.2计数排序的历史计数排序的思想可以追溯到20世纪初，最早是由HaroldH.Seward在
AI真的能理解我们这个现实物理世界吗？深度剖析原理、实证及未来走向 AI_DL_CODE 人工智能深度学习 AI AI理解世界
摘要：当下，AI与深度学习广泛渗透生活各领域，大模型与海量数据加持下，其是否理解现实物理世界引发热议。文章开篇抛出疑问，随后深入介绍AI深度学习基础，包含神经网络架构、反向传播算法。继而列举AI在物理场景识别、实验数据分析中显露的“理解”迹象，也点明常识性错误、极端场景失效这类反例。从信息论、物理启发式算法剖析理论支撑，探讨融合物理知识路径，并延展至跨学科应用、评估维度、伦理社会问题，最终展望AI
攻克设备数据质量难题：深度学习应用的数据基石搭建教程（DBSCAN 聚类算法） AI_DL_CODE 深度学习运维算法数据质量 DBSCAN聚类算法
摘要：在深度学习赋能设备管理的浪潮中，数据质量成为关键瓶颈。本文聚焦设备数据采集与预处理阶段面临的噪声干扰、数据缺失等难题，深入讲解强化采集端管控的策略，详细剖析聚类、统计法及线性回归模型在数据清洗与补全中的应用原理，并结合振动传感器数据实例给出可实操的Python代码。旨在为从业者提供一站式解决方案，助力打造高质量设备数据集，为深度学习模型高效运行筑牢根基，推动设备管理智能化落地。文章目录攻克设
人工智能在药物研发中的应用 - 从靶点发现和化合物筛选：利用AI深度学习技术加速药物研发流程 AI_DL_CODE 人工智能深度学习药物研发 deep learning
摘要：本文探讨了人工智能（AI）在药物研发中的应用，强调了AI在加速药物发现、降低成本和提高成功率方面的重要性。文章概述了AI在药物靶点识别、化合物筛选、药物设计优化等方面的应用，并详细介绍了机器学习和深度学习的基本原理。通过一个实操案例，展示了如何利用AI技术对化合物数据进行分析，预测潜在的药物候选物。案例包括数据预处理、模型训练、评估和优化等步骤，证明了AI在提高药物研发效率和准确性方面的潜力
pytorch实现循环神经网络纠结哥_Shrek pytorch rnn 深度学习
人工智能例子汇总：AI常见的算法和例子-CSDN博客PyTorch提供三种主要的RNN变体：nn.RNN：最基本的循环神经网络，适用于短时依赖任务。nn.LSTM：长短时记忆网络，适用于长序列数据，能有效解决梯度消失问题。nn.GRU：门控循环单元，比LSTM计算更高效，适用于大部分任务。网络类型优势适用场景RNN计算简单，适用于短时序列语音、文本处理（短序列）LSTM适用于长序列，能记忆长期信息
普通算法——一维差分 ZZTC 算法算法
一维差分题目链接：https://www.acwing.com/problem/content/799/题目描述：输入一个长度为nnn的整数序列。接下来输入mmm个操作，每个操作包含三个整数l,r,c，l,r,c，l,r,c，表示将序列中[l,r][l,r][l,r]之间的每个数加上ccc。请你输出进行完所有操作后的序列。说明：差分是前缀和的逆运算，也就是构造一个bbb数组使aaa数组是bbb数组
YOLOv10改进策略【Neck】| NeurIPS 2023 融合GOLD-YOLO颈部结构，强化小目标检测能力 Limiiiing YOLOv10改进专栏 YOLO 深度学习计算机视觉目标检测
一、本文介绍本文主要利用GOLD-YOLO中的颈部结构优化YOLOv10的网络模型。GOLD-YOLO颈部结构中的GD机制借鉴了全局信息融合的理念，通过独特的模块设计，在不显著增加延迟的情况下，高效融合不同层级的特征信息。将其应用于YOLOv10的改进过程中，能够使模型更有效地整合多尺度特征，减少信息损失，强化对不同大小目标物体的特征表达，从而提升模型在复杂场景下对目标物体的检测精度与定位准确性。
YOLOv10改进策略【Neck】| HS-FPN：高级筛选特征融合金字塔，加强细微特征的检测 Limiiiing YOLOv10改进专栏 YOLO 深度学习计算机视觉目标检测
一、本文介绍本文将HS-FPN结构融入YOLOv10以优化目标检测网络模型。HS-FPN借助通道注意力机制及独特的多尺度融合策略，有效应对目标尺寸差异及特征稀缺问题。在YOLOv10中应用HS-FPN时，其利用高级特征筛选低级特征，增强特征表达，助力模型精准定位和识别目标，减少因尺度变化及特征不足导致的检测误差，显著提升YOLOv10在各项检测任务中的准确性与稳定性。专栏目录：YOLOv10改进目
Java实现计数排序算法详解及优化捕风捉你从0开始学算法 java 排序算法算法
引言计数排序（CountingSort）是一种线性时间复杂度的排序算法，特别适用于数据范围有限的情况。它通过统计每个元素出现的次数，然后按照次数排序，从而实现排序。本文将详细讲解如何使用Java实现计数排序算法，并结合图解和实例代码，帮助您全面理解这一高级排序算法。同时，我们还将探讨计数排序的优化方法，以进一步提高其性能。计数排序算法的原理计数排序通过统计每个元素出现的次数，然后利用这些计数值将元
光网络结构 AdaLeery
光网络的基本结构类型有星形、总线形（含环形）和树形等3种，可组合成各种复杂的网络结构。横向光网络可横向分割为核心网、城域／本地网和接入网。核心网倾向于采用网状结构，城域／本地网多采用环形结构，接入网将是环形和星形相结合的复合结构。纵向光网络可纵向分层为客户层、光通道层（OCH）、光复用段层（OMS）和光传输层（OTS）等层。两个相邻层之间构成客户／服务层关系。客户层：由各种不同格式的客户信号（如S
二路归并排序算法 qq_26261861 排序算法算法数据结构
二路归并排序算法简单理解就是两两进行比较，然后把他们合并到一起。通俗理解就是去买衣服的时候，经常会货比三家，看了一个店选两件衣服，然后又去另外一个店选了同款的两件衣服。看价格排序，或者性价比排序一下，看哪个更便宜，或者性价比更高。二路归并排序关键点：相邻的两两进行比较，然后把他们合并在一起。相邻的两两最开始是单个元素，合并之后就会翻倍。二路归并排序的过程，需要先拆分元素，然后再合并。二路归并排序是
PyTorch 官方文档中文版本圣心 pytorch 机器学习
文档来源https://pytorch.cadn.net.cn大多数机器学习工作流都涉及处理数据、创建模型、优化模型参数，并保存经过训练的模型。本教程向您介绍完整的ML工作流在PyTorch中实现，并提供了用于了解有关每个概念的更多信息的链接。我们将使用FashionMNIST数据集来训练一个神经网络，该神经网络预测输入图像是否属于到以下类别之一：T恤/上衣、裤子、套头衫、连衣裙、外套、凉鞋、衬衫
5G无线网络架构及规划陆墨宁计算机网络基础 5G 架构网络
网络传输过程中的噪声:噪声分两种,一种是有源噪声(外部),一种是无源噪声(热噪声)5G通信网络架构移动通信网络有由三部分构成接入网:是离用户端最近的末端网络(无线基站就属于接入网),负责把用户端(手机)的数据接收上来,以及将承载网传递过来的数据送达用户端。承载网:负责数据的汇聚传输,将接入网的数据传递到核心网中去。核心网:就是数据的处理中心,负责管理传递上来的数据,对数据进行分拣处理,再将数据交给
手机直连低轨卫星通信：架构、关键技术和未来展望罗思付之技术屋综合技术探讨及方案专栏智能手机架构
【摘要】借助低轨卫星星座全时全域覆盖优势，手机直连卫星通信预期成为6G重要特征之一。首先介绍了手机直连卫星的测试验证、标准化与商业项目发展现状。其次，介绍了基于透明转发、部分可再生处理、完全可再生处理、集成接入和回传的四种手机直连低轨卫星网络架构及组网方式。通过分析手机直连低轨卫星网络场景下高移动性与大传输时延等带来的接入与传输问题，提出对地面移动通信体制进行适应性改进的关键技术方案。最后，探讨了
基于 YOLOv8+PyQt5 的无人机红外目标检测系统：开启智能监测新时代人工智能教学实践人工智能 YOLO qt 无人机
基于YOLOv8+PyQt5的无人机红外目标检测系统：开启智能监测新时代【毕业与课程大作业参考】基于yolov8+pyqt5界面自适应的无人机红外目标检测系统demo.zip资源-CSDN文库在科技飞速发展的今天，无人机技术在各个领域的应用越来越广泛。为了提升无人机在复杂环境下的目标检测能力，结合先进的深度学习算法和图形用户界面开发技术，打造功能强大的无人机红外目标检测系统成为了研究热点。本文将详
光通信网络设备急速发展，光网络架构剧烈变革 SugarNMS 行业网管网管平台网管软件光设备光网络设备管理网管开发
数据表明，IP数据流量从2010年到2014年期间翻了5倍，未来仍将保持23%的复合增长率，而移动流量在2014年增长了69%，到2019年将为2014年的10倍，急剧增长的数据流量对底层光网络设备带宽和容量提出了更高要求。同时，随着全球信息化发展和ICT融合加剧，IT理念渗透到传统通信的各个领域，光网络架构面临变革，将深刻影响光网络设备的发展。光通信网络设备业务发展正驱动着光网络架构的变革，以适
PYTHON 常用算法 33个 trust Tomorrow python 算法 python 排序算法
文章目录冒泡排序（BubbleSort）选择排序（SelectionSort）插入排序（InsertionSort）快速排序（QuickSort）归并排序（MergeSort）堆排序（HeapSort）计数排序（CountingSort）基数排序（RadixSort）桶排序（BucketSort）希尔排序（ShellSort）二分查找（BinarySearch）线性查找（LinearSearch）
为什么要有库 h^hh linux
库提供了基础功能，提高开发效率，平常写的printf，如果没有库也能写，比如现在你需要向显示器打印，向文件写入，向网络发送各种功能的时候，因为没有库了，所以printf需要你自己去实现，你想写一个链表逆置的算法，再把整个链表打印出来，你写的时候可能用了两个小时，其中一个半小时都在实现printf，剩下30分钟你再写链表，更夸张的是你以后再写任何方法的时候，只要想打印，你都得自己实现一个printf
跨境办公网络问题及其解决思路 IPdodo全球网络服务网络 web安全安全
随着全球化的加速发展，越来越多的企业开始采取跨境办公模式，尤其是在疫情后，远程办公成为了常态。然而，跨境办公所带来的网络问题也逐渐凸显，这些问题不仅影响工作效率，也可能影响公司的数据安全、合规性以及团队协作的顺畅性。一、跨境办公网络问题的主要表现1.网络延迟与带宽瓶颈跨境办公最常见的网络问题之一就是网络延迟，尤其是在涉及远程视频会议或云应用时，延迟可能导致交流不畅和信息丢失。跨境数据传输需要跨越多
面试之Solr&Elasticsearch 字节全栈_vBr 面试 solr elasticsearch
优点：1.Elasticsearch是分布式的。不需要其他组件，分发是实时的，被叫做”Pushreplication”。2.Elasticsearch完全支持ApacheLucene的接近实时的搜索。3.处理多租户（multitenancy）不需要特殊配置，而Solr则需要更多的高级设置。4.Elasticsearch采用Gateway的概念，使得完备份更加简单。5.各节点组成对等的网络结构，某些
Nginx的负载均衡入眼皆含月 nginx 负载均衡运维
一、概述Nginx负载均衡是一种通过将客户端请求分发到多个后端服务器的技术，旨在提高系统的吞吐量、可用性和容错性。二、Nginx负载均衡工作原理Nginx作为反向代理服务器，接收客户端的请求，并根据配置的负载均衡算法将请求转发到后端服务器。其工作流程如下：客户端请求到达Nginx。Nginx根据配置的负载均衡策略选择后端服务器。Nginx将请求转发到选定的后端服务器。后端服务器处理请求并返回响应。
c++ 算法之二分答案详解必胜的小铭 c++算法 c++算法开发语言
二分答案是c++之中一个简单而重要的算法，每一个OIer必备的基础算法，你知道它究竟是什么吗？目录一、简介1.定义2.时间复杂度二、核心代码三、例题1.跳石头1.题目描述2.解法2.进击的奶牛1.题目描述2.思路一、简介1.定义二分答案是一种二分搜索，二分搜索（英语：binarysearch），也称折半搜索（英语：half-intervalsearch）、对数搜索（英语：logarithmicse
深度学习基因组学+机器学习单细胞分析，当下最火热研究方向！ qwmb919 人工智能深度学习机器学习 python
深度学习已经被广泛应用于基因组学研究中，利用已知的训练集对数据的类型和应答结果进行预测，深度学习，可以进行预测和降维分析。深度学习模型的能力更强且更灵活，在适当的训练数据下，深度学习可以在较少人工参与的情况下自动学习特征和规律。调控基因组学，变异检测，致病性评分成功应用。深度学习可以提高基因组数据的可解释性，并将基因组数据转化为可操作的临床信息。深度学习通过强大的深度神经网络模型从高维大数据中自动
【llm对话系统】大模型 Llama、Qwen 和 ChatGLM 的网络结构和训练方法对比 kakaZhui llama 人工智能 AIGC chatgpt python
1.引言近年来，大型语言模型(LLM)取得了令人瞩目的进展，其中Llama、Qwen和ChatGLM是三个备受关注的开源模型。它们都在Transformer架构的基础上进行了改进和优化，并在各种NLP任务上取得了优异的性能。本文将深入分析Llama、Qwen和ChatGLM的网络结构和训练方法，比较它们的异同以及各自的优势。2.模型结构对比特性LlamaQwenChatGLM基础架构Decoder
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s