H.SH

深度学习经典网络：ShuffleNet系列网络(ShuffleNet v2)

ShuffleNet v2:https://link.springer.com/chapter/10.1007/978-3-030-01264-9_8
pytorch代码：https://github.com/Randl/ShuffleNetV2-pytorch/blob/master/model.py
keras代码：https://github.com/opconty/keras-shufflenetV2

ShuffleNet v2

0. 前言
1. 高效网络设计的准则
- - 1. Equal Channel width Minimizes Memory Access Cost (MAC)（等通道宽度可最大限度地降低内存访问成本）
  - 2. Excessive Group Convolution Increases MAC.
  - 3. Network Fragmentation Reduces Degree of Parallelism.
  - 4. Element-wise Operations are Non-negligible.
  - 5. 结论
2. ShuffleNet v2
- - 2.1 ShuffleNet Unit
  - 2.2 ShuffleNet v2网络结构
3. 实验
4. ShuffleNet v2代码

0. 前言

目前大部分的模型加速和压缩文章在对比加速效果时用的指标都是FLOPs（float-point operations），这个指标主要衡量的就是卷积层的乘法操作。但是这篇文章通过一系列的实验发现FLOPs并不能完全衡量模型速度，这主要有一下两个原因：

除了FLOPs会影响速度外，还有其他因素会造成影响。比如：内存访问消耗时间（memory access cost- MAC）这对模型速度影响比较大，但是却难以在FLOPs指标中体现出来; 还有比如并行程度（degree of parallelism）。
对于具有相同FLOPs的模型在不同的平台会有不同的运行时间。

因此，作者提出了两个设计网络应该考虑的两个准则：

首先应该考虑直接指标（比如速度），而不是考虑简介的指标（比如FLOPs)
其次这些指标应该在目标平台上同一进行评价

在论文接下来的部分，作者首先通过实验得出高效网络设计的四个准则，然后根据这些准则对现有ShuffleNet v1进行改进，提出ShuffleNet v2。

1. 高效网络设计的准则

作者首先对现有一些网络各个部分占用的时间进行了实验统计，如图1

图 1 不同网络各组成部分运行时间占比统计

从图1可以看出，FLOPs只考虑了卷积操作，虽然在网络运行时间中占了很大比重，但像data I/O, datashuffle and element-wise operations (AddTensor, ReLU, etc) 也是不容忽视的，因此只考虑FLOPs是不合理的，鉴于上述考虑，作者设计了四组对比实验来探究网络设计的高效准则。

1. Equal Channel width Minimizes Memory Access Cost (MAC)（等通道宽度可最大限度地降低内存访问成本）

结论是卷积层的输入和输出特征通道数相等时MAC最小，此时模型速度最快。

轻量级网络通常采用通道分离卷积（depthwise seperate conviolution), 而当中pointwise convolution(也就是11卷积)占了很大比重的计算复杂度，所以作者以11卷积为例，研究了11卷积与MAC之间的关系。
假设一个11卷积层的输入特征通道数是 $c_{1}$ ，输出特征尺寸是h和w，输出特征通道数是 $c_{2}$ ，那么这样一个1*1卷积层的FLOPs即为 $B=hwc_{1}c_{2}$ .
那么MAC，即内存访问操作数为：
$\mathrm{MAC}=h w\left(c_{1}+c_{2}\right)+c_{1} c_{2}\text{ }\text{ }\text{ }\text{ }(1)$

其中 $hwc_{1}$ 表示输入特征所需存储空间， $hwc_{2}$ 表示输出特征所需存储空间， $c_{1}c_{2}$ 表示卷积核所需存储空间。
根据均值不等式( $a+b>=2\sqrt{ab}$ ), 将（1）式前半部分运用均值不等式，并将便两个用B进行替换得到：
$\mathrm{MAC} \geq 2 \sqrt{h w B}+\frac{B}{h w}\text{ }\text{ }\text{ }\text{ }(2)$

因此等式成立的条件是c1=c2，也就是输入特征通道数和输出特征通道数相等时，在给定FLOPs前提下，MAC达到取值的下界。
因此就有了Table1这个实验，这些实验的网络是由10个block组成，每个block包含2个1*1卷积层，第一个卷积层的输入输出通道分别是c1和c2，第二个卷积层相反。4行结果分别表示不同的c1:c2比例，但是每种比例的FLOPs都是相同的，可以看出在c1和c2比例越接近时，速度越快，尤其是在c1:c2比例为1:1时速度最快。这和前面介绍的c1和c2相等时MAC达到最小值相对应。

2. Excessive Group Convolution Increases MAC.

结论是过多的group操作会增大MAC，从而使模型速度变慢。
在设计网络时，为了减小网络的计算复杂度，会采用分组卷积，一方面对于给定FLOPs，分组卷积会增加网络的宽度，提高模型的容量；另一方面，增加的filter channels 也会增减MAC。
对于1 *1分组卷积，MAC 和FLOPs的关系为：
$\begin{aligned} \mathrm{MAC} &=h w\left(c_{1}+c_{2}\right)+\frac{c_{1} c_{2}}{g} \\ &=h w c_{1}+\frac{B g}{c_{1}}+\frac{B}{h w} \end{aligned}\text{ }\text{ }\text{ }\text{ }(3)$
其中 $B = hwc_{1}c_{2}/g$ , 从（3）式可以看出对于给定输入 $hwc_{1}$ 和计算复杂度B , MAC会随着分组数g的增加而增大。

Table2是关于卷积的group操作对速度的影响，通过控制参数c可以使得每个实验的FLOPs相同，可以看出随着g的不断增大，c也不断增大，这和前面说的在基本不影响FLOPs的前提下，引入group操作后可以适当增加网络宽度吻合。从速度上看，group数量的增加对速度的影响还是很大的，原因就是group数量的增加带来MAC的增加（公式3），而MAC的增加带来速度的降低。

3. Network Fragmentation Reduces Degree of Parallelism.

结论是模型中的分支数量越少，模型速度越快。

图 2 分支结构

网络结构设计上，文章用了一个词：fragment，翻译过来就是分裂的意思，可以简单理解为网络的支路数量。为了研究fragment对模型速度的影响，作者做了Table3这个实验，采用的结构如图2，可以看出在相同FLOPs的情况下，单卷积层（1-fragment）的速度最快。因此模型支路越多（fragment程度越高）对于并行计算越不利，这样带来的影响就是模型速度变慢，比如Inception、NASNET-A这样的网络。

4. Element-wise Operations are Non-negligible.

结论是element-wise操作所带来的时间消耗远比在FLOPs上的体现的数值要多，因此要尽可能减少element-wise操作。
Element-wise操作主要包括：ReLU, AddTensor, AddBias，另外对于depthwise convolution这种高MAC/FLOPs比率的操作，也归结为Element-wise operation.

Table4的实验是基于ResNet的bottleneck进行的，short-cut其实表示的就是element-wise操作，因为有AddTensor操作。

5. 结论

采用”balanced convolution“，也就是保证输入和输出具有相同的宽度
考虑分组卷积的成本
减少fragmentation操作
减少element-wise操作

2. ShuffleNet v2

2.1 ShuffleNet Unit

图 3 ShuffleNet 单元

ShuffleNet v1结构如图3 (a) (b)所示，采用了pointwise group convolution 和 bottleneck-like 结构，并且采用了”channel shuffle“, 将不同组的信息建立关联。根据第一部分中讨论结果， pointwise group convolution 和 bottleneck-like 结构违背了G2和G1, 太多的分组也会违背G3以及shortcut中”Add“操作违背了G4。

ShuffleNet v2结构如图3 (c ), 首先在开始处增加了一个channel split操作，这个操作将输入特征的通道分成c-c’和c’，c’在文章中采用c/2，其中一个分支采用identity连接（与G3相对应，没有任何fragmentation), 另一个分支采用相同输入和输出通道的三个卷积层（与G1相对应），其中两个1*1的卷积层也没有采用分组卷积（与G2相对应），其实channel split已经产生了分组的效果了。卷积完之后，将两个分支的结果concatenate一起，保证整个shuffle unit的输入和输出通道数保持一致（与 G1相对应），最后利用channel shuffle操作将concatenate后的信息进行混合。值得注意的是，ShuffeNetv2没有采用v1中的”Add“操作（与G4相对应）。当网络进行下采样时，采用的ShuffleNet Unit 如图3（d)所示，可以看出经过该模块特征图缩小一般，网络宽度加倍。

2.2 ShuffleNet v2网络结构

整个网络结构如Table 5，在stage2-4, 采用堆叠ShuffleNet Unit单元的方式，遇到下采样时采用图3（d）的结构，另外在全局平均池化层之前采用1*1的卷积将输入的特征进行混合。另外，采用类似MobileNet 通道缩放方式，来构建不同复杂度的网络。

ShuffleNet v2不光速度快而且具有较高的正确率，作者将其归结于两个原因：

ShuffleNet Unit 的高效建立可以增大网络的宽度，从而增加网络的表达能力。
在每个模块中，有一半的信息直接传入相邻模块，这样有一种类似DenseNet网络feature reuse的效果。

3. 实验

准确率&速度
Table 8. Comparison of several network architectures over classification error (on
validation set, single center crop) and speed, on two platforms and four levels of computation complexity. Results are grouped by complexity levels for better comparison.The batch size is 8 for GPU and 1 for ARM. The image size is 224 × 224 except: [*]160×160 and [**] 192×192. We do not provide speed measurements for CondenseNets[10] due to lack of efficient implementation currently

Table8是关于一些模型在速度、精度、FLOPs上的详细对比。实验中不少结果都和前面几点发现吻合，比如MobileNet v1速度较快，很大一部分原因是因为简单的网络结构，没有太多复杂的支路结构；IGCV2和IGCV3因为group操作较多，所以整体速度较慢；Table8最后的几个通过自动搜索构建的网络结构，和前面的第3点发现对应，因为支路较多，所以速度较慢。

object detection

Table7是在COCO数据集上的速度和精度对比。ShuffleNet v2是指在每个block的第一个pointwise卷积层前增加一个33的depthwise卷积层，目的是增加感受野，这样有助于提升检测效果（受Xception启发）。
最终，在分类正确率排名上ShuffleNet v2 ≥ MobileNet v2 > ShuffeNet v1 > Xception
在目标检测正确率排名上ShuffleNet v2 > Xception ≥ ShuffleNet v1 ≥ MobileNet v2

ShuffleNet v2 with SE
加入SE结构后，在牺牲一定速度的前提下正确率提升了0.5%，具体结构如图4所示。

图 4 ShuffleNet Unit with SE Block

泛化到大模型的能力
ShuffleNet v2可以泛化到大模型（ FLOPs>=2G ), 作者构建了50层的ShuffleNet v2 大模型，相比于ResNet 50 ，有少于40%的计算代价，有更高的准确率。结构如Appendix Table 2，实验结果如Table 6.

4. ShuffleNet v2代码

采用tensorflow2.0, tf.keras进行编写。

# -*- coding: UTF-8 -*-

"""
shufflenetv2 in pytorch
[1] Ningning Ma, Xiangyu Zhang, Hai-Tao Zheng, Jian Sun
    ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design
    https://arxiv.org/abs/1807.11164
"""

import os
import tensorflow as tf
import tensorflow.keras as keras
from tensorflow.keras import Sequential, layers

os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'


def channel_split(x, num_splits=2):
    """split the input tensor into two equal dimension

    Args:
        x: the input tensor
        num_splits: the numbers of tensors after splitting

    """
    if num_splits == 2:
        return tf.split(x, axis=3, num_or_size_splits=num_splits)
    else:
        raise ValueError('The num_splits is 2')


def channel_shuffle(x, groups):
    """channel shuffle operation.

    Args:
        x: the input tensor
        groups: input branch number

    """
    _, height, width, channels = x.shape
    channels_per_group = channels // groups
    x = tf.reshape(x, [-1, height, width, groups, channels_per_group])
    x = tf.transpose(x, perm=[0, 1, 2, 4, 3])
    x = tf.reshape(x, [-1, height, width, channels])
    return x


class SELayer(keras.Model):
    """this is the implement of SE unit."""
    def __init__(self, out_channels, reduction=16):
        super(SELayer, self).__init__()
        self.avg_pool = layers.GlobalAveragePooling2D()
        self.fc = Sequential([
            layers.Dense(out_channels//reduction),
            layers.Activation('relu'),
            layers.Dense(out_channels),
            layers.Activation('sigmoid')
        ])

    def call(self, inputs, training=None):
        _, _, _, c = inputs.shape
        out = self.avg_pool(inputs)
        out = self.fc(out)
        out = tf.reshape(out, [-1, 1, 1, c])
        return inputs * out


class ShuffleNetUnit(keras.Model):
    """this is the implement of shufflenet v2 unit including stride=1 and 2."""
    def __init__(self, out_channels, stride=1, se=False):
        super(ShuffleNetUnit, self).__init__()
        self.stride = stride
        self.se = se
        self.out_channels = out_channels//2
        self.residual = Sequential([
            layers.Conv2D(self.out_channels, (1, 1), use_bias=False),
            layers.BatchNormalization(),
            layers.Activation('relu'),
            layers.DepthwiseConv2D((3, 3), strides=self.stride, padding='same', use_bias=False),
            layers.BatchNormalization(),
            layers.Conv2D(self.out_channels, (1, 1), use_bias=False),
            layers.BatchNormalization(),
            layers.Activation('relu')
        ])
        if stride == 1:
            self.short_cut = Sequential()
        else:
            self.short_cut = Sequential([
                layers.DepthwiseConv2D((3, 3), strides=self.stride, padding='same', use_bias=False),
                layers.BatchNormalization(),
                layers.Conv2D(self.out_channels, (1, 1), use_bias=False),
                layers.BatchNormalization(),
                layers.Activation('relu')
            ])
        if self.se:
            self.se_layer = SELayer(self.out_channels)

    def call(self, inputs, training=None):
        if self.stride == 1:
            residual, short_cut = channel_split(inputs)
        else:
            residual, short_cut = inputs, inputs
        residual = self.residual(residual)
        short_cut = self.short_cut(short_cut)
        if self.se:
            residual = self.se_layer(residual)
        out = layers.concatenate([residual, short_cut], axis=-1)
        out = channel_shuffle(out, 2)
        return out


class ShuffleNetV2(keras.Model):
    """ShuffleNet v2 implement."""
    def __init__(self, scale, se=False, num_classes=1000):
        super(ShuffleNetV2, self).__init__()
        self.se = se
        if scale == 0.5:
            out_channels = [48, 96, 192, 1024]
        elif scale == 1:
            out_channels = [116, 232, 464, 1024]
        elif scale == 1.5:
            out_channels = [176, 352, 704, 1024]
        elif scale == 2:
            out_channels = [244, 488, 976, 2048]
        else:
            raise ValueError('The value of scale must be of [0.5, 1, 1.5, 2]')
        self.conv1 = Sequential([
            layers.Conv2D(24, (3, 3), strides=2, padding='same', use_bias=False),
            layers.BatchNormalization()
        ])
        self.max_pool = layers.MaxPool2D((3, 3), strides=2, padding='same')
        self.stage2 = self._make_stage(3, out_channels[0])
        self.stage3 = self._make_stage(7, out_channels[1])
        self.stage4 = self._make_stage(3, out_channels[2])
        self.conv5 = Sequential([
            layers.Conv2D(out_channels[3], (1, 1), use_bias=False),
            layers.BatchNormalization(),
            layers.Activation('relu')
        ])
        self.avg_pool = layers.GlobalAveragePooling2D()
        self.fc = layers.Dense(num_classes)

    def call(self, inputs, training=None):
        out = self.conv1(inputs)
        out = self.max_pool(out)
        out = self.stage2(out)
        out = self.stage3(out)
        out = self.stage4(out)
        out = self.conv5(out)
        out = self.avg_pool(out)
        out = self.fc(out)
        return out

    def _make_stage(self, num_stages, out_channels):
        layers = []
        layers.append(ShuffleNetUnit(out_channels, stride=2, se=self.se))
        for i in range(num_stages):
            layers.append(ShuffleNetUnit(out_channels, stride=1, se=self.se))
        return Sequential(layers)


if __name__ == '__main__':
    model = ShuffleNetV2(scale=2, se=False)
    model.build(input_shape=(None, 224, 224, 3))
    model.summary()
    print(model.predict(tf.ones((10, 224, 224, 3))).shape)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
ResNet的半监督和半弱监督模型 Valar_Morghulis
Billion-scalesemi-supervisedlearningforimageclassificationhttps://arxiv.org/pdf/1905.00546.pdfhttps://github.com/facebookresearch/semi-supervised-ImageNet1K-models/权重在timm中也有：https://hub.fastgit.org/r
联邦学习 Federated learning Google I/O‘19 笔记努力搬砖的星期五笔记联邦学习机器学习机器学习 tensorflow
FederatedLearning:MachineLearningonDecentralizeddatahttps://www.youtube.com/watch?v=89BGjQYA0uE文章目录FederatedLearning:MachineLearningonDecentralizeddata1.DecentralizeddataEdgedevicesGboard:mobilekeyboa
PCL 怎样可视化深度图像 LeonDL168 PCL 计算机视觉人工智能视觉检测图像处理算法
本小节讲解如何可视化深度图像的两种方法，在3D视窗中以点云形式进行可视化（深度图像来源于点云），另一种是，将深度值映射为颜色，从而以彩色图像方式可视化深度图像。代码首先，在PCL（PointCloudLearning）中国协助发行的书提供光盘的第7章例2文件夹中，打开名为range_image_visualization.cpp的代码文件，同文件夹下可以找到相关的测试点云文件room_scan1.
el-dialog高度设置夏之小星星前端 vue.js elementui css
el-dialog高度设置::v-deep.el-dialog{height:78vh;overflow:auto;}
elementuiPlus取消el-input的边框 qq_39016177 elementui
elementuiPlus取消el-input的边框1.通常取消边框的方法设置border为none2.还有其他类似边框的例如outlinebox-shadow这两个属性都是会产生边框效果3.el-input需要更改的话–如下需要修改box-shadow为空即可上代码:deep(.el-input__wrapper){align-items:center;background-color:#F7F
【双语新闻】AGI安全与对齐，DeepMind近期工作曲奇人工智能安全 agi 安全 llama 人工智能
我们想与AF社区分享我们最近的工作总结。以下是关于我们正在做什么，为什么会这么做以及我们认为它的意义所在的一些详细信息。我们希望这能帮助人们从我们的工作基础上继续发展，并了解他们的工作如何与我们相关联。byRohinShah,SebFarquhar,AncaDragan21stAug2024AIAlignmentForumWewantedtosharearecapofourrecentoutput
Awesome TensorFlow weixin_30594001 人工智能移动开发大数据
AwesomeTensorFlowAcuratedlistofawesomeTensorFlowexperiments,libraries,andprojects.Inspiredbyawesome-machine-learning.WhatisTensorFlow?TensorFlowisanopensourcesoftwarelibraryfornumericalcomputationusin
【ShuQiHere】探索人工智能核心：机器学习的奥秘 ShuQiHere 人工智能机器学习
【ShuQiHere】什么是机器学习？机器学习（MachineLearning,ML）是人工智能（ArtificialIntelligence,AI）中最关键的组成部分之一。它使得计算机不仅能够处理数据，还能从数据中学习，从而做出预测和决策。无论是语音识别、自动驾驶还是推荐系统，背后都依赖于机器学习模型。机器学习与传统的编程不同，它不再依赖于人类编写的固定规则，而是通过数据自我改进模型，从而更灵活
综述论文“A Survey of Zero-Shot Learning: Settings, Methods, and Applications” 硅谷秋水机器学习机器学习神经网络深度学习
该零样本学习综述，发表于ACMTrans.Intell.Syst.Technol.10,2,Article13(January2019)摘要：大多数机器学习方法着重于对已经在训练中看到其类别的实例进行分类。实际上，许多应用程序需要对实例进行分类，而这些实例的类以前没有见过。零样本学习（Zero-ShotLearning）是一种强大而有前途的学习范例，其中训练实例涵盖的类别与想分类的类别是不相交的。
机器学习 VS 表示学习 VS 深度学习 Efred.D 人工智能机器学习深度学习人工智能
文章目录前言一、机器学习是什么?二、表示学习三、深度学习总结前言本文主要阐述机器学习,表示学习和深度学习的原理和区别.一、机器学习是什么?机器学习(machinelearning),是从有限的数据集中学习到一定的规律,再把学到的规律应用到一些相似的样本集中做预测.机器学习的历史可以追溯到20世纪40年代McCulloch提出的人工神经元网络,目前学界大致把机器学习分为传统机器学习和机器学习两个类别
端到端的自动驾驶论文与代码整理大别山伧父自动驾驶
LearningbyCheatinggithubcodearxivpaperconferenceonrobotlearning最新进展(May2021)Checkoutourlatestfollow-upwork:WorldonRails(2020)Checkoutoursubmissiontothe2020CARLAChallenge!pass
Lt-8 Multithreading yanlingyun0210 java
IntendedLearningOutcomesTounderstandtheconceptofconcurrency.Tounderstandthedifferenceofaprocessandathread.TodefineathreadusingtheThreadclassandRunnableinterface.TocontrolthreadswithvariousThreadmethod
如何使用Pytorch-Metric-Learning？鱼儿也有烦恼 PyTorch pytorch
文章目录如何使用Pytorch-Metric-Learning？1.Pytorch-Metric-Learning库9个模块的功能1.1Sampler模块1.2Miner模块1.3Loss模块1.4Reducer模块1.5Distance模块1.6Regularizer模块1.7Trainer模块1.8Tester模块1.9Utils模块2.如何使用PyTorchMetricLearning库中的
[Kaiming]Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification MTandHJ neural networks
文章目录概主要内容PReLUKaiming初始化ForwardcaseBackwardcaseHeK,ZhangX,RenS,etal.DelvingDeepintoRectifiers:SurpassingHuman-LevelPerformanceonImageNetClassification[C].internationalconferenceoncomputervision,2015:1
深度神经网络详解：原理、架构与应用阿达C 活动 dnn 计算机网络人工智能神经网络机器学习深度学习
深度神经网络（DeepNeuralNetwork，DNN）是机器学习领域中最为重要和广泛应用的技术之一。它模仿人脑神经元的结构，通过多层神经元的连接和训练，能够处理复杂的非线性问题。在图像识别、自然语言处理、语音识别等领域，深度神经网络展示了强大的性能。本文将深入解析深度神经网络的基本原理、常见架构及其实际应用。一、深度神经网络的基本原理1.1神经元和感知器神经元是深度神经网络的基本组成单元。一个
前端开发需要了解的算法知识史努比的大头算法前端
手写深拷贝functiondeepClone(obj){//处理基础数据类型和函数if(obj===null||typeofobj!=='object'){returnobj;}//处理数组if(Array.isArray(obj)){returnobj.map(item=>deepClone(item));}//处理对象constclonedObj={};for(constkeyinobj){i
推荐开源项目：PyTorch-Metric-Learning 潘惟妍
推荐开源项目：PyTorch-Metric-Learningpytorch-metric-learningTheeasiestwaytousedeepmetriclearninginyourapplication.Modular,flexible,andextensible.WritteninPyTorch.项目地址:https://gitcode.com/gh_mirrors/py/pytorc
推荐：FastAPI驱动的稳定扩散LLMs演示项目褚知茉Jade
推荐：FastAPI驱动的稳定扩散LLMs演示项目FastAPI-for-Machine-Learning-Live-DemoThisrepositorycontainsthefilestobuildyourveryownAIimagegenerationwebapplication!OutlinedarethecorecomponentsoftheFastAPIwebframework,anda
【python】【Ray的概述】资源存储库 python 开发语言
Overview概述Rayisanopen-sourceunifiedframeworkforscalingAIandPythonapplicationslikemachinelearning.Itprovidesthecomputelayerforparallelprocessingsothatyoudon’tneedtobeadistributedsystemsexpert.Rayminimi
什么是监督学习（Supervised Learning）救救孩子把 AI AI 学习
一、监督学习概述监督学习（SupervisedLearning）是一种极具威力的机器学习方法，能够训练算法以识别数据中的模式，并据此进行精准的预测或分类。借助已有的标记数据，监督学习模型学会了从输入到输出的映射关系，进而在各类实际问题中实现自动化决策。无论是医疗诊断、金融市场分析、客户行为预测，还是提升生产效率以及个性化推荐系统等领域，监督学习都彰显出巨大的潜力与价值。随着技术的持续进步，监督学习
LLM系列(4)：通义千问7B在Swift/DeepSpeed上微调秘诀与实战陷阱避坑指南汀、人工智能 LLM工业级落地实践人工智能自然语言处理 prompt Swifi DeepSpeed 通义千问 Qwen
LLM系列(4)：通义千问7B在Swift/DeepSpeed上微调秘诀与实战陷阱避坑指南阿里云于2023年8月3日开源通义千问70亿参数模型，包括通用模型Qwen-7B以及对话模型Qwen-7B-Chat，这也是国内首个开源自家大模型的大厂。在诸多权威大模型能力测评基准上，如MMLU、C-Eval、GSM8K、HumanEval、WMT22，通义千问7B均取得了同参数级别开源模型中的最好表现，
使用3DUNet训练自己的数据集（pytorch）— 医疗影像分割编程日记✧ 智能医疗 pytorch 人工智能 python 计算机视觉图像处理深度学习健康医疗
代码：lee-zq/3DUNet-Pytorch:3DUNetimplementedwithpytorch(github.com)文章<cicek16miccai.pdf(uni-freiburg.de)3DU-Net:LearningDenseVolumetricSegmentation
探索任务的隐秘世界：推荐Task2Vec 邓越浪Henry
探索任务的隐秘世界：推荐Task2Vecaws-cv-task2vecOfficialcodeforthepaper"Task2Vec:TaskEmbeddingforMeta-Learning"(https://arxiv.org/abs/1902.03545,ICCV2019)项目地址:https://gitcode.com/gh_mirrors/aw/aws-cv-task2vec在机器学习
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C