DL&CV_study

重磅开源！ICCV2019~华为诺亚方舟实验室提出无需数据网络压缩技术!

原文链接： https://mp.weixin.qq.com/s?__biz=MzA4MzQ4Mzg2OQ==\x26amp;mid=2654201880\x26amp;idx=1\x26amp;sn=d1ba638aa9f1df54af289a32c6ccbfff\x26amp;chksm=843285aab3450cbcb9ff5d8ff703e83ce114e29fe543a457ec61c5afaf03c0a452e92d03e1aa\x26amp;mpshare=1\x26amp;scene=1\x26am

点上方蓝字计算机视觉联盟获取更多干货

在右上方 ··· 设为星标 ★，与你不见不散

编辑：Sophia计算机视觉联盟报道 | 公众号 CVLianMeng

转载于：华为诺亚方舟实验室

华为诺亚方舟实验室联合北京大学和悉尼大学发布论文《DAFL：Data-Free Learning of Student Networks》，提出了在无数据情况下的网络蒸馏方法（DAFL），比之前的最好算法在MNIST上提升了6个百分点，并且使用resnet18在CIFAR-10和100上分别达到了92%和74%的准确率（无需训练数据），该论文已被ICCV2019接收。

论文地址：https://arxiv.org/pdf/1904.01186

开源地址：https://github.com/huawei-noah/DAFL

研究背景

随着深度学习技术的发展，深度神经网络（CNN）已经被成功的应用于许多实际任务中（例如，图片分类、物体检测、语音识别等）。由于CNN需要巨大的计算资源，为了将它直接应用到手机、摄像头等小型移动设备上，许多神经网络的压缩和加速算法被提出。

虽然现有的神经网络压缩算法在大部分数据集上已经可以取得很好的压缩和加速效果，但是一个很重要的问题被忽略了：绝大多数的神经网络压缩算法都假设训练数据是可以获得的。然而，在现实生活应用中，数据集往往由于隐私、法律或传输限制等原因是不可获得的。例如，用户不想让自己的照片被泄露。因此，现有的方法在这些限制下无法被使用。有很少的工作关注在无数据情况下的网络压缩，然而，这些方法得到的压缩后的网络准确率下降很多，这是因为这些方法没有利用待压缩网络中的信息。为了解决这一问题，我们提出了一个新的无需训练数据的网络压缩方法，具体的，我们把给定的待压缩网络看作一个固定的判别器，接着，我们设计了一系列的损失函数来训练生成网络，使得生成图片可以代替训练数据集进行训练，最后，我们使用生成数据结合蒸馏算法得到压缩后的网络。实验表明，我们的算法在没有训练数据的情况下仍然可以达到和需要数据的压缩算法类似的准确率。

使用GAN生成训练数据

由于训练数据在实际中常常无法得到，在此情况下，神经网络的压缩变得十分困难，因此，本论文提出了利用生成网络生成与训练数据相似的样本，以便于神经网络的压缩。生成对抗网络（GAN）是一种可以生成数据的方法，包含生成网络与判别网络，生成网络希望输出和真实数据类似的图片，判别网络通过判别生成图片和真实图片帮助生成网络训练。然而，传统的GAN需要基于真实数据来训练判别器，这对于我们来说是无法进行的。

许多研究表明，训练好的判别器具有提取图像特征的能力，提取到的特征可以直接用于分类任务，所以，由于待压缩网络使用真实图片进行训练，也同样具有提取特征的能力，从而具有一定的分辨图像真假的能力。于是，我们把待压缩网络作为一个固定的判别器，以此来训练我们的生成网络。

然而，在传统GAN中，传统的判别器的输出是判定图片是否真假，只要让生成网络生成在判别器中分类为真的图片即可训练，但是，我们的待压缩网络为分类网络，其输出是分类结果，所以，我们需要重新设计生成网络的目标。通过观察真实图片在分类网络的响应，我们提出了以下损失函数。

在图像分类任务中，神经网络的训练采用的是交叉熵损失函数，在训练完成后，真实图片在网络中的输出将会是一个one-hot的向量，即分类类别对应的输出为1，其他的输出为0。于是，我们希望生成图片也具有类似的性质，我们的交叉熵损失函数定义为：

(1)

其中就是标准的交叉熵函数，由于生成图片并没有一个真实的标签，我们直接将其输出最大值对应的标签设定为它的伪标签。

在神经网络的训练中，由卷积核提取的特征也是输入图片的一种重要表示。先前的许多工作表明，卷积核提取的特征包含着图片的许多重要信息，将训练数据输入训练好的深度网络中，卷积核会产生更大的响应（相比于噪声或与此网络无关的数据），基于此，我们提出了特征激活损失函数定义为：

(2)

目标是让生成图像在待压缩网络中的特征响应值更大，这里我们采用了1范数来优化，原因是1范数相比于2范数会产生更加稀疏的值，而神经网络的响应也常常是稀疏的。

此外，为了让神经网络更好的训练，真实的训练数据对于每个类别的样本数目通常都保持一致，例如MNIST每个类别都含有6000张图片。于是，为了让生成网络产生各个类别样本的概率基本相同，我们引入信息熵，并定义了信息熵损失函数：

(3)

其中为标准的信息熵，信息熵的值越大，对于生成的一组样本来说，每个类别的数目就越平均，从而保证了生成样本的类别平均。

最后，我们将这三个损失函数组合起来，就可以得到我们生成器总的损失函数：

(4)

通过优化以上的损失函数，训练得到的生成器可以和真实的样本在待压缩网络具有类似的响应，从而更接近真实样本。

蒸馏算法

除了训练样本的缺失，需要被压缩的神经网络常常是只提供了输入和输出的接口，网络的结构和参数都是未知的。另外，本发明提出的生成网络生成的训练样本是无标注的，基于这两点，我们引入了教师学生网络学习范式，利用蒸馏算法实现利用未标注生成样本对黑盒网络的压缩。

蒸馏算法最早由Hinton提出，待压缩网络（教师网络）为一个具有高准确率但参数很多的神经网络，初始化一个参数较少的学生网络，通过让学生网络的输出和教师网络相同，学生网络的准确率在教师的指导下得到提高。

于是，我们使用交叉熵损失来使得学生网络的输出符合教师网络的输出，具体的损失函数为：

(5)

通过引入教师学生算法，我们解决了生成图片没有标签的问题，并且可以在待压缩网络结构未知的情况下对其进行压缩。

图1 Data-free Learning

算法1是本论文方法的流程。通过公式(5)，我们可以训练一个生成器来生成和原始图片服从相似分布的数据。接着，我们使用生成数据，基于蒸馏算法训练学生网络，从而完成无数据情况下的网络压缩。

算法1：Data-free Learning

实验结果

我们在MNIST、CIFAR、CelebA三个数据集上分别进行了实验。

表1是在MNIST数据集上的结果，我们使用了LeNet-5和一个Hinton提出的具有3个全连接层的网络作为待压缩模型，将他们的通道数目减半分别作为学生模型。可以看到，使用原始数据集的蒸馏算法产生的学生模型具有和教师模型一样的准确率，但是参数量和FLOPs都大大减少。然而，在没有数据的情况下，蒸馏算法无法被使用，之前的一个使用元数据的方法只能达到92%的准确率，大大低于使用数据的算法。我们还使用了随机生成的正态分布、UPSP数据集作为训练数据进行训练，USPS数据集和MNIST数据集一样，都是手写数字分类数据集，然而，他们分别只取得了88%和94%的准确率。本论文提出的方法得到了98%的准确率，大大超越了之前的方法，并且比使用替代数据集得到的结果也要好很多，和使用原始数据得到的结果基本相似。

表1 MNIST数据集实验结果

我们还在CIFAR-10和100数据集上进行了实验，使用的教师和学生模型分别为Resnet-34和18。在CIFAR上，我们使用CIFAR-10的数据作为CIFAR-100的替代训练集，使用CIFAR-100的数据作为CIFAR-10的替代训练集，虽然CIFAR-10和100非常相似，并且具有一些重叠的图片，然而，得到的结果距离使用原始数据集仍然有较大的差距，证明了在实际情况中使用相似的数据集来替代原始数据集并不能取得很好效果。本论文提出的方法同样取得了和使用原始数据集的蒸馏算法相似的结果，并且超越了使用替代数据集的结果。

表2 CIFAR数据集实验结果

我们又在CelebA数据集上进行了实验，同样取得了很好的结果。

表3 CelebA数据集实验结果

由于我们的方法由很多损失函数组成，我们通过消融实验来分析每个损失函数项的必要性。表4是消融实验的结果，可以看到，本论文提出的损失函数的每一项都很重要。

表4 消融实验

最后，我们对教师和学生得到的卷积核做了可视化，可以发现，我们的方法学到的学生网络和教师网络具有非常相似的结构，证明了本论文方法的有效性。

图2 卷积核可视化

Great Breakthrough! Huawei Noah's Ark Labs first pioneers a novel knowledge distillation technique without training data.

Huawei Noah's Ark Lab publishes the paper "DAFL:Data-Free Learning of Student Networks", which first proposed the knowledge distillation method without data. The proposed DAFL is superior to the state-of-the art methods on MNIST by 6% accuracy, and achieves 92% and 74% accuracy on the CIFAR-10 and 100 datasets using resnet-18 with no training data.The paper has been accepted by ICCV2019.

Background

Deep convolutional neural networks (CNNs) have been successfully used in various computer vision applications such as image classification, object detection and semantic segmentation. However, launching most of the widely used CNNs requires heavy computation and storage, which can only be used on PCs with modern GPU cards. Inorder to compress and speed-up pre-trained heavy deep models, various effective approaches have been proposed recently.

Although the above mentioned methods have made tremendous efforts on benchmark datasets and models, an important issue has not been widely noticed, i.e. most existing network compression and speed-up algorithms have a strong assumption that training samples of the original network are available. However, the training dataset is routinely unknown in real-world applications due to privacy and transmission limitations. For instance, users do not want to let their photos leaked to others. Therefore, conventional methods cannot be directly used for learning portable deep models under these practice constrains.Nevertheless, only a few works have been proposed for compressing deep models without training data. The performance of compressed networks using these methods is much lower than that of the original network, due to they cannot effectively utilize the pre-trained neural networks. To address the aforementioned problem, we propose a novel framework for compressing deep neural networks without the original training dataset. To be specific, the given heavy neural network is regarded as a fixed discriminator. Then, a generative network is established for alternating the original training set by extracting information from the network during the adversarial procedure, which can be utlized for learning smaller networks with acceptable performance. The superiority of the proposed method is demonstrated through extensive experiments on benchmark datasets and models.

GAN for Generating TrainingSamples

In order to learn portable network without original data, we exploit GAN to generate training samples utilizing the available information of the given network. Generative adversarial networks (GANs) have been widely applied forgenerating samples. GANs consist of a generator G and a discriminator D. G is expected to generate desired data while D is trained to identify the differences between real images and those produced by the generator. Adversarial learning techniques can be naturally employed to synthesize training data. However, the discriminator requires real images for training. In the absence of training data, it is thus impossible to train the discriminator as vanilla GANs.

Recent works have proved that the discriminator can learn the hierarchy of representations from samples, which encourages the generalization of D in other tasks like image classification. Instead of training a new discriminator as vanilla GANs, the given deep neural network can extract semantic features from images as well, since it has already been well trained on large-scale datasets.Hence, we propose to regard this given deep neural network as a fixed discriminator. Therefore, G can be optimized directly without training D together.

The output of the discriminator is a probability indicating whether an input imageis real or fake in vanilla GANs. However, given the teacher deep neural networkas the discriminator, the output is to classify images to different concept sets, instead of indicating the reality of images. The loss function in vanilla GANs is therefore inapplicable for approximating the original training set. Thus, we conduct thorough analysis on real images and their responses on this teacher network. Several new loss functions will be devised to reflect our observations.

On the image classification task, the teacher deep neural network adopts the cross entropy loss in the training stage. Specifically for multi-class classification, the outputs are encouraged to be one-hot vectors, where only one entry is 1 and all the others are 0s. If images generated by $G$ follow the same distribution as that of the training data of the teacher network, they should also have similar outputs as the training data. We thus introduce the one-hot loss:

(1)

where is the cross-entropyloss function. Since the generated images have no true label, we suggest to usethe index of the max value of its output as the pseudo label.

Besides predicted class labels by DNNs, intermediate features extracted by convolution layers are also important representations of input images. Since filters in theteacher DNNs have been trained to extract intrinsic patterns in training data, feature maps tend to receive higher activation value if input images are realrather than some random vectors. Hence, we define an activation loss functionas:

(2)

Moreover, to ease the training procedure of a deep neural network, the number of training examples in each category is usually balanced, e.g. there are 6,000 images ineach class in the MNIST dataset. We employ the information entropy loss to measure the class balance of generated images:

(3)

where is the information entropy. When the loss takes the minimum, G could generate images of each category with roughly the same probability. T

By combining the aforementioned three loss functions, we obtain the final objective function:

(4)

By minimizing the above function, the optimal generator can synthesize images that have the similar distribution as that of the training data previously used fortraining the teacher network.

Teacher-StudentInteractions

As mentioned above, the generated images have no true label. In addition, parameters and detailed architecture information could also be unavailable sometimes. Thus, we propose to utilized the teacher-student learning paradigm for learning portable CNNs with unlabeled generated data.

Knowledge Distillation (KD) is a widely used approach to transfer the output information from a heavy network to a smaller network for achieving higher performance. The student network can be optimized using the following loss function based on knowledge distillation:

(5)

Therefore, utilizing the knowledge transfer technique, a portable network can be optimized without the specific architecture of the given network.

Figure 1: Data-free Learning

Detailed procedures of the proposed Data-Free Learning(DAFL) scheme for learning efficient student neural networks is summarized in Algorithm 1 and Figure 1. First, we regard the well-trained teacher network as a fixed discriminator. Using the loss function in Eq.(5), we optimize a generator to generate images that follow the similar distribution as that of the original training images for the teacher network. Second, we utilize the knowledge distillation approach to directly transfer knowledge from the teacher network to the student network.

Algorithm 1：Data-free Learning

ExperimentalResults

We first implement experiments on the MNIST dataset. Two architectures are used for investigating the performance of proposed method, \ie a convolution-based architecture and a network consists of fully-connect layers. The student networks have significantly fewer parameters than teacher networks. Table 1 reports the results of different methods on the MNIST datasets. Traditional methods achieve decent results, but they cannot be applied without training data. A previous method using meta-data achieves only a 92.47% accuracy. We then use a similar dataset (USPS) to train the student network and achieves only 94.56% accuracy. The proposed method utilizing generative adversarial networks achieved a 98.20% accuracy, which is much higher than the previous data-free methods.

We then conduct experiments on CIFAR-10 and CIFAR-100 datasets using ResNet-34 and ResNet-18 as teacher and student, respectively. we train the student network using the CIFAR-100 dataset, which has considerable overlaps with the original CIFAR-10 dataset, but this network only achieves a 90.65% accuracy, which is obviously lower than that of the teacher model. In contrast, the student network trained utilizing the proposed method achieved a 92.22% accuracy with only synthetic data.

The experiments on the CelebA dataset also provide similar results.

Table 2 reports the ablation study of the proposed method, which indicates that each term of the loss function is essential.

We visualize the convolutional filters of teacher and student in Figure 2, and find that they are similar, which demonstrate the effectiveness of the proposed method.

Figure 2: Visualization of filters

Paper URL: https://arxiv.org/pdf/1904.01186

Github URL：https://github.com/huawei-noah/DAFL

END

声明：本文来源于华为

如有侵权，联系删除

联盟学术交流群

扫码添加联盟小编，可与相关学者研究人员共同交流学习：目前开设有人工智能、机器学习、计算机视觉、自动驾驶（含SLAM）、Python、求职面经、综合交流群扫描添加CV联盟微信拉你进群，备注：CV联盟

你可能感兴趣的:(重磅开源！ICCV2019~华为诺亚方舟实验室提出无需数据网络压缩技术!)

自然语言处理-基于预训练模型的方法-笔记
自然语言处理-基于预训练模型的方法-笔记【下载地址】自然语言处理-基于预训练模型的方法-笔记《自然语言处理-基于预训练模型的方法》由哈尔滨工业大学出版，深入探讨了NLP领域的前沿技术与预训练模型的应用。本书系统介绍了预训练模型的基本概念、发展历程及常见模型的原理，并通过丰富的实践案例与代码实现，帮助读者掌握这些技术在自然语言处理任务中的实际应用。无论是初学者、研发人员，还是希望提升NLP能力的研究
数据存储：使用Python存储数据到redis详解数据知道爬虫和逆向教程 python redis 数据库非关系型数据库
更多内容请见：爬虫和逆向教程-专栏介绍和目录文章目录一.安装相关库和进行连接二、存储数据到Redis2.1存储字符串2.2存储列表2.3存储集合2.4有序集合类型2.5存储哈希三、数据的持久化与过期设置3.1持久化3.2过期设置四、其它操作4.1删除操作4.2关闭连接4.3使用连接池4.4处理异常五、总结在Python中，我们可以使用redis-py库来与Redis数据库进行交互。以下是如何将数据
STM32串口通信详解晟盾科技嵌入式开发 stm32 嵌入式硬件单片机
1.引言STM32是一款广泛使用的32位微控制器，以其高性能、低功耗和丰富的外设而著称。串口通信（UART/USART）是STM32中最常用的通信方式之一，用于实现与计算机或其他设备的简单数据交换。本文将详细介绍如何在STM32上配置和使用串口通信。2.基本概念2.1UARTvsUSART•UART（UniversalAsynchronousReceiver-Transmitter）：通用异步收发
Flutter 入门 TE-茶叶蛋 Flutter flutter
文章目录前言一、Flutter入门篇1.环境搭建2.Dart语言基础3.第一个Flutter应用4.核心组件与布局5.状态管理（基础）二、Flutter进阶篇1.深度状态管理2.路由与导航3.网络与数据持久化4.动画与自定义绘制5.插件与平台交互6.性能优化7.测试与调试三、高级实战技巧1.架构设计2.跨平台适配3.混合开发4.国际化与无障碍四、学习资源推荐五、学习建议前言以下是一份系统的Flut
Redis GEO vs MongoDB 地理空间关键指标对比
方案对比：RedisGEO：优点：性能极快（微秒级）简单易用，支持距离计算缺点：仅支持位置查询，无法直接关联其他属性（如商家类型）需要额外存储详细信息（需要二次查询MySQL或MongoDB）数据同步：需要维护数据一致性（当商家位置更新时，需要同步更新Redis）MongoDB地理空间索引：优点：支持地理位置+属性联合查询（如查找附近且类型为“餐饮”的商家）数据与业务模型存储在一起，避免二次查询提
STM32中的UART详解
前言在嵌入式开发中，串口通信是最常用的调试与数据传输方式之一。UART（UniversalAsynchronousReceiver/Transmitter，通用异步收发传输器）作为一种简单、可靠的异步通信协议，被广泛应用于STM32与传感器、上位机、蓝牙模块等外设的交互场景。本文将从协议基础到STM32实战，全面解析UART协议在STM32中的应用，包含硬件设计、软件配置、实战案例及调试技巧，适合
MongoDB 数据库的备份与恢复 qq_33928223 数据库管理数据库 mongodb oracle
以下是MongoDB中使用mongodump和mongorestore进行数据库逻辑备份与恢复的完整指南：一、mongodump备份工具1.核心功能逻辑备份：将MongoDB中的数据以BSON/JSON格式导出到本地文件。灵活性：支持按数据库、集合、条件过滤备份。低影响：默认在后台运行，对线上服务影响较小。2.常用命令及参数mongodump\--host\#目标实例地址（默认localhost:
“Payload document size is larger than maximum of 16793600.“问题解决（MongoDB）阿宇来了 mongodb 数据库
遇到的错误：Payloaddocumentsizeislargerthanmaximumof16793600.表示尝试插入或更新的MongoDB文档大小超过了最大限制（16MB）。错误原因MongoDB对单个文档（document）的大小有硬性限制：最大为16MB。这是为了保证性能和内存使用效率。你当前操作的数据大小已超过这个限制（如提示中的16,793,600bytes≈16MB），因此Mong
Node.js REPL 教程红衣大叔 nodejs帮助文档 node.js vim 编辑器
Node.jsREPL(Read-Eval-PrintLoop)是一个交互式环境，允许你直接输入和执行JavaScript代码，无需创建文件。它是学习Node.js、测试代码片段和调试的强大工具。启动REPL有几种方式可以启动Node.jsREPL：直接运行node命令：node在特定文件目录下启动（如果需要访问当前目录的模块）：node使用环境变量（如设置特殊选项）：NODE_REPL_HIST
resttemplate默认超时时间_使用微软数据通信框架WCF：客户端调用服务超时分析 weixin_39665302 服务端设置超时时间
首先给出对调用超时的分析和解决办法，然后在给出完整和应用代码。1客户端调用超时运行客户端，执行调用ServiceProxyproxy=newServiceProxy();strings=proxy.GetData(1);通过配置sendTimeout参数设定超时时间，超时时间默认为1分钟，上述配置中采用了默认超时时间。InnerExceptionMessage请求通道在等待00:00:59.946
管理大数据存储的十大技巧 weixin_34238633 大数据数据库运维
在1990年，每一台应用服务器都倾向拥有直连式系统(DAS)。SAN的构建则是为了更大的规模和更高的效率提供共享的池存储。Hadoop已经逆转了这一趋势回归DAS。每一个Hadoop集群都拥有自身的——虽然是横向扩展型——直连式存储，这有助于Hadoop管理数据本地化，但也放弃了共享存储的规模和效率。如果你拥有多个实例或Hadoop发行版，那么你就将得到多个横向扩展的存储集群。而我们所遇到的最大挑
深度模型训练，加速数据读取遇到显卡跑不满的问题不是吧这都有重名遇到的问题 llama 人工智能 LLM python
实测在pytorch的dataloader中使用prefetch_factor参数的时候，如果数据在机械硬盘上显卡始终是跑不满的，瓶颈在数据预加载速度上，当数据放在固态硬盘的时候就可以跑满。问题排查过程：一直在跑模型，但是数据量比较大，之前有段时间还是比较头疼显卡跑不满的。后来直接用钞能力，加了内存条，将数据缓存后一次性读到内存中终于可以跑满了，然后后面就一直没管这个了，唯一的缺点就是每次开始训练
模型微调方法Prefix-Tuning ballball~~ 大模型人工智能算法大数据
简介：个人学习分享，如有错误，欢迎批评指正。随着大规模预训练语言模型（如GPT系列、BERT等）的广泛应用，如何高效、经济地针对特定任务对这些模型进行微调（Fine-Tuning）成为研究热点。传统的微调方法通常需要调整模型的大量参数，导致计算资源消耗大、适应新任务的速度慢。为了解决这一问题，Prefix-Tuning（前缀调优）作为一种高效的微调技术被提出，旨在通过引入少量可训练的前缀参数，达到
PTP 与 gPTP 的对比解析 ftdlk 人形机器人机器人自动驾驶
PTP与gPTP的对比解析PTP（PrecisionTimeProtocol）和gPTP（generalizedPrecisionTimeProtocol）均为高精度时间同步协议，但设计目标、应用场景及技术实现存在显著差异。以下是两者的核心区别：1.协议标准与目标特性PTP(IEEE1588)gPTP(IEEE802.1AS)标准版本IEEE1588-2008（主流）/IEEE1588-2019I
搜索、广告与推荐的比较
搜索搜索广告显示广告推荐首要准则相关性投资回报率(ROI)用户兴趣其他需求各垂直领域独立定义质量，安全性(Safety)多样性(diversity),新鲜度(freshness)索引规模~十亿级~百万级--千万级~百万级~百万级--亿级个性化较少的个性化需求~亿级用户规模上的个性化检索信号较为集中较为丰富Downstream优化不适用`适用广告明显比搜索容易部分的是不需要复杂的爬虫技术和PageR
推荐算法（推广搜）——广告和推荐有什么不同？
导语近几年新兴起一个行业：推广搜。即推荐、广告、搜索算法的简称。各大厂都隐隐将其作为公司核心技术来发展。此文将带领大家探秘广告和推荐有什么区别以及其相似处。再此强调一下，广告算法里面的推荐广告和自然推荐结果里的推荐系统进行对比，但因为广告算法里面还有“搜索广告”，搜索广告和推荐系统差异性就太大了，这里不做讨论。一、不同点1.1本质不同推荐广告和自然推荐本质中要处理的群体和衡量的利益完全不一样。（图
ssm高校奖助学金管理系统设计实现
以下是关于SSM高校奖助学金管理系统的技术栈、功能设计、数据库设计及测试设计的详细说明：技术栈后端框架：Spring+SpringMVC+MyBatis（SSM组合），提供IoC、AOP、事务管理和ORM支持。前端技术：Thymeleaf/JSP+Bootstrap+jQuery，实现动态页面和响应式布局。数据库：MySQL8.0，支持事务和高并发访问。安全框架：SpringSecurity，用于
【Statsmodels和SciPy介绍与常用方法】机器学习司猫白 scipy statsmodels 统计
Statsmodels库介绍与常用方法Statsmodels是一个强大的Python库，专注于统计建模和数据分析，广泛应用于经济学、金融、生物统计等领域。它提供了丰富的统计模型、假设检验和数据探索工具，适合进行回归分析、时间序列分析等任务。本文将介绍Statsmodels的核心功能，并通过代码示例展示其常用方法。Statsmodels简介Statsmodels建立在NumPy和SciPy的基础上，
TDengine DECIMAL 数据类型使用手册 TDengine （老段） TDengine 产品设计 tdengine 大数据时序数据库数据库物联网涛思数据 iot
TDengineDECIMAL数据类型使用手册1.概述DECIMAL数据类型用来存储高精度数值数据，在其他数据库也被称为NUMERIC。DECIMAL数据类型的基本运算返回的是精确结果，适用于需要精确计算的场景，如金融数据、货币计算等。相比于浮点数类型（FLOAT、DOUBLE），DECIMAL类型：优势：保证精确计算，避免浮点数舍入误差劣势：计算性能相对较低2.基本概念2.1核心术语DECIMA
（五)PS识别：压缩痕迹挖掘-压缩量化表与 DCT 系数分析超龄超能程序猿机器学习 python 图像处理人工智能计算机视觉
（一)PS识别：Python图像分析PS识别之道（二）PS识别：特征识别-直方图分析的从原理到实现（三)PS识别：基于噪声分析PS识别的技术实现（四)PS识别：基于边缘纹理检测分析PS识别的技术实现一介绍本文将介绍一种基于量化表分析和DCT系数分析的图片PS检测方法，帮助你判断图片是否经过处理。二实现原理量化表分析在JPEG图片的压缩过程中，量化表起着关键作用。不同的软件或处理操作可能会改变量化表
数据库MySQL与SQLite afab 数据库数据库 sqlite
常用数据库及Qt中的用法一、常用数据库数据库管理系统（DBMS）是旨在使用、检索和定义规则以验证和操作数据库中的数据的软件。有四种DBMS类型：关系型、面向对象型、分层型和网络型。有很多开源数据库，包括MySQL、SQLite等。SQLite：是一个开源的关系型数据库管理系统（RDBMS）。RDBMS在多个二维表中存储数据，而不是一个大表。每张表由包含唯一值的行组成，该值被称为键，用于连接各表。这
算法分析与设计实验2：实现克鲁斯卡尔算法和prim算法表白墙上别挂我算法笔记经验分享
实验原理（一）克鲁斯卡尔算法：一种用于求解最小生成树问题的贪心算法，该算法的基本思想是按照边的权重从小到大排序，然后依次选择边，并加入生成树中，同时确保不会形成环路，直到生成树包含图中所有的顶点为止。具体步骤：边的排序：将所有边按照权重从小到大排序。初始化：创建一个空的生成树（可以是一个空的图结构），以及一个用于记录每个顶点所属集合（或称为连通分量）的数据结构（例如并查集）。边的选择：依次选择排序
【Rust】数据类型 Panda-gallery Rust rust 算法开发语言
目录思维导图1.数据类型概述1.1标量类型1.1.1整数类型1.1.2浮点数类型1.1.3布尔类型1.1.4字符类型1.2复合类型1.2.1元组类型1.2.2数组类型2.类型注解与类型推断3.整数溢出处理4.数字运算5.示例思维导图1.数据类型概述Rust是一种静态类型语言，所有变量的类型在编译时必须明确。Rust支持两种主要的数据类型：标量类型和复合类型。1.1标量类型标量类型表示单一值，Rus
MySQL与SQLite区别 GoKu~ mysql sqlite
MySQL和SQLite都是关系型数据库管理系统（RDBMS），它们都使用SQL（结构化查询语言）作为标准查询语言。然而，尽管它们共享许多共同点，但它们在语法、功能、性能和存储机制方面存在一些差异。以下是一些主要的差异：1.存储引擎：-MySQL：支持多种存储引擎，如InnoDB、MyISAM、Memory等，每种存储引擎都有不同的特性，如事务支持、索引类型、数据存储方式等。-SQLite：只有一
SQLite和MySQL数据库的区别与应用坚持学习的小菜鸟数据库
简单来说，SQLITE功能简约，小型化，追求最大磁盘效率；MYSQL功能全面，综合化，追求最大并发效率。如果只是单机上用的，数据量不是很大，需要方便移植或者需要频繁读/写磁盘文件的话，就用SQLite比较合适；如果是要满足多用户同时访问，或者是网站访问量比较大是使用MYSQL比较合适。下面详细介绍两者的区别和应用：SQLiteSQLite是非凡的数据库，他可以进程在使用它的应用中。作为一个自包含、
Python常考面试题汇总（附答案） TT图图面试职场和发展
写在前面本文面向中高级Python开发，太基本的题目不收录。本文只涉及Python相关的面试题，关于网络、MySQL、算法等其他面试必考题会另外开专题整理。不是单纯的提供答案，抵制八股文！！更希望通过代码演示，原理探究等来深入讲解某一知识点，做到融会贯通。部分演示代码也放在了我的github的该目录下。语言基础篇Python的基本数据类型Python3中有六个标准的数据类型：Number（数字）(
Docker项目部署(黑马商城项目为例)
1.网络管理（容器互联）#创建自定义网络（项目隔离）dockernetworkcreatehmall-net//加入自定义网络的容器可以通过容器名互相访问#查看所有网络dockernetworkls#将现有容器加入网络（如MySQL）dockernetworkconnecthmall-netmysql--aliasdb2.MySQL容器部署（数据持久化）#启动MySQL容器dockerrun-d\
HTTP 响应头信息详解 lsx202406 开发语言
HTTP响应头信息详解引言HTTP（超文本传输协议）是互联网上应用最为广泛的网络协议之一。在HTTP协议中，响应头信息是服务器向客户端发送的重要信息之一。响应头信息包含了关于响应的元数据，如状态码、内容类型、缓存策略等。本文将详细介绍HTTP响应头信息的概念、类型、作用以及常见响应头信息的解析。HTTP响应头信息概述HTTP响应头信息是服务器在发送HTTP响应时，除了响应体之外，附加在响应体前面的
SQLite 数据库与其他数据库的对比分析数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent 数据库 sqlite ai
SQLite数据库与其他数据库的对比分析关键词：SQLite数据库、其他数据库、对比分析、数据库特性、应用场景摘要：本文旨在对SQLite数据库与其他常见数据库进行全面的对比分析。首先介绍了数据库对比分析的背景和目的，让读者了解为何需要进行这样的对比。接着详细阐述了SQLite以及其他具有代表性数据库（如MySQL、Oracle、PostgreSQL等）的核心概念和架构，通过Mermaid流程图展
SQLite - C/C++编程环境搭建与使用指南 lsx202406 开发语言
SQLite-C/C++编程环境搭建与使用指南引言SQLite是一款轻量级的数据库管理系统，广泛应用于嵌入式系统、移动设备、Web应用等场景。其独特的架构和易用性使其成为许多开发者的首选。本文将详细介绍如何搭建SQLite的C/C++编程环境，并探讨如何在C/C++程序中集成SQLite数据库。环境搭建1.获取SQLite首先，我们需要从SQLite的官方网站（https://www.sqlite
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。