chenxp2311

论文阅读：Comparative Study of Deep Learning Software Frameworks（ caffe、Neon、TensorFlow、Theano、Torch 之比较）

Preface

这周的例会的演讲人之一是我，我一周前就开始想讲这周要讲什么。感觉以前组里面的人讲的内容太偏重那些公式什么的。大家听的昏昏欲睡，所以我想不能讲那些太细节太公式化的东西。

最近不少人问我哪个开源框架好用，我自己用过 caffe、TensorFlow、Theano、Torch，用过之后虽然有一定的感觉。但我想很多东西需要实验来具体的验证。

正好我看自己的 Mendeley 中有一篇这个文章：《Comparative Study of Deep Learning Software Frameworks》，这篇文章对现在流行的五个开源深度学习框架 caffe、Neon、TensorFlow、Theano、Torch 做了比较，很严谨。作者也开源了他们的比较 Benchmarks 代码：https://github.com/DL-Benchmarks/DL-Benchmarks。

如果您急着看比较结果，可以从目录直接跳到 Conclusion 部分，^_^

下面就是这篇文章具体的内容，笔记。

Abstract

五个开源框架：caffe、Neon、TensorFlow、Theano、Torch
比较的三方面：可扩展性（extensibility）、hardware utilization（硬件利用率）以及大家最关心的：速度（speed）

评估测试都是部署在单机上，对于多线程 CPU、GPU（Nvidia Titan X）都进行测试；
速度评估标准包括了梯度计算时间（gradient computation time）、前向传播时间（forward time）；
对于卷积网络，作者还对这几个深度框架支持的不同的卷积算法以及相应的性能表现做了实验；

最后通过实验，作者发现 Theano、Torch 是最具扩展性的深度学习框架；
在 CPU 上的测试性能来看，Torch 最优，其次是 Theano；
在 GPU 上的性能表现，对于大规模卷积以及全连接网络，还是 Torch 最优，其次是 Neon；
但是 Theano 在部署和训练 LSTM 网络中夺得拔筹；
caffe 是最容易测试评估性能的标准深度学习框架；
最后，TensorFlow 与 Theano 有些相似，是比较灵活的框架，但是其性能表现，目前还跟上面的几个框架比不起来。

但是，这篇文章发表的时候，TensorFlow 还只能用 cuDNN v.2 版本。现在怎么样，还需要做新的实验。

Introduction

现在大多数成功的深度学习架构由几种不同类型的网络层组合而成，如 全连接层（fully connected layer）、卷积层（convolutional layer）、递归层（recurrent layer）。之后用各种 随机梯度下降算法（stochastic gradient descent algorithm），以及一些 正则化技术（regularization），如 dropout、weight decay。

伴随着深度学习的流行与成功，一些深度学习框架不断涌现，包括但不限于：

caffe: http://caffe.berkeleyvision.org/
DeepLearning4J: http://deeplearning4j.org/
deepmat: https://github.com/kyunghyuncho/deepmat
Neon: http://neon.nervanasys.com/docs/latest/index.html
Eblearn: http://eblearn.sourceforge.net/
PyLearn: http://deeplearning.net/software/pylearn2/
TensorFlow: https://www.tensorflow.org/
Theano: http://deeplearning.net/software/theano/
Torch: http://torch.ch/
MXnet: http://mxnet.readthedocs.io/en/latest/
chainer: https://github.com/pfnet/chainer

不同的框架从不同的角度去部署、训练深度学习算法。例如：caffe 强调使用的简单性，所以在 caffe 中，在网络中添加一个层很简单。又如，Theano 可以自动求微分，可以方便的修改架构，以便研究与开发。

前不久，有人已经评测了几种深度学习框架的性能：https://github.com/soumith/convnet-benchmarks，但是这个比较只是在卷积网络架构上进行比较（并且忽视掉了与卷积无关测网络层，如 dropout 层、Softmax 层）。

这篇文章对评测比较实验进行了扩展，从上面的一些开源架构中，选择了五种有代表性的框架：caffe、Neon、TensorFlow、Theano、Torch。
其中，caffe、Theano、Torch 是目前深度学习社区使用最多的框架。
本论文中加入 Neon 的评测，是因为在上面的评测中，Neon 取得了卓越的性能表现。
而对 TensorFlow 进行评测，是因为自从 TensorFlow 被 Google 开源之后，取得了耀眼的关注度，在 Github 上的 Star 数量已经到 27,362 了。而 caffe 也才 11,062 个 Star 。在这篇文章进行评测的时候，TensorFlow 还没有支持最新的 cuDNN v.3，还只支持 cuDNN v.2。但为了评测的完整性，还是将 TensorFlow 加进入了。

在对这些框架进行评估时，考虑以下三个方面：

可扩展型（Extensibility）: 一是对于不同类型的网络层：全连接层（fully-connected layer）、卷积层（convolutional layer）、递归层（recurrent layer）的组合能力；二是对于不同训练过程支持的能力，如非监督逐层预训练（unsupervised layer-wise pre-training）、监督训练（supervised learning）；三是对于不同卷积层的支持能力，如支持不支持 FFT-based 算法。
硬件利用率（Hardware Utilization）: 这些框架对于硬件资源的结合、调用情况。如对于多线程 CPU 的支持使用、对于 GPU 调用的设置情况。
速度（speed）: 这些框架在训练方面、部署方面的速度表现性能。

这项研究可以便于深度学习个人与企业，了解深度学习框架的强项、弱项，以便于可以根据自身的需求来使用这些开源框架。
此外，本文还探究了深度学习框架当前的一些不足与限制，以便在未来能够得到解决。

Overview of the deep learning frameworks

这里有一个深度学习框架列表，总结了目前几乎所有的深度学习框架：http://deeplearning.net/software_links/。现在这些框架有些已经成熟了，在 CUDA 的帮助下，能够非常高效地训练具有数百万个参数的神经网络。
下面的表1 展示了 Google groups 中使用者的数量，以及每个深度学习框架在 Github 仓库中贡献者的数量（截至2016.02.08）：

可以看见，使用者与贡献者最多的是：caffe、Theano、Torch，这也是本文选择这三个框架做评测的原因之一。

表2 展示了这几个深度学习框架的通用属性：

Benchmarking Setup

Evaluation Metrics

作者用下面的两个评估标准来评测五个开源深度学习框架的性能：

前向传播时间（Forward Time）: 给定一个数据集、神经网络，将输入数据通过网络处理后，产生相应的输出数据，这个过程走过的时间，就是前向传播的时间。如果我们要将深度网络部署在实际生活中应用，前向传播时间就非常重要。
梯度计算时间（Gradient Computation Time）: 对于给定的 input batch，每一个 parameter 得到一个对应的梯度的时间，这个时间消耗也被纳入评测标准。注意到，对于大多数的框架（如：Torch），梯度计算时间是指调用 forward 函数、 backward 函数，这两个函数计算所用时间之和。但是对于 Theano，梯度计算时间是指调用 Theano 编译生成的梯度计算函数，这个函数隐式地执行了 forward、backward 过程。另外，梯度计算时间不包含计算完梯度后，对梯度进行更新的时间。

因为对于 Theano ，一开始是需要花费时间去编译生成前向传播函数、梯度计算函数。

事实上，这个正是 Theano 被众多使用者“喷“的地方，因为速度实在是太…慢…了…我使用过 Theano 这个，但感觉还好，可能我的工程不是很大吧，但是这个确实是个问题。之后 Theano 执行的时候就一点也不慢了。因为这个过程是 Theano 将 Python 代码编译为 C 代码，所以调用的时候，速度很快。

这个 Theano 编译的时间也被记录，见下面表：

System setup

本实验都是在单机上完成的，操作系统为 Ubuntu 14.04，CPU 为 Intel Xeon CPU E5-1650 v2 @3.5GHz，GPU 为 Nvidia GeForce GTX Titan X/PCIe/SSE2，32G 的 DDR3 内存，SSD 硬盘。

使用的框架版本、依赖库及其版本：

OpenCV 3.0
OpenBLAS 0.2.14
caffe 使用的 commit ID：8c8e832
Neon 版本：1.0.0.rc1 (2015-09-08)，commit ID：a6766f
TensorFlow 版本：0.6.0，使用 pip install 安装的
Theano 版本：0.7.0.dev，commit ID：662ea98
Torch7，commit ID：8c8e832，fbcunn 的 commit ID：5bb9785
caffe、Theano、Torch 的 CUDA 版本为 CUDA 7.5，cuDNN 版本为 cuDNN v3。TensorFlow 的 CUDA 版本为 CUDA 7.0，cuDNN 版本为 cuDNN v2
Data arrays 是按照 float32 存储

Results and Discussion

评测实验一是在 MNIST 数据集、ImageNet 数据集上训练栈式自编码（stacked auto-encoder network）网络，卷积网络，二是在 IMDB review 数据集上训练 LSTM 网络。

注意，使用原始的框架，以及将这个深度学习框架结合基于 CUDA 包，这两者的测试结果可能会差别很大。
如在 Torch 中，我们可以用 Nvidia cuDNN 库，或者用 cunn 库，或者使用 fbcunn 库（Facebook AI 研究组开发的深度学习 CUDA 扩展库，包括 FFT-based 卷积）。
在 Theano 中，我们可以直接使用 cuDNN 或者 conv-fft 实施卷积操作，conv-fft 是 FFT-based 的 Theano 实现。

LeNet

第一个基准测试实验是在 MNIST 数据集，在 LeNet 网络上进行实验。与原始的 LeNet 不同，这里将原先的 Sigmoid 激活函数换成了 ReLU 激活函数，将原先的 RBF 网络 换成了 Softmax logistic loss layer。

LeNet 是第一个正式的卷积神经网络模型，在 LeCun 的 Paper 上：《Gradient-based learning applied to document recognition》，引用量 5368 次。
LeNet 包括两个 卷积 - 池化（conv-pooling） 层，两个 全连接层（fully connected layer），如下图所示：

下表展示了五个深度学习框架的梯度计算、前向传播过程在 CPU、GPU 上的平均处理时间。其中， batch size 设置为 64 。

对于 CPU 的实验统计时间，CPU 线程使用的个数也被统计在表格中。其中的 Neon 不能使用多线程，因此 Neon 的 CPU 实验时间统计只有但线程的结果。对于 caffe，caffe 的多线程使用的个数，需要在安装的时候决定好。这里是 12 个线程，因此 caffe 的 CPU 实验只有 12 线程的时间统计结果。
TensorFlow、Theano、Torch 可以灵活地选择使用的 CPU 线程数，因此他们的 CPU 的实验时间有多个结果。
因为我们的机器有 6 个物理核，但用 Hpyer-Threading 的技术，可以使用 12 个线程。因此，我们统计 6 线程、 12 线程的实验结果。

当用 GPU 进行实验时，对于每个深度学习框架，使用基础的卷积加速库（如：cuDNN），并指明版本（版本越高，速度越快）。Neon 使用自己的 GPU/CPU backend。

从结果中可以看出，对于训练 LeNet，GPU的效率相比较于 CPU，是碾压性的。而且，对于更大的数据量，更大的网络模型，GPU 的这种优势将会更明显。

CPU 阶段的实验来看，Torch 的表现最好，而 Neon 的表现最差。对于 GPU 的实验看，cuDNN 的加速效果要明显好于 conv-fft 。LeCun 的一篇 Paper 《Fast Training of Convolutional Networks Through FFT》提到，一般来说，FFT-based 的性能表现，高度取决于 input 的 size，以及 kernel size 。

梯度计算的时间最好的是 Theano，只有 1.4s ，当然，Torch 的表现也很棒， 1.7s 。而对于前向传播的时间，Theano 以及 Torch 打了个平手。之前耀眼的 TensorFlow 在 GPU 实验中的表现是最差的。可能的原因是 TensorFlow 使用的是 cuDNN v.2 版本，而 caffe、Theano、Torch 使用的是 cuDNN v.3 版本。

还应该注意到 MNIST 是相对较小的一个数据集，可以很容易的“放进“ CPU 的内存，或者 GPU 的显存中。因此，Theano、Torch、Neon 是一次性的将数据全部读入显存中。这样避免了后来将数据从本地拷贝到 GPU 中所造成的延迟。

在 Theano 中，这个可以用 shared variables 来完成。
在 Torch 中，可以调用 cuda( ) 函数来完成
在 Neon 中，可以使用 DataIterator class
在 TensorFlow 中，这个可以在定义变量的时候，通过设置合适的参数来完成
在 caffe 中，将整个训练数据集拷贝到显存中，可以用 MemoryData layer

下图展示了五个深度学习框架在 GPU 上，用不同的 batch size，各自 batch size 的梯度计算时间，前向传播时间的统计：

从图中可以看出，当 batch size 较小时，Theano 的梯度计算时间最短，而当 batch size 较大时，Neon 的梯度计算时间最短。
而在前向传播实验中，Theano 不管 batch size 的大小，其前向传播时间都最短，而且随着 batch size 的变大，其优势更明显。
caffe、Torch的表现，随着 batch size 的变大，其性能下降的很明显。TensorFlow 表现一直很“稳定“ — 性能都最差，尤其是当 batch size 越小的时候。

AlexNet

在这一部分的实验中，我们将用 ImageNet 去训练 AlexNet 。其实也有很多最新的、更大的网络模型，如 GoogleNet，Oxford Net 等等。但是因为 AlexNet 是第一个大幅提升 ImageNet 比赛结果的深度网络模型（ 2012 年 ImageNet 比赛），而且 AlexNet 非常流行，很具代表性。

AlexNet 前 5 层是卷积层，后 3 层是全连接层，最后一个全连接层的 output 是一个具有 1000 输出的 Softmax 。
如下示意图，应该很清楚的展现了 AlexNet 的结构：

图像被 crop 为 224×224 。并没有做数据增广处理（data augmentation，如：random cropping，transformation）。

要注意，每一个框架在读取 ImageNet 数据的时候，caffe 是使用了 LMDB 数据库格式，Neon 是使用了 ImgMaster 类，Theano 是使用了 Hickle，Torch 使用了多线程的数据加载（这里面提供的：https://github.com/soumith/imagenet-multiGPU.torch）。

这个 AlexNet 网络模型，caffe 的版本、Neon 的版本在它们的 Github 仓库中就有，但是 Neon 不支持 Grouping 层、LRN 层。
TensorFlow 的版本改编自：https://github.com/soumith/convnet-benchmarks，同样的，TensorFlow 目前还不支持 Grouping 层。
Theano 的版本改编自《Theano-based Large-scale Visual Recognition with Multiple GPUs》这篇文章里的，不过没有用 GPU 并行。

更具体的，实现每个框架的 AlexNet 的时候，我们没有使用 dimshuffle 操作。
Theano 在 GPU 上的卷积操作，本文既调用了来自 cuDNN 库里的 dnn.dnn_conv 函数，又使用了 pylearn2 中的 cuda-convnet 接口里面的对应的卷积操作函数。对于后者，本文标记为：cuconv 。
对于 Torch，跟上面的 LeNet 一样，我们既使用了 cuDNN 卷积卷积加速库，又使用了 cunn 库、fbcunn 库，并分别做了时间消耗统计。

由于 fbcunn 库，当 stride lengths 大于 1 的时候，不支持。所以实现这个版本的 AlexNet 的时候，一开始的卷积操作，我们使用了 cuDNN 的库函数，剩下的卷积操作，我们使用 fbcunn 库来完成。此外，fbcunn 库、cunn 库不支持 grouping 层。

下面的表，展示了当 batch size 等于 256 的时候，五个深度学习框架的 AlexNet 训练的效率统计：

为了更好的比较，每个框架的数据加载时间、数据预处理时间（mean normalization）被我们去除掉了。
我们还汇报了 GPU 显存使用的峰值，来展示每个框架的的效率。
在 CPU 实验中，Torch 的性能最好，与上面 LeNet 的测试结果相似。使用 GPU 时的加速效果比 LeNet 中更明显（提高了至少 25× ）。同时，Torch 在 GPU 上的 梯度计算 性能最好（上面 LeNet 实验时 Theano，不过那时候 Torch 与 Theano 相差无几）。但是在 前向传播 中，Neon 的性能最好，但是 Torch 也紧随其后，与之相差无几（Neon 中的没有 LRN 层，同时 grouping 设置为 1 ）。
与 LeNet 相似，TensorFlow 效果最差…

下面的图，展示了在 GPU 实验上（无 LRN 层，grouping 设置为 1 ），当 batch size 的大小设置不同的值时，五个深度学习框架的性能表现：

在 前向传播 性能测试上，Neon、Torch 的性能表现一直很优异，时间都最短。但是在 梯度计算 测试中，Neon 最好。

GPU 的使用效率上，caffe、Theano、Torch 的GPU使用效率都差不多（当使用 cuDNN 的时候），但是 Neon 的使用效率最高。TensorFlow 的消耗最大。

在本实验中，还注意到，caffe 中使用的 LMDB 数据库的性能相比较于 Neon 的，Theano 的，Torch 的数据读取，更高效，因为它支持并发读取（concurrent read）。caffe 还使用了 pre-fetching 来消除 IO 延迟。所以，Neon、Theano、Torch 在以后的改进中，可以加入对 LMDB 数据读取、pre-fetching 的支持。

论文中接下去在 栈式自编码网络（stacked autoencoders）、长短期记忆网络（LSTM）中的实验，由于我对这两种网络研究不深，所以先搁下，以后有机会再写。

Conclusions

通过上面的实验，以 梯度计算时间（gradient computation time）、前向传播时间（forward time） 为基准，比较了五个较为有影响力的深度学习框架：caffe、Theano、Neon、Torch 以及 TensorFlow 的性能。总结如下：

Theano、Torch 是两个最具有扩展性的深度学习框架，无论在支持的各种网络层种类数量上，或者是在支持的各种库上。symbolic differentiation 是 Theano 中对于非标准深度网络架构（non-standard deep architecture）提供的最有用的特性。Torch 正在补上这个空缺，可以参考这个博客：https://blog.twitter.com/2015/autograd-for-torch
在 CPU 上 training 以及 deploy，对于任何的网络模型，Torch 的性能都最优，其次是 Theano，Neon 的在 CPU 上的性能最差
在 GPU 上 deploy 已经训练好的卷积和全连接网络（也就是 前向传播过程），Torch 也是最适合的，其次是 Theano
在 GPU 上 training 卷积和全连接网络，Theano 在小网络模型（LeNet）的表现最好，在大网络模型（AlexNet）上，Torch 性能最佳。Neon 在大网络模型上也非常有优势
Torch 受益于它众多的扩展库及文档（这个确实，Torch 的文档阅读性很强，Theano 也不错），还有 Torch 的错误调试工具也很有优势
TensorFlow 是非常具有扩展性的一个深度学习框架，尤其是在不同情况的各种设备上，进行深度学习框架部署时，更方便稳定。但是在单机上，它的表现就不具有那么强的竞争力了

Postscript

看完这篇文章后，我发现其实本文还少了一个很重要的框架：MXnet 。MXnet 是由 DMLC 团队开发的，主要贡献者有发明 XGBoost 的陈天奇等等大神。在一些测试中，它的性能已经优于上面的几个框架，而且它也支持分布式，能够运行 Torch 的所有代码（我看 MXnet 的一个作者的微博上说的…没试过…）。

MXnet 与 caffe、TensorFlow 之间的对比，我推荐一篇博客吧，像上文中那样具体的实验分析在这里就先不写了。博客地址：http://chenrudan.github.io/blog/2015/11/18/comparethreeopenlib.html，个人感觉现在 MXnet 就是 model 太少了，不像 caffe，都有 Caffe Model Zoo ……

另外，再推荐一篇 Github 上的文章：https://github.com/zer0n/deepframeworks，也是对 Caffe、CNTK、TensorFlow、Theano、Torch 做了比对。从 Modeling Capability 、Interfaces、Model Deployment、Performance、Architecture 这几个方面做了比较。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
sublime个人设置 bawangtianzun sublime text 编辑器
如何拥有jiangly蒋老师同款编译器(sublimec++配置竞赛向）_哔哩哔哩_bilibiliSublimeText4的安装教程（新手竞赛向）-知乎(zhihu.com)创建文件自动保存为c++打开SublimeText软件。转到"Tools"（工具）>"Developer"（开发者）>"NewPlugin"（新建插件）。在打开的新文件中，粘贴以下代码：importsublimeimport
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
管理员权限的软件不能开机自启动的解决方法 ss_ctrl
这是几种解决方法：1.将启动参数写入到32位注册表里面去在64位系统下我们64位的程序访问此HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Run注册表路径，是可以正确访问的，32位程序访问此注册表路径时，默认会被系统自动映射到HKEY_LOCAL_MACHINE\SOFTWARE\WOW6432Node\Microsoft
golang学习笔记--MPG模型 xxzed golang #学习笔记学习笔记 golang
MPG模式：M（Machine）：操作系统的主线程P（Processor）：协程执行需要的资源（上下文context），可以看作一个局部的调度器，使go代码在一个线程上跑，他是实现从N：1到N：M映射的关键G（Goroutine）：协程，有自己的栈。包含指令指针（instructionpointer）和其它信息（正在等待的channel等等），用于调度。一个P下面可以有多个G1、当前程序有三个M,
【开发环境搭建】Macbook M1搭建Java开发环境 weixin_44329069 java 开发语言
JDK安装与配置下载并安装JDK：ARM64DMG安装包下载链接：JDK21forMac(ARM64)。双击下载的DMG文件，按照提示安装JDK。配置环境变量：打开终端，使用vim编辑.bash_profile文件：vim~/.bash_profile在文件中添加以下内容来设置JAVA_HOME：exportJAVA_HOME=/Library/Java/JavaVirtualMachines/j
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
ResNet的半监督和半弱监督模型 Valar_Morghulis
Billion-scalesemi-supervisedlearningforimageclassificationhttps://arxiv.org/pdf/1905.00546.pdfhttps://github.com/facebookresearch/semi-supervised-ImageNet1K-models/权重在timm中也有：https://hub.fastgit.org/r
联邦学习 Federated learning Google I/O‘19 笔记努力搬砖的星期五笔记联邦学习机器学习机器学习 tensorflow
FederatedLearning:MachineLearningonDecentralizeddatahttps://www.youtube.com/watch?v=89BGjQYA0uE文章目录FederatedLearning:MachineLearningonDecentralizeddata1.DecentralizeddataEdgedevicesGboard:mobilekeyboa
PCL 怎样可视化深度图像 LeonDL168 PCL 计算机视觉人工智能视觉检测图像处理算法
本小节讲解如何可视化深度图像的两种方法，在3D视窗中以点云形式进行可视化（深度图像来源于点云），另一种是，将深度值映射为颜色，从而以彩色图像方式可视化深度图像。代码首先，在PCL（PointCloudLearning）中国协助发行的书提供光盘的第7章例2文件夹中，打开名为range_image_visualization.cpp的代码文件，同文件夹下可以找到相关的测试点云文件room_scan1.
Android Dialog圆角设置无效的问题 ly969434341 android
一，参考AndroidDialog圆角设置无效的问题https://blog.csdn.net/woshi_awei/article/details/99664527Android自定义Dialog实现通用圆角对话框https://cloud.tencent.com/developer/article/1740956二，原因Diallog的默认背景是白色（直角背景），我自定义的Dialog背景也是
uniapp+uview-plus实现微信小程序自定义tabbar yx_back 小程序前端 uniapp uni-app 微信小程序 uview-plus
参考文档微信小程序相关开发文档链接：https://developers.weixin.qq.com/miniprogram/dev/framework/ability/custom-tabbar.html虽然是uniapp框架但是实现方式和原生小程序相似实现思路1、app.json里面tabBar添加配置custom:true,其他和非自定义设置一样2、在components文件夹里添加Tabb
FISCO BCOS（十七）——— go SDK的使用林中有神君 #FISCO BCOS 2.8.0 golang 服务器 linux fisco bcos 区块链
1、创建一个工作目录root@wyg-virtual-machine:~/fisco#mkdirgoWorkSpace2、下载go-sdkroot@wyg-virtual-machine:~/fisco/
android 发一个可以下载的的android studio历史版本花花鱼 android android studio android ide
1、AndroidStudio下载文件归档|AndroidDevelopers2、上个图：
pytorch安装(windows) m0_62244898 windows 人工智能
（1）下载pycharmPyCharm:thePythonIDEforProfessionalDevelopersbyJetBrains(2)下载anacondaAnaconda|TheWorld'sMostPopularDataSciencePlatform(3)创建一个新环境：torchcondacreate-ntorch-y(4)进入新环境condaactivatetorch(5)加入清华源
Git报错（一）fatal: Could not read from remote repository. librarycode
解决方案来自CSDN：https://blog.csdn.net/cxwtsh123/article/details/79194263?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-3.control&dist_request_id=&depth_1-utm_source=distr
VOC数据集转换为CoCo数据集（亲测有效）情书学长人工智能学习笔记图像处理
#VOC数据集格式VOC格式的数据集分为3部分，Annotations、ImageSets、JPEGImages。（一）Annotations：存放数据标注的xml文件，格式如下：CUMID_train0001.pngC:\Users\86182\Desktop\CUMID_train\0001.pngUnknown2040136830MachineUnspecified0011933491451
【Vesta发号器源码】PropertyMachineIdsProvider DeanChangDM
Vesta发号器源码解析——PropertyMachineIdsProvider属性配置文件持有Id的模式,没啥东西，比单个的多了一个获取下一个的方法封装实现上略有一点点区别privatelong[]machineIds;privateintcurrentIndex;publiclonggetNextMachineId(){returngetMachineId();}publiclonggetMa
Awesome TensorFlow weixin_30594001 人工智能移动开发大数据
AwesomeTensorFlowAcuratedlistofawesomeTensorFlowexperiments,libraries,andprojects.Inspiredbyawesome-machine-learning.WhatisTensorFlow?TensorFlowisanopensourcesoftwarelibraryfornumericalcomputationusin
【ShuQiHere】探索人工智能核心：机器学习的奥秘 ShuQiHere 人工智能机器学习
【ShuQiHere】什么是机器学习？机器学习（MachineLearning,ML）是人工智能（ArtificialIntelligence,AI）中最关键的组成部分之一。它使得计算机不仅能够处理数据，还能从数据中学习，从而做出预测和决策。无论是语音识别、自动驾驶还是推荐系统，背后都依赖于机器学习模型。机器学习与传统的编程不同，它不再依赖于人类编写的固定规则，而是通过数据自我改进模型，从而更灵活
综述论文“A Survey of Zero-Shot Learning: Settings, Methods, and Applications” 硅谷秋水机器学习机器学习神经网络深度学习
该零样本学习综述，发表于ACMTrans.Intell.Syst.Technol.10,2,Article13(January2019)摘要：大多数机器学习方法着重于对已经在训练中看到其类别的实例进行分类。实际上，许多应用程序需要对实例进行分类，而这些实例的类以前没有见过。零样本学习（Zero-ShotLearning）是一种强大而有前途的学习范例，其中训练实例涵盖的类别与想分类的类别是不相交的。
go-etcd实战小书go golang 实战演练 golang etcd 服务发现服务注册微服务
etcd简介etcdisastronglyconsistent,distributedkey-valuestorethatprovidesareliablewaytostoredatathatneedstobeaccessedbyadistributedsystemorclusterofmachines.Itgracefullyhandlesleaderelectionsduringnetwork
梯度提升机 (Gradient Boosting Machines, GBM) ALGORITHM LOL boosting 集成学习机器学习
梯度提升机(GradientBoostingMachines,GBM)通俗易懂算法梯度提升机（GradientBoostingMachines，GBM）是一种集成学习算法，主要用于回归和分类问题。GBM本质上是通过训练一系列简单的模型（通常是决策树），然后将这些模型组合起来，从而提高整体预测性能。基本步骤初始模型：首先，我们用一个简单的模型（如一个常数值）作为预测模型，记为F0(x)F_0(x)F
机器学习 VS 表示学习 VS 深度学习 Efred.D 人工智能机器学习深度学习人工智能
文章目录前言一、机器学习是什么?二、表示学习三、深度学习总结前言本文主要阐述机器学习,表示学习和深度学习的原理和区别.一、机器学习是什么?机器学习(machinelearning),是从有限的数据集中学习到一定的规律,再把学到的规律应用到一些相似的样本集中做预测.机器学习的历史可以追溯到20世纪40年代McCulloch提出的人工神经元网络,目前学界大致把机器学习分为传统机器学习和机器学习两个类别
【HarmonyOS NEXT】List中的播放器组件如何全屏播放 Mayism123 harmonyos
【关键字】List/播放器/全屏【问题描述】List中的一个组件是一个播放器，点击全屏的时候如何让播放器全屏？【解决方案】video组件自带全屏接口requestFullscreen。参考文档地址：https://developer.huawei.com/consumer/cn/doc/harmonyos-references/ts-media-components-video-000000181
端到端的自动驾驶论文与代码整理大别山伧父自动驾驶
LearningbyCheatinggithubcodearxivpaperconferenceonrobotlearning最新进展(May2021)Checkoutourlatestfollow-upwork:WorldonRails(2020)Checkoutoursubmissiontothe2020CARLAChallenge!pass
安装python和pycharm B001XFX pycharm ide python
安装pycharm之前要先安装pythonpython安装包地址：WelcometoPython.org选择合适和版本，下载安装，安装过程中勾选path配置，可以直接配置好环境变量cmd中输入python--version检查是否安装成功，如果不显示可能是环境变量的问题；安装成功后，下载pycharm：PyCharm:thePythonIDEforProfessionalDevelopersbyJ
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h