yanglamei1962

使用 PyTorch C ++前端

PyTorch C ++前端是 PyTorch 机器学习框架的纯 C ++接口。虽然 PyTorch 的主要接口自然是 Python，但此 Python API 建立于大量的 C ++代码库之上，提供基本的数据结构和功能，例如张量和自动微分。 C ++前端公开了纯 C ++ 11 API，该 API 使用机器学习训练和推理所需的工具，扩展了此基础 C ++代码库。该拓展包括用于神经网络建模的通用组件的内置集合；使用自定义模块扩展此集合的 API；一个流行的优化算法库，例如随机梯度下降；具有 API 的并行数据加载器，用于定义和加载数据集；序列化例程等。

本教程将引导您完成使用 C ++前端训练模型的端到端示例。具体来说，我们将训练 DCGAN (一种生成模型），以生成 MNIST 数字的图像。虽然从概念上讲，这只是一个简单的示例，但它足以使您对 PyTorch C ++前端有个大概的了解，并可以满足训练更复杂模型的需求。我们将从一些鼓舞人心的词开始，说明您为什么要使用 C ++前端，然后直接深入定义和训练我们的模型。

Tip

观看来自 CppCon 2018 的简短的演讲，获得有关 C ++前端的快速而又幽默的演示。

Tip

本笔记概述了 C ++前端的组件和设计原理。

Tip

有关 PyTorch C ++生态系统的文档，请访问 https://pytorch.org/cppdocs 。您可以在此处找到高级描述以及 API 级文档。

动机

在我们开始 GAN 和 MNIST 数字的激动人心的旅程之前，让我们退一步来讨论为什么您要使用 C ++前端而不是 Python。我们(PyTorch 团队）创建了 C ++前端，以便能够在无法使用 Python 或根本不适合该工具的环境中进行研究。此类环境的示例包括：

低延迟系统：您可能希望在具有高帧率和低延迟要求的纯 C ++游戏引擎中进行强化学习研究。与 Python 库相比，使用纯 C ++库更适合这种环境。由于 Python 解释器运行缓慢，Python 可能根本无法处理此类问题。
高度多线程环境：由于全局解释器锁定(GIL），Python 一次不能运行多个系统线程。并行处理是一种替代方法，但可扩展性不强，并且存在很多缺点。 C ++没有这样的约束，线程易于使用和创建。需要高度并行化的模型，例如深层神经进化中使用的模型，可以从中受益。
现有的 C ++代码库：您可能下载了 C ++应用程序，其工作范围从后端服务器中的网页服务到照片编辑软件中的 3D 图形渲染应有尽有，并且希望将机器学习方法集成到您的系统中。 C ++前端使您可以继续使用 C ++，并省去在 Python 和 C ++之间来回绑定的麻烦，同时保留了传统 PyTorch(Python）大部分的灵活性和直观性。

C ++前端与 Python 前端并非是竞争关系。前者是对后者的补充。我们知道研究人员和工程师都喜欢 PyTorch，因为它具有简单，灵活和直观的 API。我们的目标是确保您可以在所有可能的环境(包括上述环境）中利用这些核心设计原则。如果上述的这些情况之一很好地描述了您的用例，或者您只是感兴趣或好奇，请在以下段落中继续研究 C ++前端。

Tip

C ++前端试图提供一个与 Python 前端尽可能接近的 API。如果您对 Python 前端有丰富的经验，并且问过自己“我可以使用 C ++前端做些什么？”，请像在 Python 中那样编写代码，并且大多数情况下，相同的函数和方法都可以在 C ++中使用。就像在 Python 中一样(记得用双冒号替换点）。

编写基本应用程序

首先，编写一个最小的 C ++应用程序，以验证我们是否在同一页面上了解我们的设置和构建环境。首先，您需要获取 LibTorch 发行版的副本-我们现成的 zip 归档文件，其中打包了使用 C ++前端所需的所有相关首部，库和 CMake 构建文件。 LibTorch 发行版可在 PyTorch 网站上下载，适用于 Linux，MacOS 和 Windows。本教程的其余部分将假定基本的 Ubuntu Linux 环境，但是您也可以在 MacOS 或 Windows 上进行学习。

Tip

关于安装 PyTorch的 C ++发行版的注释更详细地描述了以下步骤。

Tip

在 Windows 上，调试和发行版本不兼容 ABI。如果您打算以调试模式构建项目，请尝试使用 LibTorch 的调试版本。另外，请确保在下面的cmake --build .行中指定正确的配置。

第一步，通过从 PyTorch 网站获取的链接在本地下载 LibTorch 发行版。对于普通的 Ubuntu Linux 环境，这意味着运行以下步骤：

# If you need e.g. CUDA 9.0 support, please replace "cpu" with "cu90" in the URL below.
wget https://download.pytorch.org/libtorch/nightly/cpu/libtorch-shared-with-deps-latest.zip
unzip libtorch-shared-with-deps-latest.zip

接下来，让我们编写一个名为dcgan.cpp的小型 C ++文件，其中包含torch/torch.h，现在只需打印出三乘三的单位矩阵即可：

#include 
#include 

int main() {
  torch::Tensor tensor = torch::eye(3);
  std::cout << tensor << std::endl;
}

要在以后构建这个应用程序以及我们完整的训练脚本，我们将使用以下CMakeLists.txt文件：

cmake_minimum_required(VERSION 3.0 FATAL_ERROR)
project(dcgan)

find_package(Torch REQUIRED)

add_executable(dcgan dcgan.cpp)
target_link_libraries(dcgan "${TORCH_LIBRARIES}")
set_property(TARGET dcgan PROPERTY CXX_STANDARD 14)

注意

虽然 CMake 是 LibTorch 的推荐的构建系统，但这并不是硬性要求。您还可以使用 Visual Studio 项目文件，QMake，普通 Makefile 或您认为合适的任何其他构建环境。但是，我们不为此提供现成的支持。

在上面的 CMake 文件中记下第 4 行：find_package(Torch REQUIRED)。这表示 CMake 在查找 LibTorch 库的构建配置。为了使 CMake 知道在哪里找到这些文件，调用cmake时必须设置CMAKE_PREFIX_PATH。在执行此操作之前，让我们就dcgan应用程序的以下目录结构达成一致：_

dcgan/
  CMakeLists.txt
  dcgan.cpp

此外，我将指向未压缩的 LibTorch 分布的路径称为/path/to/libtorch。请注意，此必须是绝对路径。特别是，将CMAKE_PREFIX_PATH设置为../../libtorch之类的内容会以意想不到的方式中断，应该写$PWD/../../libtorch以获取相应的绝对路径。现在，我们准备构建我们的应用程序：

root@fa350df05ecf:/home# mkdir build
root@fa350df05ecf:/home# cd build
root@fa350df05ecf:/home/build# cmake -DCMAKE_PREFIX_PATH=/path/to/libtorch ..
-- The C compiler identification is GNU 5.4.0
-- The CXX compiler identification is GNU 5.4.0
-- Check for working C compiler: /usr/bin/cc
-- Check for working C compiler: /usr/bin/cc -- works
-- Detecting C compiler ABI info
-- Detecting C compiler ABI info - done
-- Detecting C compile features
-- Detecting C compile features - done
-- Check for working CXX compiler: /usr/bin/c++
-- Check for working CXX compiler: /usr/bin/c++ -- works
-- Detecting CXX compiler ABI info
-- Detecting CXX compiler ABI info - done
-- Detecting CXX compile features
-- Detecting CXX compile features - done
-- Looking for pthread.h
-- Looking for pthread.h - found
-- Looking for pthread_create
-- Looking for pthread_create - not found
-- Looking for pthread_create in pthreads
-- Looking for pthread_create in pthreads - not found
-- Looking for pthread_create in pthread
-- Looking for pthread_create in pthread - found
-- Found Threads: TRUE
-- Found torch: /path/to/libtorch/lib/libtorch.so
-- Configuring done
-- Generating done
-- Build files have been written to: /home/build
root@fa350df05ecf:/home/build# cmake --build . --config Release
Scanning dependencies of target dcgan
[ 50%] Building CXX object CMakeFiles/dcgan.dir/dcgan.cpp.o
[100%] Linking CXX executable dcgan
[100%] Built target dcgan

上面，我们首先在dcgan目录内创建一个build文件夹，进入该文件夹，运行cmake命令以生成必要的 build(Make）文件，最后通过运行cmake --build . --config Release成功编译该项目。现在我们准备执行最小的二进制文件并完成有关基本项目配置的这一部分：

root@fa350df05ecf:/home/build# ./dcgan
1  0  0
0  1  0
0  0  1
[ Variable[CPUFloatType]{3,3} ]

在我看来这就像一个单位矩阵！

定义神经网络模型

现在我们已经配置了基本环境，我们可以深入研究本教程中更有趣的部分。首先，我们将讨论如何在 C ++前端中定义模块并与之交互。我们将从基本的小规模示例模块开始，然后使用 C ++前端提供的广泛的内置模块库来实现完整的 GAN。

模块 API 基础

与 Python 界面一致，基于 C ++前端的神经网络由称为_模块_的可重用构建块组成。有一个基础模块类，所有其他模块都从该基础类派生。在 Python 中，此类为torch.nn.Module，在 C ++中为torch::nn::Module。除了实现模块封装的算法的forward()方法之外，模块通常还包含以下三种子对象中的任何一种：参数，缓冲区和子模块。

参数和缓冲区以张量的形式存储。参数记录梯度，但缓冲区不记录。参数通常是神经网络的可训练权重。缓冲区的示例包括批量标准化的均值和方差。为了重用特定的逻辑和状态块，PyTorch API 允许嵌套模块。嵌套模块称为_子模块_。

参数，缓冲区和子模块是必须被注册的。注册后，可以使用parameters()或buffers()之类的方法来检索整个(嵌套）模块层次结构中所有参数的容器。类似地，使用to(...)之类的方法，例如 to(torch::kCUDA)将所有参数和缓冲区从 CPU 移到 CUDA 内存，在整个模块层次结构上工作。

定义模块和注册参数

为了将这些词写成代码，让我们考虑一下用 Python 界面编写的简单模块：

import torch

class Net(torch.nn.Module):
  def __init__(self, N, M):
    super(Net, self).__init__()
    self.W = torch.nn.Parameter(torch.randn(N, M))
    self.b = torch.nn.Parameter(torch.randn(M))

  def forward(self, input):
    return torch.addmm(self.b, input, self.W)

在 C ++中，它看起来像这样：

#include 

struct Net : torch::nn::Module {
  Net(int64_t N, int64_t M) {
    W = register_parameter("W", torch::randn({N, M}));
    b = register_parameter("b", torch::randn(M));
  }
  torch::Tensor forward(torch::Tensor input) {
    return torch::addmm(b, input, W);
  }
  torch::Tensor W, b;
};

就像在 Python 中一样，我们定义了一个名为Net的类(为简单起见，这里是struct而不是class），然后从模块基类派生它。在构造函数内部，我们使用torch::randn创建张量，就像在 Python 中使用torch.randn一样。一个有趣的区别是我们如何注册参数。在 Python 中，我们用torch.nn.Parameter类包装了张量，而在 C ++中，我们不得不通过register_parameter方法传递张量。这样做的原因是 Python API 可以检测到属性为torch.nn.Parameter类型并自动注册此类张量。在 C ++中，反射非常有限，因此提供了一种更传统(而且并不是那么不可思议）的方法。

注册子模块并遍历模块层次结构

同样，我们可以注册参数，也可以注册子模块。在 Python 中，将子模块分配为模块的属性时，会自动检测并注册这些子模块：

class Net(torch.nn.Module):
  def __init__(self, N, M):
      super(Net, self).__init__()
      # Registered as a submodule behind the scenes
      self.linear = torch.nn.Linear(N, M)
      self.another_bias = torch.nn.Parameter(torch.rand(M))

  def forward(self, input):
    return self.linear(input) + self.another_bias

例如，允许使用parameters()方法来递归访问模块层次结构中的所有参数：

>>> net = Net(4, 5)
>>> print(list(net.parameters()))
[Parameter containing:
tensor([0.0808, 0.8613, 0.2017, 0.5206, 0.5353], requires_grad=True), Parameter containing:
tensor([[-0.3740, -0.0976, -0.4786, -0.4928],
        [-0.1434,  0.4713,  0.1735, -0.3293],
        [-0.3467, -0.3858,  0.1980,  0.1986],
        [-0.1975,  0.4278, -0.1831, -0.2709],
        [ 0.3730,  0.4307,  0.3236, -0.0629]], requires_grad=True), Parameter containing:
tensor([ 0.2038,  0.4638, -0.2023,  0.1230, -0.0516], requires_grad=True)]

要在 C ++中注册子模块，请使用恰当命名的register_module()方法注册类似torch::nn::Linear的模块：

struct Net : torch::nn::Module {
  Net(int64_t N, int64_t M)
      : linear(register_module("linear", torch::nn::Linear(N, M))) {
    another_bias = register_parameter("b", torch::randn(M));
  }
  torch::Tensor forward(torch::Tensor input) {
    return linear(input) + another_bias;
  }
  torch::nn::Linear linear;
  torch::Tensor another_bias;
};

Tip

您可以在torch::nn命名空间的文档中找到可用的内置模块的完整列表，例如torch::nn::Linear，torch::nn::Dropout或torch::nn::Conv2d。

微妙之处在于，为什么在构造函数的初始值设定项列表中创建子模块，而在构造函数的主体内部创建参数。这是有充分的理由的，我们将在下面有关 C ++前端的_所有权模型_的部分中对此进行介绍。但是，最终结果是，就像 Python 中一样，我们可以递归访问模块树的参数。调用parameters()将返回std::vector<torch::Tensor>，我们可以对其进行迭代：

int main() {
  Net net(4, 5);
  for (const auto& p : net.parameters()) {
    std::cout << p << std::endl;
  }
}

打印：

root@fa350df05ecf:/home/build# ./dcgan
0.0345
1.4456
-0.6313
-0.3585
-0.4008
[ Variable[CPUFloatType]{5} ]
-0.1647  0.2891  0.0527 -0.0354
0.3084  0.2025  0.0343  0.1824
-0.4630 -0.2862  0.2500 -0.0420
0.3679 -0.1482 -0.0460  0.1967
0.2132 -0.1992  0.4257  0.0739
[ Variable[CPUFloatType]{5,4} ]
0.01 *
3.6861
-10.1166
-45.0333
7.9983
-20.0705
[ Variable[CPUFloatType]{5} ]

具有三个参数，就像在 Python 中一样。为了也查看这些参数的名称，C ++ API 提供了named_parameters()方法，该方法返回OrderedDict，就像在 Python 中一样：

Net net(4, 5);
for (const auto& pair : net.named_parameters()) {
  std::cout << pair.key() << ": " << pair.value() << std::endl;
}

我们可以再次执行以查看输出：

root@fa350df05ecf:/home/build# make && ./dcgan                                                                                                                                            11:13:48
Scanning dependencies of target dcgan
[ 50%] Building CXX object CMakeFiles/dcgan.dir/dcgan.cpp.o
[100%] Linking CXX executable dcgan
[100%] Built target dcgan
b: -0.1863
-0.8611
-0.1228
1.3269
0.9858
[ Variable[CPUFloatType]{5} ]
linear.weight:  0.0339  0.2484  0.2035 -0.2103
-0.0715 -0.2975 -0.4350 -0.1878
-0.3616  0.1050 -0.4982  0.0335
-0.1605  0.4963  0.4099 -0.2883
0.1818 -0.3447 -0.1501 -0.0215
[ Variable[CPUFloatType]{5,4} ]
linear.bias: -0.0250
0.0408
0.3756
-0.2149
-0.3636
[ Variable[CPUFloatType]{5} ]

Note

torch::nn::Module的文档包含在模块层次结构上运行方法的完整列表中。

在转发模式下运行网络

要使用 C ++执行网络，我们只需调用我们自己定义的forward()方法：

int main() {
  Net net(4, 5);
  std::cout << net.forward(torch::ones({2, 4})) << std::endl;
}

打印：

root@fa350df05ecf:/home/build# ./dcgan
0.8559  1.1572  2.1069 -0.1247  0.8060
0.8559  1.1572  2.1069 -0.1247  0.8060
[ Variable[CPUFloatType]{2,5} ]

模块所有权

至此，我们知道了如何使用 C ++定义模块，注册参数，注册子模块，通过parameters()之类的方法遍历模块层次结构并最终运行模块的forward()方法。尽管在 C ++ API 中还有很多方法，类和主题需要使用，但我将为您提供完整菜单的文档。我们将在稍后实现 DCGAN 模型和端到端训练管道的过程中，涉及更多概念。在我们这样做之前，让我简要地谈谈 C ++前端为torch::nn::Module的子类提供的_所有权模型_。

在本次讨论中，所有权模型是指模块的存储和传递方式-确定特定模块实例的所有者或所有者_。在 Python 中，对象始终是动态分配的(在堆上），并具有引用语义。这是非常容易使用且易于理解的。实际上，在 Python 中，您可以很大程度上忽略对象的位置以及如何引用它们，而将精力集中在完成事情上。_

C ++是一种较低级的语言，它在此领域提供了更多选择。这增加了复杂性，并严重影响了 C ++前端的设计和人体工程学。特别是，对于 C ++前端中的模块，我们可以选择使用_或_值语义_或_参考语义。第一种情况是最简单的，并且在到目前为止的示例中已进行了展示：模块对象分配在堆栈上，并在传递给函数时可以复制，移动(使用std::move）或通过引用或指针获取：

struct Net : torch::nn::Module { };

void a(Net net) { }
void b(Net& net) { }
void c(Net* net) { }

int main() {
  Net net;
  a(net);
  a(std::move(net));
  b(net);
  c(&net);
}

对于第二种情况-参考语义-我们可以使用std::shared_ptr。引用语义的优势在于，就像在 Python 中一样，它减少了思考如何将模块传递给函数以及如何声明参数的认知开销(假设您在任何地方都使用shared_ptr）。

struct Net : torch::nn::Module {};

void a(std::shared_ptr net) { }

int main() {
  auto net = std::make_shared();
  a(net);
}

根据我们的经验，来自动态语言的研究人员非常喜欢引用语义而不是值语义，尽管后者比 C ++更“原生”。同样重要的是，torch::nn::Module的设计为了要与 Python API 的人体工程学保持紧密联系，要共享所有权。例如，采用我们先前的Net定义(此处为简称）：

struct Net : torch::nn::Module {
  Net(int64_t N, int64_t M)
    : linear(register_module("linear", torch::nn::Linear(N, M)))
  { }
  torch::nn::Linear linear;
};

为了使用linear子模块，我们想将其直接存储在我们的类中。但是，我们还希望模块基类了解并有权访问此子模块。为此，它必须存储对此子模块的引用。至此，我们已经达到了共享所有权的需要。 torch::nn::Module类和具体的Net类都需要引用该子模块。因此，基类将模块存储为shared_ptr，因此具体类也必须存储。

可是等等！在以上代码中我没有看到任何关于shared_ptr的提示！这是为什么？好吧，因为std::shared_ptr<MyModule>实在令人难受。为了保持研究人员的生产力，我们提出了一个精心设计的方案，以隐藏shared_ptr的提法-通常保留给值语义的好处-同时保留参考语义。要了解它是如何工作的，我们可以看一下核心库中torch::nn::Linear模块的简化定义(完整定义为，在此处）：

struct LinearImpl : torch::nn::Module {
  LinearImpl(int64_t in, int64_t out);

  Tensor forward(const Tensor& input);

  Tensor weight, bias;
};

TORCH_MODULE(Linear);

简而言之：该模块不是Linear，而是LinearImpl。然后，宏TORCH_MODULE定义了实际的Linear类。这个“生成的”类实际上是std::shared_ptr<LinearImpl>的包装。它是一个包装器，而不是简单的 typedef，因此，除其他事项外，构造函数仍可按预期工作，即，您仍然可以编写torch::nn::Linear(3, 4)而不是std::make_shared<LinearImpl>(3, 4)。我们将由宏创建的类称为模块_持有人_。与(共享）指针一样，您可以使用箭头运算符(例如model->forward(...)）访问基础对象。最终结果是一个所有权模型，该所有权模型非常类似于 Python API。引用语义成为默认语义，但是没有额外输入std::shared_ptr或std::make_shared。对于我们的Net，使用模块持有人 API 如下所示：

struct NetImpl : torch::nn::Module {};
TORCH_MODULE(Net);

void a(Net net) { }

int main() {
  Net net;
  a(net);
}

这里有一个微妙的问题值得一提。默认构造的std::shared_ptr为“空”，即包含空指针。什么是默认构造的Linear或Net？好吧，这是一个棘手的选择。我们可以说它应该是一个空(null）std::shared_ptr<LinearImpl>。但是，请记住Linear(3, 4)与std::make_shared<LinearImpl>(3, 4)相同。这意味着如果我们已确定Linear linear;应该为空指针，则将无法构造不采用任何构造函数参数或都不使用所有缺省构造函数的模块。因此，在当前的 API 中，默认构造的模块持有人(如Linear()）将调用基础模块的默认构造函数(LinearImpl()）。如果基础模块没有默认构造函数，则会出现编译器错误。要构造空持有人，可以将nullptr传递给持有人的构造函数。

实际上，这意味着您可以使用如先前所示的子模块，在_初始化程序列表_中注册并构造该模块：

struct Net : torch::nn::Module {
  Net(int64_t N, int64_t M)
    : linear(register_module("linear", torch::nn::Linear(N, M)))
  { }
  torch::nn::Linear linear;
};

或者，您可以先使用空指针构造持有人，然后在构造函数中为其分配值(Pythonistas 更熟悉）：

struct Net : torch::nn::Module {
  Net(int64_t N, int64_t M) {
    linear = register_module("linear", torch::nn::Linear(N, M));
  }
  torch::nn::Linear linear{nullptr}; // construct an empty holder
};

结论：您应该使用哪种所有权模型–哪种语义？ C ++前端的 API 最能支持模块所有者提供的所有权模型。这种机制的唯一缺点是在模块声明下方多了一行样板。也就是说，最简单的模型仍然是 C ++模块简介中显示的值语义模型。对于小的，简单的脚本，您也可以摆脱它。但是，由于技术原因，您迟早会发现它并不总是受支持。例如，序列化 API(torch::save和torch::load）仅支持模块支架(或普通shared_ptr）。因此，推荐使用模块持有人 API 和 C ++前端定义模块，此后我们将在本教程中使用此 API。

定义 DCGAN 模块

现在，我们有必要的背景和简介来定义我们要在本文中解决的机器学习任务的模块。回顾一下：我们的任务是从 MNIST 数据集生成数字图像。我们想使用生成对抗网络(GAN）解决此任务。特别是，我们将使用 DCGAN 体系结构-这是同类中最早的也是最简单的一种，但是完全可以完成此任务。

Tip

您可以在存储库中找到本教程中提供的完整源代码。

什么是 GAN aGAN？

GAN 由两个不同的神经网络模型组成：生成器_和_鉴别器。生成器从噪声分布中接收样本，其目的是将每个噪声样本转换为类似于目标分布的图像(在我们的情况下为 MNIST 数据集）。鉴别器又从 MNIST 数据集接收_实际_图像，或从生成器接收_假_图像。要求发出一个概率来判断特定图像的真实程度(接近1）或伪造(接近0）。来自鉴别器的关于由发生器产生的图像如何真实的反馈被用来训练发生器。鉴别器对真实性有多好的反馈将用于优化鉴别器。从理论上讲，生成器和鉴别器之间的微妙平衡使它们串联起来得到改善，从而导致生成器生成与目标分布无法区分的图像，从而使鉴别器(那时）的敏锐眼睛冒出了散发0.5的真实和真实可能性。假图片。对我们来说，最终结果是一台接收噪声作为输入并生成数字逼真的图像作为其输出的机器。

发电机模块

我们首先定义生成器模块，该模块由一系列转置的 2D 卷积，批处理归一化和 ReLU 激活单元组成。我们在定义自己的模块的forward()方法中显式地(在功能上）在模块之间传递输入：

struct DCGANGeneratorImpl : nn::Module {
  DCGANGeneratorImpl(int kNoiseSize)
      : conv1(nn::ConvTranspose2dOptions(kNoiseSize, 256, 4)
                  .bias(false)),
        batch_norm1(256),
        conv2(nn::ConvTranspose2dOptions(256, 128, 3)
                  .stride(2)
                  .padding(1)
                  .bias(false)),
        batch_norm2(128),
        conv3(nn::ConvTranspose2dOptions(128, 64, 4)
                  .stride(2)
                  .padding(1)
                  .bias(false)),
        batch_norm3(64),
        conv4(nn::ConvTranspose2dOptions(64, 1, 4)
                  .stride(2)
                  .padding(1)
                  .bias(false))
 {
   // register_module() is needed if we want to use the parameters() method later on
   register_module("conv1", conv1);
   register_module("conv2", conv2);
   register_module("conv3", conv3);
   register_module("conv4", conv4);
   register_module("batch_norm1", batch_norm1);
   register_module("batch_norm2", batch_norm2);
   register_module("batch_norm3", batch_norm3);
 }

 torch::Tensor forward(torch::Tensor x) {
   x = torch::relu(batch_norm1(conv1(x)));
   x = torch::relu(batch_norm2(conv2(x)));
   x = torch::relu(batch_norm3(conv3(x)));
   x = torch::tanh(conv4(x));
   return x;
 }

 nn::ConvTranspose2d conv1, conv2, conv3, conv4;
 nn::BatchNorm2d batch_norm1, batch_norm2, batch_norm3;
};
TORCH_MODULE(DCGANGenerator);

DCGANGenerator generator(kNoiseSize);

现在我们可以在DCGANGenerator上调用forward()将噪声样本映射到图像。

选择的特定模块，例如nn::ConvTranspose2d和nn::BatchNorm2d，遵循前面概述的结构。 kNoiseSize常数确定输入噪声矢量的大小，并将其设置为100。当然，超参数是通过研究生的血统发现的。

注意

在超参数的发现中，没有研究生受到伤害。他们定期喂给 Soylent。

Note

简要介绍如何将选项传递给 C ++前端中的Conv2d等内置模块：每个模块都有一些必需的选项，例如BatchNorm2d的功能数量。如果您只需要配置所需的选项，则可以将它们直接传递给模块的构造函数，例如BatchNorm2d(128)或Dropout(0.5)或Conv2d(8, 4, 2)(用于输入通道数，输出通道数和内核大小）。但是，如果需要修改其他通常默认设置的选项，例如Conv2d的bias，则需要构造并传递_选项_对象。 C ++前端中的每个模块都有一个关联的选项结构，称为ModuleOptions，其中Module是模块的名称，例如Linear的LinearOptions。这就是我们上面的Conv2d模块的工作。

鉴别模块

鉴别器类似地是卷积，批归一化和激活的序列。但是，卷积现在是常规的卷积，而不是转置的卷积，我们使用 alpha 值为 0.2 的泄漏 ReLU 代替了普通的 ReLU。同样，最后的激活变为 Sigmoid，将值压缩到 0 到 1 之间。然后，我们可以将这些压缩后的值解释为鉴别器分配给真实图像的概率。

为了构建鉴别器，我们将尝试不同的方法：顺序模块。像在 Python 中一样，PyTorch 在此提供了两种用于模型定义的 API：一种功能，其中的输入通过连续的函数传递(例如，生成器模块示例），而另一种面向对象的，其中我们构建了顺序模块包含整个模型作为子模块。使用顺序，鉴别符将如下所示：

nn::Sequential discriminator(
  // Layer 1
  nn::Conv2d(
      nn::Conv2dOptions(1, 64, 4).stride(2).padding(1).bias(false)),
  nn::LeakyReLU(nn::LeakyReLUOptions().negative_slope(0.2)),
  // Layer 2
  nn::Conv2d(
      nn::Conv2dOptions(64, 128, 4).stride(2).padding(1).bias(false)),
  nn::BatchNorm2d(128),
  nn::LeakyReLU(nn::LeakyReLUOptions().negative_slope(0.2)),
  // Layer 3
  nn::Conv2d(
      nn::Conv2dOptions(128, 256, 4).stride(2).padding(1).bias(false)),
  nn::BatchNorm2d(256),
  nn::LeakyReLU(nn::LeakyReLUOptions().negative_slope(0.2)),
  // Layer 4
  nn::Conv2d(
      nn::Conv2dOptions(256, 1, 3).stride(1).padding(0).bias(false)),
  nn::Sigmoid());

Tip

Sequential模块仅执行功能组合。第一个子模块的输出成为第二个子模块的输入，第三个子模块的输出成为第四个子模块的输入，依此类推。

加载数据中

现在我们已经定义了生成器和鉴别器模型，我们需要一些可以用来训练这些模型的数据。与 Python 一样，C ++前端也具有强大的并行数据加载器。该数据加载器可以从数据集中读取批次数据(您可以定义自己），并提供许多配置旋钮。

Note

尽管 Python 数据加载器使用多重处理，但 C ++数据加载器实际上是多线程的，不会启动任何新进程。

数据加载器是 C ++前端data API 的一部分，该 API 包含在torch::data::名称空间中。该 API 由几个不同的组件组成：

数据加载器类，
用于定义数据集的 API，
用于定义_转换_的 API，可以将其应用于数据集，
用于定义_采样器_的 API，该采样器会生成用于对数据集建立索引的索引，
现有数据集，变换和采样器的库。

对于本教程，我们可以使用 C ++前端附带的MNIST数据集。让我们为此实例化一个torch::data::datasets::MNIST，并应用两个转换：首先，我们对图像进行归一化，以使其在-1至+1的范围内(从0到1的原始范围）。其次，我们应用Stack 归类，它采用一批张量并将它们沿第一维堆叠为单个张量：

auto dataset = torch::data::datasets::MNIST("./mnist")
    .map(torch::data::transforms::Normalize<>(0.5, 0.5))
    .map(torch::data::transforms::Stack<>());

请注意，相对于执行训练二进制文件的位置，MNIST 数据集应位于./mnist目录中。您可以使用此脚本下载 MNIST 数据集。

接下来，我们创建一个数据加载器并将其传递给此数据集。为了创建一个新的数据加载器，我们使用torch::data::make_data_loader，它返回正确类型的std::unique_ptr(取决于数据集的类型，采样器的类型以及其他一些实现细节）：

auto data_loader = torch::data::make_data_loader(std::move(dataset));

数据加载器确实提供了很多选项。您可以在处检查全套。例如，为了加快数据加载速度，我们可以增加工作人员的数量。默认数字为零，这表示将使用主线程。如果将workers设置为2，将产生两个线程并发加载数据。我们还应该将批次大小从其默认值1增大到更合理的值，例如64(kBatchSize的值）。因此，让我们创建一个DataLoaderOptions对象并设置适当的属性：

auto data_loader = torch::data::make_data_loader(
    std::move(dataset),
    torch::data::DataLoaderOptions().batch_size(kBatchSize).workers(2));

现在，我们可以编写一个循环来加载批量数据，目前我们仅将其打印到控制台：

for (torch::data::Example<>& batch : *data_loader) {
  std::cout << "Batch size: " << batch.data.size(0) << " | Labels: ";
  for (int64_t i = 0; i < batch.data.size(0); ++i) {
    std::cout << batch.target[i].item() << " ";
  }
  std::cout << std::endl;
}

在这种情况下，数据加载器返回的类型为torch::data::Example。此类型是一种简单的结构，其中的data字段用于数据，而target字段用于标签。因为我们之前应用了Stack归类，所以数据加载器仅返回一个这样的示例。如果我们未应用排序规则，则数据加载器将改为生成std::vector<torch::data::Example<>>，批处理中每个示例包含一个元素。

如果重新生成并运行此代码，则应看到类似以下内容的内容：

root@fa350df05ecf:/home/build# make
Scanning dependencies of target dcgan
[ 50%] Building CXX object CMakeFiles/dcgan.dir/dcgan.cpp.o
[100%] Linking CXX executable dcgan
[100%] Built target dcgan
root@fa350df05ecf:/home/build# make
[100%] Built target dcgan
root@fa350df05ecf:/home/build# ./dcgan
Batch size: 64 | Labels: 5 2 6 7 2 1 6 7 0 1 6 2 3 6 9 1 8 4 0 6 5 3 3 0 4 6 6 6 4 0 8 6 0 6 9 2 4 0 2 8 6 3 3 2 9 2 0 1 4 2 3 4 8 2 9 9 3 5 8 0 0 7 9 9
Batch size: 64 | Labels: 2 2 4 7 1 2 8 8 6 9 0 2 2 9 3 6 1 3 8 0 4 4 8 8 8 9 2 6 4 7 1 5 0 9 7 5 4 3 5 4 1 2 8 0 7 1 9 6 1 6 5 3 4 4 1 2 3 2 3 5 0 1 6 2
Batch size: 64 | Labels: 4 5 4 2 1 4 8 3 8 3 6 1 5 4 3 6 2 2 5 1 3 1 5 0 8 2 1 5 3 2 4 4 5 9 7 2 8 9 2 0 6 7 4 3 8 3 5 8 8 3 0 5 8 0 8 7 8 5 5 6 1 7 8 0
Batch size: 64 | Labels: 3 3 7 1 4 1 6 1 0 3 6 4 0 2 5 4 0 4 2 8 1 9 6 5 1 6 3 2 8 9 2 3 8 7 4 5 9 6 0 8 3 0 0 6 4 8 2 5 4 1 8 3 7 8 0 0 8 9 6 7 2 1 4 7
Batch size: 64 | Labels: 3 0 5 5 9 8 3 9 8 9 5 9 5 0 4 1 2 7 7 2 0 0 5 4 8 7 7 6 1 0 7 9 3 0 6 3 2 6 2 7 6 3 3 4 0 5 8 8 9 1 9 2 1 9 4 4 9 2 4 6 2 9 4 0
Batch size: 64 | Labels: 9 6 7 5 3 5 9 0 8 6 6 7 8 2 1 9 8 8 1 1 8 2 0 7 1 4 1 6 7 5 1 7 7 4 0 3 2 9 0 6 6 3 4 4 8 1 2 8 6 9 2 0 3 1 2 8 5 6 4 8 5 8 6 2
Batch size: 64 | Labels: 9 3 0 3 6 5 1 8 6 0 1 9 9 1 6 1 7 7 4 4 4 7 8 8 6 7 8 2 6 0 4 6 8 2 5 3 9 8 4 0 9 9 3 7 0 5 8 2 4 5 6 2 8 2 5 3 7 1 9 1 8 2 2 7
Batch size: 64 | Labels: 9 1 9 2 7 2 6 0 8 6 8 7 7 4 8 6 1 1 6 8 5 7 9 1 3 2 0 5 1 7 3 1 6 1 0 8 6 0 8 1 0 5 4 9 3 8 5 8 4 8 0 1 2 6 2 4 2 7 7 3 7 4 5 3
Batch size: 64 | Labels: 8 8 3 1 8 6 4 2 9 5 8 0 2 8 6 6 7 0 9 8 3 8 7 1 6 6 2 7 7 4 5 5 2 1 7 9 5 4 9 1 0 3 1 9 3 9 8 8 5 3 7 5 3 6 8 9 4 2 0 1 2 5 4 7
Batch size: 64 | Labels: 9 2 7 0 8 4 4 2 7 5 0 0 6 2 0 5 9 5 9 8 8 9 3 5 7 5 4 7 3 0 5 7 6 5 7 1 6 2 8 7 6 3 2 6 5 6 1 2 7 7 0 0 5 9 0 0 9 1 7 8 3 2 9 4
Batch size: 64 | Labels: 7 6 5 7 7 5 2 2 4 9 9 4 8 7 4 8 9 4 5 7 1 2 6 9 8 5 1 2 3 6 7 8 1 1 3 9 8 7 9 5 0 8 5 1 8 7 2 6 5 1 2 0 9 7 4 0 9 0 4 6 0 0 8 6
...

这意味着我们能够成功地从 MNIST 数据集中加载数据。

编写训练循环

现在，让我们完成示例的算法部分，并实现生成器和鉴别器之间的精妙舞蹈。首先，我们将创建两个优化器，一个用于生成器，一个用于区分器。我们使用的优化程序实现了 Adam 算法：

torch::optim::Adam generator_optimizer(
    generator->parameters(), torch::optim::AdamOptions(2e-4).beta1(0.5));
torch::optim::Adam discriminator_optimizer(
    discriminator->parameters(), torch::optim::AdamOptions(5e-4).beta1(0.5));

Note

在撰写本文时，C ++前端提供了实现 Adagrad，Adam，LBBFG，RMSprop 和 SGD 的优化器。文档具有最新列表。

接下来，我们需要更新我们的训练循环。我们将添加一个外部循环以在每个时期耗尽数据加载器，然后编写 GAN 训练代码：

for (int64_t epoch = 1; epoch <= kNumberOfEpochs; ++epoch) {
  int64_t batch_index = 0;
  for (torch::data::Example<>& batch : *data_loader) {
    // Train discriminator with real images.
    discriminator->zero_grad();
    torch::Tensor real_images = batch.data;
    torch::Tensor real_labels = torch::empty(batch.data.size(0)).uniform_(0.8, 1.0);
    torch::Tensor real_output = discriminator->forward(real_images);
    torch::Tensor d_loss_real = torch::binary_cross_entropy(real_output, real_labels);
    d_loss_real.backward();

    // Train discriminator with fake images.
    torch::Tensor noise = torch::randn({batch.data.size(0), kNoiseSize, 1, 1});
    torch::Tensor fake_images = generator->forward(noise);
    torch::Tensor fake_labels = torch::zeros(batch.data.size(0));
    torch::Tensor fake_output = discriminator->forward(fake_images.detach());
    torch::Tensor d_loss_fake = torch::binary_cross_entropy(fake_output, fake_labels);
    d_loss_fake.backward();

    torch::Tensor d_loss = d_loss_real + d_loss_fake;
    discriminator_optimizer.step();

    // Train generator.
    generator->zero_grad();
    fake_labels.fill_(1);
    fake_output = discriminator->forward(fake_images);
    torch::Tensor g_loss = torch::binary_cross_entropy(fake_output, fake_labels);
    g_loss.backward();
    generator_optimizer.step();

    std::printf(
        "\r[%2ld/%2ld][%3ld/%3ld] D_loss: %.4f | G_loss: %.4f",
        epoch,
        kNumberOfEpochs,
        ++batch_index,
        batches_per_epoch,
        d_loss.item(),
        g_loss.item());
  }
}

上面，我们首先在真实图像上评估鉴别器，为此应为其分配较高的概率。为此，我们使用torch::empty(batch.data.size(0)).uniform_(0.8, 1.0)作为目标概率。

Note

我们选择均匀分布在 0.8 到 1.0 之间的随机值，而不是各处的 1.0，以使鉴别器训练更加可靠。此技巧称为_标签平滑_。

在评估鉴别器之前，我们将其参数的梯度归零。计算完损耗后，我们通过调用d_loss.backward()计算新的梯度来在网络中反向传播。我们对虚假图像重复此步骤。我们不使用数据集中的图像，而是让生成器通过为它提供一批随机噪声来为此创建伪造图像。然后，我们将这些伪造图像转发给鉴别器。这次，我们希望鉴别器发出低概率，最好是全零。一旦计算了一批真实图像和一批伪造图像的鉴别器损耗，我们就可以一步一步地进行鉴别器的优化程序，以更新其参数。

为了训练生成器，我们再次首先将其梯度归零，然后在伪图像上重新评估鉴别器。但是，这一次，我们希望鉴别器将概率分配为非常接近的概率，这将表明生成器可以生成使鉴别器认为它们实际上是真实的图像(来自数据集）。为此，我们用全部填充fake_labels张量。最后，我们逐步使用生成器的优化器来更新其参数。

现在，我们应该准备在 CPU 上训练我们的模型。我们还没有任何代码可以捕获状态或示例输出，但是我们稍后会添加。现在，让我们观察一下我们的模型正在_做某事_ –我们稍后将根据生成的图像来验证这是否有意义。重建和运行应打印如下内容：

root@3c0711f20896:/home/build# make && ./dcgan
Scanning dependencies of target dcgan
[ 50%] Building CXX object CMakeFiles/dcgan.dir/dcgan.cpp.o
[100%] Linking CXX executable dcgan
[100%] Built target dcga
[ 1/10][100/938] D_loss: 0.6876 | G_loss: 4.1304
[ 1/10][200/938] D_loss: 0.3776 | G_loss: 4.3101
[ 1/10][300/938] D_loss: 0.3652 | G_loss: 4.6626
[ 1/10][400/938] D_loss: 0.8057 | G_loss: 2.2795
[ 1/10][500/938] D_loss: 0.3531 | G_loss: 4.4452
[ 1/10][600/938] D_loss: 0.3501 | G_loss: 5.0811
[ 1/10][700/938] D_loss: 0.3581 | G_loss: 4.5623
[ 1/10][800/938] D_loss: 0.6423 | G_loss: 1.7385
[ 1/10][900/938] D_loss: 0.3592 | G_loss: 4.7333
[ 2/10][100/938] D_loss: 0.4660 | G_loss: 2.5242
[ 2/10][200/938] D_loss: 0.6364 | G_loss: 2.0886
[ 2/10][300/938] D_loss: 0.3717 | G_loss: 3.8103
[ 2/10][400/938] D_loss: 1.0201 | G_loss: 1.3544
[ 2/10][500/938] D_loss: 0.4522 | G_loss: 2.6545
...

移至 GPU

尽管我们当前的脚本可以在 CPU 上正常运行，但是我们都知道卷积在 GPU 上要快得多。让我们快速讨论如何将训练转移到 GPU 上。为此，我们需要做两件事：将 GPU 设备规范传递给我们分配给自己的张量，并通过to()方法将所有其他张量明确复制到 C ++前端中所有张量和模块上。实现这两者的最简单方法是在训练脚本的顶层创建torch::Device的实例，然后将该设备传递给诸如torch::zeros和to()方法之类的张量工厂函数。我们可以从使用 CPU 设备开始：

// Place this somewhere at the top of your training script.
torch::Device device(torch::kCPU);

新的张量分配，例如

torch::Tensor fake_labels = torch::zeros(batch.data.size(0));

应该更新为以device作为最后一个参数：

torch::Tensor fake_labels = torch::zeros(batch.data.size(0), device);

对于那些不在我们手中的张量，例如来自 MNIST 数据集的张量，我们必须插入显式的to()调用。这表示

torch::Tensor real_images = batch.data;

变成

torch::Tensor real_images = batch.data.to(device);

并且我们的模型参数也应该移到正确的设备上：

generator->to(device);
discriminator->to(device);

Note

如果张量已经存在于提供给to()的设备上，则该调用为空操作。没有多余的副本。

至此，我们已经使之前的 CPU 驻留代码更加明确。但是，现在将设备更改为 CUDA 设备也非常容易：

torch::Device device(torch::kCUDA)

现在，所有张量都将驻留在 GPU 上，并调用快速 CUDA 内核进行所有操作，而无需我们更改任何下游代码。如果我们想指定一个特定的设备索引，则可以将其作为第二个参数传递给Device构造函数。如果我们希望不同的张量驻留在不同的设备上，则可以传递单独的设备实例(例如，一个在 CUDA 设备 0 上，另一个在 CUDA 设备 1 上）。我们甚至可以动态地进行此配置，这通常对于使我们的训练脚本更具可移植性很有用：

torch::Device device = torch::kCPU;
if (torch::cuda::is_available()) {
  std::cout << "CUDA is available! Training on GPU." << std::endl;
  device = torch::kCUDA;
}

甚至

torch::Device device(torch::cuda::is_available() ? torch::kCUDA : torch::kCPU);

检查点和恢复训练状态

我们应该对训练脚本进行的最后扩充是定期保存模型参数的状态，优化器的状态以及一些生成的图像样本。如果我们的计算机在训练过程中崩溃，则前两个将使我们能够恢复训练状态。对于长期的训练课程，这是绝对必要的。幸运的是，C ++前端提供了一个 API，用于对模型和优化器状态以及单个张量进行序列化和反序列化。

为此的核心 API 是torch::save(thing,filename)和torch::load(thing,filename)，其中thing可以是torch::nn::Module子类或优化程序实例，例如我们在训练脚本中拥有的Adam对象。让我们更新训练循环，以一定间隔检查模型和优化器状态：

if (batch_index % kCheckpointEvery == 0) {
  // Checkpoint the model and optimizer state.
  torch::save(generator, "generator-checkpoint.pt");
  torch::save(generator_optimizer, "generator-optimizer-checkpoint.pt");
  torch::save(discriminator, "discriminator-checkpoint.pt");
  torch::save(discriminator_optimizer, "discriminator-optimizer-checkpoint.pt");
  // Sample the generator and save the images.
  torch::Tensor samples = generator->forward(torch::randn({8, kNoiseSize, 1, 1}, device));
  torch::save((samples + 1.0) / 2.0, torch::str("dcgan-sample-", checkpoint_counter, ".pt"));
  std::cout << "\n-> checkpoint " << ++checkpoint_counter << '\n';
}

其中kCheckpointEvery是设置为类似于100之类的整数，以便每批100都进行检查，而checkpoint_counter是每次创建检查点时都会增加的计数器。

要恢复训练状态，可以在创建所有模型和优化器之后但在训练循环之前添加如下代码：

torch::optim::Adam generator_optimizer(
    generator->parameters(), torch::optim::AdamOptions(2e-4).beta1(0.5));
torch::optim::Adam discriminator_optimizer(
    discriminator->parameters(), torch::optim::AdamOptions(2e-4).beta1(0.5));

if (kRestoreFromCheckpoint) {
  torch::load(generator, "generator-checkpoint.pt");
  torch::load(generator_optimizer, "generator-optimizer-checkpoint.pt");
  torch::load(discriminator, "discriminator-checkpoint.pt");
  torch::load(
      discriminator_optimizer, "discriminator-optimizer-checkpoint.pt");
}

int64_t checkpoint_counter = 0;
for (int64_t epoch = 1; epoch <= kNumberOfEpochs; ++epoch) {
  int64_t batch_index = 0;
  for (torch::data::Example<>& batch : *data_loader) {

检查生成的图像

我们的训练脚本现已完成。我们准备在 CPU 或 GPU 上训练 GAN。为了检查我们训练过程的中间输出，为此我们添加了将代码样本定期保存到"dcgan-sample-xxx.pt"文件的代码，我们可以编写一个小的 Python 脚本来加载张量并使用 matplotlib 显示它们：

from __future__ import print_function
from __future__ import unicode_literals

import argparse

import matplotlib.pyplot as plt
import torch

parser = argparse.ArgumentParser()
parser.add_argument("-i", "--sample-file", required=True)
parser.add_argument("-o", "--out-file", default="out.png")
parser.add_argument("-d", "--dimension", type=int, default=3)
options = parser.parse_args()

module = torch.jit.load(options.sample_file)
images = list(module.parameters())[0]

for index in range(options.dimension * options.dimension):
  image = images[index].detach().cpu().reshape(28, 28).mul(255).to(torch.uint8)
  array = image.numpy()
  axis = plt.subplot(options.dimension, options.dimension, 1 + index)
  plt.imshow(array, cmap="gray")
  axis.get_xaxis().set_visible(False)
  axis.get_yaxis().set_visible(False)

plt.savefig(options.out_file)
print("Saved ", options.out_file)

现在，让我们训练模型约 30 个纪元：

root@3c0711f20896:/home/build# make && ./dcgan                                                                                                                                10:17:57
Scanning dependencies of target dcgan
[ 50%] Building CXX object CMakeFiles/dcgan.dir/dcgan.cpp.o
[100%] Linking CXX executable dcgan
[100%] Built target dcgan
CUDA is available! Training on GPU.
[ 1/30][200/938] D_loss: 0.4953 | G_loss: 4.0195
-> checkpoint 1
[ 1/30][400/938] D_loss: 0.3610 | G_loss: 4.8148
-> checkpoint 2
[ 1/30][600/938] D_loss: 0.4072 | G_loss: 4.36760
-> checkpoint 3
[ 1/30][800/938] D_loss: 0.4444 | G_loss: 4.0250
-> checkpoint 4
[ 2/30][200/938] D_loss: 0.3761 | G_loss: 3.8790
-> checkpoint 5
[ 2/30][400/938] D_loss: 0.3977 | G_loss: 3.3315
...
-> checkpoint 120
[30/30][938/938] D_loss: 0.3610 | G_loss: 3.8084

并在图中显示图像：

root@3c0711f20896:/home/build# python display.py -i dcgan-sample-100.pt
Saved out.png

应该看起来像这样：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ogWWTaIg-1693019293368)(img/931dea1655c975ec616a9e22c80c242f.jpg)]

数字！万岁！现在，事情就在您的球场上：您可以改进模型以使数字看起来更好吗？

结论

希望本教程为您提供了 PyTorch C ++前端的摘要。像 PyTorch 这样的机器学习库必然具有非常广泛的 API。因此，有许多概念我们没有时间或空间来讨论。但是，我建议您尝试使用该 API，并在遇到问题时查阅我们的文档，尤其是库 API 部分。另外，请记住，只要我们能够做到，就可以期望 C ++前端遵循 Python 前端的设计和语义，因此您可以利用这一事实来提高学习率。

你可能感兴趣的:(pytorch,c语言,前端)

前端开发设计模式——单例模式夜月还山岚 JavaScript设计模式设计模式单例模式前端 javascript
目录一、单例模式的定义和特点：1.定义：2.特点：二、单例模式的实现方式：1.立即执行函数结合闭包实现：2.ES6类实现：三、单例模式的应用场景1.全局状态管理：2.日志记录器：3.数据库连接：四、单例模式的优点1.减少资源消耗：2.全局访问：3.易于管理：五、单例模式的缺点1.测试困难：2.违法单一职责原则：3.可能导致内存泄漏：六、单例模式的注意事项1.线程安全：2.延迟加载：3.可扩展性：在
前端开发设计模式——原型模式夜月还山岚 JavaScript设计模式原型模式前端设计模式
一、定义和特点1.定义原型模式是一种创建对象的方式，它通过复制一个已经存在的实例（称为原型）来创建新的实例，而不是通过传统的构造函数调用和初始化过程。2.特点高效创建对象：避免了重复执行复杂的构造过程，尤其是当对象的创建成本较高时，原型模式可以显著提高创建效率。灵活性：可以根据不同的需求对原型进行修改和扩展，从而创建出具有不同特性的新对象。动态性：在运行时可以动态地改变原型，使得创建的对象能够适应
[c语言日寄]越界访问：意外的死循环 siy2333 c语言日寄 c语言开发语言学习算法笔记
【作者主页】siy2333【专栏介绍】⌈c语言日寄⌋：这是一个专注于C语言刷题的专栏，精选题目，搭配详细题解、拓展算法。从基础语法到复杂算法，题目涉及的知识点全面覆盖，助力你系统提升。无论你是初学者，还是进阶开发者，这里都能满足你的需求！【食用方法】1.根据题目自行尝试2.查看基础思路完善题解3.学习拓展算法【Gitee链接】资源保存在我的Gitee仓库：https://gitee.com/siy
前端开发常用的设计模式有哪些我有一棵树设计模式
模块模式：将代码封装成独立的模块，提高代码的可维护性和重用性。构造函数模式：使用构造函数来创建对象，每个对象都有自己的属性和方法。工厂模式：定义一个创建对象的接口，但由子类决定实例化哪个类2。单例模式：确保一个类只有一个实例，并提供全局访问点2。订阅-发布模式（观察者模式）：定义对象间的一种一对多的依赖关系，当一个对象的状态发生改变时，所有依赖于它的对象都将得到通知12。装饰者模式：动态地给一个对
c语言无符号的变量不能和有符号的直接比较，或者使用移项解决符号问题文武先生hh c语言开发语言
使用移项解决问题，简单来说就是无符号运行不要有减号，使用移项后的加号代替if(uEventDirLimitSize>uEventAndNormalDirSize){if((uEventDirLimitSize-uEventAndNormalDirSize)>=pStConfig->stParam.stUserParam.uEventRemain){returnOK;}}改成if(uEventDir
《动手学深度学习》(PyTorch版) chaser&upper 深度学习 pytorch 深度学习 python
《动手学深度学习》PyTorch版前言简介面向人群食用方法方法一方法二方法三目录原书地址引用阅读指南前言读书啦！！！本项目将《动手学深度学习》原书中MXNet代码实现改为PyTorch实现。原书作者：阿斯顿·张、李沐、扎卡里C.立顿、亚历山大J.斯莫拉以及其他社区贡献者，GitHub地址：https://github.com/d2l-ai/d2l-zh此书的中英版本存在一些不同，针对此书英文版的P
跨域问题及解决方案八月五实战项目 spring boot 后端
跨域问题不仅影响开发效率，还可能导致项目进度延误。因此，理解和掌握跨域问题的原理及其解决方案对于前端开发者和后端开发者来说都至关重要。本文将详细介绍什么是跨域、跨域产生的原因，以及常见的后端跨域解决方案。文章目录一、什么是跨域二、跨域产生的原因三、解决策略：1.CORS（跨域资源共享）2.在SpringBoot中配置CORS2.1在目标方法中添加`@CrossOrign`注解2.2添加Cors过滤
如何0基础自学网络安全技术，推荐一个非常稳的网络安全学习路线_网络安全入门学习路线星空真懒程序员 web安全学习安全
青铜（筑基期）度过了石器时代，你已经储备了一些计算机的基础知识：操作系统的使用，网络协议，前端基础，数据库初识，但这距离做网络安全还不够，在第二个青铜阶段，你还需要再进一步学习基础，在第一阶段之上，难度会开始慢慢上升。这一阶段需要学习的知识有：Web进阶在前面的石器时代，咱们初步接触了网页编程，了解了网页的基本原理。不过那时候是纯前端的，纯静态的网页，没有接触后端。在这个进阶的阶段，你要开始接触W
c++数据结构面试题 c++代码诗人 c/c++面试题 c语言 c++
测试题一、C语言部分：1、爱因斯坦出了一道这样的数学题：有一条长阶梯，若每步跨2阶，则最后剩一阶，若每步跨3阶，则最后剩2阶，若每步跨5阶，则最后剩4阶，若每步跨6阶则最后剩5阶。只有每次跨7阶，最后才正好一阶不剩。请问这条阶梯至少有多少阶？（5分）2、一球从100米高度自由落下，每次落地后，反弹回原高度的一半，再下落，编写程序，输入下落次数，便知此次下落后的反弹高度。（5分）3、有5个人坐在一起
一文看尽C、C++、Java与Python的优势与应用禁小默 python java c语言
前言编程语言的选择直接影响到开发效率、系统性能以及开发者的工作体验。C、C++、Java和Python是当前最受欢迎的四种编程语言，它们各自有着不同的设计哲学、应用领域及开发者社区。在这篇博客中，我们将深入对比这四种语言的特点，帮助大家根据项目需求做出合理的选择。1.历史背景与语言设计理念C语言C语言由DennisRitchie于1972年在贝尔实验室开发，最初用于系统编程和操作系统的开发。C语言
使用onnxruntime-web 运行yolov8-nano推理 CHEN_RUI_2200 机器学习 YOLO
ONNX（OpenNeuralNetworkExchange）模型具有以下两个特点促成了我们可以使用onnxruntime-web直接在web端上运行推理模型，为了让这个推理更直观，我选择了试验下yolov8识别预览图片：1.跨平台兼容性ONNX是一种开放的格式，可以在不同的深度学习框架之间共享模型，如PyTorch、TensorFlow、MXNet和Caffe2。这使得用户可以在一个框架中训练模
“C语言与揭秘文件：从内存到外部存储的旅程“ 咔哆TryBid c语言
1️⃣文件概述1.文件是一组相关数据的有序集合。如，源程序文件、目标文件、可执行文件、库文件(头文件)...。文件通常驻留在外部介质(磁盘、硬盘、U盘...)上的，在使用时才调入内存。2.程序在执行时，所有的数据都存储在内存中，这些数据只能临时存放而不能永久保存，想要永久保存就需要把数据以文件的形式存储在外存储器中。每一个文件都有一个名字，操作系统以文件为单位对数据进行管理。3.C语言把外部设备也
【C语言算法刷题】第9题花生_TL00007 C语言算法刷题算法 c语言数据结构
题目描述给定一个非空字符串S，其被N个‘-’分隔成N+1的子串，给定正整数K，要求除第一个子串外，其余的子串每K个字符组成新的子串，并用‘-’分隔。对于新组成的每一个子串，如果它含有的小写字母比大写字母多，则将这个子串的所有大写字母转换为小写字母；反之，如果它含有的大写字母比小写字母多，则将这个子串的所有小写字母转换为大写字母；大小写字母的数量相等时，不做转换。输入输出描述输入两行：第一行为参数K
【C语言算法刷题】第10题花生_TL00007 C语言算法刷题 c语言算法开发语言
题目描述主管期望你来实现英文输入法单词联想功能。需求如下：依据用户输入的单词前缀，从已输入的英文语句中联想出用户想输入的单词，按字典序输出联想到的单词序列，如果联想不到，请输出用户输入的单词前缀。注意：英文单词联想时，区分大小写缩略形式如”don’t”，判定为两个单词，”don”和”t”输出的单词序列，不能有重复单词，且只能是英文单词，不能有标点符号输入描述输入为两行。首行输入一段由英文单词wor
Silero VAD 开源项目教程苏鹃咪Healthy
SileroVAD开源项目教程项目地址:https://gitcode.com/gh_mirrors/si/silero-vad项目介绍SileroVAD是一个预训练的企业级语音活动检测器（VoiceActivityDetector），由snakers4团队开发并开源在GitHub上。该项目支持多种语言和不同领域的音频，具有灵活的采样率（8000Hz和16000Hz），并且可以在PyTorch和O
CRM客户管理系统前端基础配置信息------CRM项目旧约Alatus CRM项目前端 #VUE框架 json html5 javascript jquery css ajax echarts
CRM系统body{margin:0;}CRM系统body{margin:0;}{"name":"netcrm-front","private":true,"version":"0.0.0","type":"module","scripts":{"dev":"vite","build":"vitebuild","preview":"vitepreview"},"dependencies":{"@e
FSMN-VAD与Silero-VAD Wasser. python 语音识别
引用说明：FSMN-VAD引用魔塔社区项目：https://modelscope.cn/models/iic/speech_fsmn_vad_zh-cn-16k-common-pytorch/summary感谢阿里大佬的开源与介绍。这篇文章主要介绍两种的ASR中的VAD开源模型，第一种就是FSMN-VAD，这个是达摩院语音团队提出的高效语音端点检测模型，用于检测输入音频中有效语音的起止时间点信息。
C语言实现Berlekamp-Massey算法 belle-de-jour 密码分析算法 c语言抽象代数密码学信息与通信线性代数
Berlekamp-Massey算法是一种广泛应用于纠错编码中的迭代算法，我们在许多纠错编码中都能看见它的用途。BM算法最初是为了解决线性递推序列的问题而提出的，后来被广泛应用于纠错编码中，特别是用于解码如RS码（Reed-Solomon码）和BCH码等循环纠错码。这些编码方案在数据传输和存储系统中扮演着重要角色，能够纠正多个错误并检测潜在的错误，从而确保数据的完整性和可靠性。BM算法基本原理BM
深入理解 `mmap`：高效的文件访问机制蜗牛沐雨 c++python
在现代编程中，文件操作是不可或缺的一部分。随着数据量的增加，如何高效地读取和写入文件变得尤为重要。mmap（Memory-MappedFile）是一种高效的文件访问机制，它允许将文件或设备映射到进程的地址空间中，使得文件操作就像操作内存一样简单和高效。本文将详细介绍mmap的工作原理、使用方法及其在Python和C语言中的实现。1.mmap的用途mmap的主要用途包括：高效文件访问：通过将文件映射
由于直接提供完整的游戏商城代码超出了简单回答的范围，并且游戏商城的实现可以相当复杂，涉及前端展示、后端逻辑、数据库设计等多个方面，我会分别用几种流行的编程语言和技术栈概述如何开始搭建一个基本的游戏商城编程小飞侠a 游戏前端数据库
前端（HTML/CSS/JavaScript+React）React示例:fengbaoshun.com首先，你需要安装Node.js和npm（Node包管理器），然后使用CreateReactApp来快速启动你的前端项目。bashnpxcreate-react-appgame-store-frontendcdgame-store-frontendnpmstart接下来，你可以使用React组件来
由于直接提供完整的大型项目代码（如购物商城）在单一回答中是不切实际的，我将为你概述如何在几种流行的编程语言中设置购物商城的基本框架和思路。这包括前端（如HTML/CSS/JavaScript）和后端（ SigridFelix 前端 html css
前端（HTML/CSS/JavaScript）dz61.comHTML:创建基础的页面结构，如主页、商品列表页、购物车页和结账页。html我的购物商城欢迎来到我的购物商城商品列表购物车CSS:简单的样式表，用于美化页面。css/*styles.css*/body{font-family:Arial,sans-serif;}h1{color:#333;}ul{list-style-type:none
人工智能学习框架：深入解析与实战指南一ge科研小菜鸡人工智能人工智能
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注引言随着人工智能（AI）技术的飞速发展，深度学习、强化学习和自然语言处理等领域的应用愈加广泛。掌握人工智能学习框架（如TensorFlow、PyTorch、Keras等）已成为开发智能系统、研究前沿技术的必备技能。本指南将全面介绍人工智能主流学习框架的特点、安装方法、核心功能，以及通过实践案例展示如何使用这些框架进行AI模型开发、训练与优化。1.
2025年创业公司技术栈选择：React与Vue对比硅基创想家编程语言 vue.js react.js 前端
前端开发、React、Vue、TypeScript有个残酷的事实：在2025年为你的技术栈挑选合适的框架，不是看哪个更酷炫或更热门，而是看哪个最契合你的特定需求。在前端开发领域，React和Vue这两大巨头正激烈竞争，吸引着你的目光。但有一点要明确：不存在“一刀切”的答案。React和Vue都是出色的框架，不过各自都有优势、特点和适用场景。你的决策不应只着眼于框架本身，而更应考虑团队、项目以及长期
C#导出excel： weixin_44120543 c#开发语言
前端：exportfunctionxxxx(query){returnrequest({url:'xxxx/xxxxx',method:'get',params:query,responseType:'blob'//设置响应类型为二进制数据})}xxxx(){this.queryForm.wayExport=0;//这里标记导出类型xxx(this.queryForm).then((respons
Swoole vs Workman 河南云和数据互联网 PHP 编码
目前php通信服务框架最流行的有wwoole与workerman，swoole是有C语言开发的php扩展类，而workerman是纯PHP开发框架，可能swoole比workerman出名，在百度、腾讯公司都有在使用，使用频率也比较高,但workerman也有很多项目在用，哪到底谁能更胜一筹呢？首先我们一起来了解一下swoole：Swoole是面向生产环境的PHP异步网络通信引擎使PHP开发人员可
【前沿聚焦】机器学习的未来版图：从自动化到隐私保护的技术突破网罗开发人工智能 AI 大模型机器学习人工智能
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
Nginx前端后端共用一个域名如何配置 Misnice Nginx nginx 前端运维
在Nginx中配置前端和后端共用一个域名的情况，通常是通过路径或子路径将请求转发到不同的服务。以下是一个示例配置，假设：前端静态文件在/var/www/frontend/。后端API服务运行在http://127.0.0.1:5000。域名是example.com，其中：静态前端通过example.com访问。后端API通过example.com/api/访问。server{listen80;se
【Java】--方法的使用雨雨雨点子 JavaSE java 开发语言
文章目录1.方法概念及使用1.1什么是方法1.2方法定义1.3方法调用的执行过程1.4实参和形参的关系（重要）1.5没有返回值的方法2.方法重载2.1方法重载概念2.2方法签名3.递归3.1递归的概念3.2递归执行过程分析3.3递归练习1.方法概念及使用1.1什么是方法方法就是一个代码片段.类似于C语言中的“函数”。方法存在的意义(不要背,重在体会):是能够模块化的组织代码(当代码规模比较复杂的时
LeetCode - #195 Swift 实现打印文件中的第十行网罗开发 Swift vue.js leetcode swift
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
Monorepo 在网易的工程改造实践若川视野前端 javascript npm vue.js 开发语言
大家好，我是若川。我持续组织了近一年的源码共读活动，感兴趣的可以点此扫码加我微信lxchuan12参与，每周大家一起学习200行左右的源码，共同进步。同时极力推荐订阅我写的《学习源码整体架构系列》包含20余篇源码文章。历史面试系列。另外：目前建有江西|湖南|湖北籍前端群，可加我微信进群。背景目前云音乐内有多个RN收银台场景分布在不同的工程，比如页面收银台，浮层收银台，个性收银台等，后续可能还会有别
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =