Augusdi

C++ AMP: 基于代码的C++ AMP简介

下载代码示例

本文介绍将随同 Visual Studio 11 一同发布的名为 C++ AMP 的预发布技术。所有信息均有可能发生变更。

Visual Studio 11 通过名为 C++ Accelerated Massive Parallelism (C++ AMP) 的技术为主流异构计算提供相应支持。这使您能够利用 GPU 等加速器来加速数据并行算法。

C++ AMP 以硬件可移植方式提供性能，而不会影响您预期从新型 C++ 和 Visual Studio 软件包中获得的生产力。与仅使用 CPU 相比，它可以数量级的速度提高计算能力。在一些会议上，我通常演示同时利用 NVIDIA 和 AMD GPU 且仍采用 CPU 回退解决方案的单个过程。

在此探讨 C++ AMP 的代码驱动简介中，我将假定您阅读了本文中的每一行代码。内嵌代码是本文的核心部分，并且本文不一定重复 C++ 代码中的内容。

设置和示例算法

首先，让我们了解将随必需设置代码一起使用的简单算法，以准备稍后转为使用 C++ AMP。

创建一个空 C++ 项目，添加新的空 C++ 文件 (Source.cpp) 并键入以下自解释代码（我使用非连续行号以方便在本文中进行解释，您将在附带的可下载项目中找到相同行号）：


          1 #include                 // C++ AMP header file
3 #include              // For std::cout etc
4 using namespace concurrency;    // Save some typing :)
5 using std::vector;     // Ditto.
          Comes from  brought in by amp.h
6
79 int main()
80 {
81   do_it();
82
83   std::cout << "Hit any key to exit..." << std::endl;
84   std::cin.get();
85 }

C++ AMP 跨许多头文件引入了众多类型。根据上述代码段中的行 1 和 4，主头文件是 amp.h，并且将主类型添加到了现有并发命名空间中。使用 C++ AMP 无需其他设置或编译选项。现在让我们在主头文件之上添加 do_it 函数（参见图 1）。

图 1 从主头文件调用的 do_it 函数


          52 void do_it()
53 {
54   // Rows and columns for matrix
55   const int M = 1024;
56   const int N = 1024;
57
58   // Create storage for a matrix of above size
59   vector vA(M * N);
60   vector vB(M * N);
61
62   // Populate matrix objects
63   int i = 0;
64   std::generate(vA.begin(), vA.end(), [&i](){return i++;});
65   std::generate(vB.begin(), vB.end(), [&i](){return i--;});
66
67   // Output storage for matrix calculation
68   vector vC(M * N);
69
70   perform_calculation(vA, vB, vC, M, N);
76 }

在行 59、60 和 68 中，代码使用 std::vector 对象作为每个矩阵的平面容器，即使二维类型是您真正要处理的内容也是如此 — 稍后将对此进行详细说明。

必须了解行 64 和 65 上传递给用于填充两个矢量对象的 std::generate 方法的 lambda 表达式的用法。本文假定您可以熟练地在 C++ 中使用 lambda。例如，您应该立即了解变量 i 是否已由值捕获（通过修改捕获列表，例如此 [i] 或此 [=]，并使用可变关键字），以及矢量的每个成员是否已初始化为 0！如果您不能轻松使用 lambda（对 C++ 11 标准的最佳补充），请阅读 MSDN 库文章“Lambda Expressions in C++”(msdn.microsoft.com/library/dd293608) 并在阅读完后回到此处。

do_it 函数引入了对 perform_calculation 的调用，其编码如下：


          7  void perform_calculation(
8    vector& vA, vector& vB, vector& vC, int M, int N)
9  {
15   for (int i = 0; i < M; i++)
16   {
17     for (int j = 0; j < N; j++)
18     {
19       vC[i * N + j] = vA[i * N + j] + vB[i * N + j];
20     }
22   }
24 }

在此简化的矩阵加法示例中，值得注意的一件事是由于矩阵在矢量对象中的线性化存储而丢失了矩阵的多维性（这就是为什么您必须随矢量对象传入矩阵维度的原因）。另外，您还必须使用行 19 上的指数执行所需计算。如果您希望一起添加这些矩阵的子矩阵，则更需要这样做。

到目前为止，没有出现任何 C++ AMP 代码。接下来，通过更改 perform_calculation 函数，您将了解如何可以开始引入一些 C++ AMP 类型。在稍后部分中，您将了解如何充分利用 C++ AMP 并加快数据并行算法。

array_view、extent 和 index

C++ AMP 引入了 concurrency::array_view 类型来包装数据容器 — 您可以将它视为智能指针。它以矩形方式表示数据，在最不重要的维度中是连续的。它存在的原因稍后将变得更加明显，接下来，您将了解其部分用法。让我们更改 perform_calculation 函数体，如下所示：


          11     array_view a(M*N, vA), b(M*N, vB);
12     array_view c(M*N, vC);
14
15     for (int i = 0; i < M; i++)
16     {
17       for (int j = 0; j < N; j++)
18       {
19         c(i * N + j) = a(i * N + j) + b(i * N + j);
20       }
22     }

在 CPU 上编译和运行的此函数具有与以前相同的输出。唯一区别是无故使用了行 11 和 12 上引入的 array_view 对象。行 19 仍具有所需指数（目前），但现在它使用 array_view 对象（a、b、c）而不是矢量对象（vA、vB 和 vC），并且它通过 array_view 函数运算符访问元素（而以前使用矢量下标运算符 — 稍后将对此进行详细说明）。

您必须通过模板参数（在此示例中为 int）告诉 array_view 它所包装的容器的元素类型；您将把该容器作为最后一个构造函数参数进行传递（例如，行 12 上矢量类型的 vC 变量）。第一个构造函数参数是元素数。

您也可以使用 concurrency::extent 对象来指定元素数，以便可以按照如下所示更改行 11 和 12：


          10     extent<1> e(M*N);
11     array_view a(e, vA), b(e, vB);
12     array_view c(e, vC);

extent 对象表示多维空间，在其中将级别作为模板参数进行传递。在此示例中，模板参数为 1，但级别可以是大于 0 的任何值。 extent 构造函数接受 extent 对象所表示的每个维度的大小，如行 10 上所示。然后可以将 extent 对象传递给 array_view 对象构造函数来定义其形状，如行 11 和 12 上所示。在这些行上，我还为 array_view 添加了第二个模板参数来指示它表示一维空间 — 正如在前面的代码示例中，我可以安全地忽略它，因为 1 是默认级别。

现在您了解了这些类型，可以进一步修改此函数以便它可以采用更自然的二维方式访问数据，这更加类似于矩阵：


          10     extent<2> e(M, N);
11     array_view a(e, vA), b(e, vB);
12     array_view c(e, vC);
14
15     for (int i = 0; i < e[0]; i++)
16     {
17       for (int j = 0; j < e[1]; j++)
18       {
19         c(i, j) = a(i, j) + b(i, j);
20       }
22     }

对行 10-12 进行的更改使 array_view 对象成为二维的，因此我们将需要两个指数来访问一个元素。行 15 和 17 通过下标运算符访问 extent 范围，而不是直接使用变量 M 和 N；在您将形状封装到 extent 中后，您现在可以在整个代码中使用该对象。

重要更改在行 19 上，您不再需要进行算术运算。使用指数更加合情合理，这会使整个算法本身更加可读和可维护。

如果 array_view 是使用三维 extent 创建的，则函数运算符将需要三个整数才能访问一个元素，仍从最重要的维度到最不重要的维度。因为您可能希望从多维 API 访问内容，还有一种方法可通过传递给其下标运算符的单个对象来为 array_view 设置指数。该对象的类型必须是 concurrency::index，其中 N 与创建 array_view 所使用的 extent 的级别相匹配。您稍后将了解如何可以将 index 对象传递给代码，但现在让我们手动创建一个对象来了解它并查看其运行方式，方法是按照如下所示修改函数体：


          10     extent<2> e(M, N);
11     array_view a(e, vA), b(e, vB);
12     array_view c(e, vC);
13
14     index<2> idx(0, 0);
15     for (idx[0] = 0; idx[0] < e[0]; idx[0]++)
16     {
17       for (idx[1] = 0; idx[1] < e[1]; idx[1]++)
18       {
19         c[idx] = a[idx] + b[idx];
//19         //c(idx[0], idx[1]) = a(idx[0], idx[1]) + b(idx[0], idx[1]);
20       }
22     }

正如您从行 14、15、17 和 19 中看到的，concurrency::index 类型具有与 extent 类型非常类似的接口，只是 index 表示 N 维点而不是 N 维空间。 extent 和 index 类型都通过运算符重载支持众多算术运算 — 例如，上一个示例中所示的累加运算。

以前，循环变量（i 和 j）用于为 array_view 设置指数，而现在，它们可以由行 19 上的单个 index 对象取代。该示例演示了如何通过使用 array_view 下标运算符，借助单个变量（在此示例中为 index<2> 类型的 idx）为该对象设置指数。

此时，您基本了解了随 C++ AMP 引入的三种新类型： array_view、extent 和 index。它们提供了其他功能，如图 2 中的类图表中所示。

图 2 array_view、extent 和 index 类

使用此多维 API 的真正动机是在数据并行加速器（例如 GPU）上执行算法。为此，您需要 API 中的入口点来在加速器上执行代码，并且需要采用一种方法来在编译时检查您是否正在使用可在此类加速器上高效执行的 C++ 语言的子集。

parallel_for_each 和 restrict(amp)

指示 C++ AMP 运行时采用您的函数并在加速器上执行它的 API 是 concurrency::parallel_for_each 的新重载。它接受两个参数： extent 对象和 lambda。

您已熟悉的 extent 对象用于确定将在加速器上调用多少次 lambda，并且您应假定每次它将是调用您的代码的单独线程，可能并发执行，但没有任何顺序保证。例如，extent<1>(5) 将导致对您传递给 parallel_for_each 的 lambda 调用 5 次，而 extent<2>(3,4) 将导致对 lambda 调用 12 次。在实际算法中，通常可安排对 lambda 调用数千次。

lambda 必须接受您已熟悉的 index 对象。 index 对象必须具有与传递给 parallel_for_each 的 extent 对象相同的级别。当然每次调用 lambda 时，index 值会有所不同 — 这是区分 lambda 的两次不同调用的方法。您可以将 index 值视为线程 ID。

以下是到目前为止我介绍的有关 parallel_for_each 的内容的代码表示形式：


          89     extent<2> e(3, 2);
90     parallel_for_each(e,
91       [=](index<2> idx)
92       {
93         // Code that executes on the accelerator.
          94         // It gets invoked in parallel by multiple threads
95         // once for each index "contained" in extent e
96         // and the index is passed in via idx.
          97         // The following always hold true
98         //      e.rank == idx.rank
99         //      e.contains(idx) == true
100        //      the function gets called e.size() times
101        // For this two-dimensional case (.rank == 2)
102        //      e.size() == 3*2 = 6 threads calling this lambda
103        // The 6 values of idx passed to the lambda are:
104        //      { 0,0 } { 0,1 } { 1,0 } { 1,1 } { 2,0 } { 2,1 }
105      }
106    );
107    // Code that executes on the host CPU (like line 91 and earlier)

此简单代码的行 91 缺少重要内容，不会对该代码进行编译：


          error C3577: Concurrency::details::_Parallel_for_each argument #3 is illegal: missing public member: 'void operator()(Concurrency::index<_Rank>) restrict(amp)'

在编写代码时，您可以随意在 lambda 体（行 92-105）中使用完整 C++ 语言（受 Visual C++ 编译器支持）所允许的任何内容。但是，限制您在当前 GPU 体系结构上使用 C++ 语言的某些方面，因此您必须指示代码的哪些部分应遵循这些限制（以便您可以在编译时发现您是否违反了任何规则）。必须对 lambda 以及您从 lambda 调用的任何其他函数签名做出该指示。因此您必须按照如下所示修改行 91：


          91         [=](index<2> idx) restrict(amp)

这是添加到 Visual C++ 编译器中的 C++ AMP 规范的关键新语言功能。可以使用 restrict(cpu)（隐式默认值）或前面的代码示例中所示的 restrict(amp) 或结合使用这两者（例如，restrict(cpu, amp)）对函数（包括 lambda）进行批注。不存在其他选项。批注成为函数签名的一部分，因此它参与重载，这是设计它的关键动机。在使用 restrict(amp) 对函数进行批注时，将根据一组限制对函数进行检查，如果违反了限制，您将收到编译器错误。以下博客文章中记录了一组完整限制： bit.ly/vowVlV。

lambda 的 restrict(amp) 限制之一是它们不能通过引用捕获变量（参见接近本文末尾的说明），也不能捕获指针。了解该限制后，在您查看 parallel_for_each 的上一个代码列表时，将想知道： “如果不能通过引用捕获，也不能捕获指针，我将如何观察 lambda 的结果，即所需的副作用？在 lambda 完成后，我对通过值捕获的变量进行的所有更改不会提供给外部代码。”

该问题的答案是您已知道的一种类型： array_view。允许在 lambda 中通过值捕获 array_view 对象。它是传入和传出数据的机制。只需使用 array_view 对象来包装实际容器，然后在 lambda 中捕获 array_view 对象以进行访问和填充，然后在调用 parallel_for_each 之后访问相应的 array_view 对象。

将所有代码合并在一起

使用您的新知识，您现在可以重新访问前面的串行 CPU 矩阵加法（使用了 array_view、extent 和 index 的加法），并按照如下所示替换行 15-22：


          15     parallel_for_each(e, [=](index<2> idx) restrict(amp)
16     {
19       c[idx] = a[idx] + b[idx];
22     });

您看到行 19 保持不变，而在 extent 范围内手动创建了 index 对象的双嵌套循环替换为对 parallel_for_each 函数的调用。

当使用具有其自己的内存的离散加速器时，在 lambda 中捕获传递给 parallel_for_each 的 array_view 对象会导致将基础数据复制到加速器的全局内存中。类似地，在 parallel_for_each 调用之后，当您通过 array_view 对象（在此示例中是通过 c）访问数据时，会将数据从加速器复制回主机内存。

您应该知道如果要通过原始容器 vC（而不是通过 array_view）访问 array_view c 的结果，则应该调用 array_view 对象的 synchronize 方法。代码实际上将运行，因为 array_view 析构函数将代表您调用 synchronize，但这样会丢失所有异常，因此建议您显式调用 synchronize。因此需要在 parallel_for_each 调用之后的任何位置添加一个语句，如下所示：


          23          c.synchronize();

通过 refresh 方法可实现相反目的（确保 array_view 具有已更改的原始容器中的最新数据）。

更重要的是，（通常）跨 PCIe 总线复制数据会产生大量费用，因此您只需根据需要复制数据。在前面的列表中，您可以修改行 11-13 以指示必须将 array_view 对象 a 和 b 的基础数据复制到加速器中（但不会复制回），还应指示无需将 array_view c 的基础数据复制到加速器。所需更改在以下代码段中以粗体显示：


          11          array_view a(e, vA), b(e, vB);
12          array_view c(e, vC);
13          c.discard_data();

但是，即使进行了这些修改，矩阵加法算法的运算也不够密集，无法抵销复制数据的开销，因此实际上它不是使用 C++ AMP 实现并行化的好的候选方法。我使用它只是为了教授您基础知识！

虽然如此，但通过在本文中使用此简单示例，您现在已具备并行化其他足以带来好处的计算密集型算法的技能。下面的此类算法是一个矩阵乘法。我没有添加任何注释，请确保您理解矩阵乘法算法的此简单串行实现：


          void MatMul(vector& vC, const vector& vA,
  const vector& vB, int M, int N, int W)
{
  for (int row = 0; row < M; row++)
  {
    for (int col = 0; col < N; col++)
    {
      int sum = 0;
      for(int i = 0; i < W; i++)
        sum += vA[row * W + i] * vB[i * N + col];
      vC[row * N + col] = sum;
    }
  }
}

… 以及相应的 C++ AMP 实现：


          array_view a(M, W, vA), b(W, N, vB);
array_view c(M, N, vC);
c.discard_data();
parallel_for_each(c.extent, [=](index<2> idx) restrict(amp)
{
  int row = idx[0]; int col = idx[1];
  int sum = 0;
  for(int i = 0; i < b.extent[0]; i++)
    sum += a(row, i) * b(i, col);
  c[idx] = sum;
});
c.synchronize();

在我的便携式计算机上，与 M=N=W=1024 的串行 CPU 代码相比，C++ AMP 矩阵乘法使性能提高了 40 余倍。

现在您已掌握所有基础知识，在使用 C++ AMP 实现算法后，您可能想知道如何选择要在其上执行算法的加速器。接下来让我们介绍该内容。

accelerator 和 accelerator_view

并发命名空间的一部分是新的 accelerator 类型。它表示系统上 C++ AMP 运行时可以使用的设备，第一次发布时，该设备为安装了 DirectX 11 驱动程序的硬件（或 DirectX 仿真器）。

当 C++ AMP 运行时启动时，它会枚举所有加速器，并根据内部启发式，选取其中一个作为默认加速器。这就是为什么您在所有上述代码中无需直接处理加速器的原因 — 已为您选取了默认加速器。如果您希望枚举加速器，甚至自己选择默认加速器，则可以非常轻松地实现此目的，如图 3 中的自解释代码所示。

图 3 选取加速器


          26 accelerator pick_accelerator()
27 {
28   // Get all accelerators known to the C++ AMP runtime
29   vector accs = accelerator::get_all();
30
31   // Empty ctor returns the one picked by the runtime by default
32   accelerator chosen_one;
33
34   // Choose one; one that isn't emulated, for example
35   auto result =
36     std::find_if(accs.begin(), accs.end(), [] (accelerator acc)
37   {
38     return !acc.is_emulated; //.supports_double_precision
39   });
40   if (result != accs.end())
41     chosen_one = *(result); // else not shown
42
43   // Output its description (tip: explore the other properties)
44   std::wcout << chosen_one.description << std::endl;
45
46   // Set it as default ...
          can only call this once per process
47   accelerator::set_default(chosen_one.device_path);
48
49   // ...
          or just return it
50   return chosen_one;
51 }

在行 38 上，您可以看到查询许多加速器属性之一，而其他属性显示在图 4 中。

图 4 accelerator 和 accelerator_view 类

如果您希望具有使用不同加速器的不同 parallel_for_each 调用，或由于任何其他原因，您希望比为过程全局设置默认加速器获得更明确的设置，则需要将 accelerator_view 对象传递给 parallel_for_each。这是可能的，因为 parallel_for_each 具有接受 accelerator_view 作为第一个参数的重载。获取 accelerator_view 对象与对 accelerator 对象调用 default_view 一样容易；例如：


          accelerator_view acc_vw = pick_accelerator().default_view;

除 DirectX 11 硬件以外，C++ AMP 还提供了三个特殊加速器：

direct3d_ref：用于正确性调试，但不用于生产，因为它比任何实际硬件慢很多。
direct3d_warp：在当今使用多核并流式处理 SIMD 扩展的 CPU 上执行 C++ AMP 代码的回退解决方案。
cpu_accelerator：在此版本中，根本不能执行 C++ AMP 代码。它只用于设置暂存数组（高级优化技术），这超出了本文的讨论范围，但在以下博客文章中进行了介绍： bit.ly/vRksnn。

自己了解平铺及其他参考资料

本文中没有介绍的最重要的主题是平铺。

从方案角度说，并且正如您使用迄今为止所探讨的编码技术所看到的，平铺的性能获得了极大提高，并（可能）提高更多。从 API 角度说，平铺包括 tiled_index 和 tiled_extent 类型，以及 tile_barrier 类型和 tile_static 存储类。还有接受 tiled_extent 对象且其 lambda 接受 tiled_index 对象的 parallel_for_each 的重载。在该 lambda 中，允许您使用 tile_barrier 对象和 tile_static 变量。我在我的第二篇 C++ AMP 文章的第 40 页中介绍了平铺。

可以利用博客文章和联机 MSDN 文档，自己探讨其他主题：

是一个具有两个命名空间的数学库，一个命名空间用于高精度数学函数，另一个用于快速但精确度稍差的数学函数。可根据硬件功能和方案要求选择使用。
提供了和以及一些 DirectX 互操作函数来处理图形编程。
concurrency::array 是绑定到加速器的一种容器数据类型，其接口与 array_view 几乎完全相同。此类型是必须由 lambda 中传递给 parallel_for_each 的引用捕获的两种类型之一（另一种类型是 graphics 命名空间中的 texture）。这是我在本文的前面部分提到的说明。
支持 DirectX 内部函数，例如用于跨线程同步的原子。
Visual Studio 11 中的 GPU 调试和分析。

前瞻性地保护您的投资

在本文中，我向您介绍了新型 C++ 数据并行 API，利用它，您可以采用使您的应用程序能够利用 GPU 来提高性能的方式表述算法。 C++ AMP 的设计旨在前瞻性地保护您已进行的硬件投资。

您了解到如何通过将几种类型（array_view、extent 和 index）与一个允许您从 restrict(amp) lambda 开始执行代码的全局函数 (parallel_for_each) 结合使用，来在加速器（可以通过 accelerator 和 accelerator_view 对象指定）上处理多维数据。

除 Microsoft Visual C++ 实现以外，还将 C++ AMP 作为任何人都可以在任何平台上实现的开放规范提供给了社区。

Daniel Moth 是 Microsoft Developer Division 的首席项目经理。可通过他的博客与其联系：danielmoth.com/Blog。

衷心感谢以下技术专家对本文的审阅： Steve Deitz、Yossi Levanoni、Robin Reynolds-Haertle、Stephen Toub 和 Weirong Zhu

http://msdn.microsoft.com/zh-cn/magazine/hh882446.aspx

你可能感兴趣的:(C++,AMP)

c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
【JS】执行时长(100分) |思路参考+代码解析（C++） l939035548 JS 算法数据结构 c++
题目为了充分发挥GPU算力，需要尽可能多的将任务交给GPU执行，现在有一个任务数组，数组元素表示在这1秒内新增的任务个数且每秒都有新增任务。假设GPU最多一次执行n个任务，一次执行耗时1秒，在保证GPU不空闲情况下，最少需要多长时间执行完成。题目输入第一个参数为GPU一次最多执行的任务个数，取值范围[1,10000]第二个参数为任务数组长度，取值范围[1,10000]第三个参数为任务数组，数字范围
基于CODESYS的多轴运动控制程序框架：逻辑与运动控制分离，快速开发灵活操作 GPJnCrbBdl python 开发语言
基于codesys开发的多轴运动控制程序框架，将逻辑与运动控制分离，将单轴控制封装成功能块，对该功能块的操作包含了所有的单轴控制（归零、点动、相对定位、绝对定位、设置当前位置、伺服模式切换等等）。程序框架由主程序按照状态调用分归零模式、手动模式、自动模式、故障模式，程序状态的跳转都已完成，只需要根据不同的工艺要求完成所需的动作即可。变量的声明、地址的规划都严格按照C++的标准定义，能帮助开发者快速
C++ | Leetcode C++题解之第409题最长回文串 Ddddddd_158 经验分享 C++Leetcode 题解
题目：题解：classSolution{public:intlongestPalindrome(strings){unordered_mapcount;intans=0;for(charc:s)++count[c];for(autop:count){intv=p.second;ans+=v/2*2;if(v%2==1andans%2==0)++ans;}returnans;}};
C++菜鸟教程 - 从入门到精通第二节 DreamByte c++
一.上节课的补充(数据类型)1.前言继上节课,我们主要讲解了输入,输出和运算符,我们现在来补充一下数据类型的知识上节课遗漏了这个知识点,非常的抱歉顺便说一下,博主要上高中了,更新会慢,2-4周更新一次对了,正好赶上中秋节,小编跟大家说一句:中秋节快乐!2.int类型上节课,我们其实只用了int类型int类型,是整数类型,它们存贮的是整数,不能存小数(浮点数)定义变量的方式很简单inta;//定义一
在Ubuntu中编译含有JSON的文件出现报错芝麻糊76 Linux kill_bug linux ubuntu json
在ubuntu中进行JSON相关学习的时候，我发现了一些小问题，决定与大家进行分享，减少踩坑时候出现不必要的时间耗费截取部分含有JSON部分的代码进行展示char*str="{\"title\":\"JSONExample\",\"author\":{\"name\":\"JohnDoe\",\"age\":35,\"isVerified\":true},\"tags\":[\"json\",\"
网络编程基础记得开心一点啊网络
目录♫什么是网络编程♫Socket套接字♪什么是Socket套接字♪数据报套接字♪流套接字♫数据报套接字通信模型♪数据报套接字通讯模型♪DatagramSocket♪DatagramPacket♪实现UDP的服务端代码♪实现UDP的客户端代码♫流套接字通信模型♪流套接字通讯模型♪ServerSocket♪Socket♪实现TCP的服务端代码♪实现TCP的客户端代码♫什么是网络编程网络编程，指网络上
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
C++ lambda闭包消除类成员变量 barbyQAQ c++c++java 算法
原文链接：https://blog.csdn.net/qq_51470638/article/details/142151502一、背景在面向对象编程时，常常要添加类成员变量。然而类成员一旦多了之后，也会带来干扰。拿到一个类，一看成员变量好几十个，就问你怕不怕？二、解决思路可以借助函数式编程思想，来消除一些不必要的类成员变量。三、实例举个例子：classClassA{public:...intfu
2021 CCF 非专业级别软件能力认证第一轮（CSP-J1）入门级C++语言试题（第三大题：完善程序代码） mmz1207 c++csp
最近有一段时间没更新了，在准备CSP考试，请大家见谅。（1）有n个人围成一个圈，依次标号0到n-1。从0号开始，依次0，1，0，1...交替报数，报到一的人离开，直至圈中剩最后一个人。求最后剩下的人的编号。#includeusingnamespacestd;intf[1000010];intmain(){intn;cin>>n;inti=0,cnt=0,p=0;while(cnt#includeu
《 C++ 修炼全景指南：九》打破编程瓶颈！掌握二叉搜索树的高效实现与技巧 Lenyiin C++修炼全景指南技术指南 c++算法 stl
摘要本文详细探讨了二叉搜索树（BinarySearchTree,BST）的核心概念和技术细节，包括插入、查找、删除、遍历等基本操作，并结合实际代码演示了如何实现这些功能。文章深入分析了二叉搜索树的性能优势及其时间复杂度，同时介绍了前驱、后继的查找方法等高级功能。通过自定义实现的二叉搜索树类，读者能够掌握其实际应用，此外，文章还建议进一步扩展为平衡树（如AVL树、红黑树）以优化极端情况下的性能退化。
20个新手学习c++必会的程序输出*三角形、杨辉三角等（附代码） X_StarX c++学习算法大学生开发语言数据结构
示例1:HelloWorld#includeusingnamespacestd;intmain(){coutusingnamespacestd;intmain(){inta=5;intb=10;intsum=a+b;coutusingnamespacestd;intfactorial(intn){if(nusingnamespacestd;voidprintFibonacci(intn){intt
C++八股 Petrichorzncu 八股总结 c++开发语言
这里写目录标题C++内存管理C++的构造函数，复制构造函数，和析构函数深复制与浅复制：构造函数和析构函数哪个能写成虚函数，为什么？C++数据结构内存排列结构体和类占用的内存：==虚函数和虚表的原理==虚函数虚表（Vtable）虚函数和虚表的实现细节==内存泄漏==指针的工作原理函数的传值和传址new和delete与malloc和freeC++内存区域划分C++11新特性C++常见新特性==智能指针
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
【2022 CCF 非专业级别软件能力认证第一轮（CSP-J1）入门级 C++语言试题及解析】汉子萌萌哒 CCF noi 算法数据结构 c++
一、单项选择题(共15题，每题2分，共计30分；每题有且仅有一个正确选项)1.以下哪种功能没有涉及C++语言的面向对象特性支持：()。A.C++中调用printf函数B.C++中调用用户定义的类成员函数C.C++中构造一个class或structD.C++中构造来源于同一基类的多个派生类题目解析【解析】正确答案:AC++基础知识，面向对象和类有关，类又涉及父类、子类、继承、派生等关系，printf
《 C++ 修炼全景指南：十》自平衡的艺术：深入了解 AVL 树的核心原理与实现 Lenyiin C++修炼全景指南技术指南 c++数据结构 stl
摘要本文深入探讨了AVL树（自平衡二叉搜索树）的概念、特点以及实现细节。我们首先介绍了AVL树的基本原理，并详细分析了其四种旋转操作，包括左旋、右旋、左右双旋和右左双旋，阐述了它们在保持树平衡中的重要作用。接着，本文从头到尾详细描述了AVL树的插入、删除和查找操作，配合完整的代码实现和详尽的注释，使读者能够全面理解这些操作的执行过程。此外，我们还提供了AVL树的遍历方法，包括中序、前序和后序遍历，
JAVA学习笔记之23种设计模式学习 victorfreedom Java技术设计模式 android java 常用设计模式
博主最近买了《设计模式》这本书来学习，无奈这本书是以C++语言为基础进行说明，整个学习流程下来效率不是很高，虽然有的设计模式通俗易懂，但感觉还是没有充分的掌握了所有的设计模式。于是博主百度了一番，发现有大神写过了这方面的问题，于是博主迅速拿来学习。一、设计模式的分类总体来说设计模式分为三大类：创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式，共七种：适配器
c++ opencv4.3 sift匹配图像处理大大大大大牛啊图像处理 opencv实战代码讲解 opencv sift c++opencv4 特征点
c++opencv4.3sift匹配main.cppintmain(){vectorkeypoints1,keypoints2;Matimg1,img2,descriptors1,descriptors2;intnumF
《 C++ 修炼全景指南：四》揭秘 C++ List 容器背后的实现原理，带你构建自己的双向链表 Lenyiin 技术指南 C++修炼全景指南 c++list 链表 stl
本篇博客，我们将详细讲解如何从头实现一个功能齐全且强大的C++List容器，并深入到各个细节。这篇博客将包括每一步的代码实现、解释以及扩展功能的探讨，目标是让初学者也能轻松理解。一、简介1.1、背景介绍在C++中，std::list是一个基于双向链表的容器，允许高效的插入和删除操作，适用于频繁插入和删除操作的场景。与动态数组不同，list允许常数时间内的插入和删除操作，支持双向遍历。这篇文章将详细
c++ 内存处理函数 heeheeai c++开发语言
在C语言的头文件中，memcpy和memmove函数都用于复制内存块，但它们在处理内存重叠方面存在关键区别：内存重叠:memcpy函数不保证在源内存和目标内存区域重叠时能够正确复制数据。如果内存区域重叠，memcpy的行为是未定义的，可能会导致数据损坏或程序崩溃。memmove函数能够安全地处理源内存和目标内存区域重叠的情况。它会确保在复制过程中不会覆盖尚未复制的数据，从而保证数据的完整性。效率:
【c++基础概念深度理解——堆和栈的区别，并实现堆溢出和栈溢出】 XWWW668899 C++基本概念 c++c语言开发语言青少年编程
文章目录概要技术名词解释栈溢出和堆溢出小结概要学习C++语言，避免不了要好好理解一下堆（Heap）和栈（Stack），有助于更好地管理内存，以及如何写出一段程序“成功实现”堆溢出和栈溢出。技术名词解释理解东西最快的方式是根据自己目前能理解的词语去关联新的概念，不断的纠正，向正确的深度理解靠近，当无限接近的时候也就理解了想要理解的概念。我们经常说堆栈，把这两个名词放到一起。其实，堆是堆，栈是栈，两种
LeetCode 53. Maximum Subarray 枯萎的海风算法与OJ C/C++leetcode
1.题目描述Findthecontiguoussubarraywithinanarray(containingatleastonenumber)whichhasthelargestsum.Forexample,giventhearray[−2,1,−3,4,−1,2,1,−5,4],thecontiguoussubarray[4,−1,2,1]hasthelargestsum=6.clicktos
C++常见知识掌握 nfgo c++开发语言
1.Linux软件开发、调试与维护内核与系统结构Linux内核是操作系统的核心，负责管理硬件资源，提供系统服务，它是系统软件与硬件之间的桥梁。主要组成部分包括：进程管理：内核通过调度器分配CPU时间给各个进程，实现进程的创建、调度、终止等操作。使用进程描述符（task_struct）来存储进程信息，包括状态（就绪、运行、阻塞等）、优先级、内存映射等。内存管理：包括物理内存和虚拟内存管理。通过页表映
【LeetCode】53. Maximum Subarray 墨染百城 LeetCode leetcode
问题描述问题链接：https://leetcode.com/problems/maximum-subarray/#/descriptionFindthecontiguoussubarraywithinanarray(containingatleastonenumber)whichhasthelargestsum.Forexample,giventhearray[-2,1,-3,4,-1,2,1,-
metaRTC5.0 API编程指南(一) metaRTC metaRTC c++c语言 webrtc
概述metaRTC5.0版本API进行了重构，本篇文章将介绍webrtc传输调用流程和例子。metaRTC5.0版本提供了C++和纯C两种接口。纯C接口YangPeerConnection头文件:include/yangrtc/YangPeerConnection.htypedefstruct{void*conn;YangAVInfo*avinfo;YangStreamConfigstreamco
LeetCode 673. Number of Longest Increasing Subsequence (Java版; Meidum) littlehaes 字符串动态规划算法 leetcode 数据结构
welcometomyblogLeetCode673.NumberofLongestIncreasingSubsequence(Java版;Meidum)题目描述Givenanunsortedarrayofintegers,findthenumberoflongestincreasingsubsequence.Example1:Input:[1,3,5,4,7]Output:2Explanatio
sublime个人设置 bawangtianzun sublime text 编辑器
如何拥有jiangly蒋老师同款编译器(sublimec++配置竞赛向）_哔哩哔哩_bilibiliSublimeText4的安装教程（新手竞赛向）-知乎(zhihu.com)创建文件自动保存为c++打开SublimeText软件。转到"Tools"（工具）>"Developer"（开发者）>"NewPlugin"（新建插件）。在打开的新文件中，粘贴以下代码：importsublimeimport
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交