☞北海北☜

GPU-CUDA编程学习（四）-共享内存

Shared memory

共享内存在芯片上可用，因此它比全局内存快得多。共享内存延迟大约比未调用的全局内存延迟低100倍。来自同一块的所有线程都可以访问共享内存。这在许多需要与其他线程共享结果的应用程序中非常有用。但是，如果没有同步，也会产生混乱或错误的结果。如果一个线程在其他线程写入数据之前从内存中读取数据，那么可能会导致错误的结果。因此，应该适当地控制或管理内存访问。这是由剩余的**syncthreads()**指令完成的，该指令确保在程序继续执行之前，对内存的所有写操作都已完成。这也叫做阻塞。阻塞的意思是所有线程都将到达这一行并等待其他线程完成。在所有线程都达到这个阻塞之后，它们可以进一步移动。为了演示共享内存和线程同步的使用，本文给出了一个移动平均的示例。其核函数如下:

#include 
__global__ void gpu_shared_memory(float *d_a)
{
int i, index = threadIdx.x;
float average, sum = 0.0f;
//Defining shared memory
__shared__ float sh_arr[10];
sh_arr[index] = d_a[index];
// This directive ensure all the writes to shared memory have completed
__syncthreads();
for (i = 0; i<= index; i++)
{
sum += sh_arr[i];
}
average = sum / (index + 1.0f);
d_a[index] = average;
//This statement is redundant and will have no effect on overall code execution
sh_arr[index] = average;
}

移动平均操作只是找到一个数组中直到当前元素的所有元素的平均值。许多线程的计算都需要相同的数组数据。这是使用共享内存的理想情况，它将比全局内存提供更快的数据。这将减少每个线程的全局内存访问次数，从而减少程序的延迟。共享内存的位置是用__shared__指令定义的。在本例中，定义了十个浮点数元素的共享内存。通常，共享内存的大小应该等于每个块的线程数。在这里，我们处理的是数组长度10，因此我们获得了这个大小的共享内存。下一步是将数据从全局内存复制到这个共享内存。所有线程都将按其线程ID索引的元素复制到共享数组中。现在，这是一个共享内存的写操作，在下一行中，我们将从这个共享数组中读取。因此，在继续之前，我们应该确保所有共享内存写操作都已完成。因此，让我们引入**__synchronizethreads()**阻塞。

接下来，for循环使用共享内存中的值计算到当前元素的所有元素的平均值，并将结果存储在由当前线程ID索引的全局内存中。现在，我们将尝试为这段代码编写如下的main函数：

int main(int argc, char **argv)
{
float h_a[10];
float *d_a;
//Initialize host Array
for (int i = 0; i < 10; i++)
{
h_a[i] = i;
}
// allocate global memory on the device
cudaMalloc((void **)&d_a, sizeof(float) * 10);
// copy data from host memory to device memory
cudaMemcpy((void *)d_a, (void *)h_a, sizeof(float) * 10, cudaMemcpyHostToDevice);
gpu_shared_memory << <1, 10 >> >(d_a);
// copy the modified array back to the host
cudaMemcpy((void *)h_a, (void *)d_a, sizeof(float) * 10, cudaMemcpyDeviceToHost);
printf("Use of Shared Memory on GPU: \n");
for (int i = 0; i < 10; i++)
{
printf("The running average after %d element is %f \n", i, h_a[i]);
}
return 0;
}

在主函数中，为主机数组和设备数组分配内存后，主机阵列被从0到9的值填充。它被复制到设备内存中，在那里计算移动平均并存储结果。来自设备内存的结果被复制回主机内存，然后打印在控制台上。控制台输出如下:

本节演示了当多个线程使用来自相同内存位置的数据时共享内存的使用。接下来演示原子操作的使用，它们在读修改写操作中非常重要。

Atomic operations

考虑这样一种情况:大量线程试图修改一小部分内存。这是一种经常发生的现象。当我们尝试执行一个读-修改-写操作时，它会产生更多的问题。该操作的示例是d_out[i] ++，其中从内存中读取第一个d_out[i]，然后递增，然后写回内存。但是，当多个线程在同一内存位置上执行此操作时，可能会给出错误的输出。假设一个内存位置的初始值为6，并且线程p和q试图增加这个内存位置，那么最终的答案应该是8。但是在执行时，p线程和q线程可能同时读取这个值，然后两个线程都将得到值6。它们将其增量为7，并且都将这个7存储在内存中。所以不是8，我们最终的答案是7，这是错的。
以ATM取现金为例，就可以理解这有多危险。假设你的账户上有5000英镑。你有同一账户的两张提款卡。你和你的朋友同时去两台不同的自动取款机取4000英镑。两人同时刷卡;因此，当自动取款机检查余额时，两者都会显示余额为5000英镑。
当你们两个都取4000英镑时，两台机器都会查看初始余额，即5000英镑。取钱的金额少于余额，因此两台机器都能取4000英镑。即使你的余额是5000英镑，你得到了8000英镑，这很危险。为了演示这一现象，我们举了一个大线程试图访问小数组的例子。本例的核函数如下:

include <stdio.h>
#define NUM_THREADS 10000
#define SIZE 10
#define BLOCK_WIDTH 100
__global__ void gpu_increment_without_atomic(int *d_a)
{
int tid = blockIdx.x * blockDim.x + threadIdx.x;
// Each thread increment elements which wraps at SIZE
tid = tid % SIZE;
d_a[tid] += 1;
}

内核函数只是递增d_a[tid] +=1行的内存位置。问题是这个内存位置增加了多少次。线程总数为10,000个，数组的大小仅为10。我们通过在线程ID和数组大小之间进行模操作来为数组建立索引。因此，1000个线程将在同一位置增加。理想情况下，数组中的每个位置都应该增加1000次。但正如我们将在输出中看到的，情况并非如此。在看到输出之前，我们先试着写main函数:

int main(int argc, char **argv)
{
printf("%d total threads in %d blocks writing into %d array elements\n",
NUM_THREADS, NUM_THREADS / BLOCK_WIDTH, SIZE);
// declare and allocate host memory
int h_a[SIZE];
const int ARRAY_BYTES = SIZE * sizeof(int);
// declare and allocate GPU memory
int * d_a;
cudaMalloc((void **)&d_a, ARRAY_BYTES);
// Initialize GPU memory with zero value.
cudaMemset((void *)d_a, 0, ARRAY_BYTES);
gpu_increment_without_atomic << <NUM_THREADS / BLOCK_WIDTH, BLOCK_WIDTH >> >(d_a);
// copy back the array of sums from GPU and print
cudaMemcpy(h_a, d_a, ARRAY_BYTES, cudaMemcpyDeviceToHost);
printf("Number of times a particular Array index has been incremented without atomic add is: \n");
for (int i = 0; i < SIZE; i++)
{
printf("index: %d --> %d times\n ", i, h_a[i]);
}
cudaFree(d_a);
return 0;
}

在主函数中，设备数组被声明并初始化为零。这里，一个特殊的cudaMemSet函数用于初始化设备上的内存。它作为参数传递给内核，内核会增加这10个内存位置。在这里，总共有10,000个线程被启动为1,000个块，每个块有100个线程。内核执行后存储在设备上的答案被复制回主机，每个内存位置的值显示在控制台上。输出如下:
如前所述，理想情况下，每个内存位置应该增加1,000次，但是大多数内存位置的值为16和17。这是因为许多线程同时读取相同的位置，因此增加相同的值并将其存储在内存中。由于线程执行的时间超出了程序员的控制，因此并发内存访问的次数是不知道的。如果您第二次运行您的程序，那么您的输出是否与第一次相同?您的输出可能如下所示:
正如你可能已经猜到的，每次运行程序时，内存位置可能有不同的值。这是因为设备上的所有线程都是随机执行的。

为了解决这个问题，CUDA提供了一个名为atomicAdd 操作的API。它是一个阻塞操作，这意味着当多个线程试图访问相同的内存位置时，一次只能有一个线程访问该内存位置。其他线程必须等待这个线程完成并在内存中写入它的答案。使用atomicAdd操作的内核函数如下所示：

#include 
#define NUM_THREADS 10000
#define SIZE 10
#define BLOCK_WIDTH 100
__global__ void gpu_increment_atomic(int *d_a)
{
// Calculate thread index
int tid = blockIdx.x * blockDim.x + threadIdx.x;
// Each thread increments elements which wraps at SIZE
tid = tid % SIZE;
atomicAdd(&d_a[tid], 1);
}

核函数与我们之前看到的非常相似。使用atomicAdd函数，而不是使用**+=**操作符递增内存位置。它有两个参数。第一个是我们想要增加的内存位置，第二个是这个位置必须增加的值。在这段代码中，1000个线程将再次尝试访问相同的位置;因此，当一个线程使用这个位置时，其他999个线程必须等待。这将增加执行时间方面的成本。使用原子操作的增量的主要功能如下所示：

int main(int argc, char **argv)
{
printf("%d total threads in %d blocks writing into %d array elements\n",NUM_THREADS, NUM_THREADS / // declare and allocate host memory
int h_a[SIZE];
const int ARRAY_BYTES = SIZE * sizeof(int);
// declare and allocate GPU memory
int * d_a;
cudaMalloc((void **)&d_a, ARRAY_BYTES);
// Initialize GPU memory withzero value
cudaMemset((void *)d_a, 0, ARRAY_BYTES);
gpu_increment_atomic << <NUM_THREADS / BLOCK_WIDTH, BLOCK_WIDTH >> >(d_a);
// copy back the array from GPU and print
cudaMemcpy(h_a, d_a, ARRAY_BYTES, cudaMemcpyDeviceToHost);
printf("Number of times a particular Array index has been incremented is: \n");
for (int i = 0; i < SIZE; i++)
{
printf("index: %d --> %d times\n ", i, h_a[i]);
}
cudaFree(d_a);
return 0;
}

在main函数中，包含10个元素的数组被初始化为零值并传递给内核。但是现在，内核将执行原子添加操作。所以，这个程序的输出应该是准确的。数组中的每个元素应该增加1000次。下面是输出：

如果您使用原子操作来度量程序的执行时间，它所花费的时间可能比使用全局内存的简单程序所花费的时间更长。这是因为许多线程在原子操作中等待内存访问。使用共享内存可以帮助加速操作。另外，如果相同数量的线程访问更多的内存位置，那么原子操作将导致更少的时间开销，因为等待内存访问的线程更少。

这里举一个图像操作中常用的统计直方图的例子：
我们将从CPU上计算直方图开始，以便您可以了解如何计算直方图。假设数据中有1,000个元素，每个元素的值在0到15之间。我们要计算这个分布的直方图。在CPU上进行计算的示例代码如下:

int h_a[1000] = Random values between 0 and 15
int histogram[16];
for (int i = 0; i<16; i++)
{
histogram[i] = 0;
} for (
i=0; i
<
1000; i++)
{
histogram[h_a[i]] +=1;
}

我们有1,000个数据元素，它们存储在h_a中。h_a数组包含0到15之间的值;它有16个不同的值。
现在，我们将为GPU开发相同的代码。我们将尝试使用三种不同的方法来开发此代码。前两种方法的内核代码如下:

#include 
#include 
#define SIZE 1000
#define NUM_BIN 16
__global__ void histogram_without_atomic(int *d_b, int *d_a)
{
int tid = threadIdx.x + blockDim.x * blockIdx.x;
int item = d_a[tid];
if (tid < SIZE)
{
d_b[item]++;
}
}
__global__ void histogram_atomic(int *d_b, int *d_a)
{
int tid = threadIdx.x + blockDim.x * blockIdx.x;
int item = d_a[tid];
if (tid < SIZE)
{
atomicAdd(&(d_b[item]), 1);
}
}

第一个函数是直方图计算中最简单的核函数。每个线程操作一个数据元素。使用线程ID作为输入数组的索引来获取数据元素的值。这个值用作d_b输出数组的索引，该数组递增。d_b数组应该包含输入数据中0到15之间每个值的频率。但是如果你回想上边讲的内容，这可能不会给你一个正确的答案，因为许多线程试图同时修改相同的内存位置。在本例中，1,000个线程试图同时修改16个内存位置。对于这种场景，我们需要使用原子添加操作。第二个设备函数是使用原子添加操作开发的。这个内核函数将给您正确的答案，但它将花费更多的时间来完成，因为原子操作是一个阻塞操作。当一个线程正在使用一个特定的内存位置时，所有其他线程都必须等待。因此，第二个内核函数将增加开销时间，这使得它甚至比CPU版本更慢。为了完成代码，我们试着为它编写如下的主函数:

int main()
{
int h_a[SIZE];
for (int i = 0; i < SIZE; i++) {
h_a[i] = i % NUM_BIN;
}
int h_b[NUM_BIN];
for (int i = 0; i < NUM_BIN; i++) {
h_b[i] = 0;
}
int * d_a;
int * d_b;
// allocate GPU memory
cudaMalloc((void **)&d_a, SIZE * sizeof(int));
cudaMalloc((void **)&d_b, NUM_BIN * sizeof(int));
// transfer the arrays to the GPU
cudaMemcpy(d_a, h_a, SIZE * sizeof(int), cudaMemcpyHostToDevice);
cudaMemcpy(d_b, h_b, NUM_BIN * sizeof(int), cudaMemcpyHostToDevice);
// launch the kernel
//histogram_without_atomic << <((SIZE+NUM_BIN-1) / NUM_BIN), NUM_BIN >> >(d_b, d_a);
histogram_atomic << <((SIZE+NUM_BIN-1) / NUM_BIN), NUM_BIN >> >(d_b, d_a);
// copy back the sum from GPU
cudaMemcpy(h_b, d_b, NUM_BIN * sizeof(int), cudaMemcpyDeviceToHost);
printf("Histogram using 16 bin without shared Memory is: \n");
for (int i = 0; i < NUM_BIN; i++) {
printf("bin %d: count %d\n", i, h_b[i]);
}
// free GPU memory allocation
cudaFree(d_a);
cudaFree(d_b);
return 0;
}
// declare GPU memory pointers

输出如下：

当我们尝试使用原子操作度量这段代码的性能并将其与CPU性能进行比较时，它比大型数组的CPU性能要慢。这就引出了一个问题:我们使用CUDA来进行直方图计算，有可能使计算速度更快吗?
这个问题的答案是:是的。如果我们使用共享内存来计算给定块的直方图，然后将这个块直方图添加到全局内存的总体直方图中，那么它可以加快操作速度。这是可能的，因为加法是一个累积操作。使用共享内存的内核代码：

#include 
#include 
#define SIZE 1000
#define NUM_BIN 256
__global__ void histogram_shared_memory(int *d_b, int *d_a)
{
int tid = threadIdx.x + blockDim.x * blockIdx.x;
int offset = blockDim.x * gridDim.x;
__shared__ int cache[256];
cache[threadIdx.x] = 0;
__syncthreads();
while (tid < SIZE)
{
atomicAdd(&(cache[d_a[tid]]), 1);
tid += offset;
}
__syncthreads();
atomicAdd(&(d_b[threadIdx.x]), cache[threadIdx.x]);
}

在本例中，只有256个线程尝试访问共享内存中的256个内存元素，而不是前面代码中的1,000个元素。这将有助于减少原子操作的时间开销。最后一行中的最后一个原子添加操作将把一个块的直方图添加到总体直方图值中。
因为加法是一个累积操作，所以我们不必担心每个块的执行顺序。
如果你测量之前的程序的性能，它将击败没有共享内存的GPU版本和大数组的CPU实现。你可以通过比较GPU计算的直方图和CPU计算的结果来检查GPU计算的直方图是否正确。

大学糗事8//老四赌气喝辣椒水喝的洗胃蘑菇花园
老四赌气喝辣椒水喝的洗胃我们班上老四是重庆的隔壁宿舍还有一个男生是湖南的，本来两个人饮食习惯相似应该有很多共同话题的事实恰好相反两个人就像死敌一样！两人的性格很相似都是很活跃喜欢闹腾只要有表现机会两个人都是你方唱罢我登场绝不妥协。在班级竞选上，老四要竞选学委湖南同学一定会竞选体委;在校园活动上，老四如果唱首歌湖南同学一定会跳支舞；在课堂发言上，老四提出一个观点湖南同学一定会想尽一切办法提出反驳。图
2021-04-09 小渡艳辉
遇见新的自己—小渡见面会感悟四月的南沙，微风不燥，温暖和煦，红绿相应，清清明明。恰赶上清明节，然而心中的期待已冲淡了那份哀思，来自全国各地的几十个同学带着各自成长的烙印，或喜或悲，为遇见新的自己奔赴而来，齐聚南沙，参加本次小渡见面会暨本会团体心理成长工作坊。齐聚南沙我是带着清晰的目标—学习带领成长团体活动参加本次见面会的，所以一走进会场又是牟足劲的状态，然而第一个环节，回想对自己影响最大的一个人或
五子棋刘誉天爸爸
隔了好一段时间，今天我又和爸爸一起下几局五子棋。爸爸说，现在的我开始会思考了，和一年前大不相同，爸爸想赢我也不那么容易了！而且，今天爸爸说的五子棋规则和窍门我理解得更好了，比如:1，对方有三颗子连成线时，一定要观察它的首尾，如果首尾都是空的，就一定要堵了；2，如果对方有两条线都是三颗子或者一条三颗一条四颗，而且交叉在一起，那我一定输了，所以我一定要避免让对方形成这样的局面；3，在堵对方的棋子时，还
S早起晨读6第一次复盘（四） HinaHu
S早起晨读6第一次复盘（四）今天练习完，已经是23：57分了。本想放个水，不想写这个日记了，因为今天实在有点累，因为签证缺一个材料，搞好那个材料还好麻烦，心烦。但是想想还是忍住，写完了再睡。今天先复盘了D15-D16两天的课程总共6个音标。之前练习过的，学过的，但是复盘的时候，依然还是觉得咦，这个音怎么是这么发的？感叹，复盘多么的重要。后来全盘复盘了一下D1-D14的全部音标。只差那个r这个音，因
奇葩说的真奇葩 jia年华1899
奇葩说第五季已经播到第10期了，前几季没有怎么看过，只是偶尔会看，不过四季的BBking中，我最喜欢的是肖骁，虽然他很娘，不管是外形上，还是辩论上，可谓是奇葩说里真正的奇葩。他的观点是绝对的奇葩，绝对的意想不到，而且永远都是那么的接地气，那么的通俗易懂，让观众可以不费力气的去接受和认可。而马薇薇的辩论就是吵架，争论，邱晨的辩论则是娓娓道来，听到有趣之处，观众会抿嘴一笑，而黄执中更像是一个老师在给学
什么是高防 IP？从技术原理到实战部署的深度解析快快网络-三七业务安全服务器 ip 快快网络高防IP 快快云弹性云云计算
目录前言一、高防IP的定义与核心价值二、高防IP的技术原理与架构2.1流量牵引技术2.2流量清洗引擎2.3回源机制三、高防IP的核心防护技术详解3.1DDoS攻击防御技术3.2高防IP的弹性带宽设计四、实战：基于Linux的高防IP环境配置4.1配置高防IP回源白名单4.2配置TCP抗攻击参数4.3高防IP与Nginx的配合配置五、高防IP的选型与部署建议总结前言在网络攻击日益频繁的今天，DDoS
Copula 回归与结构方程模型：R 语言构建多变量因果关系网络
技术点目录专题一、R及Python语言及相关性研究初步专题二、二元Copula理论与实践（一）专题三、二元Copula理论与实践（二）【R语言为主】专题四、Copula函数的统计检验与选择【R语言为主】专题五、高维数据与VineCopula【R语言】专题六、正则VineCopula（一）【R语言】专题七、正则VineCopula（二）【R语言】专题八、时间序列中的Copula【R语言】专题九、Co
阅来悦美·手写人生第1⃣️0⃣️9⃣️天阅来悦美
04.20/星期四农历三月初一盛大的春日，群芳并集，群山回唱。拥抱着春色，满怀的春风，一眼望不尽的绿意，充斥着山林之间。谷雨至，春已远，愿你：工作中一“谷”作气，事业高升；朋友间“谷”道热肠，人缘美好；生活中欢欣“谷”舞，快乐舒畅。清风送爽，鸥鸟深情，人间四月爱正暖。雨生百谷，时至暮春。谷雨，是春季的最后一个节气，春日胜黄金，一分耕耘一分收获，趁着好春光，播种希望，向梦想出发。春与山川俱明媚，最美
《金字塔原理》读书笔记猫呢wyh
主要内容：此书教授我们使用金字塔原理，搭建表达的逻辑，想清楚，说明白，知道说什么，怎么说。本书呈现四大逻辑——表达的逻辑、思考的逻辑、解决问题的逻辑、演示的逻辑。什么是金字塔原理：金字塔原理是一种重点突出、逻辑清晰、层次分明、简单易懂的思考、沟通方式。金字塔原理的基本结构：结论先行，以上统下，归类分组，逻辑递进。（全书精华）先重要后次要，先总结后具体，先框架后细节，先结论后原因，先结构后过程，先论
口说作文库保辉
前几天偶然听到儿子在念诗：“《咏海》作者：库煜阳大海蓝如天，一望不见头。看见鱼儿游，赶紧去抓鱼。”听到这首“诗”，感觉有点怪怪的。我好奇地问了他一句：“你念的诗是你自己创作的吧？”儿子自豪地说：“是啊！是我自己创作的，你要是不相信，我还可以念几首你听听。”接着他又念了几首，随便一个主题，他都能说四句，感觉还真有点“诗”的味道。看到儿子的表现，我很开心。我开始有意识地引导他口头说作文，这时候，我发现
剧本杀《误入杀手镇的0和1》复盘详细解析+凶手角色剧透答案真相 VX搜_小燕子复盘
为了你获得更好的游戏体验，本文仅显示《误入杀手镇的0和1》剧本杀部分真相复盘，获取完整真相复盘只需两步①【微信关注公众号：集美复盘】②回复【误入杀手镇的0和1】即可查看获取哦﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎1、剧本杀《误入杀手镇的0和1》角色介绍洛萝和刘嘎子作案过程中，萧贱贱先用枕头捂四了王有钱，然后扮作王有钱的模样在【王有钱大宫殿】游荡，所以洛萝扮
Java-Script学习笔记-1 许我写余生ღ JavaScript 学习 javascript 前端
文章目录前言JavaScript基本介绍一、js的嵌入方法内嵌式外链式行内式二、js简单语法语句注释变量JavaScript保留关键字三、JavaScript作用域Javascrpt局部变量JavaScript全局变量四、运算符算术运算符比较运算符赋值运算符逻辑运算符五、JavaScript数据类型JavaScript如何判断数据类型数字类型（Number）字符串型（string）布尔类型（boo
焦点解决第403天孟兆桂
【心灵健康的十大守则】一、不要埋怨任何人,不管任何事情,其实一切选择权都在自己的手上。选择了，不管是对与错都要面对。二、生活中，不管发生什么事情，换一个角度去想，尽量为自己找一个快乐的理由。我们应该要尽量去笑，而不是哭。三、受到上帝眷恋的时候，你要相信自己是幸运的。受到上帝捉弄的时候，你更要相信自己是幸运的。因为，上帝在换另一种方式去磨练你的意志。四、尽量对每一个人都要付出真诚。假如那个人是虚伪的
南极仙翁的坐骑白鹿，因何有一狐狸女儿？寿星行为蹊跷，不敢深究中山人读文史
南极仙翁的坐骑白鹿，因何有一狐狸女儿？寿星行为蹊跷，不敢深究《山海经》和《白鹿原》名著作品中，仙鹿都是天地间的祥瑞精灵。因为鹿是古人眼中的神物，代表着健康、幸福和长寿，但凡出现，就会为人们带来好事情。四大名著《西游记》里，作为吉祥神兽的仙鹿，却因给比丘国王进献女儿和长生不老的药方，成了反面的形象。向国王进献女儿，成为比丘国国丈，也不算什么太出格的事情；让人觉得仙鹿离经叛道的事情就是，他献策用111
今天天放晴了，心情重新调整，继续挑战生活修远聊成长
连续下雨多日，心情也跟着变差，但今天天放晴了，心情自然变好了。你的心情变好了吗？生活不止有晴天，还有阴天和下雨天，我们所要做的就是面对这些，直面生活带给我们的一切，做我们自己。挑战生活就是挑战自我，调整你自己的状态吧！每逢周一下午困，我们不应该这样，毕竟休息了周六或者是周日一天。如果你每逢周一下午困的话，那么你每逢周二周三周四周五下午也会困的。你要做到的是从周一中午就开始好好睡觉，或者说从周日晚上
未来可期2022-06-11 九九聊
清晨，马路上非常清新，许是昨天的雨把所有的阴霾都扫去了吧？走着路上的脚步变得非常轻快。回忆这四个月来的晨读，有过退缩的想法，有过放弃的想法，但最终一直坚持下来，没事落下一堂课，虽然没有把所学知识及时落下去，但一直在做，一直在进步。因为不是科班出身，所以系统性的执行有些不足，虽然学习了时间管理，但时间管理的精髓还没有真正落地。后面的路还有很长要走。但是我发现自己的潜能正在慢慢的激发出来，接下来我将梳
2018-06-03 佟色青青
*公交*小记——佟色青青今年的夏天，又一如继往地颠簸在公交车上。途经菜市场就上来几位乘客，涮卡器连续地报数着:老年卡……可最后者却报成“余额不足”。只听得公交车师机低声地说:您投一元吧，卡没费了！“谁说没费，昨天去观音庙还有的，国家给我们老年人办卡就是为了，不花钱乘车见，他妈的……”这无理不饶人的粗语，惊得四座都投去了诧异的目光。师机无奈地重申道:不是说公交卡办了就可以无偿乘一辈子公交，里面的费刷
面试高频题力扣 130. 被围绕的区域洪水灌溉(FloodFill) 深度优先遍历(dfs) 暴力搜索 C++解题思路每日一题 Q741_147 C/C++每日一题：从语法到算法面试 leetcode 深度优先 c++洪水灌溉
目录零、题目描述一、为什么这道题值得你花时间掌握？二、题目拆解：提取核心关键点三、解题思路：从边界入手，反向标记四、算法实现：深度优先遍历（DFS）+两次遍历五、C++代码实现：一步步拆解代码拆解时间复杂度空间复杂度七、坑点总结八、举一反三九、总结零、题目描述题目链接：被围绕的区域题目描述：示例1：输入：board=[[“X”,“X”,“X”,“X”],[“X”,“O”,“O”,“X”],[“X”
低调！赵丽颖产后现身，全副武装宛如路人？莫舒伊
作者：伊伊Vivien阅读时间：30s图片发自App7月16日凌晨四点，赵丽颖一人身穿蓝紫色长裙和白色帆布鞋现身北京机场，戴着帽子口罩的她包裹严实，身材苗条腰肢纤细，状态十分不错。据悉，赵丽颖自3月8日诞下儿子后一直处于休息调养阶段，此前未有公开露面。图片发自App赵丽颖与粉丝在机场对话赵丽颖：你们起的也太早了吧，我的天呐。男粉丝1：我们没睡。男粉丝2：你们懂今天睡过头的感受吗？？没有凌晨四点的觉
但愿人人平等田坤爸爸
非常讨厌那些一个月拿着五六千七八千退休金的人！来买点东西挑三拣四，讨价还价，照死里讲价！他们不知老百姓的苦，老百姓种点水果蔬菜容易吗？大热天，起早来早市，卖个百儿八十的，他们都狠下心死讲！更可恨的是他们不讲理，身边油条嫂卖油条，三轮车放在哪里好好的，有个退休的骑电动车差点碰到了油条嫂的三轮车上，就张口骂人家油条嫂！人家油条嫂的三轮车天天那样放着，根本没阻碍过交通！那些退休的就是大爷！难道他们真的为
我会养你一辈子，即使我爱的人是我妻子纵然没有纵然
我小时候长得四不像，不像爸，不像妈，不像姑，不像舅。以至于朋友现在看到我小时候的照片时，都会忍不住感叹一下，你在阿姨肚子里基因变异了吧。是真的又黑又丑，很不招人喜欢，至少，我的爷爷奶奶是真的很不喜欢我。当然，我奶奶不喜欢我，除了我长得丑，还有一部分原因是因为我老爸老妈。说起来，我爸爸的出生有点尴尬，他是家里第一个男丁，前面有一个姐姐，后面又出生了妹妹和弟弟。奶奶几乎把所有的爱都给了我的小姑和叔叔。
人间最美四月天金条碎碎碎
四月一场桃花雨，许你一季桃花肌。图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App
北京秋天的街道竹子黄了
北京秋天的街道黄叶在纷纷地飘我来到这里好多年心❤也在四处飘骑着小黄车寻找归属晚餐在哪里我不知道图片发自App北京秋天的街道荷塘的月色在飘我在四环的街边徜徉闻着成熟的味道我的未来不是梦我心里知道要付出努力才能见分晓图片发自App北京秋天的街道麻辣的味道在飘我想起我的家乡我的母亲在田埂上远眺我的初恋已成过去自行车和汽车要各有各的道图片发自App2019年8月12日夜
C语言易错点（二） WangJiaLeLeLeLe c语言开发语言
目录一、两个转义字符二、除法和取模操作符三、大小端字节序四、printf的传参五、位段六、枚举八、预处理、编译、链接九、写一个宏，交换一个数二进制位的奇偶位十、offsetof宏的实现——计算某结构体相对于首地址的偏移量十一、C语言头文件中的ifndef/define/endif的作用？十二、动态内存错误一、两个转义字符1、/060，‘/’跟三位数字表示将这个数字转为八进制数字，其对应ASCII码
缘万里长征
听说城里来了个年轻的道士，背着一把桃木剑，手持幡旗，上面写着知阴阳晓八卦，算命测祸福；上天地改生死，号称陈半仙。他算卦有一个规矩，那就是每天只算三副卦，每卦只收五文钱，而且是他主动算别人，算完即止马上收摊。因为其卦象极为灵验，因此前来求卦的人络绎不绝。那天我走在街上，突然被他叫住。“小姐，算一卦吧！”我看了看四周，此时只有我一个人，我不敢相信自己的耳朵，指了指自己：“先生是在说我吗？”“是的，要是
《金字塔原理》读后感 shuaigefeng
这本书对于那些考虑问题经常一团乱，做事情想到哪做到哪儿经常出现返工的人来说非常值得一看，这本书分别从表达、思考、解决问题以及演示四个方面帮读者建立逻辑思维，本书里面提到的逻辑性的做法乍一看觉得很简单，好像自己平时做事就是按照这个方式来的，但是实际上在一个陌生的行业或者处理一个不熟悉的事情，思考以及处事的方式经常会按照自己一种想当然的方式就开始，这个时候就经常会出现很多时候感觉大脑是糊的，事情也要一
（四）Python总结笔记：函数 Laura_Wangzx Python学习笔记 python
Python总结笔记（四）函数python中的函数函数中的参数变量作用域偏函数PFA递归函数高阶函数BIFs中的高阶函数匿名函数lambda闭包Closure装饰器Decorator函数式编程FunctionalProgramming1.python中的函数￭函数的意义:■1.对输入进行变换映射后输出，可以进行反复调用。以函数名对代码块进行封装■2.过程化VS结构化￭函数的创建及结构:■定义函数名
秋凉赋秋有集
秋天已到了两天第一天是一场细雨第二天是一场秋雨一时一时的秋雨一霎一霎的凉意天井里结着油葵蜗牛躲进了地衣一蜷缩就是一个四季一个一个的春秋像落叶迅疾生长或者离开都始料不及图片发自App
Python基础（四）函数
一、函数简介函数也是一个对象。对象是内存中专门用来存储数据的一块区域。函数用来保存一些可执行代码，并且在需要时，可以重复调用。创建函数：def函数名([形参1，形参2，.....形参n]):代码块函数名必须要符合标识符规范可以包含字母、数字、下划线，但不能以数字开头。函数中保存的代码，需要被调用才会执行。调用函数：函数对象()二、函数参数定义函数时，可以在函数名后定义数量不等的形参，多个形参以，隔
AI 浪潮下的锚与帆：工程师文化的变与不变 | 架构师夜生活腾讯云开发者人工智能
目录：一、那些让程序员焦虑的"假消息"二、我们理解的工程师文化三、AI到底改变了什么四、程序员需要学什么新技能五、80后程序员vs00后程序员六、最好的时代永远在前方引言公司食堂里，一个产品经理和一个程序员正在讨论一个让行业都焦虑的话题："AI来了，你们程序员还有什么用？我直接对着机器说需求，它就能给我做出来，我还要你干嘛？你还要给我排期！"产品经理显得有些得意。"你对它说的话它听得懂吗？它生成的
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s

GPU-CUDA编程学习（四）-共享内存

Shared memory

Atomic operations

你可能感兴趣的:(GPU-CUDA编程学习（四）-共享内存)