有名企梦的小菜鸡

CSAPP的Lab学习——CacheLab

文章目录

前言
一、A部分：编写一个高速缓存模拟器
- 构造高速缓冲行结构
- 仿写主函数，使用getopt()函数
- 分配空间并释放
- 读取给的trace文件
- 模拟cache行为
二、B部分：优化矩阵转置
- 32 * 32矩阵转置
- 64 * 64矩阵转置
- 61 * 67矩阵转置
总结

前言

一个本硕双非的小菜鸡，备战24年秋招。刚刚看完CSAPP，真是一本神书啊！遂尝试将它的Lab实现，并记录期间心酸历程。
代码下载

官方网站：CSAPP官方网站

以下是官方文档翻译：
这个实验室将帮助您了解缓存存储器对C程序性能的影响。
这个实验室由两部分组成。在第一部分中，您将编写一个小的C程序（大约200-300行）来模拟缓存内存的行为。在第二部分中，您将优化一个小的矩阵变换函数，目的是最小化缓存丢失的数量。

您将修改两个文件： csim.c和trans.c若要编译这些文件，请键入：
linux> make clean
linux> make
警告：不要让Windows WinZip程序打开你的程序。tar文件（许多Web浏览器被设置为自动执行此操作）。相反，请将文件保存到Linux目录中，并使用Linux tar程序来提取文件。一般来说，对于这个类，您不应该使用除Linux以外的任何平台来修改您的文件。这样做可能会导致数据丢失（以及重要的工作！）。

这个实验室有两个部分。在第A部分中，您将实现一个高速缓存模拟器。在B部分中，您将编写一个针对缓存性能进行优化的矩阵转置函数。
虚拟内存跟踪具有以下形式：
I 0400d7d4,8
M 0421c7f0,4
L 04f6b868,8
S 7ff0005c8,8
每一行表示一次或两个内存访问。每一行的格式为
操作字段类型，操作地址，字节大小
操作字段表示内存访问的类型：“I”表示指令加载，“L”表示数据加载，“S”表示数据存储，“M”表示数据修改(i。e., 数据加载后是数据存储)。在每个“I”之前从来没有一个空格。在M、L和S前面总是有一个空格。地址字段指定一个64位的十六进制内存地址。size字段指定该操作所访问的字节数。
官方给了一个命令可以尝试一下：

linux> valgrind --log-fd=1 --tool=lackey -v --trace-mem=yes ls -l

会输出一些类似的

可以解释一下，按照文档中介绍的那样：字母代表着不同的操作，后面是待操作地址，再后面是操作的字节数。

一、A部分：编写一个高速缓存模拟器

在A部分中，您将在csim.c中编写一个缓存模拟器，它以valgrind内存跟踪作为输入，模拟缓存内存的命中/未命中行为，并输出命中、未命中和删除的总数。

我们为您提供了一个引用缓存模拟器的二进制可执行文件，称为csim-ref，它模拟了在valgrind跟踪文件上具有任意大小和关联性的缓存的行为。在选择要驱逐的缓存行时，它使用LRU（最近最少的）替换策略。
参考模拟器采用以下命令行参数：

Usage: ./csim-ref [-hv] -s <s> -E <E> -b <b> -t <tracefile>
•-h：可选的帮助标志，打印使用信息
-v：可选的详细标志显示跟踪信息
-s<s>：设置索引位的数量（S = 2^s是集合的数量）
-E<E>：关联性（每组行数）
-b<b>：块位数（B = 2^b块大小）
-t<跟踪文件>：回溯的参数valgrind的名称

你在A部分的工作是填写csim.c文件，以便它接受相同的命令行参数，并生成与参考模拟器相同的输出。请注意，这个文件几乎完全为空。
你需要从头开始写它。

编程规则

在csim.c的标题注释中包含您的名称和loginID。
你的csim.c文件必须编译没有警告，以获得信用。
您的模拟器必须对任意的s、E和b正确工作。这意味着您将需要使用malloc函数为模拟器的数据结构分配存储空间。请输入“manmalloc”以获取有关此函数的信息。
对于这个实验室，我们只对数据缓存性能感兴趣，所以您的模拟器应该忽略所有的指令缓存访问（以“I”开头的行）。回想一下，valgrind总是把“I”放在第一列（前面没有空格），把“M”、“L”和“S”放在第二列（前面没有空格）。这可能会帮助您解析跟踪。
要获得A部分的积分，您必须在主函数结尾调用函数打印摘要，包括命中、漏掉和驱逐的总数：printSummary(hit_count, miss_count, eviction_count);
对于这个实验室，您应该假设内存访问被正确对齐，这样单个内存访问就不会跨越块边界。通过进行此假设，您可以忽略参数valgrind跟踪中的请求大小。

自我分析：麻烦参考426页（中文版）高速缓存的写法.
高速缓存结果可以用元组（S，E，B，m）来描述，其中 S=2^ s为组数，E为每个组的行数，B=2^b为块大小（字节），m=log2(M)为(主存)物理地址位数。
我们为您提供了一个自动分级程序，称为测试-csim，它可以在引用跟踪上测试缓存模拟器的正确性。在运行测试之前，一定要编译你的模拟器：

linux> make
linux> ./test-csim

对于每个测试，它都显示您获得的点数、缓存参数、输入跟踪文件以及来自模拟器和参考模拟器的结果的比较。
以下是关于在A部分工作的一些提示和建议：

对小的跟踪进行初始调试，如traces/dave.trace。
参考模拟器采用一个可选的-v参数，支持详细输出，显示每次内存访问导致的命中、失败和删除。您不需要在csim.c代码中实现这个特性，但我们强烈建议您这样做。它将允许您直接在引用跟踪文件上比较模拟器和引用模拟器的行为，从而帮助您进行调试。
我们建议您使用getopt函数来解析命令行参数。您将需要以下标头文件：

#include 
#include 
#include

每个数据加载(L)或存储(S)操作最多可能导致一次缓存丢失。数据修改操作(M)被视为一个负载，然后是一个存储到相同地址的存储。因此，M操作可能导致两次缓存命中，或一次未命中和一次命中加上可能的驱逐。
如果您想使用15-122年的 C0-style的合同，您可以包括contracts.h，我们已经在讲义目录中提供以方便您。

因为此处要用到getopt函数，getopt函数可以用来分析命令行参数，形式为：
int getopt(int argc,char * const argv[ ],const char * optstring);
具体可详见这位大佬的详解：
Linux下getopt()函数的简单使用

题中提到了LRU算法，这是一种缓存淘汰策略，具体详见LRU算法之我见。

主要流程是：

构造高速缓冲行结构
仿写主函数，使用getopt()函数
分配空间并释放
读取给的trace文件
模拟cache行为

构造高速缓冲行结构

首先仿照上面那张图来构造一个高速缓冲行结构，为结构体，其中有三个参数：有效位、标记位和高速缓冲块，其中高速缓冲块是以LRU替换策略使用的。

typedef struct {
    int vaild;
    int tag;
    int time; //此处应该是高速缓冲块，但是该题没有要求存储，且要求加入LRU替换算法，所以包含一个time表示访问时间间隔
} CacheLine, *CacheSet, **Cache;

仿写主函数，使用getopt()函数

定义getopt()函数和输出所需要的参数，根据题目提示，只需要s、E、b和t就可以：

int s, E, b, t, S; //参考模拟器参数
int hit_count, miss_count, eviction_count; //命中、漏掉和驱逐

然后根据getopt()函数的参考仿写：

int main(int argc, char* argv[]) //由于使用了getopt函数，需要传入
{
    /*仿写getopt函数的使用*/
    int ch;

    /*getopt（）函数还有搜索值，不返回-1*/
    while ((ch = getopt(argc, argv, "s:E:b:t:")) != -1) {
        switch (ch) {
            case 's':
                s = atoi(optarg);
                S = (int)pow(2, s); //根据定义，S = 2^s
                break;
            case 'E':
                E = atoi(optarg);
                break;
            case 'b':
                b = atoi(optarg);
                break;
            case 't':
                t = atoi(optarg);
                strcpy(filePath, optarg);
                break;
            default:
                printf("ERROR!!!");
                break;
        }
    }

    mallocCache();
    readTraceFile();
    freeCache();

    printSummary(hit_count, miss_count, eviction_count);
    return 0;
}

分配空间并释放

其次根据题目中的要求（提示），我们需要使用malloc函数为模拟器的数据结构分配存储空间。也就是根据上一步中读取到的s, E, b使用malloc；函数来在堆上分配空间。
先定义：

Cache cache; //开辟空间

再写开辟缓存空间

/*动态分配缓存空间*/
void mallocCache() {
    if (s < 0) {
        printf("Not s!!!");
        exit(0);
    }

    cache = (Cache)malloc(S * sizeof(CacheSet));
    assert(cache);

    for (int i = 0; i < S; i++) {
        cache[i] = (CacheSet)malloc(E * sizeof(CacheLine));
        assert(cache[i]);
        memset(cache[i], 0, sizeof(CacheLine) * E); //初始化值，全置零
    }
}

最后是释放空间

/*释放空间*/
void freeCache() {
    for (int i = 0; i < S; ++i) {
        free(cache[i]);
    }
    free(cache);
}

读取给的trace文件

首先定义文件指针

char filePath[100]; //文件指针

再写读取文件的函数

/*读取给的trace文件*/
void readTraceFile() {
    FILE* file = fopen(filePath, "r");
    assert(file);

    /*检测文件是否存在*/
    if (file == NULL) {
        printf("NO File!!!");
        exit(0);
    }

    char type;//虚拟内存的类型
    uint64_t address;//虚拟内存访问地址
    int size; //虚拟操作访问的字节数

    /*只要还有值，就统统放入缓存中*/
    /*注意%c前面有个空格，因为只有I没有空格，但是I表示指令加载没啥用*/
    while (fscanf(file, " %c %lx,%d", &type, &address, &size) > 0) {
        /*按官方的解释，分为M、L、S分别讨论*/
        switch (type) {
            case 'M' :
                cacheOperation(address); //M是数据修改
            case 'L' : //L是数据加载，没啥用
            case 'S' :
                cacheOperation(address); //S是数据存储
                break;
        }
        lruUpdate();
    }
    fclose(file);
}

因为我们在其中使用了LRU算法，所以得更新下时间。

/*更新访问时间*/
void lruUpdate() {
    for (int i = 0; i < S; ++i) {
        for (int j = 0; j < E; ++j) {
            if (cache[i][j].vaild) {
                cache[i][j].time++;
            }
        }
    }
}

模拟cache行为

终于到了代码的最后部分，我们之前所写的代码都是为了这部分服务的，获取命中、漏掉和驱逐的值

代码：

/*模拟cache行为*/
void cacheOperation(uint64_t address) {

    uint64_t setIndex = ((1ULL << 63) - 1) >> (63 - s); //组索引位（这句我也解释的不好，就知道是跟计算机位数和最高位数有关）
    int tagIndex = address >> (b + s); //标记位（计算方法：物理地址address-(b+s)）

    CacheSet cacheSet = cache[(address >> b) & setIndex];

    for (int i = 0; i < E; ++i) {
        /*看看匹没匹配，有效位是否存在和标记位是否相同*/
        if (cacheSet[i].vaild && cacheSet[i].tag == tagIndex) {
            hit_count++; //命中
            cacheSet[i].time = 0;
            return;
        }
    }

    miss_count++; //否则就是没命中

    /*取出块，并把这个块存储到组中，并返回*/
    /*存在空位，写入*/
    for (int i = 0; i < E; ++i) {
        if (!cacheSet[i].vaild) {
            cacheSet[i].vaild = 1; //有效位设置为1
            cacheSet[i].tag = tagIndex;
            cacheSet[i].time = 0;
            return;
        }
    }

    /*没有空位，使用LRU算法进行替换*/
    eviction_count++;
    int evictIndex = 0;
    int maxTime = 0;

    for (int i = 0; i < E; ++i) {
        if (cacheSet[i].time > maxTime) {
            maxTime = cacheSet[i].time;
            evictIndex = i;
        }
    }
    cacheSet[evictIndex].tag = tagIndex;
    cacheSet[evictIndex].time = 0;
}

注意，这些函数应重新排列顺序，我的顺序是：mallocCache、freeCache、lruUpdate、cacheOperation、readTraceFile和最后的主函数main，不然会报下面的错误。

先执行make，再./test-csim，成功实现！

到这里我们的A部分才算告一段落。ps:我的代码第一次编译通过了但是执行的答案不对，回头一查发现少了个冒号，当误我一个小时（终端下断点还是不太熟。。。）

二、B部分：优化矩阵转置

在B部分中，您将在trans.c中编写一个转置函数，从而导致尽可能少的缓存丢失。
设A表示一个矩阵，Aij表示第i行和第j列的分量。A的转置，表示AT，是一个矩阵，Aij=Aji。
为了帮助你开始，我们给了你一个trans.c中的转置函数的例子，它计算N×M矩阵a的转置，并将结果存储在M×N矩阵B中：

char trans_desc[] = "Simple row-wise scan transpose";
void trans(int M, int N, int A[N][M], int B[M][N])

这个例子的转置函数是正确的，但效率低，因为访问模式导致相对较多的缓存丢失。
您在B部分中的工作是编写一个类似的函数，称为transpose_submit，这将最小化在不同大小的矩阵中的缓存丢失的数量：

char transpose_submit_desc[] = "Transpose submission";
void transpose_submit(int M, int N, int A[N][M], int B[M][N]);

不要更改您的transpose_submit的描述字符串（“Transpose submission”）。自动评分器搜索这个字符串，以确定使用哪个转置函数来评估信用。

编程规则

在trans.c的标题注释中包含您的名称和loginID。
你的trans.c代码必须编译时没有警告才能获得信用。
每个转置函数最多允许定义12个int类型的局部变量。
不允许您通过使用任何长类型的变量或使用任何位技巧来存储一个变量的多个值来偏离前面的规则。
您的转置函数可能不使用递归。
如果您选择使用辅助函数，那么在辅助函数和顶级转置函数之间的堆栈上一次可能没有超过12个局部变量。例如，如果你的转置声明了8个变量，然后你调用一个使用4个变量的函数，它调用另一个使用2的函数，那么堆栈上将有14个变量，你将违反规则。
您的转置函数可能不能修改数组 A. 但是，您可以对数组B的内容做任何您想做的事情.
不允许您在代码中定义任何数组或使用malloc的任何变体。

自我分析：判分中分为了三种情况3232，6464，61*67三个不同大小的输出矩阵上的正确性和性能.

我们为您提供了一个自动分级程序，称为test-trans。c，它可以测试您在自动分级器上注册的每个转置函数的正确性和性能。
您可以在trans.c文件中注册多达100个版本的转置函数。每个转置版本都有以下形式：

/* Header comment */
char trans_simple_desc[] = "A simple transpose";
void trans_simple(int M, int N, int A[N][M], int B[M][N])
{
/* your transpose code here */
}

通过调用该表单，向自动分级器注册一个特定的转置函数：

registerTransFunction(trans_simple, trans_simple_desc);

在registerFunctions中，功能程序在 trans.c。在运行时，自动评分器将评估每个已注册的转置函数并打印结果。当然，其中一个注册函数必须是transpose_submit函数：

registerTransFunction(transpose_submit, transpose_submit_desc);

请参见默认的trans.c函数，以了解它是如何工作的示例。
自动分级器以矩阵大小作为输入。它使用valgrind来生成每个注册的转置函数的跟踪。然后，它通过在具有参数（s = 5，E = 1，b = 5）的缓存上运行参考模拟器来计算每个跟踪。
例如，要在32×32矩阵上测试您注册的转置函数，重新构建测试-转换，然后使用M和N的适当值运行它：

linux> make
linux> ./test-trans -M 32 -N 32
Step 1: Evaluating registered transpose funcs for correctness:
func 0 (Transpose submission): correctness: 1
func 1 (Simple row-wise scan transpose): correctness: 1
func 2 (column-wise scan transpose): correctness: 1
func 3 (using a zig-zag access pattern): correctness: 1
Step 2: Generating memory traces for registered transpose funcs.
Step 3: Evaluating performance of registered transpose funcs (s=5, E=1, b=5)
func 0 (Transpose submission): hits:1766, misses:287, evictions:255
func 1 (Simple row-wise scan transpose): hits:870, misses:1183, evictions:1151
func 2 (column-wise scan transpose): hits:870, misses:1183, evictions:1151
func 3 (using a zig-zag access pattern): hits:1076, misses:977, evictions:945
Summary for official submission (func 0): correctness=1 misses=287

在这个例子中，我们在trans.c中注册了四种不同的转置函数。test-trans测试每个注册的功能，显示每个功能的结果，并提取结果以供正式提交。以下是一些关于在B部分工作的提示和建议。

test-trans程序在文件trace.fi中保存函数i的跟踪。这些跟踪文件是非常宝贵的调试工具，它可以帮助您准确地理解每个转置函数的命中和失败来自哪里。要调试一个特定的函数，只需通过详细的选项通过参考模拟器运行它的跟踪：

linux> ./csim-ref -v -s 5 -E 1 -b 5 -t trace.f0
S 68312c,1 miss
L 683140,8 miss
L 683124,4 hit
L 683120,4 hit
L 603124,4 miss eviction
S 6431a0,4 miss
...

由于转置函数是在直接映射的缓存上进行评估的，因此冲突丢失是一个潜在的问题。考虑代码中可能出现的冲突，特别是对角线。试着考虑能够减少这些冲突错过的访问模式。
阻塞是减少缓存丢失的一种有用技术。看我的理解

http://csapp.cs.cmu.edu/public/waside/waside-blocking.pdf

32 * 32矩阵转置

跟A部分一样，首先分析题目，提示给出了三点建议：自动分级器进行优化、对角线冲突问题和阻塞技术。
我们先来分析一下为什么会这么慢，首先看下初始转置操作函数的代码（也就是它起始代码）

void trans(int M, int N, int A[N][M], int B[M][N])
{
    int i, j, tmp;

    for (i = 0; i < N; i++) {
        for (j = 0; j < M; j++) {
            tmp = A[i][j];
            B[j][i] = tmp;
        }
    }
}

我们可以大致分析出来为什么会这么高：其原因就是数组A与数组B的访问方式正好相反，当先按行优先顺序访问，因为题中给出的参数是（s = 5，E = 1，b = 5），则S=2^s=32、E=1、B=2 ^b=32，又因为int为4字节，所以一个高速缓冲块最多存8个int型，一共有32组。
继续分析：理论上A运行的时候并不会发生较多的miss，但是当你执行第二句的时候为列遍历B的一个元素，前8次还好说不中就不中可以存，但是当你访问到第9列的时候，此时cache已经存储了8（列）*4（int型大小）*32（每一列的行元素），意味着已经存满了，然后你为了存第9列的元素，就只能发生cache冲突，映射到同一缓冲组中，将第1列的行元素顶掉，等你访问1行2列的元素时又要重新加载。。。循环浪费。

毛用没有。
我们可以采用刚才介绍的分块思想，将每一个小块设为8的倍数，然后将这8个元素都进行操作再替换，这样可以极大的节省。

根据提示还有一个问题：对角线
因为对角线其实是根本不动的，属于原地tp，但是仍然会引发冲突（因为重复），所以也要进行单独处理。
我们可以引入局部变量，因为局部变量存储在寄存器中，不涉及内存访问。
transpose_submit函数整体代码如下：

void transpose_submit(int M, int N, int A[N][M], int B[M][N])
{
    int a, b, c, d, e, f, g, h;
    for (int i = 0; i < N; i += 8) {
        for (int j = 0; j < M; j += 8) {
            for (int ii = i; ii < i + 8; ++ii) {
                a = A[ii][j];
                b = A[ii][j + 1];
                c = A[ii][j + 2];
                d = A[ii][j + 3];
                e = A[ii][j + 4];
                f = A[ii][j + 5];
                g = A[ii][j + 6];
                h = A[ii][j + 7];

                B[j][ii] = a;
                B[j + 1][ii] = b;
                B[j + 2][ii] = c;
                B[j + 3][ii] = d;
                B[j + 4][ii] = e;
                B[j + 5][ii] = f;
                B[j + 6][ii] = g;
                B[j + 7][ii] = h;
            }
        }
    }
}

终端输入

linux> make
linux> ./test-trans -M 32 -N 32

得出答案，misses287，小于300，成功!

在网上看到了一位大佬的继续优化，我们都知道是因为B矩阵在列优先访问才导致了这个最大的问题，且题目中虽然规定不可以修改A矩阵的二维数组，但可以修改B矩阵的。那么我们可以在使用局部变量的方法的同时对B也进行行优先访问，之后再在B内部转置。（我其实也想到了这个招，就是懒了）
贴下大佬的题解，大佬写的巨详细，我这里看不懂的地方可以参考大佬的解释
代码：

void transpose_submit(int M, int N, int A[N][M], int B[M][N])
{
    const int len = 8;
    int a, b, c, d, e, f, g, h, k, s;
    for (int i = 0; i < N; i += len) {
        for (int j = 0; j < N; j += len) {
            // copy
            for (k = i, s = j; k < i + len; k++, s++) {
                a = A[k][j];
                b = A[k][j + 1];
                c = A[k][j + 2];
                d = A[k][j + 3];
                e = A[k][j + 4];
                f = A[k][j + 5];
                g = A[k][j + 6];
                h = A[k][j + 7];
                B[s][i] = a;
                B[s][i + 1] = b;
                B[s][i + 2] = c;
                B[s][i + 3] = d;
                B[s][i + 4] = e;
                B[s][i + 5] = f;
                B[s][i + 6] = g;
                B[s][i + 7] = h;
            }
            // transpose
            for (k = 0; k < len; k++) {
                for (s = k + 1; s < len; s++) {
                    a = B[k + j][s + i];
                    B[k + j][s + i] = B[s + j][k + i];
                    B[s + j][k + i] = a;
                }
            }
        }
    }
}

优化后：

64 * 64矩阵转置

一样的想法，但是由于是现在为64 * 64，一行元素是64个，以至于现在i行与i+4行就会发生冲突。如果还使用8 * 8矩阵分块，就会在内部发生冲突。理论上可以使用4 * 4矩阵分块，即

int a, b, c, d;
for (int i = 0; i < N; i += 4) {
    for (int j = 0; j < M; j += 4) {
        for (int ii = i; ii < i + 4; ++ii) {
            a = A[ii][j];
            b = A[ii][j + 1];
            c = A[ii][j + 2];
            d = A[ii][j + 3];

            B[j][ii] = a;
            B[j + 1][ii] = b;
            B[j + 2][ii] = c;
            B[j + 3][ii] = d;
        }
    }
}

我们发现效果其实并不理想

分析可知，一个cache块一组能存8个int，这么搞只能存一半。
我们可以想到，可以先进行8 * 8分块，然后再在这里进行4 * 4分块
逻辑图解：
比如下图这个8 * 8矩阵

我们可以进行如下变换，首先进行上四行变换，即

然后再对A进行逐列的进行后4行前四列的转置，即：
重复这个操作，最后变成这个样子，即：

最后进行后面的处理，就不贴了直接转就行。
代码：

void transpose_submit(int M, int N, int A[N][M], int B[M][N])
{
    int a, b, c, d, e, f, g, h, i, j, k, l;
    for (i = 0; i < N; i += 8)
    {
        for (j = 0; j < M; j += 8) {
            for (k = i; k < i + 4; k++) {
                a = A[k][j];
                b = A[k][j + 1];
                c = A[k][j + 2];
                d = A[k][j + 3];
                e = A[k][j + 4];
                f = A[k][j + 5];
                g = A[k][j + 6];
                h = A[k][j + 7];

                B[j][k] = a;
                B[j + 1][k] = b;
                B[j + 2][k] = c;
                B[j + 3][k] = d;
                B[j][k + 4] = e;
                B[j + 1][k + 4] = f;
                B[j + 2][k + 4] = g;
                B[j + 3][k + 4] = h;
            }
            for (l = j; l < j + 4; l++) {
                a = A[i + 4][l];
                b = A[i + 5][l];
                c = A[i + 6][l];
                d = A[i + 7][l];
                e = B[l][i + 4];
                f = B[l][i + 5];
                g = B[l][i + 6];
                h = B[l][i + 7];

                B[l][i + 4] = a;
                B[l][i + 5] = b;
                B[l][i + 6] = c;
                B[l][i + 7] = d;
                B[l + 4][i] = e;
                B[l + 4][i + 1] = f;
                B[l + 4][i + 2] = g;
                B[l + 4][i + 3] = h;
            }
            for (k = i + 4; k < i + 8; k++) {
                a = A[k][j + 4];
                b = A[k][j + 5];
                c = A[k][j + 6];
                d = A[k][j + 7];
                B[j + 4][k] = a;
                B[j + 5][k] = b;
                B[j + 6][k] = c;
                B[j + 7][k] = d;
            }
        }
    }
}

得出答案，misses1179，小于1300，成功!

61 * 67矩阵转置

这题说难也难，说简单也是真的简单（因为可以试出来），比较玄学。。。
因为没办法对齐处理，基本只能靠猜和一个一个试。
最后发现17 * 17的时候数据最小，为1950。
此处引用一位博主的尝试过程，这位博主我也不知道是谁，但是菜鸡在此感谢这位大佬！
ps：你们是逃学威龙，是正义使者，是这帮实验室的终极克星，照亮了像我这样的萌新前进的道路！

代码：

void transpose_submit(int M, int N, int A[N][M], int B[M][N])
{
    int i, j, h, k;
    for (i = 0; i < N; i += 17)
    {
        for (j = 0; j < M; j += 17)
        {
            for (h = i; h < i + 17 && h < N; h++)
            {
                for (k = j; k < M && k < j + 17; k++)
                {
                    B[k][h] = A[h][k];
                }
            }
        }
    }
}

得出答案，misses1950，小于2000，成功!

总结

这个Lab真的做的爽！（虽然被虐的过程很惨）。让我对cache的过程更加清楚与明白，之前看书的时候还不屑一顾就这，一看就懂，结果一做就废，翻来覆去的去扣每一个知识点的定义。B部分的优化更加具体且贴近实际情况，有的时候可能只是小小的改变就能让整个代码运行的的更加流畅。真的是很爽的一个Lab。

你可能感兴趣的:(csapp的Lab学习,学习,程序人生,linux,c++)

Python 快速入门教程：构建一个 A2A Agent @井九 python 开发语言
欢迎来到Agent2Agent(A2A)Python快速入门教程！在本教程中，您将使用PythonSDK探索一个简单的“回声”A2A服务器。这将向您介绍A2A服务器的基本概念和组件。然后，您将看到一个集成了大型语言模型(LLM)的更高级示例。本实践指南将帮助您理解：A2A协议背后的基本概念。如何使用SDK为A2A开发设置Python环境。AgentSkills(智能体技能)和AgentCards(
C++主流编辑器特点比较 FrostedLotus·霜莲 c++编辑器开发语言
在C++开发中，选择一款合适的编辑器或集成开发环境(IDE)至关重要。本文将介绍几款常见的C++编辑器/IDE的特点，帮助开发者根据自身需求做出选择。1.Dev-C++Dev-C++是一款经典的轻量级C/C++IDE，特别适合初学者和教育用途。**主要特点：**-**轻量简洁**：安装包小(约50MB)，启动快速，系统资源占用低-**集成开发环境**：内置编辑器、编译器、调试器，无需复杂配置-**
Android Profiler 深度解析及其在性能分析中的应用
一、AndroidProfiler概述AndroidProfiler是AndroidStudio内置的一套性能分析工具，取代了早期的AndroidMonitor工具。它提供了实时应用性能数据可视化，帮助开发者识别和解决性能瓶颈。核心组件模块：CPUProfiler-分析应用CPU使用和线程活动MemoryProfiler-监控内存分配和泄漏NetworkProfiler-跟踪网络请求活动Energ
windows电脑下C盘用户文件夹下放置的都是些什么文件？
在Windows电脑的C盘的用户文件夹（通常是C:\Users\）中，存放的是每个用户的个人数据、配置文件以及系统相关的用户设置。以下是这个文件夹中常见的一些文件和子文件夹：Desktop：这里存放的是用户桌面上的文件和快捷方式。Documents：这个文件夹包含了用户保存的文档，如文本文件、Word文件、Excel文件等。Downloads：默认情况下，浏览器下载的文件会保存在这里。Favori
Kotlin空安全与异常处理 Devil枫安卓 kotlin 安全微信
一、Kotlin空安全机制：从根源消除NullPointerExceptionKotlin的设计哲学认为，空引用（NullPointerException）是编程中最大的"亿万美元错误"，因此通过类型系统从根本上解决了这个问题。这种设计不是简单的语法糖，而是深入语言核心的特性。1.1类型系统的革命性设计Kotlin将类型系统明确分为两类：非空类型（如String）：编译期保证永远不会为null可空
Kotlin协程与异步编程
协程通过轻量级线程模型和挂起机制，彻底改变了Android开发和服务器端编程的异步处理方式。今天我们将聚焦于Kotlin协程这一现代异步编程的核心工具。下面直接开始一、协程基础架构解析1.1协程的轻量级特性协程并非传统线程，而是通过状态机实现的协作式任务调度单元。单个线程可承载数千个协程，其内存占用仅为线程的1/100。例如：funmain()=runBlocking{repeat(10_000)
Android Profiler 卡顿分析教程及案例 summerkissyou1987 android
以下是AndroidProfiler卡顿分析的完整教程及实战案例，结合最新工具操作流程与优化策略：一、卡顿分析操作教程1.环境配置开启GPU调试：设备设置→开发者选项→启用GPU渲染分析和GPUProfiler（需Android5.0+真机）。启动Profiler：AndroidStudio→View→ToolWindows→Profiler→选择目标设备与进程2.核心指标监控指标作用查看位置主线
android 卡顿和丢帧区别 summerkissyou1987 android
以下是Android卡顿（Jank）与丢帧（FrameDrop）的核心区别详解，结合技术原理与用户感知进行对比：一、本质差异维度卡顿（Jank）丢帧（FrameDrop）定义界面长时间无响应（如点击延迟>200ms）动画/滚动不连贯（如帧率从60fps突降至40fps）触发根源主线程阻塞（耗时计算、I/O、锁竞争）GPU渲染超时或错过垂直同步（VSync）信号关键指标单帧渲染时间>16.6ms（6
Android Profiler 丢帧分析教程及案例 summerkissyou1987 android
以下为基于最新实践的‌AndroidProfiler丢帧分析全流程指南及实战案例‌，结合权威技术文档与优化经验（2025年更新）：一、Profiler丢帧分析核心流程环境配置与数据抓取‌bashCopyCode启用GPU渲染分析（开发者选项）adbshellsettingsputglobalgpu_debug_layers1adbshellsettingsputglobalgpu_debug_ap
android-性能分析
以下是Android性能分析的完整指南，涵盖核心工具、优化方向及实操方法，适用于2025年开发环境：⚙️一、性能分析工具分类1.官方工具链工具用途关键能力版本适配AndroidProfiler实时监测CPU/内存/网络/能耗火焰图分析、内存泄漏检测（支持Activity/Fragment自动检测）AndroidStudio3.6+Perfetto系统级追踪（替代Systrace）线程调度、GPU渲
android 各版本特性详情 summerkissyou1987 android
以下是Android主要版本的核心特性与关键技术变更详解，按版本演进顺序整合最新信息（截至2025年）：架构与性能演进Android5.0(Lollipop)ART虚拟机：取代Dalvik，预编译优化显著提升应用启动速度，支持64位处理器架构。MaterialDesign：统一视觉语言，引入RecyclerView、CardView等组件。Android8.0(Oreo)后台限制：禁止隐式广播，强
ReentrantLock-signal()唤醒失败原因 summerkissyou1987 java
以下是Java中signal()唤醒失败的常见原因及解决方案分析：一、核心原因锁未正确持有调用signal()的线程必须持有与Condition关联的锁，否则抛出IllegalMonitorStateException错误示例：未调用lock()直接执行condition.signal()等待线程未进入等待状态目标线程未执行await()时调用signal()会导致信号丢失时序问题：signal(
网络故障排查：BGP故障排查小小小糖果人网络小知识网络
1、为确保BGP路由争取加入到全局路由表中，首先需要确保BGP路由有效，其次要确保能够在和通过其他路由协议学到的路由比较中优选。2、查看BGP邻居状态2.1如果没有BGP路由表中，未能查询到相匹配的路由信息，需要查看BGP邻居状态是否正常#查看对等体的信息。displaybgppeerStatuscodes:*-DynamicBGPLocalrouterID:10.2.3.4localASnumb
网络故障排查：Ping和Tracert命令小小小糖果人网络小知识网络
1、Ping和Tracert的用途1.1Ping和Tracert命令检查网络连接是否可达以及分析网络发生故障的位置。其中，Ping用于检查网络连接及主机是否可达；Tracert命令用于测试数据报文从发送主机到目的地所经过的网关。2、Ping命令简介2.1Ping命令主要用于检查网络连接及主机是否可达。Ping功能是基于ICMP协议来实现的：源端向目的端发送ICMP请求（ECHO-REQUEST）报
vue入门学习时，按照官方的教程生成的vue3项目后，命令行运行npm install出现一堆warn，然后运行npm run dev报错，项目启动失败 67号人生 vue小白学习 vue.js 学习 npm crypto.hash vue官方示例项目失败
日期：2025年6月27日星期五农历六月初三VUE版本：vue3IDE：vscodevue入门学习时，按照官方的教程生成的vue3项目后，命令行运行npminstall出现一堆warn，然后运行npmrundev报错，项目启动失败运行npminstall出现一堆warn运行npmrundev报错解决办法通过nvm安装较高版本的nodejs，或者手动冲nodejs官网下载。虽然vue官方推荐node
活体检测api集成方案-炫彩活体检测助力身份核验 wt_cs 发票识别科技 ocr 报关单识别接口数据库
现如今，随着人脸伪造技术的不断升级，传统身份核验方式面临严峻挑战，视频中的虚假人脸攻击防不胜防，用户隐私泄露、资金损失等风险如影随形。如何在便捷服务与安全防护之间找到平衡？视频活体检测接口给出了答案。视频活体检测接口，就像一位火眼金睛的安全卫士，能够对上传的视频进行精准检测，瞬间判断视频中的人物是否为真人。它有效抵御了视频中伪造的人脸攻击，一旦检测为真人，便会立即返回一张清晰的人脸照片，为下一步的
【CVPR2025】计算机视觉|Salience DETR：显著性目标检测，精度暴涨！
论文地址：http://arxiv.org/pdf/2403.16131v1代码地址：https://github.com/xiuqhou/Salience-DETR关注UPCV缝合怪，分享最计算机视觉新即插即用模块，并提供配套的论文资料与代码。https://space.bilibili.com/473764881摘要本研究旨在解决类DETR方法中存在的计算负担重和对稳定查询选择依赖性高的问题。
人脸识别接口&sdk，两张人脸相似度比对
人工智能时代，人脸识别技术正在被广泛应用于金融支付、安防监控、身份验证等多个领域，基于深度学习算法于海量样本训练，人脸识别接口以高精度、低延迟的特性出现在大众视野，成为开发者和企业用户集成人脸识别功能的首要选择之一。人脸识别接口技术服务原理：格式转换：支持BMP、JPG、PNG、TIF等多种常见图像格式；尺寸调整与压缩：建议图像大小控制在200KB左右，确保传输效率与识别质量；图像增强：自动旋转、
RT-DETR改进|爆改模型|涨点|使用VMamba作为骨干网络（附代码+修改教程）爆改模型网络深度学习人工智能计算机视觉
一、文本介绍本文修改的模型是RT-DETR，在原本的RT-DETR中，使用ResNet作为骨干网络，本文使用最新的VMamba（VisualStateSpaceModel）替换ResNet作为RT-DETR的骨干网络。VMamba是一种全新的视觉框架，VMamba结合了CNNs和ViTs的优势，同时优化了计算效率，能够在保持全局感受野的情况下实现线性复杂度。为了解决方向敏感性问题，VMamba引入
家用充电桩远程监控安全管理系统解决方案蓝蜂物联网物联网远程监控边缘计算物联网
家用充电桩远程监控安全管理系统解决方案在当今电动汽车日益普及的背景下，家用充电桩的安全管理成为了广大车主关注的重点问题。为了实现对充电桩的高效、精准、远程监控，一套完善的家用充电桩远程监控安全管理系统解决方案应运而生。本方案旨在通过先进的物联网技术、云计算、大数据分析以及人工智能等科技手段，构建一个集实时监测、异常预警、故障诊断、数据统计、远程控制于一体的智能化平台，确保充电桩的安全运行及用户充电
多模态AI Agent技术栈解析：视觉-语言-决策融合的算法原理与实践
多模态AIAgent技术栈解析：视觉-语言-决策融合的算法原理与实践嗨，我是IRpickstars！总有一行代码，能点亮万千星辰。在技术的宇宙中，我愿做永不停歇的探索者。✨用代码丈量世界，用算法解码未来。我是摘星人，也是造梦者。每一次编译都是新的征程，每一个bug都是未解的谜题。让我们携手，在0和1的星河中，书写属于开发者的浪漫诗篇。目录编辑多模态AIAgent技术栈解析：视觉-语言-决策融合的算
Android Studio在移动开发中的性能优化案例分析移动开发前沿 android studio 性能优化 android ai
AndroidStudio在移动开发中的性能优化案例分析关键词：AndroidStudio、移动开发、性能优化、内存管理、CPU优化、APK大小优化、工具链摘要：本文深入解析AndroidStudio在移动开发中的核心性能优化能力，通过内存管理、CPU调度、APK体积优化等典型场景的实战案例，系统讲解Profiler、Lint、Gradle等工具链的深度应用。结合具体代码示例和数学模型，分析内存泄
【合集】Qt Widgets Designer 手册（中译版） LSssT. Qt Widgets Designer 手册【中译版】qt 开发语言
官网链接：https://doc.qt.io/qt-6/qtdesigner-manual.htmlQtWidgetsDesigner手册QtWidgetsDesigner是使用QtWidgets设计和构建图形用户界面（GUI）的Qt工具。有关使用QtQuick的用户界面设计，请参阅QtDesignStudio。您可以采用所见即所得（W-Y-S-I-W-Y-G,whatyouseeiswhatyo
Android Profiler 功耗分析教程及案例 summerkissyou1987 android
以下是基于最新AndroidStudio工具链的EnergyProfiler功耗分析完整指南及实战案例，结合行业最佳实践和深度优化策略：⚙️一、环境配置与核心功能启用EnergyProfilerAndroidStudio→Profiler图标→连接设备（Android8.0+）→选择目标进程→点击Energy模块关键要求：测试设备需支持batteryhistorian数据采集（推荐Android1
Kotlin 函数与 Lambda 表达式 Devil枫安卓 kotlin 开发语言 android
今天继续分享Kotlin学习内容。目标：掌握函数定义、调用、参数传递，以及Lambda表达式的基础用法1.函数：Kotlin的代码模块化工具定义：函数是可重复调用的代码块，用于封装逻辑。语法：fun函数名(参数列表):返回类型{//函数体return结果//可省略（若表达式函数或返回类型可推断）}示例1：基础函数fungreet(name:String):String{return"Hello,$
为什么 Python 是 AI 的首选语言？
文章目录一、简洁优雅，易于上手二、丰富的库和框架1.数据处理与分析2.数据可视化3.机器学习与深度学习框架三、强大的社区支持四、跨平台性和可移植性五、与其他语言的互操作性文章配套代码已上传，点击查看：https://download.csdn.net/download/2501_92578370/91180848在人工智能（AI）技术飞速发展的今天，编程语言的选择对AI开发者来说至关重要。当你翻开
Unity学习（C#）——字符串的方法 concamy c#
例1：创建字符串，求字符串长度，判断字符串是否为，取字符串中的字母，字符串相加。namespace_622字符串string{classProgram{staticvoidMain(string[]args){strings="sfdkgnd";
TypeScript基本类型
一、前言TypeScript是JavaScript的一个超集，它通过添加静态类型系统帮助开发者写出更健壮、可维护性更强的代码。而理解TypeScript的基本类型是学习TypeScript的第一步。本文将带你全面了解TypeScript中的常用基本类型，包括：✅数值类型✅字符串类型✅布尔类型✅null与undefined✅any与unknown✅never与void✅数组类型✅元组类型并通过大量代
TypeScript编译选项
一、前言在开发TypeScript项目时，一个非常关键的文件就是tsconfig.json。它不仅定义了项目的根目录、模块解析方式，还控制着TypeScript编译器的行为。本文将带你全面了解：✅tsconfig.json的作用✅常用编译选项（compilerOptions）详解✅不同环境下的配置建议（开发/生产）✅配置继承与共享设置✅实际开发中的常见问题与解决方法并通过完整的代码示例帮助你掌握如
【C语言小游戏】贪吃蛇鱼弦游戏开发 c语言数学建模开发语言
鱼弦：CSDN内容合伙人、CSDN新星导师、51CTO(Top红人+专家博主)、github开源爱好者（go-zero源码二次开发、游戏后端架构https://github.com/Peakchen）贪吃蛇是一个经典的小游戏，以下是贪吃蛇的原理详细解释、使用场景解释，以及一些相关的文献材料链接和当前使用贪吃蛇的产品。原理详细解释：贪吃蛇游戏的原理是在一个有边界的游戏界面上控制一条蛇移动，蛇会不断吃
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23