qq_42241839

CSAPP(CMU 15-213)：Lab4 Cachelab详解

# 前言

本系列文章意在记录答主学习CSAPP Lab的过程，也旨在可以帮助后人一二，欢迎大家指正！

tips:本lab主要是为了深入理解cache的机制！！完成了模拟cache行为的实现以及应用！！

Part A: Writing a Cache Simulator

实现一个有关cache行为的模拟器，一开始不知从何做起，还是要注意看文档啊，CMU15-213是有recition的，里面有一些提示！

准备工作

以下内容来自rec07.pdf

A cache simulator is NOT a cache!

Memory contents NOT stored
Block offffsets are NOT used – the b bits in your address don’t matter. //本cache中不涉及数据处理
Simply count hits, misses, and evictions.

A cache is just 2D array of cache lines: cache_line cache[S] [E]

Each cache_line has:

valid bit
tag
LRU counter (only if you are not using a queue)

代码分析

命令行输入解析

//命令行输入解析：   利用getopt()        man 3 getopt
// ./csim -s 4 -E 1 -b 4 -t traces/yi.trace -v
int opt;
FILE* pFile = NULL;
int wrong_arg = 0;  //输入错误参数
while ((opt = getopt(argc, argv, "hvs:E:b:t:")) != -1) {
    switch(opt) {
        case 'h':
            wrong_arg = 1;
            break;
        case 'v':
            printTraceInfo = 1;
            break;
        case 's':
            s = atoi(optarg);
            break;
        case 'E':
            E = atoi(optarg);
            break;
        case 'b':
            b = atoi(optarg);
            break;
        case 't':
            pFile = fopen(optarg, "r");
            break;
        default:
            usage();
            break;
    }
}
if (s <= 0 || E <= 0 || b <= 0 || wrong_arg == 1 || pFile == NULL) {
    usage();
    return 0;
}

构建cache

//构建cache   使用calloc动态分配cache
typedef struct cache_line {
	int validBit;  //valid bit
	int tag;       //tag bit
	int lru;       //LRU counter
}cache;

cache** initCache() {               
	int S = (int)pow(2, s);    //set num
	cache** myCache = (cache**)calloc(S, sizeof(cache*));
	for (int i = 0; i < S; i++) {
		myCache[i] = (cache*)calloc(E, sizeof(cache));
	}
	return myCache;

}
void freeCache() {   //free cache memory
	int S = (int)pow(2, s);
	for (int i = 0; i < S; i++) {
		free(myCache[i]);
	}
	free(myCache);
}

读入输入文件

因为做cache模拟器不设计对cache存储数据的实际处理，故对于load和store，cache的行为一致，对于modify来说，则分别由一次Load与一次Store组合完成。

//读入数据并cache行为
void readTraceFile(FILE* pFile) {
	char identifier;     //the type of memory access
	long unsigned address;    //address of memory access
	int size;            //the number of bytes accessed by the operation
    
	while (fscanf(pFile, " %c %lx,%d", &identifier, &address, &size) != EOF) {
		if (printTraceInfo) printf("%c %lx,%d", identifier, address, size);
		switch(identifier) {
			case 'M':
				cacheOperation(address);
			case 'L':   //no data-operation, so load is idential with store
			case 'S':   
				cacheOperation(address);
				break;
		}
		if (printTraceInfo) printf("\n");
	}
	fclose(pFile);
}

模拟cache行为

void cacheOperation(long unsigned address) { 
	int setIndex = (address>>b)%((int)pow(2, s));   // * and / can use << >> , 
	int addressOfTag = address>>(s+b);
	for (int i = 0; i < E; i++) {
		if (myCache[setIndex][i].tag == addressOfTag && myCache[setIndex][i].validBit == 1) { //cache hit
			hits++;
			myCache[setIndex][i].lru = time++;
			if (printTraceInfo) printf(" hit");
			return;
		}
	}
	// cache miss
	misses++;
	if (printTraceInfo) printf(" miss");
	for (int i = 0; i < E; i++) {
		if (myCache[setIndex][i].validBit == 0) {  //no eviction
			myCache[setIndex][i].validBit = 1;
			myCache[setIndex][i].tag = addressOfTag;
			myCache[setIndex][i].lru = time++;
			return;
		}
	}
	// cache miss && eviction
	evictions++;
	if (printTraceInfo) printf(" eviction");
	int min_time = INT_MAX, min_index;
	for (int i = 0; i < E; i++) {
		if (myCache[setIndex][i].lru < min_time) {
			min_time = myCache[setIndex][i].lru;
			min_index = i;
		}
	}
	myCache[setIndex][min_index].validBit = 1;
	myCache[setIndex][min_index].tag = addressOfTag;
	myCache[setIndex][min_index].lru = time++;	
}

帮助信息函数usage()

void usage() {
	printf("Usage: ./csim-ref [-hv] -s  -E  -b  -t \n");
	printf("Options:\n");
	printf("  -h         Print this help message.\n");
	printf("  -v         Optional verbose flag.\n");
	printf("  -s    Number of set index bits.\n");
	printf("  -E    Number of lines per set.\n");
	printf("  -b    Number of block offset bits.\n");
	printf("  -t   Trace file.\n\n");
	printf("Examples:\n");
	printf("  linux>  ./csim-ref -s 4 -E 1 -b 4 -t traces/yi.trace\n");
	printf("  linux>  ./csim-ref -v -s 8 -E 2 -b 4 -t traces/yi.trace\n");
}

Part A 测试结果

Part A: Testing cache simulator
Running ./test-csim
                        Your simulator     Reference simulator
Points (s,E,b)    Hits  Misses  Evicts    Hits  Misses  Evicts
     3 (1,1,1)       9       8       6       9       8       6  traces/yi2.trace
     3 (4,2,4)       4       5       2       4       5       2  traces/yi.trace
     3 (2,1,4)       2       3       1       2       3       1  traces/dave.trace
     3 (2,1,3)     167      71      67     167      71      67  traces/trans.trace
     3 (2,2,3)     201      37      29     201      37      29  traces/trans.trace
     3 (2,4,3)     212      26      10     212      26      10  traces/trans.trace
     3 (5,1,5)     231       7       0     231       7       0  traces/trans.trace
     6 (5,1,5)  265189   21775   21743  265189   21775   21743  traces/long.trace
    27

途遇BUG (数据格式错误-边界条件)

最一开始遇到因为碰到7ff000390 用的是unsigned int型接收，这样会将数据截断为ff000390，而我在函数传参的过程中变成了int型，如下图代码所示，导致在cacheOperation函数中的address被解释为负数，继而在后续的处理过程发生内存越界。

void cacheOperation(int address) {}
void readTraceFile(char* tracefile) {
    unsigned address;
	while (fscanf(pFile, " %c %x,%d", &identifier, &address, &size) != EOF) {}
}

将有关参数address的类型全部改为unsigned后，因为int为4B，所以还是存在数据被阶段现象，造成tag不完整，但因为测试案例较为保守，所以还是通过了全部测试。

继而正确代码参数address应为unsigned long型,即 scanf()的输入格式中也改为%lx

void cacheOperation(unsigned long address) {}
void readTraceFile(char* tracefile) {
    unsigned long address;
	while (fscanf(pFile, " %c %lx,%d", &identifier, &address, &size) != EOF) {}
}

Part B: Optimizing Matrix Transpose

目的： 充分利用Cache的能力，尽量不访存

主要利用blocking技术提高矩阵的时间局部性/空间局部性，尽可能让载入cache的数据块得到利用，1. 此块数据载入被替换后不再使用，即不再二次载入 2. 将此块的数据存入寄存器，以避免此块因为冲突替换后二次载入（即，局部变量，注意局部变量数目不能太多，否则会被存入栈中，又回到了内存中）

Tips:

为了trace文件能够更加纯粹地指示数组的存取，要求局部变量不可超过12个，减少关于栈的引用。
题目采用直接映射（E=1），要重点考虑冲突的情况，尤其是对角线上的情况。（因为数组A的起始地址为0x30a080, 数组B的起始地址为0x34a080,其两个数组在对角线上的元素会被映射到同一块。）

题目要求：(s = 5, E = 1, b = 5)

拥有 $S = 2^s = s^5 = 32$ 个高速缓存组，每组只包含一个（E = 1）高速缓存行（cache line）。每个行由一个 $B = 2^b = 2^5 = 32B$ 的数据块（block）组成，所以总共有1KB的直接映射高速缓存(direct mapped cache)。
int型数据占4个字节，一个cache行可以存储8B。

1. M = 32, N = 32

对于题目所给的trans()函数来说，misses数高的原因在于，对于数组A是以行来访问，而对于数组B是以列为访问，又由cahce的存储量可知，一整个cache可以存储的数组的前8行所有元素(8行填满一个cahce)，而在访问数组B第九行的第1个元素之后，又会将之前存储的八行cache全部冲突替换掉，导致没有充分利用cache数据(只用到每个块的1个元素)，只能重新加载之前的cache，造成大量的misses。

故我们为了提高cache的利用率，即，在cache载入后，将cache包含的元素全部操作后再替换cache，保证不会二次载入相同的cache，即设置子块大小为 $8\times8$ 。

//按分块8*8处理
int bi, bj, i, j, tmp;
for (bi = 0; bi < M; bi += 8) {
    for (bj = 0; bj < N; bj += 8) {
        for (i = bi; i < bi + 8; i++) {
            for (j = bj; j < bj + 8; j++) {
                tmp = A[i][j];
                B[j][i] = tmp;
            }
        }
    }
}

运行结果会发现会有343次的misses，而我们理论上的研究则为 $16块 \times 8次 \times 2 = 256次$ ，显然有很大的差距，而且满分的操作为misses < 300。再次分析trace文件就会发现数组A(0x30a080)和B(0x34a080)的起始地址所映射的cache块相同，即在数组A和B的对角块上的元素会发生冲突不命中，而且在对角块上时数组B的缓存会将刚才缓存的数组A丢弃掉，故我们只需将A中缓存的值用变量保存起来，就可以减少misses数。

（上图转自网络，出处见水印。显然可以看出对角块上数组A和B的缓存会存在冲突。）

可以利用trace文件查看cache块信息(对角块与蓝块)。

//针对第一个蓝块的cache数据（数组A和B的cache不会相互冲突丢掉）
//左列 蓝块第一行 B的8个cache块都miss,即首次填充好    
//右列 蓝块第二行 所有的B数据都命中，因为第一次已填充好
L 30a0a0,4 miss eviction    L 30a120,4 miss
S 34a480,4 miss eviction    S 34a484,4 hit
L 30a0a4,4 hit              L 30a124,4 hit
S 34a500,4 miss eviction    S 34a504,4 hit
L 30a0a8,4 hit              L 30a128,4 hit
S 34a580,4 miss eviction    S 34a584,4 hit
L 30a0ac,4 hit              L 30a12c,4 hit
S 34a600,4 miss eviction    S 34a604,4 hit
L 30a0b0,4 hit              L 30a130,4 hit
S 34a680,4 miss eviction    S 34a684,4 hit
L 30a0b4,4 hit              L 30a134,4 hit
S 34a700,4 miss eviction    S 34a704,4 hit
L 30a0b8,4 hit              L 30a138,4 hit
S 34a780,4 miss eviction    S 34a784,4 hit
L 30a0bc,4 hit              L 30a13c,4 hit
S 34a800,4 miss eviction    S 34a804,4 hit

//   ./csim-ref -v -s 5 -E 1 -b 5 -t trace.f0 > trace_details.f0

//针对第一个对角块的cache数据（读取A的第一行）（数组A和B的cache会相互冲突丢掉）
L  30a080,4  miss  eviction   //第一次未命中，存放数组A的前8个元素，Load A[第一行][0]
S  34a080,4  miss  eviction   //B数组的cache映射地址与刚刚所属数组A的cache冲突，故替换
L  30a084,4  miss  eviction   //load A[1],因被替换，故只能重新二次载入相同的cache块
S  34a100,4  miss  
L  30a088,4  hit  
S  34a180,4  miss  
L  30a08c,4  hit  
S  34a200,4  miss  
L  30a090,4  hit  
S  34a280,4  miss  
L  30a094,4  hit  
S  34a300,4  miss  
L  30a098,4  hit  
S  34a380,4  miss  
L  30a09c,4  hit  
S  34a400,4  miss  
//经过这次操作后，cache第一行为A的，第二行-第八行都为B的
//读取A的第二行
L  30a100,4  miss  eviction  //替换cache第二行为A的
S  34a084,4  miss  eviction  //替换cache第一行为B的
L  30a104,4  hit  
S  34a104,4  miss  eviction  //替换cache第二行为B的
L  30a108,4  miss  eviction  //替换cache第二行为A的
S  34a184,4  hit  
L  30a10c,4  hit  
S  34a204,4  hit  
L  30a110,4  hit  
S  34a284,4  hit  
L  30a114,4  hit  
S  34a304,4  hit  
L  30a118,4  hit  
S  34a384,4  hit  
L  30a11c,4  hit  
S  34a404,4  hit

故改进代码如下：

int bj, bi, i;
int a, b, c, d, e, f, g, h;  //8 local variables
for (bi = 0; bi < M; bi += 8) {
    for (bj = 0; bj < N; bj += 8) {
        for (i = bi; i < bi + 8; i++) {
            a = A[i][0+bj]; b = A[i][1+bj]; c = A[i][2+bj]; d = A[i][3+bj];
            e = A[i][4+bj]; f = A[i][5+bj]; g = A[i][6+bj]; h = A[i][7+bj]; //除第一个A,其他都是利用cache命中存入
            B[0+bj][i] = a; B[1+bj][i] = b; B[2+bj][i] = c; B[3+bj][i] = d;
            B[4+bj][i] = e; B[5+bj][i] = f; B[6+bj][i] = g; B[7+bj][i] = h;
        }
    }
}

//对角块情况
//左列为第一行情况  右列为第二行情况   可以未改进代码的对角块情况进行对比，此次无二次载入相同的cache块，因为已经将需要的原数据放入了局部变量（寄存器）中
L  30b080,4  miss  eviction  L  30b100,4  miss  eviction
L  30b084,4  hit             L  30b104,4  hit  
L  30b088,4  hit             L  30b108,4  hit  
L  30b08c,4  hit             L  30b10c,4  hit  
L  30b090,4  hit             L  30b110,4  hit  
L  30b094,4  hit             L  30b114,4  hit  
L  30b098,4  hit             L  30b118,4  hit  
L  30b09c,4  hit             L  30b11c,4  hit  
S  34b080,4  miss  eviction  S  34b084,4  hit  
S  34b100,4  miss            S  34b104,4  miss  eviction
S  34b180,4  miss            S  34b184,4  hit  
S  34b200,4  miss            S  34b204,4  hit  
S  34b280,4  miss            S  34b284,4  hit  
S  34b300,4  miss            S  34b304,4  hit  
S  34b380,4  miss            S  34b384,4  hit  
S  34b400,4  miss            S  34b404,4  hit

此时misses数已降为287，符合满分标准（misses < 300）。

2. M = 64, N = 64

如果我们采用刚才同样的分析，可以得到子块为 $8\times4$ ，可以保证数组B每四个cache块( $4\times8$ )，不会发生二次载入的情况。而对于数组A来说，四个cahce块为( $8\times4$ )，这样的配置会导致每一个A的cache块只有四个int数据会被利用到，而其余四个数据需要下次载入才可利用，这样的代码如下：

//8*4
int bj, bi, i;
int a, b, c, d;
for (bj = 0; bj < 64; bj += 4) {
    for (bi = 0; bi < 64; bi += 8) {
        for (i = bi; i < bi + 8; i++) {
            a = A[i][0+bj]; b = A[i][1+bj]; c = A[i][2+bj]; d = A[i][3+bj];
            B[0+bj][i] = a; B[1+bj][i] = b; B[2+bj][i] = c; B[3+bj][i] = d;
        }
    }
}

misses数为1651，很显然不符合满分要求。（misses < 1300）

所以为了能够充分利用cache块，我们只能在 $8\times8$ 的框架下具体分析操作。（将 $8\times8$ 分为4个 $4\times4$ ）

思路：为了能够将前文浪费的四个int数据有效利用起来，因为局部变量数目的限制，所以可以考虑将多的数据暂时放入数组B的cache中，以待后续的操作，这样就可以避免二次载入相同的cache块。

tips:此处思路以及下面所用的图片参考引用了深入理解计算机系统-cachelab才得以做下去，感谢作者大大！

1. 观察以下两个对应的 $8\times8$ 区域。我们要将区域一的元素转置到区域二。

2.将区域一的黄色区域元素转置至对应位置，将区域一的蓝色区域暂时转置存放在区域二的蓝色区域(即数组B此时cache块的右半部分)

3.而后逐行进行后四行前四列的转置，如下图所示。

4.最后再进行后四行四列的转置。

至此这个 $8\times8$ 的区域全部转置完成，理论上每一块中不命中一次，即 $8块/行\times64行\times2 = 1024次$ 。

代码如下：

int bi, bj, i, j;
int a, b, c, d, e, f, g, h;  //8 local variables
for (bi = 0; bi < N; bi += 8) {
    for (bj = 0; bj < M; bj += 8) {
        for (i = bi; i < bi + 4; i++) {
            a = A[i][0+bj]; b = A[i][1+bj]; c = A[i][2+bj]; d = A[i][3+bj];  //store a a a a
            e = A[i][4+bj]; f = A[i][5+bj]; g = A[i][6+bj]; h = A[i][7+bj];  //store 1 1 1 1

            B[0+bj][i] = a; B[1+bj][i] = b; B[2+bj][i] = c; B[3+bj][i] = d;              //assign a a a a
            B[0+bj][4+i] = e; B[1+bj][4+i] = f; B[2+bj][4+i] = g; B[3+bj][4+i] = h;  //assign 1 1 1 1 
        }
        for (j = bj; j < bj + 4; j++) {
            a = A[4+bi][j]; b = A[5+bi][j]; c = A[6+bi][j]; d = A[7+bi][j];   //store e f g h
            e = B[j][4+bi]; f = B[j][5+bi]; g = B[j][6+bi]; h = B[j][7+bi];   //store 1 2 3 4

            B[j][4+bi] = a; B[j][5+bi] = b; B[j][6+bi] = c; B[j][7+bi] = d;          //assign e f g h
            B[4+j][0+bi] = e; B[4+j][1+bi] = f; B[4+j][2+bi] = g; B[4+j][3+bi] = h;  //assign 1 2 3 4
        }
        for (i = bi + 4; i < bi + 8; i++) {
            a = A[i][4+bj]; b = A[i][5+bj]; c = A[i][6+bj]; d = A[i][7+bj]; 
            B[4+bj][i] = a; B[5+bj][i] = b; B[6+bj][i] = c; B[7+bj][i] = d; 
        }
    }
}

通过测试，结果为misses = 1179，与理论数值相差在于对于对角块会存在冲突，而我们只处理了一部分。

3.M = 61, N = 67

此时所给的M和N对于cache块来说已经无法像前面的情况一样，可以对齐处理，如果要分析的话比较复杂，题目的满分要求也比较低misses < 2000。故我们采用变换分块大小来观察。

代码如下：

int bi, bj, i, j, tmp;
int block_size = 16;      //子块大小：block_size * block_size
for (bi = 0; bi < N; bi += block_size) {
    for (bj = 0; bj < M; bj += block_size) {
        for (i = bi; i < N && i < bi + block_size; i++) {
            for (j = bj; j < M && j < bj + block_size; j++) {
                tmp = A[i][j];
                B[j][i] = tmp;
            }
        }
    }
}

结果如下：(此图引用同一位博主的数据，谢谢博主大大！)

分块规模 $N\times N$	miss数	分块规模 $N\times N$	miss数
$2\times2$	3115	$12\times12$	2057
$3\times3$	2648	$13\times13$	2048
$4\times4$	2425	$14\times14$	1996
$5\times5$	2296	$15\times15$	2021
$6\times6$	2224	$16\times16$	1992
$7\times7$	2152	$17\times17$	1950
$8\times8$	2118	$18\times18$	1961
$9\times9$	2092	$19\times19$	1979
$10\times10$	2076	$20\times20$	2002
$11\times11$	2089	$21\times21$	1957

基本上 $8\times8$ 之后misses数在2000左右浮动，没有什么规律，在 $17\times17$ 时达到最小1950。

Part B 测试结果

Part B: Testing transpose function
Running ./test-trans -M 32 -N 32
Running ./test-trans -M 64 -N 64
Running ./test-trans -M 61 -N 67

Cache Lab summary:
                        Points   Max pts      Misses
Csim correctness          27.0        27
Trans perf 32x32           8.0         8         287
Trans perf 64x64           8.0         8        1179
Trans perf 61x67          10.0        10        1992
          Total points    53.0        53

总结

通过这三种不同数据所对应的优化方法来看，这个lab很用心了，层层递进。

对于 $M = 32, N = 32$ 来说，只需分为 $8\times8$ 即可，是最为简单的一种情况，不用什么改动就可完成适配cache，达到目标。

对于 $M = 64, N = 64$ 来说，因为元素增多，导致cache映射的不同，就需要在第一种情况的 $8\times8$ 下进一步的分析，难度递增。而且代码在这种级别的优化下阅读性变差很多。

而对于 $M = 61, N = 64$ 来说，数组的大小对于cache的大小来说已无很好的性质，只能通过 $b l o c k i n g$ 技术分块来进行尝试，达到要求。

而第三种情况才是最为常见的情况，也许这也是设计这种lab的良苦用心，现实中更多的情况则只能尝试。。。

Program timed out的解决方法

运行情况如下所示：

leo@masternode:/mnt/hgfs/CMU15-213/lab/4.cachelab-handout$ ./test-trans -M 32 -N 32

Function 0 (2 total)
Step 1: Validating and generating memory traces
Step 2: Evaluating performance (s=5, E=1, b=5)
func 0 (Transpose submission): hits:870, misses:1183, evictions:1151

Function 1 (2 total)
Step 1: Validating and generating memory traces
Error: Program timed out.
TEST_TRANS_RESULTS=0:0

将运行的程序文件夹移动到Linux单独的目录而不是虚拟机共享文件目录里。。。。

Some good habits

1.Warnings are Errors

Add “-Werror” to your compilation flags.

2.Missing Header Files

Use: man function-name

guava loadingCache代码示例 IM 胡鹏飞 Java 工具类介绍
publicclassTest2{publicstaticvoidmain(String[]args)throwsException{LoadingCachecache=CacheBuilder.newBuilder()//设置并发级别为8，并发级别是指可以同时写缓存的线程数.concurrencyLevel(8)//设置缓存容器的初始容量为10.initialCapacity(10)//设置缓存
Guava LoadingCache sqyaa. java并发编程 Java知识 jvm 缓存 guava
LoadingCache是GoogleGuava库提供的一个高级缓存实现，它通过自动加载机制简化了缓存使用模式。核心特性自动加载机制当缓存未命中时，自动调用指定的CacheLoader加载数据线程安全：并发请求下，相同key只会加载一次灵活的过期策略支持基于写入时间(expireAfterWrite)和访问时间(expireAfterAccess)的过期可设置最大缓存大小，基于LRU策略淘汰丰富的
vue keep-alive标签的运用
keep-alive，想必大家都不会很陌生，在一些选项卡中会使用到。其实，它的作用大概就是把组件的数据给缓存起来。比如果我有一个选项卡，标签一，标签二，标签三。现在，我需要实现，当我在标签一的表单中输入内容后，点击标签二，再回到标签一，表单的内容依然存在。如果按以往的做法，不使用keep-alive，那是不能实现的。然而，我们只需要在选项卡的内容最外层包一个keep-alive标签即可。但这儿有一
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
OKHttp3源码分析——学习笔记 Sincerity_ 源码相关 Okhttp 源码解析读书笔记 httpclient cache
文章目录1.HttpClient与HttpUrlConnection的区别2.OKHttp源码分析使用步骤:dispatcher任务调度器,（后面有详细说明）Request请求RealCallAsyncCall3.OKHttp架构分析1.异步请求线程池,Dispather2.连接池清理线程池-ConnectionPool3.缓存整理线程池DisLruCache4.Http2异步事务线程池,http
Python技能手册 - 模块module 金色牛神 Python python windows 开发语言
系列Python常用技能手册-基础语法Python常用技能手册-模块modulePython常用技能手册-包package目录module模块指什么typing数据类型int整数float浮点数str字符串bool布尔值TypeVar类型变量functools高阶函数工具functools.partial()函数偏置functools.lru_cache()函数缓存sorted排序列表排序元组排序
如何发现 Redis 中的 BigKey？ sevevty-seven redis bootstrap 数据库
如何发现Redis中的BigKey？Redis因其出色的性能，常被用作缓存、消息队列和会话存储。然而，在Redis的使用过程中，BigKey是一个不容忽视的问题。BigKey指的是存储了大量数据或包含大量成员的键。它们不仅会占用大量内存，还可能导致网络延迟、主从同步延迟，甚至在极端情况下引发Redis服务崩溃。因此，有效地发现和处理BigKey对于维护Redis服务的稳定性和性能至关重要。本文将深
项目开发日记
框架整理学习UIMgr：一、数据结构与算法1.1关键数据结构成员变量类型说明m_CtrlsList当前正在显示的所有UI页面m_CachesList已打开过、但现在不显示的页面（缓存池）1.2算法逻辑查找缓存页面：从m_Caches中倒序查找是否已有对应ePageType页面，找到则重用。页面加载：从资源管理器ResMgr加载prefab并绑定控制器/视图组件。页面关闭：从m_Ctrls移除，添加
C#集合：从基础到进阶的全面解析阿蒙Armon C#继续学习 c#windows linux
C#集合：从基础到进阶的全面解析在C#编程中，集合是处理数据集合的核心工具。无论是存储一组对象、实现缓存机制，还是处理复杂的数据结构，都离不开集合的灵活运用。本文将全面深入地探讨C#集合体系，从基础概念到高级技巧，帮助开发者掌握集合的精髓，写出更高效、更优雅的代码。一、集合概述与分类C#集合框架是.NET类库的重要组成部分，它提供了一系列用于存储和操作数据的类和接口。与数组相比，集合具有动态扩容、
Redis简介之它是啥财神爷首席大弟子 Redis redis 数据库缓存
什么是RedisRedis是一个基于BSD协议的开源数据库,是一个以键值对形式的存储系统Redis常用于消息队列,缓存,会话存储等场景Redis是使用C语言编写使用许可证：BSD许可证是一个开源的宽松的软件许可协议Redis优点性能极高Redis是以高性能著称,可全天24小时达到每秒十万次的读写操作数据类型丰富哈希字符串集合列表有序集合原子性操作原子性操作是指,程序要么不执行,要嘛执行完毕,这种对
短剧小程序开发全攻略：从0到1打造爆款内容平台 weixin_lynhgworld 小程序短剧
核心内容：行业趋势分析：短剧市场年增长率超300%，用户规模突破5亿，抖音、快手等平台加速布局。小程序成为短剧分发核心渠道：轻量化、低成本、社交裂变优势显著。开发核心功能模块：内容管理：支持多格式上传、分集管理、标签分类。播放体验优化：弹幕互动、倍速播放、清晰度切换、离线缓存。付费系统：单集付费、会员订阅、广告解锁等多元化盈利模式。社交裂变：分享奖励、邀请排行榜、拼团观影功能。技术实现难点：视频流
【鸿蒙实战开发】HarmoneyOS如何添加首选项功能「已注销」鸿蒙安卓前端 harmonyos java 华为 android 鸿蒙前端
什么是用户首选项？用户首选项为应用提供Key-Value键值型的数据处理能力，支持应用持久化轻量级数据，并对其修改和查询。当用户希望有一个全局唯一存储的地方，可以采用用户首选项来进行存储。Preferences会将该数据缓存在内存中，当用户读取的时候，能够快速从内存中获取数据，当需要持久化时可以使用flush接口将内存中的数据写入持久化文件中。用户首选项运作机制用户首选项的使用场景Preferen
Spring Boot使用Redis常用场景蹦跑的蜗牛 spring boot redis 后端
SpringBoot使用Redis常用场景一、概述：Redis是什么？为什么要用它？Redis（RemoteDictionaryServer）是一个内存中的数据存储系统（类似一个“超级大字典”），它能存各种类型的数据（字符串、列表、哈希等），而且读写速度极快（因为数据存在内存里）。简单说，Redis就像电脑的“缓存抽屉”：当你的程序需要频繁读取或修改某些数据时（比如用户登录信息、商品销量），直接从
云原生技术与应用-Docker高级管理--Dockerfile镜像制作慕桉 ~ 云原生 docker 容器
目录一.Docker镜像管理1.Docker镜像结构2.Dockerfile介绍二.Dockerfile实施1.构建nginx容器2.构建Tomcat容器3.构建mysql容器三.Dockerfile语法注意事项1.指令书写范围2.基础镜像选择3.文件操作注意4.执行命令要点5.环境变量和参数设置6.缓存利用与清理一.Docker镜像管理Docker镜像除了是Docker的核心技术之外，也是应用发
Android OkHttp使用与底层机制详解你过来啊你 android okhttp
OkHttp是Square公司开发的一个高效、功能强大的HTTP客户端库，因其简洁的API、灵活的拦截器链、内置连接池、透明GZIP压缩、响应缓存以及对HTTP/2和WebSocket的支持，已成为Android和Java应用开发中事实上的标准网络库。一、OkHttp的核心使用1.基本请求流程//1.创建OkHttpClient实例(通常全局共享一个实例)OkHttpClientclient=ne
Redis 性能优化实战：管道、事务、缓存与连接管理全解析佑瞻数据库与知识图谱缓存 redis 性能优化
在日常开发中，我们常常会遇到Redis操作的性能瓶颈：频繁的命令交互导致网络开销激增，并发更新时的数据一致性难以保证，海量数据遍历引发的阻塞问题……其实，Redis早已为这些场景准备了“利器”。今天我们就深入探讨Redis的管道、事务、扫描迭代、客户端缓存以及连接管理技巧，用实战代码带你玩转性能优化。一、管道（Pipelines）：批量执行命令，减少网络往返当我们需要连续执行多个Redis命令时，
九、MyBatis的缓存 ModelBulider #mybatis mybatis 后端开发语言
文章目录1.MyBatis的一级缓存2.MyBatis的二级缓存3.二级缓存的相关配置4.MyBatis缓存查询的顺序5.整合第三方缓存EHCache（了解）1.MyBatis的一级缓存一级缓存是SqlSession级别的，通过同一个SqlSession查询的数据会被缓存，下次查询相同的数据，就会从缓存中直接获取，不会从数据库重新访问使一级缓存失效的四种情况：不同的SqlSession对应不同的一
docker-基于dockerfile自动构建镜像 liux3528 docker docker linux 运维
Dockerfile是自动化构建Docker镜像的配置文件，相比手动构建具有显著优势：更小的存储空间和带宽占用、高效的缓存利用、便捷的修改流程。其核心指令包括FROM（基础镜像）、RUN（执行命令）、COPY/ADD（文件复制）、ENV（环境变量）等，通过分层技术实现高效构建。实践案例展示了如何构建Nginx游戏镜像，包括多阶段构建技巧（分离编译和运行环境），显著减小镜像体积。通过编写Docker
学会Python缓存妙用，你的程序更出色更快速！码农必胜客 Python python 缓存装饰器模块
前言在Python应用程序中，使用缓存能够显著提高性能并降低资源消耗。本文将详细介绍如何在Python中实现缓存机制，包括内置functools模块提供的lru_cache装饰器以及自定义缓存机制。使用functools模块的lru_cachefunctools模块提供了lru_cache装饰器，可以轻松添加缓存到函数中。fromfunctoolsimportlru_cache@lru_cache
Python性能加速器：掌握functools.lru_cache装饰器清水白石008 Python题库 python 论文 python 开发语言
Python性能加速器：掌握functools.lru_cache装饰器一、引言在Python中，很多函数会根据输入参数计算出相应的结果。对于某些计算密集型或I/O密集型的函数，如果它们的输入参数在多次调用中保持不变或变化不大，那么每次调用都重新计算结果将是非常低效的。functools.lru_cache装饰器正是为了解决这一问题而设计的，它能够自动缓存函数的返回值，当再次以相同的参数调用函数时
Linux-DNS域名解析服务
系列文章目录`提示：仅用于个人学习，进行查漏补缺使用。1.Linux网络设置2.LinuxDHCP服务提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录前言`提示：以下是本篇文章正文内容，下面案例可供参考`一.概述二.DNS的定义三.域名结构四、DNS域名解析方式五.DNS域名解析的流程：六.Linux中的DNS配置：_DNS缓存：_七.DNS查找顺序八.DNS服
Python深度解析：functools.lru_cache装饰器
引言在Python中，functools.lru_cache是一个强大的装饰器，用于缓存函数的调用结果。本文将深入探讨lru_cache的用法、使用场景、解决的问题、高级用法和选项、性能，以及一些注意事项。1.介绍1.1什么是functools.lru_cache？functools.lru_cache是Python标准库中的一个装饰器，用于添加缓存功能。LRU代表最近最少使用，这意味着该缓存会保
深入Redis：核心的缓存
Redis最主要的用途，主要有三个方面：存储数据、缓存、消息队列。其中，缓存是Redis最常用的场景。Redis使用内存作为硬盘的缓存。把用户集中访问的20%数据放到缓存中去，可以应对80%的请求。数据库是非常重要的组件，但是mysql的速度又比较慢，所以我们用Redis来作为mysql的缓存。为什么说关系型数据库性能不高?数据库把数据存储在硬盘上，硬盘的IO速度并不快。尤其是随机访问。如果查询不
Python进阶｜实现缓存
在Python编程中，缓存是一种用于存储计算结果的机制，以便在需要相同结果时能够快速访问，而无需重新进行计算。缓存可以显著提高程序的性能，特别是在处理昂贵或耗时的操作时。以下是几种在Python中实现缓存的方法：1.使用简单的字典作为缓存这是最基本的缓存实现方式。你可以使用一个字典来存储已经计算过的结果，其中键是输入参数（通常是可哈希的），值是计算结果。python复制代码cache={}defe
掌握 Spring Data Redis，提升后端开发效率
掌握SpringDataRedis，提升后端开发效率关键词：SpringDataRedis、后端开发、缓存、数据持久化、效率提升摘要：本文旨在深入探讨SpringDataRedis这一强大的工具，帮助后端开发者更好地掌握它以提升开发效率。首先介绍SpringDataRedis的背景知识，包括其目的、适用读者等。接着详细阐述核心概念与联系，分析核心算法原理并给出具体操作步骤，通过数学模型和公式加深理
Redis核心用法与通用命令全解析 Pota-to成长日记 Redis redis 数据库缓存
Redis核心用法与通用命令全解析——从基础操作到高效实践一、Redis基础知识速览Redis是一款高性能的键值存储系统，支持String、Hash、List、Set、SortedSet五种核心数据结构，以及Bitmaps、HyperLogLog、Streams等扩展类型。其单线程模型和内存存储特性使其在缓存、计数器、消息队列等场景中表现出色。二、核心命令详解（附实用示例）1.通用键操作命令（1）
Python-FAQ-单例模式
1需求2接口3示例4参考资料单例模式（SingletonPattern）是一种创建型设计模式，它确保一个类只有一个实例，并提供一个全局访问点来获取该实例。在Python中，实现单例模式有多种方式，下面介绍几种常见的实现方法及其优缺点。1.使用模块（Pythonic方式）Python的模块天然就是单例的，因为模块在第一次导入时会被创建并缓存，后续导入会直接使用缓存的实例。实现示例：#singleto
【线上故障排查】缓存穿透攻击的识别与布隆过滤器（面试题 + 3 步追问应对 + 案例分析）程序员岳彬从项目到面试：Java 高频面试题场景化通关指南缓存 java 后端 spring boot linux redis
一、高频面试题问题1：什么是缓存穿透？它对系统的核心危害是什么？参考答案：缓存穿透指的是用户请求的数据在缓存和数据库中都不存在，导致请求直接绕过缓存打到数据库。核心危害是大量无效请求会耗尽数据库资源，比如CPU、内存或连接数，严重时可能引发数据库宕机，进而导致整个系统崩溃，影响服务可用性。第一步追问：缓存穿透和缓存雪崩有什么本质区别？参考答案：两者本质不同。缓存穿透是请求不存在的数据，攻击或逻辑漏
Redis 分布式锁实现与实践佑瞻数据库与知识图谱 redis 分布式数据库
在分布式系统架构中，多个独立进程对共享资源的并发访问控制是常见需求，分布式锁作为解决这一问题的关键技术，在缓存更新、任务调度、库存管理等场景中发挥着重要作用。本文将从基础原理出发，详细阐述基于Redis的分布式锁实现方案，包括单实例模式与Redlock算法，并探讨其在实际应用中的关键考量。分布式锁核心概念分布式锁是一种跨进程、跨机器的同步机制，用于保证多个分布式节点对共享资源的互斥访问。一个可靠的
布隆过滤器详解及使用：解决缓存穿透问题豪宇刘缓存哈希算法散列表
在现代应用开发中，缓存技术被广泛应用于提升系统性能和响应速度。然而，缓存系统也带来了一些新的挑战，如缓存穿透、缓存击穿和缓存雪崩等问题。一、什么是布隆过滤器？布隆过滤器是一种空间效率很高的概率型数据结构，用于判断一个元素是否在一个集合中。它的优点是高效且占用内存少，但有一定的误判率（即可能会错误地认为某个不在集合中的元素存在于集合中），不过它不会漏报（即如果一个元素确实不在集合中，布隆过滤器一定能
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p