fastaway

HIT CSAPP LAB6

Cachelab

高速缓冲器模拟

2.1 画出存储器层级结构，标识容量价格速度等指标变化（5分） - 4 -
2.2用CPUZ等查看你的计算机CACHE各参数，写出各级CACHE的C S E B S E B（5分） - 4 -
2.3写出各类CACHE的读策略与写策略（5分） - 5 -
2.4 写出用GPROF进行性能分析的方法（5分） - 5 -
2.5写出用VALGRIND进行性能分析的方法（（5分） - 6 -

第3章 CACHE模拟与测试 - 8 -

3.1 CACHE模拟器设计 - 8 -
3.2 矩阵转置设计 - 10 -

第4章总结 - 21 -

4.1 请总结本次实验的收获 - 21 -
4.2 请给出对本次实验内容的建议 - 21 -

参考文献 - 22 -

第1章实验基本信息

1.1 实验目的

理解现代计算机系统存储器层级结构
掌握Cache的功能结构与访问控制策略
培养Linux下的性能测试方法与技巧
深入理解Cache组成结构对C程序性能的影响

1.2 实验环境与工具

1.2.1 硬件环境

X64 CPU；2GHz；2G RAM；256GHD Disk 以上

1.2.2 软件环境

Windows7 64位以上；VirtualBox/Vmware 11以上；Ubuntu 16.04 LTS 64位/优麒麟 64位；

1.2.3 开发工具

Visual Studio 2010 64位以上；TestStudio；Gprof;Valgrind等

1.3 实验预习

上实验课前，必须认真预习实验指导书（PPT或PDF）
了解实验的目的、实验环境与软硬件工具、实验操作步骤，复习与实验有关的理论知识。画出存储器的层级结构，标识其容量价格速度等指标变化
用CPUZ等查看你的计算机Cache各参数，写出C S E B s e b
写出Cache的基本结构与参数；写出各类Cache的读策略与写策略
掌握Valgrind与Gprof的使用方法

第2章实验预习

2.1 画出存储器层级结构，标识容量价格速度等指标变化（5分）

从上到下分别为L0 L1 L2 L3 L4 L5 L6
高层的存储器保存着从底层的存储器取出的缓存行

2.2用CPUZ等查看你的计算机Cache各参数，写出各级Cache的C S E B s e b（5分）

名称（级别类型）	C	S	E	B	s	e	b
一级数据缓存	32KB	64	8	64B	6	3	6
一级代码缓存	32KB	64	8	64B	6	3	6
二级缓存	256KB	1024	4	64B	10	2	6
三级缓存	8MB	8192	16	64B	13	4	6

2.3写出各类Cache的读策略与写策略（5分）

Cache读策略：
1、缓存命中，则从cache中读相应数据到CPU或上一级cache中。
2、缓存不命中，则从主存或下一级cache中读取数据，并替换出一行数据。
Cache写策略：
①.写一个已经缓存了的字w（写命中）是，在高速缓存更新了它的w的副本之后，
1、直写
立即将w的高速缓存块写回到紧接着的低一层中。
2、写回
尽可能的推迟更新，只有当替换算法要驱逐这个更新过的块时，才把它写到紧接着的第一层中。
②.写不命中时，
1、写分配
加载相应的低一层的块到高速缓存中，然后更新这个高速缓存块。
2、非写分配
避开高速缓存，直接把这个字写到低一层中去。

2.4 写出用gprof进行性能分析的方法（5分）

gprof是GNU profile工具，可以运行于linux、AIX、Sun等操作系统进行C、C++、Pascal、Fortran程序的性能分析，用于程序的性能优化以及程序瓶颈问题的查找和解决。通过分析应用程序运行时产生的“flat profile”，可以得到每个函数的调用次数，每个函数消耗的处理器时间，也可以得到函数的“调用关系图”，包括函数调用的层次关系，每个函数调用花费了多少时间。使用步骤如下：
（1）用gcc、g++、xlC编译程序时，使用-pg参数，如：g++ -pg -o test.exe test.cpp编译器会自动在目标代码中插入用于性能测试的代码片断，这些代码在程序运行时采集并记录函数的调用关系和调用次数，并记录函数自身执行时间和被调用函数的执行时间。
（2）执行编译后的可执行程序，如：./test.exe。该步骤运行程序的时间会稍慢于正常编译的可执行程序的运行时间。程序运行结束后，会在程序所在路径下生成一个缺省文件名为gmon.out的文件，这个文件就是记录程序运行的性能、调用关系、调用次数等信息的数据文件。
（3）使用gprof命令来分析记录程序运行信息的gmon.out文件，如：gprof test.exe gmon.out则可以在显示器上看到函数调用相关的统计、分析信息。上述信息也可以采用gprof test.exe gmon.out> gprofresult.txt重定向到文本文件以便于后续分析。

2.5写出用Valgrind进行性能分析的方法（5分)

Valgrind是运行在Linux上一套基于仿真技术的程序调试和分析工具，它包含一个内核──一个软件合成的CPU，和一系列的小工具，每个工具都可以完成一项任务──调试，分析，或测试等。Valgrind可以检测内存泄漏和内存违例，还可以分析cache的使用等。Valgrind包含以下工具：Memcheck（用来检测程序中出现的内存问题，所有对内存的读写都会被检测到，一切对malloc()/free()/new/delete的调用都会被捕获）、Callgrind（收集程序运行时的一些数据，建立函数调用关系图，还可以有选择地进行cache模拟。在运行结束时，它会把分析数据写入一个文件，callgrind_annotate可以把这个文件的内容转化成可读的形式）、Cachegrind（模拟CPU中的一级缓存I1，Dl和二级缓存，能够精确地指出程序中cache的丢失和命中。如果需要，它还能够为我们提供cache丢失次数，内存引用次数，以及每行代码，每个函数，每个模块，整个程序产生的指令数）、Helgrind（用来检查多线程程序中出现的竞争问题）、Massif（堆栈分析器，能测量程序在堆栈中使用了多少内存，告诉我们堆块，堆管理块和栈的大小）。Valgrind的使用非常简单，valgrind命令的格式如下：valgrind [valgrind-options] your-prog [your-prog options] 。一些常用的选项如下：

选项	作用
-h --help	显示帮助信息
–version	显示valgrind内核的版本，每个工具都有各自的版本
-q --quiet	安静地运行，只打印错误信息
-v --verbose	打印更详细的信息。
–tool= [default: memcheck]	最常用的选项。运行valgrind中名为toolname的工具。如果省略工具名，默认运行memcheck。
–db-attach= [default: no]	绑定到调试器上，便于调试错误。

第3章 Cache模拟与测试

3.1 Cache模拟器设计

提交csim.c

程序设计思想：

1.程序定义的cache结构体：

typedef struct cache_line {  
    char valid;  
    mem_addr_t tag;  
    unsigned long long int lru;  
} cache_line_t;  
typedef cache_line_t* cache_set_t;  
typedef cache_set_t* cache_t;

2.程序主要的函数：
在main中从命令行参数读取计算S，E，B. 如下：

S = 1 << s;
B = 1 << b;
E = E;

initCache()函数 - 分配内存，写0表示有效和标记和LRU，为它们初始化

cache = (cache_set_t *)malloc(S * sizeof(cache_set_t));
cache[i] = (cache_line_t *)malloc(E * sizeof(cache_line_t));//为行申请空间

freeCache()函数：为释放空间，根据申请空间的倒序来释放即可。
void replayTrace(char* trace_fn) ：此函数基本已经全部给出，主要的就是从trace文件中读取数据，并且调用accessdata函数，操作类型若为 'L’或 ‘S’，则调用一次accessdata，若为 ‘M’ ，则多调用一次accessdata 。另外在次函数中读取了地址addr之后，可以计算出组索引和标记：

mem_addr_t tag_now = (addr >> b) >> s;
set_index_mask = (addr >> b) & ((1 << s) - 1);

accessData - 访问内存地址addr的数据。
1)如果它已经在cache中，即冲突命中，则hit_count++，lru_counter++
2)如果它不在cache中，将其放入缓存中，miss_counter++。
3)如果一条线被驱逐，则eviction_count++
当组索引找到的某一组，存在一行有效位为1，并且标记匹配时hit发生。
若不命中，则miss_count++。
若组索引找到的某一组，有效位全部为1，此时驱逐某一块发生eviction_counter++ ，并且找到lru最小的那一行，驱逐。
否则只需任意取一块空块将addr信息存入。

测试用例1的输出截图（5分）：

测试用例2的输出截图（5分）：

测试用例3的输出截图（5分）：

测试用例4的输出截图（5分）：

测试用例5的输出截图（5分）：

测试用例6的输出截图（5分）：

测试用例7的输出截图（5分）：

测试用例8的输出截图（10分）：

注：每个用例的每一指标5分（最后一个用例10）——与参考csim-ref模拟器输出指标相同则判为正确

3.2 矩阵转置设计

提交trans.c

程序设计思想：

由于32 * 32过大，先以4 * 4矩阵进行分析。
将注册的其他函数先注释掉，只保留原始trans函数：

显然，由于cache的块的大小为32个字节，即8个int型数据，故数组中前8个元素会在用一个块中，后8个在另外一个块中，如下图，A按行访问，B按列访问：

1、A数组访问A[0][0]，冲突不命中，将块11装入cache。
2、B数组访问B[0][0]，虽然B[0][0]所映射的块11在cache中，但是标记位不同，造成冲突不命中，重新将数组B对应的块11装入cache。
3、A数组访问A[0][1]，虽然A[0][1] 所映射的块11在cache中，但是标记位不同，造成冲突不命中，重新将数组A对应的块11装入cache。
4、B数组访问B[1][0]，虽然B[1][0]所映射的块11在cache中，但是标记位不同，造成冲突不命中，重新将数组B对应的块11装入cache。
5、A数组访问A[0][2]，虽然A[0][2]所映射的块11在cache中，但是标记位不同，造成冲突不命中，重新将数组A对应的块11装入cache。
6、B数组访问B[2][0]，B[2][0] 所映射的块12不在cache中，冲突不命中，将数组B对应的块12装入cache。
7、A数组访问A[0][3]，A[0][3]所映射的块11在cache中，且标记位相同，故命中。
8、B数组访问B[3][0]，B[3][0]所映射的块12在cache中，且标记位相同，故命中。
剩余的操作以同样的方法可以分析得出类似的过程。
由上述分析知，造成冲突不命中的原因是B数组与A数组中下标相同的元素会映射到同一个cache块。
我们可以通过尝试一次性访问同一个块中的多个元素，以减少冲突不命中的数目。
针对32 * 32的矩阵，由于每个块可以存8个int型的数据，cache共有32个块，即32个组，故对于32×32的矩阵而言，每一行的32个元素占4个组，每8行会占满整个cache。
这样32 * 32的矩阵颜色相同的两个块对应关系相同。

首先由于1block存8个数，故先采用用一次访问8个数的方法减少冲突。

此时，其冲突数目如下：

这样针对32*32的矩阵，A冲突命中与否如下，m表示不命中，h表示命中

B冲突命中与否如下，同样表示方法有：

对于B数组而言，处于对角线上的元素也不命中。这是可以继续优化的部分。
对角线上如第二行的第二列的不命中，由于将A第一行的数据进行转置时会访问到B数组的第二行，而随后A数组也会访问到第二行，接着B又会重新访问第二行，这个第二次访问第二行的过程就是一次冲突不命中。按照这个访问过程来讲，要避免这个不命中，方法如下：
①在A数组访问第二行之前B数组不访问第二行。
②在A数组访问第二行之后B数组不访问第二行。
而如B[1][1]=A[1][1]，得先访问A数组的A[1][1]才能得到B数组的B[1][1]。采用方法①，然而由于最多定义12个变量，而for循环中占了4个，所以最多只能再用8个。发现B数组中第一行在不命中一次以后，对于这一行的访问以后一定是命中的，因为A数组不会再访问第一行了。故可将A数组第一行的元素先存入B数组的第一行，然后将A数组中的第二行读取以后再访问B数组中的第二行，这样一来就实现了方法①。
同理，我们可以同样地处理其余行，使得在对B数组的第i行进行访问时，A数组中的第i行已经被访问，以后A数组不会再访问第i行。
按照这个思路可以得到如下代码：

if(M == 32 && N == 32) {
	for(i = 0; i < N; i += 8){
		for(j = 0; j < M; j += 8){
			if(i == j){
				tmp0 = A[i][j];
				tmp1 = A[i][j + 1];
				tmp2 = A[i][j + 2];
				tmp3 = A[i][j + 3];
				tmp4 = A[i][j + 4];
				tmp5 = A[i][j + 5];
				tmp6 = A[i][j + 6];
				tmp7 = A[i][j + 7];
				B[i][j] = tmp0;
				B[i][j + 1] = tmp1;
				B[i][j + 2] = tmp2;
				B[i][j + 3] = tmp3;
				B[i][j + 4] = tmp4;
				B[i][j + 5] = tmp5;
				B[i][j + 6] = tmp6;
				B[i][j + 7] = tmp7;
				
				tmp0 = A[i + 1][j];
				tmp1 = A[i + 1][j + 1];
				tmp2 = A[i + 1][j + 2];
				tmp3 = A[i + 1][j + 3];
				tmp4 = A[i + 1][j + 4];
				tmp5 = A[i + 1][j + 5];
				tmp6 = A[i + 1][j + 6];
				tmp7 = A[i + 1][j + 7];
				B[i + 1][j] = B[i][j + 1];
				B[i][j + 1] = tmp0;
				B[i + 1][j + 1] = tmp1;
				B[i + 1][j + 2] = tmp2;
				B[i + 1][j + 3] = tmp3;
				B[i + 1][j + 4] = tmp4;
				B[i + 1][j + 5] = tmp5;
				B[i + 1][j + 6] = tmp6;
				B[i + 1][j + 7] = tmp7;
				
				tmp0 = A[i + 2][j];
				tmp1 = A[i + 2][j + 1];
				tmp2 = A[i + 2][j + 2];
				tmp3 = A[i + 2][j + 3];
				tmp4 = A[i + 2][j + 4];
				tmp5 = A[i + 2][j + 5];
				tmp6 = A[i + 2][j + 6];
				tmp7 = A[i + 2][j + 7];
				B[i + 2][j] = B[i][j + 2];
				B[i + 2][j + 1] = B[i + 1][j + 2];
				B[i][j + 2] = tmp0;
				B[i + 1][j + 2] = tmp1;
				B[i + 2][j + 2] = tmp2;
				B[i + 2][j + 3] = tmp3;
				B[i + 2][j + 4] = tmp4;
				B[i + 2][j + 5] = tmp5;
				B[i + 2][j + 6] = tmp6;
				B[i + 2][j + 7] = tmp7;
					
				tmp0 = A[i + 3][j];
				tmp1 = A[i + 3][j + 1];
				tmp2 = A[i + 3][j + 2];
				tmp3 = A[i + 3][j + 3];
				tmp4 = A[i + 3][j + 4];
				tmp5 = A[i + 3][j + 5];
				tmp6 = A[i + 3][j + 6];
				tmp7 = A[i + 3][j + 7];
				B[i + 3][j] = B[i][j + 3];
				B[i + 3][j + 1] = B[i + 1][j + 3];
				B[i + 3][j + 2] = B[i + 2][j + 3];
				B[i][j + 3] = tmp0;
				B[i + 1][j + 3] = tmp1;
				B[i + 2][j + 3] = tmp2;
				B[i + 3][j + 3] = tmp3;
				B[i + 3][j + 4] = tmp4;
				B[i + 3][j + 5] = tmp5;
				B[i + 3][j + 6] = tmp6;
				B[i + 3][j + 7] = tmp7;
 
				tmp0 = A[i + 4][j];
				tmp1 = A[i + 4][j + 1];
				tmp2 = A[i + 4][j + 2];
				tmp3 = A[i + 4][j + 3];
				tmp4 = A[i + 4][j + 4];
				tmp5 = A[i + 4][j + 5];
				tmp6 = A[i + 4][j + 6];
				tmp7 = A[i + 4][j + 7];
				B[i + 4][j] = B[i][j + 4];
				B[i + 4][j + 1] = B[i + 1][j + 4];
				B[i + 4][j + 2] = B[i + 2][j + 4];
				B[i + 4][j + 3] = B[i + 3][j + 4];
				B[i][j + 4] = tmp0;
				B[i + 1][j + 4] = tmp1;
				B[i + 2][j + 4] = tmp2;
				B[i + 3][j + 4] = tmp3;
				B[i + 4][j + 4] = tmp4;
				B[i + 4][j + 5] = tmp5;
				B[i + 4][j + 6] = tmp6;
				B[i + 4][j + 7] = tmp7;

				tmp0 = A[i + 5][j];
				tmp1 = A[i + 5][j + 1];
				tmp2 = A[i + 5][j + 2];
				tmp3 = A[i + 5][j + 3];
				tmp4 = A[i + 5][j + 4];
				tmp5 = A[i + 5][j + 5];
				tmp6 = A[i + 5][j + 6];
				tmp7 = A[i + 5][j + 7];
				B[i + 5][j] = B[i][j + 5];
				B[i + 5][j + 1] = B[i + 1][j + 5];
				B[i + 5][j + 2] = B[i + 2][j + 5];
				B[i + 5][j + 3] = B[i + 3][j + 5];
				B[i + 5][j + 4] = B[i + 4][j + 5];
				B[i][j + 5] = tmp0;
				B[i + 1][j + 5] = tmp1;
				B[i + 2][j + 5] = tmp2;
				B[i + 3][j + 5] = tmp3;
				B[i + 4][j + 5] = tmp4;
				B[i + 5][j + 5] = tmp5;
				B[i + 5][j + 6] = tmp6;
				B[i + 5][j + 7] = tmp7;

				tmp0 = A[i + 6][j];
				tmp1 = A[i + 6][j + 1];
				tmp2 = A[i + 6][j + 2];
				tmp3 = A[i + 6][j + 3];
				tmp4 = A[i + 6][j + 4];
				tmp5 = A[i + 6][j + 5];
				tmp6 = A[i + 6][j + 6];
				tmp7 = A[i + 6][j + 7];
				B[i + 6][j] = B[i][j + 6];
				B[i + 6][j + 1] = B[i + 1][j + 6];
				B[i + 6][j + 2] = B[i + 2][j + 6];
				B[i + 6][j + 3] = B[i + 3][j + 6];
				B[i + 6][j + 4] = B[i + 4][j + 6];
				B[i + 6][j + 5] = B[i + 5][j + 6];
				B[i][j + 6] = tmp0;
				B[i + 1][j + 6] = tmp1;
				B[i + 2][j + 6] = tmp2;
				B[i + 3][j + 6] = tmp3;
				B[i + 4][j + 6] = tmp4;
				B[i + 5][j + 6] = tmp5;
				B[i + 6][j + 6] = tmp6;
				B[i + 6][j + 7] = tmp7;
				
				tmp0 = A[i + 7][j];
				tmp1 = A[i + 7][j + 1];
				tmp2 = A[i + 7][j + 2];
				tmp3 = A[i + 7][j + 3];
				tmp4 = A[i + 7][j + 4];
				tmp5 = A[i + 7][j + 5];
				tmp6 = A[i + 7][j + 6];
				tmp7 = A[i + 7][j + 7];
				B[i + 7][j] = B[i][j + 7];
				B[i + 7][j + 1] = B[i + 1][j + 7];
				B[i + 7][j + 2] = B[i + 2][j + 7];
				B[i + 7][j + 3] = B[i + 3][j + 7];
				B[i + 7][j + 4] = B[i + 4][j + 7];
				B[i + 7][j + 5] = B[i + 5][j + 7];
				B[i + 7][j + 6] = B[i + 6][j + 7];
				B[i][j + 7] = tmp0;
				B[i + 1][j + 7] = tmp1;
				B[i + 2][j + 7] = tmp2;
				B[i + 3][j + 7] = tmp3;
				B[i + 4][j + 7] = tmp4;
				B[i + 5][j + 7] = tmp5;
				B[i + 6][j + 7] = tmp6;
				B[i + 7][j + 7] = tmp7;
			}
			else {
				for(k = i; k < i + 8; ++k) {
					for(y = j; y < j + 8; ++y){
						B[y][k] = A[k][y];
					}
				}
			}
		}
	}
}

再考察64 * 64的矩阵：
对于64 * 64的矩阵而言，每一行元素会占8个组，因此4行元素即可占满cache。
尝试和32 * 32的矩阵相同的初始8 * 8分块方法，发现miss总数达到了4000+，基本没什么优化。此时对A数组的访问依然是第一个不命中。对B数组的访问，可以看到前4行和后四行所映射的块是相同的，于是访问完前四行的第一列后，访问后四行的第一列会冲突不命中，导致原来的块被驱逐，再访问前四行的第二列，由于之前的块已经被驱逐，因此又会miss且驱逐，如此反复下去，B数组中所有的元素皆会不命中。故不能采用8 * 8的划分方式。又因为4 * 4的分块方式无法充分利用每次加载后的块，故也将其否定。
考虑将8 * 8和4 * 4相结合。
下面用示意图进行表示：
红色块移至目的地，黄色块暂存至红色块右边且移动是伴随着转置的。

再实现图中的移动即可，将黄色块移到红色块的下面，在将绿色快移到之前“暂存”黄色块的地方，最后将灰色块移动到目的地即可。

由上两种思路可同理写出61 * 67的代码。
根据反复调整分块的大小，发现分成17 * 17的块时miss数最小，代码如下

32×32（10分）：运行结果截图

64×64（10分）：运行结果截图

61×67（20分）：运行结果截图

以下是程序相应代码

csim.c

#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include "cachelab.h"

//#define DEBUG_ON 
#define ADDRESS_LENGTH 64

/* Type: Memory address */
typedef unsigned long long int mem_addr_t;

/* Type: Cache line
   LRU is a counter used to implement LRU replacement policy  */
typedef struct cache_line {
    char valid;
    mem_addr_t tag;
    unsigned long long int lru;
} cache_line_t;

typedef cache_line_t* cache_set_t;
typedef cache_set_t* cache_t;

/* Globals set by command line args */
int verbosity = 0; /* print trace if set */
int s = 0; /* set index bits */
int b = 0; /* block offset bits */
int E = 0; /* associativity */
char* trace_file = NULL;

/* Derived from command line args */
int S; /* number of sets */
int B; /* block size (bytes) */

/* Counters used to record cache statistics */
int miss_count = 0;
int hit_count = 0;
int eviction_count = 0;
unsigned long long int lru_counter = 1;

/* The cache we are simulating */
cache_t cache;  
mem_addr_t set_index_mask;

/* 
 * initCache - Allocate memory, write 0's for valid and tag and LRU
 * also computes the set_index_mask
 */
void initCache() {
	if (s < 0) {
		printf("set number error!\n");
		exit(0);
	}
	cache = (cache_set_t *)malloc(S * sizeof(cache_set_t));
	if (cache == NULL) {
		printf("No set memory!\n");
		exit(0);
	}
	for (int i = 0; i < S; ++i) {
		cache[i] = (cache_line_t *)malloc(E * sizeof(cache_line_t));//为行申请空间
		if (!cache[i]) {
			printf("No line memory!\n");
			exit(0);
		}
		for (int j = 0; j < E; ++j) {
			cache[i][j].lru = 0;
			cache[i][j].tag = 0;
			cache[i][j].valid = 0;
		}
	}
}


/* 
 * freeCache - free allocated memory
 */
void freeCache() {
	for (int i = 0; i < S; ++i) {
		free(cache[i]);
	}
	free(cache);
}


/* 
 * accessData - Access data at memory address addr.
 *   If it is already in cache, increast hit_count
 *   If it is not in cache, bring it in cache, increase miss count.
 *   Also increase eviction_count if a line is evicted.
 */
void accessData(mem_addr_t addr) {
	int flag = 0, goal = 0;
	mem_addr_t tag_now = (addr >> b) >> s;
	set_index_mask = (addr >> b) & ((1 << s) - 1);
	for (int i = 0; i < E; ++i) {
		if (cache[set_index_mask][i].valid == 1 && cache[set_index_mask][i].tag == tag_now) {
			hit_count++;
			lru_counter++;
			cache[set_index_mask][i].lru = lru_counter;
			return;
		}
	}
	miss_count++;
	for (int i = 0; i < E; ++i) {
		if (cache[set_index_mask][i].valid == 0) {
			flag = 1;
			goal = i;
			break;
		}
	}
	if (flag == 1) {
		cache[set_index_mask][goal].valid = 1;
		cache[set_index_mask][goal].tag = tag_now;
		cache[set_index_mask][goal].lru = (++lru_counter);
	}
	else {
		eviction_count++;
		flag = 0;
		int minlru = cache[set_index_mask][0].lru;
		for (int i = 0; i < E; i++) {
			if (minlru > cache[set_index_mask][i].lru) {
				minlru = cache[set_index_mask][i].lru;
				flag = i;
			}
		}
		cache[set_index_mask][flag].valid = 1;
		cache[set_index_mask][flag].tag = tag_now;
		cache[set_index_mask][flag].lru = (++lru_counter);
	}
}


/*
 * replayTrace - replays the given trace file against the cache 
 */
void replayTrace(char* trace_fn)
{
    char buf[1000];
    mem_addr_t addr=0;
    unsigned int len=0;
    FILE* trace_fp = fopen(trace_fn, "r");

    if(!trace_fp){
        fprintf(stderr, "%s: %s\n", trace_fn, strerror(errno));
        exit(1);
    }

    while( fgets(buf, 1000, trace_fp) != NULL) {
        if(buf[1]=='S' || buf[1]=='L' || buf[1]=='M') {
            sscanf(buf+3, "%llx,%u", &addr, &len);
      
            if(verbosity)
                printf("%c %llx,%u ", buf[1], addr, len);

            accessData(addr);

            /* If the instruction is R/W then access again */
            if(buf[1]=='M')
                accessData(addr);
            
            if (verbosity)
                printf("\n");
        }
    }

    fclose(trace_fp);
}

/*
 * printUsage - Print usage info
 */
void printUsage(char* argv[])
{
    printf("Usage: %s [-hv] -s  -E  -b  -t \n", argv[0]);
    printf("Options:\n");
    printf("  -h         Print this help message.\n");
    printf("  -v         Optional verbose flag.\n");
    printf("  -s    Number of set index bits.\n");
    printf("  -E    Number of lines per set.\n");
    printf("  -b    Number of block offset bits.\n");
    printf("  -t   Trace file.\n");
    printf("\nExamples:\n");
    printf("  linux>  %s -s 4 -E 1 -b 4 -t traces/yi.trace\n", argv[0]);
    printf("  linux>  %s -v -s 8 -E 2 -b 4 -t traces/yi.trace\n", argv[0]);
    exit(0);
}

/*
 * main - Main routine 
 */
int main(int argc, char* argv[])
{
    char c;

    while( (c=getopt(argc,argv,"s:E:b:t:vh")) != -1){
        switch(c){
        case 's':
            s = atoi(optarg);
            break;
        case 'E':
            E = atoi(optarg);
            break;
        case 'b':
            b = atoi(optarg);
            break;
        case 't':
            trace_file = optarg;
            break;
        case 'v':
            verbosity = 1;
            break;
        case 'h':
            printUsage(argv);
            exit(0);
        default:
            printUsage(argv);
            exit(1);
        }
    }

    /* Make sure that all required command line args were specified */
    if (s == 0 || E == 0 || b == 0 || trace_file == NULL) {
        printf("%s: Missing required command line argument\n", argv[0]);
        printUsage(argv);
        exit(1);
    }

    /* Compute S, E and B from command line args */
    S = 1 << s;
    B = 1 << b;
    E = E; 
    /* Initialize cache */
    initCache();

#ifdef DEBUG_ON
    printf("DEBUG: S:%u E:%u B:%u trace:%s\n", S, E, B, trace_file);
    printf("DEBUG: set_index_mask: %llu\n", set_index_mask);
#endif
 
    replayTrace(trace_file);

    /* Free allocated memory */
    freeCache();

    /* Output the hit and miss statistics for the autograder */
    printSummary(hit_count, miss_count, eviction_count);
    return 0;
}

trans.c

/* 
 * trans.c - Matrix transpose B = A^T
 *
 * Each transpose function must have a prototype of the form:
 * void trans(int M, int N, int A[N][M], int B[M][N]);
 *
 * A transpose function is evaluated by counting the number of misses
 * on a 1KB direct mapped cache with a block size of 32 bytes.
 */ 
#include 
#include "cachelab.h"

int is_transpose(int M, int N, int A[N][M], int B[M][N]);

/* 
 * transpose_submit - This is the solution transpose function that you
 *     will be graded on for Part B of the assignment. Do not change
 *     the description string "Transpose submission", as the driver
 *     searches for that string to identify the transpose function to
 *     be graded. 
 */
char transpose_submit_desc[] = "Transpose submission";
void transpose_submit(int M, int N, int A[N][M], int B[M][N]) {
	int i, j, tmp0, tmp1, tmp2, tmp3, tmp4, tmp5, tmp6, tmp7, k, p, y;
	if(M == 32 && N == 32) {
		for(i = 0; i < N; i += 8){
			for(j = 0; j < M; j += 8){
				if(i == j){
					tmp0 = A[i][j];
					tmp1 = A[i][j + 1];
					tmp2 = A[i][j + 2];
					tmp3 = A[i][j + 3];
					tmp4 = A[i][j + 4];
					tmp5 = A[i][j + 5];
					tmp6 = A[i][j + 6];
					tmp7 = A[i][j + 7];
					B[i][j] = tmp0;
					B[i][j + 1] = tmp1;
					B[i][j + 2] = tmp2;
					B[i][j + 3] = tmp3;
					B[i][j + 4] = tmp4;
					B[i][j + 5] = tmp5;
					B[i][j + 6] = tmp6;
					B[i][j + 7] = tmp7;
					
					tmp0 = A[i + 1][j];
					tmp1 = A[i + 1][j + 1];
					tmp2 = A[i + 1][j + 2];
					tmp3 = A[i + 1][j + 3];
					tmp4 = A[i + 1][j + 4];
					tmp5 = A[i + 1][j + 5];
					tmp6 = A[i + 1][j + 6];
					tmp7 = A[i + 1][j + 7];
					B[i + 1][j] = B[i][j + 1];
					B[i][j + 1] = tmp0;
					B[i + 1][j + 1] = tmp1;
					B[i + 1][j + 2] = tmp2;
					B[i + 1][j + 3] = tmp3;
					B[i + 1][j + 4] = tmp4;
					B[i + 1][j + 5] = tmp5;
					B[i + 1][j + 6] = tmp6;
					B[i + 1][j + 7] = tmp7;
					
					tmp0 = A[i + 2][j];
					tmp1 = A[i + 2][j + 1];
					tmp2 = A[i + 2][j + 2];
					tmp3 = A[i + 2][j + 3];
					tmp4 = A[i + 2][j + 4];
					tmp5 = A[i + 2][j + 5];
					tmp6 = A[i + 2][j + 6];
					tmp7 = A[i + 2][j + 7];
					B[i + 2][j] = B[i][j + 2];
					B[i + 2][j + 1] = B[i + 1][j + 2];
					B[i][j + 2] = tmp0;
					B[i + 1][j + 2] = tmp1;
					B[i + 2][j + 2] = tmp2;
					B[i + 2][j + 3] = tmp3;
					B[i + 2][j + 4] = tmp4;
					B[i + 2][j + 5] = tmp5;
					B[i + 2][j + 6] = tmp6;
					B[i + 2][j + 7] = tmp7;
					
					tmp0 = A[i + 3][j];
					tmp1 = A[i + 3][j + 1];
					tmp2 = A[i + 3][j + 2];
					tmp3 = A[i + 3][j + 3];
					tmp4 = A[i + 3][j + 4];
					tmp5 = A[i + 3][j + 5];
					tmp6 = A[i + 3][j + 6];
					tmp7 = A[i + 3][j + 7];
 					B[i + 3][j] = B[i][j + 3];
					B[i + 3][j + 1] = B[i + 1][j + 3];
					B[i + 3][j + 2] = B[i + 2][j + 3];
					B[i][j + 3] = tmp0;
					B[i + 1][j + 3] = tmp1;
					B[i + 2][j + 3] = tmp2;
					B[i + 3][j + 3] = tmp3;
					B[i + 3][j + 4] = tmp4;
					B[i + 3][j + 5] = tmp5;
					B[i + 3][j + 6] = tmp6;
					B[i + 3][j + 7] = tmp7;
 
					tmp0 = A[i + 4][j];
					tmp1 = A[i + 4][j + 1];
					tmp2 = A[i + 4][j + 2];
					tmp3 = A[i + 4][j + 3];
					tmp4 = A[i + 4][j + 4];
					tmp5 = A[i + 4][j + 5];
					tmp6 = A[i + 4][j + 6];
					tmp7 = A[i + 4][j + 7];
					B[i + 4][j] = B[i][j + 4];
					B[i + 4][j + 1] = B[i + 1][j + 4];
					B[i + 4][j + 2] = B[i + 2][j + 4];
					B[i + 4][j + 3] = B[i + 3][j + 4];
					B[i][j + 4] = tmp0;
					B[i + 1][j + 4] = tmp1;
					B[i + 2][j + 4] = tmp2;
					B[i + 3][j + 4] = tmp3;
					B[i + 4][j + 4] = tmp4;
					B[i + 4][j + 5] = tmp5;
					B[i + 4][j + 6] = tmp6;
					B[i + 4][j + 7] = tmp7;
 
					tmp0 = A[i + 5][j];
					tmp1 = A[i + 5][j + 1];
					tmp2 = A[i + 5][j + 2];
					tmp3 = A[i + 5][j + 3];
					tmp4 = A[i + 5][j + 4];
					tmp5 = A[i + 5][j + 5];
					tmp6 = A[i + 5][j + 6];
					tmp7 = A[i + 5][j + 7];
					B[i + 5][j] = B[i][j + 5];
					B[i + 5][j + 1] = B[i + 1][j + 5];
					B[i + 5][j + 2] = B[i + 2][j + 5];
					B[i + 5][j + 3] = B[i + 3][j + 5];
					B[i + 5][j + 4] = B[i + 4][j + 5];
					B[i][j + 5] = tmp0;
					B[i + 1][j + 5] = tmp1;
					B[i + 2][j + 5] = tmp2;
					B[i + 3][j + 5] = tmp3;
					B[i + 4][j + 5] = tmp4;
					B[i + 5][j + 5] = tmp5;
					B[i + 5][j + 6] = tmp6;
					B[i + 5][j + 7] = tmp7;
 
					tmp0 = A[i + 6][j];
					tmp1 = A[i + 6][j + 1];
					tmp2 = A[i + 6][j + 2];
					tmp3 = A[i + 6][j + 3];
					tmp4 = A[i + 6][j + 4];
					tmp5 = A[i + 6][j + 5];
					tmp6 = A[i + 6][j + 6];
					tmp7 = A[i + 6][j + 7];
					B[i + 6][j] = B[i][j + 6];
					B[i + 6][j + 1] = B[i + 1][j + 6];
					B[i + 6][j + 2] = B[i + 2][j + 6];
					B[i + 6][j + 3] = B[i + 3][j + 6];
					B[i + 6][j + 4] = B[i + 4][j + 6];
					B[i + 6][j + 5] = B[i + 5][j + 6];
					B[i][j + 6] = tmp0;
					B[i + 1][j + 6] = tmp1;
					B[i + 2][j + 6] = tmp2;
					B[i + 3][j + 6] = tmp3;
					B[i + 4][j + 6] = tmp4;
					B[i + 5][j + 6] = tmp5;
					B[i + 6][j + 6] = tmp6;
					B[i + 6][j + 7] = tmp7;
 
					tmp0 = A[i + 7][j];
					tmp1 = A[i + 7][j + 1];
					tmp2 = A[i + 7][j + 2];
					tmp3 = A[i + 7][j + 3];
					tmp4 = A[i + 7][j + 4];
					tmp5 = A[i + 7][j + 5];
					tmp6 = A[i + 7][j + 6];
					tmp7 = A[i + 7][j + 7];
					B[i + 7][j] = B[i][j + 7];
					B[i + 7][j + 1] = B[i + 1][j + 7];
					B[i + 7][j + 2] = B[i + 2][j + 7];
					B[i + 7][j + 3] = B[i + 3][j + 7];
					B[i + 7][j + 4] = B[i + 4][j + 7];
					B[i + 7][j + 5] = B[i + 5][j + 7];
					B[i + 7][j + 6] = B[i + 6][j + 7];
					B[i][j + 7] = tmp0;
					B[i + 1][j + 7] = tmp1;
					B[i + 2][j + 7] = tmp2;
					B[i + 3][j + 7] = tmp3;
					B[i + 4][j + 7] = tmp4;
					B[i + 5][j + 7] = tmp5;
					B[i + 6][j + 7] = tmp6;
					B[i + 7][j + 7] = tmp7;
				}
				else {
					for(k = i; k < i + 8; ++k) {
						for(y = j; y < j + 8; ++y){
							B[y][k] = A[k][y];
						}
					}
				}
			}
		}
	}
	else if(M == 64 && N == 64) {
		for(i = 0; i < N; i += 8) {
            		for(j = 0; j < M;j += 8) {
                		for(k = i; k < i + 4; ++k) {
                    			tmp0 = A[k][j];
                    			tmp1 = A[k][j + 1];
                    			tmp2 = A[k][j + 2];
                    			tmp3 = A[k][j + 3];
                    			tmp4 = A[k][j + 4];
                    			tmp5 = A[k][j + 5];
                   				tmp6 = A[k][j + 6];
                    			tmp7 = A[k][j + 7];
                    			B[j][k] = tmp0;
                    			B[j + 1][k] = tmp1;
                    			B[j + 2][k] = tmp2;
                    			B[j + 3][k]=tmp3;
                    			B[j][k + 4]=tmp4;
                    			B[j + 1][k + 4]=tmp5;
                    			B[j + 2][k + 4]=tmp6;
                    			B[j + 3][k + 4]=tmp7;
                		}
                		for(p = j; p < j + 4; ++p) {
                    			tmp0 = A[i + 4][p];
                    			tmp1 = A[i + 5][p];
                    			tmp2 = A[i + 6][p];
                    			tmp3 = A[i + 7][p];
                    			tmp4 = B[p][i + 4];
                    			tmp5 = B[p][i + 5];
                    			tmp6 = B[p][i + 6];
                    			tmp7 = B[p][i + 7];
                    			B[p][i + 4] = tmp0;
                    			B[p][i + 5] = tmp1;
                    			B[p][i + 6] = tmp2;
                    			B[p][i + 7] = tmp3;
                    			B[p + 4][i] = tmp4;
                    			B[p + 4][i + 1] = tmp5;
                    			B[p + 4][i + 2] = tmp6;
                    			B[p + 4][i + 3] = tmp7;
                		}
                		for(k = i + 4; k < i + 8 ; ++k) {
                    			tmp0 = A[k][j + 4];
                    			tmp1 = A[k][j + 5];
                    			tmp2 = A[k][j + 6];
                    			tmp3 = A[k][j + 7];
                    			B[j + 4][k] = tmp0;
                    			B[j + 5][k] = tmp1;
                    			B[j + 6][k] = tmp2;
                    			B[j + 7][k] = tmp3;
                		}
			}
		}
	}
	else if(M == 61 && N == 67) {
		for(i = 0; i < N;i += 17) {
            		for(j = 0; j < M; j += 17) {
               			for(k = i; k < i + 17 && k < N; ++k) {
                    			for(p = j; p < j + 17 && p < M; ++p) {
                        			tmp0 = A[k][p];
                       				B[p][k] = tmp0;
                    			}
                		}
            		}
        	}
	}
}

/* 
 * You can define additional transpose functions below. We've defined
 * a simple one below to help you get started. 
 */ 

/* 
 * trans - A simple baseline transpose function, not optimized for the cache.
 */
char trans_desc[] = "Simple row-wise scan transpose";
void trans(int M, int N, int A[N][M], int B[M][N])
{
    int i, j, tmp;

    for (i = 0; i < N; i++) {
        for (j = 0; j < M; j++) {
            tmp = A[i][j];
            B[j][i] = tmp;
        }
    }    

}

/*
 * registerFunctions - This function registers your transpose
 *     functions with the driver.  At runtime, the driver will
 *     evaluate each of the registered functions and summarize their
 *     performance. This is a handy way to experiment with different
 *     transpose strategies.
 */
void registerFunctions()
{
    /* Register your solution function */
    registerTransFunction(transpose_submit, transpose_submit_desc); 

    /* Register any additional transpose functions */
    registerTransFunction(trans, trans_desc); 

}

/* 
 * is_transpose - This helper function checks if B is the transpose of
 *     A. You can check the correctness of your transpose by calling
 *     it before returning from the transpose function.
 */
int is_transpose(int M, int N, int A[N][M], int B[M][N])
{
    int i, j;

    for (i = 0; i < N; i++) {
        for (j = 0; j < M; ++j) {
            if (A[i][j] != B[j][i]) {
                return 0;
            }
        }
    }
    return 1;
}

你可能感兴趣的:(HIT,CSAPP,Lab)

有必要获得WHQL测试认证吗，有什么好处？
什么是WHQL认证？WHQL是MicrosoftWindowsHardwareQualityLab的缩写，中文意思是Windows硬件设备质量实验室，主要是对Windows操作系统的兼容性测试，检验硬件产品和驱动程序在windows系统下的兼容性和稳定性。当某一硬件或软件通过WHQL测试时，制造商可以在其产品包装和广告上使用“DesignedforWindows”标志。该标志可以证明硬件或软件已经
驱动程序为什么要做 WHQL 认证? GDCA SSL证书网络协议网络
驱动程序进行WHQL（WindowsHardwareQualityLabs）认证的核心价值在于解决兼容性、安全性和市场准入三大关键问题，具体必要性如下：️‌一、规避系统拦截，保障驱动可用性‌消除安装警告‌未认证的驱动在安装时会触发Windows的‌红色安全警告‌（如“无法验证发布者”），甚至被系统强制拦截。通过WHQL认证的驱动获得微软数字签名，用户可无阻安装‌。满足系统强制要求‌Windows1
WHQL签名怎么申请 GDCA SSL证书 windows
WHQL（WindowsHardwareQualityLabs）签名是微软对硬件和驱动程序进行认证的一种方式，以确保它们与Windows操作系统的兼容性和稳定性。以下是申请WHQL签名的基本步骤，供您参考：1.准备阶段准备硬件设备和驱动程序：确保您的硬件设备已经准备好，并且对应的驱动程序已经经过充分的测试，能够在各种配置和环境下正常工作。获取EV代码签名证书：根据微软的要求，驱动程序进行WHQL认
基于架构的软件设计（Architecture-Based Software Design，ABSD）是一种以架构为核心的软件开发方法
ABSD方法与生命周期基于架构的软件设计（Architecture-BasedSoftwareDesign，ABSD）是一种以架构为核心的软件开发方法，强调在开发的各个阶段都要以架构为中心，确保系统的整体结构和质量属性得到有效管理。ABSD方法是一个自顶向下、递归细化的过程，软件系统的架构通过该方法得到细化，直到能产生软件构件和类。ABSD方法的三个基础功能的分解：使用基于模块的内聚和耦合技术，将
【目标检测】机场内部目标检测数据集4106张YOLO+VOC格式
数据集格式：VOC格式+YOLO格式压缩包内含：3个文件夹，分别存储图片、xml、txt文件JPEGImages文件夹中jpg图片总计：4106Annotations文件夹中xml文件总计：4106labels文件夹中txt文件总计：4106标签种类数：7标签名称:["Ground_vehicles","Horizontal_sign","Runaway_limit","Taxiway","Ver
matlab卷积矩阵绝对值,MATLAB矩阵分析和计算 weixin_39928736 matlab卷积矩阵绝对值
MATLAB矩阵分析和计算编辑锁定讨论上传视频本词条缺少概述图，补充相关内容使词条更完整，还能快速升级，赶紧来编辑吧！《MATLAB矩阵分析和计算》是清华大学出版社出版的一本图书。[1]书名MATLAB矩阵分析和计算作者杜树春出版社清华大学出版社出版时间2019年6月1日定价59元ISBN9787302524816印次1-1印刷日期2019.04.23MATLAB矩阵分析和计算图书内容编辑本书侧重
OkHttp3源码解析--设计模式，android开发实习面试题
this.cache=builder.cache;}//构造者publicstaticfinalclassBuilder{Cachecache;…//构造cache属性值publicBuildercache(@NullableCachecache){this.cache=cache;returnthis;}//在build方法中真正创建OkHttpClient对象，并传入前面构造的属性值publi
Flutter基础（前端教程⑥-按钮切换） aaiier Flutter flutter 前端状态模式
1.假设你已有的两个表单组件（示例）//手机号注册表单（示例）classPhoneRegisterFormextendsStatelessWidget{@overrideWidgetbuild(BuildContextcontext){returnColumn(children:[TextField(decoration:InputDecoration(labelText:'手机号')),Text
卫星分析系列之使用卫星图像量化野火烧毁面积在 Google Colab 中使用 Python 使用 Sentinel-2 图像确定森林火灾烧毁面积知识大胖 NVIDIA GPU和大语言模型开发教程 python sentinel 开发语言
简介几年前，当大多数气候模型预测如果我们不采取必要措施，洪水、热浪和野火将会发生更多时，我没想到这些不寻常的灾难现象会成为常见事件。其中，野火每年摧毁大量森林面积。如果你搜索不同地方的重大野火表格，你会发现令人震惊的统计数据，显示由于野火，地球上有多少森林面积正在消失。在本教程中，我将结合我已经发表过的关于下载、处理卫星图像和可视化野火的故事，量化加州发生的其中一场重大野火的烧毁面积。与之前的帖子
php中调用对象的方法可以使用array($object, ‘methodName‘)？ IT 老王 php android 开发语言
是的，在PHP中，array($object,'methodName')是一种标准的回调语法，用于表示“调用某个对象的特定方法”。这种语法可以被许多函数（如call_user_func()、call_user_func_array()、usort()等）识别并执行。语法原理在PHP中，可调用对象（callable）有多种形式，其中之一是[对象实例,方法名]数组：第一个元素：对象实例（必须是已实例化
CS144 lab2 tcp_receiver
1.实验目的lab2的目的是实现tcp的接收端。主要包括两方面（1）从发送端接收消息，使用Reassembler聚合字节流（Bytestream）（2）将确认号（ackno）和windowsize发回对端确认号，也就是first_unassemblerbyte;而Bytestream可写入的大小，也就是windowsize!ackno和windowsize两个共同描述了发送方能发送的数据范围。有时
将多个小型YOLO数据集合并为一个大型数据集梦实学习室 YOLO python YOLO python 机器学习
一、将多个小型YOLO数据集合并为一个大型数据集importosimportshutilimportargparsedefmerge_data(source_dir,target_dir,images_dir,labels_dir):images_target=os.path.join(target_dir,images_dir)labels_target=os.path.join(target_
mit6.s081lab
临近毕业季，回想自己本科四年学到了哪些东西，想到自己专业课都是为了卷绩点、应付考试，去背书、被概念，并没有十分深刻的理解和动手实践。现在想重新温习一下这部分知识，同时也加深一下对这部分内容的动手实践。那么就从大名鼎鼎的os课6.s081开始吧~~~lab1：Unixutilitieslab2：Systemcalls
【医学影像】无痛安装mamba 周树皮医学影像 python
去年编辑的一个帖子。摆了一段时间后重新回归，发送一下作为状态分界线。很癫狂的体验，man，whatcanisay！issue查看我的狗急跳墙状态1.确定版本cudanvcc-Vpythonpython--versiontorchpipshowtorch2.下载对应版本wheelcausal-conv1d：https://github.com/Dao-AILab/causal-conv1d/rele
Matlab裁剪降水数据：1km掩膜制作实战咋（za）说 matlab 降水数据处理裁剪掩膜制作降水数据裁剪 China_Pre
1km降水数据处理-制作数据裁剪掩膜1.数据概述2掩膜文件制作示例2.1数据准备2.2matlab掩膜制作示例代码3结语中国1km分辨率逐月降水量数据集（1901-2024）是高精度、长时间序列的气候数据产品，广泛应用于水文、生态、农业等领域的研究。本篇基于应用需要，以该数据集为输入，结合研究区shp边界文件，制作用于数据提取/裁剪的掩膜文件。下面为具体内容。1.数据概述中国1km分辨率逐
vue如何实现Cascader 级联选择器(二级全部选中只展示一级，三级全部选中只展示二级) 小周同学: vue vue.js
select提交重置级联exportdefault{data(){return{ruleForm:{selectLabel:[],idList:[],},citiesList:[],rules:{selectLabel:[{type:'array',required:true,message:'多选不能为空',trigger:'change'}],},props:{multiple:true,va
多线程学习
文章目录程序、进程、线程线程的创建和使用继承Thread类实现Runnable接口比较创建线程的两种方式Thread类的有关方法线程的优先级获取和设置当前线程的优先级说明线程的生命周期线程的同步Synchronized的使用方法同步机制中的锁释放锁的操作线程的死锁问题synchronized与Lock的异同线程的通信JDK5.0新增线程创建方式创建线程的方式三:实现Callable接口创建线程的方
MATLAB实现快速非局部均值图像去噪方法一只爪子
本文还有配套的精品资源，点击获取简介：非局部均值滤波是一种先进的图像去噪技术，与传统方法相比，它利用图像的全局信息来去除噪声，同时保持图像细节。该算法通过搜索和利用整个图像中相似的像素块，对每个像素点进行去噪处理。本文提供的MATLAB代码FAST_NLM_II.m实现此算法，并包含必要的参数设置、相似性计算、加权平均和图像更新步骤。了解并应用此代码是学习和进一步改进非局部均值滤波技术的基础。1.
python把竖着的变成横着的数_python – Reportlab：如何切换纵向和横向？ weixin_39524703
我正在使用reportlab从动态数据自动生成pdf报告.由于内容有时太大,无法以纵向显示,所以我正在为大量内容切换到景观.以下是我的报告生成工作原理：主功能：doc=DocTemplate(...)//DoctemplateisacustomedBaseDocTemplateclassarray=[]some_data="Hereissomedatadisplayedinportrait"arr
使用tensorflow的多项式回归的例子（二） lishaoan77 tensorflow tensorflow 回归人工智能多项式回归
例2importtensorflowastfimportnumpyasnpimportmatplotlib.pyplotaspltplt.style.use('default')#importtensorflow.contrib.eagerastfe#fromgoogle.colabimportfiles#tf.enable_eager_execution()x=np.arange(0,5,0.1
ARM 和 x86_64是什么关系 riverz1227 linux
什么是ARM和x86_64？它们都是CPU指令集架构（ISA）指令集架构（InstructionSetArchitecture）就是：CPU能够理解和执行的“语言”和“命令格式”。类比解释：指令集就像“语言”类比对象ARMCPUx86_64CPU（Intel/AMD）语言西班牙语英语编译器翻译成西班牙语的代码翻译成英语的代码执行者会西班牙语的CPU会英语的CPUARM架构是一种低功耗、高能效的CP
IP与“谷子”齐飞，阅文“乘势而上”？
爆火的“谷子经济”，又捧出一只“潜力股”。近日，阅文集团股价持续上涨，5日累计涨幅达13.20%。这其中，周三股价一度大涨约15%至29.15港元，强势突破20日、30日、120日等多根均线，市值突破280亿港元关口。股价持续大涨的背后，阅文集团领投卡牌潮流文化品牌Hitcard发出来新的信号。显然，这是“阅文好物”商业化提速的一次关键布局。预计阅文好物后续将与Hitcard拓展IP商业化合作范围
[QT] QPushButton常用样式表设置
QPushButton:PushBtn->setStyleSheet(“QPushButton{border-style:none;background-color:rgb(67,138,232)}”“QPushButton:hover{background-color:red;color:white;}”“QPushButton:pressed{background-color:rgba(85,
matlab画信号图方法,献给初学者：手把手教你绘制信号通路图
信号通路是指能将细胞外的分子信号经细胞膜传入细胞内发挥效应的一系列酶促反应通路。细胞信号通路图是科研研究过程中最常见也是最常用到的，如何绘制适合我们自己科研课题的信号通路图呢？可以试试pathwaybuildertool软件。这款软件简单易学，即便是零基础的同学，也可以做出漂亮的信号通路。1.首先，打开PathwayBuilderTool2.0软件，软件自带分子生物学会用到的基本元素，如不同的细胞
JAVA打断点技巧 weixin_43783165 java
以下是Java开发中高效使用断点的核心技巧，结合调试场景分类整理，帮助开发者精准定位问题：一、断点类型与适用场景行断点（最常用）用法：在代码行号左侧双击（IDE通用）。场景：暂停在特定代码行，检查变量状态或执行流程。技巧：结合命中次数（HitCount）：循环中设置i==N，仅在第N次循环时暂停。临时禁用断点：避免频繁暂停，右键断点取消勾选"Enabled"。方法断点（接口/实现类调试）用法：在方
【论文复现】Taylor算法用于TOA（到达时间）的三维标签位置解算，360个标签、12个基站的环境作为验证，附MATLAB例程 MATLAB卡尔曼论文复现算法 matlab 开发语言
本文给出论文《基于Taylor-Chan算法的改进UWB室内三维定位方法》中的Taylor算法来解算TOA的复现程序（MATLAB）。使用论文中给定的12个锚点/360个测试的标签用来测试算法性能文章目录运行结果程序介绍核心功能概述结果输出应用场景MATLAB源代码运行结果误差输出：程序介绍本程序基于Taylor迭代算法，实现了对三维空间内360个目标点的TOA（TimeofArrival）定位解
2025秋招优秀项目推荐微凉的衣柜人工智能深度学习算法 gpt
01.多个优异的数据结构与算法项目推荐良心推荐hello-algo包含多个通用的代码框架，一个框架完成多道题目，更详细请查阅labuladong02.大模型岗位面试总结：共24家，9个offer大模型岗位面试总结：共24家，9个offer03.视觉检测分割一切源码及在线DemoGrounded-Segment-Anything项目源码
matlab计算转子系统的固有频率、振型、不平衡响应
可以计算转子系统的固有频率、振型、不平衡响应MatrixRiccati/code/Dichotomy_1(2).m,2210MatrixRiccati/code/Dichotomy_1.m,2210MatrixRiccati/code/RiccatiSY_1.m,2756MatrixRiccati/code/Trans1x(2).m,451MatrixRiccati/code/Trans1x.m,
基于MATLAB的语音信号预处理
3.1.语音信号的预加重处理对语音的的高频部分进行加重以去除口唇部分的影响，就必须要对输入的数字语音信号进行预加重处理，以此来增加语音的高频分辨率。通常通过传递函数为的一阶FIR高通数字滤波器来实现预加重，其中为预加重系数，0.9<<1.0。设n时刻的语音采样值为X(n),经过预加重处理的结果为，这里取=0.98。图3.1为该高通滤波器的幅频特性及相频特性。图3.2中分别给出了预加重前和预加重后的
GIT漏洞详解
Git漏洞主要分为两类：Git软件本身的安全漏洞和因配置不当导致的Git仓库泄露。以下是详细解析及防御方案：一、Git软件自身漏洞（CVE漏洞）Git客户端或服务端（如GitLab、GitHub）的代码缺陷可能被利用，导致远程代码执行（RCE）、权限提升等风险。典型案例CVE-2018-11235漏洞类型：远程代码执行（RCE）。触发条件：攻击者构造恶意Git子模块名称，当受害者执行gitclon
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam

HIT CSAPP LAB6

Cachelab

高速缓冲器模拟

目录

第1章实验基本信息 - 3 -

第2章实验预习 - 4 -

第3章 CACHE模拟与测试 - 8 -

第4章总结 - 21 -

参考文献 - 22 -

第1章实验基本信息

1.1 实验目的

1.2 实验环境与工具

1.2.1 硬件环境

1.2.2 软件环境

1.2.3 开发工具

1.3 实验预习

第2章实验预习

2.1 画出存储器层级结构，标识容量价格速度等指标变化（5分）

2.2用CPUZ等查看你的计算机Cache各参数，写出各级Cache的C S E B s e b（5分）

2.3写出各类Cache的读策略与写策略（5分）

2.4 写出用gprof进行性能分析的方法（5分）

2.5写出用Valgrind进行性能分析的方法（5分)

第3章 Cache模拟与测试

3.1 Cache模拟器设计

程序设计思想：

3.2 矩阵转置设计

程序设计思想：

以下是程序相应代码

csim.c

trans.c

你可能感兴趣的:(HIT,CSAPP,Lab)

HIT CSAPP LAB6

Cachelab

高速缓冲器模拟

目 录

第1章 实验基本信息 - 3 -

第2章 实验预习 - 4 -

第3章 CACHE模拟与测试 - 8 -

第4章 总结 - 21 -

参考文献 - 22 -

第1章 实验基本信息

1.1 实验目的

1.2 实验环境与工具

1.2.1 硬件环境

1.2.2 软件环境

1.2.3 开发工具

1.3 实验预习

第2章 实验预习

2.1 画出存储器层级结构，标识容量价格速度等指标变化（5分）

2.2用CPUZ等查看你的计算机Cache各参数，写出各级Cache的C S E B s e b（5分）

2.3写出各类Cache的读策略与写策略（5分）

2.4 写出用gprof进行性能分析的方法（5分）

2.5写出用Valgrind进行性能分析的方法（5分)

第3章 Cache模拟与测试

3.1 Cache模拟器设计

程序设计思想：

3.2 矩阵转置设计

程序设计思想：

以下是程序相应代码

csim.c

trans.c

你可能感兴趣的:(HIT,CSAPP,Lab)

目录

第1章实验基本信息 - 3 -

第2章实验预习 - 4 -

第4章总结 - 21 -

第1章实验基本信息

第2章实验预习