Lab3

目录:

文章目录

      • 目录:
      • 任务:
        • 任务1:
        • 1.cache结构体:
        • 2.init_cache()函数:
        • 3.uint32_t cache_read(uintptr_t addr)函数:
        • 4. cache_write(uintptr_t addr, uint32_t data, uint32_t wmask) 函数:
      • 思考题:
        • 1.数据对齐和存储层次结构:
      • 遇到的问题:
          • 1.写回的时候误用了新的cache行的主存块号:
          • 2.随即替换时写的顺序错了:
          • 3.数据区的大小设置:
      • 实验心得:
          • 2.随即替换时写的顺序错了:
          • 3.数据区的大小设置:
      • 实验心得:


任务:

任务1:

cache.c 中实现如下函数:

1.cache结构体:

1.根据读的要求设置了tag , valid_bit , dirty_bit; 根据回的要求设置了dirty_bit。

2.根据主存地址划分:

  • cache有16KB(2^14) , 主存大小有32KB(2^15) ,块大小有2^6 bit , 且是按四路组相联来处理的;
  • 那么块内偏移为6位 ,cache行号有2^8行(因为14 - 6 = 8,cache容量处以每个块的大小)。
  • 因为是四路组相联,所以cache组数等于cache行号处以每组的行数(4),即2(8-2)=26;
  • 那么现在主存地址有15位:tag = 15 -块内偏移长度(6) - cache组号(6)= 3。
typedef struct
{
	bool dirty_bit:1;	//脏位
	bool data[64];		//数据位:每块大小为2^6,即64字节
	uint32_t tag:3;		//标记
	bool valid_bit:1;	//有效位
}cache_line;

cache_line *Cache;

2.init_cache()函数:

  • 很简单,就是算出cache的总行数;
  • 遍历所有的cache行,将每个cache行的有效位和脏位置0;
void init_cache(int total_size_width, int associativity_width) {
	int i;
	int cache_line_num = exp2(total_size_width - associativity_width);
	Cache = malloc(cache_line_num * sizeof(cache_line ));
	for(i = 0 ; i < cache_line_num ; i++)
	{
		Cache[i].valid_bit = 0;
		Cache[i].dirty_bit = 0;		
	} 
}

3.uint32_t cache_read(uintptr_t addr)函数:

1.总思路:

分为三个部分:主存地址进来

若命中:

(1)按主存地址先访问cache,如果命中,返回数据;

若不命中:

(2)在cache中找空闲行,即判断valid_bit是否为0,如果为0,则将此cache行作为新的读入的数据存放的地方;

(3)如果该cache组是全部满的,即所有的valid_bit为1,那么随便取一行,此时先判断脏位是否为1,为1的话就将当前的cache行先写回主存,再则将此cache行作为新的读入的数据存放的地方;

2.分情况说明:

uint32_t cache_read(uintptr_t addr) {
	try_increase(1);	//访问cache次数加一
	uint32_t ret_data;
	addr = addr & 0x7FFF;		//主存地址划分
	uint32_t  mem_blocks_num , mem_tag , cache_group_num , block_offset;	
	block_offset = addr & 0x3C;
	cache_group_num = (addr >> 6) & 0x3F;
	mem_tag = (addr >> 12) & 0x7;
	mem_blocks_num = (addr >> 6) & 0x1FF;

	uint32_t paddr;
	int i , j , flag;
	int cache_group_start = cache_group_num * 4;	//情况一:在当前cache中查找
	for(i = cache_group_start ; i < cache_group_start + 4 ; i++)
	{
		if(Cache[i].tag == mem_tag && Cache[i].valid_bit == 1)
		{
			hit_increase(1);
			break;
		}
	}
	if(i < cache_group_start + 4)	//如果命中
	{
		ret_data = Cache[i].data[block_offset] + (Cache[i].data[block_offset + 1] << 8) + (Cache[i].data[block_offset + 2] << 16) + (Cache[i].data[block_offset + 3] << 24);//将该数据返回
	}
	else		//如果不命中,则分为寻找空闲行和随即替换两种情况
	{
		for(j = cache_group_start ; j < cache_group_start + 4 ; j++)//寻找空闲行
		{
			if(Cache[j].valid_bit == 0)
				break;
		}
		if(j < cache_group_start + 4 )	//情况二,不命中但找到空闲行
		{
			mem_read(mem_blocks_num , Cache[j].data);//先将数据读入
			Cache[j].tag = mem_tag;
			Cache[j].valid_bit = 1;
			ret_data = Cache[j].data[block_offset] + (Cache[j].data[block_offset + 1] << 8) + (Cache[j].data[block_offset + 2] << 16) + (Cache[j].data[block_offset + 3] << 24);		
		}
		else	//情况三:不命中且此组cache行全满,考虑随机替换
		{
			flag = rand()%4 + cache_group_start;	//mod4找到一个0~3的任意数
			if(Cache[flag].dirty_bit == 1)		//若脏位为1,先写回
			{
				paddr = ( Cache[flag].tag << 6 ) | cache_group_num ;
				mem_write(paddr , Cache[flag].data);
			}
			mem_read(mem_blocks_num , Cache[flag].data);	//读入主存块
			Cache[flag].tag = mem_tag;
			Cache[flag].valid_bit = 1;
		ret_data = Cache[flag].data[block_offset] + (Cache[flag].data[block_offset + 1] << 8) + (Cache[flag].data[block_offset + 2] << 16) + (Cache[flag].data[block_offset + 3] << 24);	
		}
	}
	return ret_data;
}

4. cache_write(uintptr_t addr, uint32_t data, uint32_t wmask) 函数:

1.总思路:

分为三个部分:主存地址进来,和读的函数是一样的。

若命中:

(1)按主存地址先访问cache,如果命中,则将掩码对应的偏移处的值修改;

若不命中:

(2)在cache中找空闲行,即判断valid_bit是否为0,如果为0,则将此cache行作为新的读入数据的地方,并将掩码对应的偏移处的值修改;

(3)如果该cache组是全部满的,即所有的valid_bit为1,那么随便取一行,此时先判断脏位是否为1,为1的话就将当前的cache行先写回主存,再则将此cache行作为新的读入的数据存放的地方 , 并将掩码对应的偏移处的值修改;

2.分情况说明:

这里调用到了一个cache_alter()函数,作用是设置掩码对应的偏移处的值修改:

  • 在这里说明一下,因为那个mem_read()和mem_write()函数的第二个参数,即数据区的参数都是uint8_t的,所有设置数据区的时候都是按一个一个字节来存,但这样就造成了很不方便的地方,每次将数据返回时要把四个字节拼在一起,每次写完了之后还要将每个字节分散开写回到cache的数据区,真的很不方便。

  • 在对比uncache_read的时候那个*p来了这么一个秒操作,( Data & (~wmask) ) | (data &wmask)这个也是仿照着它写的,就是掩码的地方修改,其它非掩码的字节不变。原来还傻傻地把掩码分情况讨论了。

  • 最后改完之后,再分散到cache数据区的每个字节。

void cache_alter(int i , uint32_t block_offset , uint32_t wmask , uint32_t data)
{	//写cache行操作
	uint32_t Data;
	Data = Cache[i].data[block_offset] + (Cache[i].data[block_offset + 1] << 8) + (Cache[i].data[block_offset + 2] << 16) + (Cache[i].data[block_offset + 3] << 24); 
	Data = ( Data & (~wmask) ) | (data &wmask);
	Cache[i].data[block_offset+3] = (Data>>24) & 0xff;
	Cache[i].data[block_offset+2] = (Data>>16) & 0xff;
	Cache[i].data[block_offset+1] = (Data>>8) & 0xff;
	Cache[i].data[block_offset] = Data & 0xff;
}

void cache_write(uintptr_t addr, uint32_t data, uint32_t wmask) {
	try_increase(1);
	addr = addr & 0x7FFF;		//划分主存地址
	uint32_t mem_blocks_num , mem_tag , cache_group_num , block_offset;
	block_offset = addr & 0x3C;			
	cache_group_num = (addr >> 6) & 0x3F;
	mem_tag = (addr >> 12) & 0x7;
    mem_blocks_num = (addr >> 6) & 0x1FF;

	uint32_t paddr;

	int i , j ,flag;
	int cache_group_start = cache_group_num * 4;//第一种情况:在cache中寻找
	for(i = cache_group_start ; i < cache_group_start + 4; i++)
	{
		if(Cache[i].tag == mem_tag && Cache[i].valid_bit == 1)	
		{
			hit_increase(1);
			break;
		}
	}
	if(i < cache_group_start + 4)		//如果写命中
	{
		cache_alter(i , block_offset , wmask ,data);	//修改cache行的对应块内偏移的数据
		Cache[i].dirty_bit = 1;
	}
	else	//如果写不命中
	{
		for(j = cache_group_start ; j < cache_group_start + 4 ; j++)//找空闲行
		{
			if(Cache[j].valid_bit == 0)
				break;
		}
		if(j < cache_group_start + 4)  //如果有空闲行
		{
			mem_read(mem_blocks_num , Cache[j].data);//先读入一块新的主存块
			cache_alter(j , block_offset , wmask , data);//修改cache行的对应块内偏移的数据
			Cache[j].tag = mem_tag;	//设置标志位和其它
			Cache[j].valid_bit = 1;
			Cache[j].dirty_bit = 1;
		}
		else	//如果没有空闲行,则采用随机替换
		{
			flag = rand()%4 + cache_group_start;
			if(Cache[flag].dirty_bit == 1)	//如果脏位为1,需先写回主存
			{
				paddr = (Cache[flag].tag << 6 ) | cache_group_num;//拼接写回主存的主存块号
				mem_write(paddr , Cache[flag].data);//写回对应的主存块
			}
			mem_read(mem_blocks_num , Cache[flag].data);		//先读入新的主存块
			cache_alter(flag , block_offset , wmask , data);//修改cache行的对应块内偏移的数据
			Cache[flag].tag = mem_tag;//设置标志位和其它
			Cache[flag].valid_bit = 1;
			Cache[flag].dirty_bit = 1;
		}
	}
}

截图:
Lab3_第1张图片

思考题:

1.数据对齐和存储层次结构:

想一想, 为什么编译器为变量分配存储空间的时候一般都会对齐? 访问一个没有对齐的存储空间会经历怎么样的过
程?

因为对齐的话更有利于访存的进行;比如int类型的数是按四字节对齐的,如果没有对齐,它是紧凑排列的话每次访存都要从头开始一个一个依次查询,时间消耗变大。就好像链表和数组,链表是没有对齐的,每次访存都要从链表头开始;而数组只要知道它的首地址和访存第几个,就可以计算出访存地址。

遇到的问题:

这可太多了:

1.写回的时候误用了新的cache行的主存块号:

这是有点隐晦的错误了,就是在写了之后就会给报错,在随机替换的时候错了,那这就是写回的时候有问题,写错地方了,改了之后就是把旧的主存块号拼出来,用它。

2.随即替换时写的顺序错了:

原来被绕进去了,是应该先写回主存块呢,还是先写进cache行,再写回主存块呢?为什么会这样,那原来那块如果改过怎么办?于是明白了应该先写回再装入新的。

3.数据区的大小设置:

这就太坑了,因为mem_read和write函数入口参数类型的误导,致使我们做了很多单字节转四字节和四字节转单字节的操作,好烦心好累,明明可以强制类型转化,最后才发现。

实验心得:

这就是写回的时候有问题,写错地方了,改了之后就是把旧的主存块号拼出来,用它。

2.随即替换时写的顺序错了:

原来被绕进去了,是应该先写回主存块呢,还是先写进cache行,再写回主存块呢?为什么会这样,那原来那块如果改过怎么办?于是明白了应该先写回再装入新的。

3.数据区的大小设置:

这就太坑了,因为mem_read和write函数入口参数类型的误导,致使我们做了很多单字节转四字节和四字节转单字节的操作,好烦心好累,明明可以强制类型转化,最后才发现。

实验心得:

爽。

你可能感兴趣的:(实验,文件)