DenzilXu

Ext2文件系统—文件读写

1、定义

只有在“打开”了文件以后，或者说建立了进程与文件的“连接”之后，才能对文件进行读写。为了提高效率，Linux的读写操作都是带缓冲的，即写的时候先写到缓冲副本中，读的时候也从缓冲副本中读入。在多进程的系统中，由于同一文件可为多个进程共享，缓冲的作用就更加显著。

Linux文件缓冲设置在文件层的inode结构中。它里面有一个指针i_mapping，它指向一个address_space数据结构（通常这个结构就是inode中的i_data），缓冲区队列就在这个数据结构中。不过，挂载缓冲区队列中的并不是记录块（逻辑磁盘块）而是内存页面。也就是说，文件的内容并不是以逻辑磁盘块为单位而是以页面为单位进行缓冲的。如果一个记录块的大小为1K字节，那么一个页面就相当于4个逻辑磁盘块（记录块）。至于为什么这么做，是为了把文件内容的缓冲与文件的内存映射结合在一起（这也是为什么取名叫i_mapping、address_space，详细参考情景分析P580）。

在文件层是以页面为单位缓冲，但在设备层则是以逻辑磁盘块为单位缓冲。在一个记录块的缓冲区头部即buffer_head结构中有一个指针b_data指向记录块缓冲区，而buffer_head结构本身则不在缓冲区中。

以一个缓冲页面为例，在文件层它通过一个page数据结构挂入所属inode结构的缓冲页面队列，并且同时又可以通过各个进程的页面映射表映射到这些进程的内存空间；而在设备层则有通过若干buffer_head结构挂入其所在设备的缓冲区队列。

数据缓冲区的大小等于逻辑磁盘块（记录块）的大小，为物理磁盘块（扇区）大小的整数倍；同时内存页（文件层缓冲页page）的大小又为逻辑磁盘块的整数倍。在从磁盘读取数据时，文件系统一次读取若干个磁盘扇区大小的数据存放在记录块中，若干个记录块再组成一个内存页。如下图所示：

上面这些都是为了讲明白内存页page与逻辑磁盘块在文件系统所处的位置以及它们之间的关系（因此说到文件缓冲，要分清楚是文件层的缓冲页page还是设备层的逻辑磁盘块缓冲区buffer_head）。缓冲页面page结构除链入附属于inode结构的缓冲页面队列外，同时也链入到一个杂凑表page_hash_table中的杂凑队列中，所以寻找目标页面的的操作也是很高效的。

除了通过缓冲来提高文件读写效率外，还有个措施是“预读”。如果一个进程发动了对某一个缓冲页面的读写操作，并且该页面上不再内存中而需要从设备读入，那么就可以预测，通常情况下它接下去可能会继续往下读写，因此不妨预先将后面几个页面也一起读进来。其实以页面单位的缓冲本身就隐含着预读，因为一个页面包含着多个记录块（通常是4块），只不过预读的量很小而已。现在file结构中其实要维持两个上下文了。一个就是由“当前位置”f_pos代表的真正的读写上下文，而另一个就是预读的上下文。为此目的，在file结构中增设了f_reada、f_ramax、f_raend、f_rawin等几个字段（ra表示read ahead）。

2、文件写

2.1代码分析

1→sys_write()

注意，在调用参数中并不指明在文件中写的位置，因为文件的file结构代表着上下文，记录着在文件中的“当前位置”。

2→→fget_light ()

根据打开文件号fd找到该已打开文件的file结构。而它实质上就是通过调用下面函数实现的。

3→→→fcheck_files ()

struct fdtable *fdt = files_fdtable(files);

if (fd < fdt->max_fds)

file = rcu_dereference(fdt->fd[fd]);

即通过fdtable，根据数组下标fd得到file结构。

fget_file()返回打开的文件file结构后，便开始为写做准备。

2→→file_pos_read ()

很简单，就是返回file中的文件“当前位置”file->f_pos。再就是通过vfs_write()开始了真正的写流程。

2→→vfs_write ()

if (!(file->f_mode & FMODE_WRITE))

return -EBADF;

if (!file->f_op || (!file->f_op->write && !file->f_op->aio_write))

return -EINVAL;

一个进程要对一个已打开的文件进行写操作，应该满足几个必要条件。其一是相应file结构里f_mode字段中的标志位FMODE_WRITE为1.这个字段的内容是在打开文件时根据对系统调用open()的参数flags经过变换而来的。若标志位FMODE_WRITE为0，则表示这个文件是按“只读”方式打开的，所以该标志位为1是写操作的一个必要条件。另外file结构必须包含有具体文件系统的写操作函数。

3→→rw_verify_area ()

这是检查文件是否加锁以及是否允许使用强制锁。

检查了锁之后，就是写操作本身了。具体的文件系统通过其中file_operation数据结构提供用于写操作的函数指针。在2.6内核中，Ext2文件系统的写操作函数指针指向的就是do_sync_write()。

3→→→do_sync_write()

struct iovec iov = { .iov_base = (void __user *)buf, .iov_len = len };

struct kiocb kiocb;

init_sync_kiocb(&kiocb, filp);

kiocb.ki_pos = *ppos;

kiocb.ki_left = len;

首先这段代码是对iovec结构和kiocb结构的初始化。 iovec 主要是用于存放两个内容：用来接收所读取数据的用户地址空间缓冲区的地址（iov_base）和缓冲区的大小（iov_len）。kiocb描述符用来跟踪正在运行的同步和异步I/O操作的完成状态。在Linux内核中，每个IO请求都对应一个kiocb结构体，其ki_filp成员指向对应的file指针，通过is_sync_kiocb可以判断某Kiocb是否为同步IO请求，如果非真，表示是异步IO请求。块设备和网络设备本身就是异步的。调用宏init_sync_kiocb来初始化描述符kiocb,并设置一个同步操作对象的有关字段。主要设置ki_filp字段和ki_obj字段以及在kiocb中设置io读写的位置和长度。

接下来又是调用ret = filp->f_op->aio_write(&kiocb, &iov, 1, kiocb.ki_pos)，进行真正的写，参数就是kiocb和iovec结构变量。可见linux的块设备也是异步IO。

4→→→→generic_file_aio_write ()

5→→→→→__generic_file_aio_write_nolock ()

struct file *file = iocb->ki_filp;

struct address_space * mapping = file->f_mapping;

先从kiocb中获得file结构和address_space结构。

6→→→→→→generic_segment_checks ()

针对iovec段做一些检查。传下来的nr_segs值为1。

/* Performs necessary checks before doing a write

* @iov: io vector request

* @nr_segs: number of segments in the iovec

* @count: number of bytes to write

* @access_flags: type of access: %VERIFY_READ or %VERIFY_WRITE

* Adjust number of segments and amount of bytes to write (nr_segs should be

* properly initialized first). Returns appropriate error code that caller

* should return or zero in case that write should be allowed.

6→→→→→→generic_write_checks ()

针对写文件位置和长度做一些检查。

* Performs necessary checks before doing a write

* Can adjust writing position or amount of bytes to write.

* Returns appropriate error code that caller should return or

* zero in case that write should be allowed.

如在打开文件时的参数中将O_APPEND标志位设为1，则表示对此文件的写操作只能是在尾端添加，所以要讲当前位置pos调整到文件的尾端。

（if (file->f_flags & O_APPEND)*pos = i_size_read(inode);）

进程的task_struct结构中有个数组rlim就规定了对该进程使用各种资源的上限。其中有一项，即下标为RLIMT_FSIZE处的元素，就表示对该进程的文件大小的限制。如果企图写入的位置超出了这个限制，就要给这个进程发一个SIGXFSZ，并让系统调用失败而返回错误代码-EFBIG。

unsigned long limit = current->signal->rlim[RLIMIT_FSIZE].rlim_cur;

if (limit != RLIM_INFINITY) {

if (*pos >= limit) {

send_sig(SIGXFSZ, current, 0);

return -EFBIG;

}

… …

做完了这些检查还会调用下这个函数。

6→→→→→→file_remove_suid ()

这是说，如果当前进程并无设置“set uid”，即S_ISUID标志位的特权，而目标文件的set uid标志位S_ISUID和S_ISGID为1，则应将inode中的这些标志位清0，也就是剥夺该文件的set uid和set gid特性。

在inode结构中打上世间印记并将该inode标志成“脏”后，开始操作。

6→→→→→→generic_file_buffered_write ()

if (a_ops->write_begin)

status = generic_perform_write(file, &i, pos);

这个write_begin函数是存在的。于是调用generic_perform_write()。file->f_mapping是从对应inode->i_mapping而来，inode->i_mapping->a_ops是由对应的文件系统类型在生成这个inode时赋予的。而各个文件系统类型提供的file->f_mapping->a_ops->write_begin函数一般是block_write_begin函数的封装、file->f_mapping->a_ops->write_end函数一般是generic_write_end函数的封装。

7→→→→→→→generic_perform_write ()

这里传给它的参数包括一个iov_iter结构指针，它实际上是包含着iovec变量以及读写长度等信息。写操作的主体是由一个do-while循环实现的，循环的次数取决于写的长度和位置。在每一次循环中，只往一个缓冲页面中写，并将当前位置pos相应的向前推进，而剩下的长度iov_iter.count则逐次减少。

offset = (pos & (PAGE_CACHE_SIZE - 1)); /* Offset into pagecache page */

index = pos >> PAGE_CACHE_SHIFT; /* Pagecache index for current page */

bytes = min_t(unsigned long, PAGE_CACHE_SIZE - offset,iov_iter_count(i)); /* Bytes to write to page */

这是首先计算出当前位置是从第几个page开始，以及它在page内部的偏移和要写的长度。然后就调用write_begin函数，即ext2_write_begin()

8→→→→→→→→ext2_write_begin ()

9→→→→→→→→→__ext2_write_begin ()

10→→→→→→→→→→block_write_begin ()

根据当前位置pos计算出本次循环中要写的缓冲页面index、在该页面中的起点start、以及写入长度bytes。计算将整个文件的内容当作一个连续线性存储空间，将pos右移PAGE_CACHE_SHIFT位跟将pos被页面大小所整除是等价的（但是更快）。计算出了缓冲页面在目标文件中的逻辑序号index后，就通过__grab_cache_page()找到该缓冲页面。

11→→→→→→→→→→→__grab_cache_page ()

这个函数首先通过find_lock_page()在mapping对应的基树中查找页面，如果找不到就通过page_cache_alloc()分配一个缓冲页面，并用add_to_page_cache_lru()将其插入到mapping的基树中。

从_grab_cache_page()返回到block_write_begin()中，已经有了一个缓冲页面。在开始写入之前还要做一些准备工作。

11→→→→→→→→→→→__block_prepare_write ()

参数里的get_block变量为ext2_get_block，from和to都是页面内偏移量，而不是文件内偏移，from为该页面起点，to为起点+写入长度。

为什么要有准备工作，原因是这样的。通过前面分析知道，ext2在文件系统层面是以页面为单位缓冲的，在设备层次上却是以记录块为单位缓冲的。_grab_cache_page()返回的可能是已经存在的缓冲页面，也可能是个新分配的空白页面，它们之间有两点根本性的区别。第一点是在结构上，缓冲页面一方面与一个page结构相联系，另一方面又要与若干记录块缓冲区的头部，即buffer_head数据结构相联系，已经存在的缓冲页面是具备这个关系的，而新分配的页面则尚无buffer_head结构与之挂钩。第二点是在内容上，新分配的空白页面要将目标页面的内容首先从设备中读入（因为写操作未必是整个页面的写入，这一点在设计MS的对象层时也深有体会）。不仅如此，就是业已存在的老页面也有个缓冲页面中的内容是否“up_to_date”，即是否一致的问题。所以如果一个缓冲页面内容是一致的，就意味着构成这个页面的所有记录块的内容都一致。反过来，如果一个缓冲页面不一致，则未必每个记录块都不一致。因此，要根据写入的位置和长度找到具体设计的记录块，针对这些记录块做写入准备。

要理解后面的代码，先看下面这个问题。

现在假设有一个文件，它大概有两个页面，现在我只在文件的开始写入(修改)一点点数据，比方说10个字节，然后再seek到文件的开始进行读取操作，此时缓存如何管理？在分配一个缓冲页面的时候，我只是修改了这个页面开始的10个字节，这个10个字节之后的所有内容都应该保持之前的内容。那么这个缓冲页的内容会是什么样子。假设只是修改了缓冲页开始的10个字节，之后的内容留空或者全部初始化为零，那么当下次再次读取的时候它如何判断这个页面中的哪些位置是已经被修改过的？从设备中读取的扇区将会覆盖内存页面的什么位置？假设说每次写入的时候都把所有将要蹂躏的扇区都读入内存，那么就更没有必要了。比方说我修改了10000字节，跨越接近20个扇区，如果每个扇区都读入，然后读入之后马上被修改为其它值，那这个读取明显是耗时而没有意义的。

后面的代码就是__block_prepare_write解决这个问题的方法。对于已经建立起缓冲页面和物理记录块映射的页面，则需要做的只是检查一下记录块内容是否一致，如果不一致就调用ll_rw_block()将设备上记录块读到缓冲区中。如果缓冲页面是新的，即尚未建立起到物理记录块的映射，则需要通过get_block()先建立映射。由此可见，对文件的写操作是“写中有读，欲写先读”。关键就是读多少，怎么读，这也是解决上面问题的关键。_block_prepare_write()的机制就是以记录块为单位（buffer_head，也即逻辑磁盘块）读，并且只对满足某些特定条件的块才需要读。

blocksize = 1 << inode->i_blkbits; /*块大小，也即页内缓冲区大小*/

if (!page_has_buffers(page))

create_empty_buffers(page, blocksize, 0);

head = page_buffers(page);

调用create_empty_buffers为该页建立缓冲区队列，然后对队列进行初始化。没有涉及bh的state标志，调用的create_buffers设置bh->state=0且把新分配的缓冲区放入BUF_CLEAN链表（BH_dirty标志为0）缓冲区头赋给page->buffer。

bbits = inode->i_blkbits; /*块位数*/

block = (sector_t)page->index << (PAGE_CACHE_SHIFT - bbits);

当前页所在的块号假设块大小为1k,则bbits = inode->i_blkbits, bbits为10 则一页占2^(PAGE_CACHE_SHIFT-bbits)=2^(12-10)=2^2=4个块因此该页的逻辑起始块号为: page->index*每页块数即page->index*2^(PAGE_CACHE_SHIFT-bbits)=page->index<<(PAGE_CACHE_SHIFT-bbits)

for(bh = head, block_start = 0; bh != head || !block_start;block++, block_start=block_end, bh = bh->b_this_page)

{ block_end = block_start + blocksize;

对当前页的每个块缓冲区对应的bh和受写影响的每个bh，block_start记录循环写入的总的块大小。

if (block_end <= from || block_start >= to) {

if (PageUptodate(page)) {

if (!buffer_uptodate(bh))

set_buffer_uptodate(bh);

}

continue;

}

对于页内块完全不在from~to之间的区域，所谓完全不在，就是说这个块的整块都在from~to之外：终止地址小于from，或是块的起始地址大于to。这些块与写入范围完全无关，既不用从设备上读数据，也不会有数据写入这些块，所以可以直接跳过。

对页内form~to之间的区域，则有的块可能需要从设备读数据，有的块不需要读，于是进行下列转换、检查或设置。

检查BH_Mapped标志，未设置时，调用get_block完成从文件逻辑块号到磁盘逻辑块号的转换，磁盘逻辑块号存放在bh->b_blocknr字段，且设置BH_Mapped标志。这里的get_block对于每个没有在内存中的页面都会被执行，但是这里不要被名字所迷惑，它不会启动对文件数据的真正读取(尽管可能会启动对inode节点及数据的读取)，它只是对页面对应的buffer_head结构进行初始化，例如建立page和设备block之间的映射关系，这种映射关系根据不同的文件系统有不同的实现方式，例如经典的unix的三次间接寻址结构。而函数的最后一个参数get_block就是负责根据不同的文件系统来建立buffer_head和page的不同映射关系。再次强调，这里并不会读取文件具体内容，主要负责建立设备block和page之间的映射关系。对于get_block的代码后面还要详细分析，这里先跳过。

if (PageUptodate(page)) {

if (!buffer_uptodate(bh))

set_buffer_uptodate(bh);

continue;

}

如果page的读操作完成，PG_uptodate标志被设置，则将其缓冲区的BH_uptodate也设置。也就是说如果一个缓冲页面内容是一致的，就意味着构成这个页面的所有记录块的内容都一致。

if (!buffer_uptodate(bh) && !buffer_delay(bh) &&!buffer_unwritten(bh) &&(block_start < from || block_end > to))

{

ll_rw_block(READ, 1, &bh);

*wait_bh++=bh;

}

如果不对整个块进行重写，且它的BH_Delay和BH_Uptodate标志未置位（即块缓冲区没有有效数据的影响），调用ll_rw_block函数从磁盘读入块的内容。注意加亮语句的含义！由于前面对完全在from~to范围内的块已经跳过了，那么这里的块说明在from~to范围内，或者部分在from~to范围内。而不对整个块进行重写说明就是后者，即这个块需要重写，但又只有一部分需要重写，对于这样的块，就需要先冲设备中把原来的物理块数据先读上来，然后再将需要重写的那部分重写。这也就是__block_prepare_write()解决上面所提出问题的关键所在。一个页面中的块，完全在from~to之外的不需要读取，完全在from~to之间的也不需要读取（因为这一整块即使读上来也马上要全部写入新数据），只有部分在from~to之间的块才需要读取。ll_rw_block函数中定义了I/O完成后的处理函数end_buffer_io_sync。

while(wait_bh > wait) {

wait_on_buffer(*--wait_bh);

if (!buffer_uptodate(*wait_bh))

err = -EIO;

}

阻塞当前进程，直到for循环中的ll_rw_block读操作全部完成。对于这部分缓存刷新同步的细节，留作内存缓存线程代码分析后再来研究。

__block_prepare_write()函数至此结束，下面回头来看之前get_block()

的函数实现。

12→→→→→→→→→→→→ext2_get_block ()

参数iblock表示所处理的记录块在文件中的逻辑块号，inode则指向文件的inode结构。这个函数的基础就是ext2中文件内块号到设备上块号的映射，即经典的三层寻址结构（文件的记录块的直接寻址、间接寻址、双重间接寻址和三重间接寻址）。

在ext2文件系统的ext2_inode_info结构中（由EXT2_I(inode)宏得来），有个大小为15的整型数组i_data[]（与设备上索引节点ext2_inode结构中的i_block[]相对应）,其开头12个元素是直接寻址，第13个元素是间接寻址，它指向一个记录块，依次类推。对于1K的块大小，则ext2的一个inode所支持的最大文件大小为256*256*256+256*256+256+12个记录块（即再*1K）。

这里还要注意，在struct inode结构中有个成分名为i_data，这是一个address_space数据结构。而作为struct inode 结构一部分的ext2_inode_info结构中，也有个名为i_data的数组，它是记录块映射表，二者毫无关系。

有了这些背景知识，就可以接着看下面的函数。

13→→→→→→→→→→→→→ext2_block_to_path ()

这个函数的作用就是根据文件内的块号计算出这个记录块落在i_data[]的哪个区间，要采用几重映射。

int ptrs = EXT2_ADDR_PER_BLOCK(inode->i_sb);

int ptrs_bits = EXT2_ADDR_PER_BLOCK_BITS(inode->i_sb);

const long direct_blocks = EXT2_NDIR_BLOCKS,

indirect_blocks = ptrs,

double_blocks = (1 << (ptrs_bits * 2));

这些定义中的EXT2_NDIRBLOCKS为12，表示直接映射的记录块数量。EXT2_IND_BLOCK的值也是12，表示在i_data[]数组中用于一次间接映射的元素下标。而EXT2_DIND_BLOCK和EXT2_TIND_BLOCK则分别为用于二次间接和三次间接的元素下标，值为13、14.至于EXT2_N_BLOCKS则为i_data[]数组的大小。根据这些宏定义，在记录块大小为1K时，ptrs的值为256，从而indirect_blocks的值也是256，ptrs_bits的值为8。

if (i_block < 0) {

ext2_warning (inode->i_sb, "ext2_block_to_path", "block < 0");

} else if (i_block < direct_blocks) {

offsets[n++] = i_block;

final = direct_blocks;

} else if ( (i_block -= direct_blocks) < indirect_blocks) {

offsets[n++] = EXT2_IND_BLOCK;

offsets[n++] = i_block;

final = ptrs;

} else if ((i_block -= indirect_blocks) < double_blocks) {

offsets[n++] = EXT2_DIND_BLOCK;

offsets[n++] = i_block >> ptrs_bits;

offsets[n++] = i_block & (ptrs - 1);

final = ptrs;

} else if (((i_block -= double_blocks) >> (ptrs_bits * 2)) < ptrs) {

offsets[n++] = EXT2_TIND_BLOCK;

offsets[n++] = i_block >> (ptrs_bits * 2);

offsets[n++] = (i_block >> ptrs_bits) & (ptrs - 1);

offsets[n++] = i_block & (ptrs - 1);

final = ptrs;

} else {

ext2_warning (inode->i_sb, "ext2_block_to_path", "block > big");

}

这段代码仔细品读一下就能理解其含义，它就是三层映射路径分解的精髓之处。它就是根据文件内的块号，得到这个逻辑块的映射深度，并且算出这个逻辑块在每一层映射中的偏移量，并将计算的结果放在数组offset[]中。

由于每一层占用的位数是8位（1K的逻辑块，数组元素u32站2位，则一个逻辑块的间接寻址容量为256，即8位），于是把要解析的地址按每8位分层，每一层的8位表示它所在层的位移量（即它是属于所在层的第几个块）。

这里要特别注意的是，在ext2的块地址解析中，要先确定这个块号是属于第几层映射深度（每个深度是独立的），然后根据相应的深度减掉前面所有层深度的满块数之和（好好理解i_block -=，这些if-else-if语句是一层层往下检测的，每一层检测后都通过i_block-=将这一层的满块数减去了，因此无论到那一层都是已经把前面层所有的满块数和减去了的），这样得到的块号才是真正属于这层深度映射的地址，然后才能用上面所说的每8位分层解析出每层的偏移量。即右移得到某层的8位，然后按位与255得到这8位的值。这样结束后便得到这个块号所属的映射深度的地址，从i_data[]开始一直到真正的逻辑磁盘块号的每一层的偏移量（第几个块），即每一层的路径分量。这也是函数名block to path 的含义。

13→→→→→→→→→→→→→ext2_get_branch ()

这个函数是从磁盘上逐层读入用于间接映射的记录块。

根据数组offset[]的指引，这个函数逐层将用于记录块号映射的记录块读入内存，并将指向缓冲区的指针保存在数组chain[]的相应元素，即Indirect结构中。同时还要使该Indirect结构中的指针p指向本层记录块号映射表（数组）中的相应表项，并使key字段持有该表项的内容，也就是所映射设备上块号。

14→→→→→→→→→→→→→→sb_bread ()

将记录块读入到内存中，存放在buffer_head所指向的缓存。

14→→→→→→→→→→→→→→verify_chain ()

读入一个记录块后再调用此函数检验一下映射链的有效性，实质上是检查隔层映射表中有关的内容是否改变了（from->key==*from->p）。

14→→→→→→→→→→→→→→add_chain ()

将读入的buffer地址以及逻辑块号等内容记录到chain[]的相应元素中，即Indirect结构中（ p->key = *(p->p = v);p->bh = bh;）。

举个例子来看。假设要写的是文件内块号为10的块，则不需要间接映射，所以只用chain[0]一个Indirect结构。其指针bh为NULL，因为没有用于间接映射的记录块；指针p指向映射表中直接映射部分下标为10处，即&inode->u.ext2_i.i_data[10]；而key则持有该表项的内容，即所映射的设备上块号。想比之下，文件内块号为20的块则需要一次间接映射，所以要用chain[0]和chain[1]两个表项。第一个表项chain[0]中的指针bh仍为NULL，因为在这一层没有用于间接映射的记录块；指针p指向映射表中下标为12处，即&inode->u.ext2_i.i_data[12]，这是用于这一层间接映射的表项；而key则持有该表项的内容，即用于这一层间接映射的记录块的设备上块号。第二个表项chain[1]中的指针bh则指向该记录块的缓冲区，这个缓冲区的内容就是用作映射表的一个整数数组。所以chain[1]中的指针p指向这个数组中下标为8处，而key则持有该表项的内容，即经过间接映射后的设备上块号。这样，根据具体映射深度depth，数组chain[]中的最后一个元素，更确切的说是chain[depth-1].key，总是持有目标记录块的物理块号。而冲chain[]中的第一个元素chain[0]到具体映射的最后一个元素chain[depth-1]则提供了具体映射的整个路径，构成了一条映射链，这也是数组名chain的由来。如果把映射的过程看成爬树的过程，则一条映射链也可看成决定着书上的一个分支，所以叫ext2_get_branch()。

总结上面的分析，对于chain[]数组中Indirect元素的内容要尤其注意理解，它是文件内从逻辑块到物理块映射的载体。一个文件的整个逻辑结构由i_data[]表示，某个逻辑块在每一层的偏移由offset[]记录。在chain[]数组中，对于它的每一个元素即一个Indirect结构中，bh就是这个Indirect结构所代表的物理块映射到内存中后的首地址（这个物理块就是一个映射表数组）；p则是bh+offset[]中响应的偏移得到的地址，也就是这个Indirect结构所代表的物理块中的某个地址（从这可看出就是p完成了文件从逻辑地址到物理地址的转换，因为它把逻辑偏移offset+块首址bh得到物理块中的地址）；key就是这个地址中的内容，即块号（key就是下一层逻辑块的实际物理块号，也就是下一层Indirect结构中bh的来源）。每一层Indirect结构中的三个元素bh、p、key的含义和之间的关系就是这样的，然后如此往复。理解这三者的关系对后面的代码分析很有帮助。

从ext2_get_branch()返回到ext2_get_block()，返回值有两种可能。首先如果顺利完成映射，则返回值为NULL。其次，如果在某一层上发现映射表内的相应项为0，则说明这个表项（记录块）原来不存在（也就是说，在这一层的Indirect结构中，bh是有的，因为此层映射表已经读入内存，相应p也是有的，它就是bh+offset中的逻辑偏移，但是p地址中的内容为0，也就是代表下层块号key为0，这样一来，下一层的bh就无法读出。这也是为什么分配新块的时候会zero out 归零），现在因为写操作而需要扩充文件的大小。此时返回指向该层Indirect结构的指针，表示映射在此断裂了。此外如果映射的过程中出了错，例如读记录块失败，则返回一个错误码。

/* Simplest case - block found, no allocation needed */

if (!partial) {

first_block = le32_to_cpu(chain[depth - 1].key);

clear_buffer_new(bh_result); /* What's this do? */

… …

对于这种顺利完成了映射的情况，就把所得的结果填入作为参数传下来的缓冲区结构bh_result中。

要是ext2_get_branch()返回了一个非0指针，那就说明映射在某一层上断裂了。根据映射的深度和断裂的位置，这个记录也许还只是个中间的用于间接映射的记录块，也许就是最终的目标记录块。总之在这种情况下，要在设备上为目标记录块以及可能需要的中间记录块分配空间。

13→→→→→→→→→→→→→ext2_init_block_alloc_info

这个函数是对文件的磁盘预留窗口进行初始化，这是在2.6版本的内核中新加入的。

在磁盘上组织文件时，我们想将文件的数据尽可能存放在连续的磁盘块上，这样读写文件时，因为磁头移动的距离比较短，故速度会有很大提高。块预留机制的核心思想是文件系统应该提前考虑如果文件增长，可以从哪块空间分配磁盘块，并将这些磁盘块预留。采用这种方法，当文件增长时，会在磁盘的合适位置有空闲磁盘块供使用。为了达到这个目的，ext2块分配器被改为基于预留机制了。当一个文件第一次需要分配一个新块时，文件系统为它创建一个预留窗口，该窗口中保留了一些磁盘块（初始值为8个），然后从预留窗口中分配磁盘块。当预留窗口中的块用完时，尽量会在旧的预留窗口周围创建一个扩展的预留窗口，以代替旧的预留窗口。预留窗口会持续到写文件的进程关闭文件，然后，这些预留块又重新变为空闲块。

ext2块预留机制主要数据结构如下：

一、主要数据结构

预留块的信息是有一棵红黑树管理的，如图1：

struct rb_node

{

unsigned long rb_parent_color;

struct rb_node *rb_right;

struct rb_node *rb_left;

}；

这个结构表示树中的一个节点。

struct rb_root

{

struct rb_node *rb_node;

};

这个结构只是个封装，用来指向一颗树的根节点。

注意上面节点中并没有数据，那么数据存放在哪里？

struct ext2_reserve_window {

ext2_fsblk_t _rsv_start; /* First byte reserved */

ext2_fsblk_t _rsv_end; /* Last byte reserved or 0 */

};

这个结构用于表示一个块预留区间，[_rsv_start，_rsv_end]。

struct ext2_reserve_window_node {

struct rb_node rsv_node;

__u32 rsv_goal_size;

__u32 rsv_alloc_hit;

struct ext2_reserve_window rsv_window;

};

这个结构既包含一个struct rb_node，又包含一个struct ext2_reserve_window，将两者结合起来了。

struct ext2_block_alloc_info {

struct ext2_reserve_window_node rsv_window_node;

__u32 last_alloc_logical_block;

ext2_fsblk_t last_alloc_physical_block;

};

这个结构描述了一个inode的预留窗口，以及上一次分配的逻辑磁盘块号和物理磁盘块号。

* second extended file system inode data in memory

struct ext2_inode_info {

……

/* block reservation info */

struct ext2_block_alloc_info *i_block_alloc_info;

};

这个结构是根据磁盘上的inode信息建立起来的，每个文件一个。

* second extended-fs super-block data in memory

struct ext2_sb_info {

/* root of the per fs reservation window tree */

spinlock_t s_rsv_window_lock;

struct rb_root s_rsv_window_root;

struct ext2_reserve_window_node s_rsv_window_head;

};

这个结构是根据磁盘中的超级块在内存中建立起来的，每个文件系统一个。其中s_rsv_window_root就是红黑树的根节点，s_rsv_window_head就是包含红黑树的根节点的struct ext2_reserve_window_node。

二、主要数据结构之间的关系

1、一个文件系统对应一个ext2_sb_info结构，一个ext2_sb_info结构指向一棵红黑树。

2、每个文件inode对应一个ext2_inode_info结构，每个ext2_inode_info结构指向一个ext2_block_alloc_info结构。

3、每个ext2_block_alloc_info结构包含一个ext2_reserve_window_node结构。

4、每个ext2_reserve_window_node结构包含一个rb_node结构和一个ext2_reserve_window结构。

5、 rb_node结构用于组成一个树状结构。

6、每个ext2_reserve_window结构描述一个区间，并且多个ext2_reserve_window结构之间不会重叠。

ext2块预留机制主要数据结构转载自：

http://gbk.chinaunix.net/uid-52662-id-2107875.html

13→→→→→→→→→→→→→ext2_find_goal()

参数block为文件内逻辑块号，goal则用来返回所建议的设备上目标块号。如前所诉，ext2_inode_info结构中的i_block_alloc_info结构中设置了两个字段，last_alloc_logical_block和last_alloc_physical_block。前者用来记录下一次要分配的文件内块号，后者则用来记录希望下一次能分配的设备上块号。

正常情况下对文件的扩充是顺序的，所以每次的文件内块号都与前一次的连续，而理想的设备上块号也同样连续，二者平行的向前推进。当然这只是建议值，内核会尽量满足要求。可是文件内逻辑块号也有可能是不连续的，也就是说对文件的扩充是跳跃的。这种情况发生在通过系统调用lseek()将已经打开文件的当前读写位置推进到了超出文件末尾之后，新的逻辑块号与文件原有的最后一个逻辑块号之间留下了“空洞”。

这种情况下是通过ext2_find_near()，根据空洞的不同位置返回对设备上记录块号的建议值。要注意这两个函数返回的都是建议块号，设备上具体记录块的分配，包括目标记录块和可能需要的用于间接映射的中间记录块以及映射的建立，是由ext2_alloc_branch()完成的。调用之前先要算出映射断裂点离终点的距离，也就是还有几层映射需要建立。

/* the number of blocks need to allocate for [d,t]indirect blocks */

indirect_blks = (chain + depth) - partial - 1;

这就是计算出需要分配的间接映射块的数目。depth是总的块数目，partial是chain中断裂的那一层的地址，因此chain+depth-partial就是断裂层后还需要分配的块数，最后一块是直接块，因此再减一就是需要分配的间接块数。再然后就是调用ext2_blks_to_allocate()计算出总共需要分配的块数。

13→→→→→→→→→→→→→ext2_alloc_branch ()

14→→→→→→→→→→→→→→ext2_alloc_blocks ()

ext2_alloc_blocks一次性地就把我们需要的数据块都申请到了，并把它存放在数组new_blocks[]中。

创建的工作都是在ext2_new_blocks()中完成的，主要是处理一下预留窗口或者是查看位图。参数goal是建议分配的设备上记录块号，分配时，首先视图满足建议要求，如果所建议的记录块还空闲着，就把它分配出去，否则如果所建议的记录块已经分配掉了，就试图在它附近32个记录块的范围内分配。还不行就向前在本块组的位图中搜索，先找位图整个字节都是0，即至少有连续8个记录块空闲的区间，若实在找不到就在整个设备的范围内寻找和分配。

返回到ext2_alloc_branch ()，是一个for循环。

for (n = 1; n <= indirect_blks; n++) {

* Get buffer_head for parent block, zero it out

* and set the pointer to new one, then send

* parent to disk.

bh = sb_getblk(inode->i_sb, new_blocks[n-1]);

branch[n].bh = bh;

lock_buffer(bh);

memset(bh->b_data, 0, blocksize);

branch[n].p = (__le32 *) bh->b_data + offsets[n];

branch[n].key = cpu_to_le32(new_blocks[n]);

*branch[n].p = branch[n].key;

… …

在for循环中，每一个间接块通过getblock()为其在内存中分配缓冲区，并通过memset就爱那个其缓冲区清成全0（zero out，前面有说过），然后在缓冲区中建立起本层的映射，即将p指向的地址内容填上缓冲区的块号key，即用p指向key，继而得到此块块号。

要注意一点的是，这个for循环是从branch[1]开始的，而chain[]数组断裂的开始处是branch[0]，因此从branch[1]开始的p、key、逻辑块之间的映射已经建立好，但是branch[0]处的映射并未建立。在for循环的前面有这样一行代码：branch[0].key = cpu_to_le32(new_blocks[0]);即在映射开始断开的那一层上（branch[0]），所分配的记录块号只是记录了这一层Indirect结构中的key字段，却并未写入相应的映射表项中（由指针p所指之处）。也就是说我们的那根树枝已经建立好了，但是在断开部分还没连上，没有把这根树枝接在树上。

13→→→→→→→→→→→→→ext2_splice_branch ()

*where->p = where->key;这个函数一开始就是把原来映射开始断开的那一层所分配的记录块号写入了相应的映射表中。如果相应的Indirect结构中的指针bh为0（必定是chain[0]），则映射表就在inode结构中。否则，就是一个间接映射表。然后在修改了inode的相关字段包括最后分配的逻辑块号（last_alloc_logical_block），最后分配的物理块号（last_alloc_physical_block）等之后，将inode标志成脏。

回到ext2_get_block()中，把映射后的记录块连同设备号置入bh_result所指的缓冲区结构中，就完成了任务。从ext2_get_block()返回到_block_prepare_write()，for循环结束时，所有设计本次写操作的物理记录块（缓冲区）都已找到，需要从设备上读的读取完毕，写操作的准备工作就完成了。所以就返回到generic_perform_write()。

在generic_perform_write()中是一个while循环，通过具体文件系统所提供的函数为写操作做准备的。准备好了以后就可以从用户空间把待写的内容复制到缓冲区中，实际上是缓冲页面中。

8→→→→→→→→iov_iter_copy_from_user_atomic ()

为写操作准备好了以后，从缓冲区（缓冲页面）到设备上的记录块这条道路畅通了。这样才可以从用户空间把待写的内容复制过来。如前所述，目标记录块的缓冲区在文件层是作为缓冲页面的一部分存在的，所以这是从用户空间到缓冲页面的拷贝，具体就是通过这个函数完成。参数iov_iter *i中的iovec字段记录了指向用户空间的缓冲区buf以及待拷贝的长度（char __user *buf = i->iov->iov_base + i->iov_offset;）。对于i386处理器，flush_dcache_page是空操作。

写入缓冲页面后，调用write_end函数，ext2文件系统没有专门的write_end，就是generic_write_end()函数。

8→→→→→→→→generic_write_end()

9→→→→→→→→→block_write_end ()

10→→→→→→→→→→__block_commit_write ()

函数中的for循环扫描缓冲页面中的每个记录块，如果一个记录块与写入的范围（从from到to）相交，就把该记录块的缓冲区设成“up to date”,即与设备上的记录块一致，并将其设成dirty，下面的事就交给kflushd了。

值得注意的是，这里已经将缓冲区的BH_Update标志位设成1，表示缓冲区的内容已经与设备上相一致。可是，实际上此时缓冲区的内容尚未写会设备，所以从物理上说显然是不一致的。但是由于写操作本身已接近完成，涉及的缓冲区即将提交给kflushd，从逻辑角度上缓冲区中的内容与设备上的内容已经一致了。

所以所谓“一致”或“不一致”只是一个逻辑上的概念，并非物理上的概念。只要写入的内容已经“提交（commit）”，就认为已经一致了。而不一致的状态发生在写操作的中途，即改变了缓冲区的内容而尚未提交之前。在写入的准备阶段，遇有不一致的缓冲区就要从设备上重新读入，就是因为有未完成的写操作存在而破坏了缓冲区的内容。

完成了_block_commit_write()之后generic_perform_write()中的一轮循环，也就是对一个缓冲页面的写入就完成了。这样循环结束返回到generic_file_buffered_write()也随之结束，进而整个写文件操作的主体generic_file_aio_write()就告结束。

2→→file_pos_write ()

最后将新的当前位置写入file中。Sys_write()结束。

3、文件读

sys_read()函数与write函数几乎一样，只是在sys_write()中要验证用户空间的缓冲区可读，并使用file_operations结构中的函数指针write，而在sys_read()中则要验证用户空间的缓冲区可写，并使用file_operations函数指针read。由于涉及到较多内核页、缓冲区中的内容，以后再看。

你可能感兴趣的:(FS)

每日一题——第八十四题互联网打工人no1 C语言程序设计每日一练 c语言
题目：编写函数1、输入10个职工的姓名和职工号2、按照职工由大到小顺序排列，姓名顺序也随之调整3、要求输入一个职工号，用折半查找法找出该职工的姓名#define_CRT_SECURE_NO_WARNINGS#include#include#defineMAX_EMPLOYEES10typedefstruct{intid;charname[50];}Empolyee;voidinputEmploye
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
tiff批量转png 诺有缸的高飞鸟 opencv 图像处理 python opencv 图像处理
目录写在前面代码完写在前面1、本文内容tiff批量转png2、平台/环境opencv,python3、转载请注明出处：https://blog.csdn.net/qq_41102371/article/details/132975023代码importnumpyasnpimportcv2importosdeffindAllFile(base):file_list=[]forroot,ds,fsin
Linux CTF逆向入门蚁景网络安全 linux 运维 CTF
1.ELF格式我们先来看看ELF文件头，如果想详细了解，可以查看ELF的manpage文档。关于ELF更详细的说明：e_shoff：节头表的文件偏移量（字节）。如果文件没有节头表，则此成员值为零。sh_offset：表示了该section（节）离开文件头部位置的距离+-------------------+|ELFheader|---++--------->+-------------------
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
string trim的实现 JamesSawyer
if(typeofString.prototype.trim!=='function'){String.prototype.trim=function(){//这个正则的意思是//'^''$'表示结束和开始//'^\s*'表示任意以空格开头的空格//'\s*$'表示任意以空格结尾的空格//'\S*'表示任意非空字符//'$1'表示'(\S*(\s*\S*)*)'returnthis.replace
mysql学习教程，从入门到精通，TOP 和MySQL LIMIT 子句（15）知识分享小能手大数据数据库 MySQL mysql 学习 oracle 数据库开发语言 adb 大数据
1、TOP和MySQLLIMIT子句内容在SQL中，不同的数据库系统对于限制查询结果的数量有不同的实现方式。TOP关键字主要用于SQLServer和Access数据库中，而LIMIT子句则主要用于MySQL、PostgreSQL（通过LIMIT/OFFSET语法）、SQLite等数据库中。下面将分别详细介绍这两个功能的语法、语句以及案例。1.1、TOP子句（SQLServer和Access）1.1
metaRTC/webRTC QOS 方案与实践 metaRTC metaRTC 解决方案 webrtc qos
概述质量服务(QOS/QualityofService)是指利用各种技术方案提高网络通信质量的技术，网络通信质量需要解决下面两个问题：网络问题：UDP/不稳定网络/弱网下的丢包/延时/乱序/抖动数据量问题：发送数据量超带宽负载和平滑发送拥塞控制是各种技术方案的数据基础，丢包恢复解决丢包问题，抗乱序抖动解决网络乱序抖动问题，流量控制解决平滑发送数据/数据超带宽负载/延时问题。拥塞控制(Congest
metaRTC5.0 API编程指南(一) metaRTC metaRTC c++c语言 webrtc
概述metaRTC5.0版本API进行了重构，本篇文章将介绍webrtc传输调用流程和例子。metaRTC5.0版本提供了C++和纯C两种接口。纯C接口YangPeerConnection头文件:include/yangrtc/YangPeerConnection.htypedefstruct{void*conn;YangAVInfo*avinfo;YangStreamConfigstreamco
linux 安装Sublime Text 3 hhyiyuanyu Python学习 linux sublime text
方法/步骤打开官网http://www.sublimetext.com/3，选择64位进行下载执行命令wgethttps://download.sublimetext.com/sublime_text_3_build_3126_x64.tar.bz2进行下载3、下载完成进行解压,执行tar-xvvfsublime_text_3_build_3126_x64.tar.bz解压4、解压完成以后，移动到
bat+ffmpeg批处理图片，图片批量转码张雨zy 音视频 ffmpeg
直接在cmd中输入//批量转码文件for%ain("*.png")doffmpeg-i"%a"-fs1024k"%~na.webp"//删除所有pngdel*.png@echooff表示执行了这条命令后关闭所有命令(包括本身这条命令)的回显。而echooff命令则表示关闭其他所有命令(不包括本身这条命令)的回显，@的作用就是关闭紧跟其后的一条命令的回显脚本完整代码写入脚本中后，需要多加一个%，例如
KVM+GFS分布式存储系统构建KVM高可用 henan程序媛分布式 GFS 高可用 KVM
一、案列分析1.1案列概述本章案例主要使用之前章节所学的KVM及GlusterFs技术,结合起来从而实现KVM高可用。利用GlusterFs分布式复制卷，对KVM虚拟机文件进行分布存储和冗余。分布式复制卷主要用于需要冗余的情况下把一个文件存放在两个或两个以上的节点,当其中一个节点数据丢失或者损坏之后，KVM仍然能够通过卷组找到另一节点上存储的虚拟机文件，以保证虚拟机正常运行。当节点修复之后，Glu
Kubernetes部署MySQL数据持久化沫殇-MS Kubernetes MySQL数据库 kubernetes mysql 容器
一、安装配置NFS服务端1、安装nfs-kernel-server：sudoapt-yinstallnfs-kernel-server2、服务端创建共享目录#列出所有可用块设备的信息lsblk#格式化磁盘sudomkfs-text4/dev/sdb#创建一个目录：sudomkdir-p/data/nfs/mysql#更改目录权限：sudochown-Rnobody:nogroup/data/nfs
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
tcp线程进程多并发 @莫福瑞算法
tcp线程多并发#include#defineSERPORT8888#defineSERIP"192.168.0.118"#defineBACKLOG20typedefstruct{intnewfd;structsockaddr_incin;}BMH;void*fun1(void*sss){intnewfd=accept((BMH*)sss)->newfd;structsockaddr_incin
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
Python字符串比较：如何判断两个字符串是否相等？程序员杨弋 Python全栈工程师学习指南 python 开发语言
在Python编程中，字符串是最常用的数据类型之一。当我们需要比较两个字符串时，通常需要判断它们是否相等。这篇文章将详细介绍Python中比较两个字符串的方法。1、使用“==”运算符比较字符串在Python中，可以使用“==”运算符比较两个字符串是否相等。这个运算符返回True，表示两个字符串相等，返回False，表示两个字符串不相等。例如：str1="hello"str2="hello"ifst
Python怎么判断两个字符串是否相等？老男孩IT教育 python 开发语言
在Python语言中，字符串是一种十分常见的数据类型，在很多业务场景下，我们需要判断两个字符串是否相等，这也是一个非常基础的操作，那么该如何实现呢?以下是详细的内容：Python中判断两个字符串是否相等有两种方法：直接比较和使用字符串方法。1、直接比较在Python中，我们可以使用==运算符来比较两个字符串是否相等。例如：str1='hello'str2='world'ifstr1==str2:p
linux挂载文件夹小码快撩 linux
1.使用NFS（NetworkFileSystem）NFS是一种分布式文件系统协议，允许一个系统将其文件系统的一部分共享给其他系统。检查是否安装NFSrpm-qa|grepnfs2.启动和启用NFS服务假设服务名称为nfs-server.service，你可以使用以下命令启动和启用它：sudosystemctlstartnfs-server.servicesudosystemctlenablenf
MacOS Catalina 从源码构建Qt6.2开发库之01: 编译Qt6.2源代码捕鲸叉 QT macos c++QT
安装xcode，cmake，ninjabrewinstallnodemac下安装OpenGL库并使之对各项目可见在macOS上安装OpenGL通常涉及到安装一些依赖库，如MGL、GLUT或者是GLEW等，同时确保LLVM的OpenGL框架和相关工具链的兼容性。以下是一个基本的安装步骤，你可以在终端中执行：安装Homebrew（如果还没有安装的话）：/bin/bash-c"$(curl-fsSLht
Python实现mysql命令行 xu-jssy python mysql adb
一、源码importosimportpymysqldefsql_shell():password=input("EnterPassword:")#访问密码ifpassword.strip()!="yyds":print("Bye")return#清空控制台输出os.system("cls"ifos.name=="nt"else"clear")try:#连接到MySQL数据库conn=pymysql
P1228 地毯填补问题「已注销」 c++数据结构算法
![](地毯填补问题-洛谷)#includeusingnamespacestd;#defineqwdfs(zx+l-1,zy+l-1,zx,zy,l);#definewedfs(zx+l-1,zy+l,zx,zy+l,l);#defineerdfs(zx+l,zy+l-1,zx+l,zy,l);#definertdfs(zx+l,zy+l,zx+l,zy+l,l);voiddfs(intx,int
2021-08-24 Say no to the next social 春生阁
Youknowthesort.Drinkswitholdfriendsyouhavenothingincommonwithanymore.Yoursecondcousinonceremoved’sbabyshowerwitha$100minimumpresentspend.Thesesortsofsocialengagementssuckthelivingtimeandmoneyoutofyou.
tf.get_collection() yalesaleng
此函数有两个参数，key和scope。Args:1.key:Thekeyforthecollection.Forexample,theGraphKeysclasscontainsmanystandardnamesforcollections.2.scope:(Optional.)Ifsupplied,theresultinglistisfilteredtoincludeonlyitemswhose
一串奇特的代码 hi武林高手
一个空的div元素，所有浏览器的渲染结果都不一样。body{display:table-cell;vertical-align:middle;//垂直居中}div{margin:atuo;height:100px;width:100px;outline:inset100pxgreen;//设置4个边框的样式outline-offset:-125px;//对轮廓进行偏移}html{display：t
STM32 如何生成随机数千千道 STM32 stm32 单片机物联网
目录一、引言二、STM32随机数发生器概述三、工作原理1.噪声源2.线性反馈移位寄存器（LFSR）3.数据寄存器（RNG_DR）4.监控和检测电路：5.控制和状态寄存器6.生成流程四、使用方法1.使能随机数发生器2.读取随机数3.错误处理五、注意事项1.随机数的质量2.安全性3.性能考虑六、总结一、引言在嵌入式系统开发中，随机数的生成常常是一个重要的需求。无论是用于加密、模拟、游戏还是其他需要不确
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
nfs服务搭建 GHope
nfs是什么？基哥度娘网络文件系统(NFS)是sun微系统最初开发的分布式文件系统协议,[1]允许客户端计算机上的用户通过计算机网络访问文件很像本地存储被访问。NFS与许多其他协议一样,在开放网络计算远程过程调用(很久以前RPC)系统上建立。NFS是在请求注释(RFC)中定义的开放标准,允许任何人实现协议。NFSNFS优势：节省本地存储空间，将常用的数据存放在一台NFS服务器上且可以通过网络访问，
hbase介绍 CrazyL- 云计算+大数据 hbase
hbase是一个分布式的、多版本的、面向列的开源数据库hbase利用hadoophdfs作为其文件存储系统，提供高可靠性、高性能、列存储、可伸缩、实时读写、适用于非结构化数据存储的数据库系统hbase利用hadoopmapreduce来处理hbase、中的海量数据hbase利用zookeeper作为分布式系统服务特点：数据量大：一个表可以有上亿行，上百万列（列多时，插入变慢）面向列：面向列（族）的
C语言实现一个简单的点歌系统鹿屿二向箔 c语言开发语言
创建一个简单的点歌系统可以用C语言实现，这里提供一个基本的框架。这个系统可以包括歌曲列表、用户选择歌曲的功能以及播放歌曲的功能。以下是一个示例代码：#include#include#defineMAX_SONGS100#defineMAX_LENGTH100typedefstruct{charname[MAX_LENGTH];charartist[MAX_LENGTH];}Song;typedef
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息