Linux nand system
现在很多嵌入式设备都使用nand flash,特别是一些需要大容量的存储介质时,nand flash的高性价比是别的存储介质不能代替的,下面就行nand系统的简要分析,并将nand flash独有的ECC和OOB进行说明。
注:有兴趣的可以先查看如何编写Linux下Nand Flash驱动这篇文章,里面对部分内容分析的很透彻。
nand flash的驱动不同于i2c/spi这类总线类驱动,nand与cpu直接的传输是通过IO来进行的,所以nand的驱动只有控制器驱动,没有设备器驱动,只需要platform即可。
nand的驱动是简单了,可是与nand硬件相关的ECC是一块内容,与内存管理相关的mtd是一块,与应用层相关的文件系统也算一块,所以是很大的一块内容。
1、控制器驱动
与其他platform总线的驱动类似,在arch或dts下面进行platform_device的add,如下:
static struct resource comcerto_nand_resources[] = {
{
.start = COMCERTO_NAND_FIO_ADDR,
.end = COMCERTO_NAND_FIO_ADDR + COMCERTO_NAND_IO_SZ - 1,
.flags = IORESOURCE_MEM,
}
};
static struct platform_device comcerto_nand = {
.name = "comcertonand",
.id = -1,
.dev = {
.platform_data = NULL,
},
.resource = comcerto_nand_resources,
.num_resources = ARRAY_SIZE(comcerto_nand_resources),
};
最后通过platform_add_devices()
函数进行添加。
platform_driver一般位于/drivers/mtd/nand
中,大概如下:
static struct platform_driver comcerto_nand_driver = {
.probe = comcerto_nand_probe,
.remove = __devexit_p(comcerto_nand_remove),
.driver = {
.name = "comcertonand",
},
};
int __init comcerto_nand_init(void)
{
return platform_driver_register(&comcerto_nand_driver);
}
static void __exit comcerto_nand_exit(void)
{
platform_driver_unregister(&comcerto_nand_driver);
}
module_init(comcerto_nand_init);
module_exit(comcerto_nand_exit);
device与driver的name相同则match到,执行probe函数,nand一般都是配合mtd使用的,所以probe函数的最后是mtd的添加函数mtd_device_parse_register()
,该函数最后调用add_mtd_partitions()
函数进行mtd分区的添加,关于mtd的知识查看《Linux mtd system》这篇文章,probe函数还有ecc的相关信息下面进行说明。
2、nand flash的读取/编程
在熟悉nand的读写之前,先看下nand的硬件大概结构,如下图:
可见其最小单位是Page,下表也列出flash与普通设备读写时的一些区别。
操作 | 普通设备(硬盘/内存等) | Flash |
---|---|---|
读取/写入的叫法 | 读取/写入 | 读取/编程(Program) |
读取/写入的最小单位 | Bit/位 | Page/页 |
擦除(Erase)操作的最小单位 | Bit/位 | Block/块 |
擦除操作的含义 | 将数据删除/全部写入0 | 将整个块都擦除成全是1,也就是里面的数据都是0xFF |
对于写操作 | 直接写即可 | 在写数据之前,要先擦除,然后再写 |
对nand flash的读取/编程有统一的规范ONFI(Open Nand Flash Interface specification),其定义了如下标准的读写指令:
可以看到,其中常见的一些命令使用的都是两个周期,比如
page read(0x00,0x30)、page write(0x80,0x10)、block erase(0x60,0xD0),其读写时序图如下:
先发送第一周期的起始指令0x00,后面跟着列地址和行地址,再接着发送第二周期的指令0x30,最后才得到要读取的数据,这部分内容在博客文章里面也有提到,记得去细看。
这些指令的定义在/include/linux/mtd/nand.h
中,如下:
/*
* Standard NAND flash commands
*/
#define NAND_CMD_READ0 0
#define NAND_CMD_READ1 1
#define NAND_CMD_RNDOUT 5
#define NAND_CMD_PAGEPROG 0x10
#define NAND_CMD_READOOB 0x50
#define NAND_CMD_ERASE1 0x60
#define NAND_CMD_STATUS 0x70
#define NAND_CMD_STATUS_MULTI 0x71
#define NAND_CMD_SEQIN 0x80
#define NAND_CMD_RNDIN 0x85
#define NAND_CMD_READID 0x90
#define NAND_CMD_ERASE2 0xd0
#define NAND_CMD_PARAM 0xec
#define NAND_CMD_RESET 0xff
#define NAND_CMD_LOCK 0x2a
#define NAND_CMD_UNLOCK1 0x23
#define NAND_CMD_UNLOCK2 0x24
/* Extended commands for large page devices */
#define NAND_CMD_READSTART 0x30
#define NAND_CMD_RNDOUTSTART 0xE0
#define NAND_CMD_CACHEDPROG 0x15
真正的实现函数为/drivers/mtd/nand/nand_base.c
中的nand_command_lp()
函数,如下:
static void nand_command_lp(struct mtd_info *mtd, unsigned int command,
int column, int page_addr)
{
/* Command latch cycle */
chip->cmd_ctrl(mtd, command & 0xff, /* 发送控制指令 1 */
NAND_NCE | NAND_CLE | NAND_CTRL_CHANGE);
if (column != -1 || page_addr != -1) {
int ctrl = NAND_CTRL_CHANGE | NAND_NCE | NAND_ALE;
/* Serially input address */
if (column != -1) {
/* Adjust columns for 16 bit buswidth */
if (chip->options & NAND_BUSWIDTH_16)
column >>= 1;
chip->cmd_ctrl(mtd, column, ctrl); /* 发送Col Addr 1 */
ctrl &= ~NAND_CTRL_CHANGE;
chip->cmd_ctrl(mtd, column >> 8, ctrl); /* 发送Col Addr 2 */
}
if (page_addr != -1) {
chip->cmd_ctrl(mtd, page_addr, ctrl); /* 发送Row Addr 1 */
chip->cmd_ctrl(mtd, page_addr >> 8, /* 发送Row Addr 2 */
NAND_NCE | NAND_ALE);
/* One more address cycle for devices > 128MiB */
if (chip->chipsize > (128 << 20))
chip->cmd_ctrl(mtd, page_addr >> 16, /* 发送Row Addr 3 */
NAND_NCE | NAND_ALE);
}
}
...
case NAND_CMD_READ0:
chip->cmd_ctrl(mtd, NAND_CMD_READSTART, /* 发送控制指令 2 */
NAND_NCE | NAND_CLE | NAND_CTRL_CHANGE);
...
}
这边值得注意的是由于nand的读写最小单位为page,所以不管你传的是不是该page的首地址,硬件都会把整页返回给你,但是读出来之后,内部数据指针会定位到所要读取的那个位置,所以读取是正常的。
3、nand flash的ECC
Nand Flash物理特性上使得其数据读写过程中会发生一定几率的错误,所以要有个对应的错误检测和纠正的机制,于是才有此ECC(Error Code Correction, 或者 Error Checking and Correcting),用于数据错误的检测与纠正。Nand Flash的ECC,常见的算法有海明码和BCH,这类算法的实现,可以是软件也可以是硬件。不同系统,根据自己的需求,采用对应的软件或者是硬件。
在上面nand的硬件框图里面,可以看到page下面有一块oob数据块,叫做空闲区域(spare area)/冗余区域(redundant area),而Linux系统中,一般叫做OOB(Out Of Band),Oob的读写操作,一般是随着页的操作一起完成的,即读写页的时候,对应地就读写了oob。
关于oob具体用途,总结起来有:
- 标记是否是坏快
- 存储ECC数据
- 存储一些和文件系统相关的数据。如jffs2就会用到这些空间存储一些特定信息,而yaffs2文件系统,会在oob中,存放很多和自己文件系统相关的信息。
ECC这部分还没看明白,后期进行补充。
Linux nand system的分析就到这边,有感悟时会持续会更新。
注:以上内容都是本人在学习过程积累的一些心得,难免会有参考到其他文章的一些知识,如有侵权,请及时通知我,我将及时删除或标注内容出处,如有错误之处也请指出,进行探讨学习。文章只是起一个引导作用,详细的数据解析内容还请查看Linux相关教程,感谢您的查阅。