Linux nand system

题图：gratisography

Linux nand system

现在很多嵌入式设备都使用nand flash，特别是一些需要大容量的存储介质时，nand flash的高性价比是别的存储介质不能代替的，下面就行nand系统的简要分析，并将nand flash独有的ECC和OOB进行说明。

注：有兴趣的可以先查看如何编写Linux下Nand Flash驱动这篇文章，里面对部分内容分析的很透彻。

nand flash的驱动不同于i2c/spi这类总线类驱动，nand与cpu直接的传输是通过IO来进行的，所以nand的驱动只有控制器驱动，没有设备器驱动，只需要platform即可。

nand的驱动是简单了，可是与nand硬件相关的ECC是一块内容，与内存管理相关的mtd是一块，与应用层相关的文件系统也算一块，所以是很大的一块内容。

1、控制器驱动

与其他platform总线的驱动类似，在arch或dts下面进行platform_device的add，如下：

static struct resource comcerto_nand_resources[] = {
{
    .start  = COMCERTO_NAND_FIO_ADDR,
    .end    = COMCERTO_NAND_FIO_ADDR + COMCERTO_NAND_IO_SZ - 1,
    .flags  = IORESOURCE_MEM,
}
};

static struct platform_device comcerto_nand = {
    .name       = "comcertonand",
    .id     = -1,
    .dev        = {
                .platform_data  = NULL,
    },
    .resource   = comcerto_nand_resources,
    .num_resources  = ARRAY_SIZE(comcerto_nand_resources),
};

最后通过platform_add_devices()函数进行添加。

platform_driver一般位于/drivers/mtd/nand中，大概如下：

static struct platform_driver comcerto_nand_driver = {
    .probe = comcerto_nand_probe,
    .remove = __devexit_p(comcerto_nand_remove),
    .driver = {
           .name = "comcertonand",
           },
};

int __init comcerto_nand_init(void)
{
    return platform_driver_register(&comcerto_nand_driver);
}

static void __exit comcerto_nand_exit(void)
{
    platform_driver_unregister(&comcerto_nand_driver);
}

module_init(comcerto_nand_init);
module_exit(comcerto_nand_exit);

device与driver的name相同则match到，执行probe函数，nand一般都是配合mtd使用的，所以probe函数的最后是mtd的添加函数mtd_device_parse_register()，该函数最后调用add_mtd_partitions()函数进行mtd分区的添加，关于mtd的知识查看《Linux mtd system》这篇文章，probe函数还有ecc的相关信息下面进行说明。

2、nand flash的读取/编程

在熟悉nand的读写之前，先看下nand的硬件大概结构，如下图：

nand_flash_layout

可见其最小单位是Page，下表也列出flash与普通设备读写时的一些区别。

操作	普通设备(硬盘/内存等)	Flash
读取/写入的叫法	读取/写入	读取/编程(Program)
读取/写入的最小单位	Bit/位	Page/页
擦除(Erase)操作的最小单位	Bit/位	Block/块
擦除操作的含义	将数据删除/全部写入0	将整个块都擦除成全是1，也就是里面的数据都是0xFF
对于写操作	直接写即可	在写数据之前，要先擦除，然后再写

对nand flash的读取/编程有统一的规范ONFI(Open Nand Flash Interface specification)，其定义了如下标准的读写指令：

ONFI标准

可以看到，其中常见的一些命令使用的都是两个周期，比如
page read（0x00,0x30）、page write（0x80,0x10）、block erase（0x60,0xD0），其读写时序图如下：

nand_read_op_flow

先发送第一周期的起始指令0x00，后面跟着列地址和行地址，再接着发送第二周期的指令0x30，最后才得到要读取的数据，这部分内容在博客文章里面也有提到，记得去细看。

这些指令的定义在/include/linux/mtd/nand.h中，如下：

/*
 * Standard NAND flash commands
 */
#define NAND_CMD_READ0      0
#define NAND_CMD_READ1      1
#define NAND_CMD_RNDOUT     5
#define NAND_CMD_PAGEPROG   0x10
#define NAND_CMD_READOOB    0x50
#define NAND_CMD_ERASE1     0x60
#define NAND_CMD_STATUS     0x70
#define NAND_CMD_STATUS_MULTI   0x71
#define NAND_CMD_SEQIN      0x80
#define NAND_CMD_RNDIN      0x85
#define NAND_CMD_READID     0x90
#define NAND_CMD_ERASE2     0xd0
#define NAND_CMD_PARAM      0xec
#define NAND_CMD_RESET      0xff

#define NAND_CMD_LOCK       0x2a
#define NAND_CMD_UNLOCK1    0x23
#define NAND_CMD_UNLOCK2    0x24

/* Extended commands for large page devices */
#define NAND_CMD_READSTART  0x30
#define NAND_CMD_RNDOUTSTART    0xE0
#define NAND_CMD_CACHEDPROG 0x15

真正的实现函数为/drivers/mtd/nand/nand_base.c中的nand_command_lp()函数，如下：

static void nand_command_lp(struct mtd_info *mtd, unsigned int command,
                int column, int page_addr)
{
    /* Command latch cycle */
    chip->cmd_ctrl(mtd, command & 0xff,              /* 发送控制指令 1 */
               NAND_NCE | NAND_CLE | NAND_CTRL_CHANGE);

    if (column != -1 || page_addr != -1) {
        int ctrl = NAND_CTRL_CHANGE | NAND_NCE | NAND_ALE;

        /* Serially input address */
        if (column != -1) {
            /* Adjust columns for 16 bit buswidth */
            if (chip->options & NAND_BUSWIDTH_16)
                column >>= 1;
            chip->cmd_ctrl(mtd, column, ctrl);       /* 发送Col Addr 1 */
            ctrl &= ~NAND_CTRL_CHANGE;
            chip->cmd_ctrl(mtd, column >> 8, ctrl);  /* 发送Col Addr 2 */
        }
        if (page_addr != -1) {
            chip->cmd_ctrl(mtd, page_addr, ctrl);    /* 发送Row Addr 1 */
            chip->cmd_ctrl(mtd, page_addr >> 8,      /* 发送Row Addr 2 */
                       NAND_NCE | NAND_ALE);
            /* One more address cycle for devices > 128MiB */
            if (chip->chipsize > (128 << 20))
                chip->cmd_ctrl(mtd, page_addr >> 16, /* 发送Row Addr 3 */
                           NAND_NCE | NAND_ALE);
        }
    }
    ...
     case NAND_CMD_READ0:
        chip->cmd_ctrl(mtd, NAND_CMD_READSTART,      /* 发送控制指令 2 */
                   NAND_NCE | NAND_CLE | NAND_CTRL_CHANGE);
    ...
}

这边值得注意的是由于nand的读写最小单位为page，所以不管你传的是不是该page的首地址，硬件都会把整页返回给你，但是读出来之后，内部数据指针会定位到所要读取的那个位置，所以读取是正常的。

3、nand flash的ECC

Nand Flash物理特性上使得其数据读写过程中会发生一定几率的错误，所以要有个对应的错误检测和纠正的机制，于是才有此ECC(Error Code Correction, 或者 Error Checking and Correcting)，用于数据错误的检测与纠正。Nand Flash的ECC，常见的算法有海明码和BCH，这类算法的实现，可以是软件也可以是硬件。不同系统，根据自己的需求，采用对应的软件或者是硬件。

在上面nand的硬件框图里面，可以看到page下面有一块oob数据块，叫做空闲区域（spare area）/冗余区域（redundant area），而Linux系统中，一般叫做OOB（Out Of Band），Oob的读写操作，一般是随着页的操作一起完成的，即读写页的时候，对应地就读写了oob。

关于oob具体用途，总结起来有：

标记是否是坏快
存储ECC数据
存储一些和文件系统相关的数据。如jffs2就会用到这些空间存储一些特定信息，而yaffs2文件系统，会在oob中，存放很多和自己文件系统相关的信息。

ECC这部分还没看明白，后期进行补充。

Linux nand system的分析就到这边，有感悟时会持续会更新。

注：以上内容都是本人在学习过程积累的一些心得，难免会有参考到其他文章的一些知识，如有侵权，请及时通知我，我将及时删除或标注内容出处，如有错误之处也请指出，进行探讨学习。文章只是起一个引导作用，详细的数据解析内容还请查看Linux相关教程，感谢您的查阅。

Linux nand system