HDFS的设计

总结下HDFS的设计特点

超大文件,指几百MB,几百GB甚至几百TB大小的文件

流式数据访问,HDFS的构建思路为:一次写入、多次读取是最高效的访问模式

商用硬件,不需要运行在昂贵且高可靠的硬件上

低时间延迟的数据访问,应用与低时间延迟的数据访问场景,记住,HDFS是为高数据吞吐量应用优化的

大量的小文件,由于namenode将文件系统的元数据存储在内存中,因此该文件系统所能存储的文件总数受限于namenode的内存总量

多用户写入;任意修改文件,HDFS文件中只有一个writer,而且写操作总是将数据添加到文件的末尾。它不支持多个写入者的操作,也不支持在文件的任意位置进行修改



你可能感兴趣的:(优化,存储)