HDFS优缺点

优点:
1,高容错:保存多个副本;副本丢失自动恢复。
2,适合批量数据处理。
3,流式文件写入:一次写入多次读取,一旦写入不能修改只能增加(append);这样可以保证数据的一致性。
4,可以部署在廉价的机器上。(普通PC ,linux)

缺点:
1,低时间延迟的访问:要求低时间延迟的数据访问的应用,不适合在HDFS上运行。HDFS是提高数据吞吐量的应用优化的,但可能会以提高时间延迟为代价。
2,大量小文件不适合:由于namenode将文件系统的元数据存储在内存中,因此文件系统所能存储的文件数量受限制于namenode的内存容量。
3,并发写入,文件随机修改:一个文件只有一个写线程,不能多个线程同时读写,仅支持文件的追加(append),不支持修改。

你可能感兴趣的:(HDFS优缺点)