大数据系列教程008-DFS介绍

1.DFS介绍

由于一台机器的存储容量有限,一旦数据量达到足够的级别,就需要将数据存放在多台机器上,这就是分布式文件系统,又称之为 DFS(Distributed File System),DFS 是 HDFS 的基础。

 

2.什么是DFS

分布式文件系统 DFS 是基于 Master/Slave 模式,通常一个分布式文件系统提供多个供用户访问的服务器,一般都会提供备份和容错的功能。分布式文件系统管理的物理资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连,而非文件系统管理的物理存储资源一定直接连在本地节点上

 

3.DFS结构

分布式文件系统在物理结构上是由计算机集群中的多个节点构成的,如图 3.1 所示。这些节点分为两类,一类叫「主节点」(Master Node),也被称为「名称节点」(NameNode);另一类叫「从节点」(SlaveNode),也被称为「数据节点」(DataNode)。

大数据系列教程008-DFS介绍_第1张图片

 

你可能感兴趣的:(大数据系列教程,hadoop,分布式,大数据,DFS)