HDFS数据读写过程及编程实例

1.读数据的基本原理

1.1 FileSystem

HDFS数据读写过程及编程实例_第1张图片

(1)FileSystem是一个通用文件系统的抽象基类,可以继承FileSystem去实现很多具体子类。

1° FileSystem被分布式文件系统HDFS继承,实现DistributedFileSystem子类;

2° 通过Http的方式去访问相关文件;

3° 通过FTP的方式去读写文件。

(2)FileSystem常用的几个方法:

1° open():创建一个输入流,返回的是FSDataInputStream对象,在HDFS中实际创建的是与HDFS相对应的DFSInputStream,即FSDataInputStream对象创建之后里面封装了一个DFSInputStream;【注意】DFSInputStream是专门针对HDFS的实现。

2° read():读数据。

3° close():关闭文件。

1.2 读数据的具体流程

你可能感兴趣的:(hdfs,hadoop,big,data)