python实现对HDFS的文件操作

在HDFS中,要实现对文件的操作,一般可以在shell中发送指令完成,但这样太麻烦了。

当然我们可以调用HDFS的API,这里我们可以使用python的pyHdfs库来实现对HDFS的文件操作。

一、环境准备

1、python3.5

2、pyHdfs

二、pyHdfs安装

1、pip3 install --upgrade pip

先更新pip,防止版本过低

2、pip3 install pyHdfs

三、调用方法

详细的可见官方文档

1、实例化客户端

from pyhdfs import HdfsClient
client = HdfsClient(hosts='localhost:50070')
print(client.list_status('/'))
2、各类方法列举

(1)copy_from_local(localsrc, dest, **kwargs)

(2)copy_to_local(src, localdest, **kwargs)

(3)delete(path, **kwargs)

(4)exists(path, **kwargs)

(5)listdir(path, **kwargs)

(6)mkdirs(path, **kwargs)

...


你可能感兴趣的:(杂七杂八)