配置HDFS HttpFS和WebHDFS

HDFS支持两种RESTful接口:WebHDFS和HttpFS。
WebHDFS默认端口号为50070,HttpFS默认端口号为14000。
默认启动WebHDFS而不会启动HttpFS,而HttpFS需要通过sbin/httpfs.sh来启动。
WebHDFS模式客户端和DataNode直接交互,HttpFS是一个代理模式。对于Hue,如果HDFS是HA方式部署的,则只能使用HttpFS模式。
HttpFS是独立的模块,有自己的配置文件httpfs-site.xml、环境配置文件httpfs-env.sh和日志配置文件httpfs-log4j.properties,需独立启动。
而WebHDFS是HDFS内置模块,无自己的配置文件、环境配置文件和日志配置文件,随HDFS而启动。


WebHDFS配置,在core-site.xml中加入以下内容:

    hadoop.proxyuser.$username.hosts
    *


    hadoop.proxyuser.$groupname.groups
    *

“$username”的值为启动HDFS的用户名,“$groupname”为启动HDFS的用户组名。


HttpFS配置,在core-site.xml中加入以下内容:

    hadoop.proxyuser.httpfs.hosts
    *


    hadoop.proxyuser.httpfs.groups
    *



对于HttpFS,还需要在httpfs-site.xml中加入以下内容:

    httpfs.proxyuser.$username.hosts
    *


    httpfs.proxyuser.$groupname.groups
    *

“$username”的值为启动HttpFS的用户名,“$groupname”为启动HttpFS的用户组名。


环境配置文件httpfs-env.sh可以不用修改,直接使用默认的值,当使用sbin/httpfs.sh来启动HttpFS时会屏幕输出HTTPFS_HOME等值。

你可能感兴趣的:(配置HDFS HttpFS和WebHDFS)