不使用Cloudera Manager安装Impala(翻译)--格式有问题

不使用Cloudera Manager安装Impala

在手工安装Impala之前, 请确认所有相关的节点有合适的硬件配置,安装了正确版本的操作系统和CDH。参见 Cloudera Impala需求了解详细信息。

你可以在多个节点或一个节点上安装Impala:

  • 在多台机器上使用分布式配置安装Impala。为了最佳性能,在所有数据节点上安装Impala。
  • 在单一节点上安装Impala,作为伪分布式集群

在节点上安装Impala:

  1. 参照 CDH 5 安装手册 中安装单元描述安装Impala

  2. 参照 CDH 5 安装手册 中Hive安装描述,在集群中安装Hive metastore。作为其中一个步骤,应配置外部数据库作为Hive metastore。Impala使用相同的数据库作为它的表的元数据。可以选择MySQL或PostgreSQL数据库作为metastore(在 CDH 5 安装手册 中有每种数据库的步骤说明)。Cloudera推荐使用Hive metastore服务而不是直接连接到metastore数据库;当在CDH 4.1中运行Impala时这一步骤是必需的。确认/etc/impala/hive-site.xml文件包含以下配置,替换其中的metastore_server_host为正确的主机名:

    hive.metastore.uris

    thrift://metastore_server_host:9083

    hive.metastore.client.socket.timeout

    3600

    MetaStore Client socket timeout in seconds

  3. (可选)假如你在所有节点上都安装了Hive所有组件,可以通过启动Hive命令行并查询下列的表来验证metastore配置正确。当已经验证正确启动了命令行,则推出命令行界面继续下一步安装:

    $ hive
    Hive history file=/tmp/root/hive_job_log_root_201207272011_678722950.txt
    hive> show tables;
    table1
    table2
    hive> quit;
    $

  4. 确认你的包管理命令使用了Impala库设置,如Cloudera Impala 需求中描述的那样(Confirm that your package management command is aware of the Impala repository settings, as described in Cloudera Impala Requirements)。(资料库位置与CDH不同) 。你可能需要下载repo或list文件到系统目录/etc下。

  5. 使用以下命令 之一 安装Impala包:

RHEL, Oracle Linux, CentOS

<!-- lang: shell -->
$ sudo yum install impala             # Binaries for daemons
$ sudo yum install impala-server      # Service start/stop script
$ sudo yum install impala-state-store # Service start/stop script
$ sudo yum install impala-catalog     # Service start/stop script

SUSE

<!-- lang: shell -->
$ sudo zypper install impala             # Binaries for daemons
$ sudo zypper install impala-server      # Service start/stop script
$ sudo zypper install impala-state-store # Service start/stop script
$ sudo zypper install impala-catalog     # Service start/stop script

Debian,Ubuntu

<!-- lang: shell -->
$ sudo apt-get install impala             # Binaries for daemons
$ sudo apt-get install impala-server      # Service start/stop script
$ sudo apt-get install impala-state-store # Service start/stop script
$ sudo apt-get install impala-catalog     # Service start/stop script  

注意:Cloudera推荐不要在HDFS的NameNode节点安装Impala。在NameNode节点上安装Impala不能访问本地数据,并且可能会与HDFS NameNode内存争用,导致消极影响。

  1. 复制hive-site.xml、core-site.xml、hdfs-site.xml文件到Impala配置目录中,默认是/etc/impala/conf。假如不存在则先创建该目录。

  2. 使用下列命令之一在希望执行查询的机器上安装impala-shell。可以在任意能连接到运行了impalad进程的数据节点的机器上安装impala-shell
    RHEL/CentOS

    $ sudo yum install impala-shell
    SUSE

    $ sudo zypper install impala-shell
    Debian/Ubuntu

    $ sudo apt-get install impala-shell

  3. 参照 Impala安装之后的配置 描述完成需求或推荐配置。其中一些配置是强制性的(当使用Cloudera Manager安装时是自动完成的)

  4. 安装与配置完成后,参考 启动Impala 了解在你集群的相关节点上如何启动软件

你可能感兴趣的:(不使用Cloudera Manager安装Impala(翻译)--格式有问题)