PivotalGreenplum®6.8-安装指南-平台要求

平台要求

本主题描述了Pivotal Greenplum Database 6平台和操作系统软件要求。

重要提示:Pivotal并没有对开源版本的Greenplum数据库提供支持。Pivotal支持中心仅支持Pivotal Greenplum数据库。
  • 操作系统
    • 软件依赖关系
    • Java
  • 硬件与网络
  • 存储
  • 工具和扩展的兼容性
    • 客户端工具
    • 扩展
    • 数据连接器
    • GPText
    • Greenplum命令中心
  • Hadoop发行版
父主题: 安装和升级Greenplum
 

操作系统

Pivotal Greenplum 6在以下操作系统平台上运行:

  • 红帽企业版Linux 64位7.x(请参阅以下注释)
  • 红帽企业版Linux 64位6.x
  • CentOS 64位7.x
  • CentOS 64位6.x
  • Ubuntu 18.04 LTS

要点:在RedHat 6.x和CentOS 6.x系统上启用基于资源组的工作负载管理时,发现Greenplum数据库性能显著下降。此问题是由Linux cgroup内核bug引起的。此内核bug已在CentOS 7.x和Red Hat 7.x系统中修复。

如果您使用RedHat 6,并且于您的使用案例而言,可以接受启用资源组时的性能,那么请将内核升级到2.6.32-696版或更高版本,以受益于cgroups实现的其他修复。

注释:对于在7.3之前的Red Hat Enterprise Linux 7.x或CentOS 7.x上安装的Greenplum数据库,操作系统问题可能会导致正在运行大量工作负载的Greenplum数据库挂起。此Greenplum数据库问题是由Linux内核bug引起的。

RHEL 7.3和CentOS 7.3解决了该问题。

Greenplum数据库服务器在RHEL/CentOS系统上支持TLS版本1.2,在Ubuntu系统上支持TLS版本1.3。

软件依赖关系

Greenplum Database 6在RHEL/CentOS 6/7系统上需要以下软件包,这些软件包在安装PivotalGreenplum Database RPM包时会作为依赖项自动安装):
  • apr
  • apr-util
  • bash
  • bzip2
  • curl
  • krb5
  • libcurl
  • libevent
  • libxml2
  • libyaml
  • zlib
  • openldap
  • openssh
  • openssl
  • openssl-libs (RHEL7/Centos7)
  • perl
  • readline
  • rsync
  • R
  • sed (used by gpinitsystem)
  • tar
  • zip
Greenplum Database 6客户端软件需要以下操作系统软件包:
  • apr
  • apr-util
  • libyaml
  • libevent
在Ubuntu系统上,Greenplum Database 6需要以下软件包,当您使用Debian包安装器安装Greenplum Database时,这些软件包将作为依赖项自动安装:
  • libapr1
  • libaprutil1
  • bash
  • bzip2
  • krb5-multidev
  • libcurl3-gnutls
  • libcurl4
  • libevent-2.1-6
  • libxml2
  • libyaml-0-2
  • zlib1g
  • libldap-2.4-2
  • openssh-client
  • openssh-client
  • openssl
  • perl
  • readline
  • rsync
  • sed
  • tar
  • zip
  • net-tools
  • less
  • iproute2

Greenplum Database 6使用Python 2.7.12,该产品包含在产品安装中(而不是作为软件包依赖项安装)。

要点:SSL仅支持Greenplum数据库master主机  。它不能在segment主机上使用。
 
要点:对于所有Greenplum数据库主机系统,必须禁用SELinux。您也应该禁用防火墙软件,尽管如果出于安全目的需要也可以启用防火墙软件。请参阅禁用SELinux和防火墙软件。

Java

对于PL/Java和PXF,Greenplum 6  支持以下Java版本:
  • Open JDK 8或Open JDK 11,可从AdoptOpenJDK获得
  • Oracle JDK 8或Oracle JDK 11

硬件与网络

下表列出了在生产环境中的Linux系统上支持Greenplum Database的硬件服务器的最低推荐规格。Greenplum数据库系统中的所有主机服务器必须具有相同的硬件和软件配置。Greenplum还为其认证的硬件平台提供了硬件构建指南。建议您与Greenplum系统工程师一起检查预期的环境,以确保为Greenplum数据库配置适当的硬件。

表1.最低硬件要求
最低CPU 任何x86_64兼容的CPU
最小内存 每个服务器16 GB RAM
磁盘空间要求
  • 150MB/每个主机,用于Greenplum安装
  • 约300MB的元数据/每个segment实例
  • 数据有足够的可用空间,不超过磁盘容量的70%
网络要求 阵列中的10G以太网

存在多个接口时,建议使用NIC绑定

Pivotal Greenplum可以使用IPV4或IPV6协议。

存储

唯一支持运行Greenplum数据库的文件系统是XFS文件系统。Pivotal 明确支持所有其他文件系统。

Greenplum支持网络或共享存储:对运行Greenplum数据库的服务器而言,该共享存储被呈现为块设备,且XFS文件系统被安装在块设备上。Greenplum 支持网络文件系统。当使用网络或共享存储时,Greenplum数据库镜像必须与使用本地存储的方式相同,且不可以修改segment的镜像方案或恢复方案。

Pivotal Greenplum数据库不直接支持共享存储的其他功能(例如重复数据删除和/或复制),但可以在存储供应商的支持下使用,只要它们不干扰Greenplum Database在该站点上的预期操作(此操作由Pivotal决定)即可。

仅当将存储呈现为块设备且将XFS文件系统安装在此块设备上用来存储segment目录时,Greenplum数据库才能部署到虚拟化系统。

警告:在超融合基础架构(HCI)上运行Greenplum数据库具有性能、可伸缩性和稳定性方面的已知问题,因此不建议将其作为Pivotal Greenplum数据库的可伸缩解决方案,如果出现与基础架构相关的稳定性问题,Pivotal可能不提供支持。HCI虚拟化了传统硬件系统的所有元素,至少包括了虚拟化计算、虚拟化SAN和虚拟化网络。
 

Greenplum数据库支持在Amazon Web Services(AWS)服务器上:要么使用Amazon实例存储(Amazon使用卷名ephemeral[0-20]),要么使用Amazon Elastic Block Store(Amazon EBS)存储。如果使用Amazon EBS存储,则该存储应为Amazon EBS卷的RAID,并随XFS文件系统一起安装,以使其成为受支持的配置。

数据域增强(Data Domain Boost)

Pivotal Greenplum 6.0.0支持Data Domain Boost,用于Red Hat Enterprise Linux上的备份。下表列出了Pivotal Greenplum 6.x支持的Data Domain Boost SDK和DDOS版本。

表2. Data Domain Boost兼容性
Pivotal Greenplum Data Domain Boost DDOS
6.x 3.3 6.1(所有版本)

6.0(所有版本)

注意:除了上表中列出的DDOS版本之外,Pivotal Greenplum还支持认证版本后的所有次要修补版本(第四位数字版本)。

工具和扩展的兼容性

  • 客户端工具
  • 扩展
  • 数据连接器
  • GPText
  • Greenplum命令中心

客户端工具

Greenplum Database 6在各种平台上发布了Clients工具包,可用于从客户端系统访问Greenplum Database。以下平台支持Greenplum 6 Clients工具包:

  • 红帽企业版Linux x86_64 6.x(RHEL 6)
  • 红帽企业版Linux x86_64 7.x(RHEL 7)
  • Ubuntu 18.04 LTS
  • Windows 10(32位和64位)
  • Windows 8(32位和64位)
  • Windows Server 2012(32位和64位)
  • Windows Server 2012 R2(32位和64位)
  • Windows Server 2008 R2(32位和64位)

Greenplum 6 客户端程序包含Greenplum 5包中提供的客户端程序和加载程序,以及数据库/角色/语言命令以及Greenplum-Kafka集成和Greenplum Streaming Server命令工具。有关Greenplum 6 客户端工具的安装和使用详细信息,请参阅Greenplum 客户端和加载器工具包。

扩展

下表列出了与此版本的Greenplum Database 6兼容的Pivotal Greenplum Extensions版本。

表3. Pivotal Greenplum 6扩展兼容性
组件 包版本 附加信息
PL / Java 2.0.2 支持Java 8和11。
Python数据科学模块软件包 2.0.2  
PL / R 3.0.3 (CentOS)R 3.3.3

(Ubuntu)您安装了R 3.5.1+。

R数据科学库包 2.0.2  
PL /容器 2.1.2  
适用于R的PL/容器映像 2.1.2 R 3.6.3
适用于Python的PL/容器映像 2.1.2 Python 2.7.12

Python 3.7

PL/容器Beta 3.0.0-测试版  
适用于R的PL/容器Beta映像 3.0.0-测试版 R 3.4.4
GreenplumR 1.0.0 支持R 3.6+。
MADlib机器学习 1.17、1.16 支持矩阵,见MADlib FAQ。
PostGIS空间和地理对象

2.5.4 + pivotal.2

2.5.4 + pivotal.1

2.1.5+pivotal2-2

 

有关Oracle兼容性功能的信息,请参见Oracle兼容性功能。

以下Greenplum数据库扩展与Pivotal Greenplum数据库一起安装:
  • 模糊字符串匹配扩展
  • PL/Python扩展
  • pgcrypto扩展

数据连接器

  • Greenplum平台扩展框架(PXF)v5.12——PXF(已集成到与Greenplum Database 6),提供对Hadoop、对象存储和SQL外部数据存储的访问。有关PXF配置和使用信息,请参阅Greenplum数据库管理员指南中的使用PXF访问外部数据。
  • Greenplum-Kafka集成——Pivotal Greenplum-Kafka集成提供了从Kafka群集到Pivotal Greenplum数据库群集的高速并行数据传输,以进行批式和流式的ETL处理。它需要Kafka 0.11版本或更高版本,才能保证一次交付。有关此功能的更多信息,请参阅 Pivotal Greenplum-Kafka集成文档。
  • Greenplum Streaming Server v1.3.6——Pivotal Greenplum Streaming Server是一个ETL工具,可提供从Informatica、Kafka和自定义客户端数据源到Pivotal Greenplum数据库集群的高速并行数据传输。有关此功能的更多信息,请参阅 Pivotal Greenplum Streaming Server文档。
  • Greenplum Informatica Connector v1.0.5——Pivotal Greenplum Informatica Connector支持从Informatica PowerCenter群集到Pivotal Greenplum数据库群集的高速数据传输,以进行批式和流式的ETL操作。
  • Greenplum Spark连接器v1.6.2——Pivotal Greenplum Spark连接器支持使用Spark的Scala API在Greenplum数据库和Apache Spark集群之间进行高速并行数据传输。
  • Progress DataDirect JDBC驱动程序v5.1.4.000223——Progress DataDirect JDBC驱动程序与Type 4体系结构兼容,但是提供了将它们定义为Type 5驱动程序的高级功能。
  • Progress DataDirect ODBC驱动程序v7.1.6(07.16.0301)——Progress DataDirect ODBC驱动程序使第三方应用程序可以通过一个通用接口连接到Pivotal Greenplum数据库系统。

注意: Pivotal Greenplum 6不支持Cognos Analytics V11的ODBC驱动程序。

Greenplum数据库不支持通过ODBC驱动程序连接到IBM 的Cognos软件。它支持使用适用于Pivotal Greenplum的DataDirect JDBC驱动程序连接到IBM Cognos软件。该驱动程序可从Pivotal Network下载。

GPText

Pivotal Greenplum数据库6与Pivotal Greenplum Text版本3.3.1和更高版本兼容。有关其他兼容性信息,请参见Greenplum Text文档。

Greenplum命令中心

Pivotal Greenplum数据库6.8仅与Pivotal Greenplum Command Center 6.2和更高版本兼容。有关其他兼容性信息,请参阅Greenplum命令中心文档。

Hadoop发行版

Greenplum数据库通过Greenplum平台扩展框架(PXF)提供对HDFS的访问。

PXF可以使用Cloudera、Hortonworks数据平台、MapR和一般的Apache Hadoop发行版。PXF捆绑了它依赖的所有JAR文件,包括以下Hadoop库:

表4. PXF Hadoop支持的平台
PXF版本 Hadoop版本 Hive服务器版本 HBase服务器版本
5.12、5.11.1、5.10.1 2.x,3.1 + 1.x,2.x,3.1 + 1.3.2
5.8.2 2.x 1.x 1.3.2
5.8.1 2.x 1.x 1.3.2
注意:如果您计划访问存储在Cloudera Hadoop集群中的JSON格式数据,则PXF需要使用Cloudera 5.8或更高版本的Hadoop发行版。

你可能感兴趣的:(Greenplum)