明月清风，良宵美酒

星环TDH产品详解

一、简介
- 1.1 Transwarp Dta Hub介绍
二、环境要求
- 2.1 硬件环境要求
- - 2.1.1 服务器的RAID配置
三、安装前的检查
- 3.1 系统磁盘分区要求
- - 3.1.1 Redhat/CentOS
  - 3.1.2 SUSE
- 3.2 磁盘目录规划要求
- 3.3 内存容量要求
- 3.4 网络设置
- 3.5 集群和网络拓扑要求
- 3.6 NTP服务设置
- 3.7 安全设置
- 3.8 系统的推荐设置
四、TDH服务的角色
- 4.1 Transwarp_License_Cluster角色
- 4.2 TCOS角色
- 4.3 Flannel角色
- 4.4 Zookeeper角色
- 4.5 HDFS角色
- 4.6 YARN角色
- 4.7 Search角色
- 4.8 Hyperbase角色
- 4.9 TxSQL角色
- 4.10 TDDMS角色
- 4.11 Inceptor角色
- 4.12 Pilot角色
- 4.13 EventStore角色
- 4.14 Notification角色
- 4.15 Governor角色
- 4.16 KMS角色
- 4.17 Transporter角色
- 4.18 Workflow角色
- 4.19 Rubik角色
- 4.20 KeyByte角色
- 4.21 QuarkGateway角色
- 4.22 日志分析组件角色
- 4.23 Discover角色
- 4.24 Slipstream角色
- 4.25 Slipboard角色
五、安装准备
- 5.1 操作系统安装
- 5.2 安装前系统配置改动
- 5.3 安装介质
- - 5.3.1 安装介质获取方式
  - 5.3.2 安装介质使用说明
六、安装Manager
- 6.1 安装Manager
- 6.2 升级Manager
七、配置集群
- 7.1 全局设定
- - 7.1.1 DNS配置
  - 7.1.2 NTP配置
- 7.2 添加/刪除集群服务器
八、安装服务
- 8.1 上传产品包
- 8.2 选择服务
- 8.3 服务角色的分配
- - 8.3.1 部署角色多实例
  - 8.3.2 角色属性配置
- 8.4 配置安全
- 8.5 服务的配置
- - 8.5.1 服务的可配置项
  - 8.5.2 特殊配置要求
- 8.6 服务的安装
- 8.7 安装TDH客户端
- - 8.7.1 安裝步驟
九、向集群添加服务
十、集群扩容指导
- 10.1 扩容前节点检查
- 10.2 扩容节点操作
- - 10.2.1 添加节点
  - - 10.2.1.1 选择集群
    - 10.2.1.2 全局设定
    - 10.2.1.3 编辑机柜
    - 10.2.1.4 配置仓库
    - 10.2.1.5 节点分配
  - 10.2.2 扩容角色
  - - 10.2.2.1 分配角色
    - 10.2.2.2 配置服务
    - 10.2.2.3 应用修改
十一、管理面与业务面隔离场景安装部署说明
- 11.1 安装Manager服务
- 11.2 双平面隔离配置
- - 11.2.1 修改manager配置文件。
  - 11.2.2 修改Aquila配置，保证管理面正常访问aquila服务
  - 11.2.3 修改集群机器yum repo源配置
十二、许可证的激活与认证
- 12.1 许可证管理
- 12.2 许可证激活和使用
- 12.3 查看许可证授权管理
- 12.4 许可证过期预警
十三、安装和设置问题及回答

一、简介

1.1 Transwarp Dta Hub介绍

2006年Hadoop技术的出现标志着大数据技术时代的开始，经过10多年的蓬勃发展，大数据技术已经真正承托起一大批企业的数据基础架构。经过4年的快速演进，Transwarp Data Hub（简称TDH）已成为国际一流的大数据平台。从2016年起，TDH正式成为Gartner认可的Hadoop国际主流发行版本。

TDH是国内外领先的高性能平台，比开源基于Hadoop MapReduce计算框架的版本快10x~100x倍。TDH应用范围覆盖各种规模和不同数据量的企业，通过内存计算、高效索引、执行优化和高度容错的技术，使得一个平台能够处理GB级到PB级的数据，并且在每个数量级上，都能比现有技术提供更快的性能；企业客户不再需要混合架构，TDH可以伴随企业客户的数据增长，动态不停机扩容，避免MPP或混合架构数据迁移的棘手问题。

TDH主要提供5款核心产品：Transwarp Inceptor是大数据分析数据库，Transwarp Slipstream是实时计算引擎，Transwarp Discover专注于利用机器学习从数据中提取价值内容，Transwarp Hyperbase用于处理非结构化数据，Transwarp Scope用于构建企业搜索引擎。通过使用TDH，企业能够更有效的利用数据构建核心商业系统，加速商业创新。

TDH产品的主要技术优势包括以下几个方面：

1.极致的性能与可扩展性

TDH的批处理速度是开源Hadoop的10-100倍，是MPP的5-10倍，可以对从GB到PB级的数据量实现复杂的查询和分析。TDH具有高可扩展性，用户可以通过增加集群节点数量，线性提高系统的处理能力。

2.容器技术与大数据平台

TDH支持部署于TCOS之上。TCOS是为大数据应用量身订做的云操作系统，基于Docker和Kubernetes，支持一键部署TDH、扩容、缩容，同时支持基于优先级的抢占式资源调度和细粒度资源分配。

3.完整的SQL和ACID支持

Transwarp Inceptor是第一个实现完整SQL支持的Hadoop发行产品。它不仅支持SQL 2003，Oracle PL/SQL以及DB2 SQL PL，还实现了完整的ACID和CRUD功能。TDH提供JDBC和ODBC驱动连接，方便第三方工具运行于TDH之上。

4.低延迟的流处理 Transwarp Slipstream是同时支持事件驱动和微批处理的流处理引擎，计算延迟最低可至5ms。它提供标准的SQL编程接口，还支持高可用性（HA）和Exactly-Once的语义，从而支持7x24小时的生产业务。

5.丰富的机器学习和深度学习功能

Transwarp Discover支持用户通过R语言和Python开发机器学习项目，也可以用图形化的工具做分析。

6.大数据上的全文搜索

Transwarp Search支持通过SQL实现大数据上的秒级全文搜索，它利用层次化存储、堆外内存管理等创新性技术，极大的提高了系统的可用性。此外，Search还可以结合Inceptor提供较强的数据分析能力。

7.图形化的大数据开发工具套件

Transwarp Studio是TDH中的大数据开发工具集，包括元数据管理Governor、工作流Workflow、数据整合工具Transporter，Cube设计工具Rubik以及报表工具Pilot。用户可以使用这些图形化工具来提高大数据的开发效率，降低技术门槛。

8.多样化的数据处理功能

Transwarp Hyperbase用于存储和计算结构化或非结构化数据，包括日志记录、JSON/XML文件以及二进制数据（如图像和视频）。Hyperbase底层是KV的数据库，因此其非常适合高频次的数据入库、高并发精确检索等业务。

9.简易的操作和管理

Transwarp Manager是专门用于部署、管理和运维TDH集群的组件。它支持产品一键安装、一键升级和图形化运维，并提供了健康检测功能，帮助用户简化运维过程。

10.统一的安全/多租户管理

Transwarp Guardian是TDH平台中实现安全控制和资源管理的中央服务平台，它支持Kerberos和LDAP认证，可以做细粒度的权限控制，并且提供租户管理功能。

二、环境要求

2.1 硬件环境要求

Transwarp Data Hub(简称TDH)提供集群服务来保证服务的高可用性，因此集群系统必须是3台以上物理服务器组成，每台服务器必须具备以下最低配置：

2颗6核心或以上带超线程x86指令集CPU的服务器
64GB以上内存
2个300G以上的硬盘做RAID1，作为系统盘
4个以上的300GB容量以上的硬盘作为数据存放硬盘
2个千兆以上网卡

为实现较好的性能并实现最高的性价比，TDH针对集群内不同的模块有不同的推荐配置，Namenode和Transwarp Manager推荐使用以下配置：

2颗6核带超线程的x86指令集CPU服务器(比如Intel® Xeon® Gold-5218 Processor)
128GB以上内存
6个600G以上的硬盘做RAID1作为系统盘和管理数据
2个千兆以上网口的网卡

数据节点（Datanode）的硬件配置应该根据不同应用的特点进行选配，使用Inceptor，Discover和Slipstream配置的用户需要比较高的计算能力的服务器，其数据节点的推荐配置如下：

2颗8核心或以上带超线程x86指令集CPU的服务器(比如Intel® Xeon® Gold-5218 Processor)
128GB以上内存
2个300G以上的硬盘做RAID1，作为系统盘
10个以上的2TB容量以上的硬盘作为数据存放硬盘
2个千兆以上网卡

TDH主要提供5款核心产品：Transwarp Inceptor是大数据分析数据库，Transwarp Slipstream是实时计算引擎，Transwarp Discover专注于利用机器学习从数据中提取价值内容，Transwarp Hyperbase用于处理非结构化数据，Transwarp Search用于构建企业搜索引擎。通过使用TDH，企业能够更有效的利用数据构建核心商业系统，加速商业创新。

系统盘可以做RAID1。数据盘若需要RAID，请做RAID0。

2.1.1 服务器的RAID配置

为了优化系统的性能和稳定性，星环科技要求对服务器做以下RAID配置：

对于新部署的集群（没有数据），服务器如果有RAID卡但没有开启，需要开启RAID卡，并给每块磁盘单独做RAID0；
对于正在使用的集群（有存量数据），如果服务器配置了RAID卡但没有开启，需要给NameNode，JournalNode，TCOS
Master的etcd，TxSQL，Guardian ApacheDS，ZooKeeper等服务对应的磁盘单独做RAID0；
如果没有RAID卡，建议采购，并至少给NameNode，JournalNode，TCOS
Master的etcd，TxSQL，Guardian ApacheDS，ZooKeeper等服务对应的磁盘单独做RAID0。

三、安装前的检查

3.1 系统磁盘分区要求

系统安装和运行需要占用硬盘空间，在安装前操作系统硬盘必须留出300GB空间。对磁盘进行分区时需要遵守以下几点要求：

至少要分出swap和加载于“/”的系统分区。
推荐系统分区大小为200GB~300GB，并将该分区挂载到/目录。
请在某数据盘上为TxSQL预留不小于200GB的空间，并将TxSQL的data dir设置为该数据盘的某个目录（例如
/mnt/disk1/txsqldata/）。
推荐把每个物理磁盘挂载在 /mnt/disknn(nn为1至2位的数字)
上不同的挂载点。建议使用EXT4文件系统。每个这样的目录会被管理节点自动配置为HDFS DataNode的数据目录。
HDFS DataNode的数据目录不能放在系统分区，以避免空间不足和IO竞争。同时也建议不要将数据分区和系统分区放在同一块磁盘上以避免IO竞争。除非整个HDFS规划空间不足，否则不要在系统分区所在磁盘上创建数据分区。
为了保证Docker运行的稳定性，需要专门给Docker分配一个磁盘分区，推荐分区大小为100~300GB。同时为了保障高可用，推荐在非Docker所在磁盘预留一个同样大小的空分区作为备用分区，以便在Docker所在磁盘发生故障时快速恢复服务。
为了保证流畅运行，请尽量把Docker卷组划分在数据盘下。如果数据盘较多且存储空间过剩，建议使用单独一块数据盘作为Docker分区。否则，建议将一块数据盘的一个分区作为Docker分区。

如果您使用的是RedHat或者CentOS系统，Docker分区必须使用XFS文件系统。其他磁盘或分区推荐使用EXT4文件系统。更多详细信息请参考 Docker官方文档。

在安装之前需要对docker分区进行格式化处理：

3.1.1 Redhat/CentOS

在Redhat/CentOS上，docker分区必须采用XFS格式，实现的步骤如下：
1.创建目录/var/lib/docker

mkdir -p /var/lib/docker

2.对分区进行xfs格式化

mkfs.xfs -f -n ftype=1 /dev/

3.挂载分区

mount /dev/ /var/lib/docker

4.进行验证，检查是否格式化成功

xfs_info /dev/ | grep ftype=1

如果该语句返回结果中有ftype=1字样，则说明格式化成功。

5.配置/etc/fstab

执行语句下述命令查看UUID：

blkid /dev/

将查到的UUID值添加在/etc/fstab中：

UUID=<UUID> /var/lib/docker xfs defaults,uquota,pquota 0 0

3.1.2 SUSE

在SUSE上，docker分区应采用ext4格式，处理实现的步骤如下：
1.创建目录/var/lib/docker

mkdir -p /var/lib/docker

2.对分区进行ext4格式化

mkfs.ext4 /dev/<p_name>

3.挂载分区

mount /dev/<p_name> /var/lib/docker

4.配置/etc/fstab
执行语句下述命令查看UUID：

blkid /dev/<p_name>

将查到的UUID值添加在/etc/fstab中：

UUID=<UUID> /var/lib/docker ext4 defaults 0 0

例 1. 磁盘资源不富余时的规划
某台机器有两块硬盘，容量都为600GB，分区及挂载目录将如下，其中/dev/sda1用作系统分区：

文件系统	大小	挂载目录	文件系统类型
/dev/sda1	368GB	/	EXT4
/dev/sda2	32GB		swap
/dev/sda3	100GB	/var/log	EXT4
/dev/sda4	100GB	（空，Docker备用分区）	XFS
/dev/sdb1	250GB	/mnt/disk1	EXT4
/dev/sdb2	250GB	/mnt/disk2	EXT4
/dev/sdb3	100GB	/var/lib/docker	XFS

注意，这是磁盘资源不富余情形下的规划。如果磁盘资源比较富余，建议操作系统安装在单独磁盘上，防止数据分区与系统分区造成数据读写竞争，如下一个例子。

例 2. 磁盘资源富余时的规划
某台机器有6块硬盘，容量都为600GB，分区及挂载目录将如下，其中一块磁盘用作系统分区：

文件系统	大小	挂载目录	文件系统类型
/dev/sda1	400GB	/	EXT4
/dev/sda2	32GB		swap
/dev/sda3	168GB	/var/log	EXT4
/dev/sdb1	600GB	/mnt/disk1	EXT4
/dev/sdc1	600GB	/mnt/disk2	EXT4
/dev/sdd1	400GB	/mnt/disk3	EXT4
/dev/sdd2	200GB	/var/lib/docker	XFS
/dev/sde1	400GB	/mnt/disk4	EXT4
/dev/sde2	200GB	（空，Docker备用分区）	XFS

3.2 磁盘目录规划要求

由于 NameNode，JournalNode，Ganglia，TCOS Master的etcd，TxSQL，Guardian ApacheDS，ZooKeeper等服务或角色对磁盘IO要求比较高，所以要求这些服务或角色目录不能在同一块磁盘上，并且不能全部在系统盘上，如果可以，应尽量都不安装在系统根目录。

上述服务或角色所使用的磁盘配置或路径如下。请按照以下路径，提前规划好磁盘使用目录，并在安装时检查相关配置项的值是否为正确路径。

服务	角色	配置项/路径
TOS	TOS Master (etcd)	/var/etcd/data/
Ganglia	Gmetad	/var/lib/ganglia/rrds/
ZooKeeper	ZooKeeper Server	/var//，如 /var/zookeeper1/
HDFS	Name Node	dfs.namenode.name.dir
	Data Node	dfs.datanode.data.dir
	Journal Node	hdfs-site.xml 中的配置项 dfs.journalnode.edits.dir，默认为 /hadoop/journal
TxSQL	TxSQL Server	data.dir 和 log.dir
Guardian	ApacheDS	guardian.apacheds.data.dir
Guardian	TxSQL Server	data.dir
Transwarp Manager（开启HA时）	TxSQL Server	/var/lib/transwarp-manager/master/data/txsql/

3.3 内存容量要求

每个节点必须至少有64GB的RAM。根据节点所安装的Transwarp Data Hub服务，节点可能需要超过64GB的RAM。下表列出在节点上运行不同服务时，该节点所需的额外内存。

服务	要求
Management Server	8GB
HDFS NameNode	32GB
HDFS Standby NameNode	32GB
{HDFS DataNode	4GB
Inceptor Server	8GB
Inceptor executor	32GB
YARN ResourceManager	4GB
YARN NodeManager	4GB
NodeManager分配给Container的计算资源数	用户指定
Zookeeper	4GB
HBase Master	4GB

具体节点需要内存的计算步骤如下所示：

1.确认所有会在节点上运行的TDH服务。
2.确认每个服务要求的内存容量。
3.将所有内存要求相加。
4.如果相加后内存要求小于64GB，则最低内存要求为64GB。如果相加后内存要求大于64GB，则最低内存要求为相加后的和。

比如，如果节点上运行以下服务：

HDFS DataNode
YARN ResourceManager
HBase RegionServer
YARN NodeManager分配给Inceptor executor为32G
则节点的内存容量要求如下（生产环境实际使用内存要结合具体的应用场景）：4GB+4GB+32GB+32GB=72GB

3.4 网络设置

安装Transwarp Data Hub需要最低的网络为千兆以太网。当一台机器上有多个网络适配器时，用户可以在安装Transwarp Data Hub之前对其进行绑定配置。

3.5 集群和网络拓扑要求

决定集群中的节点数目。
决定集群中的机柜数目及每个机柜的名称。
决定每个机柜中的节点数目。
决定每个节点所在的子网（或多个子网）。
决定每个节点的主机名和IP地址。
决定哪个机器是管理节点。
决定哪些机器是NameNode。
决定哪些机器是客户端，哪些机器运行TDH服务，或二者兼是。
一旦主机名分配给NameNode，主机名则不能再更改。
确定你知道要加入到TDH集群中的每个节点的root密码。
管理节点必须和集群中的其他节点属于同一子网。
决定在集群中使用哪些组件。
决定网络带宽和交换机背板带宽。决定交换机型号。
决定如何连接到交换机。必须知道需要用到哪些以太网端口和是否需要绑定。
确定每台机器的IP地址和主机名。决定如何分配IP（使用DHCP或静态分配）。决定如何解析主机名（使用DNS或/etc/hosts）。如果使用/etc/hosts，管理节点将负责更新集群中每台机器的/etc/hosts。

3.6 NTP服务设置

决定如何进行时间同步。管理节点将负责所有服务器上的时间的同步，但您需要决定是否使用外部的NTP服务。如果不使用外部NTP服务，集群中所有服务器的时间是相同的，但这个时间有可能不是标准时间，这有可能导致集群与外部连接时产生错误。

3.7 安全设置

禁掉SELinux和iptables（Transwarp Manager会自动禁掉SELinux和iptables）。

3.8 系统的推荐设置

以下推荐配置可帮助确保TDH集群的性能优化和可管理性。

节点的主机名解析。注意，主机名只能由英文、数字和“-”组成，否则之后的安装会出现问题。
要同时添加一组节点到集群中。
要减少网络延迟，集群中的所有节点都必须属于同一子网。
每个节点应配置一块10GE的网卡，用于节点间的通信和执行集群中需要网络连接的任务。
如果节点没有使用10GE的网卡，则可使用网卡绑定以便将多个网卡组合在一起以提升网络流量。绑定的网卡必须使用工作模式6。
每个节点推荐最小的系统分区，至少有300GB的磁盘空间。
每个节点应至少有6T的可用磁盘空间用于HDFS。
集群中应至少有5个DataNode。
如果可能，避免将物理磁盘分为多个逻辑分区。除了系统分区外，每个物理磁盘应当仅有一个分区，且该分区包含整个物理磁盘。
仅使用物理机器，不要使用虚拟机器。虚拟机可能会明显导致HDFS I/O的缓慢。
节点所在的单个或多个子网不允许有其他机器。
集群中不能同时有物理机器和虚拟机器。
要确保集群中的机器不成为性能和I/O的瓶颈，所有机器必须有相似的硬件和软件配置，包括RAM、CPU和磁盘空间。
每个节点应至少有64GB的内存。
在管理节点上，由于集群中节点执行的系统监控，大量数据可被写入/var/lib/ganglia。推荐分配200GB（鉴于Ganglia非常消耗硬盘，建议根据节点数目调整该值）的磁盘空间给/var/lib/ganglia所在分区。
由于服务可能生成大量日志，推荐将/var/log放置在其他逻辑分区。这可保证日志不会占满根分区的空间。
要加快对本地文件系统的读取，可使用noatime选项挂载磁盘，这表示文件访问时间不会被写回。

四、TDH服务的角色

要在集群中运行服务，需要指定集群中的一个或多个节点执行该服务的特定功能。这些功能被归类为功能性的角色，角色用于定义节点能为集群中的服务提供哪些功能。角色分配是必须的，没有角色集群将无法正常工作。在分配角色前，需要了解这些角色的含义，以及对应于服务节点需要哪些角色。

4.1 Transwarp_License_Cluster角色

角色	描述
License Node	提供License认证服务，判断许可证是否符合授权。

4.2 TCOS角色

角色	描述
TCOS Master	提供TCOS服务的主节点。
TCOS Slave	提供TCOS服务的备用节点。
TCOS Registry	Image管理工具。

4.3 Flannel角色

角色	描述
Flanneld	Flannel服务在节点上的代理服务。
Kube Dns	Kubernetes DNS插件，用于发现服务和通过服务名访问服务。

4.4 Zookeeper角色

角色	描述
Zookeeper Server	一个或多个运行Zookeeper服务的节点。Zookeeper服务是指包含一个或多个节点的集群提供服务框架用于集群管理。对于集群，Zookeeper服务提供的功能包括维护配置信息、命名、提供Hyperbase的分布式同步，以及当 HMaster停止时触发master选择。Hyperbase需要有一个Zookeeper集群才能工作。推荐在Zookeeper集群中至少有3个节点。

角色

描述

Zookeeper Server

一个或多个运行Zookeeper服务的节点。Zookeeper服务是指包含一个或多个节点的集群提供服务框架用于集群管理。对于集群，Zookeeper服务提供的功能包括维护配置信息、命名、提供Hyperbase的分布式同步，以及当 HMaster停止时触发master选择。Hyperbase需要有一个Zookeeper集群才能工作。推荐在Zookeeper集群中至少有3个节点。

4.5 HDFS角色

角色	描述
Httpfs	对HDFS提供Web UI服务。允许用户在可视化界面上对HDFS进行操作和管理。
Data Node	在HDFS中，DataNode是用来存储数据块的节点。
Name Node	HDFS系统中的节点，用于维护文件系统中所有文件的目录结构并跟踪文件数据存储于哪些数据节点。当客户端需要从HDFS文件系统中获得文件时，它通过和NameNode通讯来知道客户端哪个数据节点上有客户端需要的文件。一个集群中只能有一个NameNode。NameNode不能被赋予其他角色。
Journal Node	Standby NameNode和Active NameNode通过JournalNode通信，保持信息同步。

4.6 YARN角色

角色	描述
Resource Manager	Resource Manager负责将各个资源部分（计算、内存、带宽等）安排给基础 NodeManager，并与NodeManager一起启动和监视它们的基础应用程序。
Node Manager	Node Manager管理一个YARN集群中的每个节点。提供针对集群中每个节点的服务，从监督对一个容器的终生管理到监视资源和跟踪节点的状态。
History Server	应用状态监控平台。
Timeline Server	提供对YARN的作业历史日志信息的展现服务。

4.7 Search角色

角色	描述
Search Server	提供内部搜索引擎服务。
Search Head	Search 的网页版本的集群管理工具，支持数据的增删改查，并且可以通过语句进行可视化查询，是ES开发人员的一个非常有用的辅助工具。

4.8 Hyperbase角色

角色	描述
Hyperbase Master	节点实现Hyperbase数据库以下功能: 配区域给RegionServers，平衡整个集群。1.确认RegionServer在运行中。2.如果没找到参考值，删除parents。3.管理数据库表。4.在RegionServers中分发消息。5.监控RegionServers以决定是否有必要执行恢复，如果是，则执行恢复。可以分配HMaster角色给一个或多个节点以进行备份切换。如果你分配角色给多个节点，这将创建一个active-standby状态的HMaster节点的集群，即一个节点处于active状态而集群中的另一个节点处于standby状态。如果active状态的HMaster停止，Zookeeper集群将选出一个inactive状态的HMaster来作为active状态的HMaster。
Region Server	负责服务和管理Hyperbase区域的节点。
Hyperbase Thrift	Thrift Client API开放的节点，客户端可通过Thrift和Hyperbase通讯。

4.9 TxSQL角色

角色	描述
TxSQL Server	高可用的元数据存储，支持数据访问，同Metastore进行通信。

4.10 TDDMS角色

角色	描述
TDDMS Master	管理所有Tablets、Tablet服务器以及其他集群相关的元数据。
TDDMS Webserver	Web服务器。
TDDMS Tablet Serve	用于存储和管理Tablet。

4.11 Inceptor角色

角色	描述
Inceptor Server	Inceptor运行的节点，帮助查询和管理HDFS的大型数据集。Inceptor Server提供工具从文件系统中提取、转换和装载数据，实施数据格式结构，以及提供HDFS或Hyperbase的直接文件访问。
Inceptor MetaStore	管理表结构及其元数据信息，从TxSQL中获取目标元数据。
Inceptor Nucleon	批处理任务的执行节点。

4.12 Pilot角色

角色	描述
Pilot Server	轻量的在线报表工具，支持多种报表样式，提供丰富美观的报表展现。
Filerobot Server	用于对接Pilot上对HDFS的操作。

4.13 EventStore角色

角色	描述
EventStore Server	EventStore的任务管理工具。
EventStore Rest	提供EventStore Rest服务的服务器。
EventStore Sentinel	Sentinel(哨兵)是用于监控EventStore集群中Master状态的工具，是EventStore的高可用性解决方案

4.14 Notification角色

角色	描述
Notification Server	提供消息通知服务。此服务覆盖TDH中所有具有通知功能的工具，如Governor。

4.15 Governor角色

角色	描述
Governor Server	负责提供对元数据的访问、历史跟踪、状态统计等功能，为用户提供数据治理服务。

4.16 KMS角色

角色	描述
KMS Server	Hadoop密钥管理服务器。

4.17 Transporter角色

角色	描述
Transporter Server	提供Transporter ETL服务。实现数据的实时入库。

4.18 Workflow角色

角色	描述
Workflow Server	提供可视化的工作流设计，以及对工作流的调试、调度，对工作流任务具有丰富的分析功能。

4.19 Rubik角色

角色	描述
Rubik Server	提供对OLAP Cube的设计、创建、实例化服务。

4.20 KeyByte角色

角色	描述
KeyByte Server	KeyByte服务器。
KeyByte Slave	集群模式下KeyByte副本服务器。

4.21 QuarkGateway角色

角色	描述
Quark Gateway	Inceptor网关服务器。

4.22 日志分析组件角色

角色	描述
Filebeat	负责采集日志数据并写入EventStore topic。
Logstash	负责把数据从对应的EventStore topic写入Search index。
Kibana	为Logstash和Search的日志分析提供友好的Web界面，可以帮助汇总、分析和搜索重要数据日志。
EventStoreManager	管理整个平台公用的EventStore集群。
Crontab	用于调度定时或周期性执行的任务。

4.23 Discover角色

角色	描述
Discover IDE	RStudio是一个R的集成开发环境(IDE)，它包括一个控制台和语法编辑器，支持直接代码执行，提供绘图、历史、调试和工作区管理等工具。
Discover Notebook	轻量的科学计算开发工具。支持使用R、Scala和SQL做数据分析，提供方便的交互界面。
Discover Local-Cran	本地的R语言程序库。

4.24 Slipstream角色

角色	描述
Slipstream Server	接收流计算请求，实现任务分配的服务。
Slipstream Metastore	管理和流相关的表结构及其元数据信息，从TxSQL中获取目标元数据。
Slipstream History Server	装载Slipstream任务的运行信息并以Web的方式供用户浏览。
Slipstream Executor	流计算的执行节点。

4.25 Slipboard角色

角色	描述
Slipboard	Slipstream开发工具套件。

五、安装准备

5.1 操作系统安装

在安装Transwarp Data Hub之前，集群中的所有节点必须满足环境要求和安装前的检查中所列举的所有要求。

可以使用两种方式来安装集群中的服务器的操作系统，单独安装方式和PXE安装方式。

其中单独安装方式是使用Red Hat Enterprise Linux for Servers、CentOS系列或SUSE Linux Enterprise Server的安装光盘在每台服务器上独立安装操作系统。

注意：对于Red Hat Enterprise Linux for Servers、CentOS 系列的操作系统，需要使用visudo命令打开/etc/sudoers配置文件：
# visudo

将该文件中的“Defaults requiretty”注释掉
如要使用非root用户安装产品，使用的用户必须拥有sudo权限。所以，管理员需要向/etc/sudoers文件中添加sudo用户。方法为在该文件以下部分最后一行的内容：

## which machines (the sudoers file can be shared between multiple
## systems).
## Syntax:
##
##      user    MACHINE=COMMANDS
##
## The COMMANDS section may have other options added to it.
##
## Allow root to run any commands anywhere
root    ALL=(ALL)       ALL
[sudo用户]	   ALL=(ALL)       NOPASSWD: ALL

例如，如果为用户admin添加sudo权限，在文件的末尾增添的内容是：

admin ALL=(ALL) NOPASSWD:ALL

5.2 安装前系统配置改动

如果您有DNS，那么您可以直接跳到下一节。如果您没有DNS，在安装前，请打开包含Transwarp Manager在内的每个节点下的/etc/hosts文件，确保该文件包含所有节点的hostname和IP地址的映射关系列表，例如：

172.16.2.124 tw-manager
172.16.2.125 tw-node2125
172.16.2.126 tw-node2126

您可以登入到节点使用 hostname 命令检查节点主机名，确保节点名称与上述 /etc/hosts 里设置的名称相同。请注意，集群的节点名称不能重复，且必须符合DNS-1123规范，由数字、小写字母或“-”组成，不能包含大写字母，长度小于63。

您可以使用 hostnamectl set-hostname hostname 命令来修改主机名，参考以下示例：

[root@localhost ~]# hostnamectl set-hostname tw-node2125
[root@localhost ~]# hostname
tw-node2125

请注意 /etc/hosts 文件的第一行必须为127.0.0.1的记录，不能将此行注释掉，也不能将当前主机名写在该行中。通常如下：

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4

5.3 安装介质

5.3.1 安装介质获取方式

5.3.2 安装介质使用说明

如果有安装光盘可将安装光盘插入服务器CD/DVD ROM中直接运行。由于安装过程中会使用到操作系统的安装介质，建议用户将OS的ISO文件事先拷贝到管理服务器上。

如客户服务代表或技术支持提供的是压缩包，请将压缩文件导入服务器中。

目前TDH共提供以下三个压缩包：

Manager安装包
TDH-Basic-Component-Transwarp-8.1.0-X86_64-snapshot.tar.gz （8.1.0版本）
TDH-Platform-Transwarp-version.tar.gz （8.1.0版本）
TDH除Discover外所有产品的产品包
TDH-Image-Registry-Transwarp-8.0.x-final.tar.gz

为了更好的支持不同产品线的产品，Transwarp Manager自6.0版本开始独立安装。

您需要先安装Transwarp Manager，之后再上传产品包来安装相应产品。

六、安装Manager

本章节将详细描述如何在管理节点上安装Manager。

注意，在安装之前请确保已经按照安装前的检查的要求为Docker分配专门的分区。

6.1 安装Manager

Manager的安装需要先解压安装包，然后运行Web Installer使用图形化界面安装。

1.解压Manager安装包。在安装包所在的服务器上运行以下命令：

# 解压出安装目录
tar xvzf <manager-install-pkg>

# 进入解压后的transwarp目录
cd transwarp

#执行install二进制文件
./install

为Manager安装包的名称，通常为 TDH-Platform-Transwarp-version.tar.gz，具体名称请参阅“5.3 安装介质”小节。

2.通过浏览器访问管理节点，进入Web Installer界面。

3.系统首先需要您阅读Java许可。阅读完毕，点击“同意”进入下一步。

4.系统将自动检查管理节点的环境配置，主要包括时间、日期、时区及主机名信息并显示在屏幕上，请确认。

5.取决于管理节点上的网卡数量，您需要进行如下操作：

如果管理节点上只有一块网卡，安装结束后，您会被要求设置
Transwarp Manager端口，推荐默认端口“8180”。
如果管理节点上有多块网卡，系统会要求您从中选择一块网卡，用于Transwarp Manager和集群中其他节点通信。在这一步，您应该选择用于集群内部通信的网卡。

6.等待安装

7.安装Manager需要一个包含对应版本操作系统的资源库（repo）。如果您的操作系统为CentOS或者Red Hat，您会看到如下提示：

8.（该步骤中所有操作以CentOS/Red Hat系统为例，SUSE系统的操作完全相同，区别在于如果您使用的是SUSE系统，示例步骤中显示“yum”的地方将会在您的操作中显示“zypper”）这一步中，您可以选择是否添加一个新的操作系统资源库。取决于您的选择，您需要进行下面的操作：

如果您选择“使用远程RPM库”，您需要输入已经创建好的资源库的URL：
- 如果您选择“创建新的RPM库(DVD)”，您需要准备好对应版本操作系统的光盘。
如果您选择“创建新的RPM库(ISO)”，您需要准备好对应版本操作系统的ISO文件。我们建议您采用ISO镜像方法生成资源库库包。
如果您选择“后台手工配置”，您在该步骤无需进行其他操作。

您进行选择后，系统会清理资源库缓存：

9.资源库缓存清理完毕后，系统会自动开始安装和配置Transwarp Manager。安装程序会自动安装必需的软件包，全程静默安装，安装配置完成后自动跳转到下一步。

10.Manager安装完成，可以访问提示的安装地址并使用默认的用户名/密码（admin/admin）去登录管理界面继续接下来的配置。

6.2 升级Manager

如果您的节点上已安装以前版本的Transwarp Manager，您也可以通过Web Installer来进行升级。

1.请先执行安装Transwarp Manager中的第1步，运行Web Installer。

2.通过浏览器访问管理节点，如http://:8179，进入升级页面，选择升级：

3.可以看到系统已经预先填写好Manager的升级配置，如果没有特殊需求，不建议对此页配置进行更改。

4.点击“继续”，进入环境检查页面：

5.如果环境检查出错，您可以返回上一步对配置进行修改，也可以手工修改后在此页面点击重试。环境检查通过后，系统会开始进行升级，可以看到如下页面：

6.升级可能需要一段时间，完成后看到如下页面表示升级成功。

如果升级失败，页面会显示失败信息，您可以点击“重试”可以重新开始升级，或者点击“回滚”则可以将Manager恢复到升级前的状态。

七、配置集群

1.打开客户端浏览器（推荐使用Google Chrome浏览器），输入安装好的管理节点IP或DNS地址，比如http://172.16.3.108:8180/（172.16.3.108是管理节点的IP地址）。访问这个地址，您会看到下面的登录页面。Manager会试着根据您的系统判断您使用的语言，如果当前显示的语言和您想要使用的不同，可以点击右上角的language icon来选择语言。目前Manager支持中文和英文：

2.以admin的身份登录，密码也是admin。

3.登录后，您需要先接受最终用户协议才可以进行进一步操作：

4.您需要给您的集群设置一个名字。输入集群名字后点击“下一步”：

7.1 全局设定

7.1.1 DNS配置

如果配置集群中的节点可以通过用主机名互相访问，用户必须配置有效的DNS服务器或/etc/hosts文件。否则请选择需要管理工具配置/etc/hosts，Transwarp Manager会相应为您配置/etc/hosts文件，然后添加节点。

7.1.2 NTP配置

使用NTP服务器可以确保集群中节点时钟同步，您可以指定外部的NTP服务器或者依赖Transwarp Manager自动选择一台节点作为内部NTP服务器。

要使用外部NTP服务器为您的集群保证时钟同步，您需要确保您的集群可以连接到该外部NTP服务器。

如果您需要使用外部NTP服务器，选择“所有节点向外部NTP同步”或“内部NTP服务器向外部NTP同步，其它节点向内部NTP服务器同步”，如下图所示。点击“添加NTP服务器”，输入您想要添加的NTP服务器，并点击“测试链接”来测试添加的NTP服务器的连接。多次点击“添加NTP服务器”可以让您添加多台外部NTP服务器。

全局设定完成后，点击“下一步”。

7.2 添加/刪除集群服务器

您可以在此步骤添加/删除/修改机柜，添加节点，以及配置RPM库。

1.点击机柜的名字和描述可以对它们进行编辑。节点数会随着您之后的配置自动改变。完成后点击“下一步”。

您可以在这一步添加新的RPM库。自5.2版本起，TDH支持集群的节点运行在不同的操作系统上，您只需要添加RPM库配置，并为节点配置相应的RPM库即可。

2.点击“添加RPM库配置”，并填写相关配置：

3.完成后，点击“保存”来保存您的配置。您可以点击相应RPM的下拉箭头看到详细配置信息：

4.点击“下一步”，为您的集群分配节点。

5.点击“添加节点”，在弹出窗口中按照提示输入符合格式的节点IP，然后点击“搜索”，Transwarp Manager会搜索您输入的节点：

6.点击“继续”，将出现进行SSH访问权限配置的界面，在该节点上您可以选择访问节点使用身份，并且提供了两种认证方法：

所有节点使用同一密码
如果您选择此选项，请在对应的输入框中输入您管理节点的密码、确认密码、输入ssh端口号：
所有节点使用同一密钥
如果您选择此选项，请点击选择文件按钮，在目录窗口中选择待上传的密钥文件，并输入ssh端口号；也可以输入密钥口令（可选）：

7.上述配置完成后，点击“完成”。节点便添加完成。如果只有一个机柜，Transwarp Manager会自动将所有节点分配给默认机柜。如果您有多个机柜，您可以通过点击“分配机柜”来指明节点和机柜之间的分配关系。如果您的集群中有6个以上的节点，那么您必须配置机柜信息，方便以后的运维和服务配置。

8.在这一步您可以为节点分配RPM库，点击“配置RPM库”，选择一个RPM库。默认使用初始配置。节点添加工作完成后，点击“下一步”继续。

9.系统会开始自动添加节点，添加节点的过程会进行一段时间，成功后您会看到成功页面。

10.点击“下一步”开始向集群安装服务。

如果您已经安装完成，可以在Manager的管理页面向集群添加新的节点。具体步骤请参考《TDH运维手册》。

八、安装服务

接下来，我们介绍如何使用Transwarp Manager向集群安装TDH的服务。

8.1 上传产品包

自6.0版本开始，Transwarp Manager作为一个单独的产品安装，各产品线的产品需要在Transwarp Manager的应用市场里先上传产品包，而后Transwarp Manager会自动完成解压，取代了之前版本的手动解压步骤，使安装服务更加便捷，并且更加灵活，例如，您可以上传不同版本的产品包，来安装不同版本的服务。

TDH的产品包名称请参考安装介质小节。

如果您刚刚完成第一个集群的节点安装，您可能会进入以下界面：

在此界面您可以直接点击上传来选择产品包上传。您也可以点击取消，回到Manager主界面，稍后再按照以下步骤上传产品包：
1.从Manager菜单点击应用市场，打开应用市场页面：

2.进入应用市场默认页面，从左侧导航栏点击上传产品包。

3.在上传产品包页面，点击左上角的上传，并在以下弹出窗口中选择产品包的位置：

4.上传需要一段时间，完成后可以看到状态图标。您也可以点击产品包右侧的查看日志来查看上传进程。

5.上传成功后，相应的服务将会出现在安装服务时的选择服务页面。

8.2 选择服务

在安装服务之前请再次确认已按照安装前的检查的要求分配资源，并已成功上传产品包。只有产品包上传成功的产品才会出现在选择服务页面。

TDH中，各个服务将被包装为容器，安装在TCOS上。TCOS是基于Docker和Kubernetes的云操作系统，在部署安装TDH服务时不会显示在服务列表中，默认安装，无需您手动添加。但您可以在后续步骤服务角色的分配和配置服务页面为TCOS服务分配角色和配置参数、属性等。

安装TxSQL前请保证在某个数据盘上已为TxSQL预留至少200G的空间，并且将TxSQL的data dir设置为该磁盘下的某个目录。

左侧为服务所属产品与版本选择，右侧为具体的服务。当某个产品被上传时，属于该产品的所有服务都将在右侧被列举出来。

如果您上传了多个版本的产品包，您可以点击选择要安装的版本
点击下一步安装所选择的服务。

8.3 服务角色的分配

选择想要安装的服务之后，接下来分配各项服务的角色。各服务角色都对应若干个勾选框，每个勾选框代表集群中的一个节点。分配角色的方法为勾选或取消勾选服务右侧对应的节点，被选中的节点将承担该服务角色。例如下图中，四个勾选框被选中代表集群中的这四个节点将承担TOS Slave角色。

Transwarp Manager对服务的角色提供默认分配，如果您想要使用默认的分配，可以点击“下一步”直接进行配置。但是我们推荐您根据实际的生产场景进行规划，同时我们推荐遵守下面的一些分配原则：

首次安装集群时需要安装TCOS角色和License角色。TOS Registry角色必须安装在Transwarp
Manager所在节点。TOS Slave角色需要安装在每个节点上。
推荐将Zookeeper角色分配给奇数个节点，建议集群大小在20个节点以下配置3个，20个节点以上配置5-7个，不超过7个。
在集群资源宽裕的情况下，将HDFS
NameNode和DataNode配置给不同的节点，也就是说避免同一节点既是NameNode又是DataNode的情况。
推荐将Hyperbase Master角色分配给奇数个节点。
分配了Hyperbase RegionServer的节点必须同时拥有HDFS DataNode角色。

8.3.1 部署角色多实例

自6.0版本起，Transwarp Manager支持同一个节点上部署同一角色的多个实例。如果服务的某一些角色支持多实例，那么服务创建之后，Transwarp Manager会将每个角色实例放到一个实例组里。您只需要在分配角色步骤添加一个实例组，就可以创建一批角色实例，再为它们分配节点即可。

例如下图中，默认创建了instancegroup1，点击 + Instance Group 创建实例组instance2，在右侧为它分配节点，即可完成多实例部署。

如果您已经安装完成，您也可以在Transwarp Manager的节点页面通过添加节点来扩容角色。具体步骤请参考《TDH运维手册》。

8.3.2 角色属性配置

Transwarp Data Hub中每个服务都可以设置该服务在集群中的服务名，用于在集群中指代该服务，这里显示的是HDFS服务的编辑页面。

如果不设置，默认服务名为“服务＋整数”，这是因为在集群计算资源允许的情况下，一些服务可以在集群中有多个实例，这些实例工作时需要通过服务名互相区分（如Zookeeper1和Zookeeper2）。在第一次安装集群时，每个服务都只能安装一个实例，额外的服务实例可以向安装好的集群添加。

8.4 配置安全

您可以在这一步进行安全配置。如果您当前还没有安装Guardian，您可以选择简单认证模式。如果您安装了Guardian，您可以在这一步选择Kerberos认证模式，并输入KAdmin票据名和密码开启Guardian插件。

8.5 服务的配置

服务的配置非常重要，请您务必在这一步仔细检查每一项服务的配置。在“配置服务”下，您可以为所有的服务进行配置。

8.5.1 服务的可配置项

Transwarp Data Hub中的每个服务都自有一系列的可配置项。

通用的可配置项包括（以Zookeeper服务为例）：

基础参数：

这里显示的是Zookeeper服务的基础参数配置页。如果没有特殊要求，您可以直接使用Transwarp Manager对基础参数提供的默认值。基础参数值不仅在这一步可以设置，安装完成后还可以在服务配置页面进行修改。

基础参数分为节点特定参数（例如上图中的 zookeeper.peer.communicate.port, zookeeper.leader.elect.port ）和非节点特定参数（例如上图中的 tickTime，init.Limit 和 syncLimit ）。

对于非节点特定参数，直接点击右侧的编辑便可以进行修改。
对于节点特定参数，点击右侧红框中的编辑来打开为节点分别配置的窗口：

然后点击节点对应的值进行修改。
自定义参数：

所有服务都可以添加自定义参数。这里显示的是Zookeeper服务的自定义参数配置页。
属性
Transwarp Data Hub中部分服务可以配置属性，这里显示的是Guardian服务的属性配置页。

8.5.2 特殊配置要求

TDDMS参数配置

请注意 tabletserver.store.datadirs 参数在部署时会默认选择本机所有容量超过200GB的挂载点作为数据目录。如本机不存在容量超过200GB的挂载点，请手动指定数据目录。

特定角色的配置要求

由于 NameNode，JournalNode，TCOS Master的etcd，TxSQL，Guardian ApacheDS，ZooKeeper等服务或角色对磁盘IO要求比较高，所以要求这些服务或角色目录不能在同一块磁盘上，并且不能全部在系统盘上，如果可以，应尽量都不安装在系统根目录。

上述服务或角色所使用的磁盘配置或路径如下。请检查相关配置项的值是否为正确路径。

服务	角色	配置项/路径
TOS	TOS Master (etcd)	/var/etcd/data/
ZooKeeper	ZooKeeper Server	/var//，如 /var/zookeeper1/
HDFS	Name Node	dfs.namenode.name.dir
	Data Node	dfs.datanode.data.dir
	Journal Node	hdfs-site.xml 中的配置项 dfs.journalnode.edits.dir，默认为 /hadoop/journal
TxSQL	TxSQL Server	data.dir 和 log.dir
Guardian	ApacheDS	guardian.apacheds.data.dir
Guardian	TxSQL Server	data.dir
Transwarp Manager（开启HA时）	TxSQL Server	/var/lib/transwarp-manager/master/data/txsql/

8.6 服务的安装

配置好参数后，点击“下一步”，在出现的如下所示窗口中可以看到配置信息总览，如果需要修改，可点击“上一步”返回修改。

确认配置信息后，点击下一步准备执行安装。

此时，Transwarp Manager会弹出一个“安装确认”窗口确认开始安装。点击“确认”继续。

安装开始，系统将花费一些时间安装您所选中的服务，请耐心等待。

安装完成后，点击“完成”进入Transwarp Manager的控制面板。

8.7 安装TDH客户端

服务安装完成后，用户必须安装TDH客户端，才可以在交互界面上执行各个服务的命令行，如 beeline 、hdfs dfs 等。

8.7.1 安裝步驟

安装过程如下。

1.获取安装包

在Transwarp Manager界面上点击icon manage → 下载客户端，下载TDH客户端。

2.解压文件

将下载的tdh-client.tar文件放在集群中的任意机器上，然后于该机器上执行如下命令解压文件：

tar -xvf tdh-client.tar

执行成功后文件会被解压至目录TDH-Client中。

3.执行脚本

请执行位于目录TDH-Client内的脚本init.sh。

source TDH-Client/init.sh

您可以以任何用户执行该脚本，但是我们建议以root用户身份执行。当以其他用户身份执行时，需要输入root密码。

注意，用户必须使用source命令执行该脚本。 bash init.sh 和 ./init.sh 都不起作用。
该脚本接受两个参数，默认都是y。第一个参数表示是否修改/etc/hosts文件（y 表示修改，n表示不修改），第二个参数表示是否安装Kerberos Client （y 表示安装，n 表示不安装）。

因此有如下表格所示的组合方式：

命令	含义
source TDH-Client/init.sh	修改/etc/hosts文件，并且安装Kerberos client
source TDH-Client/init.sh y y	修改/etc/hosts文件，并且安装Kerberos client
source TDH-Client/init.sh y n	修改/etc/hosts文件，不安装Kerberos client
source TDH-Client/init.sh n y	不修改/etc/hosts文件，安装Kerberos client
source TDH-Client/init.sh n n	不修改/etc/hosts文件，并且不安装Kerberos client

当使用source命令执行完脚本后，如果输出结中没有出现ERROR，则表示成功。此时可以直接执行相关服务的命令。

注意:
1.TDH客户端既可以在集群內也可以在集群外的任意机器上使用。目前只支持Linux环境（CentOS, Ubuntu等），不支持Windows环境。
2.如果用户修改了集群中服务的配置文件（例如从未开启Kerberos变成开启Kerberos），需要重新下载TDH客户端，并重新安裝。
3.当开启了Kerberos后，在执行相关服务的命令前，务必注意先进行kinit。
4.TDH客户端不会自动拷贝keytab文件，所以当它所在的机器本身没有keytab文件时，无法通过kinit -kt 的方式进行kinit。此时必须通过kinit ，并根据提示输入该principal密码的方式进行kinit。

九、向集群添加服务

在安装完您所选择的服务后，您还可通过Transwarp Manager主界面向集群新增服务。

以下，我们将以EventStore服务为例，演示如何在Transwarp Manager主界面添加并安装服务。

1.点击Transwarp Manager主页面上集群名旁的
，您将进入添加服务向导。

2.进入选择服务页面，选择Slipstream，点击“下一步”。

3.选择服务版本，这里会显示出您在上传产品包步骤上传成功的所有版本，选择一个版本。

4.接下来，您需要为Slipstream服务分配角色，若您需要更改依赖的具体服务可在右侧列表中选择，完成后点击“下一步”继续。

5.配置安全。如果您当前还没有安装Guardian，您可以选择简单认证模式。如果您安装了Guardian，您可以在这一步选择Kerberos认证模式，并输入KAdmin票据名和密码开启Guardian插件。

6.这一步，您需要为Slipstream进行服务配置：

配置完成后点击“下一步”。

7.进入服务总览页面，确认配置无误后，点击“下一步”：

弹出“安装确认”弹框，点击“确认”，开始安装：

8.安装过程一般需要几分钟时间。安装成功后点击“完成”，完成Slipstream安装。

十、集群扩容指导

这里仅介绍为TDH环境增加数据节点的扩容步骤，不涉及在原来的节点上增加硬件资源以及进行角色迁移的操作。TDH的节点扩容主要包含扩容前节点检查、扩容节点操作2个步骤。

10.1 扩容前节点检查

与安装TDH前检查的操作类似，在扩容前需要检查新节点的软硬件配置是否符合要求，请参考《TDH安装手册》中的第二章：环境要求和第三章：安装前检查要求

10.2 扩容节点操作

扩容操作流程包括 添加节点 和 扩容角色 2个阶段。添加节点即添加新的集群节点，扩容角色指为新节点分配服务。

10.2.1 添加节点

首先，打开浏览器，访问http://:8180地址，登录进入TDH管理界面。展开Manager页面左侧列表中的管理面板点击节点，进入 节点管理页面，点击 add new node 按钮，进入节点扩容向导过程，如下：

10.2.1.1 选择集群

进入扩容节点向导后，选择需要增加节点的集群。完成后点击“下一步”。

10.2.1.2 全局设定

1.DNS配置

如果配置集群中的节点可以通过用主机名互相访问，您必须配置有效的DNS服务器或/etc/hosts文件。否则请选择需要Transwarp Manager配置/etc/hosts，Transwarp Manager会相应为您配置/etc/hosts文件。建议和集群安装时的设置保持一致，完成后点击“下一步”。

1.NTP配置
使用NTP服务器可以确保集群中节点时钟同步，您可以指定外部的NTP服务器或者依赖Transwarp Manager自动选择一台节点作为内部NTP服务器。建议和集群安装时的设置保持一致。

要使用外部NTP服务器为您的集群保证时钟同步，您需要确保您的集群可以连接到该外部NTP服务器。

如果您需要使用外部NTP服务器，选择“所有节点向外部NTP同步”或“内部NTP服务器向外部NTP同步，其它节点向内部NTP服务器同步”，如下图所示。点击“添加NTP服务器”，输入您想要添加的NTP服务器，多次点击“添加NTP服务器”可以让您添加多台外部NTP服务器。点击“下一步”时，Manager会自动测试添加的NTP服务器的连接。

全局设定完成后，点击“下一步”。

10.2.1.3 编辑机柜

编辑机柜步骤与安装步骤中编辑机柜类似，可以添加机柜来分配扩容过程中新增的节点。点击
按钮，点进入机柜添加向导过程，如下：

在该步骤中只能新增机柜，或对新增的机柜进行编辑操作，已配置的机柜信息不可修改或编辑。

完成机柜编辑后点击“确认”，点击“下一步”。

10.2.1.4 配置仓库

配置仓库步骤与安装步骤中配置仓库类似，默认选择集群安装时的初始配置，您也可以在这一步添加新的RPM库。自5.2版本起，TDH支持集群的节点运行在不同的操作系统上，您只需要添加RPM库配置，并为节点配置相应的RPM库即可。点击
，并填写相关配置，如下图：

完成后，点击“确认”来保存您的配置。您可以拖动鼠标到相应RPM的下拉箭头看到详细配置信息：

点击“下一步”，为您的集群分配节点。

10.2.1.5 节点分配

添加节点
节点分配步骤与安装步骤中节点分配类似，点击
，在弹出窗口中按照提示输入符合格式的节点IP，然后点击“搜索”，Transwarp Manager会搜索您输入的节点，勾选需要扩容的节点进行添加。

点击“下一步”，将出现进行SSH访问权限配置的界面，在该节点上您可以选择访问节点使用身份，并且提供了两种认证方法：

所有节点使用同一密码

如果您选择此选项，请在对应的输入框中输入您管理节点的密码、确认密码、输入ssh端口号：

所有节点使用同一密钥

如果您选择此选项，请点击 选择文件 按钮，在目录窗口中选择待上传的密钥文件，并输入ssh端口号；也可以输入密钥口令（可选）：

点击“确定”后，回到节点分配界面对节点进行机柜和仓库配置。

分配机柜
勾选需要分配机柜的节点，点击“分配机柜”为节点进行配置，如果您有多个机柜，以此来指明节点和机柜之间的分配关系，方便以后的运维和服务配置。

配置仓库
勾选需要分配RPM库的节点，点击“配置仓库”选择一个RPM库。配置完成后，点击“确定”继续。

点击“下一步”，进行节点安装。

安装节点
系统会开始自动添加节点，添加节点的过程会进行一段时间，成功后您会看到成功页面。完成后，点击“下一步”继续。

10.2.2 扩容角色

10.2.2.1 分配角色

在分配角色界面，您可以点击服务列表的下拉箭头以展开明细，请参考界面下方的节点配置建议对新节点进行服务角色的分配，扩容前已配置角色的节点不要修改或编辑。配置完成后，点击“下一步”继续。

10.2.2.2 配置服务

服务的配置非常重要，请您务必在这一步仔细检查每一项服务的配置。鼠标悬浮于值“详情”可查看参数值，您可以点击“编辑”进入参数修改界面。

为保障新节点正常运行，这一步注意参考老节点的配置修改新节点的参数，特别是YARN NodeManager、Inceptor Executor等角色服务的相关参数

点击“编辑”或批量修改，对参数值进行修改。完成后，点击保存退出。
配置好参数后，点击“下一步”，继续

10.2.2.3 应用修改

系统会开始自动为新节点配置角色服务，应用修改稿的过程会进行一段时间，成功后您会看到成功页面。至此，扩容操作步骤完成。

十一、管理面与业务面隔离场景安装部署说明

通俗说的双网卡环境，管理面对应外网网段，业务面对应集群内网网段

11.1 安装Manager服务

需要注意的是必须从业务面网段安装服务，具体安装步骤同本手册第六章《安装Manager》。

11.2 双平面隔离配置

集群安装部署好后，通过手动修改配置的方式达到管理面与业务面隔离。

11.2.1 修改manager配置文件。

修改Manager所在节点的 /etc/transwarp-manager/master/application-user.properties 文件，将server.address改为该节点管理面网段ip（manager开启了ha的情况下两个manager节点都需修改为各自的管理面网段ip）

然后重启transwarp-manager服务

systemctl restart transwarp-manager

11.2.2 修改Aquila配置，保证管理面正常访问aquila服务

双平面隔离的场景下，通过业务面访问aquila 8666页面失败（业务面网段可以正常访问管理面网段）,rootcause：aquila的配置中是通过hostname port的方式访问8180，hostname解析的是非8180监听的业务面ip导致访问失败。

操作步骤：

(1) 手动修改aquila server所在节点/etc/aquila/conf/server/application.yml文件：

         manager-proxy:
                   endpoints:
                    - https://<改为manager管理面网段IP>:8180
                    - https://>:8180
                    ....
                    logoutUrl: https://<改为manager管理面网段IP>:8180/api/users/logout

(2) 通过kubectl delete pod 的方式重启aquila server服务即可。

页面配置服务重启会导致配置文件被刷新回去

11.2.3 修改集群机器yum repo源配置

保证yum正常使用,所有机器的配置都需要修改。进入节点目录/etc/yum.repos.d

(1)修改文件os.repo

baseurl=http://<改为manager管理面网段IP>:8180/pub/os

(2)修改文件transwarp.repo

baseurl=http://<改为manager管理面网段IP>:8180/pub/transwarp-RHEL7

十二、许可证的激活与认证

Transwarp Data Hub采用许可证授权方式提供相关服务，因此在安装过程中需要输入许可证并激活以启用所有服务。

12.1 许可证管理

将鼠标移至Transwarp Manager主界面左侧的“管理”菜单，在弹出的菜单栏中点击“许可证”进入许可证管理页面。

许可证管理页面分为“摘要”和“角色”两个板块。“摘要”板块显示许可服务的健康状态，Server Key、序列号、当前许可证情况，点击“启动”和“停止”可以启动或者停止许可证集群。“许可证详情”板块显示当前每一个已安装服务的License类型、版本、节点容量、License到期时间。“角色”板块展示了许可服务的角色运行的节点、每个角色运行的健康状态。

12.2 许可证激活和使用

点击“查看/更改许可证”可以查看/更改一个许可证，系统会弹出以下窗口。

如果您还没有购买商业版的Transwarp Data Hub,您可以通过用户中心申请社区版的License，关于社区版的安装与使用请参阅社区版介绍。

如果您购买了商业版的Transwarp Data Hub,我们将为您提供序列号和License Key。将两条信息都输入后点击“保存”,您便可以开始使用商业版的Transwarp Data Hub。

12.3 查看许可证授权管理

如果您已经上传过License,您可以点击“查看/更改许可证”来查看您的License Key。

12.4 许可证过期预警

当许可证离过期还有7天时，控制面板上会显示告警信息，及时提醒用户更换许可证。

十三、安装和设置问题及回答

1.问题：客户机房在节假日期间断电，需要提前进行哪些操作？

因直接断电在极端情况下会影响到TDH的稳定性，我们推荐客户在断电之前，优先在manager停止集群所有服务，再用servicetranswarp-managerstop命令停止manager。待机器上电后使用servicetranswarp-managerstart启动manager，并登入启动全部服务。

2.问题: 如何修改CentOS和Redat 操作系统中的hostname？

使用 hostnamectl set-hostname 命令。注意: 安装完成之后尽量不要修改hostname，很多参数和配置都与hostname挂钩；在/etc/hostname文件中localhost 必须在127.0.0.1的第一个，例如：

127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6

3.问题: 在安装第一步hostname检查中就失败退出TDH Transwarp Manager安装，如何解决？

登入到管理节点上执行hostname指令和/etc/hosts里的IP 后面的名字比较，看名字是否匹配。如不匹配，修改/etc/hosts文件，确保集群中的所有节点的hostname都正确。

4.问题: 为Docker创建逻辑卷组时，在执行pvcreate /dev/xxx后出现Can’t open /dev/vdb exclusively.Mounted filesystem? 如何解决？

该情况表示分区被占用，需要查看是否挂载文件系统。如果已挂载需要umount掉。

5.问题: 为Docker创建逻辑卷组时，在执行pvcreate /dev/xxx后出现“Can’t initialize physical volume “/dev/vdb” of volume group “docker” without -ff” 如何解决？

该情况表示物理卷已经创建，不需要再重复创建。可以直接执行后面步骤。

6.问题: 安装后访问http://hostname:8180出错可能有哪些原因？

1.可能是安装出现问题：请仔细按照安装文档进行安装。

2.确保访问方式是http。

3.确保http的8180端口没有被防火墙阻止。

7.问题：节点断开可能有哪些原因？

1.可能是硬件原因（网线，网口，交换机等问题）。

2.可能是机器防火墙屏蔽了ssh。

8.问题: 如何检查防火墙是否开启？

1.在命令行状态下执行setup命令，按菜单指引防火墙配置→不选防火墙开启，然后保存设置。

2.在命令行下面执行service iptables stop关闭防火墙服务。

9.问题: Transwarp Data Hub对Hostname是否有要求？

Transwarp Data Hub对需要添加或安装的节点名有一定的要求，必须是数字，字母或符号组成的，不支持使用_(下划线)和.(点)的hostname，比如TDH1.cluster.com, TDH_2.cluster.com等。用户需要编辑/etc/sysconfig/network文件里的hostname名字。

10.问题: Transwarp Manager对网络延迟是否有要求？

Transwarp Manager对节点和服务添加中对网络的延迟有一定要求，如果客户端浏览器到Transwarp Manager的延迟过长会导致添加失败，在客户端使用ping程序ping一下安装Transwarp Manager服务器的延迟，如果超过2ms, 可能会发生安装失败的问题。

11.问题: HDFS Format NameNode失败怎么办？

该问题表现为安装服务进行到HDFS的安装时出现。

解决方法为：确定该集群上是否安装过HDFS。如果安装过HDFS，且需要保留其中的数据，请不要继续下面的步骤，而应进行备份或升级操作。如果该集群上的没有需要保留数据的HDFS，可继续下面的步骤，清空HDFS中的残存数据。

a.在所有Journal Node上，清空（清空指删除目录中的所有内容，但保留目录，下同）/hadoop/journal 中的所有内容，然后执行：

service hadoop-hdfs-journalnode-hdfs1 restart

b.在所有Name Node上，清空dfs.namenode.name.dir配置的相应目录的所有内容，dfs.namenode.name.dir参数值在/etc//conf/hdfs-site.xml文件中（为集群上之前安装的HDFS服务的服务名，下同。）

c.在所有Data Node上，清空dfs.datanode.data.dir配置的相应目录的所有内容，dfs.datanode.data.dir参数值在/etc//conf/hdfs-site.xml文件中。

12.问题：Docker分区所在磁盘发生故障，如何快速恢复服务？

1.运行 mount /dev/ /var/lib/docker，将分区要求里预留的Docker备用分区 /dev/ 挂载到 /var/lib/docker；

2.运行 systemctl restart docker 重启Docker服务；

3.运行 docker info 验证重启后的Docker是否正常。如果没有报错，则说明Docker正常运行。

你可能感兴趣的:(大数据技术栈,big,data,数据仓库,etl)

neo4j 4.x新建数据库，并解决报错Unsupported administration command: CREATE DATABASE 呆萌的代Ma 图模型与知识图谱 database 数据库 neo4j
重要社区版本不支持命令createdatabasexxx，只有企业版可以！社区版本只允许同时打开一个数据库，当然你可以多开几个neo4j服务，当你打开成新的数据库后，除了新数据库和system，其他的数据库就无法访问啦，但是它们依旧存在哈解决方法首先进入安装目录，比如~/Software/neo4j-community-4.3.3，然后修改neo4j.conf文件：cdconfvimneo4j.c
【大数据Java基础- JVM 12】运行时数据区（七）对象的实例化内存布局与访问定位王知无(import_bigdata) java big data 开发语言
1.对象的实例化1.1创建对象的方式new最常见的方式变形1：Xxx的静态方法变形2：XxBuilder/XxoxFactory的静态方法Class的newInstance()：反射的方式，只能调用空参的构造器，权限必须是publicConstructor的newInstance(Xxx)：反射的方式，可以调用空参、带参的构造器，权限没有要求使用clone()：不调用任何构造器，当前类需要实现Cl
线程池工具类于无声处-听惊雷 java
工具类publicclassTaskExecutorUtil{privatestaticfinalLoggerlogger=LoggerUtils.getLogger(TaskExecutorUtil.class);privatestaticfinalThreadPoolExecutorexecutor;static{ThreadFactoryBuilderthreadFactoryBuilder
KaiwuDB 受邀亮相 2024 数博会 KaiwuDB 数据库 kaiwudb 数博会
8月28-30日，由国家数据局主办，贵州省人民政府承办的2024中国国际大数据产业博览会（简称“数博会”）在贵阳启幕。KaiwuDB受邀携一众产品亮相大会，重点展示了分布式多模数据库KaiwuDB2.0及其在物联网海量异构数据管理分析的落地应用，现场引来众多客户伙伴们的热烈关注。KaiwuDB主打面向AIoT场景提供以时序、关系数据引擎为核心，结合分布式、原生AI和云边端协同能力的数据智能产品。2
sql:Mysql create view,function,procedure geovindu 数据库编程 Mysql sql
usetest;createdatabaseLiber;useLiber;#顯示數据庫20150210GeovinDu涂聚文SHOWDATABASES;droptableBookKindList;#书目录createtableBookKindList(BookKindIDINTNOTNULLAUTO_INCREMENT,#自动增加BookKindNamenvarchar(500)notnull,B
DREAMFUSION: TEXT-TO-3D USING 2D DIFFUSION 于初见月 paper 计算机视觉
ABSTRACTRecentbreakthroughsintext-to-imagesynthesishavebeendrivenbydiffusionmodelstrainedonbillionsofimage-textpairs.Adaptingthisapproachto3Dsynthesiswouldrequirelarge-scaledatasetsoflabeled3Ddataande
MySQL查询-07 ningmengjing_ Mysql数据库 mysql 数据库 oracle
一、查询创建数据库、数据表--创建数据库createdatabasepython_test_1charset=utf8;--使用数据库usepython_test_1;--students表createtablestudents(idintunsignedprimarykeyauto_incrementnotnull,namevarchar(20)default'',agetinyintunsig
开源游戏服务器引擎goworld源码解析14_aoi lao geng 游戏服务器
aoipkg\mod\github.com\xiaonanln\go-aoi@v0.2.0\aoi.go这段代码定义了一个名为aoi的包，其中包含了一些用于处理游戏中区域（AOI）相关逻辑的类型和接口。以下是对代码的详细解释：Coord类型：Coord是一个自定义的浮点型，用于表示坐标轴上的值。AOI结构体：x和y：表示AOI在二维空间中的位置。dist：表示AOI的半径或范围。Data：一个接口
详细分析Python出现KeyError的原理分析以及解决方法（附常见Demo）码农研究僧 BUG python Bug KeyError 字典
目录1.问题所示2.原理分析3.解决方法1.问题所示系统出现问题，看报错原因，大致如下：File"d:\Usersirpa\桌面\收入确认表自动化\recorder.py",1ine113，indata_size=awaitfunc(*args.，*kwargs)Fi1e"a:\Users\rpa\桌面\收入确认表自动花\main.py",1ine24,inmainawaitac.run_task
TOPSIS法鸭梨大大大数据分析
importnumpyasnpimportpandasaspddeftopsis(file_path,weights,criteria):data=pd.read_excel(file_path)matrix=data.valuesn,m=matrix.shapeforjinrange(m):ifcriteria[j]=='max':matrix[:,j]=matrix[:,j]/np.sqrt(
搭建springboot对mysql表增删改查 Flying_tao 微服务 mysql spring boot java
安装数据库环境安装mysql，在window环境下启动，可以用sqlyong或其它工具连接数据库netstartmysqlcdC:\ProgramFiles\MySQL\MySQLServer5.6\binmysql-uroot-pshowdatabases;创建表CREATE TABLE `user`( `id` int(11) , `name` varchar(50) , PRIMARY
第12章 Flink wyz191 大数据技术原理与应用 -概念存储处理分析与应用 big data hadoop 数据仓库 flink 大数据
企业数据架构的演进：传统数据处理架构、大数据Lambda架构、流程处理架构。Flink是一种具有代表性的开源流处理架构，它实现了GoogleDataflow流计算模型，是一种兼具高吞吐、低延迟和高性能的实时流计算框架，并且同时支持批处理和流处理。Flink的主要特性包括：批流一体化、精密的状态管理、事件时间支持以及精确一次（Exactly-once）的状态一致性保障等。12.1Flink简介Fli
Cursor 与多语言开发：全栈开发的利器 drebander AI 编程 Cursor
引言全栈开发要求开发者跨越前端、后端、数据库甚至数据科学等多个技术领域，而不同技术栈往往需要切换工具和思维方式。Cursor作为一款AI驱动的智能编程助手，凭借其对20+编程语言和主流框架的深度支持，正在成为全栈开发的“瑞士军刀”。本文将解析Cursor的多语言支持能力，并通过前端、后端和数据科学领域的实际案例，展示其如何统一跨技术栈的开发体验。一、Cursor的多语言支持能力1.覆盖全技术栈的语
MySQL索引底层数据结构及原理深入分析程序员beige MySQL mysql 索引
原文链接，首发于公号：Biggerboy感谢关注。文章很长，很干，建议收藏，反复食用。辛苦点个免费的赞和关注。大家有没有遇到过慢查询的情况，执行一条SQL需要几秒，甚至十几、几十秒的时间，这时候DBA就会建议你去把查询的SQL优化一下，怎么优化？你能想到的就是加索引吧。为什么加索引就查的快了？这就要从索引的本质以及他的底层原理说起。索引是什么那索引到底是什么呢?你是不是还停留在大学学『数据库原理』
Openssl C++ API Pandada。
OpensslC++APIBase64将8位二进制信息编码为ASCII码。openssl命令base64or-encbase64EVPAPIEVP_EncodeBlock((unsignedchar*)encodeData,sourceDta,16);EVPEVP_PKEY对象用于存储公钥和（可选）私钥，以及相关的算法和参数。支持的类型有：EVP_PKEY_EC：椭圆曲线密钥（用于ECDSA和EC
【Qt图书管理系统】1.免费视频教程与项目设计与需求分析编程小鱼酱 Qt图书管理系统 Qt图书管理系统 qt图书馆管理系统 C++图书管理系统 Qt项目实战 Qt毕业设计
文章目录1.说在前面的话2.视频教程链接3.开发技术栈4.需求分析5.界面迁移逻辑6.数据库设计7.效果图设计1.说在前面的话本套图书管理系统，包含目前设计了如下功能普通用户功能：书籍查询、借阅、归还、借阅记录、个人信息修改。管理员功能：图书借阅和归还审核、图书的管理、账户管理、借阅记录。开发Qt图书管理系统的初衷是，让大家以沉浸式的编程，体验开发的乐趣。目前打算规划两个版本v1.0和v2.0。注
小白转flink技术栈心得之混编java和scala报错：error: java.lang.NoClassDefFoundError: javax/tools/ToolProvider 阿烦大64 java java maven scala flink 大数据实时计算
今天刚接手了一个flink项目，代码里有java也有scala写的部分，小白第一次遇到要java和scala都需编译的项目，于是乎先进行scala的编译：mvncleanscala:compilecompilepackage-Pfat-DskipTests结果报了一个错误:[ERROR]error:java.lang.NoClassDefFoundError:javax/tools/ToolPro
大数据：一种收集、分析和使用数据的文化程序猿广坤大数据编程语言 it资讯人工智能程序员编程语言大数据
真正的问题不是在于技术，而是在于过程。与所有IT投资一样，大数据成功的关键在于迭代，而不是关于Hadoop、NoSQL、Splunk或者任何特定的供应商或技术。Gartner发现，虽然64%的企业正在投资于大数据，但约60%不知道如何进行大数据处理。真正的问题不是在于技术，而是在于过程。与所有IT投资一样，大数据成功的关键在于迭代，而不是关于Hadoop、NoSQL、Splunk或者任何特定的供应
大数据架构：从数据收集到分析的完整流程勤劳兔码农大数据架构
大数据架构：从数据收集到分析的完整流程在现代数据驱动的世界中，大数据技术变得至关重要。企业和组织通过大数据架构来收集、存储、处理和分析大量的数据，以提取有价值的见解和信息。这篇文章将详细介绍大数据架构的完整流程，从数据收集到数据分析，涵盖每一个关键环节，并提供具体的代码示例，以便于深入理解。1.数据收集1.1数据来源数据收集是大数据架构中的第一个关键环节。数据来源广泛，包括但不限于：传感器数据：来
【异常】Python环境中没有安装 `openpyxl` 模块提示ModuleNotFoundError: No module named ‘openpyxl‘ 本本本添哥 Python 1024程序员节
一、报错内容D:\Project\xxx\.venv\Scripts\python.exe-Xpycache_prefix=D:\Users\xxx\AppData\Local\JetBrains\PyCharmCE2024.2\cpython-cache"E:/PyCharmCommunityEdition2024.2.2/plugins/python-ce/helpers/pydev/pyde
WPF-基础及进阶扩展合集（持续更新）一介学徒 WPF基础与进阶开发语言 wpf
目录一、基础1、GridSplitter分割线2、x:static访问资源文件3、wpf触发器4、添加xaml资源文件5、Convert转换器6、多路绑定与多路转换器二、进阶扩展1、HierarchicalDataTemplate2、XmlDataProvider从外部文件获取源3、TextBox在CellTemplate中的焦点问题4、让窗体可裁减5_1、获取DataGrid的ScrollVie
基于Springboot框架的学术期刊遴选服务-项目演示小咕聊编程 java 开发语言
项目介绍本课程演示的是一款基于Javaweb的水果超市管理系统，主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的Java学习者。1.包含：项目源码、项目文档、数据库脚本、软件工具等所有资料2.带你从零开始部署运行本套系统3.该项目附带的源码资料可作为毕设使用水果超市管理系统包括用户管理、新闻资讯管理、水果类别管理、水果管理、轮播图管理、库存管理的功能模块设计如图：技术栈说明后端：Spr
call of overloaded `pow(int, int)' is ambiguous； sunny_liangzilong C/C++语言
问题：我在程序中添加了头文件#include；但调用函数pow（）后，程序报错：error:callofoverloaded`pow(int,int)'isambiguous；就算是最简单的调用都报错；回答：cmath里面对于Pow函数只有这些重载。你得把第一个参数转换成以上所需要的类型。不同编译器要求不一样，可能是你编译器要求比较严格，我用codeblocks，像你那样用是不会报错的。
解决报错:org.springframework.data.redis.serializer.SerializationException: Could not write/read JSON CVPlayer- 报错解决 java redis
问题分析在使用Redis缓存含有LocalDateTime类型变量的实体类时会产生序列化问题，这是由于在默认情况下Java8不支持LocalDateTime类型导致的,因此需要添加序列化器和反序列化器。报错信息写入报错org.springframework.data.redis.serializer.SerializationException:CouldnotwriteJSON:Java8dat
Python 高手编程系列二千零五十八：监控系统与应用指标杨琴1 python 开发语言
对于监控性能而言，可供选择的工具数量可能非常多。如果你的期望很高，那么你可能需要同时使用几种工具。无论使用哪种技术栈，Munin（http://munin-monitoring.org）都是许多组织最常用的工具之一。它是一个分析资源趋势的好工具，即使是没有额外配置的默认安装也提供了大量有用的信息。它的安装包括两个主要组件。●Munin主机，从其他节点收集指标并提供指标图形。●在被监视主机上安装的M
【爬虫】使用 Scrapy 框架爬取豆瓣电影 Top 250 数据的完整教程 web15085096641 爬虫 scrapy
前言在大数据和网络爬虫领域，Scrapy是一个功能强大且广泛使用的开源爬虫框架。它能够帮助我们快速地构建爬虫项目，并高效地从各种网站中提取数据。在本篇文章中，我将带大家从零开始使用Scrapy框架，构建一个简单的爬虫项目，爬取豆瓣电影Top250的电影信息。Scrapy官方文档：ScrapyDocumentation豆瓣电影Top250：豆瓣电影Top250本文的爬虫项目配置如下：系统：Windo
pandas习题 070：将数据库中大数据分块读取计算花花 Show Python pandas 强化练习题 pandas 数据库大数据
编码题）将以下sqlite3数据库中的数据分块读取，并计算value列所有值的和。importpandasaspdimportsqlite3importrandom#创建一个SQLite内存数据库，并生成示例数据conn=sqlite3.connect(':memory:')cursor=conn.cursor()
尚硅谷课程【笔记】——大数据之Shell【一】赶紧写完去睡觉大数据生态圈大数据 linux
课程视频：【【尚硅谷】Shell脚本从入门到实战】一、Shell概述为什么要学习Shell？1）需要看懂运维人员的Shell程序2）偶尔编写一些简单的Shell程序来管理集群、提高开发效率什么是Shell？1）Shell是一个命令行解释器，它接受应用程序/用户命令，然后调用操作系统内核。2）Shell还是一个功能相当强大的编程语言，易编写、易调试、灵活性强。二、Shell解析器Linux提供的Sh
Selenium使用方法 wangxin083 爬虫 python
一、x-path练习:图片保存importrequestsfromlxmlimportetreeimportcsvdefget_net_data():url='https://www.umei.net/'response=requests.get(url)response.encoding='utf-8'print(response.text)returnresponse.textdefdownl
华为HCIP Datacom H12-821 卷37 Q_yx 华为HCIP-datacom H12-821题库华为智能路由器
1.多选题下面关于Network-Summary-LSA描述正确的是A、Network-Summary-LSA中的Metric被设置成从该ABR到达目的网段的开销值B、Network-Sumary-LSA中的Netmask被设置成目的网段的网络掩码C、Network-Summary-LSA是由ASBR产生的D、Network-Summary-LSA中的LinkStateID被设置成目的网络的IP地
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$