devalone

Ambari 操作指南 (Ambari Operations) 之一

1. Ambari 操作指南: 概述 (Ambari Operations: Overview)

Hadoop 是用在商业主机网络集群上的大规模、分布式的数据存储和处理基础架构。监控和管理如此复杂的分布式系统是不简单的。为了管理这种复杂性，
Apache Ambari 从集群节点和服务收集了大量的信息，并把它们表现为容易使用的，集中化的接口：Ambari Web

Ambari Web 显示诸如服务特定的摘要、图表以及警报信息。可以使用 Ambari Web 创建和管理 HDP 集群并执行基本的操作任务，例如启动和停止服务，向集群
中添加主机，以及更新服务配置。也可以利用 Ambari Web 执行集群管理任务，例如启用 Kerberos 安全以及执行 Stack 升级。任何用户都可以查看 Ambari
Web 特性。拥有 administrator-level 角色的用户可以访问比 operator-level 或 view-only 的用户能访问的更多选项。例如，Ambari administrator 可以
管理集群安全，一个 operator 用户可以监控集群，而 view-only 用户只能访问系统管理员授予他的必要的权限。

1.1 Ambari 体系结构 (Ambari Architecture)
-----------------------------------------------------------------------------------------------------------------------------------------
Ambari Server 从整个集群上收集信息。每个主机上都有 Ambari Agent, Ambari Server 通过 Ambari Agent 控制每部主机。

Ambari Web 是一个客户端的(client-side)JavaScript 应用用于调用 Ambari REST API (accessible from the Ambari Server) 来访问集群信息并执行集群
操作。Ambari Web 认证之后，应用程序通过了 Ambari Server 验证。浏览器和服务器间的通信使用的是异步的 REST API

Ambari Web UI 定期地访问 Ambari REST API 以重置会话超时。因而，默认情况下，Ambari Web 会话是不会自动超时的。可以配置 Ambari 在没有活动一个
段时间之后超时。

1.2 访问 Ambari Web (Accessing Ambari Web)
-----------------------------------------------------------------------------------------------------------------------------------------

   ① 打开一个支持的浏览器

   ② 输入 Ambari Web URL:

       http://:8080

       Ambari Web 登录页显示到浏览器上

   ③ 输入用户名和密码

       如果是 Ambari 系统管理员第一次访问 Ambari Web UI, 使用默认到 Ambari administrator 账号

       admin/admin

   ④ 单机 Sign In


如果 Ambari Server 停止了，可以在 Ambari Server 的机器上重新启动

   ambari-server start

在 Ambari Web 上，Ambari administrators 从 Manage Ambari 选项访问 Ambari Admin 页。

2. 理解集群仪表盘 (Understanding the Cluster Dashboard)
-----------------------------------------------------------------------------------------------------------------------------------------
使用集群仪表盘来监控 Hadoop 集群。通过单机 Ambari Web UI 主窗口顶端的 Dashboard 访问集群仪表盘。

2.1 查看集群仪表盘 (Viewing the Cluster Dashboard)
-----------------------------------------------------------------------------------------------------------------------------------------
Ambari Web UI 显示仪表盘页作为主页。使用仪表盘来查看集群的操作状态。

Ambari Web 左侧显示集群当前运行的 Hadoop 服务列表。仪表盘包括 Metrics, Heatmaps, 以及C onfig History 选项卡；默认显示 Metrics 选项卡。在
Metrics 页面上，有多个小程序(widget), 表现 HDP 集群服务的操作状态信息。多数小程序显示一个度量值(metric), 例如，HDFS Disk Usage 表示为一个
负载图表和一个百分数指示。

   ■ 度量小程序及其描述 (Metrics Widgets and Descriptions)
   -------------------------------------------------------------------------------------------------------------------------------------

       ● HDFS metrics
       ---------------------------------------------------------------------------------------------------------------------------------
       HDFS Disk Usage       ：分布式文件系统(DFS) 已使用的百分比，包括 DFS 和 non-DFS
       Data Nodes Live       ：运转中的 DataNodes 的数量，由 NameNode 报告
       NameNode Heap       ：NameNode Java Virtual Machine (JVM) 堆内存使用的百分数。
       NameNode RPC       ：潜在 RPC 队列平均水平 (The average RPC queue latency)
       NameNode CPU WIO   ：CPU wait I/O 百分比
       NameNode Uptime       ：NameNode 正常运行时间计算值(uptime calculation)

       ● YARN metrics (HDP 2.1 or later stacks)
       ---------------------------------------------------------------------------------------------------------------------------------
       ResourceManager Heap   : 以使用的 ResourceManager JVM 堆内存百分比
       ResourceManager Uptime   ：ResourceManager uptime
       NodeManagers Live       ：运转中的 DataNodes 数量，由 ResourceManager 报告
       YARN Memory               ：可用的 YARN 内存百分数(used versus total available)

       ● HBase metrics
       ---------------------------------------------------------------------------------------------------------------------------------
       HBase Master Heap       : 已使用的 NameNode JVM 对内存百分数
       HBase Ave Load           ：HBase server 上的平均负载
       HBase Master Uptime       ：HBase master uptime
       Region in Transition   ：转换中的 HBase regions 数量

       ● Storm metrics (HDP 2.1 or later stacks)
       ---------------------------------------------------------------------------------------------------------------------------------
       Supervisors Live       ：运转中的 supervisor 的数量，由 Nimbus Server 报告

2.1.1 扫描操作状态 (Scanning Operating Status)
-----------------------------------------------------------------------------------------------------------------------------------------
Ambari Web 左侧的服务摘要列表列出了当前监控的所有 Apache 组件服务。图标的形状，颜色，以及每个条目左侧的动作指明了每个条目的操作状态：

   Status Indicators
   +---------------------------+-------------------------------+
   | Color                       | Status                       |
   +---------------------------+-------------------------------+
   | 实心绿 (solid green)       | All masters are running       |
   +---------------------------+-------------------------------+
   | 闪烁绿(blinking green)   | Starting up                   |
   +---------------------------+-------------------------------+
   | 实心红 (solid red)       | At least one master is down   |
   +---------------------------+-------------------------------+
   | 闪烁红 (blinking red)       | Stopping                       |
   +---------------------------+-------------------------------+

单击服务名称打开 Services 页面，可以看到有关该服务的更多详细的信息。

2.1.2 从度量小程序查看详细信息 (Viewing Details from a Metrics Widget)
-----------------------------------------------------------------------------------------------------------------------------------------
查看度量更详细的信息，把鼠标悬停在一个 Metrics widget 上:

   ● 要移除一个 widget, 单击白色的 X
   ● 要编辑一个 widget 显示的信息，单击编辑(铅笔)图标

2.1.3 链接到服务 UI (Linking to Service UIs)
-----------------------------------------------------------------------------------------------------------------------------------------
HDFS Links 和 HBase Links widgets 列出 HDP 组件用于链接到更多的 metric 信息，可用的线程栈，日志，以及纯组件 UI. 例如，可以为 HDFS 链接到
NameNode, Secondary NameNode, 和 DataNode 。

单击 More 下拉列表从每个服务可用的链接列表中选择。Ambari Dashboard 包括如下服务的度量的附加链接：


   ● HDFS：
   -------------------------------------------------------------------------------------------------------------------------------------
   NameNode UI       ：Links to the NameNode UI
   NameNode Logs   ：Links to the NameNode logs
   NameNode JMX    ：Links to the NameNode JMX servlet
   Thread Stacks    ：Links to the NameNode thread stack traces

   ● HBase：
   -------------------------------------------------------------------------------------------------------------------------------------
   HBase Master UI    ：Links to the HBase Master UI
   HBase Logs            ：Links to the HBase logs
   ZooKeeper Info        ：Links to ZooKeeper information
   HBase Master JMX    ：Links to the HBase Master JMX servlet
   Debug Dump            ：Links to debug information
   Thread Stacks        ：Links to the HBase Master thread stack traces


2.1.4 查看集群范围的 Metrics (Viewing Cluster-Wide Metrics)
-----------------------------------------------------------------------------------------------------------------------------------------
在 Metrics 选项卡，可以查看如下集群范围的度量值：

   Memory usage   : 集群范围的内存使用，包括缓存的(cached)，交换的(swapped), 使用的(used), 以及共享的(shared)
   Network usage   : 集群范围的网络利用，包括输入和输出(including in-and-out)
   CPU Usage       : 集群范围的 CPU 信息，包括系统的，用户的及 wait IO (including system, user and wait IO)
   Cluster Load   : 集群范围负载信息，包括节点总数， CPU 总数，运行的进程数量，以及 1-min Load

可以自定义显示如下：

   ● 移除一个 widget, 单击白色的 X

   ● 放大图表或列出小程序显示的清单，在 widget 上悬停鼠标

   ● 移除或添加 metric, 在 widget 联想上选择一个条目

   ● 查看图表的大视图，选择放大镜图标。关闭大视图，单击 OK



2.2 修改集群仪表盘 (Modifying the Cluster Dashboard)
-----------------------------------------------------------------------------------------------------------------------------------------

2.2.1 替换一个移除的小程序到表盘 (Replace a Removed Widget to the Dashboard)
-----------------------------------------------------------------------------------------------------------------------------------------
替换一个已经从表盘移除的小程序：

   ① 选择 Metric Actions
   ② 单击 Add
   ③ 选择一个 metric, 例如 Region in Transition
   ④ 单击 Apply

2.2.2 重置表盘 (Reset the Dashboard)
-----------------------------------------------------------------------------------------------------------------------------------------
重置表盘上所有的 widget 显示为默认设置

   ① 选择 Metric Actions
   ② 单击 Edit
   ③ 单击 Reset all widgets to default



2.2.3 自定义 metric 显示 (Customizing Metrics Display)
-----------------------------------------------------------------------------------------------------------------------------------------
虽然不是所有的 widget 都可以被编辑，也可以使用编辑(铅笔)图标来自定义某些 widget 显示 metric

   ① 将鼠标悬停在一个 widget 上

   ② 单击 Edit, 自定义 widget 窗口出现

   ③ 根据 Customize Widget 中的指导自定义 widget 的外观

   ④ 要保存修改并关闭编辑器，单击 Apply

   ⑤ 关闭编辑器不保存修改，单击 Cancel



2.2 查看集群热图 (Viewing Cluster Heatmaps)
-----------------------------------------------------------------------------------------------------------------------------------------
如前所述，Ambari web 主页左侧被切分出一个状态摘要面板，并在顶部有 Metrics, Heatmaps, 和 Config History 选项卡，默认显示 Metrics 选项卡。
当要查看整个集群利用情况的图形表示时，单击 Heatmaps 选项卡，使用简单的颜色代码，称为 heatmap, 提供这类信息。

集群中每个主机表示为一个带颜色的块。将鼠标悬停在主机的颜色块上可以看到该主机更多的信息，在另一窗口上显示有关主机上安装的 HDP 组件的度量值。

在块中显示的颜色表示在一组选定的 metric 单元中的使用率。如果任何确定使用率的必要的数据不可用，这个块显示为 Invalid data. 通过修改 heatmap
默认的最大值解决这个问题，使用 Select Metric 菜单

Heatmaps 支持如下的 metrics :

   Host/Disk Space Used %            : disk.disk_free and disk.disk_total
   Host/Memory Used %                : memory.mem_free and memory.mem_total
   Host/CPU Wait I/O %            : cpu.cpu_wio
   HDFS/Bytes Read                : dfs.datanode.bytes_read
   HDFS/Bytes Written                : dfs.datanode.bytes_written
   HDFS/Garbage Collection Time    : jvm.gcTimeMillis
   HDFS/JVM Heap MemoryUsed        : jvm.memHeapUsedM
   YARN/Garbage Collection Time    : jvm.gcTimeMillis
   YARN / JVM Heap Memory Used    : jvm.memHeapUsedM
   YARN / Memory used %            : UsedMemoryMB and AvailableMemoryMB
   HBase/RegionServer read   request count       : hbase.regionserver.readRequestsCount
   HBase/RegionServer write request count       : hbase.regionserver.writeRequestsCount
   HBase/RegionServer compaction queue size   : hbase.regionserver.compactionQueueSize
   HBase/RegionServer regions                    : hbase.regionserver.regions
   HBase/RegionServer memstore   sizes           : hbase.regionserver.memstoreSizeMB

3 管理主机 (Managing Hosts)
-----------------------------------------------------------------------------------------------------------------------------------------
作为集群系统管理员或集群操作员，需要知道每部主机的操作状态。也需要知道哪部主机有问题需要处理。可以使用 Ambari Web Hosts 页面来管理多个
Hortonworks Data Platform (HDP) 组件，例如运行在整个集群上 DataNodes, NameNodes, NodeManagers, 和 RegionServers. 举例来说，可以重启所有的
DataNode 组件，可选地控制滚动重启任务。Ambari Hosts 可以过滤进行管理的主机组件选取，基于操作状态，主机健康状况，以及定义的主机分组。

3.1 理解主机状态 (Understanding Host Status)
-----------------------------------------------------------------------------------------------------------------------------------------
可以在 Ambari Web Hosts 页面查看集群上单个主机的状态。主机以 fully qualified domain name (FDQN)的形式列出，并附有一个带有颜色的图标指示出
主机的操作状态。

   ● 红色三角形   ：该主机上至少有一个 master 组件挂掉了，鼠标悬停图标上查看一个工具提示列出受影响的组件。

   ● 橘色           ：该主机上至少有一个 slave 组件挂掉了，鼠标悬停图标上查看一个工具提示列出受影响的组件。

   ● 黄色           : Ambari Server 没有从该主机上收到心跳包超过 3 分钟。

   ● 绿色           ：正常运行状态。

   ● Maintenace Mode   ：黑色 "医药箱" 图标指出一部主机处于维护模式。

   ● Alert           ：红色方框带有一个数字指明该主机上的警报数量。

红色图标覆盖橘色图标，橘色图标覆盖黄色图标。换句话说，一部主机有 master component 宕机附有一个红色图标，即便它可能也有 slave component 和
连接问题。主机处于维护模式或遇到警报，图标出现在主机名右侧。

3.2 查找主机页面 (Searching the Hosts Page)
-----------------------------------------------------------------------------------------------------------------------------------------
可以查找完全主机列表，通过主机名，组件属性，以及组件操作状态过滤查找。也可以通过关键字查找，简单地在搜索框内输入一个单词。

主机搜索工具在主机列表上方

   ① 单击搜索框

       出现可用的搜索类型，包括：

       通过主机属性搜索   ：通过 host name, IP, host status 以及其他属性
       Search by Service   ：通过给定一个服务，查找运行此服务组件主机
       Search by Component   ：查找运行某组件处于给定状态的主机，例如 started, stopped, maintenance mode, 等等。
       Search by keyword   ：在搜索框输入任何单词描述要查找的内容，这成为一个文本过滤器。

   ② 单击搜索类型

       出现一个可用选项的列表，取决于在第一步中的选择
       例如，如果选择单击了 Service, 当前服务出现

   ③ 单击一个选项

       匹配当前搜索条件的列表显示到 Hosts 页面

   ④ 单击下一选项再次调整搜索

3.3 执行主机级别的动作 (Performing Host-Level Actions)
-----------------------------------------------------------------------------------------------------------------------------------------
利用 Actions UI 控件对集群主机执行动作。可以执行的动作(Actions)由一个一上的操作(operation)组成，可能在多个主机上，也称为批量操作(bulk
operations).

Actions 控件由三个顺序的菜单精确定义(to refine your search) 的工作流组成：一个主机菜单，一个基于主机选择的对象菜单，基于对象选择的动作菜单。

例如，如果要重启集群中任何存在 RegionServers 主机的 RegionServers 服务组件：

   ① 在 Hosts 页面，选择或查找运行 RegionServer 到主机：

   ② 利用 Actions 控件，单击 Fitered Hosts > RegionServers > Restart

   ③ 单击 OK 来启动选定的操作

   ④ 可选地，监控后台操作，诊断或处理重启操作故障

3.4 管理主机上的组件 (Managing Components on a Host)
-----------------------------------------------------------------------------------------------------------------------------------------
管理特定主机上运行的组件，在 Hosts 页面列出的 FDQN 中单击一个，那个主机的页面出现，单击 Summary 选项卡显示组件面板列出该主机安装的所有组件

要管理一部主机上所有的组件，可以利用显示窗口右上角的 Host Actions 控件来对所选主机上安装的所有组件 start, stop, restart, delete, 或
turn on maintenance mode

另一方面，可以管理单个组件，利用在组件面板内显示在每个单独组件旁边的下拉菜单。每个组件的菜单标示了组件当前的操作状态。打开菜单，显示可用的
管理选项，基于标示的状态。例如，可以 HDFS 的 DataNode 组件执行 decommission, restart, or stop 动作

3.5 退役一个 Master 或 Slave (Decommissioning a Master or Slave)
-----------------------------------------------------------------------------------------------------------------------------------------
退役是支持从集群中移除组件和它们的主机的过程。在移除主机或从服务上移除主机之前，必须退役运行在该主机上的 master 或 slave 服务。退役有助于
保护数据丢失或服务损坏。退役对于下列组件类型可用：

   ● DataNodes
   ● NodeManagers
   ● RegionServers

退役执行下列任务：

   对于 DataNodes       ：安全地复制 HDFS 数据到集群中其他的 DataNodes
   对于 NodeManagers   ：停止接受新作业的请求并停止组件
   对于 RegionServers   ：打开 drain mode 并停止组件

3.5.1 退役一个组件 (Decommission a Component)
-----------------------------------------------------------------------------------------------------------------------------------------

   ① 利用 Ambari Web，浏览到 Hosts 页面

   ② 找到并单击组件驻留的主机 FQDN

   ③ 使用 Actions 控件，单击 Selected Hosts > DataNodes > Decommission

   过程中 UI 显示退役中(Decommissioning)状态
   退役过程完成时，退役状态变为已退役 (Decommissioned)

3.6 删除一个组件 (Delete a Component)
-----------------------------------------------------------------------------------------------------------------------------------------

   ① 利用 Ambari Web，浏览到 Hosts 页面

   ② 找到并单击组件驻留的主机 FQDN

   ③ 在 Components 中, 找到一个要退役的组件

   ④ 如果该组件的状态是 Started, 停止它

       一个退役的 slave 组件可以在已退役状态重启

   ⑤ 从组件下拉菜单中单击 Delete

       删除一个 slave 组件，如一个 DataNode 不会自动通知 master 组件，如 NameNode 从它的排除列表中移除那个 slave 组件。添加一个已删除的
       组件回到集群表现出如下问题，从 master 的视角观察，添加进来的 slave 保持在退役状态。重启 master 组件可排除故障

   ⑥ 让 Ambari 识别并监控余下的组件，重启服务。

3.7 从集群删除一个主机 (Deleting a Host from a Cluster)
-----------------------------------------------------------------------------------------------------------------------------------------
删除一个主机从集群中移除该主机

先决条件：在删除一部主机之前，必须完成如下前提：

   ● 停止该主机上运行的所有组件
   ● 退役运行在该主机上的所有 DataNode
   ● 迁移该主机上所有的 master 组件，例如 NameNode 或 ResourceManager
   ● 关闭主机的维护模式(Maintenance Mode)

步骤：
   ① 利用 Ambari Web，浏览到 Hosts 页面, 找到并单击要删除的主机 FQDN

   ② 在 Host-Details 页面，单击 Host Actions

   ③ 单击 Delete

3.8 设置维护模式 (Setting Maintenance Mode)
-----------------------------------------------------------------------------------------------------------------------------------------
在一个 Ambari-managed 集群上，当要专注于执行硬件或软件维护，修改配置设置，处理故障，退役，或移除集群节点时，设置维护模式可以阻止警报，并
去掉在特定服务，组件，以及主机上的批操作(omit bulk operations)。

显示设置一个服务的维护模式，隐含地设置了运行此服务的组件和主机的维护模式。如果维护模式阻止了要执行在服务，组件，或主机上的批操作，可以在
维护模式中显式地启动和停止服务、组件、或主机。

下面几节提供了一个案例，如何在有三个节点，Ambari 管理集群上使用维护模式。描述如何显式地打开(turn on) HDFS 服务的维护模式，主机，以及隐式地
打开服务、组件，以及主机的维护模式。

3.8.1 设置服务维护模式 (Set Maintenance Mode for a Servicee)
-----------------------------------------------------------------------------------------------------------------------------------------

   ① 在 Services 页面，选择 HDFS
   ② 选择 Service Actions, 然后选择 Turn On Maintenance Mode
   ③ OK 确认

   注意，在 Services Summary, NameNode 和 SNameNode 组件的 Maintenance Mode 打开

3.8.2 设置主机维护模式 (Set Maintenance Mode for a Host)
-----------------------------------------------------------------------------------------------------------------------------------------
使用 Host Actions 控件设置主机维护模式
步骤：

   ① Hosts 页，选择主机 FDQN
   ② 选择 Host Actions, 然后选择 Turn On Maintenance Mode.
   ③ OK 确认

   注意，主机上所有的组件打开维护模式

使用 Actions 控件设置主机维护模式
步骤：
   ① Hosts 页，选择主机 FDQN
   ② 在 Actions > Selected Hosts > Hosts, 选择 Turn On Maintenance Mode.
   ③ OK 确认

3.8.3 何时设置维护模式 (When to Set Maintenance Mode)
-----------------------------------------------------------------------------------------------------------------------------------------
设置维护模式的四个一般场景为：执行维护，测试配置修改，测底删除一个服务，处理警报。


   ■ 要在一部主机上执行硬件或操作系统维护
   -------------------------------------------------------------------------------------------------------------------------------------
   执行维护时，要能够做如下操作：

       ● 阻止这部主机上所有组件生产警报
       ● 能够停止、启动、以及重启主机上的每一个组件
       ● 阻止该主机 host-level 或 service-level 的 starting, stopping, 或 restarting 组件批操作

   为了达成这些目标，显示设置主机的维护模式，将这部主机上所有的组件隐式地设置为维护模式。

   ■ 要测试一个服务配置的修改。应该停止、启动、以及重启服务来测试重启是否激活了配置的变化
   -------------------------------------------------------------------------------------------------------------------------------------
   要测试配置信息的变化，要确保如下条件：

       ● 这个服务上没有任何组件生成警报
       ● 这个服务上没有 host-level 货 service-level 的批操作启动、停止、或重启组件

   为了达成这些目标，显示设置服务维护模式。将一个服务设置为维护模式隐式地为该服务的所有组件打开维护模式

   ■ 要停止一个服务
   -------------------------------------------------------------------------------------------------------------------------------------
   要完全停止一个服务，需要确保如下条件：

       ● 这个服务没有生成 warnings
       ● 没有由 host-level 的动作或批操作导致的组件启动，停止，或重启

   为了达成这些目标，显示为服务设置维护模式。将一个服务设置为维护模式隐式地为该服务的所有组件打开维护模式

   ■ 要停止一个主机组件生成警报
   -------------------------------------------------------------------------------------------------------------------------------------
   要停止一个主机组件生成警报，必须能够做到如下内容：

       ● 检查组件
       ● 访问该组件生成的 warnings 和 alerts

   为了达成这些目标，为主机组件显示设置维护模式。将主机组件设置为维护模式，阻止 prevents host-level 和 service-level 批操作 starting 或
   restarting 该组件。可以在维护模式开启状态系显示重启该组件。

3.9 向集群添加主机 (Add Hosts to a Cluster)
-----------------------------------------------------------------------------------------------------------------------------------------

   ① 浏览到 Hosts 页面然后选择 Actions > +Add New Hosts

       Add Host 向导提供一系列提示类似于 Ambari 集群安装向导(Ambari Cluster Install wizard.)

   ② 跟随提示，提供相关信息，继续完成向导


3.10 建立机架感知 (Establishing Rack Awareness)
-----------------------------------------------------------------------------------------------------------------------------------------
有两种方法建立机架感知。要么使用 Ambari 设置 rack ID, 或者利用自定义拓扑脚本(topology script) 设置 rack ID.

3.10.1 利用 Ambari 设置机架 ID (Set the Rack ID Using Ambari)
-----------------------------------------------------------------------------------------------------------------------------------------
通过设置 Rack ID, 使 Ambari 为主机管理机架信息，包括在 heatmaps 中通过 Rack ID 显式主机，使用户能过滤并在 Hosts 页面通过 Rack ID 查找主机

如果集群中安装了 HDFS, Ambari 通过使用拓扑脚本将 Rack ID 信息传递给 HDFS. Ambari 生成的拓扑脚本在 /etc/hadoop/conf/topology.py 位置，并自动
设置 core-site 中的 net.topology.script.file.name 属性。这个脚本读取一个 Ambari 自动生成的 /etc/hadoop/conf/topology_mappings.data 映射文件。
当你在 Ambari 中修改 Rack ID 分配时，这个映射文件会在推进(push out) HDFS 配置信息时更新。HDFS 利用这个拓扑脚本获得 DataNode 主机的机架信息。

有两种方法利用 Ambari Web 设置 Rack ID: 对于多主机，使用 Actions, 或者对于单个的主机，使用 Host Actions

   ■ 为多个主机设置 Rack ID
   -------------------------------------------------------------------------------------------------------------------------------------
   步骤：
       ① 使用 Actions, 单击 selected, filtered, 或 all hosts
       ② 单击 Hosts.
       ③ 单击 Set Rack



   ■ 在单个主机上设置 Rack ID
   -------------------------------------------------------------------------------------------------------------------------------------
   步骤：

       ① 浏览到 Host 页面
       ② 单击 Host Actions
       ③ 单击 Set Rack

3.10.2 利用自定义拓扑脚本设置机架 ID (Set the Rack ID Using a Custom Topology Script)
-----------------------------------------------------------------------------------------------------------------------------------------
如果不想 Ambari 管理主机到机架信息，可以使用自定义到拓扑脚本。要做到这一点，必须创建自己的拓扑脚本管理分布脚本到所有主机。注意，也因为
Ambari 不能访问到主机机架信息，Ambari Web 中的 heatmaps 不能显示机架。

使用自定义脚本设置 Rack ID:
步骤：
   ① 浏览到 Services > HDFS > Configs
   ② 修改 net.topology.script.file.name 为自己的自定义拓扑脚本

       如，/etc/hadoop/conf/topology.sh

   ③ 分布拓扑脚本到所有主机上

   现在，可以为 Ambari 之外的脚本管理机架映射信息了。


*
*
*

4. 管理服务 (Managing Services)
-----------------------------------------------------------------------------------------------------------------------------------------
利用 Ambari Web UI 主页的 Services 选项卡监控和管理运行于集群上选定的服务。
集群上安装的所有服务列于左侧的面板上：

4.1 启动和管理所有服务 (Starting and Stopping All Services)
-----------------------------------------------------------------------------------------------------------------------------------------
同时启动或停止列出的所有服务，单击 Actions 然后单击 Start All 或 Stop All:

4.2 显示服务操作摘要 (Displaying Service Operating Summary)
-----------------------------------------------------------------------------------------------------------------------------------------
从服务列表上单击服务的名称，显示出 Summary 选项卡含有关于此服务操作状态的基本信息，包括警报。要刷新监控面板并显示另一个服务的信息，可以在
服务列表上单击一个不同的服务名称。

注意服务名称后面带有颜色的图标，指出服务的操作状态和该服务生成的警报。可以单击一个 View Host 链接来查看组件和运行选定组件的主机。

4.2.1 警报和健康检查 (Alerts and Health Checks)
-----------------------------------------------------------------------------------------------------------------------------------------
在 Summary tab, 可以单击 Alerts 来查看所有健康检查列表以及所选中服务的状态，重要警报首先显示。要查看警报定义，可以单击列表中每个警报消息的
文本标题来查看警报定义。例如单击 HBase > Services > Alerts > HBase Master Process

4.2.2 修改服务表盘 (Modifying the Service Dashboard)
-----------------------------------------------------------------------------------------------------------------------------------------
取决于所选择的服务，Summary tab 包含一个 Metrics 表盘，默认含有重要的服务度量的监控

如果安装了 Ambari Metrics 服务并使用 Apache HDFS, Apache Hive, Apache HBase, 或 Apache YARN, 可以自定义度量表盘。可以向 Metrics 表盘添加
或从表盘上移除 widget, 并可以创建新的 widget 或删除 widget。widget 可以是对你或你的表盘私有的(private), 或者可以共享到 Widget Browser 库。

必须已经安装 Ambari Metrics 服务才能查看，创建，以及自定义 Metrics 表盘。

4.2.2.1 添加或移除一个 Widget (Adding or Removing a Widget)
-----------------------------------------------------------------------------------------------------------------------------------------
要在 HDFS, Hive, HBase, 或 YARN 服务的 Metrics 表盘中添加或移除一个 widget:

   ① 或者单击 + 号图标启动 Widget Browser, 或者从 Actions > Metrics 单击 Widget Browser
   ② Widget Browser 显示可以添加到服务表盘中的 widget, 包括已经包含在表盘中的，共享的 widget, 以及已创建的 widget.
   ③ 如果只要显示自己创建的 widget,选择 “Show only my widgets” 复选框
   ④ 如果要移除一个添加到表盘中的 widget, 单击它的移除图标
   ⑤ 如果要添加一个还没有添加进来的可用 widget, 单击 Add



4.2.2.2 创建一个 Widget (Creating a Widget)
-----------------------------------------------------------------------------------------------------------------------------------------
   ① 单击 + 图标启动 Widget Browser
   ② 或者单击 Create Widget 按钮，或者在 Actions 菜单上单击 Create Widget
   ③ 选择创建的 widget 类型
   ④ 取决于服务和 widget 类型，可以选择度量和使用的操作符创建表达式来咋 widget 中显式
       在构建表达式时会显式 widget 的预览。
   ⑤ 输入 widget 的名称和描述
   ⑥ 可选地，选择共享此 widget
       共享 widget 使这个 widget 对集群中所有用户可用。一个 widget 共享之后，其他 Ambari Admins 或 Cluster Operators 可以修改或删除这个
       widget, 这是不可恢复的。

4.2.2.3 删除一个 Widget (Deleting a Widget)
-----------------------------------------------------------------------------------------------------------------------------------------

   ① 单击 + 图标启动 Widget Browser, 或者从 Actions > Metrics 单击 Widget Browser
   ② Widget Browser 显示可以添加到服务表盘中的 widget, 包括共享的和已创建的 widget
   ③ 如果一个 widget 已添加到表盘，它会显式为 Added, 单击它可以移除
   ④ 对于自己创建的 widget, 可以选择 More... 选项删除
   ⑤ 对于共享的 widget, 如果是 Ambari Admin 或 Cluster Operator, 也会有选项删除

       删除一个共享的 widget 会从所有用户删除，此过程不可逆

4.2.2.4 导出 Widget 图形数据 (Export Widget Graph Data)
-----------------------------------------------------------------------------------------------------------------------------------------
可以利用 Export 能力从 widget 图表中导出度量数据

   ① 将鼠标指针悬停在 widget 图表上面，单击图表放大显示，显示 Export 图标
   ② 单击图标并制定 CSV 或 JSON 格式


4.2.2.5 设置显示时区 (Setting Display Timezone)
-----------------------------------------------------------------------------------------------------------------------------------------
可以设置时区用于显示 widget 图表中的度量数据

   ① Ambari Web 中，单击用户名病选择 Settings
   ② 在 Locale 节，选择 Timezone.
   ③ 单击 Save

   Ambari Web UI 重新载入并使用新设置的时区显示图表。

4.3 添加服务 (Adding a Service)
-----------------------------------------------------------------------------------------------------------------------------------------
Ambari 安装向导默认安装所有可用的 Hadoop 服务。可以在初始安装时仅选择部署一部分服务，然后在需要时安装其他服务。例如，有些有些用户在初始
安装时只选择安装核心 Hadoop 服务。 Actions 控件的 Add Service 选项可以在不中断 Hadoop 集群操作情况下部署其他服务。当部署了所有可用当服务后，
Add Service 控件显示为无效，表明它不可用。

添加服务，下面步骤展示了向 Hadoop 集群添加 Apache Falcon 服务的例子:

   (1) 单击 Actions > Add Service
       打开 Add Service wizard

   (2) 单击 Choose Services
       Choose Services 面板显示，已激活的服务显示为绿色背景并且其复选框被选中。

   (3) 在 Choose Services 面板上，选择要添加服务前面的复选框，然后单击 Next

   (4) 在 Assign Masters 页面，确认默认的主机分配。
       Add Services Wizard 指示所选服务的 master 组件安装的主机。另一方面，利用下拉菜单选择不同的主机，让所选服务的 master 组件添加到该
       主机上。

   (5) 如果要添加的服务要求 slaves 和 clients, 在 Assign Slaves and Clients 页，接受默认的 slave 和 client 组件分配的主机，单击 Next
       另一方面，选择要安装 slave 和 client 组件的主机，然后单击 Next

   (6) 在 Customize Services, 接受默认的配置属性
       另一方面，如有必要，编辑默认的配置属性值。选择 Override 为此服务创建一个配置组，然后，选择 Next

   (7) 在 Review 页，验证配置设置符合期望，然后单击 Deploy

   (8) 监控安装，启动，以及测试服务的过程，当成功结束时，单击 Next

   (9) 当看到安装结果的摘要显示时，单击 Complete

   (10) 查看并确认建议的配置修改

   (11) 重新启动其他组件，因新增加了服务，其配置已过时。

4.4 执行服务动作 (Performing Service Actions)
-----------------------------------------------------------------------------------------------------------------------------------------
通过执行服务动作来管理集群上一个选定的服务。在 Services tab, 单击 Service Actions 然后单击一个选项。可用的选项取决于选定的服务。例如，HDFS
服务动作，单击 Turn On Maintenance Mode 会阻止该服务生成的警报和状态变化指示，但允许对该服务上启动，停止，重启，迁移，或执行维护任务。

4.5 滚动重启 (Rolling Restarts)
-----------------------------------------------------------------------------------------------------------------------------------------
当重启多个服务、组件、或主机时，使用 rolling restarts 来分布任务。一个滚动重启，使用一个批次序列停止并启动多个运行中的 slave 组件，例如
DataNodes, NodeManagers, RegionServers, or Supervisors .

   重要提示：
       DataNodes 的滚动重启只能在集群维护期间执行。

可以设置滚动重启的的参数值以控制服务的数量，间隔时间，容错限度，以及在大型集群上重启组件数量的限制。

要运行一个滚动重启，执行下列步骤：

   ① 在 Service 页面左侧的服务列表上，单击一个服务名称
   ② 在服务的 Summary 页面，单击一个链接，例如 DataNodes 或 RegionServers, 任何要重启的组件

       Hosts 页面列出集群上存在有所选组件的主机名称

   ③ 利用 host-level 的 Actions 菜单，单击一个 slave 组件的名称，然后单击 Restart.
   ④ 为 Rolling Restart Parameters 查看并设置值
   ⑤ 可选地，重置标志来重启仅修改了配置的组件
   ⑥ 单击 Trigger Restart

   触发重启之后，应该监控后台操作的过程。

4.5.1 设置滚动重启参数 (Setting Rolling Restart Parameters)
-----------------------------------------------------------------------------------------------------------------------------------------
选择重启从属组件时，可以利用参数来控制如何重启组件滚动。参数值默认为集群上组件总数的 10%, 例如，对于在有三个节点的集群中的组件, 一个滚动
重启的默认设置是一次重启一个组件，重启间隔是等待 2 分钟，如果只有一个出现故障就继续，并重启运行此服务的所有组件。所有参数输入整数，非零值

Batch Size       ：包含在每次重启批次里的组件数量
Wait Time       ：每个批次组件排队等候的数据(秒单位)
Tolerate up to x failures   ：跨所有批次，在挂起重启并不在排队批次之前，重启失败容许的总数。

4.5.2 终止滚动重启 (Aborting a Rolling Restart)
-----------------------------------------------------------------------------------------------------------------------------------------
要终止批次中将来的滚动重启，单击 Abort Rolling Restart

4.6 监控后台操作 (Monitoring Background Operations)
-----------------------------------------------------------------------------------------------------------------------------------------
可以利用 Background Operations 窗口监控一个由多个操作组成的任务进度和完成情况，例如重启组件。当运行这样一个任务时，Background Operations
窗口默认是打开的。例如监控一个滚动重启的进度，单击 Background Operations 窗口中的元素：

   ① 单击每个操作的右箭头显示每一部主机上的重启操作进度
   ② 重启操作完成后，可以单击右箭头或主机名来查看日志文件以及选定主机上生成的错误信息
   ② 可选地，可以利用 Background Operations 窗口右上角的 Copy, Open, or Host Logs 图标来复制，打开，或查看操作日志。

也可以选择 Background Operations 窗口底部的复选框来在将来执行任务时隐藏该窗口。

4.7 移除一个服务 (Removing A Service)
-----------------------------------------------------------------------------------------------------------------------------------------

   重要提示：
       移除一个服务是不可逆的并且所有的配置历史将丢失

   步骤：
   ① 在 Services tab 页面的左侧面板，单击服务名称
   ② 单击 Service Actions > Delete.
   ③ 提示时，移除任何依赖服务
   ④ 提示是，停止服务的所有组件
   ⑤ 确认移除

   服务停止后，必须确认移除


4.8 操作审计 (Operations Audit)
-----------------------------------------------------------------------------------------------------------------------------------------
当利用 Ambari 执行操作时，例如用户登录或退出，停止或启动服务，添加或移除服务， Ambari 会在一个审计日志中创建一条内容。通过读取审计日志，
可以确定谁执行了操作，操作是什么时间发生的，以及其他操作特定的信息。可以在 Ambari server 主机上找到 Ambari 审计日志：

   /var/log/ambari-server/ambari-audit.log

当修改了一个服务的配置信息，Ambari 在审计日志中创建一条内容，并创建一个特殊的日志文件：

   ambari-config-changes.log

通过读取配置修改日志，可以发现每次配置修改更多的信息，例如：

   2016-05-25 18:31:26,242 INFO - Cluster 'MyCluster' changed by: 'admin';
   service_name='HDFS' config_group='default' config_group_id='-1' version='2'



4.9 使用快速链接 (Using Quick Links)
-----------------------------------------------------------------------------------------------------------------------------------------
选择 Quick Links 选项可以访问选定服务的一些额外的信息源，例如 HDFS 的 Quick Links 选项包括如下内容：

   NameNode JMX
   NameNode Logs
   Thread Stacks
   NameNode UI

Quick Links 不是对每个服务都可用


4.10 刷新 YARN 容量调度器 (Refreshing YARN Capacity Scheduler)
-----------------------------------------------------------------------------------------------------------------------------------------
修改 Capacity Scheduler 配置之后，如果没有进行破坏性修改配置信息，YARN 可以不需要重启 ResourceManager 刷新队列。如果执行了破坏性修改，例如
删除一个队列，刷新操作会失败并输出如下信息：Failed to re-init queues . 当进行破坏性修改时，必须执行 ResourceManager 重启来使容量调度器的
修改生效。

刷新 Capacity Scheduler, 执行如下步骤：

   ① 在 Ambari Web, 浏览到 Services > YARN > Summary.
   ② 单击 Service Actions, 然后单击 Refresh YARN Capacity Scheduler
   ③ 确认要执行此操作

刷新操作提交给 YARN ResourceManager



4.11 管理 HDFS (Managing HDFS)
-----------------------------------------------------------------------------------------------------------------------------------------

4.11.1 重均衡 HDFS (Rebalancing HDFS)
-----------------------------------------------------------------------------------------------------------------------------------------
HDFS 提供了一个 a “balancer” 工具帮助均衡集群中数据块跨 DataNodes 分布。启动均衡进程，执行下列步骤：

   ① 在 Ambari Web 中，浏览到 Services > HDFS > Summary
   ② 单击 Service Actions, 然后单击 Rebalance HDFS.
   ③ 输入 Balance Threshold 值作为磁盘容量到百分比
   ④ 单击 Start

可以通过打开 Background Operations 窗口监控或取消重均衡进程。

4.11.2 调整垃圾回收 (Tuning Garbage Collection)
-----------------------------------------------------------------------------------------------------------------------------------------
Concurrent Mark Sweep (CMS) garbage collection (GC) 进程包括一系列启发式规则用于触发垃圾回收。这使得垃圾回收是不可预测的并趋向于延迟回收，
直到抵达容量水平，产生一个 Full GC 错误(有可能中断所有进程)

Ambari 在集群部署期间设置了很多属性的默认值。在 hadoop-env 模板中到 export HADOOP_NameNode_Opts= 子句，有两个参数影响 CMS GC 进程，有如下
的默认设置：

   ● -XX:+UseCMSInitiatingOccupancyOnly
   阻止使用 GC 启发

   ● -XX:CMSInitiatingOccupancyFraction=
   告知 Java VM 何时 CMS 收集器被触发
   如果这个值设置得过低，CMS 收集器运行过于频繁；如果设置过高，CMS 收集器触发得太晚，并且可能发生 concurrent mode failure. 默认设置
   -XX:CMSInitiatingOccupancyFraction 的值为 70, 意味着应用程序应该利用少于 70% 的容量。

通过修改 NameNode CMS GC 参数来调整垃圾回收，执行如下步骤：

   ① 在 Ambari Web, 浏览到 Services > HDFS.
   ② 打开 Configs tab, 并浏览到 Advanced > Advanced hadoop-env
   ③ 编辑 hadoop-env 模板
   ④ 保存配置并有提示出现，重启

4.11.3 自定义 HDFS 主目录 (Customizing the HDFS Home Directory)
-----------------------------------------------------------------------------------------------------------------------------------------
默认情况下，HDFS 的用户主目录为 /user/. 可以利用 dfs.user.home.base.dir 属性自定义 HDFS 主目录

   ① 在 Ambari Web, 浏览到 Services > HDFS > Configs > Advanced.
   ② 单击 Custom hdfs-site, 然后单击 Add Property
   ③ 在弹出到 Add Property 中，添加如下属性：

       dfs.user.home.base.dir=

   ④ 单击 Add, 然后在提示是，保存新配置病重启


4.12 在 Storm 环境内管理 Atlas (Managing Atlas in a Storm Environment)
-----------------------------------------------------------------------------------------------------------------------------------------
在 Ambari 中更新 Apache Atlas 配置设置时，Ambari 标记此服务要求重启。要重启这些服务，执行如下步骤：

   ① 在 Ambari Web, 单击 Actions 控件
   ② 单击 Restart All Required

   提示：
       Apache Oozie 在一个 Atlas 配置更新后要求重启，但在 Ambari 中可能没有标记为要求重启。如果 Oozie 没有包含进来，执行如下步骤重启 Oozie:

       ① 在 Ambari Web, 在服务摘要面板单击 Oozie
       ② 单击 Service Actions > Restart All.



4.13 启用 Oozie UI (Enabling the Oozie UI)
-----------------------------------------------------------------------------------------------------------------------------------------
Ext JS 是 GPL 许可证的软件，并且不再包含在 HDP 2.6 中。因此 Oozie WAR 文件没有构建到 Ext JS-based 用户接口程序中，除非 Ext JS 手动安装到
Oozie server. 如果使用 Ambari 2.6.1.3 添加 Oozie 到 HDP2.6.4 或更高版本，默认没有 Oozie UI 可用。如果想要 Oozie UI，必须手动安装 Ext JS
到 Oozie server 主机。在重启操作期间，Ambari 重构这个 Oozie WAR 文件并包含 Ext JS-based Oozie UI

步骤：
   ① 登录到 Oozie Server 主机
   ② 下载并安装 Ext JS 包

       CentOS RHEL Oracle Linux 7:
       wget http://public-repo-1.hortonworks.com/HDP-UTILS-GPL-1.1.0.22/repos/centos7/extjs/extjs-2.2-1.noarch.rpm
       rpm -ivh extjs-2.2-1.noarch.rpm

   ③ 移除如下文件：

       rm /usr/hdp/current/oozie-server/.prepare_war_cmd

   ④ 在 Ambari UI 上重启 Oozie Server

Ambari 会重构 Oozie WAR 文件

参考：

Ambari 操作指南 (Ambari Operations) 之一

Ambari 操作指南 (Ambari Operations) 之二

Ambari 操作指南 (Ambari Operations) 之三

Ambari 操作指南 (Ambari Operations) 之四

Ambari 操作指南 (Ambari Operations) 之五

Ambari 操作指南 (Ambari Operations) 之六

你可能感兴趣的:(Hadoop)

【大数据入门核心技术-Hive】（十六）hive表加载csv格式数据或者json格式数据 forest_long 大数据技术入门到21天通关大数据 hive hadoop 开发语言后端数据仓库
一、环境准备hive安装部署参考：【大数据入门核心技术-Hive】（三）Hive3.1.2非高可用集群搭建【大数据入门核心技术-Hive】（四）Hive3.1.2高可用集群搭建二、hive加载Json格式数据1、数据准备vistu.json[{"id":111,"name":"name111"},{"id":222,"name":"name22"}]上传到hdfshadoopfs-putstu.j
cascading 入门（一） zhumin726
1cascading是什么cascading是一个架构在Hadoop上的API，用来创建复杂和容错数据处理工作流。它抽象了集群拓扑结构和配置来快速开发复杂分布式的应用，而不用考虑背后的MapReduce。Cascading目前依赖于Hadoop提供存储和执行架构，但是CascadingAPI为开发者隔离了Hadoop的技术细节，提供了不需要改变初始流程工作流定义就可以在不同的计算框架内运行的能力。
搭建单机伪分布式Hadoop+spark+scala 啥也不会0-0 分布式 hadoop spark
目录一、准备环境包：二、创建centos7虚拟机并配置ip三、链接Xshell并上环境包四、安装JDK1.解压jdk2.设置JAVA环境变量3.执行source使设置生效：4.检查JAVA是否可用。五、免密登陆1.创建ssh秘钥，输入如下命令，生成公私密钥2.将master公钥id_dsa复制到master进行公钥认证，实现本机免密登陆，测试完exit退出六、安装Hadoop软件1.解压hadoo
Hadoop 与 Spark：大数据处理的比较王子良. 大数据经验分享 hadoop spark 大数据
欢迎来到我的博客！非常高兴能在这里与您相遇。在这里，您不仅能获得有趣的技术分享，还能感受到轻松愉快的氛围。无论您是编程新手，还是资深开发者，都能在这里找到属于您的知识宝藏，学习和成长。博客内容包括：Java核心技术与微服务：涵盖Java基础、JVM、并发编程、Redis、Kafka、Spring等，帮助您全面掌握企业级开发技术。大数据技术：涵盖Hadoop（HDFS）、Hive、Spark、Fli
虚拟机VMware Workstation Pro安装集群+hadoop+spark+scala 落枫兮 hadoop spark scala
参考资料：参考视频教程链接：大数据实验虚拟机安装Hadoop和Spark_哔哩哔哩_bilibiliup主：孤独时代的硕硕namenode安装选择镜像、路径、磁盘（最好不要c盘）、内存和处理器编辑名称与位置可点击此处自定义硬盘进行设置。选择语言、时区、软件、位置和网络
Hadoop分布式文件系统-HDFS架构 Fancs2024 hadoop hadoop hdfs
一、HDFS的简介HDFS全称HadoopDistributedFileSystem，是分布式文件管理系统。主要是为了解决大数据如何存储的问题，跟一般文件系统不同的是，它可以通过扩展服务器结点来扩充存储量，可以用低成本的硬件构建出支持高吞吐量的文件系统。二、HDFS的特点高容错性：一个HDFS集群会包含非常多的结点，HDFS将文件分块存储，并且会保存多个副本到不同的机器节点上以保证数据的安全，而且
TiDB 对 Hadoop 的影响：大数据时代的新选择狮歌~资深攻城狮 tidb 数据仓库数据分析数据库分布式
TiDB对Hadoop的影响：大数据时代的新选择随着大数据时代的到来，各种处理和存储海量数据的技术应运而生。Hadoop和TiDB都是这个时代的代表性技术，但它们的设计初衷、使用场景和应用方式却有所不同。那么，TiDB作为一个分布式数据库，它对传统的Hadoop生态系统产生了哪些影响呢？今天，我们就来聊聊这个话题。Hadoop简介：大数据的“老牌劲旅”首先，我们需要了解一下Hadoop的背景。Ha
Apache DolphinScheduler 限制秒级别的定时调度数据库
背景ApacheDolphinScheduler定时任务配置采用的7位Crontab表达式，分别对应秒、分、时、月天、月、周天、年。在团队日常开发工作中，工作流的定时调度一般不会细化到秒级别。但历史上出现过因配置的疏忽大意而产生故障时间，如应该配置每分钟执行的工作流被配置长了每秒执行，造成短时间内产生大量工作流实例，对ApacheDolphinScheduler服务可用性和提交任务的Hadoop集
有了TiDB，是否还需要“散装”大数据组件？狮歌~资深攻城狮 tidb 数据仓库数据分析数据库分布式
有了TiDB，是否还需要“散装”大数据组件？最近和同事们讨论一个问题：在大数据应用日益增多的今天，如果使用了TiDB这样的一体化数据库，还需要使用那些传统的大数据组件（比如Hadoop、Spark等）吗？相信大家在公司或项目中，常常遇到需要处理大量数据的场景，特别是互联网、金融、电商等行业。随着TiDB的兴起，它作为一款分布式关系型数据库，似乎能够解决不少大数据问题。那么，问题来了：如果我们已经选
Hadoop是什么，怎么部署安装？狮歌~资深攻城狮 hadoop 大数据分布式
Hadoop是什么？Hadoop是一个由Apache基金会开发的开源分布式系统基础架构，主要用于处理和存储大规模数据集。它包括两个核心组件：Hadoop分布式文件系统（HDFS）和HadoopYARN（YetAnotherResourceNegotiator）。HDFS提供了一个高吞吐量的数据访问接口，允许用户在集群中存储大量数据。它通过将文件分割成多个块并分布在集群的不同节点上来实现高可靠性和可
azkaban的概况北京小峻大数据 azkaban mysql 数据库
Azkaban的性质azkaban是一个任务调度,管理系统,可以帮用户管理,调度各种运算任务的一个web服务器可以调度任何任务,只要你的任务能用脚本启动azkaban的类似的产品还有很多,例如hadoop生态中原生的:oozie,areflow局限性目前azkaban只支持mysql作为元数据管理系统,必须安装mysql服务器角色executorserver有好几个是真正执行的程序,调度用户的任务
基于hadoop的协同过滤算法电影推荐系统的设计与实现 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
基于hadoop的协同过滤算法电影推荐系统的设计与实现文章目录基于hadoop的协同过滤算法电影推荐系统的设计与实现1.背景介绍1.1电影推荐系统的重要性1.2传统推荐系统的缺陷1.3Hadoop在大数据处理中的作用2.核心概念与联系2.1协同过滤算法2.2基于用户的协同过滤2.3基于项目的协同过滤2.4Hadoop在协同过滤算法中的应用3.核心算法原理具体操作步骤3.1基于用户的协同过滤算法流程
hive电影数据分析系统 Springboot协同过滤-余弦函数推荐系统爬虫2万+数据大屏数据展示 + [手把手视频教程和开发文档] QQ-1305637939 毕业设计大数据毕设计算机毕业设计 hive spring boot 爬虫
hive电影数据分析Springboot协同过滤-余弦函数推荐系统爬虫2万+数据大屏数据展示+[手把手视频教程和开发文档]【功能介绍】1.java爬取【豆瓣电影】网站中电影数据,保存为data.csv文件,数据量2万+2.data.csv上传到hadoop集群环境3.MR数据清洗data.csv4.Hive汇总处理,将Hive处理的结果数据保存到本地Mysql数据库中5.Springboot+Vu
hadoop电影数据分析系统 Springboot协同过滤-余弦函数推荐系统爬虫2万+数据大屏数据展示 + [手把手视频教程和开发文档] QQ-1305637939 计算机毕业设计毕业设计大数据毕设 hadoop spring boot 爬虫
全套视频教程全套开发文档hadoop电影数据分析系统Springboot协同过滤-余弦函数推荐系统爬虫2万+数据大屏数据展示【Hadoop项目】1.java爬取【豆瓣电影】网站中电影数据,保存为data.csv文件,数据量2万+2.data.csv上传到hadoop集群环境3.data.csv数据清洗4.MR数据汇总处理,将Reduce的结果数据保存到本地Mysql数据库中5.Springboot
spark电影数据分析系统 Springboot协同过滤-余弦函数推荐系统爬虫2万+数据大屏数据展示 + [手把手视频教程和开发文档] QQ-1305637939 毕业设计大数据毕设计算机毕业设计 spark spring boot 爬虫大数据电影推荐电影分析
spark电影数据分析系统Springboot协同过滤-余弦函数推荐系统爬虫2万+数据大屏数据展示+[手把手视频教程和开发文档【功能介绍】1.java爬取【豆瓣电影】网站中电影数据,保存为data.csv文件,数据量2万+2.data.csv上传到hadoop集群环境3.MR数据清洗data.csv4.Spark汇总处理,将Spark处理的结果数据保存到本地Mysql数据库中5.Springboo
hadoop图书数据分析系统 Springboot协同过滤-余弦函数推荐系统爬虫1万+数据大屏数据展示 + [手把手视频教程和开发文档] QQ-1305637939 毕业设计大数据毕设图书数据分析 hadoop spring boot 爬虫
hadoop图书数据分析系统Springboot协同过滤-余弦函数推荐系统爬虫1万+数据大屏数据展示+[手把手视频教程和开发文档]【亮点功能】1.Springboot+Vue+Element-UI+Mysql前后端分离2.Echarts图表统计数据,直观展示数据情况3.发表评论后，用户可以回复评论,回复的评论可以被再次回复,一级评论可以添加图片附件4.爬虫图书数据1万+5.推荐图书列表展示,推荐图
2024年最全（一）大数据---Hadoop整体介绍（架构层）----（组件，并发知识体系大全 2401_84586689 程序员大数据 hadoop 架构
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！Hadoop方案一、大数据介绍============
大数据分析专业毕业设计最新最全选题精华汇总--持续更新中⑤ 源码空间站11 python django 大数据分析数据可视化 hadoop hive 大数据分析毕设
目录前言开题指导建议更多精选选题选题帮助最后前言大家好,这里是源码空间站学长大数据分析专业毕业设计毕设专题!大四是整个大学期间最忙碌的时光，一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了大数据分析专业最新精选选题，如遇选题困难或选题有任何疑问，都可以问学长哦(见文末)!以下是学长精心整理的一些选题:21.基于Hadoop和Spa
Hadoop 常用命令 ZenPower hadoop 大数据分布式
查看指定目录下的文件及文件夹hadoopfs-ls/user/hive/warehouse/查看指定目录下的文件及文件夹大小#文件大小（单位Byte）hadoopfs-du/user/hive/warehouse#文件大小（单位人性化）hadoopfs-du-h/user/hive/warehouse#文件大小（只显示汇总）hadoopfs-du-s/user/hive/warehouse删除指定
hadoop常用命令汇总 m0_67402026 java java 后端
1、查看目录下的文件列表：hadoopfs–ls[文件目录]hadoopfs-ls-h/lance2、将本机文件夹存储至hadoop上：hadoopfs–put[本机目录][hadoop目录]hadoopfs-putlance/3、在hadoop指定目录内创建新目录：hadoopfs–mkdir[目录]hadoopfs-mkdir/lance4、在hadoop指定目录下新建一个文件，使用touch
hadoop常用命令我要用代码向我喜欢的女孩表白 hadoop npm 大数据
Yarn查看提交到资源调度器的任务（任何用yarn资源的都可以看，比如spark、tez、mapreduce）看正在运行的yarn任务yarnapplication-list杀死对应的yarn任务yarnapplication-kill{application_Id}（id可以通过-list看到）hdfs查看hdfs目录hdfsdfs-ls/（查看本集群的目录）hdfsdfs-lshdfs://i
Kylin入门教程 -龙川- 介绍学习笔记 kylin
引言ApacheKylin是一个开源的分布式分析引擎，提供Hadoop上的多维分析（OLAP）能力，使得超大规模数据集的实时查询和分析成为可能。它通过预计算数据立方体来加速查询，使得复杂查询可以在亚秒级响应。本文将详细介绍Kylin的基本概念、安装与配置、基本操作及高级功能，帮助你全面掌握这款强大的数据分析工具。第一部分：Kylin简介1.1什么是Kylin？Kylin是由eBay开发并捐赠给Ap
flume系列之：flume落cos 快乐骑行^_^ 日常分享专栏 flume系列
flume系列之：flume落cos一、参考文章二、安装cosjar包三、添加hadoop-cos的相关配置四、flume环境添加hadoop类路径五、使用cos路径六、启动/重启flume一、参考文章Kafka数据通过Flume存储到HDFS或COSflumetocos使用指南二、安装cosjar包将对应hadoop版本的hadoop-cos的jar包(hadoop-cos-{hadoop.ve
Hadoop 和 Spark 的内存管理机制分析王子良. 经验分享 hadoop spark 大数据
欢迎来到我的博客！非常高兴能在这里与您相遇。在这里，您不仅能获得有趣的技术分享，还能感受到轻松愉快的氛围。无论您是编程新手，还是资深开发者，都能在这里找到属于您的知识宝藏，学习和成长。博客内容包括：Java核心技术与微服务：涵盖Java基础、JVM、并发编程、Redis、Kafka、Spring等，帮助您全面掌握企业级开发技术。大数据技术：涵盖Hadoop（HDFS）、Hive、Spark、Fli
SS00023.PBpositions——|Hadoop&PB级离线数仓.v02|——|Griffin.v02|Griffin部署| yanqi_vip 数据库 hadoop hive 大数据 hdfs
一、Griffin编译准备###---软件解压缩[root@hadoop02~]#ls/opt/yanqi/software/griffin-griffin-0.5.0.zip/opt/yanqi/software/griffin-griffin-0.5.0.zip[root@hadoop02~]#cd/opt/yanqi/software/[root@hadoop02software]#unzi
解决 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform...警告克里斯蒂亚诺罗纳尔多阿维罗 hadoop
这个警告意味着Hadoop在加载本地本机库时遇到了问题。通常情况下，Hadoop会尝试加载本地的本机库以提高性能，但是如果找不到适合你的操作系统和架构的本地库，它会退而使用内置的Java类来模拟所需的功能。虽然这个警告会影响Hadoop的性能，但它并不会导致Hadoop无法正常工作。你仍然可以使用Hadoop，但可能会遇到性能上的损失。解决方法：在Hadoop中，配置'java.library.p
Hive 数据类型全解析：大数据开发者的实用指南大鳥 sql hive 数据仓库
在大数据处理领域，Hive作为一款基于Hadoop的数据仓库工具，被广泛应用于数据的存储、查询和分析。而理解Hive的数据类型是有效使用Hive的基础，本文将深入探讨Hive的数据类型，帮助大家更好地掌握Hive的使用。Hive数据类型概述Hive支持多种数据类型，主要可分为数值类型、日期/时间类型、字符类型、Misc类型以及复杂类型。这些数据类型为存储和处理各种不同格式的数据提供了有力的支持。以
Java 大视界 -- 解锁 Java 与 Hadoop HDFS 交互的高效编程之道（二）青云交大数据新视界 Java 大视界 HDFS Java 流代码示例性能优化读写操作大数据 Hadoop java
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
Yarn工作机制？思维导图代码示例（java 架构) 用心去追梦 java 架构开发语言
YARN工作机制YARN（YetAnotherResourceNegotiator）是Hadoop生态系统中的资源管理和调度框架，它负责管理集群中的所有资源，并为应用程序提供调度服务。以下是关于YARN工作机制的详细介绍：YARN架构组件ResourceManager(RM)：管理整个集群的资源分配。负责启动和监控ApplicationMaster。NodeManager(NM)：每个节点上的代理
使用 Hadoop 实现大数据的高效存储与查询王子良. 经验分享大数据 hadoop 分布式
欢迎来到我的博客！非常高兴能在这里与您相遇。在这里，您不仅能获得有趣的技术分享，还能感受到轻松愉快的氛围。无论您是编程新手，还是资深开发者，都能在这里找到属于您的知识宝藏，学习和成长。博客内容包括：Java核心技术与微服务：涵盖Java基础、JVM、并发编程、Redis、Kafka、Spring等，帮助您全面掌握企业级开发技术。大数据技术：涵盖Hadoop（HDFS）、Hive、Spark、Fli
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod