双椒叔叔

【Ambari2.7.3源码分析】Agent组件状态收集器ComponentStatusExecutor

1、InitializerModule.py中

在InitializerModule.py中，初始化了众多属性后，进行线程的初始化
这些线程在agent端非常重要

  def init_threads(self):
    """
    Initialize thread objects
    """
    self.component_status_executor = ComponentStatusExecutor(self)
    self.action_queue = ActionQueue(self)
    self.alert_scheduler_handler = AlertSchedulerHandler(self)
    self.command_status_reporter = CommandStatusReporter(self)
    self.host_status_reporter = HostStatusReporter(self)
    self.alert_status_reporter = AlertStatusReporter(self)
    self.heartbeat_thread = HeartbeatThread.HeartbeatThread(self)

其中ComponentStatusExecutor(self)就是ambari-agent对组件状态执行器进行初始化
本文也主要讲此线程

2、ComponentStatusExecutor.py中

在ComponentStatusExecutor.py中
核心方法为下面的run()方法

  def run(self):
    """
    Run an endless loop which executes all status commands every 'status_commands_run_interval' seconds.
    """
    if self.status_commands_run_interval == 0:
      self.logger.warn("ComponentStatusExecutor is turned off. Some functionality might not work correctly.")
      return

    while not self.stop_event.is_set():
      try:
        # 为了删除已删除的信息需要这样子做
        self.clean_not_existing_clusters_info()
        cluster_reports = defaultdict(lambda:[])

        with self.reports_to_discard_lock:
          self.reports_to_discard = []

        for cluster_id in self.topology_cache.get_cluster_ids():
          # TODO: check if we can make clusters immutable too
          try:
            topology_cache = self.topology_cache[cluster_id]
            metadata_cache = self.metadata_cache[cluster_id]
          except KeyError:
            # multithreading: if cluster was deleted during iteration
            continue

          if 'status_commands_to_run' not in metadata_cache:
            continue

          status_commands_to_run = metadata_cache.status_commands_to_run

          if 'components' not in topology_cache:
            continue

          current_host_id = self.topology_cache.get_current_host_id(cluster_id)

          if current_host_id is None:
            continue

          cluster_components = topology_cache.components
          for component_dict in cluster_components:
            # 这里command_name只有status
            for command_name in status_commands_to_run:

              if self.stop_event.is_set():
                break

              # cluster was already removed
              if cluster_id not in self.topology_cache.get_cluster_ids():
                break

              # check if component is installed on current host
              if current_host_id not in component_dict.hostIds:
                break

              service_name = component_dict.serviceName
              component_name = component_dict.componentName

              # do not run status commands for the component which is starting/stopping or doing other action
              if self.customServiceOrchestrator.commandsRunningForComponent(cluster_id, component_name):
                self.logger.info("Skipping status command for {0}. Since command for it is running".format(component_name))
                continue
              # cluster_id=topology_cache.get_cluster_ids()
              # component_dict in cluster_components
              # service_name=component_dict.serviceName
              # component_name = component_dict.componentName
              # metadata_cache = self.metadata_cache[cluster_id]
              # status_commands_to_run = metadata_cache.status_commands_to_run
              # command_name in status_commands_to_run
              result = self.check_component_status(cluster_id, service_name, component_name, command_name)

              if result:
                cluster_reports[cluster_id].append(result)


        cluster_reports = self.discard_stale_reports(cluster_reports)
        self.send_updates_to_server(cluster_reports)
      except ConnectionIsAlreadyClosed: # server and agent disconnected during sending data. Not an issue
        pass
      except:
        self.logger.exception("Exception in ComponentStatusExecutor. Re-running it")
      # 每status_commands_run_interval秒内执行所有状态命令（默认20s)
      self.stop_event.wait(self.status_commands_run_interval)
    self.logger.info("ComponentStatusExecutor has successfully finished")

3、对run()归纳如下

run()方法中
运行一个无限循环，在每status_commands_run_interval秒内执行所有状态命令（默认20s）

self.stop_event.wait(self.status_commands_run_interval)

3.1、循环所有cluster_id

for cluster_id in self.topology_cache.get_cluster_ids():

topology_cache为InitializerModule.init()中初始化的属性

self.topology_cache = ClusterTopologyCache(self.config.cluster_cache_dir, self.config)

3.2、获取`topology_cache`、`metadata_cache`

topology_cach与metadata_cache实际上都是从
/var/lib/ambari-agent/cache/cluster_cache
目录中进行查询的

 topology_cache = self.topology_cache[cluster_id]

 metadata_cache = self.metadata_cache[cluster_id]

如果cluster_id不存在，则continue
修改下面的文件
vim /etc/ambari-agent/conf/ambari-agent.ini
loglevel=DEBUG
DEBUG后，日志中topology_cache、metadata_cache我各截取了部分
topology_cache：

metadata_cache：

3.3、获取`status_commands_to_run`、`current_host_id`

if 'status_commands_to_run' not in metadata_cache:
  continue

status_commands_to_run = metadata_cache.status_commands_to_run

如果metadata_cache中不存在status_commands_to_run，则continue

   if 'components' not in topology_cache:
       continue

   current_host_id = self.topology_cache.get_current_host_id(cluster_id)

   if current_host_id is None:
     continue

topology_cache中没有components则continue
current_host_id 从topology_cache取不到的话也continue

3.4、获取cluster_components并循环所有component

 cluster_components = topology_cache.components
 for component_dict in cluster_components:
 	# 这里command_name只有status
 	for command_name in status_commands_to_run:
		 if self.stop_event.is_set():
	       break
	
	     # cluster was already removed
	     if cluster_id not in self.topology_cache.get_cluster_ids():
	       break
	
	     # check if component is installed on current host
	     if current_host_id not in component_dict.hostIds:
	       break

在每一个集群cluster_id的循环里

要对获取到的所有component进行循环
- 并对该component进行所有要执行的status_command指令循环（# 这里command_name只有status）
  （这里注意下，此循环逻辑说白了就是收集所有组件信息，并非执行server端传来的命令，server端的命令是由另外一个线程CommandStatusReporter执行的）
- 如果有stop_event事件，则break跳出，等待下一个20s执行下一轮while循环
- 在这时检查cluster_id是否还在topology_cache.get_cluster_ids()中，current_host_id主机id是否还在component_dict.hostIds中
  （因为循环很多次，需要在每次执行前进行cluster、host存在的确认）
- 在当前要执行的status_command命令执行前获取component_dict组件名称以及对应的服务名称（例如NAMENODE，HDFS；HMASTER，HBASE等）
```
service_name = component_dict.serviceName
component_name = component_dict.componentName
```
- 不为正在启动/停止或正在执行其他操作的组件运行status commands（过滤掉这些处于操作状态的组件）
```
 if self.customServiceOrchestrator.commandsRunningForComponent(cluster_id, component_name):
     self.logger.info("Skipping status command for {0}. Since command for it is running".format(component_name))
     continue
```
- 对当前组件执行status检查命令，并返回结果集（check_component_status逻辑为：如果组件状态已更改，则返回组件状态，否则为None）
```
result = self.check_component_status(cluster_id, service_name, component_name, command_name)
```
  check_component_status()方法的解析请看第4小节

4、check_component_status()

  def check_component_status(self, cluster_id, service_name, component_name, command_name, report=False):
    """
    Returns components status if it has changed, otherwise None.
    """

    # if not a component
    if self.topology_cache.get_component_info_by_key(cluster_id, service_name, component_name) is None:
      return None

    command_dict = {
      'serviceName': service_name,
      'role': component_name,
      'clusterId': cluster_id,
      'commandType': AgentCommand.status,
    }

    component_status_result = self.customServiceOrchestrator.requestComponentStatus(command_dict)
    status = LiveStatus.LIVE_STATUS if component_status_result['exitcode'] == 0 else LiveStatus.DEAD_STATUS

    # log if status command failed
    if status == LiveStatus.DEAD_STATUS:
      stderr = component_status_result['stderr']
      if "ComponentIsNotRunning" not in stderr and "ClientComponentHasNoStatus" not in stderr:
        self.logger.info("Status command for {0} failed:\n{1}".format(component_name, stderr))

    result = {
      'serviceName': service_name,
      'componentName': component_name,
      'command': command_name,
      'status': status,
      'clusterId': cluster_id,
    }

    if status != self.reported_component_status[cluster_id]["{0}/{1}".format(service_name, component_name)][command_name]:
      logging.info("Status for {0} has changed to {1}".format(component_name, status))
      self.recovery_manager.handle_status_change(component_name, status)

      if report:
        with self.reports_to_discard_lock:
          self.reports_to_discard.append(result)

        self.send_updates_to_server({cluster_id: [result]})

      return result
    return None

其中
requestComponentStatus()做组件状态请求，然后返回component_status_result结果集

 component_status_result = self.customServiceOrchestrator.requestComponentStatus(command_dict)

DEBUG后将这个component_status_result 取了出来，如下

{
	'structuredOut': {
		u'version': u'3.1.0.0-78',
		u'repository_version_id': 1
	},
	'stdout': "2020-07-08 11:10:24,938 - Action afix 'pre_get_version' not present\n2020-07-08 11:10:24,938 - Action afix 'post_get_version' not present\nPackages:\n  accumulo-client\n  accumulo-gc\n  accumulo-master\n  accumulo-monitor\n  accumulo-tablet\n  accumulo-tracer\n  atlas-client\n  atlas-server\n  beacon\n  beacon-client\n  beacon-server\n  druid-broker\n  druid-coordinator\n  druid-historical\n  druid-middlemanager\n  druid-overlord\n  druid-router\n  druid-superset\n  falcon-client\n  falcon-server\n  flume-server\n  hadoop-client\n  hadoop-hdfs-client\n  hadoop-hdfs-datanode\n  hadoop-hdfs-journalnode\n  hadoop-hdfs-namenode\n  hadoop-hdfs-nfs3\n  hadoop-hdfs-portmap\n  hadoop-hdfs-secondarynamenode\n  hadoop-hdfs-zkfc\n  hadoop-httpfs\n  hadoop-mapreduce-client\n  hadoop-mapreduce-historyserver\n  hadoop-yarn-client\n  hadoop-yarn-nodemanager\n  hadoop-yarn-registrydns\n  hadoop-yarn-resourcemanager\n  hadoop-yarn-timelinereader\n  hadoop-yarn-timelineserver\n  hbase-client\n  hbase-master\n  hbase-regionserver\n  hive-client\n  hive-metastore\n  hive-server2\n  hive-server2-hive\n  hive-server2-hive2\n  hive-webhcat\n  hive_warehouse_connector\n  kafka-broker\n  knox-server\n  livy-client\n  livy-server\n  livy2-client\n  livy2-server\n  mahout-client\n  oozie-client\n  oozie-server\n  phoenix-client\n  phoenix-server\n  pig-client\n  ranger-admin\n  ranger-kms\n  ranger-tagsync\n  ranger-usersync\n  shc\n  slider-client\n  spark-atlas-connector\n  spark-client\n  spark-historyserver\n  spark-schema-registry\n  spark-thriftserver\n  spark2-client\n  spark2-historyserver\n  spark2-thriftserver\n  spark_llap\n  sqoop-client\n  sqoop-server\n  storm-client\n  storm-nimbus\n  storm-slider-client\n  storm-supervisor\n  superset\n  tez-client\n  zeppelin-server\n  zookeeper-client\n  zookeeper-server\nAliases:\n  accumulo-server\n  all\n  client\n  hadoop-hdfs-server\n  hadoop-mapreduce-server\n  hadoop-yarn-server\n  hive-server\n2020-07-08 11:10:25,023 - Command: /usr/bin/hdp-select status hadoop-hdfs-datanode > /tmp/tmpTAl577\nOutput: hadoop-hdfs-datanode - 3.1.0.0-78\n\n2020-07-08 11:10:25,024 - Version for component hadoop-hdfs-datanode: 3.1.0.0-78",
	'stderr': '',
	'exitcode': 0
}

requestComponentStatus()如下

  def requestComponentStatus(self, command_header, command_name="STATUS"):
    """
     Component status is determined by exit code, returned by runCommand().
     Exit code 0 means that component is running and any other exit code means that
     component is not running
    """
    override_output_files = True
    if logger.level == logging.DEBUG:
      override_output_files = False

    # make sure status commands that run in parallel don't use the same files
    status_commands_stdout = self.status_commands_stdout.format(uuid.uuid4())
    status_commands_stderr = self.status_commands_stderr.format(uuid.uuid4())
    status_structured_out = self.status_structured_out.format(uuid.uuid4())

    try:
      res = self.runCommand(command_header, status_commands_stdout,
                            status_commands_stderr, command_name,
                            override_output_files=override_output_files, is_status_command=True,
                            tmpstrucoutfile=status_structured_out)
      #add debug log
      logger.debug('=====gaofeng=====requestComponentStatus=====status_commands_stdout=== %s',status_commands_stdout)
      logger.debug('=====gaofeng=====requestComponentStatus=====status_commands_stderr=== %s',status_commands_stderr)
      logger.debug('=====gaofeng=====requestComponentStatus=====status_structured_out=== %s',status_structured_out)
      logger.debug('=====gaofeng=====requestComponentStatus=====res=== %s',res)

    finally:
      try:
        os.unlink(status_commands_stdout)
        os.unlink(status_commands_stderr)
        os.unlink(status_structured_out)
      except OSError:
        pass # Ignore failure

    return res

DEBUG 2020-07-08 11:10:25,050 CustomServiceOrchestrator.py:541 - =====gaofeng=====requestComponentStatus=====status_commands_stdout=== /var/lib/ambari-agent/data/status_command_stdout_ce21f1b2-d80d-46aa-949c-5576a2ef6755.txt
DEBUG 2020-07-08 11:10:25,050 CustomServiceOrchestrator.py:542 - =====gaofeng=====requestComponentStatus=====status_commands_stderr=== /var/lib/ambari-agent/data/status_command_stderr_73644f49-c8d8-4f3f-8841-6e733271ce40.txt
DEBUG 2020-07-08 11:10:25,050 CustomServiceOrchestrator.py:543 - =====gaofeng=====requestComponentStatus=====status_structured_out=== /var/lib/ambari-agent/data/status_structured-out-a9bc749d-c09a-49a5-b722-cd26502b5ea3.json
DEBUG 2020-07-08 11:10:25,050 CustomServiceOrchestrator.py:544 - =====gaofeng=====requestComponentStatus=====res=== {'structuredOut': {u'version': u'3.1.0.0-78', u'repository_version_id': 1}, 'stdout': "2020-07-08 11:10:24,938 - Action afix 'pre_get_version' not present\n2020-07-08 11:10:24,938 - Action afix 'post_get_version' not present\nPackages:\n  accumulo-client\n  accumulo-gc\n  accumulo-master\n  accumulo-monitor\n  accumulo-tablet\n  accumulo-tracer\n  atlas-client\n  atlas-server\n  beacon\n  beacon-client\n  beacon-server\n  druid-broker\n  druid-coordinator\n  druid-historical\n  druid-middlemanager\n  druid-overlord\n  druid-router\n  druid-superset\n  falcon-client\n  falcon-server\n  flume-server\n  hadoop-client\n  hadoop-hdfs-client\n  hadoop-hdfs-datanode\n  hadoop-hdfs-journalnode\n  hadoop-hdfs-namenode\n  hadoop-hdfs-nfs3\n  hadoop-hdfs-portmap\n  hadoop-hdfs-secondarynamenode\n  hadoop-hdfs-zkfc\n  hadoop-httpfs\n  hadoop-mapreduce-client\n  hadoop-mapreduce-historyserver\n  hadoop-yarn-client\n  hadoop-yarn-nodemanager\n  hadoop-yarn-registrydns\n  hadoop-yarn-resourcemanager\n  hadoop-yarn-timelinereader\n  hadoop-yarn-timelineserver\n  hbase-client\n  hbase-master\n  hbase-regionserver\n  hive-client\n  hive-metastore\n  hive-server2\n  hive-server2-hive\n  hive-server2-hive2\n  hive-webhcat\n  hive_warehouse_connector\n  kafka-broker\n  knox-server\n  livy-client\n  livy-server\n  livy2-client\n  livy2-server\n  mahout-client\n  oozie-client\n  oozie-server\n  phoenix-client\n  phoenix-server\n  pig-client\n  ranger-admin\n  ranger-kms\n  ranger-tagsync\n  ranger-usersync\n  shc\n  slider-client\n  spark-atlas-connector\n  spark-client\n  spark-historyserver\n  spark-schema-registry\n  spark-thriftserver\n  spark2-client\n  spark2-historyserver\n  spark2-thriftserver\n  spark_llap\n  sqoop-client\n  sqoop-server\n  storm-client\n  storm-nimbus\n  storm-slider-client\n  storm-supervisor\n  superset\n  tez-client\n  zeppelin-server\n  zookeeper-client\n  zookeeper-server\nAliases:\n  accumulo-server\n  all\n  client\n  hadoop-hdfs-server\n  hadoop-mapreduce-server\n  hadoop-yarn-server\n  hive-server\n2020-07-08 11:10:25,023 - Command: /usr/bin/hdp-select status hadoop-hdfs-datanode > /tmp/tmpTAl577\nOutput: hadoop-hdfs-datanode - 3.1.0.0-78\n\n2020-07-08 11:10:25,024 - Version for component hadoop-hdfs-datanode: 3.1.0.0-78", 'stderr': '', 'exitcode': 0}

再回到check_component_status()中

对比之前汇报给server端的
[cluster_id][service_name/component_name][command_name]维度的状态信息
如果当前的状态与服务端不一致，则记录日志，’状态发生改变’，
并调用recovery_manager.handle_status_change修改状态

5、总结

前提准备
InitializerModule.py中初始化metadata_cache、topology_cache等属性
（/var/lib/ambari-agent/cache/cluster_cache获取的）
在ComponentStatusExecutor.run()中
1、循环topology_cache中的所有cluster_ids
2、循环topology_cache中当前cluster_id的所有components
3、循环metadata_cache中status_commands_to_run所有的command_name（其实就一个status）
4、check_component_status()检查组件结果状态，如果组件状态已更改,
   则给server返回组件状态，否则等待20s执行下一个ComponentStatusExecutor.run()。

【Bigtop】Ambari2.8.0编译及安装 Meepoljd 大数据运维开发大数据 hadoop ambari
Ambari2.8.0编译及安装Ambari2.8.0编译及安装编译Ambari编译Ambari-metrics搭建Ambari镜像准备Ambari2.8.0编译及安装编译Ambari安装必要工具：yum-yinstallgcc-c++gitpsutilspython-develrpm-build克隆仓库并切换到2.8.0-rc1分支gitcheckoutrelease-2.8.0-rc1必须安装
Ambari安装部署教程 Aries_Chen_CSDN 大数据 hadoop ambari
前言之前尝试过使用Ambri安装HDFS集群，整个搭建的流程应该是记录的比较详细的，重新把资料整理了一下发布到博客，希望可以帮到有需要的人吧。环境准备以下操作使用root用户执行：1.关闭防火墙chkconfigiptablesoffserviceiptablesstopchkconfig--listiptables2.关闭SElinuxvi/etc/sysconfig/selinux将SELIN
玩转Ambari之二----基于ubuntu的源码编译和安装 Heavbird 大数据 Hadoop Ambari
网上关于ambari安装的有很多，有直接从现成的源直接下载安装的，也有自己构建本地源安装的，还有不少自己从apache网站下载源码编译安装的。前两者相对简单，依赖小，期间遇到问题也少，顺利的话，可能什么问题都碰不到就完成了。后者会遇到各种不同的问题。apache网上公布的最新版本是２.５.２,鉴于网上能搜到的基于源码安装帖子的版本都较老，并且很多都是基于centos的，基于Ubuntu的很少。我们
ubuntu16.04安装 ambari 2.7.3的环境准备工作 lbl251
0、登录官网先看下资料https://docs.cloudera.com/HDPDocuments/Ambari-2.7.3.0/bk_ambari-installation/content/setup_options.html1、准备好安装包（ambari安装包）（要用root用户最好）https://docs.hortonworks.com/HDPDocuments/Ambari-2.7.3.
Ambari——编译——解决解决windows和linux下phantomjs链接超时问题空了虾摸索 Ambari ambari-排错 ambari windows linux
您的支持是我继续创作与分享的动力源泉!!!您的支持是我继续创作与分享的动力源泉!!!您的支持是我继续创作与分享的动力源泉!!!错误日志：[INFO]CopyingextractedfolderC:\Users\LENOVO\AppData\Local\Temp\phantomjs\phantomjs-2.1.1-windows.zip-extract-1786692611821\phantomjs
大数据开源框架技术汇总浪尖聊大数据-浪尖数据仓库 hive flume 分布式 scipy makefile crm lighttpd
主要基于对现阶段一些常用的大数据开源框架技术的整理，只是一些简单的介绍，并不是详细技术梳理。可能会有疏漏，发现再整理。参考的太多，就不一一列出来了。这只是作为一个梳理，对以后选型或者扩展的做个参考。目录系统平台（Hadoop、CDH、HDP）监控管理（CM、Hue、Ambari、Dr.Elephant、Ganglia、Zabbix、Eagle）文件系统（HDFS、GPFS、Ceph、Gluster
大数据分析学习第十五课自建云服务器集群离线安装Ambari2.7.5和HDP3.1.5(一) 猫头鹰数据分析大数据 Java Hive hadoop ambari 大数据 centos hdfs
之前了解了很多关于大数据平台一站式部署管理的工具，比如ApacheAmbari和CDH，目前最新的CDH已经没有了社区版，也就是说以后使用新版本的ClouderaManager和CDH都是要收费的，这对于很多小公司来说，可能无法承受。转向Ambari是他们的一个可选项。Ambari是Apache的一个顶级开源项目，开源是其最大的优势，开源也意味着Ambari可以灵活地进行扩展，集成更多的数据组件，
Ambari注册节点时报错：EOF occurred in violation of protocol (_ssl.c:579) kongxx
问题原因Ambari在注册节点的时候，ambari-agent报错EOFoccurredinviolationofprotocol(_ssl.c:579)解决办法修改/etc/ambari-agent/conf/ambari-agent.ini文件，在[security]配置部分添加[security]...force_https_protocol=PROTOCOL_TLSv1_2
Hadoop深度运维：Apache集群原地升级Ambari-HDP Summer_1981
作者介绍冯武，目前在瓜子从事大数据集群运维管理，主要负责Hadoop、Ansible、Ambari、ClouderaManager等技术栈的维护调优工作。公司从建设Hadoop起，采用了Apache社区版本的Hadoop，随着业务的发展，集群规模越来越来大，现已突破百余节点。在频繁的更改配置、增删节点、监控告警等操作中，传统手工运维的弊端被放得越来越大，日常维护消耗了工程师大量的时间和精力。现状的
kyuubi 接入starrocks | doris 甜甜的巧克力阿大数据相关大数据 kyuubi starrocks doris
kyuubi接入starrocks一、环境Hadoop集群组件版本Hadoop3.1.1spark3.Xzookeeper3.XHive3.Xkyuubi版本1.7.1starrocks2.X 已将kyuubi部署到yarn上，并且接入了spark3引擎，并通过Ambari进行kyuubi组件的管理，下面步骤为新增对starrocks集群的访问。二、接入步骤假设安排hostA、hostB两个节点
Ambari添加Kerberos支持 AlienPaul
安装JCE从如下下载链接下载jce_policy-8.zip文件。https://www.oracle.com/technetwork/java/javase/downloads/jce-6-download-429243.html解压到$JAVA_HOME/jre/lib/security/目录。例如/usr/java/jdk1.8.0_171-amd64/jre/lib/security/安装
Centos7.5+Ambari2.7.3+HDP3.1.0.0离线安装 WaiSaa
Centos7.5+Ambari2.7.3+HDP3.1.0.0离线安装1简介Ambari跟Hadoop等开源软件一样，也是ApacheSoftwareFoundation中的一个项目，并且是顶级项目。就Ambari的作用来说，就是创建、管理、监视Hadoop集群，但是这里的Hadoop指的是Hadoop整个生态圈（例如Hive，Hbase，Sqoop，Zookeeper等），而并不仅是特指Had
Ambari2.7.3 和HDP3.1.0搭建Hadoop集群大道至简非简
一、环境及软件准备1、集群规划hadoop01/192.168.0.151hadoop02/192.168.0.152hadoop03/192.168.0.153hadoop04/192.168.0.154hadoop05/192.168.0.155ambariserver是否否否否ambariagent是是是是是namenode是是否否否datanode否否是是是resourcemanager是
企业级大数据安全架构（五）Knox安装云掣YUNCHE 企业级大数据安全架构大数据
本章节介绍安全架构里面一个重要组件Knox安装，我们是通过ambari安装，如果安装开源Knox可参考官网文档1添加服务打开Ambari页面并登录，然后点击主页上的"AddService"按钮。2Knox勾选在服务列表中，找到并勾选"Knox"选项，然后点击"Next"按钮。3安装knox节点在选择安装节点页面上，选择要安装Knox的节点，然后点击"Next"按钮。4设置knox密码在设置Knox
Centos7 Ambari集群环境搭建香蕉牛奶蛇皮走位 hdfs hadoop mapreduce cloudera
Ambari集群环境搭建1.1服务规划序号主机名操作系统Ip地址服务1hbase100.yunCentOS_7.6172.21.xx.100HTTPServer、amber-server、amber-agent2hbase101.yunCentOS_7.6172.21.xx.101amber-agent2hbase102.yunCentOS_7.6172.21.xx.102amber-agent*
企业级大数据安全架构（四）Ranger安装云掣YUNCHE 企业级大数据安全架构大数据安全架构安全
作者：楼高Ranger是支持审计功能的，安装时可以选择审计数据保存的位置，默认支持Solr和HDFS。HDFS的配置比较简单，这里就不赘述了，我们这里使用Ambari默认自带的Solr保存审计日志，下面部署Solr：1选择安装组件选择InfraSolraddservice在ambari中solr是InfraSolr2选择安装节点3选择服务安装节点4配置相关信息5查看solr配置可以导出配置信息6开
Cloudera公司的CDH与HDP均无法下载问题（403 Forbidden (varnish) the provided credentials were incorrect）小宇0926 大数据平台搭建 cloudera
Cloudera公司的CDH与HDP均无法下载问题1.问题描述2.解决方法1.问题描述最近想下载CDH的相关安装包，发现需要输入用户名和密码然而输入cloudera账号之后，会出现如下提示也就是说cloudera不允许下载免费的安装包了，查了一下，如果然如此。2.解决方法使用开源的Apache的相关软件包http://archive.apache.org/dist/CDH&Ambari安装包百度云
企业级大数据安全架构（三）修改集群节点hostname 云掣YUNCHE 企业级大数据安全架构大数据安全架构安全
作者：楼高在后续安装FreeIPA的过程中，要求机器名必须包含完整的域名信息。如果之前在Ambari集群节点上的机器名不符合这个要求，可以按照以下步骤在Ambari上修改所有节点的机器名：1.部署节点说明本次测试是三台ambari节点，主机名分别是jz001，jz002，jz003。其中ambari-server安装在jz001上；ambari-agent三台均有安装。2.禁用Kerberos需要
Ambari 安装部署教程(手把手教学）【超级详细】小伍_Five ambari php 服务器
Ambari的安装部署这里有详细的Ambari的安装部署，快来围观，保证成功！1.CentOS7虚拟机安装2.虚拟机环境设置1.配置网卡2.重新启动网络配置3.测试网络是否畅通(本地PING虚拟机IP)4.更改主机名5.配置FQDN（所有节点）6.克隆其他节点7.更改hosts，添加主机映射8.关闭防火墙9.关闭SELINUX10.安装JDK83.SSH免密登陆配置1.各个机器执行4.时间同步5.
Hidataplus-3.3.2.0-005公测版本基于openEuler release 22.03 (LTS-SP2)的测试杨航的技术博客 hidataplus 大数据
1概述本文介绍hidataplus-3.3.2.0-005公测版本在openEulerrelease22.03(LTS-SP2)操作系统（最小化安装）中的部署。测试角色如下：hadoop、yarn、zookeeper、hive、impala。1.1服务器序号IP操作系统部署内容用途备注0110.10.0.3centos7.4nginxhttp-yum源选用非ambari服务器配置yum源是为了减少
ambari失败重装重置环境 qzWsong ambari 服务器 linux
3_1_4是ambari版本号sudorpm-qa|grep3_1_4|awk'{print$1}'|xargsrpm-e--nodepssudorpm-qa|grepambari|awk'{print$1}'|xargsrpm-e--nodepsrm-rf/usr/hdp/userdelaccumulouserdeladminuserdelambari-qauserdelamsuserdelat
Linux集群组件启停查脚本碼小白
大数据平台中涉及很多集群，如果你使用的不是CDH、Ambari等集成版工具，而是自己去部署的源生组件集群，那可能需要简单的脚本去启动、停止、查看状态。这里以zookeeper为例，起一个简单的。0、确保脚本所在的机器能够免密登录到zookeeper集群其他机器SSH免密登录配置1、将zookeeper集群的IP都写入一个文件中touch/root/zookeeper创建一个空文件vi/root/z
Ambari Rest API zincooo HDFS ambari hadoop 大数据
文章目录集群获取集群信息获取集群所有信息主机获取集群下的所有机器获取机器的详细信息Hosts基本信息alerts_summary告警概览metrics指标kerberos_identitieskerberos信息alerts告警详情stack_versions软件栈版本host_components机器组件服务获取集群所有服务获取服务详情ServiceInfo基本信息alerts_summary告
Ambari入门及安装青涩的芒果汁技术分享
Ambari简述什么是AmbariApacheAmbari项目旨在通过开发用于配置，管理和监控ApacheHadoop集群的软件来简化Hadoop管理。Ambari提供了一个直观，易用的Hadoop管理WebUI。Ambari的功能提供了跨任意数量的主机安装Hadoop服务的分步向导。处理群集的Hadoop服务配置。提供集中管理，用于在整个集群中启动，停止和重新配置Hadoop服务。提供了一个仪表
Hadoop：Flink on Yarn服务配置与设置 william_cheng666 Hadoop hadoop flink
之前打算直接在ambari上安装配置flink服务方便管理，但是发现ambari集成的flink会出现很多问题反而不方便管理（可能是没找到正确的方法），于是打算单独配置服务下载两个文件文件flink-1.10.1文件：https://archive.apache.org/dist/flink/flink-1.10.1/flink-1.10.1-bin-scala_2.11.tgzHadoop依赖包
Grafana二进制部署并配置prometheus数据源万里长江横渡 grafana prometheus
1、获取grafna二进制安装包https://grafana.com/grafana/download?pg=graf&plcmt=deploy-box-1grafana官网下载地址[root@ambari-hadoop1~]#cd/opt/module/grafana/[root@ambari-hadoop1grafana]#pwd/opt/module/grafana2、在安装自己的安装目录
Hortonworks中修改Hive使用postgresql数据库 kongxx
首先停止Hive服务从Ambari管理界面上停止Hive服务修改Hive配置在Hive->Configs->Advanced中，将数据库改为使用已存在的postgresql数据库，然后修改数据库用户，密码和数据库名称。创建用户和数据库使用postgres用户连接postgresql数据库>psql-Upostgrespostgres=#CREATEUSERhiveWITHPASSWORD'hive
Ambari-Hadoop集群、Elasticsearch集群及nginx安装客尘烦恼 linux 大数据 Ambari Hadoop安装 elasticsearch安装 nginx ELK配置
环境初始化hostnamevi/etc/hosts打通yumntplimit参数初始化防火墙jdkmysql-connectormysqlambariHDP安装ELK环境nodeeses-headkibanalogstashfilebeatnginx写在前面的话，安装这些东西的话，最好用脚本，不容易出错，下面写的是手动部署的过程环境初始化一定要先挂载好磁盘hostnamehostnamevi/et
hive命令启动出现classnotfound dogplays hive 数据仓库
环境：ambari集群三个节点node104、node105和node106，其中node105上有hiveserver2，并且三个节点均有HIVECLIENT注意：“./”指hive安装目录其中装有hiveserver2的node105节点，由于某种需要向lib目录下上传了某些jar包，并且通过ambariweb修改了此项参数的值做完以上变更后，发现在node104和node106上的hive安
基于ambari hadoop平台的搭建大数据小应用
环境准备1:jdk安装,防止在/opt/data下,tar–zxf安装包在/opt/apps下所有节点都需要2:sudoaptupdate源升级,所有节点都需要3:/etc/hosts10.68.29.243iZwz9870dk1soyw67s3ephZ10.68.29.244iZwz9870dk1soyw67s3epgZ10.68.29.245iZwz9870dk1soyw67s3eplZ10.
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多