随缘清风殇

第十二章 Ambari二次开发之集成Alluxio

1、Alluxio高可用部署

生产环境：使用具有高可用性的模式来运行Alluxio masters。

1.1、Alluxio架构

Alluxio可以被分为三个部分：**masters、workers以及clients。**一个典型的设置由一个主服务器、多个备用服务器和多个worker组成。客户端用于通过Spark或MapReduce作业、Alluxio命令行或FUSE层等应用程序与Alluxio服务器通信。

Master：管理文件和对象元数据
Worker：管理本地MSE、SSD和HDD
Client：向用户和应用提供接口，向Matser和Worker发送请求
Under File System：用于备份

1.1.1、master

核心：master分为主master和备用master，以实现容错。

（1）主matser

Alluxio中只有一个master进程为主master。主master用于管理全局的元数据，这里面包含文件系统元数据（文件系统节点树）、数据块元数据（数据块位置）、以及worker的容量元数据（空闲或已占用空间）。

Alluxio clients与主master通信用来读取或修改元数据。所有的worker都会定期的向主master发送心跳。主master会在一个分布式的持久化系统上记录所有的文件系统事务，这样可以恢复主master的信息。这组日志被称为journal。

（2）备用master

	**备用master读取主master写入的journal日志，以保持与主master的状态同步**。它们会对journal日志写入检查点，用于快速恢复。它们不处理来自Alluxio组件的任何请求。

1.1.2、Worker

Alluxio的worker用于管理用户为Alluxio定义的本地资源（内存、SSD、HDD）。Alluxio的worker将数据存储为块，并通过在其本地资源上读或者创建新的数据块来响应client请求。Workers只用于管理数据块；文件到数据块的映射存储在master中。Workers在其底层存储上进行数据操作。

优势：
- 1、从底层存储系统读取的数据能被存储在worker中，这样别的client可以立即使用。
- 2、Client可以是轻量级的，不依赖于底层存储的连接器。
注意事项：因为RAM的容量有限，所以当空间满了的时候block会被清理。Workers使用清理策略决定什么数据留在Alluxio中。

1.2、Alluxio数据流读写架构

1.2.1、读数据流架构

（1）本地缓存命中

本地缓存命中发生在请求数据位于本地Alluxio worker。举例说明，如果一个应用通过Alluxio client请求数据，client向Alluxio master请求数据所在的worker。如果数据在本地可用，Alluxio client使用“短路”读取来绕过Alluxio worker，并直接通过本地文件系统读取文件。短路读取避免通过TCP套接字传输数据，并提供数据的直接访问。

注意事项：Alluxio除了内存之外还可以管理其他存储介质(例如SSD、HDD)，因此本地数据访问速度可能会因本地存储介质的不同而有所不同。

（2）远程缓存命中

当请求的数据存储在Alluxio中，而不是存储在client的本地worker上时，client将对具有数据的worker进行远程读取。client完成读取后，会要求本地的worker（如果存在）创建一个copy，这样以后读取的时候可以在本地读取相同的数据。远程缓存击中提供了网络级别速度的数据读取。

注意事项：Alluxio优先从远程worker读取数据，而不是从底层存储，因为Alluxio worker间的速度一般会快过Alluxio workers和底层存储的速度。

（3）缓存MISS

如果数据在Alluxio中找不到，则会发生缓存丢失，应用将不得不从底层存储读取数据。Alluxio client会将数据读取请求委托给worker（有限本地worker）。这个worker会从底层存储读取数据并缓存。缓存丢失通常会导致最大的延迟，因为数据必须从底层存储获取。

注意事项：当client只读取块的一部分或不按照顺序读取块时，client将指示worker异步缓存整个块。异步缓存不会阻塞client，但是如果Alluxio和底层存储系统之间的网络带宽是瓶颈，那么异步缓存仍然可能影响性能。

1.2.2、写数据流架构

（1）只写入到Alluxio

写类型设置：MUST_CACHE

Alluxio client将数据写入本地Alluxio worker，而不会写入到底层存储。如果“短路”写可用，Alluxio client直接写入到本地RAM的文件，绕过Alluxio worker，避免网络传输。当可以容忍数据丢失时，MUST_CACHE设置对于写临时数据非常有用。

注意事项：由于数据没有持久存储在under storage中，因此如果机器崩溃或需要释放数据以进行更新的写操作**，数据可能会丢失**。

（2）写到UFS

写类型设置：CACHE_THROUGH

数据被同步地写到一个Alluxio worker和下一个底层存储。Alluxio client将写操作委托给本地worker，而worker同时将对本地内存和底层存储进行写操作。由于底层存储的写入速度通常比本地存储慢，所以client的写入速度将与底层存储的速度相匹配。

数据写入速度：client的写入速度将与底层存储的速度相匹配。

（3）写回UFS

写类型设置：ASYNC_THROUGH

数据被同步地写入到一个Alluxio worker，并异步地写入到底层存储。ASYNC_THROUGH可以在持久化数据的同时以内存速度提供数据写入。

数据写入速度：持久化数据的同时以内存速度提供数据写入。

1.3、集群安装部署

（1）准备工作

①免密登录：设置从master节点到worker节点的SSH免密登录

②TCP通信：开放所有节点之间的TCP通信。对于基本功能，确保所有节点上RPC端口都是打开的（默认值：19998）

③sudo权限：Alluxio自动在worker节点上上安装RAMFS时才需要给将运行Allluxio的OS用户授予sudo特权。

（2）下载Alliuxio安装包

注意事项：解压安装包目录复制到所有节点（包括运行master和worker的所有节点）

tar -xvzpf alluxio-2.9.1-bin.tar.gz

（3）配置文件

说明：在master节点上，参照模板创建conf/alluxio-site.properties配置文件。

 cp conf/alluxio-site.properties.template conf/alluxio-site.properties

（4）配置文件集群广播

说明：将配置文件复制到所有其他Alluxio节点。通过将所有work节点的IP地址或主机名添加到conf/workers文件中，操作员可以利用内置工具将配置文件复制到远程节点，

./bin/alluxio copyDir conf/

2、Ambari集成Alluxi安装部署

生命周期

方法名称	方法作用	备注
install()	通过 wget 的方式来下载解压服务安装包
configure()	执行服务配置、设置目录用户组等相关逻辑
start()	启动服务
status()	监听服务状态
stop()	停止服务
restart()	重启服务、自动执行 stop() 和 start() 方法

2.1、metainfo文件

作用：主要是配置服务名，服务类型，服务操作脚本，metrics以及快速链接等

（1）服务组件配置

架构组件如下

组件名称	组件数量	备注
master	1+	管理节点
worker	1+	数据节点
client	1+	集群外提交查询机器

①Master组件配置

组件配置项	组件配置	备注
组件角色	master
组件数量	1+
组件依赖	Zookeeepr、HDFS
组件生命周期管理脚本	master.py

代码实现

<component>
    <name>ALLUXIO_MASTERname>
    <displayName>Alluxio MasterdisplayName>
    <category>MASTERcategory>
    <cardinality>1+cardinality>
    <dependencies>
        <dependency>
            <name>HDFS/HDFS_CLIENTname>
            <scope>hostscope>
            <auto-deploy>
                <enabled>trueenabled>
            auto-deploy>
        dependency>
        <dependency>
            <name>ZOOKEEPER/ZOOKEEPER_SERVERname>
            <scope>clusterscope>
            <auto-deploy>
                <enabled>trueenabled>
                <co-locate>ALLUXIO/ALLUXIO_MASTERco-locate>
            auto-deploy>
        dependency>
    dependencies>
    <commandScript>
        <script>scripts/master.pyscript>
        <scriptType>PYTHONscriptType>
        <timeout>500timeout>
    commandScript>
component>

②Worker组件配置

组件配置项	组件配置	备注
组件角色	worker
组件数量	1+
组件依赖	无
父组件	ALLUXIO_MASTER
组件生命周期管理脚本	slave.py

代码实现

<component>
    <name>ALLUXIO_SLAVEname>
    <displayName>Alluxio WorkerdisplayName>
    <category>SLAVEcategory>
    <cardinality>1+cardinality>
    <bulkCommands>
        <displayName>Alluxio WorkersdisplayName>
        
        <masterComponent>ALLUXIO_MASTERmasterComponent>
    bulkCommands>
    <commandScript>
        <script>scripts/slave.pyscript>
        <scriptType>PYTHONscriptType>
        <timeout>300timeout>
    commandScript>
component>

③Client组件配置

组件配置项	组件配置	备注
组件角色	client
组件数量	1+
组件依赖	无
组件配置文件		conf目录下文件
组件生命周期管理脚本	client.py

代码实现

<component>
    <name>ALLUXIO_CLIENTname>
    <displayName>Alluxio ClientdisplayName>
    <category>CLIENTcategory>
    <cardinality>1+cardinality>
    <commandScript>
        <script>scripts/client.pyscript>
        <scriptType>PYTHONscriptType>
        <timeout>300timeout>
    commandScript>
    <configFiles>
        <configFile>
            <type>envtype>
            <fileName>alluxio-site.propertiesfileName>
            <dictionaryName>alluxio-sitedictionaryName>
        configFile>
        <configFile>
            <type>envtype>
            <fileName>alluxio-env.shfileName>
            <dictionaryName>alluxio-envdictionaryName>
        configFile>
        <configFile>
            <type>xmltype>
            <fileName>core-site.xmlfileName>
            <dictionaryName>alluxio-core-sitedictionaryName>
        configFile>
        <configFile>
            <type>envtype>
            <fileName>log4j.propertiesfileName>
            <dictionaryName>alluxio-log4jdictionaryName>
        configFile>
        <configFile>
            <type>envtype>
            <fileName>metrics.propertiesfileName>
            <dictionaryName>alluxio-metricsdictionaryName>
        configFile>
    configFiles>
component>

（2）服务心跳脚本配置

配置说明：配置相关python脚本对服务状态进行监听。
代码实现

<commandScript>
    <script>scripts/service_check.pyscript>
    <scriptType>PYTHONscriptType>
    <timeout>300timeout>
commandScript>

（3）依赖服务配置

配置说明：alluxio服务依赖于HDFS、ZOOKEEPER
代码实现

<requiredServices>
    <service>ZOOKEEPERservice>
    <service>HDFSservice>
requiredServices>

（4）依赖文件配置

配置说明：Alluxio服务依赖于alluxio-config、alluxio-env、core-site、hdfs-site、yarn-site等xml文件
代码实现

<configuration-dependencies>
    <config-type>alluxio-siteconfig-type>
    <config-type>alluxio-envconfig-type>
    <config-type>alluxio-metricsconfig-type>
    <config-type>alluxio-log4jconfig-type>
    <config-type>core-siteconfig-type>
    <config-type>hdfs-siteconfig-type>
    <config-type>yarn-siteconfig-type>
configuration-dependencies>

（5）自定义连接配置

配置说明：配置Alluxio服务 web UI 链接
代码实现

<quickLinksConfigurations>
    <quickLinksConfiguration>
        <fileName>quicklinks.jsonfileName>
        <default>truedefault>
    quickLinksConfiguration>
quickLinksConfigurations>

（6）样式配置

配置说明：配置Alluxio的主题配置
代码实现

<themes>
    <theme>
        <fileName>directories.jsonfileName>
        <default>truedefault>
    theme>
themes>

（7）系统匹配配置

注意事项：服务会根据操作系统的差异来选择不同的 rpm 包，此项不进行配置
代码实现

<osSpecifics>
    <osSpecific>
        <osFamily>anyosFamily>
        <packages>
            <package>
                <name>alluxioname>
            package>
        packages>
    osSpecific>
osSpecifics>

2.2、本地集群下载

安装包拉取步骤

（1）配置本地集群安装包下载路径

说明：本地集群只在内网，不在外网，故使用http服务从本地文件拉取到各个Matser/Slave节点

env.xml文件配置<-->
<property require-input="true">
    <name>flink.download.urlname>
    <value>value>
    <description>本地集群安装包路径description>
property>

（2）参数配置

说明：将安装包作为Python参数

#params.py

alluxio_download_url = config['configurations']['alluxio-env']['alluxio.download.url']

# 拉取文件到服务器路径
temp_alluxio_dir = "/tmp/alluxio_install"

（3）Master节点拉取安装包

# master.py

Execute('wget ' + params.alluxio_download_url + ' -P ' + params.temp_alluxio_dir)

（4）Slave节点拉取安装包

# slave.python 

Execute('wget ' + params.alluxio_download_url + ' -P ' + params.temp_alluxio_dir)

2.3、公共配置文件实例化

（1）env.xml文件配置

①alluxio-env.sh配置项

<property require-input="true">
    <name>alluxio.log.dirname>
    <description>Alluxio Log Directorydescription>
    <value>/var/log/alluxiovalue>
property>

②alluxio-site.properties配置项

<property require-input="true">
    <name>alluxio.hdd.dirsname>
    <description>Alluxio HDD Directorydescription>
    <value>/hadoop/alluxio/hddvalue>
property>

<property require-input="true">
    <name>alluxio.hdd.quotaname>
    <description>Alluxio HDD Size(GB)description>
    <value>20GBvalue>
property>  

<property require-input="true">
    <name>alluxio.underfs.addressname>
    <description>Alluxio UnderFS Addressdescription>
    <value>/hadoop/alluxio/underFSStoragevalue>
property>

<property require-input="true">
    <name>alluxio.master.journal.foldername>
    <description>Alluxio Master Journal Folderdescription>
    <value>/hadoop/alluxio/journalvalue>
property>

<property require-input="true">
    <name>alluxio.worker.memoryname>
    <description>Alluxio Worker Memory(GB)description>
    <value>2GBvalue>
property>

<property require-input="true">
    <name>alluxio.zookeeper.addressname>
    <description>Alluxio Zookeeper Addressdescription>
    <value>value>
property>

（2）文件参数实例化

①alluxio-env.sh参数项

# java dir
java_home = config['ambariLevelParams']['java_home']

# Set install dir
cmd = "/usr/bin/hdp-select versions"
usr_base = "/usr/hdp/"
base_dir = usr_base + commands.getoutput(cmd) + "/alluxio/"

# log dir
log_dir = config['configurations']['alluxio-env']['alluxio.log.dir']

②alluxio-site.properties参数项

说明：alluxio运行配置参数

# HA高可用
enabled_ha = 'alluxio.zookeeper.enabled=false'
zk_addr = 'alluxio.zookeeper.address=' + config['configurations']['core-site']['ha.zookeeper.quorum']
journal_folder = 'alluxio.master.journal.folder=' + config['configurations']['alluxio-env']['alluxio.master.journal.folder']
worker_timeout = 'alluxio.worker.block.heartbeat.timeout.ms=120000'
if len(alluxio_masters) > 1:
  enabled_ha = 'alluxio.zookeeper.enabled=true'
  zk_addr = 'alluxio.zookeeper.address=' + config['configurations']['alluxio-env']['alluxio.zookeeper.address']
  journal_folder = 'alluxio.master.journal.folder=' + config['configurations']['alluxio-env']['alluxio.master.journal.folder']
  worker_timeout = 'alluxio.worker.block.heartbeat.timeout.ms=120000'
else:
  alluxio_master = 'alluxio.master.hostname=' + alluxio_masters[0]

#alluxio_master = '#alluxio.master.hostname=' + host_name
alluxio_master_web_port = 'alluxio.master.web.port=' + config['configurations']['alluxio-env']['alluxio.master.web.port']


# alluxio underfs address
underfs_addr = config['configurations']['alluxio-env']['alluxio.underfs.address']

# alluxio worker memory alotment
worker_mem = config['configurations']['alluxio-env']['alluxio.worker.memory']


# alluxio hdd dirs
hdd_dirs = config['configurations']['alluxio-env']['alluxio.hdd.dirs']
hdd_quota = config['configurations']['alluxio-env']['alluxio.hdd.quota']

③masters参数项

说明：配置masters的地址

# alluxio masters address
alluxio_masters = config['clusterHostInfo']['alluxio_master_hosts']
alluxio_masters_str = '\n'.join(alluxio_masters)

④slaves参数项

说明：配置slaves的地址

# alluxio workers address
alluxio_workers = config['clusterHostInfo']['alluxio_slave_hosts']
alluxio_workers_str = '\n'.join(alluxio_workers)

（3）模板文件配置

说明：创建模板文件，与conf目录下所需实例化文件相对应

①alluxio-env.sh.j2

JAVA_HOME={{java_home}}
ALLUXIO_HOME={{base_dir}}
ALLUXIO_LOGS_DIR={{log_dir}}

对应conf目录下的alluxio-env.sh文件

②alluxio-site.properties.j2

{{enabled_ha}}
{{zk_addr}}
{{journal_folder}}
{{worker_timeout}}
{{alluxio_master}}
alluxio.underfs.address={{underfs_addr}}
alluxio.underfs.hdfs.configuration=/etc/hadoop/conf/core-site.xml:/etc/hadoop/conf/hdfs-site.xml
{{alluxio_master_web_port}}

#alluxio.keyvalue.enabled=true
#alluxio.keyvalue.partition.size.bytes.max=256MB

alluxio.worker.tieredstore.levels=1
alluxio.worker.tieredstore.level0.alias=MEM
alluxio.worker.tieredstore.level0.dirs.path=/mnt/ramdisk
alluxio.worker.tieredstore.level0.dirs.quota={{worker_mem}}
alluxio.worker.tieredstore.level0.watermark.high.ratio=0.9
alluxio.worker.tieredstore.level0.watermark.low.ratio=0.7
#alluxio.worker.tieredstore.level1.alias=SSD
#alluxio.worker.tieredstore.level1.dirs.path=/opt/data/bigdata/alluxio
#alluxio.worker.tieredstore.level1.dirs.quota=25GB
#alluxio.worker.tieredstore.level1.watermark.high.ratio=0.9
#alluxio.worker.tieredstore.level1.watermark.low.ratio=0.7
alluxio.worker.tieredstore.level1.alias=HDD
alluxio.worker.tieredstore.level1.dirs.path={{hdd_dirs}}
alluxio.worker.tieredstore.level1.dirs.quota={{hdd_quota}}
alluxio.worker.tieredstore.level1.watermark.high.ratio=0.9
alluxio.worker.tieredstore.level1.watermark.low.ratio=0.7

对应conf目录下的alluxio-site.properties文件

③master.j2

说明：对应conf目录下的masters文件

{{alluxio_masters_str}}

④master.j2

说明：对应conf目录下的slaves文件

{{alluxio_workers_str}}

（4）模板文件实例化

代码实现

def configure(self, env):
    import params

    env.set_params(params)

    alluxio_config_dir = params.base_dir + 'conf/'
    alluxio_libexec_dir = params.base_dir + 'libexec/'

    # alluxio-env.sh
    File(format("{alluxio_config_dir}/alluxio-env.sh"),
         owner='alluxio',
         group='alluxio',
         mode=0700,
         content=Template('alluxio-env.sh.j2', conf_dir=alluxio_config_dir)
        )

    # alluxio-site.properties
    File(format("{alluxio_config_dir}/alluxio-site.properties"),
         owner='alluxio',
         group='alluxio',
         mode=0700,
         content=Template('alluxio-site.properties.j2', conf_dir=alluxio_config_dir)
        )

    # masters
    File(format("{alluxio_config_dir}/masters"),
         owner='alluxio',
         group='alluxio',
         mode=0700,
         content=Template('masters.j2', conf_dir=alluxio_config_dir)
        )

    # workers
    File(format("{alluxio_config_dir}/workers"),
         owner='alluxio',
         group='alluxio',
         mode=0700,
         content=Template('workers.j2', conf_dir=alluxio_config_dir)
        )

2.4、Matser/Slave安装部署

（1）安装配置项

<property require-input="true">
    <name>alluxio.log.dirname>
    <description>Alluxio Log Directorydescription>
    <value>/var/log/alluxiovalue>
property>

（2）安装脚本参数项

# Set install dir
cmd = "/usr/bin/hdp-select versions"
usr_base = "/usr/hdp/"
base_dir = usr_base + commands.getoutput(cmd) + "/alluxio/"

# alluxio log dir
log_dir = config['configurations']['alluxio-env']['alluxio.log.dir']
journal_dir = config['configurations']['alluxio-env']['alluxio.master.journal.folder']

# alluxio hdd dirs
hdd_dirs = config['configurations']['alluxio-env']['alluxio.hdd.dirs']
hdd_quota = config['configurations']['alluxio-env']['alluxio.hdd.quota']

（3）Matser安装脚本

安装步骤

脚本实现

#Call setup.sh to install the service
def install(self, env):

    import params
    # Install packages listed in metainfo.xml
    self.install_packages(env)
    env.set_params(params)

    # Create the base_dir/alluxio dir
    cmd = '/bin/mkdir' + ' -p ' + params.base_dir 
    Execute('echo "Running ' + cmd + '"')
    Execute(cmd)

    # Create the log_dir dir
    cmd = '/bin/mkdir' + ' -p ' + params.log_dir 
    Execute('echo "Running ' + cmd + '"')
    Execute(cmd)

    # Create the hdd_dirs dir
    cmd = '/bin/mkdir' + ' -p ' + params.hdd_dirs 
    Execute('echo "Running ' + cmd + '"')
    Execute(cmd)

    # Create the journal_dir dir
    cmd = '/bin/mkdir' + ' -p ' + params.journal_dir 
    Execute('echo "Running ' + cmd + '"')
    Execute(cmd)

    # Create the underfs_addr dir
    cmd = '/bin/mkdir' + ' -p ' + params.underfs_addr 
    Execute('echo "Running ' + cmd + '"')
    Execute(cmd)

    #extract archive and symlink dirs
    Execute('wget ' + params.alluxio_download_url + ' -P ' + params.temp_alluxio_dir)
    cmd = '/bin/tar' + ' -zxf ' + params.temp_alluxio_dir + '/* --strip 1 -C ' + params.base_dir
    Execute('echo "Running ' + cmd + '"')
    Execute(cmd)
    Execute('rm -rf ' + params.temp_alluxio_dir)

    cmd = '/bin/ln' + ' -s ' + params.base_dir + ' ' + params.usr_base + 'current/alluxio'
    Execute('echo "Running ' + cmd + '"')
    try:
        Execute(cmd)
        except:
            pass
        #call configure
    self.configure(env)

（4）Slave安装脚本

安装步骤

脚本实现

#Call setup.sh to install the service
def install(self, env):
    import params

    # Install packages listed in metainfo.xml
    self.install_packages(env)
    env.set_params(params)

    # Create the base_dir/alluxio dir
    cmd = '/bin/mkdir' + ' -p ' + params.base_dir
    Execute('echo "Running ' + cmd + '"')
    Execute(cmd)

    # Create the log_dir dir
    cmd = '/bin/mkdir' + ' -p ' + params.log_dir 
    Execute('echo "Running ' + cmd + '"')
    Execute(cmd)

    # Create the hdd_dirs dir
    cmd = '/bin/mkdir' + ' -p ' + params.hdd_dirs 
    Execute('echo "Running ' + cmd + '"')
    Execute(cmd)

    # Create the journal_dir dir
    cmd = '/bin/mkdir' + ' -p ' + params.journal_dir 
    Execute('echo "Running ' + cmd + '"')
    Execute(cmd)

    # Create the underfs_addr dir
    cmd = '/bin/mkdir' + ' -p ' + params.underfs_addr 
    Execute('echo "Running ' + cmd + '"')
    Execute(cmd)

    #extract archive and symlink dirs
    Execute('wget ' + params.alluxio_download_url + ' -P ' + params.temp_alluxio_dir)
    cmd = '/bin/tar' + ' -zxf ' + params.temp_alluxio_dir + '/* --strip 1 -C ' + params.base_dir
    Execute('echo "Running ' + cmd + '"')
    Execute(cmd)
    Execute('rm -rf ' + params.temp_alluxio_dir)

    cmd = '/bin/ln' + ' -s ' + params.base_dir  + ' ' + params.usr_base + 'current/'
    Execute('echo "Running ' + cmd + '"')

    try:
        Execute(cmd)
        except:
            pass

     self.configure(env)

2.5、Master/Slave服务生命周期

（1）服务生命周期

自定义服务生命周期：服务的安装、配置、启动、监听状态、停止、删除(卸载) 操作

组件类型	组件生命周期	备注
matser	安装、启动、停止、配置、状态
slave	安装、启动、停止、配置、状态
client	安装、配置

（2）参数配置项

# alluxio pid dir
pid_dir = config['configurations']['alluxio-env']['alluxio.pid.dir']

（3）Matser服务生命周期

文件说明：master生命周期包括安装、启动、停止、配置、重启、状态，其文件里面有 install()、configure()、start()、status()、stop()、restart() 六个方法
脚本实现

 #Call start.sh to start the service
  def start(self, env):
    import params
    env.set_params(params)

    #call configure
    self.configure(env)
    
    #execute the startup script
    cmd = params.base_dir + 'bin/alluxio-start.sh ' + 'master'
    
    Execute('echo "Running cmd: ' + cmd + '"')    
    Execute(cmd)
    
    # Create pid file - note check_process_status expects a SINGLE int in the file
    cmd = "mkdir -p " + params.pid_dir
    Execute(cmd)
    cmd = "echo `ps -A -o pid,command | grep -i \"[j]ava\" | grep AlluxioMaster | awk '{print $1}'`> " + params.pid_dir + "/AlluxioMaster.pid"
    Execute(cmd)

  #Called to stop the service using alluxio provided stop
  def stop(self, env):
    import params
    env.set_params(params)

    #call configure
    self.configure(env)

    #execure the startup script
    cmd = params.base_dir + 'bin/alluxio-stop.sh ' + 'master'

    Execute('echo "Running cmd: ' + cmd + '"')
    Execute(cmd)

  def restart(self, env):
    self.stop(env)
    self.start(env)

  #Called to get status of the service using the pidfile
  def status(self, env):
    check_process_status("/var/run/alluxio/AlluxioMaster.pid")

（4）Slave服务生命周期

文件说明：slave生命周期包括安装、启动、停止、配置、重启、状态，其文件里面有 install()、configure()、start()、status()、stop()、restart() 六个方法
脚本实现

#Call start.sh to start the service
def start(self, env):
    import params
    env.set_params(params)
    self.configure(env)
    #Mount ramfs
    cmd = params.base_dir + 'bin/alluxio-start.sh ' + 'worker' + ' Mount'

    Execute('echo "Running cmd: ' + cmd + '"')
    Execute(cmd)

    # Create pid file - note check_process_status expects a SINGLE int in the file
    cmd = "mkdir -p " + params.pid_dir
    Execute(cmd)
    cmd = "echo `ps -A -o pid,command | grep -i \"[j]ava\" | grep AlluxioWorker | awk '{print $1}'`> " + passrams.pid_dir + "/AlluxioWorker.pid"
    Execute(cmd)

    #Called to stop the service using the pidfile
    def stop(self, env):
        import params
        env.set_params(params)
        self.configure(env)
        #execure the startup script
        cmd = params.base_dir + 'bin/alluxio-stop.sh ' + 'worker'

        Execute('echo "Running cmd: ' + cmd + '"')
        Execute(cmd)

        #Check pid file using Ambari check_process_status
        def status(self, env):
            check_process_status("/var/run/alluxio/AlluxioWorker.pid")

2.6、Matser/Slave心跳检查

心跳检测逻辑：每间隔一段时间检测服务是否正常运行

ssh 192.168.6.102 /usr/hdp/3.1.0.0-78/alluxio /bin/alluxio format -s

运行结果

代码实现

def service_check(self, env):
    import params

    env.set_params(params)
    target_host = params.alluxio_masters[0]
    print ('Service check host is: ' + target_host)

    #call format
    format_command = [ "ssh", target_host, params.base_dir + "/bin/alluxio", "format", "-s"]
    format_proc = subprocess.Popen(format_command, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
    (format_stdout, format_stderr) = format_proc.communicate()
    format_response = format_stdout

    if 'Failed' in format_response:
        raise ComponentIsNotRunning()

        full_command = [ "ssh", target_host, params.base_dir + "/bin/alluxio", "runTests"]
        proc = subprocess.Popen(full_command, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
        (stdout, stderr) = proc.communicate()
        response = stdout

        if 'Failed' in response:
            raise ComponentIsNotRunning()

3、Ambari集成Alluxio

3.1、启动顺序

文件说明：文件可以定义组件在 Ambari 中启动顺序。

resource目录下的role_command_order.json定义着全局的的依赖。每个Stack目录下也会存在role_command_order.json。相同的配置，Stack下面的会覆盖全局的。不同的配置，Ambari会拼接在一起。高版本的Stack会继承低版本的配置。相同的也会overwrite，不同的merge。

①定义组件启动顺序报错

{
    "general_deps" : {
        "_comment" : "dependencies for Alluxio",
        "ALLUXIO_WORKER-START": ["ALLUXIO_MASTER-START"],
        "ALLUXIO_SERVICE_CHECK-SERVICE_CHECK": ["ALLUXIO_MASTER-START", "ALLUXIO_WORKER-START"],
        "ALLUXIO_MASTER-STOP": ["ALLUXIO_WORKER-STOP"],
        "ALLUXIO_MASTER-START": ["NAMENODE-START", "DATANODE-START", "ZOOKEEPER_SERVER-START"]
    }
}

启动结果

②定义组件启动顺序正确

{
    "general_deps" : {
        "_comment" : "dependencies for Alluxio",
        "ALLUXIO_MASTER-START": ["NAMENODE-START", "DATANODE-START", "ZOOKEEPER_SERVER-START"],
        "ALLUXIO_MASTER-STOP": ["ALLUXIO_SLAVE-STOP"],
        "ALLUXIO_SLAVE-START": ["ALLUXIO_MASTER-START"],
        "ALLUXIO_SERVICE_CHECK-SERVICE_CHECK": ["ALLUXIO_MASTER-START", "ALLUXIO_SLAVE-START"]
    }
}

运行结果

③问题说明：启动顺序脚本组件名称未与组件定义脚本名称未保持一致，尴尬！！！

3.2、自定义页面快链

服务可以通过将元信息添加到遵循预定义 JSON 格式的文件中来添加到 Ambari Web UI 的快速链接列表。Ambari 服务器解析快速链接 JSON 文件并将其内容提供给 UI，以便 Ambari Web UI 可以根据信息计算快速链接 URL，并相应地填充快速链接下拉列表。具体集成步骤如下：

（1）metainfo.xml文件配置启用

配置说明：默认情况下，JSON 文件名为 quicklinks.json，位于服务根目录下的 quicklinks 目录中。

<quickLinksConfigurations>
    <quickLinksConfiguration>
        <fileName>quicklinks.jsonfileName>
        <default>truedefault>
    quickLinksConfiguration>
quickLinksConfigurations>

（2）quicklinks文件

配置说明：快速链接 JSON 文件有两个主要部分，“配置”部分用于确定协议（HTTP 与 HTTPS），“链接”部分用于在 Ambari Web UI 上显示的每个快速链接的元信息。JSON 文件还在顶部包含一个“名称”部分，该部分定义了服务器用于识别的快速链接 JSON 文件的名称。

{
  "name": "default",
  "description": "default quick links configuration",
  "configuration": {
    "links": [
      {
        "name": "Alluxio_WEB_UI",
        "label": "Alluxio Web UI",
        "requires_user_name": "false",
        "component_name": "ALLUXIO_MASTER",
        "url":"%@://%@:%@",
        "port":{
          "http_property": "alluxio.master.web.port",
          "http_default_port": "19999",
          "regex": "^(\\d+)$",
          "site": "alluxio-ambari-config"
        }
      }
    ]
  }
}

参数说明

配置属性	配置说明	备注
links/name	快链名称
links/label	快链显示名称
requires_user_name
component_name	快链所关联的组件名称
url	第一个%@为通信协议，第二个是主机名，第三个是端口号
port/http_property	端口号，动态获取
port/http_default_port	默认端口
port/regex	正则规则
port/site	http_property参数所在的文件名称，省略了”.xml“

（3）显示规则

注意事项：界面显示如下

3.3、自定义警告

配置文件：alerts.json

（1）alter概述

在Ambari中的告警机制用来监控各个模块及其机器的状态。对于告警来说主要包括AlertDefinition和Alert Instance。

Alert Definition：告警任务定义，即定义告警的检测时间间隔（interval）、类型（type）、以及阈值等。
Alert Instance：告警实例，即Ambari会读取alert definition，然后创建对应实例去执行告警任务。

（2）alter类型

alert类型分为五种，分别如下

类型	用途	阈值是否可分配	阈值单位
PORT	用来监测机器上的一个端口进程是否存在	是	秒
METRIC	用来监测Metric相关的配置属性	是	%
AGGREGATE	用来收集其他某些Alert的状态	是	%
WEB	用来监测一个WEB UI（URL）地址是否可用	否	无
SCRIPT	Alert的检测逻辑由一个自定义的python脚本执行	否	无

注意事项：alert检查结果有五个级别，分别是OK、WARNING、CRITICAL、UNKNOWN和NONE

（3）Alter开发实例

Ⅰ、第一步_PORT告警示例实现

{
  "ALLUXIO": {                    
      "service": [],
      "ALLUXIO_MASTER": [        
          {
              "name": "ALLUXIO_server_process",
              "label": "ALLUXIO服务进程",
              "description": "如果您不能确定ALLUXIO服务器进程已启动并且正在网络上侦听，则将触发此主机级别警报。",
              "interval": 1,
              "scope": "ANY",
              "enabled": true,
              "source": {
                  "type": "PORT",
                  "uri": "{{alluxio-env/alluxio.master.web.port}}",
                  "default_port": 19999,
                  "reporting": {
                      "ok": {
                          "text": "TCP OK - {0:.3f}s response on port {1}"
                      },
                      "warning": {
                          "text": "TCP OK - {0:.3f}s response on port {1}",
                          "value": 1.5
                      },
                      "critical": {
                          "text": "Connection failed",
                          "value": 5
                      }
                  }
              }
          }
      ]
  }
}

参数说明：依据metainfo.xml 文件的service.name/component.name属性表示用来定义这个 Alert 属于哪个 Service 的哪个模块

属性	说明	备注
name	告警名称
label	告警显示名称
description	告警描述
interval	告警检测周期	单位为分钟
scope	告警范围
enabled	是否启用告警
source	告警实例
source/type	告警类型
source/uri	定义变量，获取conf的参数值
source/default_port	监测告警的默认端口号。	如果 uri 参数失效，就会读取该参数。
source/reporting	代表告警级别	分别是OK、WARNING，CRITICAL、UNKNOWN 和 NONE

Ⅱ、第二步：上传文件

cd /var/lib/ambari-server/resources/stacks/HDP/3.1/services/FLINK
rz alerts.json

结果如下

Ⅲ、第三步：调试运行

如果是修改 alerts.json 文件内容：则需要重启 Ambari Server ，并卸载、重新安装服务，Ambari 会将新预定义的 Alert 信息保存到数据库中。
如果是修改 SCRIPT 类型的 py 文件，则只需要将修改后的 py 文件放置到告警组件所在机器的 /var/lib/ambari-agent/cache/stacks/HDP/3.1/services/ALLUXIO/package/alerts 目录下即可（以 Elasticsearch 为例）。实时更新，不需要重启 ambari-server ，大概等待一分钟后，程序刷新。

Ⅳ、运行结果

3.4、自定义监控指标

3.4.1、Ambari Metrics概述

说明：Metrics在Metrics 页面上，有多个小程序(widget), 表现 HDP 集群服务的操作状态信息。多数小程序显示一个度量值(metric), 例如，HDFS Disk Usage 表示为一个负载图表和一个百分数指示。

（1）AWS概述

Ambari Metrics System 简称为 AMS，它主要为系统管理员提供了集群性能的监察功能。Metrics 一般分为 Cluster、Host 以及 Service 三个层级。

Cluster/Host 级：主要负责监察集群机器相关的性能
Service级：主要负责 Host Component 的性能。

AMS 涉及的模块如下图所示：

①Master 模块：即Metrics Collector

②Slave：包括Metrics Monitor 和 Hadoop Sinks，Salve 模块负责收集信息，并发送给 Collector。

Metrics Monitor：负责收集机器本身相关的指标，例如 CPU、Mem、Disk 等
Hadoop Sinks：负责收集 Hadoop 相关 Service 模块的性能数据，例如该模块占用了多少 Mem，以及该模块的 CPU 占用率等

（2）Ambari Widget介绍

核心：显示 AMS 收集的 Metrics 属性

3.4.2、AWS监控指标接口

核心：通过接口查看

（1）接口说明

说明：该接口给出所有可用指标的列表

http://AMS_SERVER:6188/ws/v1/timeline/metrics/metadata

查看结果

（3）获取指标值

http://leidi01:6188/ws/v1/timeline/metrics?metricNames=<>&hostname=<>&appId=<>&startTime=<>&endTime=<>&precision=<>

# 样例数据:我需要从运行 Hbase appId 的主机名中获取 default.General.heap.max 和 default.General.heap.used 指标名称
http://leidi01:6188/ws/v1/timeline/metrics?metricNames=default.General.heap.max,default.General.heap.used&appId=hivemetastore&hostname=leidi01

运行结果

3.4.3、第三方服务增加Metrics和Widgets

核心：配置相关的 metrics.json 以及 widget.json

（1）metainfo.xml文件配置

注意事项：timelineAppId，该值是唯一的，一般用 Service Name 即可，并且不区分大小写。Metrics Collector 中的 Tmeline Server 会通过 timelineAppid 区分各个模块的 Metrics 信息。

AmbariMetrics搜集该组件时的名称<-->
<component>
    ......
    <timelineAppid>alluxiotimelineAppid>
    ......
component>

（2）widgets.json文件配置

核心：自定义服务仪表盘

{
    "layouts": [
        {
            "layout_name": "default_alluxio_dashboard",
            "display_name": "Standard Alluxio Dashboard",
            "section_name": "Alluxio_SUMMARY",
            "widgetLayoutInfo": [
                {
                    "widget_name": "ALLUXIO GC count",
                    "description": "Count of total garbage collections and count of major type garbage collections of the JVM.",
                    "widget_type": "GRAPH",
                    "is_visible": true,
                    "metrics": [
                        {
                            "name": "master.CapacityTotal._rate",    
                            "metric_path": "metrics/master/capacitytotal._rate",  
                            "service_name": "ALLUXIO",         
                            "component_name": "ALLUXIO_MASTER"
                        },
                        {
                            "name": "master.PathsTotal._rate",
                            "metric_path": "metrics/master/pathstotal._rate",
                            "service_name": "ALLUXIO",
                            "component_name": "ALLUXIO_MASTER"
                        }
                    ],
                    "values": [
                        {
                            "name": "Master CapacityTotal count",    
                            "value": "${master.CapacityTotal._rate}"  
                        },
                        {
                            "name": "master.PathsTotal",
                            "value": "${metrics/master/pathstotal._rate}"
                        }
                    ],
                    "properties": {       
                        "graph_type": "LINE",
                        "time_range": "1"
                    }
                }
            ]
        }
    ]
}

属性说明

属性	说明	备注
metrics/name	数据推送到collector的实际名称
metrics/metric_path	与metrics.json文件的metricKey要保持一致	去掉._rate的部分
metrics/service_name	服务名
metrics/component_name	组件名
metrics/host_component_criteria	可选参数	该值为主机指标，不加这个参数的话，就是服务指标
values/name	仅用于“GRAPH图形”窗口小部件类型。	作为放大图例中的标签名称。
values/value	计算数据集值的表达式

（3）metrics.json文件配置

核心：自定义监控信息，声明服务指标

{
    "ALLUXIO_MASTER": {
        "Component": [
            {
                "type": "ganglia",
                "metrics": {
                    "default": {
                        "metrics/master/capacitytotal": {
                            "metric": "master.CapacityTotal",
                            "pointInTime": true,
                            "temporal": true
                          },
                          "metrics/master/pathstotal": {
                            "metric": "master.PathsTotal",
                            "pointInTime": true,
                            "temporal": true
                          }             
                    }
                }
            }
        ]
    }
}

属性说明

属性	说明	备注
type	ganglia是负责收集指标数据的
	为widgets.json里面的metrics[i].metric_path的值	去掉._max、._min之类的聚合标识
metric	widgets.json里面的metrics[i].name的值	去掉._max、._min之类的聚合标识
pointInTime	是否允许时间段的查询	如果为 false 则代表不允许
temporal	是否支持时间段的查询

（4）发送指标数据

核心：向 Ambari Metrics Collector 发送指标数据

①使用postman发送监控指标

{
  "metrics": [
    {
      "metricname": "master.PathsTotal",
      "appid": "alluxio",
      "hostname": "leidi01",
      "timestamp": 1612608282778,
      "starttime": 1612608282778,
      "metrics": {
        "1612608282778": 333
      }
    }
  ]
}

发送结果

②通过脚本定时发送

import requests
import json
 
# -----------------------------------------------------------------------------
#                       Functions
# -----------------------------------------------------------------------------
def human_readable(num):
  """
  this function will convert bytes to MB.... GB... etc
  """
  step_unit = 1024.0
  for x in ['bytes', 'KB', 'MB', 'GB', 'TB']:
    if num < step_unit:
      return "%3.1f %s" % (num, x)
    num /= step_unit
 
# -----------------------------------------------------------------------------
#         Variables
# -----------------------------------------------------------------------------
AMS_SERVER = 'amshost01.domain.com'
AMS_PORT = '6188'
AMS_URL = 'http://' + AMS_SERVER + ':' + AMS_PORT + '/ws/v1/timeline/'
 
# -----------------------------------------------------------------------------
#                Main
# -----------------------------------------------------------------------------
 
try:
  request01 = requests.get(AMS_URL + "metrics?metricNames=default.General.heap.max,default.General.heap.used&appId=hivemetastore&hostname=hiveserver01.domain.com")
  request01_dict = json.loads(request01.text)
  output = {}
  for row in request01_dict['metrics']:
    for key01, value01 in row.items():
      if key01 == 'metricname':
        metricname = value01
      if key01 == 'metrics':
        for key02, value02 in value01.items():
          metricvalue = value02
    output[metricname] = metricvalue
  print('Hive Metastore Heap Max: ' + human_readable(output['default.General.heap.max']))
  print('Hive Metastore Heap Used: ' + human_readable(output['default.General.heap.used']))
  print(("Hive Metastore percentage memory used: {:.0f}").format(output['default.General.heap.used']*100/output['default.General.heap.max']))
except:
  print("Cannot contact AMS server")
  exit(1)
exit(0)

（5）调试步骤

①首次 widgets.json 和 metrics.json 文件上传到服务器后，仅需重启 ambari-server 即可生效。后续的 widgets.json 和 metrics.json 文件如果要修改的话，均需要重启 ambari-server 和重装服务才可生效。

但是，生效以后，需要在 “widget Browser” 里面手动添加最新的 widget 部件。默认，ambari 会一直展示旧的数据。这些 widget 部件信息存储在 widget 这个表中。所以需要在 “widget Browser” 里面手动添加最新的 widget 部件。

②如果 package 里面有文件增删或修改，重启ambari-server，这个package 文件也会覆盖实时更新，实时更新后，我们重启组件来验证修改的功能。

（6）运行结果

说明：无数据…

你可能感兴趣的:(#,Ambari二次开发,ambari,大数据,hadoop)

探索数据安全新境界：Apache Spark SQL Ranger Security插件深度揭秘乌昱有Melanie
探索数据安全新境界：ApacheSparkSQLRangerSecurity插件深度揭秘项目地址:https://gitcode.com/gh_mirrors/sp/spark-ranger随着大数据的爆炸性增长，数据安全性成为了企业不可忽视的核心议题。在这一背景下，【ApacheSparkSQLRangerSecurityPlugin】以其强大的数据访问控制能力脱颖而出，成为数据处理领域的明星级
Java 大视界 -- Java 大数据在智能医疗远程会诊与专家协作中的技术支持（146）青云交大数据新视界 Java 大视界 java 大数据智能医疗远程会诊专家协作数据安全病例诊断
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
golang面经整理（一）（k8s,docker二次开发方向，云原生方向） gooooer 1024程序员节
笔者在2022年7月份-9月份之间面试了很多golang和k8s相关的面试，主要想从事云原生相关的开发工作，大小公司面试了很多，现将整体面试感受和一些通用的问题做一些整理记录，帮助大家在面试的时候更好的进行准备。最近大环境不好，大厂的岗位也少了不少。主要投递的岗位包含广州、深圳的岗位，面试的是golang工程师相关的岗位，但其实单纯做云原生相关岗位比较少，基本上局限于国内的几朵云，阿里云，华为云，
HDFS相关的面试题努力的搬砖人. java 面试 hdfs
以下是150道HDFS相关的面试题，涵盖了HDFS的基本概念、架构、操作、数据存储、高可用性、权限管理、性能优化、容错机制、与MapReduce的结合、安全性、数据压缩、监控与管理、与YARN的关系、数据一致性、数据备份与恢复等方面，希望对你有所帮助。HDFS基本概念1.HDFS是什么？它的设计目标是什么？•HDFS是Hadoop分布式文件系统，设计目标是实现对大规模数据的高吞吐量访问，适用于一次
Flink相关面试题努力的搬砖人. 面试 java 后端 flink
以下是150道ApacheFlink面试题及其详细回答，涵盖了Flink的基础知识、核心架构、API使用、性能调优等多个方面，每道题目都尽量详细且简单易懂：Flink基础概念类1.什么是ApacheFlink？ApacheFlink是一个开源的流处理和批处理框架，能够实现快速、可靠、可扩展的大数据处理。它既可以处理无界的数据流，也可以处理有界的数据批，提供了低延迟和高吞吐量的实时数据处理能力。Fl
2017安全之势：云、大数据、IoT、人工智能 weixin_34392906 人工智能大数据嵌入式
“新技术让信息系统变成了孙悟空，开始无所不能，但安全仍是它的‘紧箍咒’！怎样解开这个‘紧箍咒’？各路安全厂商各显其能，但似乎路漫漫兮离目标还很遥远。”三未信安董事长张岳公在ZD至顶网《百位意见领袖寄语2017》中说出了这样一句话，我觉着很有道理。安全是一个永恒的话题，如果说它与新的信息技术相生相克也不过分。即便如此，我们更要尽可能的减少安全带来的束缚。2017已经到来，不妨来看看至顶网与业界大咖总
hadoop3.x--搭建hadoop高可用集群（HA模式）运维小菜 hadoop hadoop hdfs
hadoop高可用集群（HA模式）一、安装前1.集群规划2.安装前配置3.安装jdk与hadoop4.克隆虚拟机与互信配置5.搭建zookeeper集群二、HDFS1.配置hdfs2.初始化启动hdfs集群三、MapReduce与Yarn1.配置MapReduce2.配置yarn3.启动yarn四、验证1.查看java进程2.hdfs与yarn前台页面一、安装前1.集群规划hostnameipNN
直方图梯度提升：大数据时代的极速决策引擎万事可爱^ 大数据机器学习深度学习直方图梯度提升 GBDT 算法
一、为什么需要直方图梯度提升？在Kaggle竞赛的冠军解决方案中，超过70%的获奖方案都使用了梯度提升算法。但当数据量突破百万级时，传统梯度提升树（GBDT）面临三大致命瓶颈：训练耗时剧增：每个特征的分割点计算都需要全量数据排序内存消耗爆炸：存储排序后的特征值需要额外空间处理效率低下：无法有效利用现代CPU的多核特性而梯度提升决策树（GBDT）作为集成学习的代表算法，通过迭代构建决策树实现预测能力
从原理到实践：Go 语言内存优化策略深度解析叶间清风1998 服务器 linux 网络
目录一、引言二、Go语言内存管理基础原理2.1栈与堆内存分配2.2垃圾回收机制剖析三、内存优化策略与实践3.1合理使用指针传递3.2避免不必要的内存分配3.3优化切片与映射的使用3.4控制变量作用域3.5减少闭包导致的变量逃逸四、内存优化工具与性能分析4.1pprof工具的使用4.2其他性能分析辅助手段五、不同场景下的内存优化案例分析5.1高并发Web服务场景5.2大数据处理与分析场景六、总结与展
动漫短剧小程序源码|动漫短剧app源码交付 weixin_707762673 小程序 php
系统全部开源可二次开发，包部署上线上架，专业的售后团队以及技术服务公司，不转包不外包，完全自研技术团队。今天给大家带来一个超级给力的项目——动漫短剧小程序源码|动漫短剧app源码交付！这不仅是一套完整的解决方案，而且是针对那些想要进入火爆市场领域的朋友们的一把金钥匙！首先说一下背景吧。近年来随着短视频行业的爆发式增长，特别是微短剧、国漫等细分市场的快速崛起，让很多企业和个人看到了新的机会窗口。然而
在虚拟机上安装Hadoop 杜清卿 hadoop
基本步骤与安装java一致:先用finalshell将hadoop-3.1.3.tar.gz导入到opt目录下面的software文件夹下面，然后解压,最后配置环境变量。1.使用finalshell上传。这里直接鼠标拖动操作即可。2.解压。进入到Hadoop安装包路径下，cd/opt/software/，再解压安装文件到/opt/module下，对应的命令是:tar-zxvfhadoop-.1.3
hadoop集群配置-scp拓展使用杜清卿 hadoop 服务器大数据
任务1：在hadoop102上，将hadoop101中/opt/module/hadoop-3.1.3目录拷贝到hadoop102上。分析：使用scp进行拉取操作：先登录到hadoop2使用命令：scp-rroot@hadoop101:/opt/module/hadoop-3.1.3/opt/module/任务2：在hadoop101上操作，将hadoop100中/opt/module目录下所有目
硅谷企业的大数据平台架构什么样？看看Twitter、Airbnb、Uber的实践大数据v 分布式数据库大数据编程语言 hadoop
导读：本文分析一下典型硅谷互联网企业的大数据平台架构。作者：彭锋宋文欣孙浩峰来源：大数据DT（ID：hzdashuju）01Twitter的大数据平台架构Twitter是最早一批推进数字化运营的硅谷企业之一，其公司运营和产品迭代的很多功能是由其底层的大数据平台提供的。图7-2所示为Twitter大数据平台的基本示意图。▲图7-2Twitter大数据平台架构Twitter的大数据平台开发比较早，很多
【图像预处理】瞬间记忆深度学习 python
(4条消息)图像预处理方法总结_AI强仔的博客-CSDN博客对图像进行预处理的一些常见方法包括：调整图像大小和分辨率，以便适应模型的输入要求。对图像进行裁剪或填充，以使其大小和比例符合要求。调整图像的亮度、对比度和饱和度等图像属性。进行图像平滑或锐化操作，以去除噪声或增强图像特征。进行图像归一化或标准化，以确保各个特征在相同的尺度上。应用数据增强技术，如旋转、平移、缩放、翻转等，以扩大数据集，提高
大数据学习（75）-大数据组件总结 viperrrrrrr 大数据 impala yarn hdfs hive CDH mapreduce
大数据学习系列专栏：哲学语录:用力所能及，改变世界。如果觉得博主的文章还不错的话，请点赞+收藏⭐️+留言支持一下博主哦一、CDHCDH（ClouderaDistributionIncludingApacheHadoop)是由Cloudera公司提供的一个集成了ApacheHadoop以及相关生态系统的发行版本。CDH是一个大数据平台，简化和加速了大数据处理分析的部署和管理。CDH提供Hadoop的
大数据点燃智能制造变革之火——从数据到价值的跃迁 Echo_Wish 大数据高阶实战秘籍大数据制造
大数据点燃智能制造变革之火——从数据到价值的跃迁在全球制造业向智能化转型的浪潮中，大数据已然成为点燃变革的关键火种。从车间到供应链，从设备到产品生命周期，制造业正通过大数据分析找到隐形的效率优化机会，打破传统生产模式的桎梏。作为Echo_Wish，今天我将和大家探讨大数据如何融入智能制造，助力实现生产效率和业务价值的双重飞跃。一、智能制造的核心诉求：数据驱动的决策与执行智能制造的目标是通过数据驱动
Sqoop安装部署愿与狸花过一生大数据 sqoop hadoop hive
ApacheSqoop简介Sqoop（SQL-to-Hadoop）是Apache开源项目，主要用于：将关系型数据库中的数据导入Hadoop分布式文件系统（HDFS）或相关组件（如Hive、HBase）。将Hadoop处理后的数据导出回关系型数据库。核心特性批量数据传输支持从数据库表到HDFS/Hive的全量或增量数据迁移。并行化处理基于MapReduce实现并行导入导出，提升大数据量场景的效率。自
AI预测体彩排3新模型百十个定位预测+胆码预测+杀和尾+杀和值2025年3月21日第25弹 GIS小天体彩排3 人工智能机器学习彩票算法
前面由于工作原因停更了很长时间，停更期间很多彩友一直私信我何时恢复发布每日预测，目前手头上的项目已经基本收尾，接下来恢复发布。当然，也有很多朋友一直咨询3D超级助手开发的进度，在这里统一回复下。由于本人既精通编程+大数据分析，也热衷于彩票研究，所以很多彩友通过一些渠道找到了我。目前，加我的已有不少彩友，分成了3类人群：第一类：平时不懂数据分析，买彩全靠瞎猜乱蒙，这些朋友希望借助我的技术和方法来给他
Zynq PL端IP核之AXI DMA Mazy.v fpga开发嵌入式硬件 arm开发单片机
1.AXIDMA简介Zynq提供了两种DMA，一种是PS中的DMA控制器，通过GP口与PL端连接，另一种是PL中的AXIDMAIP核（软核），通过HP口与PS端连接。Zynq有4个HP接口，每一个HP接口都包含控制和数据FIFO，这些FIFO为大数据量突发传输提供缓冲，让HP接口成为理想的高速数据传输接口。AXIDMAIP内核在AXI4内存映射和AXI4StreamIP接口之间提供高带宽直接储存访
Dify - 架构、部署、扩展与二次开发指南花千树-010 AIGC 架构 AIGC prompt embedding llama gpt agi
本文详细解析Dify的架构、部署流程、高可用中间件的独立部署方法，以及二次开发流程，帮助开发者更高效地管理和扩展Dify。1.本地DEMO部署安装Docker，执行下面脚本，可能需要配置镜像。gitclonehttps://github.com/langgenius/dify.gitcddifycddockercp.env.example.envdockercomposeup-d1.Dify部署后
揭秘时空大数据：详细介绍、真实应用场景和数据示例解析陈书予 GIS开发（时空大数据）前端大数据 python 时序数据库
时空大数据(SpatialBigData)是指利用空间环境和时间环境信息，以及数字技术，从多种来源获取的海量、动态的、多维的数据，对空间环境和时间环境进行实时监测，并基于复杂的数据分析和挖掘，获取有价值的信息。时空大数据示例：1）社会网络数据：Twitter、Facebook、Instagram等社交媒体上的海量数据，可以通过时间、空间、主题等来提取有价值的信息。2）遥感图像数据：通过遥感技术从卫
python基于Django的旅游景点数据分析及可视化的设计与实现 7blk7 qq2295116502 python django 数据分析
目录项目介绍技术栈具体实现截图Scrapy爬虫框架关键技术和使用的工具环境等的说明解决的思路开发流程爬虫核心代码展示系统设计论文书写大纲详细视频演示源码获取项目介绍大数据分析是现下比较热门的词汇，通过分析之后可以得到更多深入且有价值的信息。现实的科技手段中，越来越多的应用都会涉及到大数据随着大数据时代的到来，数据挖掘、分析与应用成为多个行业的关键,本课题首先介绍了网络爬虫的基本概念以及技术实现方法
ssh命令满分对我强制爱 linux 服务器运维 spark
ssh命令无需密码也可登录要先关闭防火墙，命令如下：systemctlstopfirewalldsystemctldisablefirewalldsystemctlstatusfirewalldeg：目标：hadoop100通过ssh访问hadoop101,hadoop102时不需要密码，其他两台设备也类似。具体操作如下：1.在hadoop100中生成公钥和密码。ssh-keygen-trsa三次
存算一体与存算分离：架构设计的深度解析与实现方案克里斯蒂亚诺罗纳尔多阿维罗大数据数据库
随着数据量的不断增大和对计算能力的需求日益提高，存算一体作为一种新型架构设计理念，在大数据处理、云计算和人工智能等领域正逐步引起广泛关注。在深入探讨存算一体之前，我们需要先了解存储和计算的基本概念，以及存算分离和存算一体之间的区别。什么是存算一体？存算一体，顾名思义，是将数据存储与计算资源紧密结合，形成一个统一的架构。在这种架构下，存储和计算不仅在物理层面上结合，更在架构设计上深度融合。具体来说，
LakeHouse湖仓一体成为下一站灯塔，数仓、数据湖架构即将退出群聊科杰科技大数据数据仓库
摘要：当前的大数据技术应用趋势表明，客户对单一的数据湖和数仓架构并不满意。近年来几乎所有的数据仓库都增加了对Parquet和ORC格式的外部表支持，这使数仓用户可以从相同的SQL引擎查询数据湖表，但它不会使数据湖表更易于管理，也不会消除仓库中数据的ETL复杂性、陈旧性和高级分析挑战。KeenDataLakeHouse（湖仓一体）作为新一代大数据技术架构，将逐渐取代单一数据湖和数仓架构，成为大数据架
数据让农业更聪明——用大数据激活田间地头 Echo_Wish 大数据大数据
数据让农业更聪明——用大数据激活田间地头在农业领域，随着人口增长和气候变化的影响，如何提升生产力始终是个关键话题。大数据，这个曾经只属于科技领域的概念，如今已悄然进入田间地头。今天，我以Echo_Wish的视角，和大家聊聊大数据如何赋能农业生产力，帮农民在阳光下也能掌握“科技的钥匙”。认识农业中的大数据什么是农业中的“大数据”？简单来说，就是收集和分析有关土地、气候、作物、病虫害以及市场需求等方面
GraphCube、Spark和深度学习技术赋能快消行业关键运营环节 weixin_30777913 开发语言大数据深度学习人工智能 spark
在快消品（FMCG）行业，需求计划（DemandPlanning）、库存管理（InventoryManagement）和需求供应管理（DemandSupplyManagement）是影响企业整体效率和利润水平的关键运营环节。GraphCube图多维数据集技术、Spark大数据分析处理技术和深度学习技术的结合，为这些环节提供了智能化、动态化和实时化的解决方案，显著提升业务运营效率和企业利润。一、技术
从 0 到 1 构建 Python 分布式爬虫，实现搜索引擎全攻略七七知享 Python python 分布式爬虫搜索引擎算法程序人生网络爬虫
从0到1构建Python分布式爬虫，实现搜索引擎全攻略在大数据与信息爆炸的时代，搜索引擎已然成为人们获取信息的关键入口。你是否好奇，像百度、谷歌这般强大的搜索引擎，背后是如何精准且高效地抓取海量网页数据的？本文将带你一探究竟，以Python为工具，打造属于自己的分布式爬虫，进而搭建一个简易搜索引擎，完整呈现从底层代码编写到系统搭建的全过程。通过本文的实践，我们成功打造了Python分布式爬虫，并以
第三十篇维度建模：从理论到落地的企业级实践随缘而动，随遇而安数据库 sql 数据仓库大数据数据库架构
目录一、维度建模核心理论体系1.1Kimball方法论四大支柱1.2关键概念对比矩阵二、四步建模法全流程解析2.1选择业务过程（以电商为例）2.2声明原子粒度（订单案例）2.3维度设计规范时间维度（含财年逻辑）SCDType2完整实现（Hudi）2.4事实表类型与设计三、企业级建模实战：电商用户分析3.1业务矩阵分析3.2模型实现代码四、高级建模技巧4.1多星型模式关联4.2大数据场景优化五、性能
Hive面试题御风行云天面试题大全 hive hadoop 数据仓库面试
Hive面试题1Hive基础概念1.1解释Hive是什么以及它的用途Hive的主要用途：1.2描述Hive架构和组件1.HiveCLI/Beeline和WebUI2.HiveQL3.HiveDriver（驱动）4.Metastore5.Compiler（编译器）6.Optimizer（优化器）7.Executor（执行器）8.HadoopCoreComponents（核心组件）9.HiveUDFs
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源