wbj0110

cdh4 hadoop,hive,impala,hbase本地库搭建及安装

--hadoop文件位置：
log目录 :

 
       1 
       /var/log/hadoop-hdfs  
      
       2 
       /var/log/hadoop-mapreduce  
      
       3 
       /var/log/hbase  
      
       4 
       /var/log/hive  
      
       5 
       /var/log/hive 
      
       6 
       /var/log/impala

安装目录：

 
       1 
       /usr/lib

启动命令目录：

 
       1 
       /etc/init.d/

配置文件目录：

 
       1 
       /etc/hadoop/conf  
      
       2 
       /etc/hbase/conf 
      
       3 
       /etc/hive/conf  
      
       4 
       /etc/impala/conf

环境变量：

 
       1 
       /etc/profile

让/etc/profile文件修改后立即生效 ,可以使用如下命令:

 
       1 
        source /etc/profile

node配置：

 
       1 
       /etc/hosts

资源库位置：

 
       1 
       /etc/yum.repos.d/

1.本地cdh4 搭建/
1、安装httpd服务,作用：用browser查看本地库
--安装httpd

 
       1 
        yum install httpd

--启动httpd
vi /etctpdtpd.conf (配置文件)

 
       1 
       service httpd start  
      
       2 
       service httpd stop  
      
       3 
       service httpd restart

--关闭防火墙

 
       1 
       service iptables status  
      
       2 
       service iptables stop

--浏览器查看
http://ip地址
2、安装createrepo
--Createrepo用于创建本地源。

 
       1 
        sudo yum install yum-utils createrepo

3、搭建本地源
--下载cloudera-manager.repo,cloudera-cdh4.repo到/etc/yum.repos.d/目录下

 
       1 
        cd /etc/yum.repos.d/  
      
       2 
       wget http://archive.cloudera.com/cm4/redhat/6/x86_64/cm/cloudera-manager.repo  
      
       3 
       wget http://archive.cloudera.com/cdh4/redhat/6/x86_64/cdh/cloudera-cdh4.repo

--将远程源的RPM包同步到本地的httpd服务目录

 
       1 
        cd /var/www/html/   
      
       2 
       reposync -r cloudera-manager  
      
       3 
       reposync -r cloudera-cdh4

--生成或刷新：RPMS，和一个放依赖关系等信息的文件夹repodata。

 
       1 
        cd /var/www/html/cloudera-manager   
      
       2 
       createrepo .  
      
       3 
        cd /var/www/html/cloudera-cdh4   
      
       4 
       createrepo .

至此，CDH4本地源搭建完成。
4:本地源的使用
--修改cloudera-manager.repo中的baseurl修改指向本地局域网的服务器
将baseurl=http://archive.cloudera.com/cm4/redhat/6/x86_64/cm/4/ 改为：
baseurl=http://172.16.2.52/cloudera-manager/
--修改cloudera-cdh4.repo中的baseurl修改指向本地局域网的服务器
将baseurl=http://archive.cloudera.com/cdh4/redhat/6/x86_64/cdh/4/ 改为：
baseurl=http://172.16.2.52/cloudera-cdh4/
baseurl的地址是服务器地址+放置RPM包的目录名，结构如下图：里面有一个放RPM包的文件夹RPMS，和一个放依赖关系等信息的文件夹repodata。
2.cloudera manager安装
--安装

 
       1 
        sudo yum install cloudera-manager-daemons   
      
       2 
        sudo yum install cloudera-manager-server   
      
       3 
        sudo yum install cloudera-manager-server-db   
      
       4 
        sudo yum install cloudera-manager-agent

--启动

 
       1 
       service cloudera-scm-server start  
      
       2 
       service  cloudera-manager-server-db  start  
      
       3 
       service cloudera-scm-agent start

3.cdh4 安装
//安装装CDH4

 
       1 
        yum install hadoop-0.20-mapreduce-jobtracker hadoop-0.20-mapreduce-tasktracker  
      
       2 
        yum install hadoop-hdfs-namenode  
      
       3 
        yum install hadoop-hdfs-datanode  
      
       4 
        yum install hadoop-0.20-conf-pseudo  
      
       5 
        sudo -u hdfs hdfs namenode -format

--启动hdfs

 
       1 
        for x in `cd /etc/init.d ; ls hadoop-hdfs-*` ; do sudo service $x start ; done

4..安装 hive
参考资料：http://heylinux.com/archives/2456.html
--安装hive

 
       1 
        sudo yum install hive hive-metastore hive-server

--安装mysql

 
       1 
        sudo yum install mysql mysql-server mysql-devel  
      
       2 
       service mysqld start

--安装mysql连接驱动

 
       1 
        sudo yum install mysql-connector-java  
      
       2 
        ln -s /usr/share/java/mysql-connector-java.jar /usr/lib/hive/lib/mysql-connector-java.jar

--设置root密码

 
       1 
        sudo /usr/bin/mysql_secure_installation

根据提示输入密码

 
       01 
       01    [...]     
      
       02 
        02    Enter current password for root (enter for none):      
      
       03 
       03    OK, successfully used password, moving on...     
      
       04 
       04    [...]     
      
       05 
       05    Set root password? [Y/n] y     
      
       06 
       06    New password:hadoophive     
      
       07 
       07    Re-enter new password:hadoophive     
      
       08 
        08    Remove anonymous users? [Y/n] Y      
      
       09 
       09    [...]     
      
       10 
       10    Disallow root login remotely? [Y/n] N     
      
       11 
       11    [...]     
      
       12 
        12    Remove test database and access to it [Y/n] Y      
      
       13 
       13    [...]     
      
       14 
       14    Reload privilege tables now? [Y/n] Y     
      
       15 
        15    All done!

--进入mysql 依次执行

 
       01 
       mysql -u root -p hadoophive 
      
       02 
       CREATE DATABASE metastore; 
      
       03 
       USE metastore; 
      
       04 
       SOURCE /usr/lib/hive/scripts/metastore/upgrade/mysql/hive-schema-0.10.0.mysql.sql; 
      
       05 
        CREATE USER 'hive'@'%' IDENTIFIED BY 'hadoophive';  
      
       06 
        CREATE USER 'hive'@'localhost' IDENTIFIED BY 'hadoophive';  
      
       07 
        GRANT  ALL PRIVILEGES ON metastore.* TO 'hive'@'%';  
      
       08 
        GRANT  ALL PRIVILEGES ON metastore.* TO 'hive'@'localhost';  
      
       09 
       FLUSH PRIVILEGES; 
      
       10 
       quit;

--启动hive
--修改配置文件hive-site.xml
sudo vim /etc/hive/conf/hive-site.xml参考 hive 配置

 
       01 
        <configuration>  
      
       02 
         
       03 
       <!-- Hive Configuration can either be stored in this file or in the hadoop configuration files  --> 
      
       04 
       <!-- that are implied by Hadoop setup variables.                                                --> 
      
       05 
       <!-- Aside from Hadoop setup variables - this file is provided as a convenience so that Hive    --> 
      
       06 
       <!-- users do not have to edit hadoop configuration files (that may be managed as a centralized --> 
      
       07 
       <!-- resource).                                                                                 --> 
      
       08 
         
       09 
       <!-- Hive Execution Parameters --> 
      
       10 
         
       11 
        <property>  
      
       12 
          <name>javax.jdo.option.ConnectionURL</name>  
      
       13 
          <value>jdbc:mysql://localhost:3306/metastore</value>  
      
       14 
          <description>JDBC connect string for a JDBC metastore</description>  
      
       15 
        </property>  
      
       16 
         
       17 
        <property>  
      
       18 
          <name>javax.jdo.option.ConnectionDriverName</name>  
      
       19 
          <value>com.mysql.jdbc.Driver</value>  
      
       20 
          <description>Driver class name for a JDBC metastore</description>  
      
       21 
        </property>  
      
       22 
        <property>  
      
       23 
            <name>javax.jdo.option.ConnectionUserName</name>  
      
       24 
            <value>hive</value>  
      
       25 
        </property>  
      
       26 
        <property>  
      
       27 
             <name>javax.jdo.option.ConnectionPassword</name>  
      
       28 
             <value>hadoophive</value>  
      
       29 
        </property>  
      
       30 
        <property>  
      
       31 
              <name>hive.metastore.uris</name>   
      
       32 
              <value>thrift://127.0.0.1:9083</value>  
      
       33 
              <description>IP address (or fully-qualified domain name) and port of the metastore host</description>  
      
       34 
        </property>  
      
       35 
        </configuration>

--启动hive

 
       1 
       service hive-metastore start 
      
       2 
       service hive-server start

--依次执行

 
       01 
        $ sudo -u hdfs hadoop fs -mkdir /user/hive  
      
       02 
        $ sudo -u hdfs hadoop fs -chown hive /user/hive  
      
       03 
        $ sudo -u hdfs hadoop fs -mkdir /tmp  
      
       04 
        $ sudo -u hdfs hadoop fs -chmod 777 /tmp  
      
       05 
        $ sudo -u hdfs hadoop fs -chmod o+t /tmp  
      
       06 
        $ sudo -u hdfs hadoop fs -mkdir /data  
      
       07 
        $ sudo -u hdfs hadoop fs -chown hdfs /data  
      
       08 
        $ sudo -u hdfs hadoop fs -chmod 777 /data  
      
       09 
        $ sudo -u hdfs hadoop fs -chmod o+t /data  
      
       10 
        $ sudo chown -R hive:hive /var/lib/hive

$ sudo vim /tmp/kv1.txt

 
       1 
        1,www.baidu.com  
      
       2 
        2,wwww.google.com  
      
       3 
        3,wwww.sina.com.cn  
      
       4 
        4,wwww.163.com  
      
       5 
        5,wheylinx.com

 
       1 
        CREATE TABLE IF NOT EXISTS pokes ( foo INT,bar STRING ) ROW FORMAT DELIMITED FIELDS TERMINATED BY "," LINES TERMINATED BY "\n";  
      
       2 
       show tables; 
      
       3 
        desc formatted pokes;  
      
       4 
        LOAD DATA LOCAL INPATH '/tmp/kv1.txt' OVERWRITE INTO TABLE pokes;  
      
       5 
        select * from pokes;

5.安装impala

参考资料：http://heylinux.com/archives/2456.html
--下载资源包

`1`	`sudo` `wget http://archive.cloudera.com/impala/redhat/6/x86_64/impala/cloudera-impala.repo`

--同步资源库

 
       1 
        cd /var/www/html/  
      
       2 
       reposync -r cloudera-impala 
      
       3 
        cd /var/www/html/cloudera-impala  
      
       4 
       createrepo .

--修改cloudera-impala.repo
将baseurl=http://archive.cloudera.com/impala/redhat/6/x86_64/impala/1/改为：
baseurl=http://172.16.2.52/cloudera-impala/
--安装

 
       1 
        sudo yum install impala   
      
       2 
        sudo yum install impala-shell   
      
       3 
        sudo yum install impala-server   
      
       4 
        sudo yum install impala-state-store

--添加配置/etc/hadoop/conf/hdfs-site.xml如下
sudo vim /etc/hadoop/conf/hdfs-site.xml

 
       01 
       <property> 
      
       02 
           <name>dfs.client.read.shortcircuit</name>  
      
       03 
           <value>true</value>  
      
       04 
       </property> 
      
       05 
       <property> 
      
       06 
           <name>dfs.domain.socket.path</name>  
      
       07 
           <value>/var/run/hadoop-hdfs/dn._PORT</value>  
      
       08 
         </property>  
      
       09 
       <property> 
      
       10 
           <name>dfs.client.file-block-storage-locations.timeout</name>  
      
       11 
           <value>3000</value>     
      
       12 
       </property> 
      
       13 
       <property> 
      
       14 
          <name>dfs.datanode.hdfs-blocks-metadata.enabled</name>  
      
       15 
          <value>true</value>  
      
       16 
       </property>

--复制文件到/etc/impala/conf/

 
       1 
        sudo cp -rpa /etc/hadoop/conf/core-site.xml /etc/impala/conf/  
      
       2 
        sudo cp -rpa /etc/hadoop/conf/hdfs-site.xml /etc/impala/conf/  
      
       3 
        sudo cp -rpa /etc/hive/conf/hive-site.xml /etc/impala/conf/

--重新启动datanode 及 impala

 
       1 
        sudo service hadoop-hdfs-datanode restart  
      
       2 
        sudo service impala-state-store restart  
      
       3 
        sudo service impala-server restart

--进入impala命令行

 
       1 
       impala-shell

5.安装hbase（伪分布）
--安装zookper

 
       1 
        yum install zookeeper-server

--启动zookper

 
       1 
       service  zookeeper-server start

--安装hbase，hbase-master，hbase-regionserver

 
       1 
        sudo yum install hbase  
      
       2 
        sudo yum install hbase-master  
      
       3 
        sudo yum install hbase-regionserver

--修改配置
sudo vim /etc/security/limits.conf

 
       1 
       hdfs - nofile 32768 
      
       2 
       hbase - nofile 32768

--修改配置
$sudo vim /etc/pam.d/common-session

 
       1 
       session required pam_limits.so

--修改hadoop配置
sudo vim /etc/hadoop/conf/hdfs-site.xml

 
       1 
       <property> 
      
       2 
          <name>dfs.datanode.max.xcievers</name>  
      
       3 
          <value>4096</value>  
      
       4 
       </property>

--修改hbase配置/etc/hbase/conf/hbase-site.xml

 
       01 
       <configuration>  
      
       02 
           <property>   
      
       03 
             <name>hbase.rootdir</name>   
      
       04 
             <value>hdfs://myhost:8020/hbase</value>   
      
       05 
           </property>   
      
       06 
           <property>   
      
       07 
             <name>hbase.cluster.distributed</name>   
      
       08 
             <value>true</value>   
      
       09 
           </property>   
      
       10 
       </configuration>

--创建hbase工作目录

 
       1 
        sudo -u hdfs hadoop fs -mkdir /hbase  
      
       2 
        sudo -u hdfs hadoop fs -chown hbase /hbase

--hdfs重启

 
       1 
        sudo /etc/init.d/hadoop-hdfs-namenode restart  
      
       2 
        sudo /etc/init.d/hadoop-hdfs-datanode restart

--启动

 
       1 
        sudo service hbase-master start  
      
       2 
        sudo service hbase-regionserver start

--进入hbase

 
       1 
       hbase shell

你可能感兴趣的:(cdh)

maven使用Cloudera仓库邢为栋 Bigdata Java maven cloudera java
现在已经很少开发Java了，Maven用的也少，已经忘得差不多了，但是在工作中不可避免需要开发一些。生产用的大数据平台使用的是CDH6.3.2，在开发时需要在Maven中引入Cloudera的一些依赖包，这时就需要配置Cloudera仓库。本文记录配置过程，以作备忘。配置Cloudera仓库，编辑pom文件，添加如下内容：cloudera.repohttps://repository.cloude
SLAAC 与 DHCPv6 笔记250405 kfepiza 网络通讯传输协议物联 #Linux CentOS Ubuntu 等笔记 tcp/ip ip tcp linux 网络网络协议
SLAAC与DHCPv6笔记250405SLAAC（无状态地址自动配置）和DHCPv6是IPv6网络中两种主要的地址配置机制，分别适用于不同的场景和需求。以下是它们的核心区别、协作方式及实际应用指南：核心区别对比特性SLAACDHCPv6（有状态）DHCPv6（无状态）地址生成方式客户端基于RA前缀自行生成地址服务器分配完整地址地址由SLAAC生成，服务器提供参数依赖服务器无需服务器（仅需路由器R
SSl TLS协议信息泄露漏洞(CVE-2016-2183)【原理扫描】漏洞修复向阳而生，一路生花安全网络
1、找到控制面板，控制面板->网络和Internet->Internet选项2、只选择TLS1.2,点击应用和确定3，接着win+r键打开运行，输入gpedit.msc，点击确定4、进入本地组策略编辑器，找到SSL密码套件顺序5、点击SSL密码套件顺序，点击编辑，点击已启用，SSL密码套件内容要编辑6、输入以下内容，并确定。TLS_ECDHE_ECDSA_WITH_AES_128_GCM_SHA2
大数据学习（75）-大数据组件总结 viperrrrrrr 大数据 impala yarn hdfs hive CDH mapreduce
大数据学习系列专栏：哲学语录:用力所能及，改变世界。如果觉得博主的文章还不错的话，请点赞+收藏⭐️+留言支持一下博主哦一、CDHCDH（ClouderaDistributionIncludingApacheHadoop)是由Cloudera公司提供的一个集成了ApacheHadoop以及相关生态系统的发行版本。CDH是一个大数据平台，简化和加速了大数据处理分析的部署和管理。CDH提供Hadoop的
数据中台（二）数据中台相关技术栈 Yuan_CSDF #数据中台
1.平台搭建1.1.Amabari+HDP1.2.CM+CDH2.相关的技术栈数据存储：HDFS，HBase，Kudu等数据计算：MapReduce,Spark,Flink交互式查询：Impala,Presto在线实时分析：ClickHouse，Kylin，Doris，Druid，Kudu等资源调度：YARN，Mesos，Kubernetes任务调度：Oozie，Azakaban，AirFlow，
Linux关闭swap分区操作[适用于CDH报警等] NBA首席形象大使阿坤大数据运维和开发 #大数据集群 linux 运维 hadoop
1.查看swap分区挂载路径(没卵用)swapon-s2.设置配置文件的swap配置echo“vm.swappiness=0”>/etc/sysctl.conf3.设置内存中的swap状态。有时候配置文件为0，但集群或服务仍然使用了swap分区，可能原因就是内存没有同步配置echo“0”>/proc/sys/vm/swappiness4.生效配置sysctl-p5.将/etc/fstab文件中所有
Ranger集成CDH6.3.1详细步骤 sunxunyong hadoop
CDH-ranger基础环境：jdk:1.8maven:mvn-verisonApacheMaven3.9.4brewsearchbzip2brewinstallbzip2brewlistyuminstallgit-yyuminstall-ypython3yuminstall-ybzip2yum-yinstallfontconfig-develpip3installrequests下载ranger
海思视觉Hi3516CV610运行sample pride.li 海思视觉 linux 视觉检测
使用前先提前，请使用nfs将开发板和ubuntu进行共享，共享目录为nfs编译samplecdHi3516CV610_SDK_V1.0.1.0/smp/a7_linux/source/mpp/sample/vencmakeallcp sample_vencnfsnfs：ubuntu和开发板共享的目录移植ko如果需要重新编译kocdHi3516CV610_SDK_V1.0.1.0/smp/a7_li
ecc椭圆加密算法c语言,ECC 椭圆曲线加密算法学习————ECDH与ECDSA weixin_39927508 ecc椭圆加密算法c语言
0x00前言之前学习了实数域上的椭圆曲线与有限域$\mathbb{F}_{p}$上的椭圆曲线。详细可以参考ECC椭圆加密算法学习————从实数域到有限域的椭圆曲线。不难发现，在实数域的标量乘法看上去是一个“简单”的问题，但是在有限域$\mathbb{F}_{p}$就显得非常困难。本文主要讨论如何将之前所学的运用于加密问题中。相关代码一些重要的域参数素数$p$椭圆曲线系数$a$与$b$基点(生成元)
DroidDissector本地部署想做后端的小C linux 运维服务器
DroidDissector本地部署我启动的是MediumPhoneAPI30安卓虚拟机先决条件：把frida-server推送到虚拟机的/data/local/tmp/目录中cdH:\frida_serveradbpushH:\frida_server\frida-server-16.6.6-android-x86/data/local/tmp/
HAProxy 1.8.13 编译安装清笙漓江南 Linux MircSystemctl haproxy编译安装 haproxy socket
HAProxy编译安装首先上官网获取haproxy的tar包解压至当前目录haproxy的配置文件中要使用到haproxy用户所以我们先创建该用户useradd-r-s/sbin/nologinhaproxytarxfhaproxy-1.8.13.tar.gzcdhaproxy-1.8.13/vimREADME文档其中我们可以查看到关于怎么样安装我们使用其中的一项，包括了pcre和ssl以及zli
一文弄懂ECDHE算法中的TLS握手流程 LUCIAZZZ java 网络协议计算机网络操作系统 spring spring boot
部分内容来源：小林coding说一下ECDHE算法DHE算法由于计算性能不佳，因为需要做大量的乘法，为了提升DHE算法的性能，所以就出现了现在广泛用于密钥交换算法——ECDHE算法。ECDHE算法是在DHE算法的基础上利用了ECC椭圆曲线特性，可以用更少的计算量计算出公钥，以及最终的会话密钥。小红和小明使用ECDHE密钥交换算法的过程：双方事先确定好使用哪种椭圆曲线，和曲线上的基点G，这两个参数都
对应chd5.14的spark_carbonData使用文档(基于CDH 的spark-yarn模式) 颜语一声对应chd5.14的spark
一、部署(基于CDH的spark-yarn模式)下载源码编译(目前官网已经提供编译好的jar包了)【https://dist.apache.org/repos/dist/release/carbondata/】mvn-DskipTests-Pspark-2.1-Dspark.version=2.1.0cleanpackagemvn-DskipTests-Pspark-2.2-Dspark.vers
openssl中dh算法实现 sjtu_chenchen 加密技术 c++openssl dh
Openssl的DH实现在crypt/dh目录中，各个源码如下：(1）dh.h定义了DH密钥方法数据结构以及各种函数。(2)dh_asn1.cDH密钥参数的DER编解码实现。(3）dh_lib.c实现了通用的DH函数，设计层面的。(4）dh_gen.c实现了生成DH密钥参数。(5）dh_key.c实现openssl提供的默认的DH_METHOD，实现了根据密钥参数生成DH公私钥，以及根据DH公钥(
k8s ssl 漏洞修复魏无羡 kubernetes ssl 容器
针对Kubernetes集群中SSL/TLS协议信息泄露漏洞（CVE-2016-2183）的修复，需重点修改涉及弱加密算法的组件配置。以下是具体修复步骤及验证方法：一、漏洞修复步骤1.修复etcd服务修改配置文件：编辑/etc/kubernetes/manifests/etcd.yaml，在command段添加以下参数禁用弱加密算法：---cipher-suites=TLS_ECDHE_RSA_W
maven插件学习(maven-shade-plugin和maven-antrun-plugin插件) catcher92 java maven maven 学习大数据
整合spark3.3.x和hive2.1.1-cdh6.3.2碰到个问题，就是spark官方支持的hive是2.3.x，但是cdh中的hive确是2.1.x的，项目中又计划用spark-thrift-server，导致编译过程中有部分报错。其中OperationLog这个类在hive2.3中新增加了几个方法，导致编译报错。这个时候有两种解决办法：修改spark源码，注释掉调用OperationLo
加密套件以及ECDH 追梦-北极星 Wifi linux
1、加密套件：密码，算法以及安全设置http://wemedia.ifeng.com/30498593/wemedia.shtml2、ECDH密钥协商算法ECDH密钥协商算法-OrcHome3、ecdh的原理https://www.cnblogs.com/fishou/p/4206451.htmlECDH:ECC算法用途比RSA还猛，不仅可以加解密、签名验证。还可以与DH结合使用，用于密钥磋商，这
Flink--初识 DataStream Connector Kafka XK&RM Flink flink kafka scala
目录1.增加POM文件2.使用Kafka作为Source2.1创建Topic2.2Code3.使用Kafka作为Sink3.1CodeFlink作为比较适合流式处理的计算框架，在流式处理当中，比较搭配的消息中间件为Kafka本次使用的Kafka版本为2.1.0-cdh6.2.0Flink版本为1.11.2，Scala版本为2.12.10官网FlinkprovidesanApacheKafkacon
架构第二十九章：haproxy 琴剑诗酒架构
1、下载安装Haproxy1.1、下载下载地址：https://src.fedoraproject.org/repo/pkgs/haproxy/1.2、安装将下载的安装包上传至服务器。tar-xvfhaproxy-2.6.6.tar.gzcdhaproxy-2.6.6makeTARGET=linux31#centos7.x是linux31、centos6.x是linux26sudomakeinst
CDH+Kylin三部曲之三：Kylin官方demo 2401_89740692 kylin 大数据
《CDH+Kylin三部曲之二：部署和设置》：完成CDH和Kylin部署，并在管理页面做好相关的设置；现在Hadoop、Kylin都就绪了，接下来实践Kylin的官方demo；Yarn参数设置Yarn的内存参数设置之后一定要重启Yarn使之生效，否则Kylin提交的任务是会由于资源限制而无法执行；关于Kylin官方demo下图是官方demo的脚本的一部分(create_sample_tables.
Hadoop1.0和2.0的主要区别 web_15534274656 java hadoop 大数据 hdfs dubbo java-zookeeper
Hadoop1.0指的是版本为ApacheHadoop0.20.x、1.x或者CDH3系列的Hadoop，组件主要由HDFS和MapReduce两个系统组成，HDFS是一个分布式文件存储系统，MapReduce是一个离线处理框架，分为三部分，运行时环境为JobTracker和TaskTracker，编程模型为Map映射和Reduce规约，数据处理引擎为MapTask和ReduceTask，Hado
CDH/HDP国产替换之路 yumgpkpm hadoop hive hbase hdfs
哪些用户需要迁移原社区版用户社区版不再更新Cloudera(Cloudera和Hortonworks合并后)所有产品不再提供社区版，用户无法获取新的功能。社区版不再免费2021年1月31日开始，所有Cloudera软件都需要有效的订阅，且订阅费昂贵（50个节点，一年订阅费50万美元）。原企业版用户企业版不再更新Cloudera和Hortonworks合并后推出了新一代大数据平台CDP，CDH6和H
为什么我的CDH不用Hue，改用Scriptis了？兔子那么可爱大数据 UI 开源数据分析中间件
理性谈谈Hue的优缺点平时做数据开发用的比较多的是CDH的Hue，Hue提供了对接Hadoop平台的UI界面，可以对Hbase数据进行直接操作，执行Mapreducer任务时有可视化的执行界面，进行数据报表和Oozie定时任务，可以说还是非常的方便的。但是用久了就会发现Hue也有许多痛点。数据表不能直接方便地导出Excel，降低了工作效率UDF和函数支持较差，没有自带的数据分析常用UDF函数库，也
CDH角色迁移和硬盘扩容专注大数据的Lyer java 大数据 hadoop hive hdfs
1.概述生产CDH集群硬盘不足，HDFSdatanode节点数据不平衡，历史管理角色安装混乱，全部节点需要硬盘扩容。迁移要求HDFS数据不丢失Hive元数据不丢失无临时过渡服务器不能影响用户计算使用CDH5.11.0只能使用centos6.5-6.9x版本大数据组件角色迁移ClouderaManagementService服务迁移服务器由物理机全部改造为虚拟机主节点不迁移角色迁移2.迁移整个迁移的
SpringBoot+Implala常见问题：[Cloudera][ImpalaJDBCDriver](500605) 错误平凡君笔记 Hive Impala SpringBoot
问题描述Causedby:java.sql.SQLException:[Cloudera]ImpalaJDBCDriver问题分析：当CDH机器配置了LDAP验证的时候，Dbeaver或者其他链接工具或者java代码链接impala时，需要在impala链接Url后添加AuthMech=3属性Cloudera官网文档里也说明了这件事https://docs.cloudera.com/documen
一次bilibili的漏洞扫描完全之人技巧安全
拿到bilibili的shell，到时为所欲为，嘿嘿嘿。nmap命令：nmap-Obilibili.com；没。nmap-A-T4bilibili.com；有！以下是对该SSL/TLS扫描结果的深技术分析及安全加固建议：1.协议与加密套件分析观察结果markdown复制-协议版本:TLSv1.2(100%)-支持加密套件:*ECDHE-RSA-AES256-GCM-SHA384(前向保密)*DHE
kylin linux 安装教程,Apache Kylin | 安装指南社本 kylin linux 安装教程
软件要求Hadoop:2.7+Hive:0.13-1.2.1+HBase:1.1+Spark2.1.1+JDK:1.7+OS:Linuxonly,CentOS6.5+orUbuntu16.0.4+用HortonworksHDP2.2-2.6,ClouderaCDH5.7-5.11,AWSEMR5.7-5.10,AzureHDInsight3.5-3.6进行测试。出于试用和开发的目的，我们建议您使用
hbase无法建表：org.apache.hadoop.hbase.PleaseHoldException: Master is initializing magicchu CDH HBASE 大数据
1.环境：cdh6.2.12.现象：hbaseshell进去后，list命令执行正常，执行建表语句后报错：ERROR:org.apache.hadoop.hbase.PleaseHoldException:Masterisinitializing提示master正在初始化中，查看master日志：WARNorg.apache.hadoop.hbase.master.HMaster:hbase:na
CDH_6.3.2的搭建我的K8409 Flink linux 大数据分布式
一站式搭建大数据的应用1、前提条件和准备工作hostnamectlset-hostnamecdh01hostnamectlset-hostnamecdh02hostnamectlset-hostnamecdh032、修改IP和Host映射关系（所有节点）在window中也配置一下vim/etc/hosts192.168.92.201cdh01192.168.92.202cdh02192.168.9
spark2如何集成到cdh里蘑菇丁经验 hadoop 大数据+机器学习+oracle
最近做性能测试需要spark2测试下和spark1.6性能有多大差别，官方文档里写着可以集成，但是自己怎么搞都不行，折磨了3天的时间，目前终于把spark2集成到集群里了我安装的是最新版本的下载spark2安装包wgethttp://archive.cloudera.com/beta/spark2/parcels/latest/SPARK2-2.0.0.cloudera.beta2-1.cdh5.
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他