留不住斜阳

Hadoop概述

第1章大数据概论

1.1 大数据概念

大数据（BigData）：指无法在一定时间范围内用常规软件工具进行处理的数据集合，需要新处理模式才具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。

主要解决海量数据存储和海量数据的分析计算问题。

按顺序给出数据存储单位：bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB

1.2 大数据特点（4V）

1.2.1 Volume（大量）

大数据的体量非常大，PB级别将是常态，且增长速度较快。

据IDC于2018年11月发布的《数据时代2025》报告预测，全球数据总量将从2018年的33ZB增至2025年的175ZB，相当于每天产生491EB的数据。

1.2.2 Velocity（高速）

这是大数据区分于传统数据挖掘最显著的特征。大数据与海量数据的重要区别在两方面：一方面，数据的增长速度快；另一方面，大数据对处理数据的响应速度有更严格的要求。例如，实时分析场景下，对延迟有更低要求。数据的增长速度和处理速度是大数据高速性的重要体现。

1.2.3 Variety（多样）

多样性主要体现在数据来源多、数据类型多和数据之间关联性强这三个方面。
① 数据来源多，互联网和物联网的发展，带来了诸如社交网站、传感器等多种来源的数据。而由于数据来源于不同的应用系统和不同的设备，决定了大数据形式的多样性。

② 数据类型多，并且以非结构化数据为主。大数据中有70％-85％的数据是如图片、音频、视频、网络日志、链接信息等非结构化和半结构化的数据。

③ 数据之间关联性强，频繁交互，如游客在旅游途中上传的照片和日志，就与游客的位置、行程等信息有很强的关联性。

1.2.4 Value（低价值密度）

大数据背后潜藏的价值巨大。由于大数据中有价值的数据所占比例很小，而大数据真正的价值体现在从大量不相关的各种类型的数据中。挖掘出对未来趋势与模式预测分析有价值的数据，并通过机器学习、人工智能方法或数据挖掘方法深度分析，并运用于农业、金融、医疗等各个领域，以期创造更大的价值。

1.3 大数据应用场景

物流仓储：大数据分析系统助力商家精细化运营、提升销量、节约成本。
零售：分析用户消费习惯，为用户购买商品提供方便，从而提升商品销量，例如，啤酒和尿不湿故事。
旅游：深度结合大数据能力与旅游业需求，共建旅游产业智慧管理、智慧服务和智慧营销的未来。
商品广告推荐：给用户推荐可能喜欢的商品。
保险：数据挖掘与风险预测，助力保险行业精准营销，提升精细化与定价能力。
金融：多维度体现用户特征，帮助金融机构推荐优质客户，防范欺诈风险。
房产：大数据全面助力房地产行业，打造精准投策与营销，选出更合适的地，建造更合适的楼，卖给更合适的人。
人工智能：大数据为人工智能提供数据支持。

第2章从Hadoop框架讨论大数据生态

2.1 Hadoop是什么

Hadoop是一个由Apache基金会所开发的分布式系统基础架构；
主要解决海量数据的存储和分析计算问题；
广义上来说，Hadoop通常是指一个更广泛的概念-Hadoop生态圈；

2.2 Hadoop发展历史

Lucene框架是Doug Cutting开发的开源软件，用Java书写代码，实现与Google类似的全文检索功能，它提供了全文检索引擎的架构，包括完整的查询引擎和搜索引擎。
2001年年底Lucene称为Apache基金会的一个子项目。
对于海量数据场景，Lucene面对与Google同样的困难，存储数据难，检索速度慢。
学习和模仿Google解决这些问题的办法：微型版Nutch；
可以说Google是Hadoop的思想之源(Google在大数据方面的三篇论文)：GFS—>HDFS; MapReduce—>MR; BigTable—>HBase;
2003-2004年，Google公开了部分GFS和MapReduce思想的细节，以此为基础Goug Cutting等人用2年业余时间实现了DFS和MapReduce机制，使Nutch性能飙升；
2005年Hadoop作为Lucene的子项目Nutch的一部分正式引入Apache基金会；
2006年3月，MapReduce和Nutch Distributed File System(NDFS)分别被纳入到Hadoop项目中，Hadoop就此正式诞生，标志着大数据时代来临。
名字来源于Doug Cutting儿子的玩具大象。

2.3 Hadoop三大发行版本

Hadoop三大发行版本：Apache、Cloudera、Hortonworks。

Apache版本最原始（最基础）的版本，对于入门学习最好。
Cloudera在大型互联网企业中用的较多。
Hortonworks文档较好。

Apache Hadoop
官网地址：http://hadoop.apache.org/releases.html
下载地址：https://archive.apache.org/dist/hadoop/common/

Cloudera Hadoop
官网地址：https://www.cloudera.com/downloads/cdh/5-10-0.html
下载地址：http://archive-primary.cloudera.com/cdh5/cdh/5/

(1) 2008年成立的Cloudera是最早将Hadoop商用的公司，为合作伙伴提供Hadoop的商用解决方案，主要是包括支持、咨询服务、培训。
(2) 2009年Hadoop的创始人Doug Cutting也加盟Cloudera公司。Cloudera产品主要为CDH，Cloudera Manager，Cloudera Support
(3) CDH是Cloudera的Hadoop发行版，完全开源，比Apache Hadoop在兼容性，安全性，稳定性上有所增强。
(4) Cloudera Manager是集群的软件分发及管理监控平台，可以在几个小时内部署好一个Hadoop集群，并对集群的节点及服务进行实时监控。Cloudera Support即是对Hadoop的技术支持。
(5) Cloudera的标价为每年每个节点4000美元。Cloudera开发并贡献了可实时处理大数据的Impala项目。

Hortonworks Hadoop
官网地址：https://hortonworks.com/products/data-center/hdp/
下载地址：https://hortonworks.com/downloads/#data-platform

(1) 2011年成立的Hortonworks是雅虎与硅谷风投公司Benchmark Capital合资组建。
(2) 公司成立之初就吸纳了大约25名至30名专门研究Hadoop的雅虎工程师，上述工程师均在2005年开始协助雅虎开发Hadoop，贡献了Hadoop 80%的代码。
(3) 雅虎工程副总裁、雅虎Hadoop开发团队负责人Eric Baldeschwieler出任Hortonworks的首席执行官。
(4) Hortonworks的主打产品是Hortonworks Data Platform（HDP），也同样是100%开源的产品，HDP除常见的项目外还包括了Ambari，一款开源的安装和管理系统。
(5) HCatalog，一个元数据管理系统，HCatalog现已集成到Facebook开源的Hive中。Hortonworks的Stinger开创性的极大的优化了Hive项目。Hortonworks为入门提供了一个非常好的，易于使用的沙盒。
(6) Hortonworks开发了很多增强特性并提交至核心主干，这使得Apache Hadoop能够在包括Window Server和Windows Azure在内的Microsoft Windows平台上本地运行。定价以集群为基础，每10个节点每年为12500美元。

2.4 Hadoop的优势（4高）

高扩展性：Hadoop是一个高度可扩展的存储平台，它可以存储和分发跨越数百个并行操作的廉价的服务器集群。不同于传统的关系型数据库不能扩展到处理大量的数据，Hadoop是能给企业提供涉及成百上千TB的数据节点上运行的应用程序。
高效率：在MapReduce的思想下，Hadoop是并行工作的，以加快任务处理速度。
可靠性：Hadoop自动维护多份数据副本，假设计算任务失败，Hadoop能够针对失败的节点重新分配处理任务。
高容错性：Hadoop的一个关键优势就是容错能力强，当数据被发送到一个单独的节点，该数据也被复制到集群的其他节点上，这意味着故障发生时，存在另一个副本可供使用。

2.5 Hadoop组成（面试重点）

2.5.1 HDFS架构概述

HDFS（Hadoop Distributed File System）的架构概述，如图所示。

HDFS架构主要由四个部分组成，分别为HDFS Client、NameNode、DataNode和Secondary NameNode。

2.5.2 YARN架构概述

YARN架构概述，如图所示。

2.5.3 MapReduce架构概述

MapReduce将计算过程分为两个阶段：Map和Reduce，
(1) Map阶段并行处理输入数据
(2) Reduce阶段对Map结果进行汇总

2.6 大数据技术生态体系

大数据技术生态体系如图所示。

图中涉及的技术名词解释如下：
(1) Sqoop一款开源的工具，主要用于在Hadoop、Hive与传统的数据库(MySQL)进行数据的传递，可以将一个关系型数据库（MySQL，Oracle等）中的数据导进到Hadoop的HDFS中，也可以将HDFS的数据导进到关系型数据库中。
(2) Flume：Cloudera提供的一个高可靠的，分布式的海量日志采集、聚合和传输的系统，Flume支持在日志系统中定制各类数据发送方，用于收集数据；同时，Flume提供对数据进行简单处理，并写到各种数据接受方（可定制）的能力。
(3) Kafka：一种高吞吐量的分布式发布订阅消息系统
(4) Storm：Storm用于“连续计算”，对数据流做连续查询，在计算时就将结果以流的形式输出给用户。
(5) Spark：Spark是当前最流行的开源大数据内存计算框架。可以基于Hadoop上存储的大数据进行计算。
(6) Oozie：Oozie是一个管理Hdoop作业（job）的工作流程调度管理系统。
(7) Hbase：HBase是一个分布式的、面向列的开源数据库。HBase不同于一般的关系数据库，它是一个适合于非结构化数据存储的数据库。
(8) Hive：Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的SQL查询功能，可以将SQL语句转换为MapReduce任务进行运行。其优点是学习成本低，可以通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析。
(9) R语言：R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件，它是一个用于统计计算和统计制图的优秀工具。
(10) Mahout：Apache Mahout是个可扩展的机器学习和数据挖掘库。
(11) ZooKeeper：Zookeeper是Google的Chubby一个开源的实现。它是一个针对大型分布式系统的可靠协调系统，提供的功能包括：配置维护、名字服务、分布式同步、组服务等。ZooKeeper的目标就是封装好复杂易出错的关键服务，将简单易用的接口和性能高效、功能稳定的系统提供给用户。

第3章 Hadoop安装包目录结构

Hadoop-2.7.2目录结构

drwxr-xr-x. 2 test test  4096 5月  22 2017 bin
drwxr-xr-x. 3 test test  4096 5月  22 2017 etc
drwxr-xr-x. 2 test test  4096 5月  22 2017 include
drwxr-xr-x. 3 test test  4096 5月  22 2017 lib
drwxr-xr-x. 2 test test  4096 5月  22 2017 libexec
-rw-r--r--. 1 test test 15429 5月  22 2017 LICENSE.txt
-rw-r--r--. 1 test test   101 5月  22 2017 NOTICE.txt
-rw-r--r--. 1 test test  1366 5月  22 2017 README.txt
drwxr-xr-x. 2 test test  4096 5月  22 2017 sbin
drwxr-xr-x. 4 test test  4096 5月  22 2017 share

说明
(1) bin目录：Hadoop最基本的管理脚本目录，这些脚本是sbin目录下管理脚本的基础实现。用户可以直接使用这些脚本来管理和使用Hadoop
(2) etc目录：Hadoop的配置文件目录
(3) include目录：对外提供的编程库头文件（具体动态库和静态库在lib目录中），这些头文件均是用C++定义的，通常用于C++程序访问HDFS或者编写MapReduce程序。
(4) lib目录：该目录下存放的是Hadoop运行时依赖的jar包，Hadoop在执行时会把lib目录下面的jar全部加到classpath中。
(5) libexec目录：存放hadoop配置环境的一些文件，可用于配置日志输出、启动参数（比如JVM参数）等基本信息
(6) sbin目录：存放启动或停止Hadoop相关服务的脚本
(7) share目录：存放Hadoop的依赖jar包、文档、和官方案例
(8) logs目录：该目录存放的是Hadoop运行的日志，查看日志对寻找Hadoop运行错误非常有帮助。
注意：logs文件目录需要hadoop初始化之后才会自动生成。

第4章 Hadoop运行模式简介

Hadoop运行模式
(1) 本地模式：无需运行任何守护进程，所有程序都在单个JVM上执行，测试和开发时使用。
(2) 伪分布式模式：等同于完全分布式，只有一个节点。
(3) 完全分布式模式：多个节点一起运行。

第5章 Hadoop编译源码（面试重点）

5.1 前期工作准备

CentOS联网
配置CentOS能连接外网。Linux虚拟机ping www.baidu.com 是畅通的
注意：用root角色编译，减少文件夹权限出现问题
安装包准备(hadoop源码、JDK8、maven、ant 、protobuf)
(1) hadoop-3.3.1-src.tar.gz
(2) jdk-8u171-linux-x64.rpm
(3) apache-ant-1.9.16-bin.tar.gz（build工具，打包用的）
(4) apache-maven-3.6.3-bin.tar.gz
(5) protobuf-2.5.0.tar.gz（序列化的框架）
(6) cmake-3.14.5.tar.gz
(7) yarn-v1.7.0.tar.gz（网络慢，下载不下来，可手动安装）

5.2 编译环境准备

注意：所有操作必须在root用户下完成

5.2.1 安装部署JDK

(1) JDK解压、配置环境变量 JAVA_HOME和PATH

[root@hadoop101 software] # rpm -ivh jdk-8u171-linux-x64.rpm

[root@hadoop101 software]# vi /etc/profile
#JAVA_HOME：
export JAVA_HOME=/usr/java/jdk1.8.0_171-amd64
export PATH=$PATH:$JAVA_HOME/bin

[root@hadoop101 software]#source /etc/profile

(2) 验证是否部署成功

java -version

5.2.2 安装部署Maven

(1) Maven解压、配置 MAVEN_HOME和PATH

[root@hadoop101 software]# tar -zxvf apache-maven-3.6.3-bin.tar.gz -C /opt/module/

[root@hadoop101 apache-maven-3.6.3]# vi conf/settings.xml

<mirrors>
    
<mirror>
    <id>nexus-aliyunid>
    <mirrorOf>centralmirrorOf>
    <name>Nexus aliyunname>             
    <url>http://maven.aliyun.com/nexus/content/groups/publicurl>
mirror>
mirrors>

[root@hadoop101 apache-maven-3.6.3]# vi /etc/profile
#MAVEN_HOME
export MAVEN_HOME=/opt/module/apache-maven-3.6.3
export PATH=$PATH:$MAVEN_HOME/bin

[root@hadoop101 software]#source /etc/profile

(2) 验证是否部署成功

mvn -version

5.2.3 安装部署ant

(1) ant解压、配置 ANT _HOME和PATH

[root@hadoop101 software]# tar -zxvf apache-ant-1.9.16-bin.tar.gz -C /opt/module/

[root@hadoop101 apache-ant-1.9.16]# vi /etc/profile
#ANT_HOME
export ANT_HOME=/opt/module/apache-ant-1.9.16
export PATH=$PATH:$ANT_HOME/bin

[root@hadoop101 software]#source /etc/profile

(2) 验证是否部署成功

ant -version

5.2.4安装编译依赖包

(1) 安装glibc-headers、g++、gcc

[root@hadoop101 apache-ant-1.9.9]# yum install glibc-headers
[root@hadoop101 apache-ant-1.9.9]# yum install gcc gcc-c++

(2) 安装make和cmake
采用离线安装的方式
删除已安装的cmake

yum remove cmake -y

下载cmake-3.14.5

wget https://cmake.org/files/v3.14/cmake-3.14.5.tar.gz

解压后，进行配置

./configure --prefix=/usr/local/cmake

安装编译

make && make install

创建链接

ln -s /usr/local/cmake/bin/cmake /usr/bin/cmake

配置环境变量

vim /etc/profile
export CMAKE_HOME=/usr/local/cmake
export PATH=$PATH:$CMAKE_HOME/bin

使配置生效

source /etc/profile

验证是否部署成功

cmake -version

(3) 安装openssl库

[root@hadoop101 software]#yum install openssl-devel

(4) 安装 ncurses-devel库

[root@hadoop101 software]#yum install ncurses-devel

5.2.5 安装部署protobuf

(1) 解压protobuf ，进入到解压后protobuf主目录，/opt/module/protobuf-2.5.0，然后相继执行命令

[root@hadoop101 software]# tar -zxvf protobuf-2.5.0.tar.gz -C /opt/module/
[root@hadoop101 opt]# cd /opt/module/protobuf-2.5.0/

[root@hadoop101 protobuf-2.5.0]#./configure 
[root@hadoop101 protobuf-2.5.0]# make 
[root@hadoop101 protobuf-2.5.0]# make check 
[root@hadoop101 protobuf-2.5.0]# make install 
[root@hadoop101 protobuf-2.5.0]# ldconfig 

[root@hadoop101 hadoop-dist]# vi /etc/profile
#LD_LIBRARY_PATH
export LD_LIBRARY_PATH=/opt/module/protobuf-2.5.0
export PATH=$PATH:$LD_LIBRARY_PATH

[root@hadoop101 software]#source /etc/profile

(2) 验证是否部署成功

protoc --version

5.2.6 安装部署yarn

(1) 下载yarn-v1.7.0.tar.gz

https://github.com/yarnpkg/yarn/releases/download/v1.7.0/yarn-v1.7.0.tar.gz

(2) 解压安装包、配置环境变量

export PATH=$PATH:/opt/module/yarn-v1.7.0/bin

(3) 验证是否部署成功

yarn -v

5.3 编译源码

(1) 解压源码到/opt/目录

[root@hadoop101 software]# tar -zxvf hadoop-3.3.1-src.tar.gz -C /opt/

(2) 进入到hadoop源码主目录

[root@hadoop101 hadoop-3.3.1-src]# pwd
/opt/hadoop-3.3.1-src

(3) 通过maven执行编译命令

[root@hadoop101 hadoop-3.3.1-src]#mvn package -Pdist,native -DskipTests -Dtar

等待时间30分钟左右，最终成功是全部SUCCESS，如下所示。

[INFO] Reactor Summary for Apache Hadoop Main 3.3.1:
[INFO] 
[INFO] Apache Hadoop Main ................................. SUCCESS [  1.030 s]
[INFO] Apache Hadoop Build Tools .......................... SUCCESS [  1.256 s]
[INFO] Apache Hadoop Project POM .......................... SUCCESS [  1.428 s]
[INFO] Apache Hadoop Annotations .......................... SUCCESS [  2.540 s]
[INFO] Apache Hadoop Assemblies ........................... SUCCESS [  0.093 s]
[INFO] Apache Hadoop Project Dist POM ..................... SUCCESS [  1.216 s]
[INFO] Apache Hadoop Maven Plugins ........................ SUCCESS [  3.588 s]
[INFO] Apache Hadoop MiniKDC .............................. SUCCESS [  1.588 s]
[INFO] Apache Hadoop Auth ................................. SUCCESS [  4.189 s]
[INFO] Apache Hadoop Auth Examples ........................ SUCCESS [  2.209 s]
[INFO] Apache Hadoop Common ............................... SUCCESS [01:45 min]
[INFO] Apache Hadoop NFS .................................. SUCCESS [  3.716 s]
[INFO] Apache Hadoop KMS .................................. SUCCESS [  3.617 s]
[INFO] Apache Hadoop Registry ............................. SUCCESS [  4.302 s]
[INFO] Apache Hadoop Common Project ....................... SUCCESS [  0.036 s]
[INFO] Apache Hadoop HDFS Client .......................... SUCCESS [ 29.727 s]
[INFO] Apache Hadoop HDFS ................................. SUCCESS [01:30 min]
[INFO] Apache Hadoop HDFS Native Client ................... SUCCESS [  5.747 s]
[INFO] Apache Hadoop HttpFS ............................... SUCCESS [  5.463 s]
[INFO] Apache Hadoop HDFS-NFS ............................. SUCCESS [  2.853 s]
[INFO] Apache Hadoop HDFS-RBF ............................. SUCCESS [ 34.599 s]
[INFO] Apache Hadoop HDFS Project ......................... SUCCESS [  0.043 s]
[INFO] Apache Hadoop YARN ................................. SUCCESS [  0.038 s]
[INFO] Apache Hadoop YARN API ............................. SUCCESS [ 17.689 s]
[INFO] Apache Hadoop YARN Common .......................... SUCCESS [ 37.159 s]
[INFO] Apache Hadoop YARN Server .......................... SUCCESS [  0.065 s]
[INFO] Apache Hadoop YARN Server Common ................... SUCCESS [ 11.563 s]
[INFO] Apache Hadoop YARN NodeManager ..................... SUCCESS [ 39.694 s]
[INFO] Apache Hadoop YARN Web Proxy ....................... SUCCESS [  3.030 s]
[INFO] Apache Hadoop YARN ApplicationHistoryService ....... SUCCESS [  5.204 s]
[INFO] Apache Hadoop YARN Timeline Service ................ SUCCESS [  4.539 s]
[INFO] Apache Hadoop YARN ResourceManager ................. SUCCESS [ 29.506 s]
[INFO] Apache Hadoop YARN Server Tests .................... SUCCESS [  1.580 s]
[INFO] Apache Hadoop YARN Client .......................... SUCCESS [  6.155 s]
[INFO] Apache Hadoop YARN SharedCacheManager .............. SUCCESS [  2.723 s]
[INFO] Apache Hadoop YARN Timeline Plugin Storage ......... SUCCESS [  2.758 s]
[INFO] Apache Hadoop YARN TimelineService HBase Backend ... SUCCESS [  0.038 s]
[INFO] Apache Hadoop YARN TimelineService HBase Common .... SUCCESS [  4.042 s]
[INFO] Apache Hadoop YARN TimelineService HBase Client .... SUCCESS [  4.112 s]
[INFO] Apache Hadoop YARN TimelineService HBase Servers ... SUCCESS [  0.042 s]
[INFO] Apache Hadoop YARN TimelineService HBase Server 1.2  SUCCESS [  3.641 s]
[INFO] Apache Hadoop YARN TimelineService HBase tests ..... SUCCESS [  2.161 s]
[INFO] Apache Hadoop YARN Router .......................... SUCCESS [  4.146 s]
[INFO] Apache Hadoop YARN TimelineService DocumentStore ... SUCCESS [  2.776 s]
[INFO] Apache Hadoop YARN Applications .................... SUCCESS [  0.030 s]
[INFO] Apache Hadoop YARN DistributedShell ................ SUCCESS [  2.773 s]
[INFO] Apache Hadoop YARN Unmanaged Am Launcher ........... SUCCESS [  1.977 s]
[INFO] Apache Hadoop MapReduce Client ..................... SUCCESS [  0.249 s]
[INFO] Apache Hadoop MapReduce Core ....................... SUCCESS [  5.032 s]
[INFO] Apache Hadoop MapReduce Common ..................... SUCCESS [  6.925 s]
[INFO] Apache Hadoop MapReduce Shuffle .................... SUCCESS [  3.020 s]
[INFO] Apache Hadoop MapReduce App ........................ SUCCESS [  7.624 s]
[INFO] Apache Hadoop MapReduce HistoryServer .............. SUCCESS [  4.919 s]
[INFO] Apache Hadoop MapReduce JobClient .................. SUCCESS [  6.218 s]
[INFO] Apache Hadoop Mini-Cluster ......................... SUCCESS [  0.759 s]
[INFO] Apache Hadoop YARN Services ........................ SUCCESS [  0.049 s]
[INFO] Apache Hadoop YARN Services Core ................... SUCCESS [  3.108 s]
[INFO] Apache Hadoop YARN Services API .................... SUCCESS [  1.220 s]
[INFO] Apache Hadoop YARN Application Catalog ............. SUCCESS [  0.047 s]
[INFO] Apache Hadoop YARN Application Catalog Webapp ...... SUCCESS [01:51 min]
[INFO] Apache Hadoop YARN Application Catalog Docker Image  SUCCESS [  0.104 s]
[INFO] Apache Hadoop YARN Application MaWo ................ SUCCESS [  0.032 s]
[INFO] Apache Hadoop YARN Application MaWo Core ........... SUCCESS [  2.567 s]
[INFO] Apache Hadoop YARN Site ............................ SUCCESS [  0.035 s]
[INFO] Apache Hadoop YARN Registry ........................ SUCCESS [  0.496 s]
[INFO] Apache Hadoop YARN UI .............................. SUCCESS [  0.029 s]
[INFO] Apache Hadoop YARN CSI ............................. SUCCESS [ 58.278 s]
[INFO] Apache Hadoop YARN Project ......................... SUCCESS [ 14.296 s]
[INFO] Apache Hadoop MapReduce HistoryServer Plugins ...... SUCCESS [  2.343 s]
[INFO] Apache Hadoop MapReduce NativeTask ................. SUCCESS [ 25.556 s]
[INFO] Apache Hadoop MapReduce Uploader ................... SUCCESS [  1.908 s]
[INFO] Apache Hadoop MapReduce Examples ................... SUCCESS [  3.745 s]
[INFO] Apache Hadoop MapReduce ............................ SUCCESS [  4.303 s]
[INFO] Apache Hadoop MapReduce Streaming .................. SUCCESS [  9.576 s]
[INFO] Apache Hadoop Distributed Copy ..................... SUCCESS [  4.087 s]
[INFO] Apache Hadoop Client Aggregator .................... SUCCESS [  1.619 s]
[INFO] Apache Hadoop Dynamometer Workload Simulator ....... SUCCESS [  2.917 s]
[INFO] Apache Hadoop Dynamometer Cluster Simulator ........ SUCCESS [  7.487 s]
[INFO] Apache Hadoop Dynamometer Block Listing Generator .. SUCCESS [  2.654 s]
[INFO] Apache Hadoop Dynamometer Dist ..................... SUCCESS [  6.977 s]
[INFO] Apache Hadoop Dynamometer .......................... SUCCESS [  0.031 s]
[INFO] Apache Hadoop Archives ............................. SUCCESS [  2.317 s]
[INFO] Apache Hadoop Archive Logs ......................... SUCCESS [  1.940 s]
[INFO] Apache Hadoop Rumen ................................ SUCCESS [  4.180 s]
[INFO] Apache Hadoop Gridmix .............................. SUCCESS [  3.342 s]
[INFO] Apache Hadoop Data Join ............................ SUCCESS [  2.309 s]
[INFO] Apache Hadoop Extras ............................... SUCCESS [  2.092 s]
[INFO] Apache Hadoop Pipes ................................ SUCCESS [  5.797 s]
[INFO] Apache Hadoop OpenStack support .................... SUCCESS [  3.129 s]
[INFO] Apache Hadoop Amazon Web Services support .......... SUCCESS [ 44.618 s]
[INFO] Apache Hadoop Kafka Library support ................ SUCCESS [ 11.525 s]
[INFO] Apache Hadoop Azure support ........................ SUCCESS [ 14.468 s]
[INFO] Apache Hadoop Aliyun OSS support ................... SUCCESS [ 17.768 s]
[INFO] Apache Hadoop Scheduler Load Simulator ............. SUCCESS [  4.359 s]
[INFO] Apache Hadoop Resource Estimator Service ........... SUCCESS [  6.999 s]
[INFO] Apache Hadoop Azure Data Lake support .............. SUCCESS [ 11.090 s]
[INFO] Apache Hadoop Image Generation Tool ................ SUCCESS [  2.883 s]
[INFO] Apache Hadoop Tools Dist ........................... SUCCESS [ 14.856 s]
[INFO] Apache Hadoop Tools ................................ SUCCESS [  0.040 s]
[INFO] Apache Hadoop Client API ........................... SUCCESS [02:12 min]
[INFO] Apache Hadoop Client Runtime ....................... SUCCESS [02:06 min]
[INFO] Apache Hadoop Client Packaging Invariants .......... SUCCESS [  2.121 s]
[INFO] Apache Hadoop Client Test Minicluster .............. SUCCESS [03:32 min]
[INFO] Apache Hadoop Client Packaging Invariants for Test . SUCCESS [  0.169 s]
[INFO] Apache Hadoop Client Packaging Integration Tests ... SUCCESS [  3.994 s]
[INFO] Apache Hadoop Distribution ......................... SUCCESS [ 43.159 s]
[INFO] Apache Hadoop Client Modules ....................... SUCCESS [  0.053 s]
[INFO] Apache Hadoop Tencent COS Support .................. SUCCESS [  7.339 s]
[INFO] Apache Hadoop Cloud Storage ........................ SUCCESS [  0.447 s]
[INFO] Apache Hadoop Cloud Storage Project ................ SUCCESS [  0.041 s]
[INFO] ------------------------------------------------------------------------
[INFO] BUILD SUCCESS
[INFO] ------------------------------------------------------------------------

(4) 编译成功的64位hadoop包在/opt/hadoop-3.3.1-src/hadoop-dist/target下

[root@hadoop101 target]# pwd
/opt/hadoop-3.3.1-src/hadoop-dist/target

注意：编译期间maven报错。可能网络阻塞问题导致依赖库下载不完整导致，多次执行命令（一次通过比较难）

[root@hadoop101 hadoop-2.7.2-src]#mvn package -Pdist,nativeN -DskipTests -Dtar

你可能感兴趣的:(Hadoop,hadoop,概述,使用场景)

上位机知识篇---SD卡&U盘镜像
常用的镜像烧录软件balenaEtcherbalenaEtcher是一个开源的、跨平台的工具，用于将操作系统镜像文件（如ISO和IMG文件）烧录到SD卡和USB驱动器中。以下是其使用方法、使用场景和使用注意事项的介绍：使用方法下载安装：根据自己的操作系统，从官方网站下载对应的安装包。Windows系统下载.exe文件后双击安装；Linux系统若下载的是.deb文件，可在终端执行“sudodpkg-
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
Java特性之设计模式【责任链模式】 Naijia_OvO Java特性 java 设计模式责任链模式
一、责任链模式概述顾名思义，责任链模式（ChainofResponsibilityPattern）为请求创建了一个接收者对象的链。这种模式给予请求的类型，对请求的发送者和接收者进行解耦。这种类型的设计模式属于行为型模式在这种模式中，通常每个接收者都包含对另一个接收者的引用。如果一个对象不能处理该请求，那么它会把相同的请求传给下一个接收者，依此类推主要解决：职责链上的处理者负责处理请求，客户只需要将
Linux操作系统磁盘管理 CZZDg linux 运维服务器
目录一.硬盘介绍1.硬盘的物理结构2.CHS编号3.磁盘存储划分4.开机流程5.要点6.磁盘存储数据的形式二.Linux文件系统1.根文件系统2.虚拟文件系统3.真文件系统4.伪文件系统三.磁盘分区与挂载1.磁盘分区方式2.分区命令3.查看与识别命令4.格式化命令5.挂载命令四.LVM逻辑卷1.概述2.管理命令五.磁盘配额1.概述usrquota:支持对用户的磁盘配额grpquota：支持对组的磁
计算机网络技术 CZZDg 计算机网络
目录一.网络概述1.网络的概念2.网络发展是3.网络的四要素4.网络功能5.网络类型6.网络协议与标准7.网络中常见的概念8.网络拓补结构二.网络模型1.分层思想2.OSI七层模型3.TCP/IP五层模型4.数据的封装与解封装过程三.IP地址1.进制转换2.IP地址定义3.IP地址组成成分4.IP地址分类5.地址划分6、相关概念一.网络概述1.网络的概念两个主机通过传输介质和通信协议实现通信和资源
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
微软 Bluetooth LE Explorer 实用工具的详细使用分析悟空胆好小 microsoft
微软BluetoothLEExplorer实用工具的详细使用分析文章目录微软**BluetoothLEExplorer**实用工具的详细使用分析1.**工具定位与核心功能**2.**关键特性与更新**3.**使用场景示例**4.**系统要求与依赖**5.**与专业工具对比**6.**局限性**7.**实践建议**结论以下是微软BluetoothLEExplorer实用工具的详细使用分析：1.工具定
matlab卷积矩阵绝对值,MATLAB矩阵分析和计算 weixin_39928736 matlab卷积矩阵绝对值
MATLAB矩阵分析和计算编辑锁定讨论上传视频本词条缺少概述图，补充相关内容使词条更完整，还能快速升级，赶紧来编辑吧！《MATLAB矩阵分析和计算》是清华大学出版社出版的一本图书。[1]书名MATLAB矩阵分析和计算作者杜树春出版社清华大学出版社出版时间2019年6月1日定价59元ISBN9787302524816印次1-1印刷日期2019.04.23MATLAB矩阵分析和计算图书内容编辑本书侧重
【unity编辑器开发与拓展EditorGUILayoyt和GUILayoyt】死也不注释 Unity编辑器开发与拓展笔记 unity 编辑器游戏引擎
EditorGUILayout与GUILayout的核心区别及使用场景详解一、对比表特性GUILayoutEditorGUILayout命名空间UnityEngineUnityEditor使用场景运行时UI+编辑器扩展仅限编辑器扩展控件风格基础游戏风格（无编辑器优化）原生Unity编辑器风格布局复杂度基础流式布局高级自动布局（带标签对齐/间距优化）序列化支持❌不支持✅直接支持SerializedP
Android 15.0 根据app包名授予app监听系统通知权限安卓兼职framework应用工程师 android 15.0 Rom定制化系列讲解 android rom framework 监听系统通知权限
1.概述在15.0的系统rom产品定制化开发中，在一些产品rom定制化开发中，系统内置的第三方app需要开启系统通知权限，然后可以在app中，监听系统所有通知，来做个通知中心的功能，所以需要授权获取系统通知的权限，然后来顺利的监听系统通知。来做系统通知的功能，接下来来实现这个功能2.根据app包名授予app监听系统通知权限的核心类packages/apps/Settings/src/com/and
Python爬虫实战：利用最新技术爬取B站直播数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 html 百度
1.B站直播数据爬取概述B站(哔哩哔哩)是中国最大的年轻人文化社区和视频平台之一，其直播业务近年来发展迅速。爬取B站直播数据可以帮助我们分析直播市场趋势、热门主播排行、观众喜好等有价值的信息。常见的B站直播数据类型包括：直播间基本信息(标题、分类、主播信息)实时观看人数与弹幕数据礼物打赏数据直播历史记录分区热门直播数据本文将重点介绍如何获取直播间基本信息和分区热门直播数据。2.环境准备与工具选择2
FPGA 设计中的 “Create HDL Wrapper“ 和 “Generating Output Products“ 的区别行者.................. fpga开发
CreateHDLWrapper(创建HDL包装器)目的：为顶层设计模块（通常是BlockDesign/IPIntegrator设计）创建一个HDL包装文件功能：将图形化/框图设计的BlockDesign转换为可综合的HDL代码（Verilog或VHDL）创建一个顶层模块，将所有IP核和连接实例化使用场景：当使用IPIntegrator创建BlockDesign后需要将图形化设计转换为HDL代码以
C++ 标准库＜numeric＞
以下对C++标准库中头文件所提供的数值算法与工具做一次系统、深入的梳理，包括算法功能、示例代码、复杂度分析及实践建议。一、概述中定义了一组对数值序列进行累加、内积、差分、扫描等操作的算法，以及部分辅助工具（如std::iota、std::gcd/std::lcm等）。所有算法均作用于迭代器区间，符合STL风格，可与任意容器或原始数组配合使用。从C++17、20起，又陆续加入了并行友好的std::r
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
《Python星球日记》第35天：全栈开发（综合项目） Code_流苏 Python星球日记编程项目实战 Python全栈开发 Django Flask 后端开发博客系统
名人说：路漫漫其修远兮，吾将上下而求索。——屈原《离骚》创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder）专栏：《Python星球日记》，限时特价订阅中ing目录一、全栈开发概述1.全栈开发的优势2.全栈开发技能组合二、博客系统项目需求分析1.功能需求2.技术栈选择3.项目结构规划三、数据库设计1.实体关系分析2.Django模型设计四、后端开发1.Django项目创建2.视图
上位机知识篇---文件系统 Atticus-Orion 上位机知识篇文件系统 windows linux FAT NTFS ext4 ZFS
文章目录前言1.FAT（FileAllocationTable）版本FAT12FAT16FAT32优势兼容性好简单轻量适合小文件存储劣势不支持大文件性能较差缺乏高级功能使用场景2.NTFS（NewTechnologyFileSystem）优势支持大文件和大分区高性能日记功能权限控制劣势兼容性差不适合嵌入式设备使用场景3.exFAT（ExtendedFileAllocationTable）优势支持大
《C++性能优化指南》 linux版代码及原理解读第一章 v俊逸 C++性能优化指南性能优化 C++性能优化性能优化
概述：目录概述：性能优化的必要性：C++代码优化策略总结用好的编译器并用好编译器使用更好的算法使用更好的库减少内存分配和复制移除计算使用更好的数据结构提高并发性优化内存管理性能优化的必要性：按照当今的CPU运行速度来说，执行一条指令所需要的时间是10的-9次方的时间单位，如此快速的执行速度是否就没有性能优化的必要了呢？其实不然，性能优化与CPU的执行速度并无非常大的关系，试想一下，一段代码，如果用
《C++性能优化指南》 linux版代码及原理解读第四章 v俊逸 C++性能优化指南性能优化 C++性能优化指南性能优化
目录概述为什么字符串很麻烦字符串是动态分配的字符串赋值背后的操作如何面对字符串会进行大量复制写时复制COW（copyonwrite）尝试优化字符串避免临时字符串通过预留存储空间减少内存分配通过传递引用减少实参复制使用迭代器操作减少循环中的比较操作减少返回值的复制还没有结束，使用字符数组代替字符串再次优化字符串尝试其他的算法叠加以前的优化方式使用其他的编译器使用其他字符串的库功能丰富的字符串库使用s
【收藏系列】Python 常用装饰器全解析 Gaffey大杂烩 python python 装饰器
Python常用装饰器全解析装饰器是Python中一个强大的特性，它允许我们在不修改原函数或类的情况下，扩展或修改其功能。本文将详细介绍几个最常用的内置装饰器。Python装饰器速查表（一句话用途）装饰器一句话作用概述@classmethod定义一个类方法，第一个参数是类本身（cls），常用于工厂函数或操作类属性。@staticmethod定义一个不依赖实例或类的工具方法，无需self或cls参数
初学者如何选购性价比国产电钢琴？指尖跃动的 C 大调电钢琴
内容概要本文专为初学者设计，系统解析选购性价比国产电钢琴的关键要点。我们将从选购指南入手，深入探讨手感还原度（如逐级重锤技术和实木琴键设计）、音质稳定性（高复音数确保不跑音）、实用功能（如耳机插孔避免扰民）及性价比策略（低价位结合零调音成本）。随后，推荐高性价比型号，例如贝琪电钢琴，并全面分析其优缺点，帮助读者明智决策。此外，常见问题部分将解答入门常见困惑。为清晰展示核心内容，下表概述文章结构：文
5G NR 物理层介绍刘孬孬沉迷学习 5G 学习笔记信息与通信信号处理
5GNR物理层介绍前言这一章孬孬整理了一下现有的NR物理层的具体内容和流程，和大家一下学习一下，希望大家多多支持，一键三连。一、概述物理层的主要功能是将高层（应用层、MAC层等）的数据转换为适合无线信道传输的信号，并在接收端恢复原始数据。其链路处理包括编码、调制、资源映射、OFDM处理等步骤，确保高效、可靠的传输。以下是物理层链路的关键步骤总结，分为发送端和接收端处理。2.发送端物理层链路处理2.
5G标准学习笔记14 - CSI--RS概述刘孬孬沉迷学习 5G 学习笔记信息与通信
5G标准学习笔记14-CSI–RS概述大家好~，这里是刘孬孬，今天带着大家一起学习一下5GNR中一个非常非常重要的参考信号------------------CSI-RS信号，CSI-RS不是持续发送，UE只能在网络明确配置了CSI-RS的情况下才能使用其进行信道测量。前言对于CSI-RS，肯定还离不开前面所说的CSI（channelstateinformation），前面也讲过CSI对于MIMO
5G标准学习笔记06-基于AI/ML波束管理刘孬孬沉迷学习 5G 学习笔记
5G标准学习笔记06-基于AI/ML波束管理前言前面对于孬孬学习了波束管理的概述，下面要进一步来看一下传统波束管理和现在3GPP中推动的AL/ML波束管理之前的区别联系。一、传统波束管理方法流程传统BM流程主要包括以下步骤：波束扫描（BeamSweeping）：gNB通过顺序发送多个窄波束（SSB或CSI-RS），覆盖整个服务区域，UE测量每个波束的信号质量（如L1-RSRP或L1-SINR）。波
5G标准学习笔记03- CSI 反馈增强概述刘孬孬沉迷学习 5G 笔记学习
5G标准学习笔记03-CSI反馈增强概述大家好，最近在研究AI/ML3gpp标准NR空口的有关内容，后面可能会给大家介绍一下对应的有关内容AI/ML在3GPP标准中的研究进展在AI/ML在NR空口的应用中，对应标准主要聚焦了3个case进行讨论研究分别是：CSI反馈增强；波束管理；定位精度增强；这三个内容可能比较涉及RAN1/2的具体内容，后面会基于这个进行一定的介绍。今天主要是主要介绍CSI反馈
Matlab裁剪降水数据：1km掩膜制作实战咋（za）说 matlab 降水数据处理裁剪掩膜制作降水数据裁剪 China_Pre
1km降水数据处理-制作数据裁剪掩膜1.数据概述2掩膜文件制作示例2.1数据准备2.2matlab掩膜制作示例代码3结语中国1km分辨率逐月降水量数据集（1901-2024）是高精度、长时间序列的气候数据产品，广泛应用于水文、生态、农业等领域的研究。本篇基于应用需要，以该数据集为输入，结合研究区shp边界文件，制作用于数据提取/裁剪的掩膜文件。下面为具体内容。1.数据概述中国1km分辨率逐
玩转Docker | 使用Docker部署HomeBox家庭库存管理工具心随_风动玩转Docker docker 容器运维
玩转Docker|使用Docker部署HomeBox家庭库存管理工具前言一、HomeBox介绍Homebox简介主要特点主要使用场景二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署HomeBox服务下载HomeBox镜像编辑部署文件创建容器检查容器状态检查服务端口安全设置四、访问HomeBox服务访问HomeBox首页注册账号五、HomeBox使用体验总结前言随着智能家居和
深入解析TCP：可靠传输的核心机制与实现逻辑 Gappsong874 网络 tcp/ip 网络协议 web安全网络安全大数据
TCP协议概述TCP（TransmissionControlProtocol）是一种面向连接的、可靠的传输层协议。它通过一系列机制确保数据准确、有序地从发送方传递到接收方，适用于对可靠性要求高的场景（如网页浏览、文件传输）。可靠传输的核心机制三次握手建立连接TCP通过三次握手（Three-WayHandshake）初始化连接，确保双方具备收发能力：SYN：客户端发送SYN=1和随机序列号seq=x
【Kafka专栏 13】Kafka的消息确认机制：不是所有的“收到”都叫“确认”！
作者名称：夏之以寒作者简介：专注于Java和大数据领域，致力于探索技术的边界，分享前沿的实践和洞见文章专栏：夏之以寒-kafka专栏专栏介绍：本专栏旨在以浅显易懂的方式介绍Kafka的基本概念、核心组件和使用场景，一步步构建起消息队列和流处理的知识体系，无论是对分布式系统感兴趣，还是准备在大数据领域迈出第一步，本专栏都提供所需的一切资源、指导，以及相关面试题，立刻免费订阅，开启Kafka学习之旅！
C#基础-区分数组与集合 yi碗汤园 C#开发语言 c#前端
目录区分数组与集合1.定义1）数组2）集合2.大小1）数组2）集合3.访问速度1）数组2）集合4.内存管理1）数组2）集合5.使用场景1）数组2）集合总结本篇文章来学习一下C#的数组（Array）与集合（Collection），数组和集合是两种常用的数据结构，均为引用类型，下面通过定义、大小、访问速度等方面比较数组和集合的不同，来进一步加深对它们的理解。区分数组与集合1.定义1）数组①数组是固定大
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin

Hadoop概述

第1章 大数据概论

1.1 大数据概念

1.2 大数据特点（4V）

1.2.1 Volume（大量）

1.2.2 Velocity（高速）

1.2.3 Variety（多样）

1.2.4 Value（低价值密度）

1.3 大数据应用场景

第2章 从Hadoop框架讨论大数据生态

2.1 Hadoop是什么

2.2 Hadoop发展历史

2.3 Hadoop三大发行版本

2.4 Hadoop的优势（4高）

2.5 Hadoop组成（面试重点）

2.5.1 HDFS架构概述

2.5.2 YARN架构概述

2.5.3 MapReduce架构概述

2.6 大数据技术生态体系

第3章 Hadoop安装包目录结构

第4章 Hadoop运行模式简介

第5章 Hadoop编译源码（面试重点）

5.1 前期工作准备

5.2 编译环境准备

5.2.1 安装部署JDK

5.2.2 安装部署Maven

5.2.3 安装部署ant

5.2.4安装编译依赖包

5.2.5 安装部署protobuf

5.2.6 安装部署yarn

5.3 编译源码

你可能感兴趣的:(Hadoop,hadoop,概述,使用场景)

第1章大数据概论

第2章从Hadoop框架讨论大数据生态