E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop相关
玩转大数据计算之Hadoop
Hadoop官方文档提供了3种安装模式:单机安装:Hadoop所有服务都在一个JVM进程运行单机伪分布式安装:Hadoop服务都在一台机器上每个独立JVM进程运行完全分布式安装:在多个物理机或虚拟机分别安装
Hadoop
pptb
·
2020-07-12 03:32
基于Kafka+SparkStreaming+HBase实时点击流案例
,记录下自己的工作和学习路程,希望能跟大家互相交流成长本文章更倾向于实战案例,涉及框架原理及基本应用还请读者自行阅读相关文章,相关在本文章最后参考资料中关于Zookeeper/Kafka/HBase/
Hadoop
MichaelFly
·
2020-07-11 13:31
azkaban web-server源码解析
注:请先看azkaban官方文档,然后安装好azkaban-web-server并熟悉使用流程后,再往下看一、概述azkaban主要用于
hadoop相关
job任务的调度,但也可以应用任何需要调度管理的任务
盖世天才
·
2020-07-11 06:52
大数据
hadoop集群搭建四 hadoop高可用集群的安装
基本安装配置该项操作均在集群用户admin下进行,只在一台主机上进行操作其他的主机进行同步安装与步骤#mkdir~/hadoop#cdhadoop#tar-xzf~/setups/hadoop-2.7.3.tar.gz配置
hadoop
离人散
·
2020-07-10 00:46
Hadoop相关
技术点
MapReduceMR流程shuffle机制MR调优全排序推荐书籍:《Hadoop权威指南》YARN调度原理流程资源调度器资源隔离机制RM高可用推荐书籍:《Hadoop权威指南》HDFS通信框架(RPC)第一、第二关系管理读写流程(源码)NN高可用脑裂相约管理联邦机制推荐书籍:《HDFS源码解析》HBase数据模型架构组成读写流程建表优化布隆过滤器协处理器HBase优化设计推荐书籍:《HBase原
点点滴滴的记录
·
2020-07-09 21:16
MapReduce
YARN
HDFS
HBase
Hive
如何合理设置
hadoop相关
组件的jvm Xmx
1.这个问题不是很简单么?直接设置不久好了,java-Xmx2000m像这样不就好了。No,我说的不仅仅是这个问题,比如,你看到/usr/local/bigdata/jdk/bin/java-Xmx2048m-Djava.net.preferIPv4Stack=true-Dhadoop.log.dir=/usr/local/bigdata/hadoop/logs-Dhadoop.log.file=
梅降雪
·
2020-07-09 19:02
hadoop
大数据相关知识点
hadoop相关
试题1、MapTask并行机度是由什么决定的?由切片数量决定的。2、MR是干什么的?MR将用户编写的业务逻辑代码和自带的默认组件结合起来组成一个完整的分布式应用程序
Mr.WiG
·
2020-07-08 19:21
大数据知识点梳理
Hadoop启动顺序 | jps对应进程 | hadoop | zookeeper | hbase | spark
Hadoop启动hadoop集群后,可以通过jps命令显示当前所有java进程pid的命令,也就显示了所有与
Hadoop相关
的进程。
stone_fall
·
2020-07-08 06:04
hdfs
java实现hadoopRPC协议,模拟namenode和datanode的通信
RPC是hadoop中提供的框架,所以如果自己设计一个RPC框架,必须要引入
hadoop相关
的依赖。二、原理简介RPC作用和RMI(remotemethodi
moshang_3377
·
2020-07-07 17:48
hadoop
java
zookeeper 分布式锁服务
zookeeper是hadoop下面的一个子项目,用来协调跟
hadoop相关
的一些分布式的框架,如hadoop,hive,pig等,其实他们都是动物,所以叫z
weixin_33830216
·
2020-07-06 19:12
开源大数据,
Hadoop相关
的工具有哪些
1.HadoopApache的Hadoop项目已几乎与大数据划上了等号。它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算。支持的操作系统:Windows、Linux和OSX。相关链接:http://hadoop.apache.org2.Ambari作为Hadoop生态系统的一部分,这个Apache项目提供了基于Web的直观界面,可用于配置、管理和监控Hadoop集群。
人工智能爱好者
·
2020-07-06 12:36
大数据
Hadoop解决两个问题
Hadoop解决两个问题海量数据的存储--HDFS海量数据的分析--MapReduceHadoop=TheHadoopprojects和
Hadoop相关
的一些项目Common,Avro,MapReduce
wuyanlinwangli
·
2020-07-06 08:02
Hadoop
Hadoop相关
文档
Hadoop(HDFS)HDFS产出背景:随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。HDFS定义:HDFS,它是一个文件系统,用于存储文件,通过目录树来定位文件;其次,它是分布式的,由很多服务器联合起来实现其功能,集群中的
「已注销」
·
2020-07-05 10:07
大数据面试题个人整理(一)
大数据面试题个人整理(一)
Hadoop相关
试题1、MapTask并行机度是由什么决定的?由切片数量决定2、MR是干什么的?
如何释然╰╮
·
2020-07-05 09:15
大数据
面试
[大数据]Hadoop大数据开发基础----环境配置(一)
大数据的概念就不在此赘述了,自己看书了解一下~下面说一下Hadoop集群的搭建及配置1.
Hadoop相关
软件及版本软件版本备注LinuxOsCentOS6.864位JDK1.7+64位VMware14pro
qq_36563021
·
2020-07-05 06:40
Hadoop之HDFS文件操作Java实现
新建一个Java工程导入
hadoop相关
包,具体为hadoop/share/common/lib、hadoop/share/common/hadoop-common-2.6.1.jar、hadoop/share
DataSheep
·
2020-07-05 06:10
Hadoop
大数据
国内
Hadoop相关
的开源项目
1、BC-Hadoop:中国移动Hadoop工具链打包https://github.com/cmri/bc-hadoop2.0孵化阶段,将成为一个通用的开源Hadoop平台2、BC-BSP:中国移动图计算平台https://github.com/cmri/BC-BSP孵化阶段,将成为通用的开源BSP平台3、小米Minos:部署和管理Hadoop生态链工具Minosisadistributeddep
weixin_30485291
·
2020-07-04 02:58
spark、hadoop大数据计算面试题汇总
utm_content=g_1000084791
Hadoop相关
试题Hive相关试题hive表关联查询,如何解决数据倾斜的问题?
灰二和杉菜
·
2020-07-02 15:58
HDFS配置Kerberos认证
HDFS配置Kerberos认证2014.11.04本文主要记录CDHHadoop集群上配置HDFS集成Kerberos的过程,包括Kerberos的安装和
Hadoop相关
配置修改说明。
wulantian
·
2020-06-29 21:30
hadoop
hadoop面试问题
Hadoop相关
试题Hive相关试题1、hive表关联查询,如何解决数据倾斜的问题?
原来是阿付
·
2020-06-29 04:47
Flume的简介、原理与安装
1、前言flume是由cloudera软件公司产出的可分布式日志收集系统,后与2009年被捐赠了apache软件基金会,为
hadoop相关
组件之一。
俊杰梓
·
2020-06-28 19:11
Flume
看完肯定会系列之——CentOS7下安装和配置Hadoop以及Hadoop集群
文章目录一、事前准备1、CentOS虚拟机2、虚拟机安装好JDK3、
Hadoop相关
压缩包(包含Zookeeper、HBase、Hive,本篇文章只下载Hadoop即可)二、一些事前配置1、关闭防火墙2
日写BUG八百行
·
2020-06-27 20:43
看完肯定会
hadoop
linux
centos
MapReduce工作原理图文详解
MapReduce工作原理图文详解前言:前段时间我们云计算团队一起学习了
hadoop相关
的知识,大家都积极地做了、学了很多东西,收获颇丰。可是开学后,大家都忙各自的事情,云计算方面的动静都不太大。
weixiaolu123
·
2020-06-27 15:28
hadoop
hadoop伪分布式环境搭建
前言:由于博主之前没有从事过
hadoop相关
的开发工作,最近正好遇到一个
hadoop相关
的项目,于是决定自学研究一下,博主整理的东西绝对是最全最详细的,不要问为什么,因为博主为了搭建hadoop环境几乎以及把网上所有的教程都看了一遍
会说话的丶猫
·
2020-06-27 10:00
Centos7下安装Cloudera Manager以及Hadoop
安装HadoopCM安装前准备系统设置安装CM安装CDH-
HADOOP相关
页面安装Hadoop(CM)警告:在执行以下命令时,如果出现ssh相关命令(此处只记录了一次),则需要在操作机器上向每台机器都发起一次
胖蚂蚁_alleyz
·
2020-06-26 21:52
hadoop
Flume实现读取文件
一、需求分析二、上传jar包因为本案例要读到hdfs里,所以,就要
hadoop相关
jar包支持。
student__software
·
2020-06-26 15:15
大数据学习
大数据生态技术
大数据013——Flume
1.Flume简介Flume是由Cloudera软件公司提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,后与2009年被捐赠了apache软件基金会,为
hadoop相关
组件之一。
JankoWilliam
·
2020-06-26 11:21
大数据
Flulme
大数据面试题及答案
Hadoop相关
试题Hive相关试题1、hive表关联查询,如何解决数据倾斜的问题?
_Jack_LI
·
2020-06-25 23:35
大数据
大数据题
Flume实时监控Hive输出的日志信息并且读取吧到Hdfs文件系统
第一步:既然Flume想要输出数据到Hdfs文件系统,必然会依赖
Hadoop相关
的jar包,所以我们首先把Flume依赖的jar包导入flume安装目录下的lib
Now-just-do-it
·
2020-06-25 13:52
Hive
字节跳动C++研发实习生
一面(1h30min)一开始看了我的简历里有关于hadoop的项目经历,所以一开是问了
hadoop相关
的问题1问:先介绍以下hadoop的简单原理答:map从hdfs获取数据,处理成键值对,然后可以经过
UpUper2019
·
2020-06-25 13:30
hadoop、spark各大数据组件介绍
hadoop相关
组件hadoop体系结构,如图:hadoop核心设计,如图HadoopCommonHadoop体系最底层的一个模块,为Hadoop各子项目提供各种工具,如:配置文件和日志操作等。
戰士
·
2020-06-25 11:23
架构
基础知识
我的大数据之路 - Flume 案例:监听上传Hive日志文件到HDFS
目录Goal:监听上传Hive日志文件到HDFSHow:1.拷贝
Hadoop相关
jar到Flume的lib目录下:2.创建flume-hive-hdfs.conf文件:3.开启你的集群然后执行监控配置:
有一个码农,他叫封子
·
2020-06-25 03:31
大数据
Hadoop分布式集群环境搭建
本文将介绍
Hadoop相关
的技术框架以及搭建Hadoop平台的详细过程。avatar文章概览Ha
小生很忙
·
2020-06-24 17:54
hadoop学习笔记之一:初识hadoop
引言最近了解到淘宝使用hadoop的项目多了起来,hadoop对于许多测试人员来说或许是个新鲜玩儿,因此,把自己之前整理的学习笔记整理发上来,希望通过此系列文章快速了解Hadoop的基本概念和架构原理,从而助于
hadoop
liuxinglanyue
·
2020-06-24 07:04
Hadoop
Flume概念与原理、与Kafka优势对比
blog.csdn.net/gyshun/article/details/797105341.背景flume是由cloudera软件公司产出的可分布式日志收集系统,后与2009年被捐赠了apache软件基金会,为
hadoop
吃鱼的羊
·
2020-06-23 13:28
Kafka
简单介绍Hadoop实操
Hadoop实操这是Fayson创建的学习交流的公众号,包含非常多优质
hadoop相关
的文章.新的一年希望自己能够好好学习Hadoop实操里的所有内容,并整理出对应的文档,整理对应的blog.加油!
天南第一剑修
·
2020-06-23 12:27
Hadoop实操系列
大数据
spark分布式大数据计算7一spark和pyspark的安装和启动
本文参考自:https://blog.csdn.net/ouyangyanlan/article/details/52355350原文中有
Hadoop相关
内容,我这边没有使用相关功能,于是忽略Hadoop
小茹_1107
·
2020-06-23 09:44
spark
爬虫学习之1:初试scrapy:爬取应届生求职网招聘信息
下面直接贴过程:一、安装Scrapy本来在Linux比较方便,但我电脑里的Ubuntu由于搭建了很多
Hadoop相关
的东西
cskywit
·
2020-06-23 01:32
Python
基于Hadoop海量日志的入侵检测技术
基于Hadoop海量日志的入侵检测技术
Hadoop相关
技术Web日志基于Hadoop海量日志的入侵检测算法基于Hadoop量日志的入侵检测系统的实现Hadoop简介Hadoop是一个项目的总称,是开源实现的谷歌的集群系统
listone_sec
·
2020-06-23 00:58
入侵检测
大数据运维文档
大数据运维文档一
hadoop相关
运维1系统环境由于机器安装时,硬盘挂在不同,所以hadoop安装路径可能不同。默认
hadoop相关
集群项目路径在/app目录下。
ciqingloveless
·
2020-06-22 23:17
hadoop
京东大数据平台进化之路
导读时下大数据技术趋于成熟与稳定的今天,
hadoop相关
服务也不再高高在上,已是作为如同数据库般的作为基础软件设施提供计算与存储服务,京东大数据平台从无到有,从量到质,从微创到革新经历五年的时间,集群规模一步步
Hadoop技术博文
·
2020-06-22 16:09
org.apache.hadoop.ipc.RemoteException(java.io.IOException)异常
最近在调试flink程序时,发现程序起不来,查看错误日志和
hadoop相关
,我的程序与
hadoop相关
的只有设置了checkpoint的路径是hdfs的一个目录路径。
沧海笑007
·
2020-06-22 09:36
Hadoop
Flume之HDFS Sink使用案例
CentOS7Java版本:1.8.0_221Flume版本:1.8.0HDFS版本:2.7.7Flumeagent配置:NetcatTCPSource、MemoryChannel、HDFSSink具体步骤a)拷贝
Hadoop
TomAndersen
·
2020-06-22 06:28
Flume
Hadoop
flume介绍与原理(一)
1.背景flume是由cloudera软件公司产出的可分布式日志收集系统,后与2009年被捐赠了apache软件基金会,为
hadoop相关
组件之一。
weixin_33958585
·
2020-06-21 11:41
大数据平台搭建(一):虚拟机环境配置
前言 最近看了些
hadoop相关
的资料,然后想自己从零开始搭建一个大数据平台。
闹闹的BaBa
·
2020-06-21 08:58
Flume快速入门系列(3) | 如何实时读取本地/目录文件到HDFS上
目录一.实时读取本地文件到HDFS1.1需求:1.2需求分析1.3实现步骤1.Flume要想将数据输出到HDFS,必须持有
Hadoop相关
jar包2.创建flume-file-hdfs.conf文件3.
不温卜火
·
2020-06-21 04:12
Hadoop
#
Flume
Hadoop相关
面试题知识点总结
Hadoop相关
总结1.2.1Hadoop常用端口号1.2.2Hadoop配置文件以及简单的Hadoop集群搭建(1)配置文件:Hadoop2.xcore-site.xml、hdfs-site.xml、
美食江湖
·
2020-06-21 03:49
大数据
CDH6.3.2 开启Kerberos 认证
CDH6.3.2开启Kerberos认证标签(空格分隔):大数据平台构建一:如何安装及配置KDC服务二:如何通过CDH启用Kerberos三:如何登录Kerberos并访问
Hadoop相关
服务一:如何安装及配置
flyfish225
·
2020-05-29 22:38
CDH
6.3.2
kerberos
认证
大数据技术
hadoop面试题之HDFS
广义上hadoop是指与
hadoop相关
的大数据生态圈。包含hive、spark、hbase等。狭义上hadoop指的是apache的开源框架。
becooner
·
2020-04-05 23:23
dir.who is not allowed to impersonate hadoop的问题
之前用java做
Hadoop相关
项目没有遇到这种问题,今天使用python操作HDFS遇到这个问题,首先是权限之类的问题,在core-site.xml中配置可以访问的hosts和groups,具体:hadoop.proxyuser.xxx.hosts
Super~me
·
2020-03-28 12:00
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他