E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
cloudera
CDH6 离线安装
一、环境准备1、CM简介
Cloudera
Manager是一个拥有集群自动化安装、中心化管理、集群监控、报警功能的一个工具,使得安装集群从几天的时间缩短在几个小时内,运维人员从数十人降低到几人以内,极大的提高集群管理的效率
·
2022-03-24 14:12
cdh5hadoop
Cloudera
Manager 术语和架构
简介:本文介绍了
Cloudera
Manager的常见术语和架构
Cloudera
Manager术语为了有效地使用
Cloudera
Manager,您应该首先了解其术语。
·
2022-03-24 14:51
周边生态|StreamNative 联合
Cloudera
开源 Apache Pulsar+Apache NiFi 集成处理器
近日,StreamNative和
Cloudera
官方宣布共同开源ApacheNiFi和ApachePulsar联合解决方案,将二者集成打造成完整的边缘到云数据的流平台。
·
2022-03-18 12:04
Hadoop学习(一)Hadoop概述
基金会开发阿德分布式系统基础架构主要解决,海量数据的存储和海量数据的分析计算问题PS:储存大小数量级:兆M->吉G->太T->拍P->艾E->泽ZHadoop三大发行版本:Apache(最原始,最基础,开源)、
Cloudera
温玉琳琅
·
2022-03-18 05:20
Hadoop
Hadoop
大数据
云平台的云计算安全参数详解
随着对云计算技术需求的增加,许多科技巨头都在提供云自动化服务,如亚马逊网络服务(AWS)、微软Azure、谷歌云平台(GCP)、IBM、SAP、
Cloudera
等。
·
2022-03-16 19:03
云计算网络安全
大数据开发面试:impala和hive的比较
Impala:
Cloudera
公司推出,提供对于hdfs,hbase数据的高性能,低延迟的交互式sql查询功能基于hive,使用内存计算,兼顾数据仓库,具有实时,批处理,多并发等优点是CDH首选的PB级大数据实时查询
道法—自然
·
2022-02-28 15:44
python存数据到impala_python连接impala(安装impyla)
相关环境如下:Python3.4Win764位参照官网https://github.com/
cloudera
/impyla中的安装步骤执行:1、pipinstallsix2、pipinstallbit_array3
weixin_39839968
·
2022-02-28 15:36
大数据平台安装部署--CDH6.2版本【集群】
1:CDH介绍CDH是
Cloudera
的100%开源平台发行版,包括ApacheHadoop,专为满足企业需求而构建。CDH提供开箱即用的企业使用所需的一切。
大自然的农民工
·
2022-02-28 11:37
big
data
hadoop
hdfs
CDH6 离线安装
一、环境准备1、CM简介
Cloudera
Manager是一个拥有集群自动化安装、中心化管理、集群监控、报警功能的一个工具,使得安装集群从几天的时间缩短在几个小时内,运维人员从数十人降低到几人以内,极大的提高集群管理的效率
·
2022-02-27 17:09
cdh5hadoop
hadoop生态_大数据学习笔记6——hadoop生态圈之初识flume
命令(1)大数据学习笔记4——hdfs文件系统shell命令(2)大数据学习笔记5——hdfs文件系统shell命令(3)今天说说hadoop生态圈中用于数据采集的组件:flume1、flume概念(
cloudera
weixin_39687814
·
2022-02-27 09:41
hadoop生态
hadoop生态圈
【Flume】笔记
一、Flume概述1.1Flume定义Flume是
Cloudera
提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。
十二翼堕落天使
·
2022-02-27 09:40
大数据
flume
big
data
大数据
NiFi SFTP BUG 以及1.15最近的修复
NiFiSFTP1.15最近的修复序很久没更新关于NiFi相关的内容了,其实NiFi现在在
cloudera
社区的热度居高不下,大量的思想火花与bug被修复。这里就谈谈关于SFTP相关的一些修复工作。
青冬
·
2022-02-22 07:14
nifi
nifi
sftp
砖厂CEO Ali对Hadoop的最新评价
原本的三个Hadoop公司
Cloudera
,Hortonworks和MapR遇到了他们自己的危机,引发了对整个Hadoop未来命运的讨论。
smilegator
·
2022-02-21 17:18
CDH6安装简介
环境介绍虚拟机版本:CentOS7.5(三台)CHD版本:6.3.0MySQL:5.7相关下载地址(不清楚百度,一搜一大把)https://archive.
cloudera
.com/cm6/6.3.0/
PandaEyes聊大数据
·
2022-02-19 14:39
写入时间戳类型数据到Parquet,再用Impala读取
Parquet最初是由Twitter和
Cloudera
(由于Impala的缘故)合作开发完成并开源,2015年5月从Apache的孵化器里毕业成为Apache顶级项目[1][2]。
逍遥老怪
·
2022-02-18 19:34
Flume 入门
一:Flume是什么:1.有
Cloudera
公司开源2.分布式,可靠,高可用的海量日志采集系统;3.数据源可定制,可扩展;4.数据存储系统可定制,可扩展;5.中间件,屏蔽了数据源和数据存储之间的耦合。
曹振华
·
2022-02-18 06:17
大数据生态圈技术整理
组件类型(本文还未写完)文件系统HDFS调度系统OozieAzkabanAirflow管理系统ZookeeperYARNAmbari
Cloudera
ManagerHue数据存储HDFSHBaseCarbonDataAccumulo
非常强壮的蚂蚁
·
2022-02-18 02:41
CDH 使用 Hive schematool
翻译:https://www.
cloudera
.com/documentation/enterprise/latest/topics/cdh_ig_hive_schema_tool.html版本:5.14.2
金刚_30bf
·
2022-02-18 02:15
1.Apache Flume介绍
1.概述Flume是
Cloudera
提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的软件。
非勤能补拙
·
2022-02-17 19:51
在 centos6.9 上 cdh-5.13.3的搭建报错
201810:52:19+0000]8858MainThreadutilERRORLineagefilenotfound,skippingSparkplugincreation:/etc/spark/conf.
cloudera
.spark_on_yarn
秦记
·
2022-02-17 13:44
##Shanghai SQL on Hadoop Meetup第一次聚会-CSDN活动
project_id=3476会议介绍这是ShanghaiSQLonHadoopMeetup的第一次线下聚会,Intel携手
Cloudera
,Kyligence为大家准备了精彩的技术内容分享。
葡萄喃喃呓语
·
2022-02-17 09:19
黑猴子的家:Flume简介
Flume作为
Cloudera
开发的实时日志收集系统,受到了业界的认可与广泛应用。Flume初始的发行版本目前被统称为FlumeOG(originalgeneration),属于
Cloudera
。
黑猴子的家
·
2022-02-16 03:20
P04_zookeeper-cdh5集群搭建
安装ZooKeeper包[CDH下载地址](http://archive.
cloudera
.com/cdh5/cdh/5/)1、将课程提供的zookeeper-3.4.5-cdh5.3.6.tar.gz
Albert陈凯
·
2022-02-15 10:12
铜川市区领导为
Cloudera
授权陕西基地鼓劲加油
10月11日,铜川市发改委主任王晓刚、耀州区区长张大军、市统计局局长杨琨及有关部门负责人来到智空间,对铜川大数据学院(
Cloudera
授权陕西基地)西安运营中心的准备情况进行指导。
Cloudera陕西基地
·
2022-02-13 17:16
Cloudera
spark 安装
翻译:https://www.
cloudera
.com/documentation/enterprise/latest/topics/cdh_ig_spark_installation.html版本:5.14.2Continuereading
金刚_30bf
·
2022-02-13 01:18
HBase编译安装(单机版)
cdh5.14.0其他:因为前期编译过hadoop等组件,所以配套的git、Protobuf、Findbugs等都已经安装过了,不确定是否起到作用2、源码下载、解压wgethttp://archive.
cloudera
.com
刘子栋
·
2022-02-12 14:36
MySQL to HBase over Kafka Connect 实时同步实践 (2) 架构一览
image.png组件说明CDH6.1.1线上Hadoop集群最终采用了CDH发行版,版本是CDH6.0.0,后续升级到CDH6.1.1.上述组件中,Kafka,HBase,Hive,
Cloudera
Manager
517001e7cb6e
·
2022-02-12 06:57
大数据平台CDH集群在线安装
标签:
Cloudera
-ManagerCDHHadoop部署集群摘要:管理、部署Hadoop集群需要工具,
Cloudera
Manager便是其一。本文详细记录了以在线方式部署CDH集群>的步骤。
weixin_33724570
·
2022-02-11 11:48
大数据
运维
java
CDH离线安装
系统参数系统centos:CentOSLinuxrelease7.5.1804(Core)JDK:jdk-8u162-linux-x64
Cloudera
Manager:5.15.0服务器5台,内存16g
豪大大大
·
2022-02-11 06:15
开源实践 | OceanBase 在红象云腾大数据场景下的实践与思考
作者:童小军红象云腾(REDOOP)公司董事长兼CTO,中国首位
Cloudera
CCDH认证工程师,曾任ChinaHadoopSummit联合主席。
·
2022-02-09 18:52
数据库oceanbase
spark-submit解读
本文基于spark1.6-CDH5.7.2讨论当执行spark-submit时,会产出如下操作:1、设置HADOOP_HOME=/opt/
cloudera
/parcels/CDH-5.7.2-1.cdh5.7.2
凡尔Issac
·
2022-02-08 22:56
cdh6.3.2安装
1.数仓之
Cloudera
Manager1.1CM简介1.1.1CM简介
Cloudera
Manager是一个拥有集群自动化安装、中心化管理、集群监控、报警功能的一个工具,使得安装集群从几天的时间缩短在几个小时内
coderKeNan
·
2022-02-07 14:35
大数据
数据库
big
data
运维
大数据——Flume学习笔记
Flume常见案例1.监控端口数据2.监控单个目录并将数据输出到hdfs3.avrosource4.taildirsource5.hivesink6.hbasesink一、Flume定义 Flume是
Cloudera
Vicky_Tang
·
2022-02-07 07:36
大数据
flume
Apache Zeppelin 基于 kerberos 多租户集成
本着开发前先调研轮子的原则,一番调研到了两个轮子:Hue:
cloudera
生态自带组件,功能强大,但是仅限于
cloudera
生态圈Zeppelin:Apache开源顶级项目,支持hivesp
咬尘归
·
2022-02-05 13:44
Apache Ambari 项目或将被“雪藏”:只因没人愿意参与开发 | 提议已获“全票通过”
近日,
Cloudera
工程师、ApacheAmbariPMC主席JayushLuniya在发送给Ambari社区名为《[VOTE]MoveApacheAmbaritoAttic》的邮件中提议:将ApacheAmbari
·
2022-01-20 19:09
apache
Apache Oozie学习笔记(一)
由
Cloudera
公司贡献给Apache。Oozie是运行于Javaservlet容器上的一个javaweb应用。
·
2022-01-06 10:39
大数据hadoop工作流调度器
【阿里云 CDP 公开课】 直播预告来袭!
简介:扫描海报上的钉钉群二维码入群,线上观看直播,还可以与来自阿里云和
Cloudera
的技术专家交流~背景介绍CDP(
Cloudera
DataPlatform)是
Cloudera
和Hortonworks
·
2021-11-25 13:46
阿里云开发者
Cloudera
CDP 企业数据云测试开通指导
简介:基于阿里云部署的
Cloudera
CDP企业数据云平台已经进入公测阶段,本文详细介绍了相关试用/试用流程。
·
2021-11-24 11:54
云原生分布式
Flume 日志文件/实时数据流采集框架 概念及原理介绍
技术背景由
cloudera
软件公司产出的可分布式日志收集系统,后与2009年被捐赠了apache软件基金会,为hadoop相关组件之一。
章云邰
·
2021-11-13 16:38
吐血整理:常用的大数据采集工具,你不可不知
1FlumeFlume作为Hadoop的组件,是由
Cloudera
专门研发的分布式日志收集系统。尤其近几年
·
2021-11-10 16:08
CDH6.3.3 paywall版之前自定义http服务器放置parcels安装数据
当前大数据集群的工具选型上,巨头们都是自研大数据工具,中小微企业都是开源大数据组件搭积木,中间层级的厂商或买商业软件(MaxCompute/腾讯云/华为云)或在CDH基础上再集成商业套件(Dataphin之类).
cloudera
江畔独步
·
2021-11-09 18:14
cdh集群管理
http
服务器
apache
Hadoop 入门笔记 二十三 : MapReduce性能优化-文件类型
Hadoop得到了企业界及学术界关注,Yahoo、Facebook、
Cloudera
、Twitter、Intel、华为等诸多公司和技术团体对Hadoop给予了大力支持。
Cloudera
对Apache
·
2021-11-07 12:43
hadoop
flume详解
定义flume全称ApacheFlume技术角度:使用Java语言开发的一个分布式、高可靠、高可用中间件项目角度:最早是
Cloudera
提供的日志收集系统,现在是Apache软件基金会(ASF)的顶级项目
·
2021-11-05 19:12
Cloudera
Manager 术语和架构
简介:本文介绍了
Cloudera
Manager的常见术语和架构
Cloudera
Manager术语为了有效地使用
Cloudera
Manager,您应该首先了解其术语。
·
2021-10-28 11:09
大数据开发之HDFS的API操作过程
创建maven工程并导入jar包
cloudera
https://repository.
cloudera
.com/artifactory/
cloudera
-repos/org.apache.hadoophadoop-client2.6.0
·
2021-10-28 11:08
大数据hdfs
CDP 平台简介
简介:EDC建立在
Cloudera
DataPlatform(CDP)之上,该产品结合了
Cloudera
EnterpriseDataHub和HortonworksDataPlatformEnterprise
·
2021-10-27 14:04
大数据
【大数据】☀️搞定Hadoop集群☀️概述&环境配置
目录一、什么是Hadoop框架:二、Hadoop三大发行版:1.ApacheHadoop2.
Cloudera
Hadoop3.HortonworksHadoop三、Hadoop的优势:四、Hadoop组成
故里º
·
2021-10-24 09:00
大数据
1024程序员节
hadoop
big
data
大数据
hdfs
【填坑之旅-hadoop】centos7安装hadoop2.10.1 hive 1.2.2 / hdfs 文件上传写入流程 / MapReduce Yarn 流程/zookeeper/hive
的原理和编程第四天常见mr算法实现和shuffle的机制第五天hadoop2.x中HA机制的原理和全分布式集群安装部署及维护第六天hbasehive第七天storm+kafka第八天实战项目hadoop
cloudera
cloudera
edh
alwarse
·
2021-10-22 11:24
大数据hadoop-填坑
hadoop
hdfs
mapreduce
干货 | 如何为已有的 ambari 集群修改主机名
之前是有修改过ip的,主机名还真没修改过,只能给他提供一份官方的步骤:https://docs.
cloudera
.com/HDP...。不过经过后面小伙伴们的反馈,都修改成功了。
·
2021-10-16 16:42
java
为在线数据库构建基于 Kudu 的实时数据同步
简述Kudu是
Cloudera
开源的新型列式存储系统,是ApacheHadoop生态圈的成员之一。它专门为了对快速变化的数据进行快速的分析,填补了以往Hadoop存储层的空缺。
·
2021-10-09 12:52
数据库
上一页
7
8
9
10
11
12
13
14
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他