E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Cloudera
CDH部署Hive详细指南
CDH部署Hive详细指南本文将详细介绍如何使用
Cloudera
ManagerWeb界面部署Hive组件,包括安装、配置、优化和运维管理等内容。
暴躁哥
·
2025-06-25 20:48
大数据技术
hive
hadoop
数据仓库
通过CDH安装Spark的详细指南
通过CDH安装Spark的详细指南简介
Cloudera
DistributionofHadoop(CDH)是一个企业级的大数据平台,它集成了多个开源组件,包括Hadoop、Spark、Hive等。
暴躁哥
·
2025-06-25 20:48
大数据技术
spark
大数据
分布式
hadoop yarn 获取日志_Hadoop YARN日志查看方式
HadoopYARN日志查看方式实验环境CDH6.3.2Hadoop版本$hadoopversionHadoop3.0.0-cdh6.3.2Sourcecoderepositoryhttp://github.com/
cloudera
weixin_30131105
·
2025-06-18 20:39
hadoop
yarn
获取日志
parquet :开源的列式存储文件格式
1.Parquet文件定义与核心概念Parquet是一种开源的列式存储文件格式,由Twitter和
Cloudera
合作开发,2015年成为Apache顶级项目。
·
2025-06-07 07:24
Impala原理与代码实例讲解
1.2Impala的诞生Impala是由
Cloudera
公司开发的一款开源的MPP(大规模并行处理)SQL查询引擎,可以直接在Hadoop的存储层(如HDFS、HB
AI天才研究院
·
2025-05-03 14:35
AI大模型企业级应用开发实战
AI大模型应用入门实战与进阶
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
Hadoop-几种列式存储比较
第一章相关理论1.1Parquet格式介绍1.1.1起源与发展Parquet,作为Hadoop生态系统中的一种新型列式存储格式,由
Cloudera
和Twitter公司联手开发,并已跻身至Apache软件基金会的顶级项目之列
xyz2011
·
2025-04-19 17:07
Hive面试题(持续更新)
hadoop
hdfs
大数据
数据仓库
maven使用
Cloudera
仓库
生产用的大数据平台使用的是CDH6.3.2,在开发时需要在Maven中引入
Cloudera
的一些依赖包,这时就需要配置
Cloudera
仓库。本文记录配置过程,以作备忘。
邢为栋
·
2025-04-09 03:02
Bigdata
Java
maven
cloudera
java
Redash:让数据可视化变得简单
Redash支持查询多个数据库,包括:Redshift、GoogleBigQuery、PostgreSQL、MySQL、Graphite、Presto、Google电子表格、
Cloudera
Impala
开源项目精选
·
2025-04-08 07:13
信息可视化
开源
github
数据权限访问控制(Apache Sentry)
ApacheSentry最初由
Cloudera
公司内部开发,针对Hadoop系统中的数据(主要是HDFS、Hive的数据)进行细粒度控制,对HDFS、Hive以及Impala有着良好的支持性。
deepdata_cn
·
2025-03-24 14:56
权限管理
apache
sentry
大数据学习(75)-大数据组件总结
如果觉得博主的文章还不错的话,请点赞+收藏⭐️+留言支持一下博主哦一、CDHCDH(
Cloudera
DistributionIncludingApacheHadoop)是由
Cloudera
公司提供的一个集成了
viperrrrrrr
·
2025-03-21 22:42
大数据
impala
yarn
hdfs
hive
CDH
mapreduce
深度解读Kafka数据可靠性
目前越来越多的开源分布式处理系统如
Cloudera
、ApacheStorm、Spark等都支持与Kafka集成。
程序の之道
·
2025-02-07 06:17
kafka
hive
yarn
spark
hadoop
CDH/HDP国产替换之路
哪些用户需要迁移原社区版用户社区版不再更新
Cloudera
(
Cloudera
和Hortonworks合并后)所有产品不再提供社区版,用户无法获取新的功能。
yumgpkpm
·
2025-02-05 09:59
hadoop
hive
hbase
hdfs
CDH角色迁移和硬盘扩容
迁移要求HDFS数据不丢失Hive元数据不丢失无临时过渡服务器不能影响用户计算使用CDH5.11.0只能使用centos6.5-6.9x版本大数据组件角色迁移
Cloudera
ManagementService
专注大数据的Lyer
·
2025-02-05 09:56
java
大数据
hadoop
hive
hdfs
SpringBoot+Implala常见问题:[
Cloudera
][ImpalaJDBCDriver](500605) 错误
问题描述Causedby:java.sql.SQLException:[
Cloudera
]ImpalaJDBCDriver问题分析:当CDH机器配置了LDAP验证的时候,Dbeaver或者其他链接工具或者
平凡君
·
2025-02-04 18:12
笔记
Hive
Impala
SpringBoot
kylin linux 安装教程,Apache Kylin | 安装指南
0.13-1.2.1+HBase:1.1+Spark2.1.1+JDK:1.7+OS:Linuxonly,CentOS6.5+orUbuntu16.0.4+用HortonworksHDP2.2-2.6,
Cloudera
CDH5.7
社本
·
2025-02-03 07:26
kylin
linux
安装教程
spark2如何集成到cdh里
spark1.6性能有多大差别,官方文档里写着可以集成,但是自己怎么搞都不行,折磨了3天的时间,目前终于把spark2集成到集群里了我安装的是最新版本的下载spark2安装包wgethttp://archive.
cloudera
.com
蘑菇丁
·
2025-01-27 16:55
经验
hadoop
大数据+机器学习+oracle
CDH大数据平台
CDH概念CDH(
Cloudera
DistributionIncludingApacheHadoop)是由
Cloudera
公司提供的一个集成了ApacheHadoop以及相关生态系统的发行版本。
梦龙zmc
·
2025-01-25 06:44
大数据
大数据
CDH日志清理
/*|sort-nrcd/var/lib/
cloudera
-service-monitordu-s./*|sort-nrcd/var/lib/
cloudera
-host-moni
只是甲
·
2025-01-24 14:13
#
CDH大数据平台
大数据和数据仓库
Cloudera
日志清理
hadoop
MAC安装
Cloudera
QuickStart VM+incubator-griffin相关配置过程
4.
Cloudera
已经将所有组件都装好了,我是因为卸载重装了mysq
youyouiyiy
·
2025-01-19 22:14
virtualbox
centos
cloudera
griffin
9.迁移CM和数据库-2
9.1将原CM节点数据迁移至新节点9.1.1备份原CM节点数据主要备份CM的监控数据和管理信息,数据目录包括:/var/lib/
cloudera
-host-monitor/var/lib/
cloudera
-service-monitor
大勇任卷舒
·
2024-09-03 05:01
大数据基础之Flume——Flume基础及Flume agent配置以及自定义拦截器
Flume简介Flume用于将多种来源的日志以流的方式传输至Hadoop或者其他目的地 -一种可靠、可用的高效分布式数据收集服务Flume拥有基于数据流上的简单灵活架构,支持容错、故障转移与恢复由
Cloudera
2009
Clozzz
·
2024-09-03 03:17
Flume
大数据
flume
hadoop
Flume介绍及调优
一、概述Flume是
Cloudera
提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理
桓桓桓桓
·
2024-09-03 01:04
分布式
大数据
日志搜集
大数据技术之Flume
第1章Flume概述1.1Flume定义Flume是
Cloudera
提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。
okbin1991
·
2024-09-03 00:32
大数据
flume
java
hadoop
开发语言
ubuntu16.04安装 ambari 2.7.3的环境准备工作
0、登录官网先看下资料https://docs.
cloudera
.com/HDPDocuments/Ambari-2.7.3.0/bk_ambari-installation/content/setup_options.html1
lbl251
·
2024-08-28 01:40
基于Hadoop平台的电信客服数据的处理与分析④项目实现:任务16:数据采集/消费/存储
Flume:是
Cloudera
提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据
我非夏日
·
2024-08-23 06:28
大数据开发---电信项目
大数据
大数据技术开发
hadoop
CDH 启停使用HiveServer2
翻译:https://www.
cloudera
.com/documentation/enterprise/latest/topics/cdh_ig_hiveserver2_start_stop.html
金刚_30bf
·
2024-03-26 23:41
大数据分析学习第十五课 自建云服务器集群离线安装Ambari2.7.5和HDP3.1.5(一)
之前了解了很多关于大数据平台一站式部署管理的工具,比如ApacheAmbari和CDH,目前最新的CDH已经没有了社区版,也就是说以后使用新版本的
Cloudera
Manager和CDH都是要收费的,这对于很多小公司来说
猫头鹰数据分析
·
2024-02-20 08:29
大数据
Java
Hive
hadoop
ambari
大数据
centos
hdfs
大数据技术之 Flume
第1章Flume概述1.1Flume定义Flume是
Cloudera
提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。
骚戴
·
2024-02-11 09:34
大数据
大数据
Flume
【大数据】Flume-1.9.0安装➕入门案例
监控端口数据官方案例3.实时读取本地文件(hive.log)到HDFS案例4.实时读取目录文件到HDFS案例5.实时监控目录下多个追加文件总结前言大数据解决的无非是海量数据的采集、存储、计算,Flume是
Cloudera
欧叶冲冲冲
·
2024-02-11 09:34
flume
大数据
flume
学习
分布式
大数据Flume--入门
AgentSourceSinkChannelEventFlume安装部署安装地址安装部署Flume入门案例监控端口数据官方案例实时监控单个追加文件实时监控目录下多个新文件实时监控目录下的多个追加文件FlumeFlume定义Flume是
Cloudera
泛黄的咖啡店
·
2024-02-11 09:04
大数据
flume
初识kafka
目前越来越多的开源分布式处理系统如
Cloudera
、Storm、Spark、Flink等都支持与Kafka集成。
tracy_668
·
2024-02-09 14:07
69.Kudu、Spark2、Kafka安装—CDH
CentOS6.5CM和CDH版本为:5.12.1CM管理员为:admin用户操作系统用户为:root用户69.2操作演示Kudu安装Kudu的Parcel部署下载Kudu的Parcel包:http://archive.
cloudera
.com
大勇任卷舒
·
2024-02-09 14:55
Hadoop深度运维:Apache集群原地升级Ambari-HDP
作者介绍冯武,目前在瓜子从事大数据集群运维管理,主要负责Hadoop、Ansible、Ambari、
Cloudera
Manager等技术栈的维护调优工作。
Summer_1981
·
2024-02-08 18:42
Spark Chapter 8 Spark SQL
SparkSQL/SparkCore直接使用SQL语句进行大数据分析hive的问题:底层MR,2.x之后可以用spark应用场景SQLonHadoop:Hive,Shark(不维护了),Impala(
Cloudera
深海suke
·
2024-02-07 01:34
CDH使用Disk Balancer平衡磁盘HDFS数据
从CDH5.8.2开始,
Cloudera
Manager提供了一个全面的存储容量管理解决方
Alderaan
·
2024-02-05 16:05
Cloudera
CDH
cloudera
hdfs
disk
balancer
在 CDH 中调优 Apache Hive on Spark
本主题假设您的集群由
Cloudera
Manager管理,并且您使用YARN作为Spark集群管理器。以下部分中描述的
海阔天空&沫语
·
2024-02-05 09:27
大数据/架构
hive
hadoop
spark
CDH6.3.2 多 Spark 版本共存
一部署Spark客户端1.1部署spark3客户端tar-zxvfspark-3.3.1-bin-3.0.0-cdh6.3.2.tgz-C/opt/
cloudera
/parcels/CDH/libcd/
大数据AI
·
2024-02-05 09:56
大数据从入门到精通
spark
cdh
Kudu+Impala介绍
转自:http://www.360doc.com/content/18/0913/16/59691344_786386910.shtmlKudu+Impala介绍概述Kudu和Impala均是
Cloudera
wjmmjr1
·
2024-02-05 07:20
HIVE
TextFileSequenceFileRCFileORCParquetUDF自定义函数环境搭建1)hive下载http://archive.clordera.com/cdh5/cdh/5/wgethttp://archive.
cloudera
.com
Yagami_
·
2024-02-05 00:23
CDH-CM资源下载
http://ro-bucharest-repo.bigstepcloud.com/
cloudera
-repos/CDH-6.3.2 链接: https://pan.baidu.com/s/1Vd9ZaXcKG0JDCDszTtasjQoycpCDH
0X码上链
·
2024-02-03 21:12
大数据
分布式技术
cdh
Flink SQL Client 安装各类 Connector、组件的方法汇总(持续更新中....)
但是对于某些特定的平台,如果AWSEMR、
Cloudera
CDP等产品会有所不同,主要是它们中的某些Jar包可能被改写过,例如和HiveMetastore的交互,AWSEMR就有另外一套Metatstore
Laurence
·
2024-02-03 06:53
大数据专题
flink
sql
client
安装
部署
connector
插件
CDH6.3.2安装
文章目录@[toc]一、CM简介1、
Cloudera
Manager的概念2、
Cloudera
Manager的功能3、
Cloudera
Manager的架构二、准备清单1、部署步骤2、集群规划3、软件环境准备三
烟雨话浮生
·
2024-02-02 14:09
hadoop
harvester
hadoop
浅谈Spark Livy
SparkLivy什么是LivyLivy的特点Livy的运作流程阐述Livy的安装、启动、访问Livy的使用1.什么是Livylivy是
cloudera
开发的通过REST来连接、管理spark的解决方案
浅汐yt
·
2024-02-02 13:40
spark
大数据
spark
大数据
spark livy hue
Spark提供了REST接口,有如下特性:*提供交互式shell*批量提交*多用户使用用一个服务(用户模拟)*可以从任何地方使用REST的方式提交*无需对代码进行任何修改wgethttp://archive.
cloudera
.com
bigdataf
·
2024-02-02 13:08
livy-spark
hue
【livy】Spark Livy深究
什么是livyLivy的特点Livy
cloudera
开发通过REST来连接、管理spark的解决方案从任何地方提交job使用交互式的Scala、Python语言与远程的spark集群进行通信无需更改代码
小赵要加油
·
2024-02-02 13:07
livy
大数据
分布式
大数据开发流程图
Flume:实时数据采集的一个开源框架,它是
Cloudera
提供的一个高可用
xyzkenan
·
2024-02-01 14:30
大数据开发
大数据
大数据开发流程
Cloudera
Manager开启kafka JMX监控
在
Cloudera
Manager上创建了3节点的kafka集群服务,想要外部连接kafkaJMX监控kakfa数据,需要修改kakfa配置:-Dcom.sun.management.jmxremote.host
Troyong
·
2024-02-01 13:28
Kafka
kafka
jmx
cloudera
利用
Cloudera
Manager下安装kafka
文章目录前言一、基于CDH版本选择安装1.1基于CDH版本选择安装1.2选择依赖项1.3角色分配1.4设置KafkaBroker配置1.5查看命令详请1.6安装概要1.7主页查看/启动前言本文章是是利用
Cloudera
Manager
914 JJ
·
2024-02-01 13:28
KAFKA
kafka
大数据
cloudera
使用
Cloudera
Manager部署Kafka消息队列
一.下载需要安装的Kafka版本1.查看
Cloudera
DistributionofApacheKafka(简称CDK)版本CDK版本链接地址:https://www.
cloudera
.com/documentation
至尊宝l
·
2024-02-01 13:27
Cloudera
Manager
kafka
cloudera
分布式
Cloudera
Manager 安装 Kafka 并简单使用
Kafka简介kafka是一款分布式消息发布和订阅的系统,具有高性能和高吞吐率。Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。Kafka的目的是通过Hadoop的并行加载机制来统一线上和离线的消息处理,也是为了通过集群机来提供实时的消费。核心概念:BrokerKafka集群包含一个或多个服务器,这种服务器被称为brokerTopic每条发布到Kaf
大数据AI
·
2024-02-01 13:25
大数据从入门到精通
cloudera
kafka
大数据
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他