E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Cloudera
CDH5.13.x文档翻译SQL Differences Between Impala and Hive
https://www.
cloudera
.com/documentation/enterprise/5-13-x/topics/impala_langref_unsupported.html#langref_hiveql_deltaImpala
gregocean
·
2023-03-24 07:10
大数据技术之CM安装------1
第1章
Cloudera
Manager1.1
cloudera
manager的概念简单来说,
Cloudera
Manager是一个拥有集群自动化安装、中心化管理、集群监控、报警功能的一个工具(软件),使得安装集群从几天的时间缩短在几个小时内
ItStar
·
2023-03-23 00:30
Cloudera
Hadoop(cdh5.1.0)平台搭建2
选择免费的版本,因为免费的版本功能足够使用节点IP一般连续,采用图中的模式会比较好,然后搜索后目前有两个阶节点,选中,继续选择Parcel(离线)安装,但是CDH版本是5.3.0,我们安装的是5.1.0版本的,点击更多选项进行版本修改在URL中可以看出系统默认是按照最新的版本我们需要改成5.1.0的返回,在进入这个页面的时候,就可以选择CDH5.1.0的版本了没有勾选,继续使用root账户或者有r
鹰击长空123
·
2023-03-21 19:00
spark on hbase 读写
本文主要讲述了spark对hbase进行独写的两种方式,这两种方式分别为:1.利用spark提供的newAPIHadoopRDDapi对hbase进行读写2.SparkOnHbase,这种方式其实是利用
Cloudera
-labs
Ivan_030c
·
2023-03-21 04:47
CDH 5.13 集群有2台服务器,发生自动重启,有报错
2018-08-0610:28:21,732ERRORParcelUpdateService:com.
cloudera
.parcel.components.ParcelDownloaderImpl:(1skipped
秦记
·
2023-03-20 03:47
Flink CDC + Hudi + Hive + Presto构建实时数据湖最佳实践
PrestoDB0.256Mysql5.72.集群服务器基础环境2.1Maven和JDK环境版本2.2Hadoop集群环境版本2.3HADOOP环境变量配置exportHADOOP_HOME=/opt/
cloudera
大数据技术架构
·
2023-03-19 11:26
hadoop
数据库
mysql
java
大数据
Streampark集成
Cloudera
Flink、ldap、告警,以及部署常见问题
集成背景我们当前集群使用的是
Cloudera
CDP,Flink版本为
Cloudera
Version1.14,整体Flink安装目录以及配置文件结构与社区版本有较大出入。
酥酥饼一号
·
2023-03-19 11:12
cloudera
flink
大数据
使用idea操作Hbase数据库
首先创建一个maven项目,然后再pom.xml文件中添加
cloudera
https://repository.
cloudera
.com/artifactory/
cloudera
-reposorg.apache.hbasehbase-server1.2.4org.apache.hbasehbase-client1.2.4org.apache.hbasehbase1.2.4org.apache.hb
不愿透露姓名的李某某
·
2023-03-15 12:45
hue 中使用 oozie workflow 运行 shell 脚本执行 sqoop 命令,报错 Launcher ERROR, reason: Main class [org.apache.o...
oozieworkflow中运行报错:LauncherERROR,reason:Mainclass[org.apache.oozie.action.hadoop.ShellMain],exitcode[1]在
cloudera
manager
cooooper
·
2023-03-11 02:37
Cloudera
EventServer起不来
问题:
Cloudera
ManagementServiceEventServer起不来,image.pngimage.png解决方法:mv/var/lib/
cloudera
-scm-eventserver
代码足迹
·
2023-03-10 20:06
Sqoop job运行时出现Unsupported major.minor version 52.0
CDH在安装过程中,会自己下载jdk(5.15.0时是jdk1.7.0_67-
cloudera
)。在组件拉起时,不指定节点的情况下,都是以自下载的jdk启动。
南知唔知
·
2023-03-09 09:29
centos安装
cloudera
-scm-agent启动失败,Failed to connect to previous supervisor
cloudera
-scm-agent启动失败,查看日志文件var/log/
cloudera
-scm-agent/
cloudera
-scm-agent.log,发现如下解决办法:1、#ps-ef|grepsupervisord
AlwaysonR
·
2023-02-19 02:06
HDFS HA硬件配置
翻译自:https://www.
cloudera
.com/documentation/enterprise/latest/topics/cdh_hag_hdfs_ha_hardware_config.html
金刚_30bf
·
2023-02-18 08:59
那些安装CDH集群过程中踩过的坑......(比较全)
一、登录
Cloudera
Manager(http://192.168.201.128:7180/cmf/login)时,无法访问web页面针对此问题网上有较多的解决方案(e.g.https://www.cnblogs.com
weixin_30764883
·
2023-02-18 07:57
大数据
java
数据库
Hadoop2.x分布式集群部署12
一、Hadoop2.x分布式集群部署-HDFS1.hadoop2.x版本下载及安装https://archive.apache.org/disthttp://archive.
cloudera
.com/cdh5
麻帅
·
2023-02-17 22:29
docker部署CDH
docker部署CDHdocker拉取cdhdockerpull
cloudera
/quickstart:latestdockertag
cloudera
/quickstart:latestcdh:5.13.0docker
Youngmon
·
2023-02-04 17:00
关于hadoop:2.6.0-cdh5.16.2与hive1.1.0-cdh5.16.2兼容springboot问题
具体的pom.xml的配置如下:cidiservcom.cidi${revision}4.0.0cidiserv_dataprocessing数据处理
cloudera
http://repository.
cloudera
.com
weixin_43814165
·
2023-02-03 12:32
java
开发语言
初识大数据(二. Hadoop是什么)
在hadoop的使用版本中,目前除Apache的版本,hadoop还有
Cloudera
与Hortonwor
weixin_34205076
·
2023-02-02 14:58
大数据
数据库
人工智能
Hadoop (一) ——hadoop基础知识
hadoop的应用场景在线旅游:目前全球范围内80%的在线旅游网站都是在使用
Cloudera
公司提供的Hadoop发行版,其中SearchBI网站曾经报道过的Expedia也在其中。
qq_44658961
·
2023-02-02 14:27
Hadoop
[centos] 使用package升级
cloudera
manager 5.13
Step1收集升级信息Step2完成安装前步骤Step3备份
Cloudera
Manager数据库Step4升级JDKStep5建立对软件的访问创建一个临时远程仓库Step6准备对
Cloudera
NavigatorDataManagementComponent
小南瓜瓜
·
2023-02-02 14:26
cloudera
cdh
cloudera
manager
5-13
CDH大数据平台 16
Cloudera
Manager Console之Sentry权限配置和测试(markdown新版)
个人主页:@与自己作战作者简介:大数据领域优质创作者、CSDN@内容合伙人、阿里云专家博主希望大佬们多多支持,携手共进如果文章对你有帮助的话,欢迎评论点赞收藏加关注⛔如需要支持请私信我,必支持文章目录一、Sentry权限配置1、启动Sentry1.1、hdfs启动sentry1.1.1、开启hadoop超级用户1.1.2、开启sentry访问控制列表1.1.3、开启sentry同步1.1.4、添加
与自己作战
·
2023-02-02 14:53
CDH
#
Kafka
#
HIVE
sentry
hadoop
hue
hive
kafka
kafka管理工具 | 监控 | 偏移量 | 堆积 | offset,必备技能
Kafka内部提供了许多管理脚本,这些脚本都放在$KAFKA_HOME/bin目录下,CDH版本放在/opt/
cloudera
/parcels/KAFKA-3.1.0-1.3.1.0.p0.35/lib
数据仓库与Python大数据
·
2023-02-01 00:05
CDH 升级SPARK2 与 问题
本文基于CHD14.2,UBUNTU14.04进行安装注意事项:本文中有chown授权,千万不要图方便直接chown-R/opt/
cloudera
否则会发生你意想不到的惊喜你懂的开始:以下操作基于主节点
会长大的幸福_8bf9
·
2023-01-31 00:02
大数据之CDH5.16.1集成Phoenix
1下载parcelshttp://archive.
cloudera
.com/
cloudera
-labs/phoenix/parcels/latest/下载如下三个文件:CLABS_PHOENIX-4.7.0
LearnBigData
·
2023-01-30 21:59
kudu-安装
1.环境准备CentOS7JDK82.下载kudu仓库文件http://archive.
cloudera
.com/kudu/redhat/7/x86_64/kudu/
cloudera
-kudu.repo3
诗意_面包
·
2023-01-30 08:41
CDH-节点扩展
扩展步骤:准备环境:jdk-1.8、python-2.7、修改hosts环境、安装ntp、关闭防火墙建目录,并将parcel-repo的包拷贝过来|--/opt|--/
cloudera
|--/parcels
Grey____
·
2023-01-28 14:52
星环科技TDH多模型统一架构VS CDH架构
CDH是
Cloudera
的开源平台发行版,通过将Hadoop与其他十几个开源项目集成,为企业大数据业务提供服务。
·
2023-01-28 12:49
数据库
Spark的Job Historyserver无法查看历史日志记录的解决
进入Server页面显示如下Eventlogdirectory:hdfs://quickstart.
cloudera
:8020/user/spark/applicationHistoryNocompletedapplicationsfound
润土1030
·
2023-01-26 11:28
Ubuntu 16.04 安装
Cloudera
Manager 5.15.1
一、下载相关文件ubuntu16.04http://old-releases.ubuntu.com/releases/16.04.3/ubuntu-16.04.4-server-amd64.iso
cloudera
manager
胖骆驼
·
2023-01-26 08:42
CDH6.2.0不兼容CentOS8的问题
华为云安装的CentOS8系统,在上面安装CDH6.2.0,前面也遇到些问题,都解决了,最后遇到下面错误:[root@m182cm6]#sudoyuminstall
cloudera
-manager-daemons
cloudera
-manager-agent
cloudera
-manager-serverError
mylife512
·
2023-01-17 15:33
大数据
大数据
cloudera
flink流处理
--flink_warehousecom.kaikeba.flink1.0-SNAPSHOT4.0.0flink_study--
cloudera
https://repository.
cloudera
.com
给我一个苹果
·
2023-01-12 10:48
flink
scala
big
data
【hive】Use CodedInputStream.setSizeLimit() to increase the size limit
-
Cloudera
Community-131534setorc.compress.size=4096sethive.exec.orc.default.stripe.size=268435456
littlemichelle
·
2022-12-30 01:32
Hive
&
Sql
&
Spark
hive
大数据
hadoop
Ambari3.0.0+BigTop3.2.0 SNAPSHOT初体验
简介
Cloudera
和Hortonworks两家公司合并后,CDH、HDP也合并成了CDP,并且不再开源。
泽芯
·
2022-12-26 09:47
大数据
ambari
big
data
hadoop
spark
【大数据技术Hadoop+Spark】Flume、Kafka的简介及安装(图文解释 超详细)
Flume简介Flume是
Cloudera
提供的一个高可用、高可靠、分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理
showswoller
·
2022-12-26 08:46
大数据
kafka
spark
hadoop
flume
CDH6.3.2集成Apache Atlas2.1.0
1环境准备1.1CDH6.3.2环境搭建参考文档如下
Cloudera
Manager安装CDH6教程-(一)虚拟环境安装配置
Cloudera
Manager安装CDH6教程-(二)搭建
Cloudera
和CDH6CM
CarsonBigData
·
2022-12-23 13:04
大数据
apache
log4j
java
【大数据入门核心技术-Hive】(十五)Hive的Hcatalog详解
一、Hadoop三大发行版本Hadoop三大发行版本:Apache、
Cloudera
、Hortonworks。Apache版本最原始(最基础)的版本,对于入门学习最好。
forest_long
·
2022-12-23 10:03
大数据技术入门到21天通关
大数据
hive
hadoop
数据仓库
hdfs
端口号及作用
CDH端口说明7180
Cloudera
Manager前端端口7182
Cloudera
ManagerServer与Agent通讯端口8888Hue前端端口Hadoop端口说明9870HDFS前端端口8020NameNode
Kazi_1024
·
2022-12-19 09:10
Hadoop
hive
hadoop
大数据
阿里架构师”kafka 数据可靠性深度解读(转)
目前越来越多的开源分布式处理系统如
Cloudera
、ApacheStorm、Spark等都支持与Kafka集成。
wzz没bug
·
2022-12-19 07:23
kafka
kafka
“阿里架构师”kafka 数据可靠性深度解读
目前越来越多的开源分布式处理系统如
Cloudera
、ApacheStorm、Spark等都支持与Kafka集成。
James0502
·
2022-12-19 07:21
java
Java
微服务
源码分析
高可用
高并发
kafka 数据可靠性深度解读
目前越来越多的开源分布式处理系统如
Cloudera
、ApacheStorm、Spark等都支持与Kafka集成。如果想学习Java工程化、高性能及分布式、深入浅出。
javaQQ群 866865133
·
2022-12-19 07:50
Java
spring
kafka
jvm
netty
第1章 大数据概述
惠普等第二次1995年前后互联网信息传输雅虎、谷歌、阿里巴巴、百度、腾讯等第三次2010年前后大数据、云计算和物联网信息爆炸亚马逊、谷歌、IBM、VMware、Palantir、Hortonworks、
Cloudera
wyz191
·
2022-12-19 03:17
大数据技术原理与应用
-
概念
存储
处理
分析与应用
大数据
CDH Parcel包制作流程详解
CDHParcel包制作流程详解背景介绍CDH可以很方便的添加一些大数据相关服务,但这仅限于
cloudera
公司提供。
诸葛余
·
2022-12-15 11:02
cloudera
manger
Spark-3.1.2编译适应 CDH-5.16.2
编译适应CDH-5.16.2这是仓库地址:gitee3.1.2-cdh5.16.2,下载完成后直接运行build-run.sh即可编译教程pom.xml配置修改修改Spark根目录下的pom文件,添加
cloudera
ZackYoungH
·
2022-12-15 11:22
CDH
SPARK
spark
大数据
分布式
CDH6.3.2集成spark-sql完整版本
archive.apache.org/dist/spark/spark-2.4.0/spark-2.4.0-bin-hadoop2.7.tgz解压spark-4.0-bin-hadoop2.7.tgz到/opt/
cloudera
奇科.zhang
·
2022-12-15 11:50
CDH
spark
sql
hadoop
Spark3.0.1 结合CDH6.1.0 编译打包
spark代码gitclonehttps://github.com/apache/spark.gitcdsparkgitcheckout-bv3.0.1_cdh6.1.0v3.0.1#新开一个分支1.添加
Cloudera
maven
屋顶看飞机
·
2022-12-15 11:05
Spark3.0
spark
深入剖析kafka架构内部原理
目前越来越多的开源分布式处理系统如
Cloudera
、ApacheStorm、Spark等都支持与Kafka集成。
weixin_30877181
·
2022-12-11 07:07
运维
数据库
前端
ViewUI
【大数据入门核心技术-Impala】(一)Impala简介
目录一、Impala介绍二、Impala优势三、Impala主要功能一、Impala介绍Impala是
Cloudera
公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase
forest_long
·
2022-12-10 11:34
大数据技术入门到21天通关
大数据
flume
hadoop
Impala
big
data
hadoop2.6.0(单节点)下Sqoop-1.4.6安装与配置(数据读取涉及hadoop、hbase和hive)
下载Sqoophttp://sqoop.apache.org/或http://archive-primary.
cloudera
.com/cdh5/cdh/5/(这个就是版本已经对应好了,不需去弄版本兼容问题了
weixin_33921089
·
2022-12-05 17:03
大数据
数据库
python
Hadoop学习笔记——入门教程(虚拟机安装Linux&Hadoop环境搭建配置)
文章目录一、Hadoop安装配置文档及注意事项二、Hadoop概述2.1、Hadoop是什么2.2、Hadoop的发展历史2.3、Hadoop三大发行版本2.3.1ApacheHadoop2.3.2
Cloudera
Hadoop2.3.3HortonworksHadoop2.4
姓余的
·
2022-12-03 12:47
BigData_Study
linux
大数据
hadoop
分布式消息系统Kafka解析
1、Kafka基本概念1.1Kafka特性Kafka是一个开源的分布式消息系统,支持高吞吐、可持久化、可扩展的流式处理平台,已广泛集成于
Cloudera
、Spark、Flink等分布式分析处理平台
solihawk
·
2022-12-01 02:25
分布式系列
#
kafka
kafka
分布式
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他