E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
研磨hadoop
Presto连接Hive
配置HiveConnectoretc/catalog/hive.propertiesconnector.name=hive-
hadoop
2hive.metastore.uri=thrift://:9083hive.config.resources
kongxx
·
2023-12-17 16:46
7.Sqoop安装
1下载并解压1.1下载地址http://mirrors.hust.edu.cn/apache/sqoop/1.4.6/1.2上传安装包sqoop-1.4.6.bin__
hadoop
-2.0.4-alpha.tar.gz
Rex_2013
·
2023-12-17 15:47
流批一体神器 Flink 之 Flink State 架构原理解析
身为大数据工程师,你还在苦学Spark、
Hadoop
、Storm,却还没搞过Flink?醒醒吧!
zhisheng_blog
·
2023-12-17 14:32
分布式
大数据
编程语言
flink
hadoop
基于
Hadoop
的电商数据分析系统设计与实现
基于
Hadoop
的电商数据分析系统设计与实现DesignandImplementationofE-commerceDataAnalysisSystembasedon
Hadoop
目录目录2摘要3关键词3第一章绪论
wusp1994
·
2023-12-17 13:40
hadoop
电商数据分析
数据分析
高效存储大规模数据的方法与实现
Hadoop
DistributedFileSystem(HDFS)是一个常用的分布式文件系统,它使用主从架构,
静谧星光c
·
2023-12-17 11:47
大数据
基于ambari
hadoop
平台的搭建
环境准备1:jdk安装,防止在/opt/data下,tar–zxf安装包在/opt/apps下所有节点都需要2:sudoaptupdate源升级,所有节点都需要3:/etc/hosts10.68.29.243iZwz9870dk1soyw67s3ephZ10.68.29.244iZwz9870dk1soyw67s3epgZ10.68.29.245iZwz9870dk1soyw67s3eplZ10.
大数据小应用
·
2023-12-17 10:04
kafka学习笔记--节点的服役与退役
如有侵权、联系速删视频教程链接:【尚硅谷】Kafka3.x教程(从入门到调优,深入全面)文章目录服役新节点新节点准备执行负载均衡操作退役旧节点执行负载均衡操作执行停止命令服役新节点依旧使用前面文章创建的三个
hadoop
102
向着百万年薪努力的小赵
·
2023-12-17 10:25
#
Kafka学习--入门到调优
kafka
学习
笔记
物联网架构之
Hadoop
修改/etc/hosts文件192.168.107.197node1192.168.107.196node2192.168.107.195node3创建用户并加入组groupadd
hadoop
useradd-g
hadoop
hduserpasswdhduservim
叮咚网工
·
2023-12-17 10:25
云计算
linux服务器
大数据
架构
hadoop
大数据
HDFS介绍+Shell操作
看黑马网课记录第二章-wwww操]使用命令操作HDFS文件系统_哔哩哔哩_bilibiliHDFS1.什么是HDFS
hadoop
三大组件之一,负责海量数据的分布式存储2.HDFS架构角色:主节点(领导)
Y蓝田大海
·
2023-12-17 10:14
大数据开发
hdfs
hadoop
大数据
Hadoop
分布式配置小白篇(附加各阶段问题解决方式)
3.ssh免密4.创建
hadoop
用户5.jdk、
Y蓝田大海
·
2023-12-17 09:09
大数据开发
hadoop
大数据
分布式
2018-06-14
Hadoop
:1.官网:http://
hadoop
.apache.org/2.
Hadoop
的狭义和褒义认识:狭义:软件(HDFS、MapReduce、Yarn)褒义:以
Hadoop
为主的生态圈3.
Hadoop
hoose
·
2023-12-17 09:26
Flink 简介
Flink简介#一、Flink简介#1.Flink发展这几年大数据的飞速发展,出现了很多热门的开源社区,其中著名的有
Hadoop
、Storm,以及后来的Spark,他们都有着各自专注的应用场景。
lz_matlab
·
2023-12-17 09:09
Flink
flink
大数据
Hadoop
中Join案例
ReduceJoin案例Map端的主要工作:为来自不同表或文件的key/value对,打标签以区别不同来源的记录。然后用连接字段作为key,其余部分和新加的标志作为value,最后进行输出。Reduce端的主要工作:在Reduce端以连接字段作为key的分组已经完成,我们只需要在每一个分组当中将那些来源于不同文件的记录(在Map阶段已经打标志)分开,最后进行合并就ok了。订单数据表t_orderi
zmx_messi
·
2023-12-17 08:43
hadoop
大数据
分布式
Docker中执行tar: Cannot read: Is a directory in docker
我想要在Docker镜像中安装
Hadoop
,下面是Dockerfile的一部分:COPY
hadoop
-3.1.2.tar.gz/usr/
hadoop
/
hadoop
-3.1.2.tar.gzRUNcd/usr
王勇1024
·
2023-12-17 08:04
Hadoop
,Hive和Spark大数据框架的联系和区别
Hadoop
,Hive和Spark是大数据相关工作中最常用的三种框架。1
Hadoop
hadoop
是一个分布式计算框架,是大数据处理的基石,大多其他框架都是以
hadoop
为基础。
Weiyaner
·
2023-12-17 06:00
数据库
大数据
hadoop
mapreduce
spark
Win10下安装大数据开发环境 spark+
hadoop
+hive(实测可用)
Win10下安装大数据开发环境spark+
hadoop
+hive(实测可用)基础环境安装spark安装
Hadoop
安装hive安装总结参考博客基础环境安装首先,我们需要搭建软件的运行环境,本文中所使用的软件均需要运行在
YannAdams
·
2023-12-17 06:30
Spark
Hadoop
Hive
大数据环境
Windows
spark
hadoop
hive
大数据生态中‘
Hadoop
’、‘Hive’、‘Spark’、‘Mapreduce’、‘HDFS’、‘Yarn’是什么关系
所以用到了
Hadoop
生态来管理信息。
Hadoop
生态中HDFS:处理存储,管理信息的分布式存储、提供接口,让用户感觉集群中的信息
小书生啊
·
2023-12-17 06:29
大数据
hadoop
hive
大数据 |
Hadoop
、Hive、Spark的关系
文章总括图数据存储单机数据库时代所有数据在单机都能存的下,数据处理的任务都是IO密集型,更谈不上分布式系统一个典型的2U服务器可以插6块硬盘,每块硬盘4T,共24T原始容量,再加上一些数据包的可用冗余,再加上一些格式化的损失,保守估计一台服务器至少可以有10T以上的可用容量,再加上128G内存和两颗CPU,装入DBMS,稍微调优,单表处理10e条数据问题不大多机数据库时代当数据量变多时,单台机器无
xyzhang2018
·
2023-12-17 06:58
数据库
hadoop
大数据
spark
[AIGC ~大数据] 深入理解
Hadoop
、HDFS、Hive和Spark:Java大师的大数据研究之旅
在这个充满机遇和挑战的领域中,我深入研究了
Hadoop
、HDFS、Hive和Spark等关键技术。本篇博客将从"是什么"、"为什么"和"怎么办"三个角度,系统地介绍这些技术。文章目录是什么?
程序员三木
·
2023-12-17 06:55
AI
大数据
hadoop
AIGC
基于
Hadoop
的铁路货运大数据平台设计与应用
完整下载:基于
Hadoop
的铁路货运大数据平台设计与应用基于
Hadoop
的铁路货运大数据平台设计与应用DesignandApplicationofRailwayFreightBigDataPlatformbasedon
Hadoop
wusp1994
·
2023-12-17 06:24
大数据
hadoop
分布式
Hadoop
文章目录1、
Hadoop
是什么2、
Hadoop
优势3、
Hadoop
组成(1)HDFS(2)YARN(3)MapReduce架构概述(4)HDFS、YARN、MapReduce三者关系(5)大数据技术生态体系
Gong_yz
·
2023-12-17 06:39
大数据
hadoop
分布式
一组【卜算子】,记录生活中点滴
卜算子•自嘲文/何波秉烛夜
研磨
,字纸多笆斗。半世浮翩少锦章,却也逍遥臭。父劝不言从,子语难忘旧。留得酸文暮色中,愿作穷宣究。卜算子•问弦文/何波吐絮跌柔蓝,丹桂摇香阁。帘卷西风朔雁啼,一地相思萼。
納蘭熔婼
·
2023-12-17 06:03
hive学习笔记
1.HIVE结构Hive是建立在
Hadoop
上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在
Hadoop
中的大规模数据的机制。
Tech_Hog
·
2023-12-17 05:05
Hadoop
hadoop
hive
Caused by: java.lang.IllegalStateException: com.google.protobuf.InvalidProtocolBufferException: Prot
1报错
hadoop
中namenode报错Causedby:java.lang.IllegalStateException:com.google.protobuf.InvalidProtocolBufferException
不吃饭的猪
·
2023-12-17 05:34
java
开发语言
Hive学习笔记
只在主节点上安装)(1)下载安装包到/usr/app/目录下(2)解压(3)修改配置文件/etc/profile(添加exportHIVE_HOME=/usr/local/hive-0.9.0-binexport
HADOOP
_HOME
weixin_30470857
·
2023-12-17 05:32
hive 增加表字段语录_HIVE常用SQL语句及语法
addressstring)rowformatdelimitedfieldsterminatedby'\t';创建字段中含有数组类型,对象类型的表,并查询特殊字段外部表默认存在HDFS下的‘/user/
hadoop
weixin_39811386
·
2023-12-17 05:32
hive
增加表字段语录
Hive笔记五:入门教程
摘要:Hive是建立在
Hadoop
上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在
Hadoop
中的大规模数据的机制。
Mojoooo
·
2023-12-17 05:00
hive
hive
hadoop
面试题 5 ---有用
1.0简要描述如何安装配置apache的一个开源
hadoop
,只描述即可,无需列出具体步骤,列出具体步骤更好。
okbin1991
·
2023-12-17 05:00
hadoop
hdfs
大数据
分布式
java
hadoop
学习笔记--13.hive 属性配置、交互式命令行和文件系统交互
一、hive配置文件常见属性1.在cli命令行上显示当前的数据库名以及查询的行头信息在hive-site.xml中添加以下配置hive.cli.print.headertrueWhethertoprintthenamesofthecolumnsinqueryoutput.hive.cli.print.current.dbtrueWhethertoincludethecurrentdatabasei
liuzebin9
·
2023-12-17 05:58
Hadoop
hadoop
hive
【Hive】【
Hadoop
】工作中常操作的笔记-随时添加
文章目录1、Hive复制一个表:2、字段级操作3、hdfs文件统计1、Hive复制一个表:直接Copy文件createtablenew_tableliketable_name;hdfsdfs-get/apps/hive/warehouse/ods.db/table_nameloaddatalocalinpath'/路径'intotablenew_table;修复表:msckrepairtablet
cbigchaos
·
2023-12-17 05:57
#
Hive
#
Hadoop
hadoop
hive
笔记
大数据
第一步:
hadoop
安装基础环境
1.安装vm虚拟机【一路默认】**解决x64的问题需要lenove里面的安全模块启用。2.安装linux安装了5台linux服务器centos准备搭建haddop环境唯一需要配置的就是网络。用nat宿主这种方式。IP192.168.253.12子网掩码255.255.255.0网关192.168.253.2192.168.253.11192.168.253.12192.168.253.13192.
微生命
·
2023-12-17 05:37
《PySpark大数据分析实战》-11.Spark on YARN模式安装
Hadoop
对大数据技术栈
Hadoop
、Hive、Spark、Kafka等有深入研究,对Data
wux_labs
·
2023-12-17 05:16
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
PySpark
《PySpark大数据分析实战》-12.Spark on YARN配置Spark运行在YARN上
对大数据技术栈
Hadoop
、Hive、Spark、Kafka等有深入研究,对Data
wux_labs
·
2023-12-17 05:10
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
PySpark
ubuntu下hbase的搭建和依赖环境搭建以及相关操作
ubuntu从0安装HBase和HBase所依赖的环境的安装配置简单说三步走java环境的安装和配置
hadoop
安装和配置hbase安装和配置我的搭建环境ubuntu:18软件源阿里云java:openjdkversion
不走小道
·
2023-12-17 05:53
笔记
大数据开发
windows环境运行datax缺少本地
hadoop
环境报错:Could not locate executable null\bin\winutils.exe
目录一、完整报错二、解决三、临时解决方案四、其他一、完整报错十二月07,202310:01:05上午org.apache.
hadoop
.util.ShellgetWinUtilsPath严重:Failedtolocatethewinutilsbinaryinthe
hadoop
binarypathjava.io.IOException
zkkkkkkkkkkkkk
·
2023-12-17 04:08
python
报错解决
hadoop
python
java操作cdh得
hadoop
出现java.io.IOException: Failed on local exception: com.google.protobuf.InvalidProt...
这个问题是,java得操作
Hadoop
得api得版本跟haodoop得不一致导致得在
hadoop
中运行/bin/
hadoop
version查看
hadoop
得版本之后将java得api中得jar包版本对应更换
PunkP
·
2023-12-17 03:21
hadoop
学习大纲
Hadoop
集群环境搭建
Hadoop
集群环境搭建HDFS图说HDFS基本原理
hadoop
的shell命令操作javaapi操作HDFSHDFS之namenode管理元数据机制MapReduce初识MapReduceintelij
piziyang12138
·
2023-12-17 00:12
MapReduce
MapReduce是一个分布式运算程序的编程框架,是用户开发“基于
Hadoop
的数据分析应用”的核心框架。
编织幻境的妖
·
2023-12-17 00:53
mapreduce
大数据
Spark(一): 基本架构及原理
Spark提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表数据等)的数据集和数据源(批量数据或实时的流数据)的大数据处理的需求官方资料介绍Spark可以将
Hadoop
集群中的应用在内存中的运行速度提升
hedgehog1112
·
2023-12-16 22:33
查看hive表储存在hdfs的哪个目录下
查看一个HDFS目录占用了多少磁盘空间可以使用
hadoop
fs-d
言之。
·
2023-12-16 22:58
hive
hdfs
hadoop
【Scala】Scala中的一些基本数据类型的特性 列表、元组、构造器、单例对象、伴生类、伴生对象、抽象类与特质
列表使用List(“”,“”,“”)去声明sliding和groued表示迭代器valiter=List("
Hadoop
","Spark","Scala")sliding2//sliding和groued
冲鸭嘟嘟可
·
2023-12-16 20:17
scala
开发语言
后端
【Apache Pinot】Data upload jobtype 粗略分析
离线数据需要通过脚本去生成对应的数据上传到数据库里面,但是其中config中有个jobtype让人有点迷惑,本文简单的做一个概念的整理用处先说一下流程,目前我以hdfs举例,我们的脚本会先把数据通过hdfs的client上传到
hadoop
彭笳鑫
·
2023-12-16 20:05
数据库
apache
pinot
数据库
olap
大数据
【LDAP】LDAP 未授权访问漏洞修复方案
例如:ldapsearch-x-b"dc=
hadoop
,dc=com"-Hldap://10.4.3.3:
kiraraLou
·
2023-12-16 20:28
ldap+kerberos
网络
Flink 本地单机/Standalone集群/YARN模式集群搭建
下载地址:下载Flink的二进制包点进去后,选择如下链接:解压flink-1.10.1-bin-scala_2.12.tgz,我这里解压到soft目录[root@
hadoop
1softpackage]#
程序猿进阶
·
2023-12-16 20:26
Flink
flink
大数据
hbase
这种数据库是
Hadoop
生态下的核心技术之一。HBase的基本架构主要包括四种类型的服务器,这些服务器以主从模式进行协作:RegionServer:这是负责处理数据读写服务的组件。
编织幻境的妖
·
2023-12-16 20:51
hbase
数据库
大数据
数据仓库工具Hive
Hive是一个基于
Hadoop
的数据仓库工具,主要用于处理和分析大规模结构化数据。
编织幻境的妖
·
2023-12-16 20:51
数据仓库
hive
hadoop
Spark
在核心上,Spark是基于内存计算的,这使得它比基于磁盘计算的
Hadoop
MapReduce更快。
编织幻境的妖
·
2023-12-16 20:16
spark
大数据
分布式
Hbase2.1 集群搭建
>Hbase在大数据的体系中扮演着DB角色,不得不说是重要的一员,在上一篇,大猪已经给大家演示了[
Hadoop
3.2集群搭建](https://www.jianshu.com/p/3182aaff918d
kikiki4
·
2023-12-16 19:41
黑猴子的家:hive-start.sh
[alex@
hadoop
102~]$cd/usr/local/bin/[alex@
hadoop
102bin]$sudotouchhive-start.sh[alex@
hadoop
102bin]$sudochownalex
黑猴子的家
·
2023-12-16 19:10
Sqoop安装与配置-shell脚本一键安装配置
Sqoop是一个用于在Apache
Hadoop
和结构化数据存储(如关系数据库)之间传输数据的工具。
大数据魔法师
·
2023-12-16 18:31
大数据
sqoop
hadoop
hive
上一页
35
36
37
38
39
40
41
42
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他