E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
研磨hadoop
一文读懂:制造业头部企业如何构建经营分析数字化体系
用BI数据分析手段,通过SAPBW/4HANA、SAPSACPlanning、数据中台、
Hadoop
等构建大数据平台,实现企业经营分析的数字化在近年逐步被认可和推崇,尤其是数字化场景的经营分析会成为数字化转型的亮点应用之一
智扬信达
·
2023-12-01 09:11
业务
big
data
数据挖掘
数据分析
制造
Spark写入es:Es
Hadoop
RemoteException: version_conflict_engine_exception
背景介绍业务场景:spark批量写入es,基于es-
hadoop
组件实现批处理任务定时调度cdh5.5.3集群,spark2.3,elasticsearch6.4.3es中对应索引的_id由程序控制,保证全局唯一仅测试环境出现
weixin_34117522
·
2023-12-01 09:59
大数据
java
scala
CentOS7.5搭建
Hadoop
-3.3.6集群的详细操作流程-实操版本
一、准备工作1、安装VMware,已安装的,跳过此步骤即可官方正版VMware下载(16pro):https://www.aliyundrive.com/s/wF66w8kW9ac安装:选一下安装地址,一直下一步即可。(可能会要求重启电脑,重启即可)2、安装CentOS7.5下载Linux系统镜像(阿里云盘不限速):https://www.aliyundrive.com/s/UQMBPEovxNg
落叶,听雪
·
2023-12-01 07:43
hadoop
大数据
分布式
从
Hadoop
框架与MapReduce模式中谈海量数据处理(含淘宝技术架构)
前言最近凡是空闲时,便在看“
Hadoop
”,“MapReduce”“海量数据处理”这方面的论文。
Alukar
·
2023-12-01 05:17
2019-08-28
液体离心涡旋技术:是国内唯一可以将高纤维食物垃圾
研磨
成
自诩顽石奈何草木
·
2023-12-01 05:34
一周热点:IBM新技术使网速达400G/s,硬盘会“烧掉”吗
本周云计算内容精彩纷呈,有IBM发布新网络传输技术,速度最高可达400Gbps,四大著名风投眼中的大数据初创公司,Moz公司CEO结合自身创业实践解读如何理智使用AWS,还有Intel发布15核芯片以及其软硬兼备的
Hadoop
wfwserhdext
·
2023-12-01 01:32
shdethy
牛逼啊
勇士托尼和女巫海伦的故事
有时她仔细地把各种药材
研磨
成粉,杵成浆,然后按部就班地丢进坩埚里搅拌。有时她也会从书架上取下基本砖头一样厚的古籍,坐在炉火边一读就是一下午。
奇幻芍药糖
·
2023-12-01 00:21
flink写入带kerberos认证的kudu connector
文章目录前言一、介绍二、先来看kudujavaapi认证kerberos1.首先需要进行kerberos的验证(需要将相应用户的keytab文件引入本地)2.依赖3.引入
hadoop
配置文件4.获取客户端
重生之我在异世界打工
·
2023-11-30 22:03
flink
flink
Hadoop
之HDFS
2)定义:HDFS(
Hadoop
DistributedFileSystem),它是一个文件系统,用于存储文件,通过目录树来定位
小猫旺财
·
2023-11-30 20:11
Hadoop
hadoop
hdfs
big
data
大数据
HDFS概述
文章目录一、HDFS概述1.什么是HDFS2.HDFS基本架构3.搭建[HDFS]4.安装
hadoop
5.
hadoop
配置文件的配置etc/
hadoop
6.namenode的格式化7.启动
hadoop
守护进程
~chun
·
2023-11-30 20:11
数据
HDFS详解
HDFS架构剖析HDFS,
Hadoop
DistributeFileSystem(
Hadoop
分布式文件系统)的简称,它是
Hadoop
核心组件之一,是大数据生态圈最底层的分布式存储服务。
liuhanyuu
·
2023-11-30 20:09
hdfs
hadoop
大数据
大数据-HDFS的定义、使用场景、优缺点、组成架构
HDFS定义HDFS(
Hadoop
DestributedFileSystem)是一个分布式的文件系统,用于存储文件,通过目录树来定位文件HDFS使用场景适合一次写入,多次读取的场景,不支持文件的修改HDFS
hmyqwe
·
2023-11-30 20:08
HDFS
大数据
【
Hadoop
】分布式文件系统 HDFS
数据复制复制的实现原理三、HDFS的特点四、图解HDFS存储原理1.写过程2.读过程3.HDFS故障类型和其检测方法故障类型和其检测方法读写故障的处理DataNode故障处理副本布局策略一、介绍HDFS(
Hadoop
DistributedFileSystem
和瑚
·
2023-11-30 20:06
#
Hadoop
hadoop
hdfs
大数据
Linux(三):“/”和“~”的区别
而每个用户都有”家“目录,也就是用户的个人目录,比如root用户的”家“目录就是/root,普通用户
hadoop
的家目录就是/home/
hadoop
。
CodingALife
·
2023-11-30 18:20
Linux
linux
Hyper-v虚拟机
Hadoop
集群搭建
大数据
Hadoop
简介
Hadoop
是一个由Apache基金会所开发的分布式系统基础架构。
Hadoop
实现了一个分布式文件系统(
Hadoop
DistributedFileSystem),简称HDFS。
真.电脑人
·
2023-11-30 16:16
hadoop
大数据
分布式
大数据学习-离线数仓项目实战笔记(上)
1.前置1.1.软件版本产品版本
Hadoop
2.9.2Hive2.3.7Flume1.9DataX3.0Airflow1.10Atlas1.2.0Griffin0.4.0Impalaimpala-2.3.0
ys4tnaf
·
2023-11-30 15:24
hadoop
大数据
数据仓库
hive
flume
大数据项目实践过程笔记
开发工具intelijidea2.19.3目前围绕
Hadoop
体系的大数据架构包括:传统大数据架构数据分析的业务没有发生任何变化,但是因为数据量、性能等问题导致系统无法正常使用,需要进行升级改造,那么此类架构便是为了解决这个问题
提莫_
·
2023-11-30 15:54
BigData
大数据
【大数据学习笔记-1】大数据
hadoop
平台基本组件
Hadoop
是一个由Apache基金会所开发的分布式计算和存储架构。说人话的通俗描述:你在爱奇艺网站看过一次科幻片后,下次再登录爱奇艺,首页会把最新科幻动作片推送给你,目的是要向你多收点会员费。
工匠小能手
·
2023-11-30 15:19
相关概念和应用场景
大数据
Hbase学习笔记(三)Shell操作
[leon@
hadoop
102HBase]$bin/HBaseshell1.其他操作1.1查看集群状态使用status可以查看集群状态,默认为summary,可以选择‘simple’和‘detailed
做个合格的大厂程序员
·
2023-11-30 15:59
大数据之
Hadoop
hadoop
主要解决:海量数据的存储和海量数据的分析计算
hadoop
发展历史Google是
hadoop
的思想之源(Google在大数据方面的三篇论文)2006年3月,Map-reduce和NutchDistributedFileSystem
小裕哥略帅
·
2023-11-30 13:41
大数据
hadoop
java
01数仓平台
Hadoop
介绍与安装
Hadoop
概述
Hadoop
是数仓平台的核心组件。在
Hadoop
1.x时代,
Hadoop
中的MapReduce同时处理业务逻辑运算和资源调度,耦合性较大。在
Hadoop
2.x时代,增加了Yarn。
kk_io
·
2023-11-30 13:38
数据仓库
hadoop
大数据
分布式
hadoop
简介
大数据和
hadoop
的关系:随着近几年计算机技术和互联网的发展,“大数据”这个名词越来越多进入我们的视野。大数据的快速发展也在无时无刻影响着我们的生活。那大数据究竟是什么呢?
owlcity123
·
2023-11-30 13:06
电商平台数据仓库搭建02-
Hadoop
集群搭建
虚拟机需要配置3台,分别为
Hadoop
102,
Hadoop
103,
Hadoop
104。配置ssh、jdk1.vm-tools,并创建新用户
hadoop
并配置root权
王小磊~
·
2023-11-30 13:04
电商数据仓库搭建
hadoop
数据仓库
hive
sql
大数据
【
Hadoop
】集群资源管理器 YARN
一、yarn简介ApacheYARN(YetAnotherResourceNegotiator)是
hadoop
2.x引入的分布式资源管理系统。
和瑚
·
2023-11-30 13:34
#
Hadoop
hadoop
大数据
分布式
在centos7上搭建
hadoop
大数据平台
目录一、安装搭建java环境1、安装方法2、查看是否已安装3、卸载4、安装4.1检查yum中有没有java1.8包4.2开始安装5、验证二、
Hadoop
安装1、下载2、准备启动
Hadoop
集群2.1配置
船长灬普朗克
·
2023-11-30 13:03
大数据
hadoop
大数据
java
Windows11编译
Hadoop
3.3.6源码
kontext-tech/winutils还未发布3.3.6版本,因此尝试源码编译目录环境和安装包准备,见2zlib编译方法一:方法二:配置文件更改1.maven阿里云镜像2.Node版本3.越过Javadoc检查编译
Hadoop
Error
斐硕人
·
2023-11-30 13:33
僧旅
hadoop
数据仓库搭建
目录1数据仓库概念1.1什么是数据仓库1.2OLTP与OLAP2项目需求及架构设计3项目框架4框架版本选型4.1
Hadoop
版本综述4.2社区版与第三方发行版的比较4.2.1.Apache社区版4.2.2
赵广陆
·
2023-11-30 13:32
bigdata
数据仓库
00
Hadoop
数据仓库平台
在这里是学习大数据的第一站什么是数据仓库常见大数据平台组件及介绍什么是数据仓库在计算领域,数据仓库(DW或DWH)也称为企业数据仓库(EDW),是一种用于报告和数据分析的系统,被认为是商业智能的核心组件。数据仓库是来自一个或多个不同来源的集成数据的中央存储库。它们将当前和历史数据存储在一个位置,用于为整个企业的员工创建分析报告。这对公司来说是有益的,因为它使他们能够询问数据并从数据中汲取见解并做出
kk_io
·
2023-11-30 13:29
数据仓库
hadoop
数据仓库
大数据
2019-12-11
Hive是基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
diedfish_qyf
·
2023-11-30 11:41
Ubuntu 文件系统成为只读模式的解决办法
虚拟机环境的Linux系统由于是虚拟化虚拟出来的主机环境,因此经常会出现一些操作系统的问题,今天我遇到了一个Ubuntu操作系统文件系统成了只读模式,无法进行系统的操作,由于出问题的主机是我个人搭建的
Hadoop
Kevin-K先森
·
2023-11-30 10:46
Android
技术···
技术
Ubuntu
Hadoop
-HDFS详解与HA,完全分布式集群搭建(细到令人发指的教程)
是什么hdfs的由来hdfs架构体系hdfs的优缺点优点缺点二、HDFS_block简介和注意事项Block拆分标准三、HDFS_block安全与管理Block数据安全Block的管理效率四、HDFS_
Hadoop
3
毫无感情的dj
·
2023-11-30 10:06
hadoop
hdfs
大数据
分布式
zookeeper
Hadoop
-HDFS角色工作机制
一、角色职责介绍
Hadoop
DistributedFileSystem(HDFS,分布式文件系统):HDFS是
Hadoop
应用程序使用分布式存储,HDFS集群主要由管理文件系统元数据的NameNode
H.S.T不想卷
·
2023-11-30 10:33
大数据
hadoop
hdfs
大数据
【大数据
Hadoop
】HDFS-Namenode-format格式化的源码步骤分析
Namenodeformat流程格式化命令源码解读初始化操作格式化操作本地写VERSION文件JournalManager的格式化持久化FsImage文件流程根据配置项获取nameserviceId、namenodeId判断配置项dfs.namenode.support.allow.format是否允许格式化,一般生产环境建议配置,防止误操作格式化了已有数据。获取格式化的目录(fsImage和ed
笑起来贼好看
·
2023-11-30 10:30
Hadoop
大数据
服务运维部署
hadoop
大数据
hdfs
大数据技术之
Hadoop
(HDFS)
2.HDFS定义HDFS(
Hadoop
DistributedFileSystem),它是一个文件系统,用于存储文件,
江苏彭与晏
·
2023-11-30 10:23
hadoop
大数据
hdfs
大数据 -
Hadoop
- HDFS
前言
Hadoop
是一个专为离线和大规模数据分析而设计的,并不适合那种对几个记录随机读写的在线事务处理模式。
蒙蒙的林先生
·
2023-11-30 10:21
大数据
大数据
大数据
hadoop
hdfs
大数据
Hadoop
-HDFS_架构、读写流程
大数据
Hadoop
-HDFS基本系统架构HDFS架构包含三个部分:NameNode,DataNode,Client。NameNode:NameNode用于存储、生成文件系统的元数据。运行一个实例。
大沙头三马路
·
2023-11-30 09:48
BigDate
Linux
大数据
hadoop
hdfs
HCIA
大数据-
hadoop
-hdfs
Hadoop
分布式文件系统(HDFS)是指被设计成适合运行在通用硬件(commodityhardware)上的分布式文件系统(DistributedFileSystem)。
像影子追着光梦游_
·
2023-11-30 09:48
大数据
hadoop
hdfs
大数据
Hadoop
-HDFS_元数据持久化
大数据
Hadoop
-HDFS_元数据持久化(1)在HDFS第一次格式化后,NameNode(即图中的主NameNode)就会生成fsimage和editslog两个文件;(2)备用NameNode(即图中的备
大沙头三马路
·
2023-11-30 09:14
BigDate
Linux
大数据
hadoop
hdfs
linux
【物联网与大数据应用】
Hadoop
数据处理
Hadoop
是目前最成熟的大数据处理技术。
Bosenya12
·
2023-11-30 09:06
大数据
hadoop
分布式
Map和Reduce在
Hadoop
与Python中有何异同?
Hadoop
是一个大数据处理平台,也是一个集群,能够对海量数据进行存储和运算。MapReduce是
Hadoop
众多组件当中的一个。
值得一看的喵
·
2023-11-30 09:25
阿里云ECS-Centos7.9集群部署Redis服务遭木马攻击
阿里云ECS-Centos7.9集群部署Redis服务遭木马攻击#背景阿里云ECS-Centos7.9集群:
hadoop
202,
hadoop
203,
hadoop
204
hadoop
202启动redis-server
start@today
·
2023-11-30 07:45
Linux
阿里云ECS
Redis安全漏洞
阿里云
redis
运维
MapReduce的基础知识
1、什么是MapReduce
Hadoop
MapReduce是一个分布式计算框架,用于轻松编写分布式应用程序,这些应用程序以可靠,容错的方式并行处理大型硬件集群(数千个节点)上的大量数据(多TB数据集)MapReduce
huan1993
·
2023-11-30 07:44
scp(secure copy)安全拷贝和rsync远程同步的区别
(fromserver1toserver2)(2)基本语法#命令递归要拷贝的文件路径/名称目的用户@主机:目的路径/名称scp-r$pdir/$fname$user@
hadoop
$host:$pdir/
宇文智
·
2023-11-30 05:09
大数据技术
安全
服务器
linux
Hadoop
学习笔记---大数据概论入门
第一章:大数据概念大数据是指无法在一定时间范围内,用常用的工具软件进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。大数据主要解决海量数据的采集、存储和分析计算问题。按顺序给出存储单位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。1Byte=8bit1KB=1024MB1MB=102
沉迷技术不能自拔
·
2023-11-30 05:14
大数据
hadoop
学习
Hadoop
入门笔记
第1章
Hadoop
概述1.1
Hadoop
是什么1.2
Hadoop
发展历史(了解)1.3
Hadoop
三大发行版本(了解)
Hadoop
三大发行版本:Apache、Cloudera、Hortonworks。
阳宝宝的向日葵
·
2023-11-30 05:44
大数据
hadoop
hdfs
big
data
Hadoop
入门+组成学习笔记
Hadoop
学习笔记
Hadoop
的优势(4高)1.高可靠性—
Hadoop
底层有多个数副本,保存再不同的服务器里,即使一台计算机出现故障,也不会丢失数据2.高扩展性—可以添加多个节点3.高效性—再MapReduce
Fan_Coder
·
2023-11-30 05:14
Hadoop
hadoop
大数据
mapreduce
Hadoop
入门学习笔记-第五天(
hadoop
-hive安装部署与配置笔记)
1.准备安装包:MySQL-5.6.26-1.linux_glibc2.5.x86_64.rpm-bundlemysql-connector-java-5.1.39.jar(驱动,需要放入/hive/lib)apache-hive-1.2.1-bin.tar.gz2.安装mysql数据用于储存元数据,hive自带Derby,但该数据库不稳定,使用mysql作为元数据管理1).只需要安装在集群里面的
渣男程序员007
·
2023-11-30 05:44
Hadoop入门学习笔记
数据库
hadoop
mysql
java
hive
Hadoop
入门学习笔记-第六天(hive数据库命令相关操作)
hive命令行操作/user/hive/warehouse(hdfs目录))说明:hive创建的数据库和数据库表都存在hdfs,一般默认目录为:/user/hive/warehouse1…创建hive的数据库1.hive创建数据库的最简单写法和mysql差不多:createdatabasefoo;2.仅当名为foo的数据库当前不存在时才创建:createdatabaseifnotexistsfoo
渣男程序员007
·
2023-11-30 05:44
Hadoop入门学习笔记
hadoop
数据库
java
hive
mysql
Hadoop
入门学习笔记
视频课程地址:https://www.bilibili.com/video/BV1WY4y197g7课程资料链接:https://pan.baidu.com/s/15KpnWeKpvExpKmOC8xjmtQ?pwd=5ay8这里写目录标题一、VMware准备Linux虚拟机1.1.VMware安装Linux虚拟机1.1.1.修改虚拟机子网IP和网关1.1.2.安装Linux虚拟机1.2.VMwa
faith瑞诚
·
2023-11-30 05:43
hadoop
学习
笔记
Hadoop
入门学习笔记-第四天(wordCount实例代码编写笔记)
1.新建一个maven项目2.pom文件中引入以下jar包org.apache.
hadoop
hadoop
-client2.7.3org.apache.
hadoop
hadoop
-common2.7.3org.apache.
hadoop
hadoop
-hdfs2.7.3org.apache.
hadoop
hadoop
-client2.7.33
渣男程序员007
·
2023-11-30 05:43
Hadoop入门学习笔记
java
大数据
hadoop
mapreduce
spark
上一页
42
43
44
45
46
47
48
49
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他