E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop详细配置
IDEA 插件 - EasyCode,MyBatis 代码生成器最优配置!
具体安装步骤,不再赘述,仅附上个人工作、学习中的对EasyCode的
详细配置
。
Geek攻城猫
·
2024-01-05 08:03
效率
大数据高级开发工程师——
Hadoop
学习笔记(4)
文章目录
Hadoop
进阶篇MapReduce:
Hadoop
分布式并行计算框架MapReduce的理解MapReduce的核心思想MapReduce编程模型MapReduce编程指导思想【八大步骤】Map
讲文明的喜羊羊拒绝pua
·
2024-01-05 08:20
大数据
hadoop
mapreduce
大数据学习方向
一、大数据运维之Linux基础打好Linux基础,以便更好地学习
Hadoop
,hbase,NoSQL,Spark,Storm,docker,openstack等。
乐姐
·
2024-01-05 08:18
大数据
大数据
大数据学习
大数据开发
大数据入门
人工智能
大数据开发学习资料汇总
目录大数据系列
Hadoop
Hadoop
权威指南
Hadoop
权威指南修订
Hadoop
实战
Hadoop
实战_2
Hadoop
源码分析大数据处理系统:
Hadoop
源代码情景分析
Hadoop
开发者入门专刊
Hadoop
比屋大数据
·
2024-01-05 08:44
大数据架构师源码零基础教程
大数据
linux
运维
【大数据进阶第二阶段之
Hadoop
学习笔记】
Hadoop
概述
【大数据进阶第二阶段之
Hadoop
学习笔记】
Hadoop
概述-CSDN博客【大数据进阶第二阶段之
Hadoop
学习笔记】
Hadoop
运行环境搭建-CSDN博客【大数据进阶第二阶段之
Hadoop
学习笔记】
Hadoop
伊达
·
2024-01-05 08:12
Hadoop
大数据
大数据
学习
hadoop
Hadoop
大数据生态系统及常用组件简介
经过多年信息化建设,我们已经进入一个神奇的“大数据”时代,无论是在通讯社交过程中使用的微信、QQ、电话、短信,还是吃喝玩乐时的用到的团购、电商、移动支付,都不断产生海量信息数据,数据和我们的工作生活密不可分、须臾难离。什么是大数据什么是大数据,多大算大,100G算大么?如果是用来存储1080P的高清电影,也就是几部影片的容量。但是如果100G都是文本数据,比如我们的后端kafka里的数据,抽取一条
669生活
·
2024-01-05 08:11
大数据
编程语言
人工智能
大数据
程序员
编程语言
hadoop
【大数据(一)】
hadoop
2.4.1集群搭建(重点)
1.准备Linux环境1.0先将虚拟机的网络模式选为NAT1.1修改主机名vi/etc/sysconfig/networkNETWORKING=yesHOSTNAME=server1.itcast.cn1.2修改ip地址vi/etc/sysconfig/network-scripts/ifcfg-eth0重新启动网络:servicenetworkrestart1.3修改ip地址和主机名的映射关系v
幸福巡礼
·
2024-01-05 08:09
大数据
php
开发语言
java与大数据:
Hadoop
与MapReduce
Hadoop
和MapReduce是由Apache软件基金会开发和维护的开源项目。它们的出现主要是为了解决传统的数据处理工具无法处理大数据量的局限性。首先,让我们深入了解一下
Hadoop
。
naer_chongya
·
2024-01-05 08:38
大数据
java
hadoop
【大数据进阶第二阶段之
Hadoop
学习笔记】
Hadoop
运行环境搭建
【大数据进阶第二阶段之
Hadoop
学习笔记】
Hadoop
概述-CSDN博客【大数据进阶第二阶段之
Hadoop
学习笔记】
Hadoop
运行环境搭建-CSDN博客【大数据进阶第二阶段之
Hadoop
学习笔记】
Hadoop
伊达
·
2024-01-05 08:08
大数据
Hadoop
大数据
hadoop
学习
【大数据进阶第二阶段之
Hadoop
学习笔记】
Hadoop
运行模式
【大数据进阶第二阶段之
Hadoop
学习笔记】
Hadoop
概述-CSDN博客【大数据进阶第二阶段之
Hadoop
学习笔记】
Hadoop
运行环境搭建-CSDN博客【大数据进阶第二阶段之
Hadoop
学习笔记】
Hadoop
伊达
·
2024-01-05 08:08
大数据
hadoop
学习
字节跳动 Spark 支持万卡模型推理实践
背景介绍在云原生化的发展过程中Kubernetes由于其强大的生态构建能力和影响力,使得包括大数据、AI在内越来越多类型的负载应用开始向Kubernetes迁移,字节内部探索Spark从
Hadoop
迁移到
字节跳动云原生计算
·
2024-01-05 06:09
spark
大数据
分布式
HBase 和 Hive 的差别是什么,各自适用在什么场景中?
一、区别:Hbase:
Hadoop
database的简称,也就是基于
Hadoop
数据库,是一种NoSQL数据库,主要适用于海量明细数据(十亿、百亿)的随机实时查询,如日志明细、交易清单、轨迹行为等。
杰在天涯
·
2024-01-05 05:23
大数据与
hadoop
的介绍
大数据是什么,什么是大数据?萝卜和青菜各自有各自的看法,下面说说我所了解到的大数据,那,就从大数据特征说起:大数据,不仅仅具备大的特征,只有外行人才会天真的以为大数据,就是数据,量大!量大只是大数据其中的一个特征,除了这个特征之外,它还和另外三个特征和起来组成了大数据必不可少的四个特征:Volume大量的海量的数据Variety多种多样的数据的类型多种多样,比如数据来源多样,企业内部的日志,互联网
昨天_03fb
·
2024-01-05 00:31
kudu NoSQL数据库详解
一、Hbase、Kudu和ClickHouse对比
Hadoop
生态圈中HDFS一直用来保存底层数据。
wespten
·
2024-01-04 23:09
数据库存储
块存储
文件存储
对象存储
分布式网络存储
ui
金色麦芒的2023
通过学习
Hadoop
、Spark等框架,我掌握了大数据的存储、处理和分析技术,能够更高效地处理大规模数据集。同时,我也深入学习
溜达的大象
·
2024-01-04 22:44
程序人生
Hadoop
集群三节点搭建(一)
一、第一台虚拟机准备确认是可以上网,方便下载文件和工具,使用ping命令测试下安装工具net-tool:工具包集合,包含ifconfig等命令,大家可以根据自己需要按需下载创建普通用户attest,并修改attest用户的密码配置attest用户具有root权限,方便后期加sudo执行root权限的命令在/opt目录下创建文件夹,并修改所属主和所属组二、安装JDK卸载虚拟机自带的JDKrpm-qa
DIY……
·
2024-01-04 21:08
hadoop
java
大数据
微信基于StarRocks的湖仓一体实践
作者:StarRocksActiveContributer、微信OLAP内核研发工程师微信作为国内活跃用户最多的社交软件,其数据平台建设经历了从
Hadoop
到ClickHouse亚秒级实时数仓的阶段,但仍旧面临着数据体验割裂
StarRocks_labs
·
2024-01-04 20:38
后端
大数据应用场景-搜索引擎概述
从互联网网页爬取网页数据,存储到网页库;2.建立索引:分析整理爬虫收集到的数据资源,建立索引,为检索系统提供数据;3.提供检索服务:从预处理好的资源里挑选出用户最满意的结果最快最好的展现给用户;二.基于
Hadoop
MapReduce
GuangHui
·
2024-01-04 16:14
hbase编程
importorg.apache.
hadoop
.conf.Configuration;importorg.apache.
hadoop
.hbase.
SunsPlanter
·
2024-01-04 15:23
数据库
11111111
参考步骤1.使用vim编辑器打开/usr/local/
hadoop
/etc/
hadoop
/core-site.xml文件,它的初始内容如下:修改以后,core-site.xml文件的内容如下:
hadoop
.tmp.dirfile
SunsPlanter
·
2024-01-04 15:23
tomcat
服务器
java
2024.1.3 Spark on Yarn部署方式与工作原理
YARN模式:这是一种分布式资源管理器,可以与
Hadoop
集成,将
白白的wj
·
2024-01-04 11:44
spark
大数据
分布式
开发语言
python
【数据湖架构】数据湖101:概述
数据湖是非结构化和结构化数据池,按原样存储,没有特定的目的,可以建立在多种技术上,如
Hadoop
,NoSQL,AmazonSimpleStorageService,关系数据库或各种组合根据一份名为“什么是数据湖
架构师研究会
·
2024-01-04 10:08
数据管理
数据架构
数据应用架构
架构
数据湖
Flume基础知识(四):Flume实战之实时监控单个追加文件
1)案例需求:实时监控Hive日志,并上传到HDFS中2)需求分析:3)实现步骤:(1)Flume要想将数据输出到HDFS,依赖
Hadoop
相关jar包检查/etc/profile.d/my_env.sh
依晴无旧
·
2024-01-04 10:08
大数据
flume
大数据
日志框架之Logback的使用与
详细配置
概述Logback是一个Java日志框架,是log4j项目的继承者,也是log4j创始人设计的另一个开源日志组件,性能比log4j要好。它旨在解决log4j存在的一些问题,并提供了更高效和更灵活的日志框架。Logback特点:高性能:采用异步日志机制,可以将日志操作和业务逻辑分离,从而大幅度提升系统的性能。灵活的配置:支持多种不同的配置方式,包括基于XML、Groovy、JSON等格式的配置文件,
kkkkatoq
·
2024-01-04 10:15
logback
Java技术栈 ——
Hadoop
入门(一)
Java技术栈——
Hadoop
入门(一)一、
Hadoop
第一印象二、安装
Hadoop
三、
Hadoop
解析3.1
Hadoop
生态介绍3.1.1MapReduce-核心组件3.1.2HDFS-核心组件3.1.3YARN
键盘国治理专家
·
2024-01-04 08:02
Java技术栈
java
hadoop
开发语言
大数据-HDFS原理
HDFS(
Hadoop
DistributionFileSystem)是基于谷歌发布的GFS论文设计的;出了具有其他文件系统具有的特性之后,HDFS还具有:高容错性:认为硬件总是不可靠的;高吞吐量:为大量数据访问的应用提供高吞吐量的支持
运维仙人
·
2024-01-04 07:00
大数据
运维
【
Hadoop
-HDFS-S3】HDFS 和存储对象 S3 的对比
【
Hadoop
-HDFS-S3】HDFS和存储对象S3的对比1)可扩展性2)数据的高可用性3)成本价格4)性能表现5)数据权限6)其他限制虽然Apache
Hadoop
以前都是使用HDFS的,但是当
Hadoop
bmyyyyyy
·
2024-01-04 07:25
Hadoop
hadoop
hdfs
大数据
#存储对象
#S3
对比Pig、Hive和SQL,浅看大数据工具之间的差异
以下为译文有人说对于大数据分析来说
Hadoop
才是炙手可热的新技术,SQL虽然久经考验但已经有些过时了。这话说得不错,但有非常多的项目都用
Hadoop
作
MayerBin
·
2024-01-04 06:09
CloudManager大数据本地环境标准部署文档
一、基本信息文档目的:标准化、规范化
Hadoop
在本地化环境中部署所涉及的操作和流程,以便高效、高质地落地本地化环境部署的工作。
有语忆语
·
2024-01-04 04:29
大数据之数据仓库
项目
大数据
【SpringBoot框架篇】34.使用Spring Retry完成任务的重试
SpringRetry是从SpringBatch独立出来的一个功能,已经广泛应用于SpringBatch,SpringIntegration,SpringforApache
Hadoop
等Spring项目
皓亮君
·
2024-01-04 04:45
spring
spring
boot
后端
spring-retry
java
多台机器的时钟同步
本文将以第二种方式介绍三台机器之间的时间同步具体的操作步骤:本文是以centos6.5作为服务器搭建的三台机器
Hadoop
伪分布式的平台,解决三台机器之间的时间同步的问题,主机master的IP为192.168.141.130
无为二里
·
2024-01-04 03:26
hadoop
时钟同步
docker-compose部署
hadoop
集群(高可用)—— 筑梦之路
hadoop
高可用依赖组件zookeeper1.下载二进制文件###1、zookeeper#下载地址:https://zookeeper.apache.org/releases.html#zookeeper
筑梦之路
·
2024-01-04 03:11
数据库技术
大数据
Java技术
hadoop
docker
大数据
从零开始了解大数据(六):数据仓库Hive篇
目录前言一、数据仓库基本概念二、ApacheHive入门1.ApacheHive概述2.ApacheHive架构与组件三、ApacheHive安装部署1.ApacheHive部署实战(1)
Hadoop
与
橘子-青衫
·
2024-01-04 02:51
大数据
从零开始了解大数据
大数据
数据仓库
hive
hadoop
分布式
从零开始了解大数据(五):YARN篇
目录前言一、
Hadoop
YARN介绍二、
Hadoop
YARN架构与组件1.ResourceManager(RM)2.NodeManager(NM)3.ApplicationMaster三、程序提交YARN
橘子-青衫
·
2024-01-04 02:20
大数据
从零开始了解大数据
大数据
hadoop
分布式
从零开始了解大数据(七):总结
系列文章目录从零开始了解大数据(一):数据分析入门篇-CSDN博客从零开始了解大数据(二):
Hadoop
篇-CSDN博客从零开始了解大数据(三):HDFS分布式文件系统篇-CSDN博客从零开始了解大数据
橘子-青衫
·
2024-01-04 02:19
从零开始了解大数据
大数据
大数据
hadoop
hive
big
data
hdfs
数据仓库
MapReduce计算模型、数据流和控制流,
Hadoop
流的工作原理
1、Job在
Hadoop
中,每个MapReduce任务都被初始化为一个Job。每个Job又可以分为两个阶段:Map阶段和Reduce阶段。这两个阶段分别用两个函数来
南宫凝忆
·
2024-01-04 01:47
Hadoop
mapreduce
大数据
big
data
VirtualBox6.0 搭建Ubuntu18.04集群环境
image.png2、下载Ubuntu18.04镜像应为计划搭建
hadoop
集群,所以用server版本。
大道至简非简
·
2024-01-04 00:54
Vector CANoe VT System系列板卡介绍,
详细配置
、使用、panel、CAPL脚本编写,保姆级教程
VectorCANoeCAPL系列相关文章导览,下面链接可直接跳转CAPL入门到精通文章导览VectorCANoeVTSystem系列板卡文章导览,下面链接可直接跳转VectorCANOEVT7001A配置详解VectorCANOEVT2004A配置详解VectorCANOEVT2516A配置详解VectorCANOEVT2816A配置详解VectorCANOEVT2820配置详解VectorCA
diagCar
·
2024-01-04 00:06
CANOE之VT
System
信息与通信
测试工具
汽车
车载系统
功能测试
Spark相关知识点(期末复习集锦)
一、Spark简介Spark,拥有
hadoop
MR所具有的优点,但不同于MR的是job中监测结果可以保存在内存中,从而不再需要读写HDFS,因此spark能够更好的适用于数据挖掘与机器学习等需要迭代的mr
夜をむかえる
·
2024-01-03 22:49
spark
大数据
分布式
Spark向Hbase中写数据报异常:org.apache.
hadoop
.hbase.client.RetriesExhaustedWithDetailsException: Failed 5
解决:将第二行代码中的表名写全,并指定在哪个名称空间valtable:Table=con.getTable(TableName.valueOf("info:tb_order"))
夺命大翻斗
·
2024-01-03 22:12
spark
hbase
apache
关于Cloudera
Hadoop
的安装(CentOS)- 官文标注(待完成)
CDH5andClouderaManager5RequirementsandSupportedVersionsInanenterprisedatahub,ClouderaManagerandCDHinteractwithseveralproductssuchasApacheAccumulo,ApacheImpala(incubating),Hue,ClouderaSearch,andClouder
DazzlingTiger
·
2024-01-03 21:15
Hadoop
Linux
hadoop
cloudera
安装
hive基本概念原理与底层架构
hive是一个数据仓库基础工具在
hadoop
中用来处理结构化的数据,它架构在
hadoop
之上,总归为大数据,并使得查询和分析方便,提供简单的sql查询功能,可以讲sql语句转换成mapreduce任务进行
byway_lyn
·
2024-01-03 20:22
大数据
Hadoop
入门学习线路图
Hadoop
是系统学习大数据的必会知识之一,
Hadoop
里面包括几个组件HDFS、MapReduce和YARN,HDFS是存储数据的地方就像我们电脑的硬盘一样文件都存储在这个上面,MapReduce是对数据进行处理计算的
千_锋小小千
·
2024-01-03 19:12
Hadoop
写文件时datanode发生故障的处理过程
学习
Hadoop
写文件的流程时,看《
Hadoop
权威指南》中文版,在datenode发生故障时的处理那里,真的是看不懂。于是找来英文原版进行翻阅,终于有种看明白的感觉了。
小北觅
·
2024-01-03 18:03
【Spark精讲】RDD缓存源码分析
以
Hadoop
RDD为例overridedefcompute(split:Partition,context:TaskC
话数Science
·
2024-01-03 18:08
Spark
Spark精讲
大数据
spark
大数据
我的大数据之路:2023年度总结
2023年度最值得骄傲的事从0到1搭建了离线数仓体系,针对
Hadoop
生态组件的原理和特性有了深入的理解。
话数Science
·
2024-01-03 18:07
大数据
面试
大数据
面试
spark
Flink-Paimon 案例
Flink-Paimon案例1、下载FlinkJar包并解压tar-xzfflink-*.tgz2、下载PaimonJar包放进Flink的lib中cppaimon-flink-*.jar/lib/3、如果运行在
Hadoop
猫猫爱吃小鱼粮
·
2024-01-03 16:49
flink
大数据
开源大数据集群部署(一)集群实施规划
主机操作系统要求软件信息参数配置8C16G操作系统版本CentOSLinuxrelease7.8.2003(Core)java版本javaversion“1.8.0_281”
hadoop
版本
hadoop
3.2.4
云掣YUNCHE
·
2024-01-03 15:42
开源大数据集群部署
开源
大数据
SSM项目的
详细配置
(使用maven工程+配置类方法)
目录1添加依赖2控制层配置类3业务层配置类4持久层配置类4.1方式14.1.1合起来配置(会出现问题)4.1.2分开配置4.2方式25配置类的初始化6实际测试1添加依赖在项目下的pom.xml里面设置打包方式为pompom在项目下的pom.xml里面加入需要的依赖6.0.62.1.19.1.02.15.08.0.0.Final3.5.118.0.255.1.111.2.83.0.23.0.01.2
DEMIY_
·
2024-01-03 14:37
spring
ssm
mybatis
spring
mybatis
mvc
2018年最强干货!年薪80万+的大数据开发【教程】都在这儿!
技术层面来说,大数据使用的
Hadoop
(在分布式服务器集群上存储海量数据并运行分布式分析应用的一种方法)需要JAVASE基础,即使你没有学过JAVAEE上手
Hadoop
也是可以的。
yoku酱
·
2024-01-03 13:36
上一页
24
25
26
27
28
29
30
31
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他