E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop集群安装
金色麦芒的2023
通过学习
Hadoop
、Spark等框架,我掌握了大数据的存储、处理和分析技术,能够更高效地处理大规模数据集。同时,我也深入学习
溜达的大象
·
2024-01-04 22:44
程序人生
Hadoop
集群三节点搭建(一)
一、第一台虚拟机准备确认是可以上网,方便下载文件和工具,使用ping命令测试下安装工具net-tool:工具包集合,包含ifconfig等命令,大家可以根据自己需要按需下载创建普通用户attest,并修改attest用户的密码配置attest用户具有root权限,方便后期加sudo执行root权限的命令在/opt目录下创建文件夹,并修改所属主和所属组二、安装JDK卸载虚拟机自带的JDKrpm-qa
DIY……
·
2024-01-04 21:08
hadoop
java
大数据
微信基于StarRocks的湖仓一体实践
作者:StarRocksActiveContributer、微信OLAP内核研发工程师微信作为国内活跃用户最多的社交软件,其数据平台建设经历了从
Hadoop
到ClickHouse亚秒级实时数仓的阶段,但仍旧面临着数据体验割裂
StarRocks_labs
·
2024-01-04 20:38
后端
大数据应用场景-搜索引擎概述
从互联网网页爬取网页数据,存储到网页库;2.建立索引:分析整理爬虫收集到的数据资源,建立索引,为检索系统提供数据;3.提供检索服务:从预处理好的资源里挑选出用户最满意的结果最快最好的展现给用户;二.基于
Hadoop
MapReduce
GuangHui
·
2024-01-04 16:14
树莓派
集群安装
K9S
在树莓派上安装完成k3s后看到K9S可以快速解决K3S下的日常问题,而且可以UI展示,很有意思.查找资料后进行安装.一.在树莓派上安装K9S配置当前用户k3s的config文件首先确保当前用户下已经配置了.kube/config,如果没有创建采用下面的方法创建$sudocat/etc/rancher/k3s/k3s.yamlapiVersion:v1clusters:-cluster:certif
forrestsun
·
2024-01-04 16:12
hbase编程
importorg.apache.
hadoop
.conf.Configuration;importorg.apache.
hadoop
.hbase.
SunsPlanter
·
2024-01-04 15:23
数据库
11111111
参考步骤1.使用vim编辑器打开/usr/local/
hadoop
/etc/
hadoop
/core-site.xml文件,它的初始内容如下:修改以后,core-site.xml文件的内容如下:
hadoop
.tmp.dirfile
SunsPlanter
·
2024-01-04 15:23
tomcat
服务器
java
2024.1.3 Spark on Yarn部署方式与工作原理
YARN模式:这是一种分布式资源管理器,可以与
Hadoop
集成,将
白白的wj
·
2024-01-04 11:44
spark
大数据
分布式
开发语言
python
【数据湖架构】数据湖101:概述
数据湖是非结构化和结构化数据池,按原样存储,没有特定的目的,可以建立在多种技术上,如
Hadoop
,NoSQL,AmazonSimpleStorageService,关系数据库或各种组合根据一份名为“什么是数据湖
架构师研究会
·
2024-01-04 10:08
数据管理
数据架构
数据应用架构
架构
数据湖
Flume基础知识(四):Flume实战之实时监控单个追加文件
1)案例需求:实时监控Hive日志,并上传到HDFS中2)需求分析:3)实现步骤:(1)Flume要想将数据输出到HDFS,依赖
Hadoop
相关jar包检查/etc/profile.d/my_env.sh
依晴无旧
·
2024-01-04 10:08
大数据
flume
大数据
Java技术栈 ——
Hadoop
入门(一)
Java技术栈——
Hadoop
入门(一)一、
Hadoop
第一印象二、安装
Hadoop
三、
Hadoop
解析3.1
Hadoop
生态介绍3.1.1MapReduce-核心组件3.1.2HDFS-核心组件3.1.3YARN
键盘国治理专家
·
2024-01-04 08:02
Java技术栈
java
hadoop
开发语言
大数据-HDFS原理
HDFS(
Hadoop
DistributionFileSystem)是基于谷歌发布的GFS论文设计的;出了具有其他文件系统具有的特性之后,HDFS还具有:高容错性:认为硬件总是不可靠的;高吞吐量:为大量数据访问的应用提供高吞吐量的支持
运维仙人
·
2024-01-04 07:00
大数据
运维
【
Hadoop
-HDFS-S3】HDFS 和存储对象 S3 的对比
【
Hadoop
-HDFS-S3】HDFS和存储对象S3的对比1)可扩展性2)数据的高可用性3)成本价格4)性能表现5)数据权限6)其他限制虽然Apache
Hadoop
以前都是使用HDFS的,但是当
Hadoop
bmyyyyyy
·
2024-01-04 07:25
Hadoop
hadoop
hdfs
大数据
#存储对象
#S3
对比Pig、Hive和SQL,浅看大数据工具之间的差异
以下为译文有人说对于大数据分析来说
Hadoop
才是炙手可热的新技术,SQL虽然久经考验但已经有些过时了。这话说得不错,但有非常多的项目都用
Hadoop
作
MayerBin
·
2024-01-04 06:09
CloudManager大数据本地环境标准部署文档
一、基本信息文档目的:标准化、规范化
Hadoop
在本地化环境中部署所涉及的操作和流程,以便高效、高质地落地本地化环境部署的工作。
有语忆语
·
2024-01-04 04:29
大数据之数据仓库
项目
大数据
【SpringBoot框架篇】34.使用Spring Retry完成任务的重试
SpringRetry是从SpringBatch独立出来的一个功能,已经广泛应用于SpringBatch,SpringIntegration,SpringforApache
Hadoop
等Spring项目
皓亮君
·
2024-01-04 04:45
spring
spring
boot
后端
spring-retry
java
多台机器的时钟同步
本文将以第二种方式介绍三台机器之间的时间同步具体的操作步骤:本文是以centos6.5作为服务器搭建的三台机器
Hadoop
伪分布式的平台,解决三台机器之间的时间同步的问题,主机master的IP为192.168.141.130
无为二里
·
2024-01-04 03:26
hadoop
时钟同步
docker-compose部署
hadoop
集群(高可用)—— 筑梦之路
hadoop
高可用依赖组件zookeeper1.下载二进制文件###1、zookeeper#下载地址:https://zookeeper.apache.org/releases.html#zookeeper
筑梦之路
·
2024-01-04 03:11
数据库技术
大数据
Java技术
hadoop
docker
大数据
从零开始了解大数据(六):数据仓库Hive篇
目录前言一、数据仓库基本概念二、ApacheHive入门1.ApacheHive概述2.ApacheHive架构与组件三、ApacheHive安装部署1.ApacheHive部署实战(1)
Hadoop
与
橘子-青衫
·
2024-01-04 02:51
大数据
从零开始了解大数据
大数据
数据仓库
hive
hadoop
分布式
从零开始了解大数据(五):YARN篇
目录前言一、
Hadoop
YARN介绍二、
Hadoop
YARN架构与组件1.ResourceManager(RM)2.NodeManager(NM)3.ApplicationMaster三、程序提交YARN
橘子-青衫
·
2024-01-04 02:20
大数据
从零开始了解大数据
大数据
hadoop
分布式
从零开始了解大数据(七):总结
系列文章目录从零开始了解大数据(一):数据分析入门篇-CSDN博客从零开始了解大数据(二):
Hadoop
篇-CSDN博客从零开始了解大数据(三):HDFS分布式文件系统篇-CSDN博客从零开始了解大数据
橘子-青衫
·
2024-01-04 02:19
从零开始了解大数据
大数据
大数据
hadoop
hive
big
data
hdfs
数据仓库
MapReduce计算模型、数据流和控制流,
Hadoop
流的工作原理
1、Job在
Hadoop
中,每个MapReduce任务都被初始化为一个Job。每个Job又可以分为两个阶段:Map阶段和Reduce阶段。这两个阶段分别用两个函数来
南宫凝忆
·
2024-01-04 01:47
Hadoop
mapreduce
大数据
big
data
VirtualBox6.0 搭建Ubuntu18.04集群环境
image.png2、下载Ubuntu18.04镜像应为计划搭建
hadoop
集群,所以用server版本。
大道至简非简
·
2024-01-04 00:54
Spark相关知识点(期末复习集锦)
一、Spark简介Spark,拥有
hadoop
MR所具有的优点,但不同于MR的是job中监测结果可以保存在内存中,从而不再需要读写HDFS,因此spark能够更好的适用于数据挖掘与机器学习等需要迭代的mr
夜をむかえる
·
2024-01-03 22:49
spark
大数据
分布式
Spark向Hbase中写数据报异常:org.apache.
hadoop
.hbase.client.RetriesExhaustedWithDetailsException: Failed 5
解决:将第二行代码中的表名写全,并指定在哪个名称空间valtable:Table=con.getTable(TableName.valueOf("info:tb_order"))
夺命大翻斗
·
2024-01-03 22:12
spark
hbase
apache
关于Cloudera
Hadoop
的安装(CentOS)- 官文标注(待完成)
CDH5andClouderaManager5RequirementsandSupportedVersionsInanenterprisedatahub,ClouderaManagerandCDHinteractwithseveralproductssuchasApacheAccumulo,ApacheImpala(incubating),Hue,ClouderaSearch,andClouder
DazzlingTiger
·
2024-01-03 21:15
Hadoop
Linux
hadoop
cloudera
安装
hive基本概念原理与底层架构
hive是一个数据仓库基础工具在
hadoop
中用来处理结构化的数据,它架构在
hadoop
之上,总归为大数据,并使得查询和分析方便,提供简单的sql查询功能,可以讲sql语句转换成mapreduce任务进行
byway_lyn
·
2024-01-03 20:22
大数据
Hadoop
入门学习线路图
Hadoop
是系统学习大数据的必会知识之一,
Hadoop
里面包括几个组件HDFS、MapReduce和YARN,HDFS是存储数据的地方就像我们电脑的硬盘一样文件都存储在这个上面,MapReduce是对数据进行处理计算的
千_锋小小千
·
2024-01-03 19:12
Hadoop
写文件时datanode发生故障的处理过程
学习
Hadoop
写文件的流程时,看《
Hadoop
权威指南》中文版,在datenode发生故障时的处理那里,真的是看不懂。于是找来英文原版进行翻阅,终于有种看明白的感觉了。
小北觅
·
2024-01-03 18:03
【Spark精讲】RDD缓存源码分析
以
Hadoop
RDD为例overridedefcompute(split:Partition,context:TaskC
话数Science
·
2024-01-03 18:08
Spark
Spark精讲
大数据
spark
大数据
我的大数据之路:2023年度总结
2023年度最值得骄傲的事从0到1搭建了离线数仓体系,针对
Hadoop
生态组件的原理和特性有了深入的理解。
话数Science
·
2024-01-03 18:07
大数据
面试
大数据
面试
spark
Flink-Paimon 案例
Flink-Paimon案例1、下载FlinkJar包并解压tar-xzfflink-*.tgz2、下载PaimonJar包放进Flink的lib中cppaimon-flink-*.jar/lib/3、如果运行在
Hadoop
猫猫爱吃小鱼粮
·
2024-01-03 16:49
flink
大数据
开源大数据集群部署(一)集群实施规划
主机操作系统要求软件信息参数配置8C16G操作系统版本CentOSLinuxrelease7.8.2003(Core)java版本javaversion“1.8.0_281”
hadoop
版本
hadoop
3.2.4
云掣YUNCHE
·
2024-01-03 15:42
开源大数据集群部署
开源
大数据
2018年最强干货!年薪80万+的大数据开发【教程】都在这儿!
技术层面来说,大数据使用的
Hadoop
(在分布式服务器集群上存储海量数据并运行分布式分析应用的一种方法)需要JAVASE基础,即使你没有学过JAVAEE上手
Hadoop
也是可以的。
yoku酱
·
2024-01-03 13:36
【HBase】——Java API
1环境1.1依赖org.apache.hbasehbase-client2.4.111.2配置文件hbase-site.xmlhbase.zookeeper.quorum
hadoop
102:2181,
hadoop
103
那时的样子_
·
2024-01-03 12:47
hbase
java
数据库
大数据实时项目必备技能二:kafka有话说
导读:Kafka是由LinkedIn开发并开源的分布式消息系统,因其分布式及高吞吐率而被广泛使用,现已与Cloudera
Hadoop
,ApacheStorm,ApacheSpark集成。
栀子花_ef39
·
2024-01-03 11:05
数字化转型必备:数睿通 2.0 数据中台升级详解
资源评价)数据集市完善,打通审批流程修复数据生产由于DruidSQLUtils不支持Doris导致无法建表的问题优化贴源数据模块,改为读取数据库的元数据,与同步的数据做关联匹配此外,数据生产模块很多朋友对于
Hadoop
小螺旋丸
·
2024-01-03 10:51
hadoop
git
数据仓库
大数据
新年快乐—数睿通2.0数据中台全新功能模块发布
FlinkSql作业开发调度中心运维中心资源中心配置中心其他模块结语引言离上次发文已经有接近三个月了,这三个月主要在开发数睿通的数据生产模块,同时优化了一下数据集成,目前已经基本开发完毕了,集成了Flink,
Hadoop
小螺旋丸
·
2024-01-03 10:43
大数据
springcloud
java
数据库
大数据
云计算
Spark大数据分析与实战笔记(第二章 Spark基础-02)
文章目录每日一句正能量章节概要2.2搭建Spark开发环境2.2.1环境准备2.2.2Spark的部署方式2.2.3Spark
集群安装
部署一、Spark下载二、Spark安装三、环境变量配置2.2.4SparkHA
想你依然心痛
·
2024-01-03 09:14
#
Spark大数据分析与实战
spark
数据分析
笔记
Hive自定义函数支持国密SM4解密
当前项目背景需要使用到国密SM4对加密后的数据进行解密,Hive是不支持的,尝试了华为DWS数仓,华为只支持在DWS中的SM4加密解密,不支持外部加密数据DWS解密新建Maven工程只需要将引用的第三方依赖打到jar包中,
hadoop
4935同学
·
2024-01-03 08:03
Hive
Java
hive
hadoop
数据仓库
计算机毕业设计吊打导师
hadoop
+spark+hive知识图谱医生推荐系统 医生数据分析可视化大屏 医生爬虫 医疗可视化 医生大数据 机器学习 大数据毕业设计
流程:1.Python爬虫采集中华健康网约10万医生数据,最终存入mysql数据库;2.使用pandas+numpy/
hadoop
+mapreduce对mysql中的医生数据进行数据分析,使用高德地图解析地理位置
计算机毕业设计大神
·
2024-01-03 07:53
纠删码ReedSolomon
随着大数据技术的发展,HDFS作为
Hadoop
的核心模块之一得到了广泛的应用。为了数据的可靠性,HDFS通过多副本机制来保证。
旅僧
·
2024-01-03 07:14
#
大数据计算基础
大数据
分布式
算法
Clojure 实战(4):编写
Hadoop
MapReduce 脚本
Hadoop
简介众所周知,我们已经进入了大数据时代,每天都有PB级的数据需要处理、分析,从中提取出有用的信息。
Hadoop
就是这一时代背景下的产物。
张吉Jerry
·
2024-01-03 07:35
大数据
hadoop
clojure
RKE安装k8s及部署高可用rancher
一了解Rancher1推荐架构安装Rancher的方式有两种:单节点安装和高可用
集群安装
。
Michaelwubo
·
2024-01-03 06:30
kubernetes
rancher
容器
python操作hdfs及hbase
创建目录client.makedirs("/tmp/ct/test51")默认权限755,用户名:dr.who可以创建多层级目录(类似mkdir-p)如果存在权限不足,可以通过命令行对上层目录权限进行修改:
hadoop
dfs-chmod-R777
佛系小懒
·
2024-01-03 04:26
使用Datax将Hive中的表迁移到MySQL
无法上传(2)解压datax压缩包sudotar-zxvfdatax.tar.gz-C/usr/local(解压到的目录,可自己设置)(3)修改文件夹名称 mvdatax.tar datax(4)给
hadoop
孤城暮雨@
·
2024-01-03 04:17
数据迁移
hive
mysql
hadoop
数据库
Azkaban+Spark资源调度
前提条件:各节点之间的免密、登录启动
Hadoop
集群、Spark、Azkaban、Hive免密登录操作ssh-keygen-trsaslave01执行:scp~/.ssh/id_rsa.pub
hadoop
孤城暮雨@
·
2024-01-03 04:46
spark
大数据
分布式
计算机毕业设计大数据类题目
序号题目题目要求(该课题的研究目的、所实现的主要功能等)1基于
Hadoop
的大数据宠物商城推荐系统收集大量有关宠物产品和用户购买行为的数据,并使用
hadoop
进行数据处理和存储,以构建一个个性化的宠物产品推荐系统
程序源码123
·
2024-01-03 00:14
任务书
开题报告
论文
课程设计
大数据
java
spring
boot
旅游
后端
数据库
DEVOPS架构师 -- 02Kubernetes落地实践之旅
文章目录第二天Kubernetes落地实践之旅纯容器模式的问题容器调度管理平台架构图核心组件工作流程架构设计的几点思考实践--
集群安装
k8s集群主流安装方式对比分析核心组件理解集群资源kubectl的使用实践
FikL-09-19
·
2024-01-02 19:41
DEVOPS架构师
kubernetes
devops
运维
hive多分隔符外表支持
CREATEEXTERNALTABLEtext_mid1(idSTRING,nameSTRING)ROWFORMATSERDE'org.apache.
hadoop
.hive.contrib.
甲乙寄几
·
2024-01-02 19:31
hive
hadoop
数据仓库
上一页
23
24
25
26
27
28
29
30
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他