E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop分布式系统
SQL条件判断语句嵌套window子句的应用【易错点】--HiveSql面试题25
目录0需求分析1数据准备3数据分析4小结0需求分析需求:表如下user_idgood_namegoods_typerk1
hadoop
1011hive1221sqoop2631hbase1041spark1351flink2661kafka1471oozie108
莫叫石榴姐
·
2024-02-09 06:00
SQLBOY1000题
sql
HiveSql面试题
sql
HiveSQL——条件判断语句嵌套windows子句的应用
0需求分析需求:表如下user_idgood_namegoods_typerk1
hadoop
1011hive1221sqoop2631hbase1041spark1351flink2661kafka1471oozie108
爱吃辣条byte
·
2024-02-09 06:58
#
HIve
SQL
大数据
数据仓库
大数据 - Spark系列《五》- Spark常用算子
Spark系列文章:大数据-Spark系列《一》-从
Hadoop
到Spark:大数据计算引擎的演进-CSDN博客大数据-Spark系列《二》-关于Spark在Idea中的一些常用配置-CSDN博客大数据
王哪跑nn
·
2024-02-09 05:25
spark
大数据
spark
分布式
spark原理总体介绍
部署图image.png从部署图中可以看到整个集群分为Master节点和Worker节点,相当于
Hadoop
的Master和Slave节点。
tracy_668
·
2024-02-09 03:48
2020-11-04
只要是一堆机器,就可以叫做集群,但他们是不是一起干活就不知道了;而
分布式系统
是若干独立计算机的集合,这些计算机对于用户来说像单个相关系统分
肝点啥_董晓宁
·
2024-02-09 02:51
UUID和雪花(Snowflake)算法该如何选择?
UUID和Snowflake都可以生成唯一标识,在
分布式系统
中可以说是必备利器,那么我们该如何对不同的场景进行不同算法的选择呢,UUID简单无序十分适合生成requestID,Snowflake里面包含时间序列等
Java方文山
·
2024-02-09 00:20
IT界的那些事儿
oracle
数据库
Zookeeper集群搭建(3台)
准备工作1、提前安装好
hadoop
102、
hadoop
103、
hadoop
104三台机器,参照:CentOS7集群环境搭建(3台)-CSDN博客2、提前下载好Zookeeper安装包并上传到/opt/software
在下区区俗物
·
2024-02-08 21:35
zookeeper
linux
分布式
Hadoop
集群所有进程查看脚本
/bin/bashforiin
hadoop
102
hadoop
103
hadoop
104doecho---------$i----------ssh$i"$*"done2、赋予文件运行权限chmod+xxcall.sh3
在下区区俗物
·
2024-02-08 21:04
hadoop
大数据
linux
并发编程中一种经典的分而治之的思想!!
有点像
Hadoop
中的MapReduce。ForkJoin是由JDK1.7之后提供的多线程并发处理框架。ForkJoin框架的基本思想是分而治之。什么是分而治之?
冰河团队
·
2024-02-08 19:06
docker load -i 导入后 看不到镜像
dockerload-i导入后看不到镜像[root@centos8~]#dockerimagesREPOSITORYTAGIMAGEIDCREATEDSIZEcsctbb.com/
hadoop
3.3.0084faab5baec7hoursago1.68GBcentos8.1.1911470671670cac14monthsago237MBkubeguide
吕楚王
·
2024-02-08 19:29
Docker
大数据从何学起?大数据脑图+学习路线清晰的告诉你!
【大数据开发学习资料领取方式】:加入大数据技术学习交流扣扣群458345782,点击加入群聊,私信管理员即可免费领取第一阶段linux+搜索+
hadoop
体系Linux基础→sh
yoku酱
·
2024-02-08 18:16
Hadoop
深度运维:Apache集群原地升级Ambari-HDP
作者介绍冯武,目前在瓜子从事大数据集群运维管理,主要负责
Hadoop
、Ansible、Ambari、ClouderaManager等技术栈的维护调优工作。
Summer_1981
·
2024-02-08 18:42
7.0 MapReduce编程实例教程
注意:MapReduce依赖
Hadoop
的库,但由于本教程使用的
Hadoop
运行环境
二当家的素材网
·
2024-02-08 18:11
Hadoop
教程
mapreduce
eclipse
大数据
Zookeeper的详细介绍及使用场景
Zookeeper是什么Zookeeper分布式服务框架是Apache
Hadoop
的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等
Zal哥哥
·
2024-02-08 15:11
深入理解Spark的前世今生
Spark,是一种通用的大数据计算框架,正如传统大数据技术
Hadoop
的MapReduce、Hive引擎,以及Storm流式实时计算引擎等。
闲云野鹤~~~
·
2024-02-08 14:01
Spark
配置集群时间同步
配置集群时间同步:1.时间服务器配置(必须root用户)检查ntp是否安装[root@
hadoop
102桌面]#rpm-qa|grepntpntp-4.2.6p5-10.el6.centos.x86_64fontpackages-filesystem
sixleaves
·
2024-02-08 14:49
SQL在云计算中的新角色:重新定义数据分析
文章目录1.云计算与数据分析的融合2.SQL在云计算中的新角色3.分布式SQL查询引擎4.SQL-on-
Hadoop
解决方案5.SQL与其他数据分析工具的集成6.实时数据分析与SQL7.SQL在云数据仓库中的角色
程序边界
·
2024-02-08 13:01
sql
云计算
数据分析
No.2大数据入门 | 环境搭建:jdk1.8安装及环境配置
上一篇文章我们安装了虚拟机以及linux操作系统,接下来就要安装在操作系统上运作的大数据核心
hadoop
分布式系统
基础架构!
滚滚红尘_8133
·
2024-02-08 11:43
Hadoop
多次格式化后如何解决
产生原因我们在配置
hadoop
中的hdfs时,会设置元数据的存储位置,如图所示要想解决此问题,先停止所有启动的服务stop-all.sh然后删除上图画出来的配置文件,这里三台机器都要删,最后进入
hadoop
(((φ(◎ロ◎;)φ)))牵丝戏安
·
2024-02-08 11:50
笔记
Hadoop
云计算
hadoop
hdfs
《Redis开发与运维》学习笔记3:主从复制,哨兵和集群
这篇主要整理第六章,第九章和第十章的内容,聚焦于Redis的分布式和集群部分,转载注明出处:https://blog.csdn.net/Koikoi12复制复制可以在
分布式系统
中实现相同数据的多个Redis
Koikoi123
·
2024-02-08 10:50
redis
运维
学习
java
后端
CentOS 7搭建
Hadoop
伪分布模式
配置文件:链接:https://pan.baidu.com/s/1rYvnxbyqXOG1DjI63dxbAw提取码:6e1l复制这段内容后打开百度网盘手机App,操作更方便哦1.1修改IP地址在虚拟机的命令行中输入下面的命令,修改网卡的配置文件vi/etc/sysconfig/network-scripts/ifcfg-ens33配置以下信息TYPE=Ethernet#类型为以太网BOOTPRO
clevercondy
·
2024-02-08 09:52
hadoop
linux
centos
七种常见分布式事务详解(2PC、3PC、TCC、Saga、本地事务表、MQ事务消息、最大努力通知)
分布式事务:在
分布式系统
中一次操作需要由多个服务协同完成,这种由不同的服务之间通过网络协同完成的事务称为分布式事务一、2PC:2PC,两阶段提交,将事务的提交过程分为资源准备和资源提交两个阶段,并且由事务协调者来协调所有事务参与者
屌丝的程序员
·
2024-02-08 09:59
分布式
分布式事务
2018-07-14
复制/etc/skel目录为/home/tuser1改权限2、编辑/etc/group文件,添加组
hadoop
。
啊鑫007
·
2024-02-08 08:56
Hadoop
生态漏洞修复记录
Hadoop
常用端口介绍HDFSNameNode50070dfs.namenode.http-addresshttp服务的端口50470dfs.namenode.https-addresshttps服务的端口
不会吐丝的蜘蛛侠。
·
2024-02-08 08:30
hadoop
大数据
分布式
Hadoop
2.7配置
core-site.xmlfs.defaultFShdfs://bigdata/ha.zookeeper.quorum192.168.56.70:2181,192.168.56.71:2181,192.168.56.72:2181-->
hadoop
.tmp.dir
不会吐丝的蜘蛛侠。
·
2024-02-08 08:59
Hadoop
hadoop
大数据
hdfs
hive2.3.2配置(带kerberos)
hive-env.shexport
HADOOP
_HEAPSIZE=2048export
HADOOP
_CLIENT_OPTS="-Xmx2g-Xms2g-Djava.net.preferIPv4Stack
不会吐丝的蜘蛛侠。
·
2024-02-08 08:59
Hadoop
hive
hadoop
大数据
高性能hbase配置
hbase-env.shexport
HADOOP
_HOME=/export/
hadoop
export
HADOOP
_CONF_DIR=/export/common/
hadoop
/confexportJAVA_HOME
不会吐丝的蜘蛛侠。
·
2024-02-08 08:59
Hadoop
hbase
数据库
大数据
HDFS执行balance报错:hdfs balance java.io.IOException: Another Balancer is running.. Exiting
现象:1、大数据
Hadoop
集群,HDFS扩容后,为了使各节点数据均衡,执行balance操作。2、启动hdfsbalance时,一直出现其他的balance在执行中,其实并没有执行。
不会吐丝的蜘蛛侠。
·
2024-02-08 08:29
Hadoop
hdfs
hadoop
java
大数据问题:
Hadoop
的web页面无法访问logs
HTTPERROR403Problemaccessing/logs/.Reason:Useryarnisunauthorizedtoaccessthispage.PoweredbyJetty://分析:1、有的说是权限问题,但是并没有用yarn用户启动
Hadoop
不会吐丝的蜘蛛侠。
·
2024-02-08 08:28
Hadoop
hadoop
hadoop
调优-hdfs配置优化
dfs.permissions.enabledtruedfs.namenode.handler.count90dfs.ha.automatic-failover.enabledtrue其它优化:dfs.hosts/export/
hadoop
不会吐丝的蜘蛛侠。
·
2024-02-08 08:28
Hadoop
hadoop
hdfs
big
data
spark运行失败The directory item limit of /spark_dir/spark_eventLogs is exceeded: limit=1048576 items=104
报错:org.apache.
hadoop
.ipc.RemoteException(org.apache.
hadoop
.hdfs.protocol.FSLimitException$MaxDirectoryItemsExceededException
不会吐丝的蜘蛛侠。
·
2024-02-08 08:58
Hadoop
spark
hadoop
hdfs
grafana+prometheus+hiveserver2(jmx_exporter+metrics)
文件开启metricshive.server2.metrics.enabledtruehive.service.metrics.codahale.reporter.classesorg.apache.
hadoop
.hive.common.metrics.metrics2
不会吐丝的蜘蛛侠。
·
2024-02-08 08:24
hive
Hadoop
grafana
prometheus
hive监控
jmx_exporter
hive_metrics
hadoop
学习笔记
下载安装伪分布式:1.国内源下载地址:https://mirrors.tuna.tsinghua.edu.cn/apache/
hadoop
/common/Indexof/apache/
hadoop
/commonhttps
草琳情
·
2024-02-08 08:54
hadoop
学习
笔记
BAT架构师进阶:大型网站架构书籍推荐
“书籍推荐分为如下:大型网站架构系列
分布式系统
系列BAT技术系列架构设计系列一:大型网站架构系列第一本:《大型网站技术架构:核心原理与案例分析》这本书主要从大型网站架构的特点,架构目标(高性能,高可用,
liuhuiteng
·
2024-02-08 07:40
架构师
架构师
flink on yarn
Per-JobCluster模式flinkrunflinkrunapplication-tyarn-application配置任务退出时保留Checkpoint从外部checkpoint恢复应用资料使用安装完
hadoop
3.3.4
枪枪枪
·
2024-02-08 07:46
flink
大数据
hadoop
Mac 安装多版本 protoc / protobuf
)brew安装brewinstallprotobuf#查看安装目录$whichprotoc/opt/homebrew/bin/protoc#2)配置环境变量vim~/.zshrc#protoc(for
hadoop
大数据王小皮
·
2024-02-08 07:26
操作配置
macos
分布式事务解决方案AT模式
AT模式是Seata框架中的一种分布式事务解决方案,它利用两阶段提交(2PC)的概念,通过日志记录(在undo_log中)来实现在
分布式系统
中数据的一致性。
辞暮尔尔-烟火年年
·
2024-02-08 06:50
微服务
分布式
分布式事务解决方案2阶段模式
两阶段提交(2PC)是最著名的分布式事务协议之一,它可以确保
分布式系统
中的事务能够以原子方式提交或回滚。2PC分为两个阶段:准备阶段(第一阶段)和提交阶段(第二阶段)。
辞暮尔尔-烟火年年
·
2024-02-08 06:20
微服务
分布式
sqoop导入数据到hdfs
Sqoop是apache旗下的一款”
Hadoop
和关系数据库之间传输数据”的工具导入数据:将MySQL,Oracle导入数据到
Hadoop
的HDFS、HIVE、HBASE等数据存储系统导出数据:从
Hadoop
鲲鹏猿
·
2024-02-08 06:40
hdfs
sqoop
hadoop
Hadoop
之环境配置
1.安装环境ubuntu2.安装jdk3.安装
Hadoop
1.在安装ubuntu时需要注意安装ubuntu创建用户,等待时间比较长,大家需要有点耐心。
鲲鹏猿
·
2024-02-08 06:39
big
data
数据库
数据库架构
ASP.NET Core 企业级开发架构简介及框架汇总
水平方向架构是指将大应用分成若干小的应用实现系统功能的架构,同时这样的系统叫做
分布式系统
。在架构上Java和.Net世界都有优秀的框架支持构建垂直和水平方向架构。
aydh696
·
2024-02-08 06:38
数据采集工具Sqoop、Datax、Flume、Canal
libcpmysql-connector-java-5.1.10.jar/sqoop-install-path/lib重命名文件并配置文件mvsqoop-env-template.shsqoop-env.sh#添加环境变量export
HADOOP
_COMMON_HOME
yue-verdure
·
2024-02-08 06:08
大数据
sqoop
flume
大数据
阿里云
大数据系列—数据迁移(Sqoop,Flume,DataX)对比学习(stage3)
个人大数据技术栈:DataX,Sqoop,
Hadoop
,Hive,Spark,Flink,Hbase,Kafka,Kettle,Azkaban,Airflow,Tableau…个人在学习领域:Python
道-闇影
·
2024-02-08 06:07
big
data
大数据
sqoop
flume
Zookeeper搭建集群步骤
[
hadoop
@note1~]$cat/etc/hosts127.0.0.1localhostlocalhost.localdomainlocalhost4localhost4.localdomain4
qq_22019789
·
2024-02-08 06:37
zookeeper
java
MapReduce的类型与格式
MapReduce的类型
Hadoop
的MapReduce中,map函数和reduce函数遵循如下格式:map:(k1,v1)--->list(k2,v2)combiner:(k2,list(v2))--
Vechace
·
2024-02-08 05:31
Spark安装(Yarn模式)
一、解压链接:https://pan.baidu.com/s/1O8u1SEuLOQv2Yietea_Uxg提取码:mb4htar-zxvf/opt/software/spark-3.0.3-bin-
hadoop
3.2
莫噶
·
2024-02-08 04:44
搭建
spark
大数据
分布式
Hadoop
搭建(完全分布式)
bigdata-masterbigdata-slave1bigdata-salve2NameNodeNodeManagerNodeManagerSecondaryNameNodeDataNodeDataNodeResourceManagerNodeManagerDataNode目录一、jdk安装:二、
hadoop
莫噶
·
2024-02-08 04:14
搭建
分布式
hadoop
大数据
现成
Hadoop
安装和配置,图文手把手交你
为了可以更加快速的可以使用
Hadoop
,便写了这篇文章,想尝试自己配置一下的可以参考从零开始配置
Hadoop
,图文手把手教你,定位错误资源1.两台已经配置好的
hadoop
2.xshell+Vmware链接
叫我小唐就好了
·
2024-02-08 03:56
一些好玩的事
hadoop
大数据
分布式
课程设计
运维
消息队列使用的四种场景介绍
一、简介消息队列中间件是
分布式系统
中重要的组件,主要解决应用耦合,异步消息,流量削锋等问题。实现高性能,高可用,可伸缩和最终一致性架构。
Bin哥厉害7
·
2024-02-08 03:19
java
spring
boot
消息队列
网易和腾讯面试题精选---性能和优化面试问题
从理解CPU缓存层次结构的复杂性到利用高级缓存机制,从优化数据库交互到微调
分布式系统
,这本综合指南提供了对性能优化的多方面的见解。面试问答1
前网易架构师-高司机
·
2024-02-08 00:15
服务器面试题
面试
性能优化
上一页
7
8
9
10
11
12
13
14
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他