E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop性能分析
Hive及各组件功能介绍
Hive是一个开源的数据仓库基础设施,是构建在
Hadoop
之上的。它提供了一种类似于SQL的查询语言,称为HiveQL,用于查询和分析存储在
Hadoop
中的大规模数据集。
思旭�
·
2024-01-13 12:32
hive
hadoop
数据仓库
HDFS及各组件功能介绍
Hadoop
分布式文件系统(
Hadoop
DistributedFileSystem,HDFS)是
Hadoop
生态系统的核心组件之一,它是设计用于存储和处理大规模数据集的分布式文件系统。
思旭�
·
2024-01-13 12:32
hdfs
hadoop
大数据
zookeeper未授权访问漏洞修复方式
:https://www.cnblogs.com/linuxbug/p/5023677.html图片中的解决方式都是通过设置认证用户,但是仅仅设置用户和密码的话集群(ApacheActivemq集群,
Hadoop
xiexiaoming052
·
2024-01-13 12:39
golang
mina
linux
github
Yarn的安装与使用详细介绍
什么是yarnApache
Hadoop
YARN(YetAnotherResourceNegotiator,另一种资源协调者)是一种新的
Hadoop
资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度
知数SEO
·
2024-01-13 11:36
Linux专区
yarn
centos
linux
hadoop
historyserver启动,无法访问,查看报错等问题
hadoop
historyserver启动,无法访问,查看报错等问题1、historyserver无法启动2、historyserver已启动,可以看到进程,web无法访问url3、historyserver
这都不是事er
·
2024-01-13 10:07
实时数仓
hadoop
按照官网步骤sbin/start-yarn.sh失败
按照官网步骤sbin/start-yarn.sh失败环境sbin/start-yarn.sh启动失败sbin/stop-yarn.sh执行失败环境Centos7-1台虚拟机
hadoop
-3.2.1OpenJDK1.8.0
这都不是事er
·
2024-01-13 10:06
hadoop生态
linux
centos
hadoop
AVL树(Java)
目录一、什么是AVL树二、AVL树的实现AVL树的节点AVL树的插入AVL树的旋转右单旋左单旋左右双旋右左双旋AVL树的验证三、AVL树的
性能分析
一、什么是AVL树在了解什么是AVL树之前,我们先回顾二叉搜索树的概念二叉搜索树
楠枬
·
2024-01-13 10:41
Java
数据结构
java
AVL树
大数据系列 | CDH6.3.2(Cloudera Distribution
Hadoop
)部署、原理和使用介绍
大数据系列|CDH6.3.2(ClouderaDistribution
Hadoop
)部署、原理和使用介绍1.大数据技术生态中
Hadoop
、Hive、Spark的关系介绍2.CDN(ClouderaDistribution
Hadoop
降世神童
·
2024-01-13 10:50
高级IT运维技术专栏
大数据
cloudera
hadoop
Java获取纳秒的应用场景
场景一:性能测量和优化通过获取纳秒级别的时间戳,可以对代码的执行时间进行精确测量,从而进行
性能分析
和优化。
公子乂
·
2024-01-13 09:49
java
开发语言
Flink CDC 实时抽取 Oracle 数据-排错&调优
使用环境Oracle:11.2.0.4.0(RAC部署)Flink:1.13.1
Hadoop
:3.2.1问题1、无法连接数据库根据官方文档说明,在FlinkS
Denny辉
·
2024-01-13 09:48
Flink
Oracle
CDC
flink
oracle
大数据
Spark原理——逻辑执行图
"local[6]").setAppName("wordCount_source")valsc=newSparkContext(conf)valtextRDD=sc.parallelize(Seq("
Hadoop
Spa
我像影子一样
·
2024-01-13 09:17
Spark
大数据
spark
大数据
Spark原理——运行过程
运行过程逻辑图是什么怎么生成具体怎么生成valtextRDD=sc.parallelize(Seq("
Hadoop
Spark","
Hadoop
Flume","SparkSqoop"))valsplitRDD
我像影子一样
·
2024-01-13 09:44
Spark
大数据
spark
大数据
2022-02-01大数据学习日志——
Hadoop
离线阶段——数据仓库、Apache Hive
学习目标理解数仓概念、起源由来理解数仓(OLAP)与数据库(OLTP)区别掌握数仓分层架构思想掌握ApacheHive功能与架构组件理解ApacheHive远程模式部署安装内容大纲#数据仓库基础核心知识1、数据仓库是什么为何而来?为了分析数据而来数据分析的平台2、数据仓库的特性3、数据仓库和数据库的区别OLTP系统OLAP系统注意:这里要解决一个核心的误区:数仓绝不是大型数据库。这么理解就凉凉4、
王络不稳定
·
2024-01-13 09:28
数据仓库
big
data
hive
SQL
性能分析
-整理
参考之前的文章:SQL优化总结以及参考百度/CSDN/尚硅谷/黑马程序员/阿里云开发者社区,我个人把SQL
性能分析
的知识再整理了一下,学就要学彻底,事不宜迟,直接进入正题吧。
玖玖1704
·
2024-01-13 09:31
MySQL
sql
数据库
ubuntu程序
性能分析
文章目录timeperfvalgrindubuntu重复执行命令在Ubuntu上,可以使用一些工具来测量两段程序的计算量,如下所示:timetime命令:time命令可以用于测量程序的执行时间。在终端中运行以下命令来执行程序并测量其执行时间:time./program这将输出程序的执行时间,包括用户时间、系统时间和实际时间。在运行的程序之前加time最后得出三个时间real、user、sys。re
Nie_Xun
·
2024-01-13 07:07
算法
使用Sqoop将数据导入
Hadoop
的详细教程
在大数据处理中,Sqoop是一个强大的工具,它可以将关系型数据库中的数据导入到
Hadoop
生态系统中,以便进行进一步的分析和处理。
晓之以理的喵~~
·
2024-01-13 07:43
sqoop
hadoop
sqoop
hive
Sqoop入门指南:安装和配置
Sqoop是一个强大的工具,用于在
Hadoop
和关系型数据库之间高效传输数据。在本篇文章中,将深入探讨如何安装和配置Sqoop,以及提供详细的示例代码。
晓之以理的喵~~
·
2024-01-13 07:13
sqoop
sqoop
hadoop
hive
Hadoop
分布式集群安装
上一篇大数据文章讲解了在单机上搭建
Hadoop
-Yarn伪分布式集群的安装方法,方便大家学习,真实环境不可能只有一台机器,肯定是多节点的集群,大单位还会建设很多
Hadoop
集群,比如各个大部门有自己的集群
鬓戈
·
2024-01-13 07:28
大数据
分布式
hadoop
大数据
基于
Hadoop
的网上购物行为大数据分析及预测系统【flask+echarts+机器学习】前后端交互
有需要本项目或者部署的系统可以私信博主,提供远程部署和讲解本研究基于淘宝用户行为的开源数据展开大数据分析研究,通过
Hadoop
大数据分析平台对阿里天池公开的开源数据集进行多维度的用户行为分析,为电商销售提供可行性决策
王小王-123
·
2024-01-13 06:53
hadoop
flask
网上购物行为分析
Hadoop大数据淘宝
Hadoop系统
使用Sqoop将数据从
Hadoop
导出到关系型数据库
当将数据从
Hadoop
导出到关系型数据库时,ApacheSqoop是一个非常有用的工具。
晓之以理的喵~~
·
2024-01-13 06:23
sqoop
hadoop
数据库
sqoop
NameNode瞬时高并发导致短暂不可用,
Hadoop
2.7二次开发
版本
hadoop
2.7分段锁优化Namenode的FSNamesystem类中主要有三块。
邵红晓
·
2024-01-13 06:24
实验二 :HIve数据定义操作实验
二、实验环境要首先自行搭建由3台虚拟机构成的
Hadoop
环境及Hive环境。
又是被bug折磨的一天
·
2024-01-13 04:55
hive
sql
大数据
Hadoop
/Spark安装
单机安装
Hadoop
安装Javasudoapt-getinstalldefault-jdkjava-version2.设置
Hadoop
用户和组sudoaddgroup
hadoop
sudoadduser-
周倜吉
·
2024-01-13 03:40
2022字节跳动【数据仓库工程师】日常实习面经-----一面
都还没学扎实)一,自我介绍二,问答阶段shuffle阶段详细介绍回答环形缓冲区,分区排序,溢写磁盘,reduce再抽取归并等等计算单元和实际block存储单元不在一个机器节点上,这样会带来大量的IO操作,
Hadoop
dyson不只是吹风机
·
2024-01-13 03:34
面试
数据仓库
大数据
Flink
GoogleFileSystemBigTableMapReduceHDFSHBase
Hadoop
Hadoop
基于硬盘,可以处理海量数据;Spark基于内存,性能提高百倍,微批(500ms);Flink基于
三半俊秀
·
2024-01-13 01:53
性能分析
与调优: Linux 实现 CPU剖析与火焰图
目录一、实验1.环境2.CPU剖析3.CPU火焰图一、实验1.环境(1)主机表1-1主机主机架构组件IP备注prometheus监测系统prometheus、node_exporter192.168.204.18grafana监测GUIgrafana192.168.204.19agent监测主机node_exporter192.168.204.202.CPU剖析(1)CPU剖析①命令使用perf命
cronaldo91
·
2024-01-13 00:52
性能分析与调优
服务器
linux
云计算
性能优化
MySQL学习
2.索引的分类3.索引语法查看数据库增删改查情况索引优缺点SQL
性能分析
慢查询日志profile详情explain执行计划explain执行计划各字段含义索引的使用索引的设计原
Alex_Drag
·
2024-01-13 00:22
tools
数据库
mysql
数据库
学习
设置5台SSH互免的虚拟机服务器配置
步骤如下——1、准备五台机器服务器名字服务器IP
hadoop
1192.168.31.130
hadoop
2192.168.31.131
hadoop
3192.168.31.132
hadoop
4192.168.31.133
hadoop
5192.168.31.134
朱季谦
·
2024-01-12 23:24
Linux
ssh
服务器
eclipse
hadoop
(4)--NameNode元数据管理
这是分享的第四篇文章了,可能有些小伙伴看到标题后,很纳闷,完全是跳跃式的,NameNode是什么呢?NameNode是管理元数据的,这个和大数据有什么关系呢?对了,就爱带着问题去探索,NameNode是HDFS的一个组件,可以说一个进程,HDFS中共有三个组件NameNode,DataNode,SecondNameNode。这三个都是做什么的呢?NameNode:管理元数据的DataNode:保存
ROCK_杰哥
·
2024-01-12 22:41
MySQL慢查询日志分析(慢查询日志)
慢查询日志一般用于
性能分析
时开启,收集慢SQL然后通过explain进行全面分析,一般来说,生产是不会开启的,收集慢查询语句是十分耗性能的,但是我们在测试环境是可以模拟分析的,优化
胡八一
·
2024-01-12 22:01
#
mysql
mysql
数据库
如何进行大数据系统测试
大数据系统常见的架构形式有如下几种:
Hadoop
架构:
Hadoop
DistributedFileSystem(HDFS):这是一种分布式文件系统,设计用于存储海量数据并允许跨多台机器进行高效访问。
Feng.Lee
·
2024-01-12 21:41
系统测试
项目管理
测试工具
大数据
【MYSQL】性能相关
SQL语句的
性能分析
是一个非常重要的任务,尤其是在处理大数据时。下面是一些常用的SQL
性能分析
方法:执行计划:使用EXPLAIN命令来查看SQL语句的执行计划。
YifengGuo233
·
2024-01-12 21:04
mysql
ZooKeeper 安装与部署
1.1认识Zookeeper介绍Zookeeper前,看下面这个图:在这张图片里,我们可以看到
Hadoop
是一只大象,HIVE是一只蜜蜂,Bigtop是马戏团,Pig是一只猪,HAMA是一只河马…只有Zookeeper
Destiny_-Sky
·
2024-01-12 18:48
ZooKeeper
zookeeper
分布式
java
Linux学习笔记——ZooKeeper集群安装部署
5.8、ZooKeeper集群安装部署5.8.1、简介Zookeeper是一个分布式的、开放源码的分布式应用程序协调服务,是
Hadoop
和HBase的重要组件。
kxttmx
·
2024-01-12 18:16
linux
学习
zookeeper
Zookeeper安装与部署
由于ZooKeeper便捷的使用方式、卓越的性能和良好的稳定性,被广泛地应用于诸如
Hadoop
、HBase、Kafka和Dubbo等大型分布式系统中。一个分布式系统最多只能同时满足一致性
HRX98
·
2024-01-12 18:12
经验贴
zookeeper
分布式
zookeeper下载安装部署
zookeeper是一个为分布式应用提供一致性服务的软件,它是开源的
Hadoop
项目的一个子项目,并根据google发表的一篇论文来实现的。
倚-天-照-海
·
2024-01-12 18:38
kafka
zookeeper
linux
分布式
Hadoop
常用命令
启动
Hadoop
所有进程:start-all.sh关闭
Hadoop
所有进程:stop-all.sh单进程启动:start-dfs.sh和start-yarn.sh分别启动HDFS和YARNhdfsdfs-xxx
在努力的Jie
·
2024-01-12 16:16
Hadoop
的核心 —— HDFS(1)
首先来看看
Hadoop
是什么?
土冥王
·
2024-01-12 16:13
kafka下载安装部署
它现在是Apache旗下的一个开源系统,作为
hadoop
生态系统的一部分,被各种商业公司广泛应用。
倚-天-照-海
·
2024-01-12 15:25
kafka
kafka
分布式
Hbase2.1 集群搭建
Hbase在大数据的体系中扮演着DB角色,不得不说是重要的一员,在上一篇,大猪已经给大家演示了
Hadoop
3.2集群搭建了,本次我们将继续紧接着搭建Hbase集群。
kikiki2
·
2024-01-12 15:31
Hadoop
框架下MapReduce中的map个数如何控制
一个job的map阶段并行度由客户端在提交job时决定客户端对map阶段并行度的规划基本逻辑为:一、将待处理的文件进行逻辑切片(根据处理数据文件的大小,划分多个split),然后每一个split分配一个maptask并行处理实例二、具体切片规划是由FileInputFormat实现类的getSplits()方法完成切分规则如下:1.简单地按照文件的内容长度进行切片2.切片大小默认是datanode
数据萌新
·
2024-01-12 14:31
解决java连接Hbase程序卡住执行也不报错的问题
程序运行不知多久,就报错了(截取一行有用的):java.net.UnknownHostException:cannotresolve
hadoop
01,1
向他一样rap
·
2024-01-12 14:37
hbase
java
big
data
性能分析
与调优: Linux 网络性能 观测工具
目录一、实验1.环境2.ss3.ip4.ifconfig5.nstat6.netstat7.sar8.nicstat9.ethtool10.tcplife11.tcptop12.tcpretrans13.bpftrace14.tcpdump15.Wireshark二、问题1.nicstat如何安装和使用2.Wireshark如何安装使用一、实验1.环境(1)主机表1-1主机主机架构组件IP备注pr
cronaldo91
·
2024-01-12 13:11
性能分析与调优
linux
网络
运维
性能优化
云计算
查询速度提升15倍!银联商务基于 Apache Doris 的数据平台升级实践
为更好提供数据服务,银联商务实现了从
Hadoop
到ApacheDoris的架构升级,使数据导入性能提升2-5倍、ETL场景性能提升3-12倍、查询分析响应速度提升10-15倍,满足大规模数据导入和实时极速查询的业务需求
SelectDB技术团队
·
2024-01-12 13:28
apache
数据库
大数据
数据分析
数据仓库
GBASE南大通用 GBase 8a 产品构建数仓系统架构
架构技术实现特点适用场景独立数据仓库(集市)系统架构一套GBase8a物理集群适用于数据规模较小的业务场景适用于各业务之间数据互访较频繁的业务场景适用于单一独立的业务场景企业级数仓系统架构多套GBase8a物理集群,根据需要搭配
Hadoop
GBASE数据库
·
2024-01-12 12:04
数据库
GBASE南大通用
GBASE
Hive安装与配置
注意:Hive的安装与配置建立在
Hadoop
已安装配置好的情况下。hadopp安装与配置Hive的基本安装从官网下载Hive二进制包,下载好放在/opt目录下。
qq_58647543
·
2024-01-12 11:50
hive
hive
关于hive在运行insert时失败原因刨析
yarn容器最大内存、容器最小内存等Theclasstouseastheresourcescheduler.yarn.resourcemanager.scheduler.classorg.apache.
hadoop
.yarn.server.resourcemanager.scheduler
Alonzo de blog
·
2024-01-12 08:57
hadoop
hadoop
大数据
hive
mapreduce
hadoop
分布式文件系统
Hadoop
分布式文件系统分布式文件系统:管理网络中跨多台计算机存储的文件系统称为分布式文件系统。
Alonzo de blog
·
2024-01-12 08:27
hadoop
hadoop
大数据
hdfs
【数据库学习】hive
1,HIVE
Hadoop
的数据仓库处理工具,数据存储在
Hadoop
兼容的文件系统(例如,AmazonS3、HDFS)中。
兔兔西
·
2024-01-12 08:50
数据库
学习
hive
基于JavaWeb+BS架构+SpringBoot+Vue基于hive旅游数据的分析与应用系统的设计和实现
文目录前言主要技术系统设计功能截图订阅经典源码专栏Java项目精品实战案例《500套》源码获取文末获取源码Lun文目录1概述51.1研究背景51.2研究意义51.3研究内容52关键技术介绍72.1Java介绍72.2MySql数据库72.3
Hadoop
FREE技术
·
2024-01-12 07:01
架构
spring
boot
vue.js
计算机专业毕业设计
上一页
21
22
23
24
25
26
27
28
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他