E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop性能调优
Flink 细粒度滑动窗口性能优化
大数据技术AIFlink/Spark/
Hadoop
/数仓,数据分析、面试,源码解读等干货学习资料118篇原创内容公众号1、概述1.1细粒度滑动的影响当使用细粒度的滑动窗口(窗口长度远远大于滑动步长)时,
hyunbar
·
2024-02-19 13:39
Flink
大数据
flink
java
数据库
【大数据面试题】006介绍一下Parquet存储格式的优势
同时一般查询使用时不会使用所有列,而是只用到几列,所以查询速度会更快压缩比例高因为是列式存储,所以可以对同一类型的一段做压缩,压缩比例高支持的平台和框架多在
Hadoop
,Spark,Presto,Python
Jiweilai1
·
2024-02-19 13:34
一天一道面试题
大数据
spark
hadoop
Sqoop 入门基础
简介Sqoop(SQLto
Hadoop
)是一个开源工具,用于在关系型数据库和
Hadoop
之间传输数据。
香菜的开发日记
·
2024-02-19 13:17
sqoop
hadoop
hive
hadoop
硬件配置 高可用 datanode namenode硬件配置
每个分布式文件系统分块在NameNode的内存中大小约为250个字节,此外还要加上文件和目录所需的250字节空间。500字节一个块假设我们有5000个平均大小为20GB的文件并且使用默认的分布式文件系统分块大小(64MB)同时副本因子为3,5000*20GB=102400000M=97T那么NameNode需要保存5千万个分块的信息,这些分块的大小加上文件系统的开销总共需要1.5GB的内存。但是一
xcagy
·
2024-02-19 13:07
HADOOP
K8S
hadoop硬件
田尚滨
【大数据】
HADOOP
-YARN-ContainerExecutor容器启动器详解
在NodeManager中,有三种运行Container的方式,它们分别是:DefaultContainerExecutorLinuxContainerExecutorDockerContainerExecutor从它们的名字中,我们就能看得出来,默认情况下,一定使用的是DefaultContainerExecutor。而一般情况下,DefaultContainerExecutor也确实能够满足我
笑起来贼好看
·
2024-02-19 11:38
Hadoop
大数据
hadoop
大数据
linux
学习篇-
Hadoop
-YARN-环境搭建
文章目录一、
Hadoop
-YARN-环境搭建一、
Hadoop
-YARN-环境搭建官网参考:https://
hadoop
.apache.org/docs/stable/
hadoop
-project-dist
东东爱编码
·
2024-02-19 11:08
hadoop
大数据
hadoop
【大数据】
HADOOP
-Yarn集群界面UI指标项详解(建议收藏哦)
目录首页(Cluster)节点信息SchedulerMetrics:集群调度信息节点信息详解(Nodes)应用列表信息(applications)队列详情页(Scheduler)指标详细说明(非常重要)首页(Cluster)集群监控信息指标详解AppsSubmitted:已提交的应用AppsCompleted:已完成的应用AppsRunning:正在运行的应用ContainersRunning:正
笑起来贼好看
·
2024-02-19 11:08
Hadoop
大数据
服务运维部署
大数据
hadoop
分布式
yarn
Hadoop
-Yarn-NodeManager都做了什么
一、源码下载下面是
hadoop
官方源码下载地址,我下载的是
hadoop
-3.2.4,那就一起来看下吧Indexof/dist/
hadoop
/core二、上下文在我的博客中已经简要的分析了NodeManager
隔着天花板看星星
·
2024-02-19 11:00
hadoop
大数据
分布式
【2019-04-28】
Hadoop
分布式文件系统
Hadoop
自带HDFS(
hadoop
distributefilesystem)。HDFS默认数据块128M。
BigBigFlower
·
2024-02-19 11:56
Hadoop
搭建之 start-yarn.sh 报错
在搭建伪分布式的
Hadoop
集群环境时,在配置基础环境了并成功开启了HDFS组件后,jps查看已运行的名称节点和数据节点进程,[
hadoop
@master
hadoop
]$jps8994NameNode10396Jps9087DataNode9279SecondaryNameNode
万里长江雪
·
2024-02-19 11:58
java
hadoop
hdfs
大数据
运维
网络
hadoop
-2.7.4-nodemanager无法启动问题解决方案
近期新配了
hadoop
-274版本的集群,发现有一个小问题,DataNode无法顺利启动。
半肉哥
·
2024-02-19 11:27
hadoop
hadoop
-yarn资源分配介绍-以及推荐常用优化参数
如果有什么不正确的欢迎大家一起交流学习~Yarn前言作为
Hadoop
2.x的一部分,YARN采用MapReduce中的资源管理功能并对其进行打包,以便新引擎可以使用它们。
Winhole
·
2024-02-19 11:26
hadoop
Linux
Hadoop
-Yarn-NodeManager如何计算Linux系统上的资源信息
NodeResourceMonitorImpl)时只是提了下SysInfoLinux,下面我们展开讲下SysInfoLinux是用于计算Linux系统上的资源信息的插件二、SysInfoLinux源码packageorg.apache.
hadoop
.util
隔着天花板看星星
·
2024-02-19 11:48
hadoop
大数据
linux
node命令yarn --version指向了java
问题描述本地安装了java、
hadoop
和nodejs,并配置了环境变量,但是
hadoop
的bin目录下存在yarn命令,所以使用nodejs的yarn命令启动项目会出现找不到类,此时键入yarn-version
码学弟
·
2024-02-19 11:43
前端
node.js
yarn
企业级大数据安全架构(一)平台安全隐患
1缺乏统一的访问控制机制大数据平台由
Hadoop
生态体系众多组件组成,而每个组件都会提供相应的WebUI界面和RESTful接口,例如Nam
·
2024-02-19 11:48
大数据企业级安全性
MapReduce
MapReduce定义mapReduce是一个分布式运算程序的编程框架,是用户开发基于
hadoop
的数据分析应用的核心框架。
诺冰1314
·
2024-02-19 10:46
大数据
haoop
MapReduce
hadoop
mapreduce
大数据
Hive入门,Hive是什么?
它是建立在
Hadoop
生态系统之上的,利用
Hadoop
的分布式存储和计算能力来处理和分析数据。
JayGboy
·
2024-02-19 10:31
hive
hadoop
数据仓库
Hive on Spark配置
pwd=66663、将Spark安装包通过xftp上传到/opt/software安装部署Spark1、解压spark-3.3.1-bin-without-
hadoop
.tgz进入安装包所在目录cd/opt
在下区区俗物
·
2024-02-15 10:51
hive
spark
hadoop
配置hive on spark
hdfsdfs-mkdir/spark-jarshdfsdfs-put/opt/spark/jars/*/spark-jars2、修改hive-site.xml文件,添加如下配置:spark.yarn.jarshdfs://
hadoop
空白格2519
·
2024-02-15 10:51
数据采集
big
data
hive
spark
hadoop
hive on spark配置经验
常规配置配置完,开启
hadoop
,开启spark(如果在hdfs上上传了纯净版的spark则不需要开启),开启hive注:当前节点一定要是namenode的active节点,因为
hadoop
长时间不用namenode
小五冲冲冲
·
2024-02-15 10:21
Spark
hive
spark
hadoop
(三十八)大数据实战——Atlas元数据管理平台的部署安装
本节内容是关于ApacheAtlas的部署安装,在开始安装Atlas之前我们需要提前安装好Atlas需要集成的组件,如
hadoop
、zo
厉害哥哥吖
·
2024-02-15 09:09
大数据
大数据
MySQL
性能调优
篇(3)-缓存的优化与清理
MySQL数据库缓存的优化与清理数据库缓存在MySQL中扮演着非常重要的角色,它可以显著提高数据库的性能和响应速度。在本篇博客中,我们将介绍如何优化和清理MySQL数据库的缓存,以进一步提高数据库的效率。优化缓存1.适当调整缓存大小MySQL数据库的缓存大小对性能有着直接的影响。通过修改以下两个参数,可以调整缓存的大小:innodb_buffer_pool_size:适用于InnoDB存储引擎,用
俞兆鹏
·
2024-02-15 08:35
MySQL学习指南
mysql
MySQL
性能调优
篇(4)-查询语句的优化与重构
MySQL数据库查询语句的优化与重构MySQL是一种常用的关系型数据库管理系统,广泛应用于Web开发中。在实际应用中,对数据库查询语句的优化和重构是提高应用性能和响应速度的重要手段。本文将介绍一些常见的优化技巧和重构方法,帮助开发者提高数据库查询效率。优化索引索引是数据库中存储数据位置的数据结构,可以加快查询操作的速度。对于频繁查询的列,可以为其添加索引。常用的索引类型包括主键索引、唯一索引和普通
俞兆鹏
·
2024-02-15 08:24
MySQL学习指南
mysql
Hadoop
手把手逐级搭建 第二阶段:
Hadoop
完全分布式(full)
前置步骤:1).第一阶段:
Hadoop
单机伪分布(single)0.步骤概述1).克隆4台虚拟机2).为完全分布式配置ssh免密3).将
hadoop
配置修改为完全分布式4).启动完全分布式集群5).在完全分布式集群上测试
郑大能
·
2024-02-15 04:07
记一次PHP并发
性能调优
实战 -- 性能提升104%
适合阅读人群文中的调优思路无论是php,java,还是其他任何语言都是用.如果你有php使用经验,那肯定就更好了业务背景框架及相应环境laravel5.7,mysql5.7,redis5,nginx1.15centos7.5bbrdocker,docker-compose阿里云4C和8G问题背景php已经开启opcache,laravel也运行了optimize命令进行优化,composer也进行
PHP9年架构师
·
2024-02-15 04:59
Java
性能调优
的 11 个实用技巧
大多数开发人员认为性能优化是个比较复杂的问题,需要大量的经验和知识。是的,这并不没有错。诚然,优化应用程序以获得最好的性能并不是一件容易的事情,但这并不意味着你在没有获得这些经验和知识之前就不能做任何事。下面有几个很容易遵循的建议和最佳实践能够帮你创建一个性能良好的应用程序。这些建议中的大多数都是基于Java的,但是也不一定,也有一些是可以应用于所有的应用程序和编程语言的。在我们分享基于Java的
java菜
·
2024-02-15 04:29
一面数据:
Hadoop
迁移云上架构设计与实践
背景一面数据创立于2014年,是一家领先的数据智能解决方案提供商,通过解读来自电商平台和社交媒体渠道的海量数据,提供实时、全面的数据洞察。长期服务全球快消巨头(宝洁、联合利华、玛氏等),获得行业广泛认可。公司与阿里、京东、字节合作共建多个项目,旗下知乎数据专栏“数据冰山”拥有超30万粉丝。一面所属艾盛集团(Ascential)在伦敦证券交易所上市,在120多个国家为客户提供本地化专业服务。公司在2
JuiceFS
·
2024-02-15 01:48
(免费领源码)Java#MySql#
hadoop
高校固定资产管理系统74965-计算机毕业设计项目选题推荐
摘要在信息飞速发展的今天,网络已成为人们重要的信息交流平台。高校部门每天都有大量的信息需要通过网络发布,为此,高校固定资产管理系统开发的必然性,所以本人开发了一个基于Tomcat(服务器)模式的高校固定资产管理系统,该系统以B/S/Java语言、MySql数据库等为开发技术,实现了添加、修改、查看、删除系统数据。本系统采取组件化的方式对系统进行拆分,并对数据库中各个表的增删查改、表与表之间的约束关
2301_3224142804
·
2024-02-15 00:42
java
mysql
hadoop
spring
boot
django
python
php
大数据集群环境启动总结
hadoop
启动与停止单个节点逐一启动在主节点上使用以下命令启动HDFSNameNode:
hadoop
-daemon.shstartnamenode在每个从节点上使用以下命令启动HDFSDataNode
我还不够强
·
2024-02-14 23:04
Hadoop
-3.0.3 安装
Hadoop
-3.0.3安装一下载安装包二配置
Hadoop
环境变量/etc/profile后面追加export
HADOOP
_HOME=/data/
hadoop
-3.0.3exportPATH=$
HADOOP
_HOME
火星机遇号
·
2024-02-14 23:52
HDFS用户及权限配置
HDFS用户及权限配置使用linux用户bruce,格式化
hadoop
的namenode,那么bruce成为hdfs的超级用户在bruce用户下运行命令:#创建/user/
hadoop
目录
hadoop
fs-mkdir-p
wpheternal
·
2024-02-14 21:42
hadoop笔记
hadoop
hdfs
Hadoop
(HDFS)的超级用户
Hadoop
(HDFS)的超级用户超级用户超级用户即运行namenode进程的用户。宽泛的讲,如果你启动了namenode,你就是超级用户。超级用户干任何事情,因为超级用户能够通过所有的权限检查。
zinger.wang
·
2024-02-14 21:12
大数据
hadoop
hdfs
HDFS的超级用户
一.解释原因HDFS(
Hadoop
DistributedFileSystem)和linux文件系统管理一样,也是存在权限控制的。
重剑DS
·
2024-02-14 21:41
大数据
hdfs
hadoop
大数据
MySQL
性能调优
-(七)分区分表
分区表的应用场景1.表非常大以至于无法全部都放在内存中,或者只在表的最后部分有热点数据,其他均是历史数据2.分区表的数据更容易维护批量删除大量数据可以使用清除整个分区的方式对一个独立分区进行优化、检查、修复等操作3.分区表的数据可以分布在不同的物理设备上,从而高效地利用多个硬件设备4.可以使用分区表来避免某些特殊的瓶颈innodb的单个索引的互斥访问ext3文件系统的inode锁竞争5.可以备份和
努力的布布
·
2024-02-14 18:38
MySQL
mysql
Spark通过jdbc
性能调优
--采用分区的方式从oracle读数据
spark通过jdbc读取Oracle,当数据量很大的时候会出现两个问题:读取数据异常缓慢,甚至卡死大表中进行操作也会出现OOM的问题调优常规的读取数据库的方式如下ods_bdz=spark.read.format(“jdbc”).option(“url”,“jdbc:oracle:thin:@”+dbstring).option(“dbtable”,“ODS_BDZ”).option(“user
korry24
·
2024-02-14 18:08
oracle
spark
mysql
MySQL
性能调优
篇(5)-分区表的设计和使用
数据库分区表是MySQL中一种高效的数据管理技术,能够帮助我们更好地进行数据存储和查询。在本文中,我们将介绍MySQL数据库分区表的设计和使用。什么是数据库分区表数据库分区表是将一个大表拆分成多个小表,每个小表称为一个分区。分区表在逻辑上仍然是一个完整的表,但在物理存储上被分成多个部分。分区表可以根据表中的某个列的值进行划分,比如根据日期、地区、用户ID等。这样可以将数据分散存储在不同的分区中,提
俞兆鹏
·
2024-02-14 18:38
MySQL学习指南
mysql
openGauss学习笔记-218 openGauss
性能调优
-确定
性能调优
范围-硬件瓶颈点分析-I/O
文章目录openGauss学习笔记-218openGauss
性能调优
-确定
性能调优
范围-硬件瓶颈点分析-I/O218.1查看I/O状况218.2性能参数分析openGauss学习笔记-218openGauss
superman超哥
·
2024-02-14 10:36
openGauss学习笔记
openGauss
国产数据库
开源数据库
数据库
RDBMS
openGauss学习笔记-217 openGauss
性能调优
-确定
性能调优
范围-硬件瓶颈点分析-内存
文章目录openGauss学习笔记-217openGauss
性能调优
-确定
性能调优
范围-硬件瓶颈点分析-内存217.1查看内存状况217.2性能参数分析openGauss学习笔记-217openGauss
superman超哥
·
2024-02-14 10:34
openGauss学习笔记
openGauss
国产数据库
开源数据库
数据库
RDBMS
Hadoop
+Spark+MongoDB+MySQL+C#大数据开发项目最佳实践
一、前言随着IT技术的飞速发展,各行各业都已在广泛尝试使用大数据技术提供更稳健和优质的服务。目前,医疗IT系统收集了大量极具价值的数据,但这些历史医疗数据并没有发挥出其应有的价值。为此,本文拟利用医院现有的历史数据,挖掘出有价值的基于统计学的医学规则、知识,并基于这些信息构建专业的临床知识库,提供诊断、处方、用药推荐功能,基于强大的关联推荐能力,极大地提高医疗服务质量,减轻医疗人员的工作强度。二、
yiyidsj
·
2024-02-14 07:08
大数据
人工智能
互联网
spark
Hadoop
MySQL
大数据开发
大数据学习
学习总结 - swift适配器 为
Hadoop
的存储层增加对 OpenStack Swift 的支持
虽然文档内所涉及的版本有点旧,但内容很精彩,值得推荐背景在
Hadoop
中有一个抽象文件系统的概念,它有多个不同的子类实现,由DistributedFileSystem类代表的HDFS便是其中之一。
天地不仁以万物为刍狗
·
2024-02-14 07:37
分布式解决方案
C#
Hadoop
学习笔记
记录一下学习地址http://www.360doc.com/content/14/0607/22/3218170_384675141.shtml转载于:https://www.cnblogs.com/TF12138/p/4170558.html
第八个猴子
·
2024-02-14 07:37
大数据
hadoop
HDFS的API封装
Configuration类:该类的对象封装了客户端或者服务端的配置。FileSystem类:该类的对象是一个文件系统对象,可以用该队想的一些方法来对文件进行操作。FSDataInputStream和FSDataOutputStream:这两个类是HDFS中的输入输出流。基本流程:得到Configuration对象得到FileSystem对象进行文件操作(读写、删除、改名)所需引入的库import
Cynicism_Kevin
·
2024-02-14 07:37
大数据
java
hadoop
hdfs
Hive的小文件问题
Reduce的数量3.2已存在的小文件合并3.2.1方式一:insertoverwrite(推荐)3.2.2方式二:concatenate3.2.3方式三:使用hive的archive归档3.2.4方式四:
hadoop
getmerge
爱吃辣条byte
·
2024-02-14 06:11
#
Hive
hive
数据仓库
从
Hadoop
框架与MapReduce模式中谈海量数据处理(含淘宝技术架构)
从
Hadoop
框架与MapReduce模式中谈海量数据处理(含淘宝技术架构)前言几周前,当我最初听到,以致后来初次接触
Hadoop
与MapReduce这两个东西,我便稍显兴奋,觉得它们很是神秘,而神秘的东西常能勾起我的兴趣
Dimple七
·
2024-02-14 06:41
java面试题/认证答辩 ---linux系统操作
基本命令(cd,ls,top等)的使用掌握:掌握常用软件的安装(java,mysql等)精通:掌握常见运维工具的使用,能进行脚本开发综合应用:掌握linux操作系统的基本原理,具备在系统下进行网络配置,
性能调优
Fuly1024
·
2024-02-14 05:31
面试刷题
linux
大数据开发之Sqoop详细介绍
备注:测试环境CDH6.3.1Sqoop1.4.7一.Sqoop概述ApacheSqoop(SQL-to-
Hadoop
)项目旨在协助RDBMS与
Hadoop
之间进行高效的大数据交流。
只是甲
·
2024-02-14 01:17
《Linux 简易速速上手小册》第10章: 性能监控与优化(2024 最新版)
10.1.4拓展案例2:分析具体时间段的系统负载10.2优化性能10.2.1重点基础知识10.2.2重点案例:优化Web服务器性能10.2.3拓展案例1:数据库服务器性能优化10.2.4拓展案例2:网络
性能调优
江帅帅
·
2024-02-13 22:58
《Linux
简易速速上手小册》
linux
运维
服务器
数据挖掘
人工智能
python
web3
Ubuntu16.04下HBase安装笔记
基础准备JDK
Hadoop
SSHServer下载HBasehttps://hbase.apache.org/tar-zxvfhbase-1.4.2-bin.tar.gzsudomvhbase-1.4.2
bluexiii
·
2024-02-13 22:48
利用 Docker 安装
Hadoop
集群并通过 Java API 访问 HDFS
前言最近刚好在学习
Hadoop
,在安装过程中遇到了一些小麻烦,正好将此次过程记录并分享出来,希望能对准备学习本块内容的读者们有所帮助。本次操作在Ubuntu中完成,如何安装Ubuntu本文不再赘述。
qq_33419925
·
2024-02-13 21:38
docker
hadoop
linux
java
大数据
hadoop
(十三)—自定义排序
这节课我们一起学习
Hadoop
的自定义排序,
Hadoop
是有一套默认的排序规则的,但是这往往不能满足我们多样化的需求,为了让排序更多样化,这就需要用到我们本节课所要学习的自定义排序功能。
文子轩
·
2024-02-13 20:13
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他