E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop离线数仓
hadoop
之mapreduce教程+案例学习(一)
第1章MapReduce概述目录第1章MapReduce概述1.1MapReduce定义MapReduce是一个分布式运算程序的编程框架,是用户开发“基于
Hadoop
的数据分析应用”的核心框架。
菜瓜技术联盟
·
2024-01-22 19:04
Hadoop
mapreduce
hadoop
Minimum Array(在线+贪心map /
离线
+扫描线思想+区间删除)
题目长为n(n#include#include#include#includeusingnamespacestd;#definerep(i,a,b)for(inti=(a);i=(b);--i)typedeflonglongll;typedefdoubledb;typedefpairP;#definefifirst#definesesecond#definepbpush_back#definedb
Code92007
·
2024-01-22 19:01
#
线段树/树状数组
思维题
贪心
离线
扫描线思想
区间删除
在线
贪心
Impala:基于内存的MPP查询引擎
Impala的特点1.3、Impala与Hive1、Impala概述1.1、Impala简介Impala是Cloudera公司主导研发的高性能、低延迟的交互式SQL查询引擎,它提供SQL语义,能查询存储在
Hadoop
对许
·
2024-01-22 17:26
Java大数据
#
Hadoop及生态圈
#
数据湖仓
大数据
Hadooop和Hbase是什么关系
HBase是一个基于
Hadoop
的NoSQL分布式列存储数据库,用于存储海量结构化和半结构化数据,并提供高可用、高性能和面向列的操作功能。
wwwyx12138
·
2024-01-22 17:50
hbase
数据库
大数据
大数据平台的硬件规划、网络调优、架构设计、节点规划
1.大数据平台硬件选型要对
Hadoop
大数据平台进行硬件选型,首先需要了解
Hadoop
的运行架构以及每个角色的功能。
小枫@码
·
2024-01-22 17:18
大数据架构师
大数据
数据湖技术之Paimon
社区希望能够将Flink的Streaming实时计算能力和Lakehouse新架构优势进一步结合,推出新一代StreamingLakehouse技术,促进数据在数据湖上真正实时流动起来,并为用户提供实时
离线
一体化的开发体验
小枫@码
·
2024-01-22 17:48
数据湖
大数据
Nginx之Centos7安装及配置代理多个后端服务
Nginx之Centos7安装文章目录Nginx之Centos7安装1.
离线
安装1.下载2.安装依赖3.编译并安装4.启动5.访问6.访问出现403问题处理7.80端口代理多个后端服务2.Nginx常用命令
小袁搬码
·
2024-01-22 15:49
nginx
运维
centos
hadoop
-hdfs-API
处理
hadoop
配置文件及系统环境1.将
hadoop
所有jar包(除了..以外)添进
hadoop
/lib文件夹备用。2.将linux的
hadoop
/bin导出覆盖windows的
hadoop
/bin。
有七段变化
·
2024-01-22 15:43
Apache doris Datax DorisWriter扩展使用方法
DataX是阿里云DataWorks数据集成的开源版本,在阿里巴巴集团内被广泛使用的
离线
数据同步工具/平台。
张家锋
·
2024-01-22 15:27
vscode Extension 插件
离线
安装
下载DownloadExtension(这个必须有网)插件官网https://marketplace.visualstudio.com搜索想要的插件,点击卡片进入详情页搜索DownloadExtension关键字,点击下载安装InstallExtension刚下载好的文件eamodio.gitlens-9.3.0.vsix存放目录c:\download\eamodio.gitlens-9.3.0.
澄澄真可爱
·
2024-01-22 15:40
CentOS7下
Hadoop
2.9.2、Hive 2.3.6安装与实践
参考的安装文章地址:https://blog.csdn.net/pengjunlee/article/details/81607890实际安装的版本为:
hadoop
2.9.2,hive2.3.6;操作系统
流火星空
·
2024-01-22 14:58
大数据
hive
大数据
hive
java大数据
hadoop
2.9.2 Linux安装mariadb和hive
一、安装mariadb版本centos71、检查Linux服务器是否已安装mariadbyumlistinstalledmariadb*2、如果安装了,想要卸载yumremovemariadbrm-rf/etc/my.cnfrm-rf/var/lib/mysql才能完全删除3、安装mariadb在线网络安装yuminstall-ymariadb-server开启服务systemctlstartma
crud-boy
·
2024-01-22 14:26
java大数据
大数据
linux
mariadb
关于Hive架构原理,尚硅谷
最近学习hive时候,在做一个实操案例,具体大概是这样子的:我在dataGip里建了一个表,然后在
hadoop
集群创建一个文本文件里面存储了数据库表的数据信息,然后把他上传到hdfs后,dataGrip
大数据SQLboy
·
2024-01-22 11:41
Hive
hive
架构
hadoop
Impala
最大的特点就是速度快Impala优势Impala的诞生Hive与MR适合
离线
批处理,但是对交互式查询的场景无能为力(快速响应),所以为了积极查询速度问题开发了Impala,Impala抛弃了MR,使用了类似传统的
奋斗的蛐蛐
·
2024-01-22 10:42
Ranger概述及安装配置
二、Ranger2.1、什么是rangerApacheRanger是一个用来在
Hadoop
平台上进行监控,启动服务,以及全方位数据安全访问管理的安全框架。Ranger愿景是在Apa
小枫@码
·
2024-01-22 09:39
大数据运维
安全
运维
【大数据处理技术实践】期末考查题目:集群搭建、合并文件与数据统计可视化
合并文件与数据统计可视化实验目的任务一:任务二:实验平台实验内容及步骤任务一:搭建具有3个DataNode节点的HDFS集群集群环境配置克隆的方式创建Slave节点修改主机名编辑hosts文件生成密钥免认证登录修改
hadoop
汐ya~
·
2024-01-22 09:35
hadoop
linux
虚拟机
java
redis-5.0.8集群环境搭建
单机环境安装redis-3.2.8主从复制架构搭建及哨兵配置如果你对redis的安装很陌生,请看完我以上两期教程,对完成此期教程很有帮助2.下载解压redis-5.0.8.tar.gz[xiaokang@
hadoop
01
小刘新鲜事儿
·
2024-01-22 08:15
redis
redis
大数据技术原理及应用课实验3 :熟悉常用的HBase操作
目录实验3熟悉常用的HBase操作一、实验目的二、实验平台三、实验步骤(每个步骤下均需有运行截图)(一)编程实现以下指定功能,并用
Hadoop
提供的HBaseShell命令完成相同任务:1.列出HBase
Blossom i
·
2024-01-22 08:08
大数据编程
大数据
hbase
数据库
Flink on YARN(下):常见问题与排查思路
杨弢(搏远),阿里巴巴计算平台事业部技术专家,Apache
Hadoop
Committer,目前专注于YARN、Flink、YuniKorn等开源项目的资源调度方向。
Apache Flink
·
2024-01-22 08:33
一张图轻松掌握 Flink on YARN 基础架构与启动流程
杨弢(搏远),阿里巴巴计算平台事业部技术专家,Apache
Hadoop
Committer,目前专注于YARN、Flink、YuniKorn等开源项目的资源调度方向。
zhisheng_blog
·
2024-01-22 08:02
10
Hadoop
的安全模式及权限介绍
1、HDFS工作流程启动NameNode,NameNode加载fsimage到内存,对内存数据执行editslog日志中的事务操作。文件系统元数据内存镜像加载完毕,进行fsimage和editslog日志的合并,并创建新的fsimage文件和一个空的editslog日志文件。NameNode等待DataNode上传block列表信息,直到副本数满足最小副本条件,这个过程NameNode处于安全模式
水无痕simon
·
2024-01-22 08:02
Hadoop
hadoop
安全
大数据
Flink背景
数仓
简介在信息爆炸的时代,为了从海量数据中洞察业务价值,驱动运营决策,企业通常会构建用于数据分析的数据仓库。
201001070
·
2024-01-22 08:31
Flink
flink
大数据
[flink]一Flink部署|配置文件|提交作业|部署模式|独立模式部署|yarn模式部署
一、集群部署集群规划节点服务器
hadoop
1
hadoop
2
hadoop
3
hadoop
4角色JobManagerTaskManagerTaskManagerTaskManagerTaskManager1、
胖胖学编程
·
2024-01-22 08:30
Flink
flink
腾讯云对接华为
离线
推送遇到的问题
一、首先是华为开发者中的处理https://developer.huawei.com/consumer/cn/console/service/AppService1、点击AppGalleryConnect2、点击我的项目3、未添加应用前这里有个小坑,未添加应用前是没有腾讯云说的agconnect-services.json文件的,这里浪费了我很长时间,更别说clientId等信息了。4、补充一点:
开发_李行
·
2024-01-22 08:56
推送
腾讯云
华为
腾讯云
Hadoop
基本概论
目录一、大数据概论1.大数据的概念2.大数据的特点3.大数据应用场景二、
Hadoop
概述1.
Hadoop
定义2.
Hadoop
发展历史3.
Hadoop
发行版本4.
Hadoop
优势5.
Hadoop
1.x/2
LzYuY
·
2024-01-22 08:25
Hadoop
hadoop
大数据
分布式
史上最全深度解析Flink内存管理--大数据技术
目前,大数据计算引擎主要使用Java或基于JVM的编程语言实现的,例如Apache
Hadoop
,ApacheSpark,ApacheDrill,ApacheFlink等。
大数据学习僧
·
2024-01-22 08:50
Flink
大数据
flink
Flink(十四)【Flink SQL(中)查询】
FlinkSQL查询环境准备:#1.先启动
hadoop
my
hadoop
start#2.不需要启动flink只启动yarn-session即可/opt/module/flink-1.17.0/bin/yarn-session.sh-d
让线程再跑一会
·
2024-01-22 08:14
Flink
flink
大数据
Flink是如何管理内存的
在讲Flink管理内存之前要了解下Flink为什么要自己实现内存管理一、Flink为什么要自己实现内存管理在大数据领域,大多数数据相关的开源框架(
Hadoop
、Spark、Storm)都是基于JVM运行的
Relian哈哈
·
2024-01-22 08:13
Flink
hive sql转换成MR任务过程
)、WEBUI(浏览器访问hive)2)元数据:Metastore元数据包括:表名、表所属的数据库(默认是default)、表的拥有者、列/分区字段、表的类型(是否是外部表)、表的数据所在目录等;3)
Hadoop
上官沐雪
·
2024-01-22 08:08
hive
hive
大数据开发之电商
数仓
(
hadoop
、flume、hive、hdfs、zookeeper、kafka)
第1章:数据仓库1.1数据仓库概述1.1.1数据仓库概念1、数据仓库概念:为企业制定决策,提供数据支持的集合。通过对数据仓库中数据的分析,可以帮助企业,改进业务流程、控制成本,提高产品质量。数据仓库并不是数据的最终目的地,而是为数据最终的目的地做好准备,这些准备包括对数据的:清洗、转义、分类、重组、合并、拆分、统计等。2、数据仓库的数据通常包括:业务数据、用户行为数据和爬虫数据等3、业务系统数据库
Key-Key
·
2024-01-22 07:29
大数据
hadoop
flume
kafka
hive
hdfs
看看关系型数据库是怎么吊打
Hadoop
的
所以在不少架构中,会看到使用ETL的方式将数据库送到
Hadoop
中,使用其分布式存储和分布式计算的特点来进行分析。
薛晓刚
·
2024-01-22 02:58
数据库
25.集群异常故障分析——HOSTS
25.1问题情况
Hadoop
集群HDFS、YARN、Hive等服务出现异常告警重启集群异常告警任然存在大量告警Cluster1HDFS可用空间抑制...NameNode运行状况抑制...HDFS金丝雀抑制
大勇任卷舒
·
2024-01-22 02:51
【blender渲染】blender流体模拟基础
各位新年好哇,最近在做demo的时候,为了更好的效果,开始摸索一点
离线
渲染的东西。像这种后续渲染的处理,由于3dsmax是更偏向于建模的dcc,有点不那么好使(没有说看不起vray的意思哈)。
misaka12807
·
2024-01-22 01:25
blender大便造型家
blender
动画
图形渲染
材质
着色器
游戏美术
vr
安装配置vscode
安装VSCodeVisualStudioCode
离线
安装扩展先在ExtensionsforVisualStudioCode下载扩展包。
liuyuan185442111
·
2024-01-21 22:24
其他
vscode
ide
编辑器
Hive SQL的编译过程(转)
Hive是基于
Hadoop
的一个数据仓库系统,在各大公司都有广泛的应用。美团数据仓库也是基于Hive搭建,每天执行近万次的HiveETL计算流程,负责每天数百GB的数据存储和分析。
愤怒的谜团
·
2024-01-21 20:40
大数据小白初探HDFS从零到入门(一)
目录1.前言2.大数据的诞生3.发展趋势及应用4.
离线
计算和实时计算5.大数据的特性1.前言前两天把Hbase的初级入门知识整理了下,在文章中提到了“HDFS”这个大数据的基础,有同事小伙伴想要了解下这方面的知识
北京-景枫
·
2024-01-21 20:55
Hadoop
大数据
hdfs
yarn
大数据特性
Hbase笔记
HBase-1.hbase介绍ApacheHBase™是
Hadoop
数据库,是一个分布式,可扩展的大数据存储。当您需要对大数据进行随机,实时读/写访问时,请使用ApacheHBase™。
MFRain
·
2024-01-21 20:24
Docker elacticsearch+filebeat+logstash+kibana docker-compose一键启动 日志管理系统 本地安装 详细版
思路(使用
离线
本地搭建)1.安装docker以及docker-compose(自行安装版本不低即可)安装docker:(4条消息)Centos7安装Docker_玩物丧志的快乐的博客-CSDN博客_centos7docker
HaoJIANG_0
·
2024-01-21 19:25
docker
docker-compose
elk
云计算
运维开发
spark on yarn安装部署
所使用的安装包名称按自己的修改,安装包可去各大官网上下载一,解压tar-zxvf/opt/software/spark-3.1.1-bin-
hadoop
3.2.tgz-C/opt/module/修改名称
佛系爱学习
·
2024-01-21 17:11
spark
大数据
分布式
黑猴子的家:API 操作 HDFS 文件下载
1、Code->GitHubhttps://github.com/liufengji/
hadoop
_hdfs.git2、Code@TestpublicvoidgetFileFromHDFS()throwsException
黑猴子的家
·
2024-01-21 16:19
django基于
Hadoop
平台的电影推荐系统(程序+开题报告)
本系统(程序+源码+数据库+调试部署+开发环境)带文档lw万字以上,文末可获取系统程序文件列表开题报告内容研究背景:随着互联网的普及和大数据技术的发展,人们对于个性化推荐的需求越来越高。电影作为一种重要的娱乐方式,其推荐系统的研究也受到了广泛关注。然而,传统的电影推荐系统往往基于用户的历史行为进行推荐,忽略了其他重要的信息,如电影的类型、导演、演员等。此外,由于电影数据的海量性和复杂性,传统的推荐
liu10662
·
2024-01-21 15:51
django
python
后端
ubuntu22.04安装atlas2.0.0
在ubuntu裸机上安装,裸机未安装java,
hadoop
等环境。jdk和maven都使用apt方式安装。sudoaptinstallopenjdk-8-jdksudoa
playmakerlby
·
2024-01-21 15:37
大数据
大数据
maven
数据仓库简介、数据仓库的发展、
数仓
理论简介
数仓
理论简介数据仓库解决方案诞生至今,也有2、30年的发展历史了,在这个过程中,
数仓
理论不断被更新和完善,逐步形成了目前大家普通遵守的
数仓
开发理论(概念)。
yida&yueda
·
2024-01-21 11:48
大数据
数据仓库
big
data
数据库
数据仓库简介
一、
数仓
概念数据仓库,英文名称为DataWarehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。
水坚石青
·
2024-01-21 11:46
数据仓库
mysql
数据库
java
数据仓库
oracle
大数据
maven创建
离线
本地仓库的坑之verifying availability
离线
运行,maven本身就支持的不够友好,
离线
从来都不是maven的好朋友!笔者就在搭建maven本地仓库时遇到了一些麻烦。
快乐的阿常艾念宝
·
2024-01-21 10:14
小工具
hadoop
yarn 配置
转自:http://blog.csdn.net/guotong1988/article/details/47130701
晴天哥_王志
·
2024-01-21 09:03
02-黑马程序员大数据开发:分布式计算和分布式资源调度
分布式计算模式:分散->汇总模式(MapReduce)和中心调度->步骤执行模式(ApacheSpark,Flink;比较复杂,中间会有数据交换的过程);2.MapReduce概述MapReduce是
Hadoop
S1406793
·
2024-01-21 08:52
大数据开发
大数据
分布式
大数据开发之Kafka(broker、消费者、eagle监控、kraft模式)
KafkaBroker4.1KafkaBroker工作流程4.1.1Zookeeper存储的Kafka的信息1、查看zookeeper中的kafka节点所存储的信息启动Zookeeper客户端[atguigu@
hadoop
104zookeeper
Key-Key
·
2024-01-21 07:18
大数据
kafka
linq
Hadoop
入门概述
Hadoop
是一个开源的分布式计算框架,主要用于处理和存储大规模数据集。
转身成为了码农
·
2024-01-21 07:41
hadoop
大数据
分布式
大数据之Spark架构设计与工作流程
驱动器还负责任务的调度,并与集群管理器(如
Hadoop
YARN、ApacheMesos或Standalone模
转身成为了码农
·
2024-01-21 07:41
大数据
spark
分布式
上一页
25
26
27
28
29
30
31
32
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他