E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
mapreduce运行日志
Springdata-mongodb的基本使用
MongoTemplate1.1MongodbDriverApi操作MongoDB1.1.2基本CRUD1.1.3连接选项1.2MongoTemplate的基本CRUD1.3MongoTemplate的聚合查询1.3.1Aggregate1.3.2
MapReduce
1.3.3
haptony
·
2022-09-26 07:53
Java
mongodb
java
数据库
大数据学习路径
五8一】最后014,即可免费领取一整套系统的大数据学习教程第一阶段linux+搜索+hadoop体系Linux基础→shell编程→高并发架构→lucene,solr搜索→hadoop体系→HDFS→
mapreduce
金罗老师
·
2022-09-25 07:07
大数据
大数据开发
大数据学习
人工智能
编程开发
大数据分析
hadoop
spark
大数据学习
大数据开发
大数据入门
数据分析
人工智能
大数据之Python入门语法基础
特点及简介\python在编程语言中的排名4位简洁优雅同scala语言完成同样一个任务c语言1000行java100行scala/python20行面向过程及面向对象的语言同scala语言wordcount
MapReduce
梦子mengy7762
·
2022-09-24 16:28
爬虫
数据分析
python
大数据
python
java
hadoop
编程语言
分布式系统面试连环炮
他们有共同的一个问题,就是都没怎么搞过分布式系统,现在互联网公司,一般都是做分布式的系统,大家都不是做底层的分布式系统、分布式存储系统HadoopHDFS、分布式计算系统Hadoop
MapReduce
/
@司马懿
·
2022-09-22 19:12
分布式服务
参加第2届全国高校大数据教学研讨会总结
以前涉及到的大数据计算,基本就是
MapReduce
操作以及加减乘除的简单组合,并没有特别地将其视为大数据算法,并且认为大数据算法知识传统算法的简单迁移。专家眼中的大数据算法跟我想的还是不一样。
桂小林
·
2022-09-22 14:56
其它
大数据
教学研讨会
我眼中的大数据(一)
我们常说的大数据技术,其实起源于Google在2004年前后发表的三篇论文,分别是分布式文件系统GFS、大数据分布式计算框架
MapReduce
和NoSQL数据库系统BigTable(如果大家需要可以留言给我
平 凡 程 序 猿
·
2022-09-22 14:20
大数据
数据库
大数据
storm
hadoop
flink
Qt环境生成dump解决异常崩溃
一般通过客户反馈以及分析系统
运行日志
,问题基本都能够得到快速解决。但总会有些bug很难定位,这种情况下通过生成dump文件,结合winDbg程序定位问题将是一个很好的解决方式。
空白即是昵称
·
2022-09-22 08:07
Qt开发
qt
开发语言
presto和clickhouse简单介绍
它的产生是为了解决hive的
Mapreduce
模型太慢以及不能通过bi或者dashboards直接展现hdfs数据的问题,presto是一个纯粹的计算引擎。
古城的风cll
·
2022-09-22 05:54
presto
clickhouse
大数据技术Spark详解
Hadoop的
MapReduce
是大家广为熟知的计算框架,那为什么咱们还要学习新的计算框架Spark呢,这里就不得不提到Spark和Hadoop的关系。
wespten
·
2022-09-21 14:20
Hadoop
Hive
Spark
大数据安全
大数据
spark
scala
大数据技术之Hive+Flume+Zookeeper+Kafka详解
Hive本质是将HQL转化成
MapReduce
程序。(1)Hive处理的数据存储在HDFS(2)Hive分析数据底层的实现是
MapReduce
(3)执行程序运行在Yarn上Hive的
wespten
·
2022-09-21 14:12
Hadoop
Hive
Spark
大数据安全
kafka
大数据
hive
MapReduce
概述及
MapReduce
详细实现
目录一、概述二、定义三、
MapReduce
原理1、原理四、MR执行过程1、map阶段2、reudce阶段3、shuffle过程五、
MapReduce
默认输入处理类六、RecordReader七、Inputsplit
It.explorer
·
2022-09-21 13:09
hadoop
hadoop
Hadoop框架之——
Mapreduce
概述
文章目录1.定义2.优缺点2.1.优点2.2缺点3,
MapReduce
核心思想4,
MapReduce
进程5,常用数据序列化类型6,
MapReduce
编程规范7.WordCount案例实操1.定义
Mapreduce
Alienware^
·
2022-09-21 13:39
#
Hadoop
大数据
hadoop
mapreduce
MapReduce
工作流程概述
Mapreduce
工作流程概述HDFS以固定大小的block为基本单位存储数据,而对于
mapreduce
而言,其处理单位为split;split是一个逻辑概念,它只包含一些元数据信息,如数据起始位置,
tomwang0322
·
2022-09-21 13:08
HDFS、YARN、
MapReduce
概述及三者之间的关系
组成3、HDFS文件块大小4、HDFS的优点5、HDFS的缺点6、HDFS读数据流程7、NameNode工作原理8、DataNode工作原理二、YARN架构概述1、yarn概述2、yarn构成组件三、
MapReduce
1
普通网友
·
2022-09-21 13:35
java
hdfs
mapreduce
hadoop
分布式
运维
大数据面试之hive重点(二)
可回答:1)HiveSQL的解析过程;2)HiveSQL的底层实现问过的一些公司:阿里,头条,小米,滴滴,美团x2,网易,快手58,好未来参考答案:我们先来看下
MapReduce
框架实现SQL基本操作的原理
大数据小理
·
2022-09-21 13:35
大数据面试
数仓面试
hive
hive
大数据
MapReduce
概述
文章目录1、
MapReduce
的优缺点1.1优点1.2缺点2、
MapReduce
进程3、常用数据序列化类型1、
MapReduce
的优缺点1.1优点
MapReduce
易于编程良好的扩展性当计算资源不能得到满足的时候
MelodyYN
·
2022-09-21 13:05
Hadoop
mapreduce
hadoop
big
data
第一章
MapReduce
概述
1.1
MapReduce
定义
MapReduce
是一个分布式应用程序的编程框架,是用户开发“基于Hadoop的数据分析应用”的核心框架。
留不住斜阳
·
2022-09-21 13:34
MapReduce
大数据
mapreduce
hadoop
big
data
【Hadoop】5.1
MapReduce
概述
5.1
MapReduce
概述5.1.1
MapReduce
核心思想5.1.2
MapReduce
编程规范5.1.3WordCount案例
MapReduce
定义
MapReduce
是一个分布式运算程序的编程框架
coolcoo1cool
·
2022-09-21 13:03
Hadoop
mapreduce
MapReduce
体系架构和工作流程
前言:MapRedeuce这一章节是非常重要的,涉及了很多实例,这篇文章对
MapReduce
进行概述,了解它的架构和工作机制,为编程做好基础。
非公版vj
·
2022-09-21 13:02
概念阐述
mapreduce
MapReduce
概述及工作流程
内容
mapreduce
原语(独创)
mapreduce
工作流程(重点)MR作业提交流程(重点)YARNRM-HA搭建(熟练)运行自带的wordcount(了解)动手写wordcount(熟练)
MapReduce
30岁老阿姨
·
2022-09-21 13:31
Hadoop
mapreduce
hadoop
大数据
数据采集模块——Flume消费Kafka数据写入到HDFS
测试集群为第三方公司基于当前主流开源组件自主研发并搭建的大数据平台,包含常用组件:HDFS,
MapReduce
,Yarn,Hive,HBase,Phoenix,Zookeeper,Spark,Impala
Diego_zh
·
2022-09-21 11:16
kafka
Flume
kafka
flume
hdfs
大数据
Hbase介绍
利用HadoopHDFS作为其文件存储系统,利用Hadoop
MapReduce
来处理Hbase中的海量数据,利用Zookeeper作为其分布式协同服务主要用来存储非结构化和半结构化的松散数据(列存NoSQL
sanhongbo
·
2022-09-19 11:35
hbase
hbase
数据库
zookeeper
spark学习day(一)
spark的介绍spark框架是如何处理数据的Hadoop
MapReduce
框架并行计算的思想、分而治之的思想scala集合高阶函数处理数据的思想将要分析的数据放到集合中去,然后调用集合的高阶函数处理数据
不再简简单单
·
2022-09-19 11:05
spark
spark学习day(一)
spark的介绍
hadoop学习之(
MapReduce
、Pig、hive)
学习背景:基于美国民航航班的历年数据(1987年--2008年),开发
MapReduce
、Pig、hive应用程序计算其中某一年各个航班的飞行数据(飞行架次、飞行距离);
MapReduce
项目:1.编写
是饿梦啊
·
2022-09-18 09:01
hadoop
hive
mapreduce
pig
大数据
java
mapreduce
api_Hadoop实战-初级部分 之 Hadoop
MapReduce
JAVA API
精品视频课程推荐Java数据结构和算法精讲版本课程专注于数据结构和算法的内容,使用Java来进行代码示例,不空洞的讲解概念和理论,重点放在代码的实现和示例上。从零开始、全面系统、成体系的讲解数据结构和基本算法,循序渐进的讲述构建软件系统所常见的数据结构和算法。Hadoop实战-初级部分视频教程Hadoop初级精品课程,帮助学员快速掌握Hadoop入门到上手开发,并掌握一定的开发技巧。通过Hadoo
weixin_39980298
·
2022-09-17 18:45
java
mapreduce
api
Java并发编程——ForkJoinPool
核心思想是将大的任务拆分成多个小任务(即fork),然后在将多个小任务处理汇总到一个结果上(即join),非常像
MapReduce
处理原理。
小波同学
·
2022-09-17 01:04
EMR重磅发布智能运维诊断系统(EMR Doctor)——开源大数据平台运维利器
简介:E-
MapReduce
推出面向开源大数据集群的智能运维诊断系统E-
MapReduce
Doctor,有效提升大数据集群运维效率,辅助EMR用户完善集群监控体系。
·
2022-09-16 16:43
后端
大数据(三)大数据计算引擎
文章目录说明分享大数据计算引擎批处理
MapReduce
tez流批处理Flinkspark总结说明本博客每周五更新一次。介绍过大数据平台的搭建、应用和存储,本期分享下大数据计算。
羽落风起
·
2022-09-16 13:07
大数据
big
data
hadoop
spark
第9章 Spark—基于内存的大数据计算框架
Spark是UCBerkeleyAMPlab(加州大学伯克利分校的AMP实验室)所开源的类Hadoop
MapReduce
的通用并行框架,Spark,拥有Hadoop
MapReduce
所具有的优点;但不同于
这里是_uuu
·
2022-09-16 13:06
大数据
大数据开发之小文件合并
问题背景:MR计算引擎一般把一次查询切分成多个stage,每个stage是一次
MapReduce
计算,而
MapReduce
计算则是将多个MapTask读取到的数据,划分成不同的分区,汇聚到不同的Reduce
归去来?
·
2022-09-16 13:36
数据仓库
大数据
hadoop
hdfs
大数据计算框架及引擎介绍
如ApacheHadoop可以看作一种以
MapReduce
作为默认处理引擎的处理框架
归去来?
·
2022-09-16 13:32
大数据架构
大数据
hadoop
mapreduce
spark
hdfs
Python——logging日志模块的简单使用
logging模块是python内置的标准模块,主要用于输出
运行日志
,可以设置输出日志的等级、日志保存路径、日志文件和回滚等;记录程序日志信息的目的是:可以很方便的了解程序的运行情况可以分析用户的操作行为
钟灵毓秀M
·
2022-09-15 14:53
python基础
python
logging
python 日志输出变量_Python常用模块logging——日志输出
用途logging模块是Python的内置模块,主要用于输出
运行日志
,可以灵活配置输出日志的各项信息。
weixin_39712705
·
2022-09-15 14:20
python
日志输出变量
Apache Flink 简介
前言计算引擎大数据计算引擎分为离线计算和实时计算,离线计算就是我们通常说的批计算,代表是Hadoop
MapReduce
、Hive等大数据技术。
小波同学
·
2022-09-12 23:52
JVM系列之性能调优案例
减少FullGC出现的频率,解决运行慢、卡顿问题1.2、调优的大方向合理地编写代码充分并合理的使用硬件资源合理地进行JVM调优1.3、不同阶段的考虑上线前项目运行阶段线上出现OOM1.4、调优监控的依据
运行日志
异常堆栈
prefect_start
·
2022-09-12 10:31
JVM
面试
JVM
参数调优
性能优化
Python3 函数式编程
Python3函数式编程目录函数式编程高阶函数
mapreduce
filter返回函数匿名函数(lambda)装饰器参考资料相关知识:函数内部的变量在函数执行完后就销毁;Python中一切皆变量。
唐奋
·
2022-09-11 22:40
Python编程开发
python
开发语言
HDFS学习笔记(五):Yarn架构原理
文章目录1、Yarn产生背景1.1
MapReduce
1的局限性1.2Yarn设计思想2、Yarn基本组成架构2.1、ResourceManager(RM)2.1.1、调度器(Scheduler)2.1.2
leo825...
·
2022-09-09 16:33
大数据学习
hdfs
学习
架构
第十三章 大数据Hadoop原理应用
13.1HDFS原理及应用13.2
MapReduce
与Yarn原理及应用13.1HDFS原理及应用分而治之简单介绍Hadoop(5.x版本比较好)。
我爱肉肉
·
2022-09-09 07:22
JavaWeb基础篇
hadoop
hdfs
mapreduce
大数据
Hadoop大数据综合案例5-SSM可视化基础搭建
大数据招聘网数据分析综合案例Hadoop大数据综合案例1-Hadoop2.7.3伪分布式环境搭建Hadoop大数据综合案例2-HttpClient与Python招聘网数据采集Hadoop大数据综合案例3-
MapReduce
CDHong.it
·
2022-09-09 07:48
Hadoop大数据
可视化
ssm
数据库
大数据技术之Hadoop(
MapReduce
) 第5章 Yarn
5.1Yarn概述Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台,而
MapReduce
等运算程序则相当于运行于操作系统之上的应用程序。
尚硅谷铁杆粉丝
·
2022-09-09 07:16
Java
Java
Linux
大数据
IT
尚硅谷
Yarn资源管理器
Yarn被引入Hadoop2.0,最初是为了改善
MapReduce
的实现,但是因为具有足够的通用性,同样也可以支持其他的分布式计算模式,比如Spark,Tez等计算框架。Yarn的设计
稷下小鲤鱼
·
2022-09-09 07:44
Yarn
初识HADOOP---大数据分析技术笔记1
MapReduce
模型该模型抽象出硬盘读写问题,并将其转化为对一个数据集(由键值对组成)的计算,它是一个批处理系统传统关系型数据库
MapReduce
GB数量级PB数量级交互式和批处理批处理多次读写一次写入多次读取事务
不秃头的码农
·
2022-09-09 07:44
大数据
大数据
猿创征文|Hadoop大数据技术
概述优点缺点基本组成NameNodeSecondaryNameNodeDataNodeYARNYARN调度器(Scheduler)FIFOSchedulerCapacityScheduleFairScheduler
MapReduce
啊Q老师
·
2022-09-08 20:45
Hadoop
HDFS
YARN
MapReduce
Hive
什么是
MapReduce
?
MapReduce
整体架构搭建使用介绍
文章目录前言
MapReduce
入门
MapReduce
的核心思想
MapReduce
yarnYarn伪分布式搭建
MapReduce
编码需求
MapReduce
2.0工作机制
MapReduce
数据流转机制MR编码准备
IT行业小趴菜
·
2022-09-08 12:40
#
MapReduce
mapreduce
大数据
big
data
hdfs
重磅发布!阿里云全链路数据湖开发治理解决方案
简介:阿里云重磅发布全链路数据湖解决方案,主要包含开源大数据平台E-
MapReduce
(EMR)+一站式大数据数据开发治理平台DataWorks+数据湖构建DLF+对象存储OSS等核心产品。
·
2022-09-08 11:01
后端
数据湖统一元数据与权限
关于大数据的由来和发展,要追溯到谷歌在2003年发表的论文,论文中提出了HDFS和
MapReduce
两个组件。
·
2022-09-08 11:26
深度解读!新一代大数据引擎Flink厉害在哪?(附实现原理细节)
导语|大数据计算分为离线计算和实时计算,其中离线计算就是我们通常说的批计算,代表技术是Hadoop
MapReduce
、Hive等;实时计算也被称作流计算,代表技术是Storm、SparkStreaming
架构师小秘圈
·
2022-09-08 10:56
一文详解Spark基本架构原理
ApacheSpark是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一,与Hadoop和Storm等其他大数据和
MapReduce
大数据Arry
·
2022-09-08 10:24
大数据
大数据
程序员
编程
数据分析
Hadoop中的
MapReduce
框架原理、切片源码断点在哪断并且介绍相关源码、FileInputFormat切片源码解析、总结,那些可以证明你看过切片的源码
文章目录13.
MapReduce
框架原理13.1InputFormat数据输入13.1.3FileInputFormat切片源码解析13.1.3.1切片源码断点在哪断并且介绍相关源码:13.1.3.2切片源码详解
Redamancy_06
·
2022-09-08 10:48
#
Hadoop
hadoop
mapreduce
大数据
Hive的基本知识与操作
Hive的基本知识与操作Hive的基本概念Hive本质是将SQL转换为
MapReduce
的任务进行运算,底层由HDFS来提供数据存储,说白了hive可以理解为一个将SQL转换为
MapReduce
的任务的工具
伍点
·
2022-09-07 21:00
上一页
68
69
70
71
72
73
74
75
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他