E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据面试
大数据面试
题
BigData面试题总结JAVA相关1-1)List与set的区别?老掉牙的问题了,还在这里老生常谈:List特点:元素有放入顺序,元素可重复,Set特点:元素无放入顺序,元素不可重复。1-2)数据库的三大范式?原子性、一致性、唯一性1-3)java的io类的图解1-4)对象与引用对象的区别对象就是好没有初始化的对象,引用对象即使对这个对象进行了初始化,这个初始化可以使自己的直接new的也可以是直
行走的数据智能
·
2023-04-10 17:41
计算机求职面试
大数据面试
面经5:美团:22年实习生大数据开发面试
记录了面试各个公司的问题和心经,给正在面试的你做一些适当的参考如果这篇文章对你有所帮助,可以点一下关注作者支持一下,对于这段时间的面试,作者也是参考和总结了一些面试中常常问到的问题,可以关注作者私信“
大数据面试
牧码文
·
2023-04-09 01:08
面试
big
data
java
【面试题】京东
大数据面试
真题汇总,收藏必备
今年冬天冷的好慢,现在空气中吹的风还是暖的...京东
大数据面试
题_hive中都有哪些join操作?leftjoin:以左侧为主表,返回记录与主表记录数相同,关联不上的字段为空。
OnlyCoding…
·
2023-04-09 01:37
大数据
面试
hive
职场和发展
hadoop
大数据面试
题_Impala等查询组件(除Hive外的其它组件)
大数据面试
题_Impala等查询组件(除Hive外的其它组件)一、Impala1、什么是Impala?
Jerry Hong
·
2023-04-08 07:55
数据仓库
即席查询
大数据面试
hive
大数据
hadoop
大数据面试
题4 ---一般有用太多
第1部分选择题1.1Hadoop选择题1.1.1Hdfs1.下面哪个程序负责HDFS数据存储?a)NameNodeb)Jobtrackerc)Datanoded)secondaryNameNodee)tasktracker2.HDfS中的block默认保存几份?a)3份b)2份c)1份d)不确定3.下列哪个程序通常与NameNode在一个节点启动?a)SecondaryNameNodeb)Data
okbin1991
·
2023-04-06 13:17
大数据
hadoop
mapreduce
hdfs
分布式
「硬刚Doris系列」Apache Doris 架构原理及核心特性解读
点击上方蓝色字体,选择“设为星标”回复"面试"获取更多惊喜轻戳有惊喜:全网最全
大数据面试
提升手册!
王知无(import_bigdata)
·
2023-04-05 08:40
分布式
大数据
数据库
java
hadoop
大数据面试
3分钟自我介绍_
大数据面试
要注意哪些方面?
大数据面试
准备三大攻略...
大数据面试
要注意哪些方面?一般来说,求职者要做好自我介绍、面试提问和专业考题三大方面的准备。下面是小编专门为大数据求职者整理的面试攻略,希望对大家找工作有所帮助。一、
大数据面试
的自我介绍。
weixin_39984403
·
2023-04-02 19:28
大数据面试3分钟自我介绍
大数据面试
题:介绍下HBase架构
从Hbase的架构图上可以看出,Hbase中的存储包括HMaster、HRegionSever、HRegion、HLog、Store、MemStore、StoreFile、HFile等。Hbase中的每张表都通过键按照一定的范围被分割成多个子表(HRegion),默认一个HRegion超过256M就要被分割成两个,这个过程由HRegionServer管理,而HRegion的分配由HMaster管理
蓦然_
·
2023-03-31 22:11
大数据面试题
大数据开发面试题
面试题
hbase
【闲聊】我用ChatGPT参加了
大数据面试
用ChatGPT试了试面试题,回答得比较简单。问:你可以以应聘者的身份参加一场大数据程序员面试吗答:可以,如果您符合面试要求,可以参加大数据程序员面试。问:那么为什么你要投递大数据开发这个岗位答:我对于大数据开发的岗位深感兴趣,因为我有着多年的编程经验,我熟悉分析数据、解决问题和提出创新解决方案的能力,并且拥有扎实的数据库和计算机科学的基础知识。此外,我乐于参与新技术的开发和利用,以满足业务需求,
和风与影
·
2023-03-30 23:31
大数据
面试
大数据
面试
ChatGPT
阿里大数据之路:数据模型篇大总结
全网最全
大数据面试
提升手册!第1章大数据领域建模综述1.1为什么需要数据建模有结构地分类组织和存储是我们面临的一个挑战。数据模型强调从业务、数据存取和使用角度合理存储数据。
王知无(import_bigdata)
·
2023-03-29 04:29
数据仓库
dbcp
webgl
glassfish
dwr
大数据面试
题以及答案整理(一)
hadoop的shuffle过程一、Map端的shuffleMap端会处理输入数据并产生中间结果,这个中间结果会写到本地磁盘,而不是HDFS。每个Map的输出会先写到内存缓冲区中,当写入的数据达到设定的阈值时,系统将会启动一个线程将缓冲区的数据写到磁盘,这个过程叫做spill。在spill写入之前,会先进行二次排序,首先根据数据所属的partition进行排序,然后每个partition中的数据再
在远方的你等我
·
2023-03-26 22:27
大数据面试
-Spark
目录1.mr和spark区别,怎么理解spark-rddSpark和MR的异同2.spark集群运算的模式RDD中reduceBykey与groupByKey哪个性能好,为什么rdd怎么分区宽依赖和窄依赖flatmap算子的理解,flat原理,返回类型1.mr和spark区别,怎么理解spark-rdd(1)Mr是文件方式的分布式计算框架,是将中间结果和最终结果记录在文件中,map和reduce的
Movle
·
2023-03-26 21:03
大数据面试
之Hive常见题目
大数据面试
之Hive常见题目1.Hive的架构1、重点四个器:解释器(SQLParser)、Driver:编译器(Compiler),优化器(Optimizer),执行器(Executor)相关解释:Driver
落叶飘雪2014
·
2023-03-22 11:18
大数据面试系列
Hive
大数据
面试
Hive
大数据面试
问题大集合(硬货、全面)
第一章java基础.........................................................................16java基础16JDK和JRE有什么区别16java中八种基本数据类型,String属于基本数据类型么16int和Integer的区别16inta=2*8怎样运算效率最快17floatf=3.4;是否正确171.1.6.shorts
边东野Lee
·
2023-03-18 18:23
面试
大数据
java
数据结构
算法
数据仓库面试题——数据仓库分层
答案来源:
大数据面试
题V3.0,523道题,679页,46w字问过的一些公司:字节x2,字节(2021.07)-(2021.08)-(2021.10),阿里x2,爱奇艺,百度x2,百度(2021.08)
蓦然_
·
2023-03-10 07:56
大数据面试题
数据仓库
数据仓库
数据挖掘
数据库
about云
大数据面试
宝典 大公司面试一般用不到
阿里四轮面试总结第一轮面试电话(**5**月6号):1.自我介绍,包括做过项目。2.有看过哪些JDK源码,了解哪些常用库。3.集合框架HashMap的扩容机制,ConcurrnetHashMap的原理4.jvm内存模型与gc内存回收机制5.classloader结构,是否可以自己定义一个java.lang.String类,为什么?双亲代理机制。6.了解哪些设计模式,6个设计原则分别是什么?每种设计
okbin1991
·
2023-02-25 11:09
大数据
面试
java
jvm
职场和发展
2023版最新最强
大数据面试
宝典
此套面试题来自于各大厂的真实面试题及常问的知识点,如果能理解吃透这些问题,你的大数据能力将会大大提升,进入大厂指日可待获取本文《2023最新
大数据面试
宝典》完整版带目录的PDF文档,请搜索公众号【五分钟学大数据
·
2023-02-21 15:19
大数据
大数据面试
必知必会@2019-01-09
Zookeeper是什么Zookeeper是一个分布式的,开源的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和HBase导致重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步,组服务等。为什么使用Zookeeper大部分的分布式应用程序都需要一个主控、协调器或者控制器来物理分布的子进程(如资源,内存分配等)目前大
digger30
·
2023-02-03 03:48
大数据面试
杀招——Hadoop高频考点,正在刷新你的认知!
一、什么是Hadoop?这是一个看着不起眼,实则“送命题”的典型。往往大家关于大数据的其他内容准备得非常充分,反倒问你什么是Hadoop却有点猝不及防,回答磕磕绊绊,给面试官的印象就很不好。另外,回答这个问题,一定要从事物本身上升到广义去介绍。面试官往往通过这个问题来判断你是否具有最基本的认知能力。Hadoop是一个能够对大量数据进行分布式处理的软件框架。以一种可靠、高效、可伸缩的方式进行数据处理
刀哥说Java
·
2023-01-31 02:10
大数据面试
题整理 -- hadoop 部分
Map端优化参数选项类型默认值描述io.sort.mbint100缓存map中间结果的buffer大小(MB)io.sort.record.percentfloat0.05io.sort.mb中用来保存mapoutput记录边界的百分比,其他缓存用来保存数据io.sort.spill.percentfloat0.80map开始做spill操作的阈值io.sort.factorint10做merge
thoughtCodes
·
2023-01-25 08:36
大数据面试
题(二)----HDFS面试题
版权声明:本文为CSDN博主「北京小辉」的原创文章,遵循CC4.0BY-SA版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.csdn.net/silentwolfyh/article/details/103863381———————————————————————————————————“无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家。教程不仅是零基础,通俗
老王的小知识
·
2023-01-25 08:35
#
【大数据】面试题
大数据
分布式
hdfs
面试
大数据面试
题(一)----HADOOP 面试题
原文链接:https://blog.csdn.net/silentwolfyh/article/details/103857911———————————————————————————————————
大数据面试
宝典目录
老王的小知识
·
2023-01-25 08:35
#
【大数据】面试题
大数据
hadoop
面试
大数据面试
题--MapReduce篇
MapReduce任务执行的11个步骤1.运行job任务2.获取ApplicationID|JobID3.CopyJob资源到HDFS-切片信息、配置信息、代码片段4.提交任务给ResourceManager5.RM->NM消耗一个Container资源,用于启动MRAppMaster6.MRAppMaster初始化任务,完成任务调度前的准备工作7.MRAppMaster查询输入切片信息、配置,进
丿沐染烟忱丶
·
2023-01-25 08:01
大数据面试题
面试题
大数据
mapreduce
大数据面试
题--HDFS篇
NameNode和SecondaryNameNode区别?第一阶段:NameNode启动(1)NameNode服务工作,第一次启动格式化后,创建fsimage和editlog文件。如果不是第一次启动,直接加载镜像文件和日志到内存。(2)处理客户端对元数据进行增删改的请求。(3)NameNode记录操作日志,更新滚动日志。(4)NameNode在内存中对数据进行增删改查。第二阶段:Secondary
丿沐染烟忱丶
·
2023-01-25 08:30
大数据面试题
大数据
面试题
大数据面试
题之葵花宝典------Hadoop
葵花宝典------Hadoop1.hdfs读写流程2.hdfs的体系结构3.一个datanode宕机,怎么一个流程恢复4.hadoop的namenode宕机,怎么解决5.namenode对元数据的管理6.元数据的checkpoint7.yarn资源调度流程8.hadoop中combiner和partition的作用9.用mapreduce怎么处理数据倾斜问题?10.shuffle阶段,你怎么理解
海鸥~
·
2023-01-25 07:35
Big
Data
------
面试题
面试
大数据面试
题集锦-Hadoop面试题(二)-HDFS
你准备好面试了吗?这里有一些面试中可能会问到的问题以及相对应的答案。如果你需要更多的面试经验和面试题,关注一下"张飞的猪大数据分享"吧,公众号会不定时的分享相关的知识和资料。1、HDFS中的block默认保存几份?默认保存3份2、HDFS默认BlockSize是多大?默认64MB3、负责HDFS数据存储的是哪一部分?DataNode负责数据存储4、SecondaryNameNode的目的是什么?他
张飞的猪大数据
·
2023-01-25 07:32
Hadoop大数据面试
hadoop
hdfs
大数据
面试
面试题
【
大数据面试
题】(八)Spark 相关面试题
1.spark中的RDD是什么,有哪些特性?答:RDD(ResilientDistributedDataset)叫做分布式数据集,是spark中最基本的数据抽象,它代表一个不可变,可分区,里面的元素可以并行计算的集合Dataset:就是一个集合,用于存放数据的Destributed:分布式,可以并行在集群计算Resilient:表示弹性的,弹性表示1.RDD中的数据可以存储在内存或者磁盘中;2.R
云 祁
·
2023-01-13 09:21
#
----
面试总结
大数据
spark
大数据面试
通关手册|Hbase面试题(一)
⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言,欢迎留言交流!⭐⭐本文由【王知无】原创,首发于CSDN博客!⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!1.Hbase调优HBase高可用在HBase中Hmaster负责监控RegionServer的生命周期,均衡RegionServer的负载,如果Hmaster挂掉了,那么
王知无(import_bigdata)
·
2023-01-07 15:09
大数据面试通关手册
大数据
大数据面试
通关手册|数据仓库面试题(四)
⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言,欢迎留言交流!⭐⭐本文由【王知无】原创,首发于CSDN博客!⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!数据仓库的定义?首先,用于支持决策,面向分析型数据处理;其次,对多个异构的数据源有效集成,集成后按照主题进行重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。数
王知无(import_bigdata)
·
2023-01-07 15:09
大数据面试通关手册
数据仓库
大数据
数据库
数据分析
java
大数据面试
通关手册|Hbase面试题(二)
⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言,欢迎留言交流!⭐⭐本文由【王知无】原创,首发于CSDN博客!⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!技术背景起源于谷歌旧三篇论文中bigtable。设计目的为了解决大数据环境中海量结构化数据的实时读写问题。为了弥补hadoop生态中没有实时存储的缺陷。设计思想分布式技术本
王知无(import_bigdata)
·
2023-01-07 15:09
大数据面试通关手册
分布式
数据仓库
数据库
大数据
hbase
大数据面试
通关手册|Hadoop面试题(一)
⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言,欢迎留言交流!⭐⭐本文由【王知无】原创,首发于CSDN博客!⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!1、Flume使用场景线上数据一般主要是落地(存储到磁盘)或者通过socket传输给另外一个系统,这种情况下,你很难推动线上应用或服务去修改接口,实现直接向kafka里写数
王知无(import_bigdata)
·
2023-01-07 15:39
大数据面试通关手册
大数据
面试
大数据面试
通关手册 | ClickHouse基础&实践&调优全视角解析
Clickhouse是一个高性能且开源的数据库管理系统,主要用于在线分析处理(OLAP)业务。它采用列式存储结构,可使用SQL语句实时生成数据分析报告,另外它还支持索引,分布式查询以及近似计算等特性,凭借其优异的表现,ClickHouse在各大互联网公司均有广泛地应用。WhyClickHouse首先我们来看一下OLAP场景下的关键特征。1.大多数数据库访问都是读请求。2.数据总是以批量形式写入数据
王知无(import_bigdata)
·
2023-01-07 15:38
大数据面试通关手册
数据库
大数据
sap
uefi
dbcp
大数据面试
通关手册|Spark面试题(四)
⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言,欢迎留言交流!⭐⭐本文由【王知无】原创,首发于CSDN博客!⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!1、spark的有几种部署模式,每种模式特点?1)本地模式 Spark不一定非要跑在hadoop集群,可以在本地,起多个线程的方式来指定。将Spark应用以多线程的方式直接
王知无(import_bigdata)
·
2023-01-07 15:38
大数据面试通关手册
大数据
hadoop
spark
java
面试
大数据面试
通关手册|Zookeeper面试题总结
⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言,欢迎留言交流!⭐⭐本文由【王知无】原创,首发于CSDN博客!⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!1、请简述Zookeeper的选举机制假设有五台服务器组成的zookeeper集群,它们的id从1-5,同时它们都是最新启动的,也就是没有历史数据,在存放数据量这一点上,都
王知无(import_bigdata)
·
2023-01-07 15:08
大数据面试通关手册
大数据
大数据面试
通关手册|Spark面试题(一)
⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言,欢迎留言交流!⭐⭐本文由【王知无】原创,首发于CSDN博客!⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!Spark通常来说,Spark与MapReduce相比,Spark运行效率更高。请说明效率更高来源于Spark内置的哪些机制?hadoop和spark使用场景?spark如
王知无(import_bigdata)
·
2023-01-07 15:08
大数据面试通关手册
大数据
大数据面试
通关手册|Flink面试题(一)
⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言,欢迎留言交流!⭐⭐本文由【王知无】原创,首发于CSDN博客!⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!FlinkFlink的容错机制(checkpoint)Flinkcheckpoint与SparkFlink有什么区别或优势吗Flink中的Time有哪几种对于迟到数据是怎么
王知无(import_bigdata)
·
2023-01-07 15:08
大数据面试通关手册
大数据
面试
大数据面试
通关手册|数据仓库面试题(一)
⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言,欢迎留言交流!⭐⭐本文由【王知无】原创,首发于CSDN博客!⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!1.维表和宽表的考查(主要考察维表的使用及维度退化手法)维表数据一般根据ods层数据加工生成,在设计宽表的时候,可以适当的用一些维度退化手法,将维度退化到事实表中,减少事实
王知无(import_bigdata)
·
2023-01-07 15:08
大数据面试通关手册
大数据
面试
大数据面试
通关手册|Hadoop面试系列之优化
⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言,欢迎留言交流!⭐⭐本文由【王知无】原创,首发于CSDN博客!⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!1、MapReduce跑得慢的原因?Mapreduce程序效率的瓶颈在于两点:1)计算机性能CPU、内存、磁盘健康、网络2)I/O操作优化(1)数据倾斜(2)map和red
王知无(import_bigdata)
·
2023-01-07 15:38
大数据面试通关手册
大数据
大数据面试
通关手册|Flume面试题汇总
⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言,欢迎留言交流!⭐⭐本文由【王知无】原创,首发于CSDN博客!⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!1、Flume使用场景线上数据一般主要是落地(存储到磁盘)或者通过socket传输给另外一个系统,这种情况下,你很难推动线上应用或服务去修改接口,实现直接向kafka里写数
王知无(import_bigdata)
·
2023-01-07 15:38
大数据面试通关手册
大数据
大数据面试
通关手册|Hadoop系列之YARN
⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言,欢迎留言交流!⭐⭐本文由【王知无】原创,首发于CSDN博客!⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!1、简述hadoop1与hadoop2的架构异同1)加入了yarn解决了资源调度的问题。2)加入了对zookeeper的支持实现比较可靠的高可用。2、为什么会产生yarn,
王知无(import_bigdata)
·
2023-01-07 15:37
大数据面试通关手册
大数据
大数据面试
通关手册|Spark面试题(三)
⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言,欢迎留言交流!⭐⭐本文由【王知无】原创,首发于CSDN博客!⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!39.Spark的UDF?因为目前SparkSQL本身支持的函数有限,一些常用的函数都没有,比如len,concat...etc但是使用UDF来自己实现根据业务需要的功能是
王知无(import_bigdata)
·
2023-01-07 15:07
大数据面试通关手册
大数据
面试
大数据面试
通关手册 | Hadoop面试题(一)
⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言,欢迎留言交流!⭐⭐本文由【王知无】原创,首发于CSDN博客!⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!1、集群的最主要瓶颈磁盘IO2、Hadoop运行模式单机版、伪分布式模式、完全分布式模式3、Hadoop生态圈的组件并做简要描述1)Zookeeper:是一个开源的分布式应
王知无(import_bigdata)
·
2023-01-07 15:07
大数据面试通关手册
大数据
面试
大数据面试
通关手册|Hadoop系列之MapReduce
⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言,欢迎留言交流!⭐⭐本文由【王知无】原创,首发于CSDN博客!⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!1、谈谈Hadoop序列化和反序列化及自定义bean对象实现序列化?1)序列化和反序列化(1)序列化就是把内存中的对象,转换成字节序列(或其他数据传输协议)以便于存储(持久
王知无(import_bigdata)
·
2023-01-07 15:07
大数据面试通关手册
大数据
面试
大数据面试
题——Spark数据倾斜调优(五)
1、数据倾斜数据倾斜指的是,并行处理的数据集中,某一部分(如Spark或Kafka的一个Partition)的数据显著多于其它部分,从而使得该部分的处理速度成为整个数据集处理的瓶颈。数据倾斜俩大直接致命后果。1、数据倾斜直接会导致一种情况:OutOfMemory。2、运行速度慢。主要是发生在Shuffle阶段。同样Key的数据条数太多了。导致了某个key(下图中的80亿条)所在的Task数据量太大
蓦然_
·
2023-01-02 11:19
大数据面试题
1024程序员节
Spark面试题总结
数据倾斜总结
大数据面试题总结
大数据
阿里云大数据开发一面面经,已过,面试题已配答案
参考答案来源:
大数据面试
题V3.0,523道题,679页,46w字二面:阿里云大数据开发二面面经,已过,面试题已配答案_蓦然_的博客-CSDN博客1、实习经历这一点就不多说了,每个人都不一样,根据自己的介绍就行
蓦然_
·
2022-12-31 16:35
大数据面试题
hadoop
面试
大数据
2021年
大数据面试
宝典完整版(含答案解析)
本文转载自微信公众号《大数据私房菜》,原文章链接为:https://mp.weixin.qq.com/s/0mgy07WAMBYNBP6er8_hDA版本更新时间更新内容v1.02020-07-01新建v1.12020-07-18朋友面试大数据工程师提供的关于架构及数仓方面的题目v1.22020-08-08朋友面试数据专家提供的数据驱动,spark及flink方面面试题v1.32020-08-22
行走的数据智能
·
2022-12-27 19:46
计算机求职面试
大数据理论
大数据组件架构
大数据
hadoop
spark
kafka
面试
【面试真题】今日头条
大数据面试
100题,收藏备用
1、简述WordCount的实现过程2、简述MapReduce与Spark的区别与联系3、Spark在客户端与集群运行的区别4、相同的SQL在HiveSql与SparkSQL的实现中,为什么Spark比Hadoop快5、简述自定义UDF实现过程6、HBase表设计有哪些注意事项7、谈谈你对HBase的HLog的理解8、数据同样存在HDFS,为什么HBase支持在线查询9、SparkSQL操作Hiv
大数据研习社
·
2022-12-21 04:02
大数据实战精英+架构师
面试题
Flink
big
data
hadoop
spark
大数据面试
题:介绍下YARN
介绍YARN,可以先考虑下面两个问题1)如何管理集群资源?2)如何给任务合理分配资源?YARN是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台,而MapReduce等运算程序则相当于运行于操作系统之上的应用程序。YARN作为一个资源管理、任务调度的框架,主要包含ResourceManager、NodeManager、ApplicationMaster和Conta
蓦然_
·
2022-12-18 22:59
大数据面试题
大数据开发面试题
大数据面试题
YARN面试题总结(
大数据面试
)
YARN概述YARN是一种新的Hadoop资源管理器,它是一个通用资源管理系统。可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大优点。YARN最初是为了修复MapReduce实现里的明显不足,并对可伸缩性(支持一万个节点和二十万个内核的集群)、可靠性和集群利用率进行了提升。YARN实现这些需求的方式是,把JobTracker的两个主要功能(资源管
404个问号
·
2022-12-18 22:22
大数据
yarn
java
大数据
大数据面试
题(四):Yarn核心高频面试题
文章目录Yarn核心高频面试题一、简述Hadoop1与Hadoop2的架构异同二、为什么会产生yarn,它解决了什么问题,有什么优势?三、HDFS的数据压缩算法?及每种算法的应用场景?1、gzip压缩2、Bzip2压缩3、Lzo压缩4、Snappy压缩四、Hadoop的调度器总结五、Mapreduce推测执行算法及原理Yarn核心高频面试题一、简述Hadoop1与Hadoop2的架构异同加入了ya
Lansonli
·
2022-12-18 22:40
大数据入门核心技术
大数据
大数据核心面试题
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他