大数据面试第4页

大数据面试题集锦-Hadoop面试题(三)-MapReduce

你准备好面试了吗?这里有一些面试中可能会问到的问题以及相对应的答案。如果你需要更多的面试经验和面试题，关注一下"张飞的猪大数据分享"吧，公众号会不定时的分享相关的知识和资料。文章目录1、谈谈Hadoop序列化和反序列化及自定义bean对象实现序列化?2、FileInputFormat切片机制3、在一个Hadoop任务中，什么是InputSplit（切片），以及切片是用来做什么的，切片与block有

张飞的猪大数据·2023-04-13 01:43

大数据面试题集锦-Hadoop面试题(五)-优化

你准备好面试了吗?这里有一些面试中可能会问到的问题以及相对应的答案。如果你需要更多的面试经验和面试题，关注一下"张飞的猪大数据分享"吧，公众号会不定时的分享相关的知识和资料。文章目录1、MapReduce优化方法2、MapReduce跑得慢的原因？3、HDFS小文件优化方法1、MapReduce优化方法1）数据输入（1）合并小文件：在执行mr任务前将小文件进行合并，大量的小文件会产生大量的map

张飞的猪大数据·2023-04-13 01:43

大数据面试葵花宝典之Kafka进阶

大数据面试-------Kafka进阶一、Kafka的设计时什么样呢？

一只走在大数据路上的猿子·2023-04-11 10:21

大数据面试题

行走的数据智能·2023-04-10 17:41

面经5：美团：22年实习生大数据开发面试

记录了面试各个公司的问题和心经，给正在面试的你做一些适当的参考如果这篇文章对你有所帮助，可以点一下关注作者支持一下，对于这段时间的面试，作者也是参考和总结了一些面试中常常问到的问题，可以关注作者私信“大数据面试

牧码文·2023-04-09 01:08

【面试题】京东大数据面试真题汇总，收藏必备

今年冬天冷的好慢，现在空气中吹的风还是暖的...京东大数据面试题_hive中都有哪些join操作？leftjoin：以左侧为主表，返回记录与主表记录数相同，关联不上的字段为空。

OnlyCoding…·2023-04-09 01:37

大数据面试题_Impala等查询组件(除Hive外的其它组件)

大数据面试题_Impala等查询组件(除Hive外的其它组件)一、Impala1、什么是Impala?

Jerry Hong·2023-04-08 07:55

大数据面试题4 ---一般有用太多

第1部分选择题1.1Hadoop选择题1.1.1Hdfs1.下面哪个程序负责HDFS数据存储？a)NameNodeb)Jobtrackerc)Datanoded)secondaryNameNodee)tasktracker2.HDfS中的block默认保存几份？a)3份b)2份c)1份d)不确定3.下列哪个程序通常与NameNode在一个节点启动？a)SecondaryNameNodeb)Data

okbin1991·2023-04-06 13:17

「硬刚Doris系列」Apache Doris 架构原理及核心特性解读

点击上方蓝色字体，选择“设为星标”回复"面试"获取更多惊喜轻戳有惊喜：全网最全大数据面试提升手册！

王知无(import_bigdata)·2023-04-05 08:40

大数据面试3分钟自我介绍_大数据面试要注意哪些方面？大数据面试准备三大攻略...

大数据面试要注意哪些方面？一般来说，求职者要做好自我介绍、面试提问和专业考题三大方面的准备。下面是小编专门为大数据求职者整理的面试攻略，希望对大家找工作有所帮助。一、大数据面试的自我介绍。

weixin_39984403·2023-04-02 19:28

大数据面试题：介绍下HBase架构

从Hbase的架构图上可以看出，Hbase中的存储包括HMaster、HRegionSever、HRegion、HLog、Store、MemStore、StoreFile、HFile等。Hbase中的每张表都通过键按照一定的范围被分割成多个子表（HRegion），默认一个HRegion超过256M就要被分割成两个，这个过程由HRegionServer管理,而HRegion的分配由HMaster管理

蓦然_·2023-03-31 22:11

【闲聊】我用ChatGPT参加了大数据面试

用ChatGPT试了试面试题，回答得比较简单。问：你可以以应聘者的身份参加一场大数据程序员面试吗答：可以，如果您符合面试要求，可以参加大数据程序员面试。问：那么为什么你要投递大数据开发这个岗位答：我对于大数据开发的岗位深感兴趣，因为我有着多年的编程经验，我熟悉分析数据、解决问题和提出创新解决方案的能力，并且拥有扎实的数据库和计算机科学的基础知识。此外，我乐于参与新技术的开发和利用，以满足业务需求，

和风与影·2023-03-30 23:31

阿里大数据之路：数据模型篇大总结

全网最全大数据面试提升手册！第1章大数据领域建模综述1.1为什么需要数据建模有结构地分类组织和存储是我们面临的一个挑战。数据模型强调从业务、数据存取和使用角度合理存储数据。

王知无(import_bigdata)·2023-03-29 04:29

大数据面试题以及答案整理（一）

hadoop的shuffle过程一、Map端的shuffleMap端会处理输入数据并产生中间结果，这个中间结果会写到本地磁盘，而不是HDFS。每个Map的输出会先写到内存缓冲区中，当写入的数据达到设定的阈值时，系统将会启动一个线程将缓冲区的数据写到磁盘，这个过程叫做spill。在spill写入之前，会先进行二次排序，首先根据数据所属的partition进行排序，然后每个partition中的数据再

在远方的你等我·2023-03-26 22:27

大数据面试-Spark

目录1.mr和spark区别，怎么理解spark-rddSpark和MR的异同2.spark集群运算的模式RDD中reduceBykey与groupByKey哪个性能好，为什么rdd怎么分区宽依赖和窄依赖flatmap算子的理解，flat原理，返回类型1.mr和spark区别，怎么理解spark-rdd(1)Mr是文件方式的分布式计算框架，是将中间结果和最终结果记录在文件中，map和reduce的

Movle·2023-03-26 21:03

大数据面试之Hive常见题目

大数据面试之Hive常见题目1.Hive的架构1、重点四个器：解释器（SQLParser）、Driver：编译器（Compiler），优化器（Optimizer），执行器（Executor）相关解释：Driver

落叶飘雪2014·2023-03-22 11:18

大数据面试问题大集合（硬货、全面）

第一章java基础.........................................................................16java基础16JDK和JRE有什么区别16java中八种基本数据类型，String属于基本数据类型么16int和Integer的区别16inta=2*8怎样运算效率最快17floatf=3.4;是否正确171.1.6.shorts

边东野Lee·2023-03-18 18:23

数据仓库面试题——数据仓库分层

答案来源：大数据面试题V3.0，523道题，679页，46w字问过的一些公司：字节x2，字节(2021.07)-(2021.08)-(2021.10)，阿里x2，爱奇艺，百度x2，百度(2021.08)

蓦然_·2023-03-10 07:56

about云大数据面试宝典大公司面试一般用不到

阿里四轮面试总结第一轮面试电话(**5**月6号)：1.自我介绍，包括做过项目。2.有看过哪些JDK源码，了解哪些常用库。3.集合框架HashMap的扩容机制，ConcurrnetHashMap的原理4.jvm内存模型与gc内存回收机制5.classloader结构，是否可以自己定义一个java.lang.String类，为什么？双亲代理机制。6.了解哪些设计模式，6个设计原则分别是什么？每种设计

okbin1991·2023-02-25 11:09

2023版最新最强大数据面试宝典

此套面试题来自于各大厂的真实面试题及常问的知识点，如果能理解吃透这些问题，你的大数据能力将会大大提升，进入大厂指日可待获取本文《2023最新大数据面试宝典》完整版带目录的PDF文档，请搜索公众号【五分钟学大数据

·2023-02-21 15:19

大数据面试必知必会@2019-01-09

Zookeeper是什么Zookeeper是一个分布式的，开源的分布式应用程序协调服务，是Google的Chubby一个开源的实现，是Hadoop和HBase导致重要组件。它是一个为分布式应用提供一致性服务的软件，提供的功能包括：配置维护、域名服务、分布式同步，组服务等。为什么使用Zookeeper大部分的分布式应用程序都需要一个主控、协调器或者控制器来物理分布的子进程（如资源，内存分配等）目前大

digger30·2023-02-03 03:48

大数据面试杀招——Hadoop高频考点，正在刷新你的认知！

一、什么是Hadoop？这是一个看着不起眼，实则“送命题”的典型。往往大家关于大数据的其他内容准备得非常充分，反倒问你什么是Hadoop却有点猝不及防，回答磕磕绊绊，给面试官的印象就很不好。另外，回答这个问题，一定要从事物本身上升到广义去介绍。面试官往往通过这个问题来判断你是否具有最基本的认知能力。Hadoop是一个能够对大量数据进行分布式处理的软件框架。以一种可靠、高效、可伸缩的方式进行数据处理

刀哥说Java·2023-01-31 02:10

大数据面试题整理 -- hadoop 部分

Map端优化参数选项类型默认值描述io.sort.mbint100缓存map中间结果的buffer大小(MB)io.sort.record.percentfloat0.05io.sort.mb中用来保存mapoutput记录边界的百分比，其他缓存用来保存数据io.sort.spill.percentfloat0.80map开始做spill操作的阈值io.sort.factorint10做merge

thoughtCodes·2023-01-25 08:36

大数据面试题(二)----HDFS面试题

老王的小知识·2023-01-25 08:35

大数据面试题(一)----HADOOP 面试题

原文链接：https://blog.csdn.net/silentwolfyh/article/details/103857911———————————————————————————————————大数据面试宝典目录

老王的小知识·2023-01-25 08:35

大数据面试题--MapReduce篇

MapReduce任务执行的11个步骤1.运行job任务2.获取ApplicationID|JobID3.CopyJob资源到HDFS-切片信息、配置信息、代码片段4.提交任务给ResourceManager5.RM->NM消耗一个Container资源，用于启动MRAppMaster6.MRAppMaster初始化任务，完成任务调度前的准备工作7.MRAppMaster查询输入切片信息、配置，进

丿沐染烟忱丶·2023-01-25 08:01

大数据面试题--HDFS篇

NameNode和SecondaryNameNode区别？第一阶段：NameNode启动（1）NameNode服务工作，第一次启动格式化后，创建fsimage和editlog文件。如果不是第一次启动，直接加载镜像文件和日志到内存。（2）处理客户端对元数据进行增删改的请求。（3）NameNode记录操作日志，更新滚动日志。（4）NameNode在内存中对数据进行增删改查。第二阶段：Secondary

丿沐染烟忱丶·2023-01-25 08:30

大数据面试题之葵花宝典------Hadoop

葵花宝典------Hadoop1.hdfs读写流程2.hdfs的体系结构3.一个datanode宕机,怎么一个流程恢复4.hadoop的namenode宕机,怎么解决5.namenode对元数据的管理6.元数据的checkpoint7.yarn资源调度流程8.hadoop中combiner和partition的作用9.用mapreduce怎么处理数据倾斜问题？10.shuffle阶段,你怎么理解

海鸥~·2023-01-25 07:35

大数据面试题集锦-Hadoop面试题(二)-HDFS

你准备好面试了吗?这里有一些面试中可能会问到的问题以及相对应的答案。如果你需要更多的面试经验和面试题，关注一下"张飞的猪大数据分享"吧，公众号会不定时的分享相关的知识和资料。1、HDFS中的block默认保存几份？默认保存3份2、HDFS默认BlockSize是多大？默认64MB3、负责HDFS数据存储的是哪一部分？DataNode负责数据存储4、SecondaryNameNode的目的是什么？他

张飞的猪大数据·2023-01-25 07:32

【大数据面试题】（八）Spark 相关面试题

1.spark中的RDD是什么，有哪些特性？答：RDD（ResilientDistributedDataset）叫做分布式数据集，是spark中最基本的数据抽象，它代表一个不可变，可分区，里面的元素可以并行计算的集合Dataset：就是一个集合，用于存放数据的Destributed：分布式，可以并行在集群计算Resilient：表示弹性的，弹性表示1.RDD中的数据可以存储在内存或者磁盘中；2.R

云祁·2023-01-13 09:21

大数据面试通关手册｜Hbase面试题(一)

⭐⭐欢迎关注博客主页：https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言，欢迎留言交流！⭐⭐本文由【王知无】原创，首发于CSDN博客！⭐⭐本文首发CSDN论坛，未经过官方和本人允许，严禁转载！1.Hbase调优HBase高可用在HBase中Hmaster负责监控RegionServer的生命周期，均衡RegionServer的负载，如果Hmaster挂掉了，那么

王知无(import_bigdata)·2023-01-07 15:09

大数据面试通关手册｜数据仓库面试题（四）

⭐⭐欢迎关注博客主页：https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言，欢迎留言交流！⭐⭐本文由【王知无】原创，首发于CSDN博客！⭐⭐本文首发CSDN论坛，未经过官方和本人允许，严禁转载！数据仓库的定义？首先，用于支持决策，面向分析型数据处理；其次，对多个异构的数据源有效集成，集成后按照主题进行重组，并包含历史数据，而且存放在数据仓库中的数据一般不再修改。数

王知无(import_bigdata)·2023-01-07 15:09

大数据面试通关手册｜Hbase面试题（二）

⭐⭐欢迎关注博客主页：https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言，欢迎留言交流！⭐⭐本文由【王知无】原创，首发于CSDN博客！⭐⭐本文首发CSDN论坛，未经过官方和本人允许，严禁转载！技术背景起源于谷歌旧三篇论文中bigtable。设计目的为了解决大数据环境中海量结构化数据的实时读写问题。为了弥补hadoop生态中没有实时存储的缺陷。设计思想分布式技术本

王知无(import_bigdata)·2023-01-07 15:09

大数据面试通关手册｜Hadoop面试题（一）

⭐⭐欢迎关注博客主页：https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言，欢迎留言交流！⭐⭐本文由【王知无】原创，首发于CSDN博客！⭐⭐本文首发CSDN论坛，未经过官方和本人允许，严禁转载！1、Flume使用场景线上数据一般主要是落地（存储到磁盘）或者通过socket传输给另外一个系统，这种情况下，你很难推动线上应用或服务去修改接口，实现直接向kafka里写数

王知无(import_bigdata)·2023-01-07 15:39

大数据面试通关手册 | ClickHouse基础&实践&调优全视角解析

Clickhouse是一个高性能且开源的数据库管理系统，主要用于在线分析处理(OLAP)业务。它采用列式存储结构，可使用SQL语句实时生成数据分析报告，另外它还支持索引，分布式查询以及近似计算等特性，凭借其优异的表现，ClickHouse在各大互联网公司均有广泛地应用。WhyClickHouse首先我们来看一下OLAP场景下的关键特征。1.大多数数据库访问都是读请求。2.数据总是以批量形式写入数据

王知无(import_bigdata)·2023-01-07 15:38

大数据面试通关手册｜Spark面试题(四)

⭐⭐欢迎关注博客主页：https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言，欢迎留言交流！⭐⭐本文由【王知无】原创，首发于CSDN博客！⭐⭐本文首发CSDN论坛，未经过官方和本人允许，严禁转载！1、spark的有几种部署模式，每种模式特点？1）本地模式 Spark不一定非要跑在hadoop集群，可以在本地，起多个线程的方式来指定。将Spark应用以多线程的方式直接

王知无(import_bigdata)·2023-01-07 15:38

大数据面试通关手册｜Zookeeper面试题总结

⭐⭐欢迎关注博客主页：https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言，欢迎留言交流！⭐⭐本文由【王知无】原创，首发于CSDN博客！⭐⭐本文首发CSDN论坛，未经过官方和本人允许，严禁转载！1、请简述Zookeeper的选举机制假设有五台服务器组成的zookeeper集群，它们的id从1-5，同时它们都是最新启动的，也就是没有历史数据，在存放数据量这一点上，都

王知无(import_bigdata)·2023-01-07 15:08

大数据面试通关手册｜Spark面试题(一)

⭐⭐欢迎关注博客主页：https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言，欢迎留言交流！⭐⭐本文由【王知无】原创，首发于CSDN博客！⭐⭐本文首发CSDN论坛，未经过官方和本人允许，严禁转载！Spark通常来说，Spark与MapReduce相比，Spark运行效率更高。请说明效率更高来源于Spark内置的哪些机制？hadoop和spark使用场景？spark如

王知无(import_bigdata)·2023-01-07 15:08

大数据面试通关手册｜Flink面试题(一)

⭐⭐欢迎关注博客主页：https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言，欢迎留言交流！⭐⭐本文由【王知无】原创，首发于CSDN博客！⭐⭐本文首发CSDN论坛，未经过官方和本人允许，严禁转载！FlinkFlink的容错机制（checkpoint）Flinkcheckpoint与SparkFlink有什么区别或优势吗Flink中的Time有哪几种对于迟到数据是怎么

王知无(import_bigdata)·2023-01-07 15:08

大数据面试通关手册｜数据仓库面试题（一）

⭐⭐欢迎关注博客主页：https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言，欢迎留言交流！⭐⭐本文由【王知无】原创，首发于CSDN博客！⭐⭐本文首发CSDN论坛，未经过官方和本人允许，严禁转载！1.维表和宽表的考查（主要考察维表的使用及维度退化手法）维表数据一般根据ods层数据加工生成，在设计宽表的时候，可以适当的用一些维度退化手法，将维度退化到事实表中，减少事实

王知无(import_bigdata)·2023-01-07 15:08

大数据面试通关手册｜Hadoop面试系列之优化

⭐⭐欢迎关注博客主页：https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言，欢迎留言交流！⭐⭐本文由【王知无】原创，首发于CSDN博客！⭐⭐本文首发CSDN论坛，未经过官方和本人允许，严禁转载！1、MapReduce跑得慢的原因？Mapreduce程序效率的瓶颈在于两点：1）计算机性能CPU、内存、磁盘健康、网络2）I/O操作优化（1）数据倾斜（2）map和red

王知无(import_bigdata)·2023-01-07 15:38

大数据面试通关手册｜Flume面试题汇总

⭐⭐欢迎关注博客主页：https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言，欢迎留言交流！⭐⭐本文由【王知无】原创，首发于CSDN博客！⭐⭐本文首发CSDN论坛，未经过官方和本人允许，严禁转载！1、Flume使用场景线上数据一般主要是落地（存储到磁盘）或者通过socket传输给另外一个系统，这种情况下，你很难推动线上应用或服务去修改接口，实现直接向kafka里写数

王知无(import_bigdata)·2023-01-07 15:38

大数据面试通关手册｜Hadoop系列之YARN

⭐⭐欢迎关注博客主页：https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言，欢迎留言交流！⭐⭐本文由【王知无】原创，首发于CSDN博客！⭐⭐本文首发CSDN论坛，未经过官方和本人允许，严禁转载！1、简述hadoop1与hadoop2的架构异同1）加入了yarn解决了资源调度的问题。2）加入了对zookeeper的支持实现比较可靠的高可用。2、为什么会产生yarn,

王知无(import_bigdata)·2023-01-07 15:37

大数据面试通关手册｜Spark面试题(三)

⭐⭐欢迎关注博客主页：https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言，欢迎留言交流！⭐⭐本文由【王知无】原创，首发于CSDN博客！⭐⭐本文首发CSDN论坛，未经过官方和本人允许，严禁转载！39.Spark的UDF?因为目前SparkSQL本身支持的函数有限，一些常用的函数都没有，比如len,concat...etc但是使用UDF来自己实现根据业务需要的功能是

王知无(import_bigdata)·2023-01-07 15:07

大数据面试通关手册 | Hadoop面试题（一）

⭐⭐欢迎关注博客主页：https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言，欢迎留言交流！⭐⭐本文由【王知无】原创，首发于CSDN博客！⭐⭐本文首发CSDN论坛，未经过官方和本人允许，严禁转载！1、集群的最主要瓶颈磁盘IO2、Hadoop运行模式单机版、伪分布式模式、完全分布式模式3、Hadoop生态圈的组件并做简要描述1）Zookeeper：是一个开源的分布式应

王知无(import_bigdata)·2023-01-07 15:07

大数据面试通关手册｜Hadoop系列之MapReduce

⭐⭐欢迎关注博客主页：https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言，欢迎留言交流！⭐⭐本文由【王知无】原创，首发于CSDN博客！⭐⭐本文首发CSDN论坛，未经过官方和本人允许，严禁转载！1、谈谈Hadoop序列化和反序列化及自定义bean对象实现序列化?1）序列化和反序列化（1）序列化就是把内存中的对象，转换成字节序列（或其他数据传输协议）以便于存储（持久

王知无(import_bigdata)·2023-01-07 15:07

大数据面试题——Spark数据倾斜调优（五）

1、数据倾斜数据倾斜指的是，并行处理的数据集中，某一部分（如Spark或Kafka的一个Partition）的数据显著多于其它部分，从而使得该部分的处理速度成为整个数据集处理的瓶颈。数据倾斜俩大直接致命后果。1、数据倾斜直接会导致一种情况：OutOfMemory。2、运行速度慢。主要是发生在Shuffle阶段。同样Key的数据条数太多了。导致了某个key(下图中的80亿条)所在的Task数据量太大

蓦然_·2023-01-02 11:19

阿里云大数据开发一面面经，已过，面试题已配答案

参考答案来源：大数据面试题V3.0，523道题，679页，46w字二面：阿里云大数据开发二面面经，已过，面试题已配答案_蓦然_的博客-CSDN博客1、实习经历这一点就不多说了，每个人都不一样，根据自己的介绍就行

蓦然_·2022-12-31 16:35

2021年大数据面试宝典完整版（含答案解析）

本文转载自微信公众号《大数据私房菜》，原文章链接为：https://mp.weixin.qq.com/s/0mgy07WAMBYNBP6er8_hDA版本更新时间更新内容v1.02020-07-01新建v1.12020-07-18朋友面试大数据工程师提供的关于架构及数仓方面的题目v1.22020-08-08朋友面试数据专家提供的数据驱动，spark及flink方面面试题v1.32020-08-22

行走的数据智能·2022-12-27 19:46

【面试真题】今日头条大数据面试100题，收藏备用

1、简述WordCount的实现过程2、简述MapReduce与Spark的区别与联系3、Spark在客户端与集群运行的区别4、相同的SQL在HiveSql与SparkSQL的实现中，为什么Spark比Hadoop快5、简述自定义UDF实现过程6、HBase表设计有哪些注意事项7、谈谈你对HBase的HLog的理解8、数据同样存在HDFS，为什么HBase支持在线查询9、SparkSQL操作Hiv

大数据研习社·2022-12-21 04:02

推荐频道

大数据面试

大数据面试题集锦-Hadoop面试题(三)-MapReduce

大数据面试题集锦-Hadoop面试题(五)-优化

大数据面试葵花宝典之Kafka进阶

大数据面试题

面经5：美团：22年实习生大数据开发面试

【面试题】京东大数据面试真题汇总，收藏必备

大数据面试题_Impala等查询组件(除Hive外的其它组件)

大数据面试题4 ---一般有用太多

「硬刚Doris系列」Apache Doris 架构原理及核心特性解读

大数据面试3分钟自我介绍_大数据面试要注意哪些方面？大数据面试准备三大攻略...

大数据面试题：介绍下HBase架构

【闲聊】我用ChatGPT参加了大数据面试

阿里大数据之路：数据模型篇大总结

大数据面试题以及答案整理（一）

大数据面试-Spark

大数据面试之Hive常见题目

大数据面试问题大集合（硬货、全面）

数据仓库面试题——数据仓库分层

about云大数据面试宝典 大公司面试一般用不到

2023版最新最强大数据面试宝典

大数据面试必知必会@2019-01-09

大数据面试杀招——Hadoop高频考点，正在刷新你的认知！

大数据面试题整理 -- hadoop 部分

大数据面试题(二)----HDFS面试题

大数据面试题(一)----HADOOP 面试题

大数据面试题--MapReduce篇

大数据面试题--HDFS篇

大数据面试题之葵花宝典------Hadoop

大数据面试题集锦-Hadoop面试题(二)-HDFS

【大数据面试题】（八）Spark 相关面试题

大数据面试通关手册｜Hbase面试题(一)

大数据面试通关手册｜数据仓库面试题（四）

大数据面试通关手册｜Hbase面试题（二）

大数据面试通关手册｜Hadoop面试题（一）

大数据面试通关手册 | ClickHouse基础&实践&调优全视角解析

大数据面试通关手册｜Spark面试题(四)

大数据面试通关手册｜Zookeeper面试题总结

大数据面试通关手册｜Spark面试题(一)

大数据面试通关手册｜Flink面试题(一)

大数据面试通关手册｜数据仓库面试题（一）

大数据面试通关手册｜Hadoop面试系列之优化

大数据面试通关手册｜Flume面试题汇总

大数据面试通关手册｜Hadoop系列之YARN

大数据面试通关手册｜Spark面试题(三)

大数据面试通关手册 | Hadoop面试题（一）

大数据面试通关手册｜Hadoop系列之MapReduce

大数据面试题——Spark数据倾斜调优（五）

阿里云大数据开发一面面经，已过，面试题已配答案

2021年大数据面试宝典完整版（含答案解析）

【面试真题】今日头条大数据面试100题，收藏备用

about云大数据面试宝典大公司面试一般用不到