spark 蘑菇云入学测试题,考试题

 

姓名:

QQ

手机:

邮箱:

 

1题:请详细描述Java线程的工作机制,Java并发编程的优缺点。

 

2题:在Java中如何完成文件的随机读写,以及如何把数据序列化的输出到内存中。

 

3题:请细致描述HadoopMapReduce具体工作过程,并动手绘制流程图。

 

4题:请细致描述HadoopMapReduce输入数据的Split划分机制,并回答每个Split

小是否等于Block大小及原因。

 

5题:请详细解析下面的Scala代码的每一个语法细节。

abstract class RDD[T: ClassTag](
    @transient private var _sc: SparkContext,
@transient private var deps: Seq[Dependency[_]]
  ) extends Serializable with Logging {

 

 

6题:请详解解析下面的Scala代码的每一个语法细节。

defjoinVertices[U: ClassTag](table: RDD[(VertexId, U)])(mapFunc: (VertexId, VD, U) => VD)
  : Graph[VD, ED] = {
val uf = (id: VertexId, data: VD, o: Option[U]) => {
    o match {
case Some(u) => mapFunc(id, data, u)
case None => data
    }
  }
graph.outerJoinVertices(table)(uf)
}

 

7题:请详解描述Scalaapplyunapply的工作机制,并用代码示例说明。

 

8题:请详细描述Scala的隐式转换、隐式类、隐式参数、隐式对象,并用代码实例说明。

 

9题:请详细描述Scala中函数也是对象的原理,以及为何Scala中闭包的原理。

 

10题:请描述您心中的大数据技术架构全图。

 

 

 

 

 

 

 

 

 

 

 

你可能感兴趣的:(大数据蘑菇云行动)