大数据:常见面试题

1、scala 隐函数关键字

implicit

2、val x=y=1结果

1)x、y都是var,x变为Unit

2)都是val,报错

3、java内存模型

堆内存、栈内存、方法区

栈内存:保存局部变量

堆内存:存储数组和对象

方法区:代码区、字符串常量池、静态区

4、用mr设计一个分组排重计数算法

输入文件格式:二级域名,一级频道,二级频道,访问ip地址,访问者id

需求:按照二级域名,一级频道,二级频道分组,计算pageview数,计算独立ip数和独立访问者id数

5、hadoop中combiner的作用

当map生成的数据过大时,带宽就成了瓶颈,怎样精简压缩传给Reduce的数据,有不影响末了的结果呢。有一种方法就是使用Combiner,Combiner号称本地的Reduce,Reduce zui终的输入,是Combiner的输出

6、Linkedlist和ArrayList的区别

ArrayList是使用数组方式存储数据,此数组元素数大于实际存储的数据以便增加和插入元素,允许直接按序号索引元素,但是插入元素要涉及数组元素移动等内存操作,所以索引数据快而插入数据慢。LinkedList使用双向链表实现存储,按序号索引数据需要进行前向或后向遍历,但是插入数据时只需要记录本项的前后项即可,所以插入速度较快。

7、http安全问题

1)重要信息:MD5,AES加密

2)不太重要的数据:用签名

3)登录态:

8、linux的启动顺序

通电后读取ROM的BIOS程序进行硬件自检,自检成功后把计算机控制权交给BIOS中BOOTsequence中的下一个有效设备,读取该设备MBR找到操作系统,载入linux的bootloader,一般是grub。之后载入kernel,执行 /etc/rc.d/sysinit ,开启其他组件(/etc/modules.conf),执行运行级别,执行/etc/rc.d/rc.local ,执行/bin/login,末后shell启动。

喜欢学习可以加入裙:九四三零六四六四四

你可能感兴趣的:(大数据:常见面试题)