5月14日第九次早课

1.排序语法,默认是降序吗

    默认 asc  升序

 2.限制多少行语法

 limit  

3.分组函数有哪些

GROUP BY 是分组查询, 一般 GROUP BY 是和聚合函数配合使用

分组函数:(五个)   

 1···max(expr):求expr的最大值 }\     

 2···min(expr):求expr的最小值 }-- 数据类型是有规定的     

3···sum(expr):求expr的总和   }-- 必须是字符型或数字    

4···avg(expr):求expr的平均值 }/   

 5···count(expr):求expr的个数         

expr的类型不能是空,如果是空,则不计入其中,        因此需要用到nvl()来进行转换

4.分组语法是什么

  group by expr1,expr2,...的用法:

        group by 的后面跟的是炫耀分组的条件,

        例如用 department_id 进行分组,可以写成 group by department_id

        如果需要多重分组,只需要在后面急需添加筛选条件即可;

        Tips:select 语句中不包含分组函数的列,如果用group by 语句,

             那么就需要全部出现在group by的语句中;


5.分组语法的注意点是什么


6.join有哪几种

left join(左联接) 返回包括左表中的所有记录和右表中联结字段相等的记录

right join(右联接) 返回包括右表中的所有记录和左表中联结字段相等的记录

inner join(等值连接) 只返回两个表中联结字段相等的行

7.left join是哪个表数据全

a  left join b  ; a最全

8.union 和union all 区别是什么

union   会去重

union all  不会

9.谈谈你们觉得什么是子表

任何一个查询结果都可以是子表,相当于临时表,或者缓存

10.模糊查询名称ename的有s字符的名称有哪些?

查询姓名以S开头的\以S结尾\包含S字符\第二个字母为L __

SELECT emp.ename FROM emp WHERE emp.ename LIKE 'S%';

SELECT emp.ename FROM emp WHERE emp.ename LIKE '%S';

SELECT emp.ename FROM emp WHERE emp.ename LIKE '%S%';

SELECT emp.ename FROM emp WHERE emp.ename LIKE '_L%';


11.like查询语法,比如是第三个字符是s,那么前面是不是要用两个占位符?

是的    LIKE '_s%';

12.谈谈你们对hadoop的理解

5月14日第九次早课_第1张图片


13.hadoop包含哪三大组件,分别是做什么的

hdfs 存储

mapreduce 计算

yarn资源和作业调度

HDFS:

    HDFS 是Hadoop上分布式文件系统

    HDFS采用主从模式,其架构主要包含

NameNode   DataNode   Client三个部分

 NameNode : 用于存储生成文件系统的元数据。运行一个实列,因此需要解决单点故障问题

 DataNode :用于存储实际的数据,并将自己管理的数据块信息上报给NameNode,运行多个实例。一个数据默认存储3个副本

                      分布在3个不同的DataNode以保证可用性。

Client: 支持使用者读写HDFS,从NameNode获取元数据或实际数据返回给使用者。可以有多个实例,和业务一起运行。

MapReduce是Google提出的一种并行计算框架:

     Map:映射,对一些独立元素组成的列表的每一个元素进行指定的操作。每个元素都是被独立操作的,而

                原始列表没有被更改。Map操作是可以高度并行的,这对高性能应用以及并行计算领域的需求非常有用。

    Reduce:      化简,对一个列表的元素进行适当的合并,虽然它不如Map那么并行,但是因为化简总是一个简单的答案,

                       大规模的运算相对独立,所以化简函数在高度并行环境下也很有用。

适合:大规模数据集的离线批处理计算;任务分而治之,子任务相对独立

不适合:实时的交互式计算,要求快速响应和低延迟,比如BI;流失计算,实时分析,比如广告点击计算;子任务之间相互依赖的迭代计算。

Yarn: 

      是Hadoop2.0后的资源管理系统,它是一个通用的资源管理模块,可为各类应用程序进行资源管理和调度

      yarn是轻量级弹性计算平台,除了MapReduce框架,还可以支持其他框架,比如Spark,Storm等

      多种框架统计管理,共享集群资源:

      *资源利用率高

      *运维成本低

14.hadoop官网地址是什么

hadoop.apache.org

15.maven编译是不是需要pom.xml

需要

16.maven的默认仓库文件夹在哪

可改变默认的 .m2 目录下的默认本地存储库文件夹

通过修改${user.home}/.m2/settings.xml 配置本地仓库路径 ,没有settings这个xml文件就新建,或者如下复制个;具体看图:

17.我们进行hadoop部署是什么模式?有进程吗

单机部署             进程没有

伪分布式部署      进程存在+1节点  开发

集群部署             进程存在+n节点  开发/生产

18.hdfs的存储也是从 根目录 开始的吗

是的 

19.伪分布式部署时要配置jdk和ssh,那么请问你们 配置ssh无密码的访问,这个流程会吗

哈哈  会

20.tar解压时,特别要留意一个东西是什么

用户用户组


·

你可能感兴趣的:(5月14日第九次早课)