5月14日第九次早课

1.排序语法，默认是降序吗

默认 asc 升序

2.限制多少行语法

limit

3.分组函数有哪些

GROUP BY 是分组查询, 一般 GROUP BY 是和聚合函数配合使用

分组函数：(五个)

1···max(expr):求expr的最大值 }\

2···min(expr):求expr的最小值 }-- 数据类型是有规定的

3···sum(expr):求expr的总和   }-- 必须是字符型或数字

4···avg(expr):求expr的平均值 }/

5···count(expr):求expr的个数

expr的类型不能是空，如果是空，则不计入其中，        因此需要用到nvl()来进行转换

4.分组语法是什么

group by expr1,expr2,...的用法:

        group by 的后面跟的是炫耀分组的条件，

        例如用 department_id 进行分组，可以写成 group by department_id

        如果需要多重分组，只需要在后面急需添加筛选条件即可;

        Tips:select 语句中不包含分组函数的列，如果用group by 语句，

             那么就需要全部出现在group by的语句中;

5.分组语法的注意点是什么

6.join有哪几种

left join(左联接) 返回包括左表中的所有记录和右表中联结字段相等的记录

right join(右联接) 返回包括右表中的所有记录和左表中联结字段相等的记录

inner join(等值连接) 只返回两个表中联结字段相等的行

7.left join是哪个表数据全

a left join b ; a最全

8.union 和union all 区别是什么

union 会去重

union all 不会

9.谈谈你们觉得什么是子表

任何一个查询结果都可以是子表，相当于临时表，或者缓存

10.模糊查询名称ename的有s字符的名称有哪些?

查询姓名以S开头的\以S结尾\包含S字符\第二个字母为L __

SELECT emp.ename FROM emp WHERE emp.ename LIKE 'S%';

SELECT emp.ename FROM emp WHERE emp.ename LIKE '%S';

SELECT emp.ename FROM emp WHERE emp.ename LIKE '%S%';

SELECT emp.ename FROM emp WHERE emp.ename LIKE '_L%';

11.like查询语法，比如是第三个字符是s，那么前面是不是要用两个占位符?

是的 LIKE '_s%';

12.谈谈你们对hadoop的理解

13.hadoop包含哪三大组件，分别是做什么的

hdfs 存储

mapreduce 计算

yarn资源和作业调度

HDFS:

HDFS 是Hadoop上分布式文件系统

HDFS采用主从模式，其架构主要包含

NameNode DataNode Client三个部分

NameNode ：用于存储生成文件系统的元数据。运行一个实列，因此需要解决单点故障问题

DataNode ：用于存储实际的数据，并将自己管理的数据块信息上报给NameNode,运行多个实例。一个数据默认存储3个副本

分布在3个不同的DataNode以保证可用性。

Client: 支持使用者读写HDFS，从NameNode获取元数据或实际数据返回给使用者。可以有多个实例，和业务一起运行。

MapReduce是Google提出的一种并行计算框架：

Map：映射，对一些独立元素组成的列表的每一个元素进行指定的操作。每个元素都是被独立操作的,而

原始列表没有被更改。Map操作是可以高度并行的，这对高性能应用以及并行计算领域的需求非常有用。

Reduce: 化简，对一个列表的元素进行适当的合并，虽然它不如Map那么并行，但是因为化简总是一个简单的答案，

大规模的运算相对独立，所以化简函数在高度并行环境下也很有用。

适合：大规模数据集的离线批处理计算；任务分而治之，子任务相对独立

不适合：实时的交互式计算，要求快速响应和低延迟，比如BI；流失计算，实时分析，比如广告点击计算；子任务之间相互依赖的迭代计算。

Yarn：

是Hadoop2.0后的资源管理系统，它是一个通用的资源管理模块，可为各类应用程序进行资源管理和调度

yarn是轻量级弹性计算平台，除了MapReduce框架，还可以支持其他框架，比如Spark，Storm等

多种框架统计管理，共享集群资源：

*资源利用率高

*运维成本低

14.hadoop官网地址是什么

hadoop.apache.org

15.maven编译是不是需要pom.xml

需要

16.maven的默认仓库文件夹在哪

可改变默认的 .m2 目录下的默认本地存储库文件夹

通过修改${user.home}/.m2/settings.xml 配置本地仓库路径，没有settings这个xml文件就新建，或者如下复制个；具体看图：

17.我们进行hadoop部署是什么模式?有进程吗

单机部署进程没有

伪分布式部署进程存在+1节点开发

集群部署进程存在+n节点开发/生产

18.hdfs的存储也是从根目录开始的吗

是的

19.伪分布式部署时要配置jdk和ssh，那么请问你们配置ssh无密码的访问，这个流程会吗

哈哈会

20.tar解压时，特别要留意一个东西是什么

用户用户组

5月14日第九次早课

1.排序语法，默认是降序吗

2.限制多少行语法

3.分组函数有哪些

4.分组语法是什么

5.分组语法的注意点是什么

6.join有哪几种

7.left join是哪个表数据全

8.union 和union all 区别是什么

9.谈谈你们觉得什么是子表

10.模糊查询名称ename的有s字符的名称有哪些?

11.like查询语法，比如是第三个字符是s，那么前面是不是要用两个占位符?

12.谈谈你们对hadoop的理解

13.hadoop包含哪三大组件，分别是做什么的

14.hadoop官网地址是什么

15.maven编译是不是需要pom.xml

16.maven的默认仓库文件夹在哪

17.我们进行hadoop部署是什么模式?有进程吗

18.hdfs的存储也是从 根目录 开始的吗

19.伪分布式部署时要配置jdk和ssh，那么请问你们 配置ssh无密码的访问，这个流程会吗

20.tar解压时，特别要留意一个东西是什么

你可能感兴趣的:(5月14日第九次早课)

18.hdfs的存储也是从根目录开始的吗

19.伪分布式部署时要配置jdk和ssh，那么请问你们配置ssh无密码的访问，这个流程会吗