大数据的技术栈-逐步完善

目录

1.hadoop

        a.HDFS分布式文件系统

        b.Yarn集群资源管理器

        c.MapReduce sql引擎

        d.Impala sql引擎

        e.工具概观

2.数据仓库知识

        a.Hive数据库

                1)Hive Sql

                2)数据库结构

        b.Doris数据库

3.混合处理框架SPARK

        a.Spark

        b.集群架构

4.数仓模型知识

5.开发工具

        a.Dbeaver

        b.Idea

6.kafka


转职开始做大数据了,逐步跟着学习的脚本把知识变成自己的

1.hadoop

        a.HDFS分布式文件系统

        b.Yarn集群资源管理器

                前端工作流异常时候 yarn检查异常信息-CSDN博客

                

        c.MapReduce sql引擎

        d.Impala sql引擎

        e.工具概观

2.数据仓库知识

        a.Hive数据库

                1)Hive Sql

                2)数据库结构

        b.Doris数据库

3.混合处理框架SPARK

        a.Spark

                1)SCALA

                        Scala中的选项(Options )-CSDN博客

        b.集群架构

                使用spark进行递归的可行方案-CSDN博客

                spark读取和保存本机文件-CSDN博客

                本机spark 通idea连接Oracle的坑-CSDN博客

4.数仓模型知识

        a.分层逻辑

        b.模型规范

        c.指标检查

5.开发工具

        

        a.Dbeaver

        b.Idea

                windows idea本地执行spark sql避坑-CSDN博客

6.kafka

你可能感兴趣的:(大数据)