大数据复习笔记

一、知识总览

1、Linux

    1、常用的高级命令()
    top  iotop   ps -ef   netstat   tree   df -h   rpm  tar 
    
    2、查看端口号  查看进程   查看磁盘使用情况
    netstat    top  ps -ef    df -h

2、Shell

    1、四个工具
        awk  sed  sort cut 
    2、写过哪些脚本
        1)分发同步 、启动停止
            #!/bin/bash
            
            case $1 in 
            "start")
                    for i in hadoop102 hadoop103 hadoop104 
                    do
                        ssh $i "绝对路径"
                    done 
            ;;
            "stop")
            
            ;;
            esac

        2)ods => ads 
            #!/bin/bash
            
            定义变量
            APP=gmall
            
            获取时间
            
            sql="

你可能感兴趣的:(Hadoop,Hive,Spark,大数据安全,大数据,hadoop,分布式)