地球人是我哈

Hadoop、Hive On k8s

参考文章：在Kubernetes上部署Hadoop_迷途的攻城狮（798570156）的博客-CSDN博客_apache hadoop k8s

1、环境介绍：

机器：

IP	主机名	角色
192.168.119.129	master	k8s-master01
192.168.119.130	node1	k8s-master02

Hadoop版本：hadoop-2.7.2
Hive版本：hive-2.1.1

目前在K8S里面调试Yarn环境，无法正常提交任务至Yarn运行，ResourceManager和NodeManager不部署

注意：在开启端口映射时，比如，将容器内的端口：8020 映射到宿主机：8020 ，会报错：
:::info
The Service “xxx-service” is invalid: spec.ports[1].nodePort: Invalid value: 8020: provided port is not in the valid range. The range of valid ports is 30000-32767
:::
K8s 默认端口映射的范围：30000 – 32767，需要手动调整范围：
修改 kube-apiserver 开启Node的pod端口范围

2、DockerFile

vim docker-hadoop

FROM openjdk:8-jdk

ENV HADOOP_VERSION 2.7.2
ENV HIVE_VERSION 2.1.1
ENV HADOOP_HOME=/opt/hadoop
ENV HIVE_HOME /opt/hive

ENV HADOOP_COMMON_HOME=${HADOOP_HOME} \
    HADOOP_HDFS_HOME=${HADOOP_HOME} \
    HADOOP_MAPRED_HOME=${HADOOP_HOME} \
    HADOOP_YARN_HOME=${HADOOP_HOME} \
    HADOOP_CONF_DIR=${HADOOP_HOME}/etc/hadoop \
    PATH=${PATH}:${HADOOP_HOME}/bin

ENV PATH=${PATH}:${HIVE_HOME}/bin

#RUN curl --silent --output /tmp/hadoop.tgz https://ftp-stud.hs-esslingen.de/pub/Mirrors/ftp.apache.org/dist/hadoop/common/hadoop-${HADOOP_VERSION}/hadoop-${HADOOP_VERSION}.tar.gz && tar --directory /opt -xzf /tmp/hadoop.tgz && rm /tmp/hadoop.tgz

#RUN curl --silent --output /tmp/hive.tgz http://archive.apache.org/dist/hive/hive-${HIVE_VERSION}/apache-hive-${HIVE_VERSION}-bin.tar.gz && tar --directory /opt -xzf /tmp/hive.tgz && rm     /tmp/hadoop.tgz


COPY apache-hive-${HIVE_VERSION}-bin.tar.gz /tmp/hive.tgz 
COPY hadoop-${HADOOP_VERSION}.tar.gz /tmp/hadoop.tgz
RUN tar --directory /opt -xzf /tmp/hive.tgz && rm /tmp/hive.tgz 
RUN tar --directory /opt -xzf /tmp/hadoop.tgz && rm /tmp/hadoop.tgz
RUN mv /opt/apache-hive-${HIVE_VERSION}-bin /opt/hive-${HIVE_VERSION}
RUN ln -s /opt/hive-${HIVE_VERSION}  ${HIVE_HOME}
COPY mysql-connector-java-5.1.47-bin.jar ${HIVE_HOME}/lib/

RUN ln -s /opt/hadoop-${HADOOP_VERSION} ${HADOOP_HOME}

WORKDIR $HADOOP_HOME

# Hdfs ports
EXPOSE 50010 50020 50070 50075 50090 8020 9000

# Mapred ports
EXPOSE 19888

#Yarn ports
EXPOSE 8030 8031 8032 8033 8040 8042 8088 8090

#Other ports
EXPOSE 49707 2122

# Hive port
EXPOSE 10000 10002 9083

构建镜像

docker build -f docker-hadoop -t hadoop:2.7.2 . --no-cache

将镜像上传到阿里云镜像仓库

[root@node2 docker]# docker images
REPOSITORY             TAG                 IMAGE ID            CREATED             SIZE
hadoop                 3.3.2               3c5e7afd9959        About an hour ago   1.84GB
openjdk                8-jdk               b273004037cc        6 months ago        526MB
redis                  latest              3edbb69f9a49        7 months ago        117MB
big-data/pig           v3.1.2204           2e48ce06d2fa        10 months ago       1.26GB
big-data/mysql-redis   v3.0.2111           6a0542caf04c        14 months ago       453MB
guohao/kibanatest      0.1                 23367f808e5a        15 months ago       2GB
abell_test             0.1                 ba6acccedd29        16 months ago       72.8MB
ubuntu                 latest              ba6acccedd29        16 months ago       72.8MB
centos                 8                   5d0da3dc9764        17 months ago       231MB
centos                 latest              5d0da3dc9764        17 months ago       231MB
big-data/mysql-redis   v2                  b42d43966aa9        19 months ago       453MB
portainer/portainer    latest              62771b0b9b09        2 years ago         79.1MB
kibana                 7.6.0               b36db011e72c        3 years ago         1.01GB
elasticsearch          7.6.0               5d2812e0e41c        3 years ago         790MB
[root@node2 docker]# docker tag 3c5e7afd9959 registry.cn-hangzhou.aliyuncs.com/dockerxiahu/hadoop:3.3.2
[root@node2 docker]# docker push registry.cn-hangzhou.aliyuncs.com/dockerxiahu/hadoop:3.3.2
The push refers to repository [registry.cn-hangzhou.aliyuncs.com/dockerxiahu/hadoop]
07c796120429: Pushed 
52ed9ff2fb8e: Pushed 
6b5aaff44254: Pushed 
53a0b163e995: Pushed 
b626401ef603: Pushed 
9b55156abf26: Pushed 
293d5db30c9f: Pushed 
03127cdb479b: Pushed 
9c742cd6c7a5: Pushed 
3.3.2: digest: sha256:bef0b6581a47585e2dd5010002c1895abb9d7793048071c56a50c52974d4bad5 size: 2215

3、搭建NFS

服务端配置

## 创建同步目录
sudo mkdir /home/nfs

## 安装同步服务
sudo yum install -y rpcbind nfs-utils

## 设置同步目录
sudo vim /etc/exports 
/home/nfs *(insecure,rw,sync,no_root_squash)

## 服务开机自启动
sudo systemctl enable rpcbind
sudo systemctl start rpcbind
sudo systemctl enable nfs-server
sudo systemctl start nfs-server
sudo exportfs -r
sudo exportfs

## 防火墙设置
sudo firewall-cmd --zone=public --permanent --add-service=rpc-bind
sudo firewall-cmd --zone=public --permanent --add-service=mountd
sudo firewall-cmd --zone=public --permanent --add-service=nfs
sudo firewall-cmd --reload

客户端配置

## 检查服务端共享目录
sudo showmount -e 192.168.119.129

## 挂在共享目录
sudo mkdir /home/nfs
sudo mount -t nfs 192.168.119.129:/home/nfs /home/nfs

## 同步服务 自动挂载
sudo vim /etc/fstab
192.168.119.129:/home/nfs      /home/nfs           nfs     defaults        0 0
sudo systemctl daemon-reload

4、构建Yaml文件

pv

apiVersion: v1
kind: PersistentVolume
metadata:
  name: hadoop-config-nfs-pv
	namespace: hadoop
  labels:
    release: hadoop-config
spec:
  capacity:
    storage: 16Mi
  accessModes:
    - ReadWriteMany
  persistentVolumeReclaimPolicy: Retain
  nfs:
    path: /home/nfs/data/hadoop-config
    server: 192.168.119.129

创建/home/nfs/data/hadoop-config共享路径，用于存储hadoop的配置文件

pvc

apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: hadoop-config-nfs-pvc
	namespace: hadoop
spec:
  accessModes:
    - ReadWriteMany
  resources:
    requests:
      storage: 16Mi
  selector:
    matchLabels:
      release: hadoop-config

pv与pvc进行绑定

hadoop-namenode

apiVersion: apps/v1
kind: StatefulSet
metadata:
  name: hadoop-nn
  namespace: hadoop
spec:
  replicas: 1
  revisionHistoryLimit: 10
  selector:
    matchLabels:
      app: hadoop-nn
  serviceName: hadoop-nn-service
  template:
    metadata:
      labels:
        app: hadoop-nn
    spec:
      containers:
        - name: hadoop-nn
          image: registry.cn-hangzhou.aliyuncs.com/dockerxiahu/hadoop:2.7.2
          command:
            - "/bin/bash"
            - "/root/bootstrap/bootstrap.sh"
            - "-d"
          env:
            - name: HADOOP_CONF_DIR
              value: /etc/hadoop
            - name: NODE_TYPE
              value: NN
          volumeMounts:
            - name: hadoop-config-volume
              mountPath: /etc/hadoop
            - name: hadoop-custom-config-volume
              mountPath: /root/bootstrap
            - name: dfs-name-dir-volume
              mountPath: /dfs/nn
      affinity:
        nodeAffinity:
          requiredDuringSchedulingIgnoredDuringExecution:
            nodeSelectorTerms:
            - matchExpressions:
              - key: kubernetes.io/hostname
                operator: In
                values:
                - k8s-master01
      volumes:
        - name: hadoop-config-volume
          persistentVolumeClaim:
            claimName: hadoop-config-nfs-pvc
        - name: hadoop-custom-config-volume
          configMap:
            name: hadoop-custom-config-cm
        - name: dfs-name-dir-volume
          hostPath: 
            path: /opt/dfs/nn
            type: DirectoryOrCreate

创建Pod，名称为：hadoop-nn
从registry.cn-hangzhou.aliyuncs.com/dockerxiahu/hadoop:2.7.2拉取镜像
设置环境变量：$HADOOP_CONF_DIR，$NODE_TYPE
添加挂载卷，与宿主机进行交互，持久化存储数据
- 容器：/etc/hadoop —> 宿主机：/home/nfs/data/hadoop-config
- 容器：/root/bootstrap —> 配置文件内的bootstrap.sh移动到/root/bootstrap
- 容器：/dfs/nn —> 宿主机：/opt/dfs/nn
最后会执行shell：/bin/bash /root/bootstrap/bootstrap.sh -d

hadoop-namenode-service

apiVersion: v1
kind: Service
metadata:
  name: hadoop-nn-service
  namespace: hadoop
  labels:
    app: hadoop-nn
spec:
  ports:
    - nodePort: 50070    
      port: 50070
      targetPort: 50070
      name: datanode
    - nodePort: 8020
      port: 8020
      targetPort: 8020
      name: namenode
  selector:
    app: hadoop-nn
  type: NodePort

管理hadoop-nnpod

hadoop-datanode

apiVersion: apps/v1
kind: StatefulSet
metadata:
  name: hadoop-dn-node1
  namespace: hadoop
spec:
  replicas: 1
  revisionHistoryLimit: 10
  selector:
    matchLabels:
      app: hadoop-dn-node1
  serviceName: hadoop-dn-node1-service
  template:
    metadata:
      labels:
        app: hadoop-dn-node1
    spec:
      containers:
        - name: hadoop-dn-node1
          image: registry.cn-hangzhou.aliyuncs.com/dockerxiahu/hadoop:2.7.2
          command: 
            - "/bin/bash"
            - "/root/bootstrap/bootstrap.sh"
            - "-d"
          env:
            - name: HADOOP_CONF_DIR
              value: /etc/hadoop
            - name: NODE_TYPE
              value: DN
          volumeMounts:
            - name: hadoop-config-volume
              mountPath: /etc/hadoop
            - name: hadoop-custom-config-volume
              mountPath: /root/bootstrap
            - name: dfs-data-dir-volume
              mountPath: /dfs/dn/data
      affinity:
        nodeAffinity:
          requiredDuringSchedulingIgnoredDuringExecution:
            nodeSelectorTerms:
            - matchExpressions:
              - key: kubernetes.io/hostname
                operator: In
                values:
                - nfs-server
      volumes:
        - name: hadoop-config-volume
          persistentVolumeClaim:
            claimName: hadoop-config-nfs-pvc
        - name: hadoop-custom-config-volume
          configMap:
            name: hadoop-custom-config-cm
        - name: dfs-data-dir-volume
          hostPath:
            path: /opt/dfs/dn
            type: DirectoryOrCreate

创建Pod，名称为：hadoop-dn-node1
从registry.cn-hangzhou.aliyuncs.com/dockerxiahu/hadoop:2.7.2拉取镜像
设置环境变量：$HADOOP_CONF_DIR，$NODE_TYPE
添加挂载卷，与宿主机进行交互，持久化存储数据
- 容器：/etc/hadoop —> 宿主机：/home/nfs/data/hadoop-config
- 容器：/root/bootstrap —> 配置文件内的bootstrap.sh移动到/root/bootstrap
- 容器：/dfs/dn/data —> 宿主机：/opt/dfs/dn
最后会执行shell：/bin/bash /root/bootstrap/bootstrap.sh -d

configMap

apiVersion: v1
kind: ConfigMap
metadata:
  name: hadoop-custom-config-cm
  namespace: hadoop
  labels:
    app: hadoop
data:
  bootstrap.sh: |-
    #!/bin/bash
    NAME_NODE_MEMORY=900m
    DATA_NODE_MEMORY=1000m
    RESOURCE_MANAGER_MEMORY=900m
    NODE_MANAGER_MEMORY=900m

    cd /root/bootstrap


    # Don't override slaves、core-site.xml and yarn-site.xml
    if [[ ! -e $HADOOP_CONF_DIR/NameNode ]];then
      rm -f $HADOOP_HOME/etc/hadoop/slaves $HADOOP_HOME/etc/hadoop/core-site.xml $HADOOP_HOME/etc/hadoop/yarn-site.xml $HADOOP_HOME/etc/hadoop/hdfs-site.xml $HADOOP_HOME/etc/hadoop/mapred-site.xml

      # Copy original hadoop file to $HADOOP_CONF_DIR
      cp -a $HADOOP_HOME/etc/hadoop/* $HADOOP_CONF_DIR
    fi
    # Get this node's FQDN

    #FQDN=`ping $HOSTNAME -c 1 | grep PING | awk '{print $2}'`
    FQDN=$HOSTNAME
    
    # NAME_NODE_FQDN=$FQDN".hadoop-nn-service"
    # sed -i 's/${NAME_NODE_SERVICE_NAME}/'$NAME_NODE_FQDN'/g' `grep '${NAME_NODE_SERVICE_NAME}' -rl $HADOOP_CONF_DIR`
    # sed -i 's/${NAME_NODE_SERVICE_NAME}/'$NAME_NODE_FQDN'/g' `grep '${NAME_NODE_SERVICE_NAME}' -rl $HADOOP_HOME/etc/hadoop`
    # If this node is nameNode, set it's FQDN to core-site.xml file and yarn-site.xml file

    if [[ "$NODE_TYPE" =~ "NN" ]]; then
     for cfg in ./*; do
        if [[ ! "$cfg" =~ bootstrap.sh ]]; then
                cat $cfg > $HADOOP_CONF_DIR/${cfg##*/}
        fi
     done
     
     for f in slaves core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml; do
      if [[ -e ${HADOOP_CONF_DIR}/$f ]]; then
        cp -a  ${HADOOP_CONF_DIR}/$f $HADOOP_HOME/etc/hadoop/$f
      else
        echo "ERROR: Could not find $f in $CONFIG_DIR"
        exit 1
      fi
     done
    

     NAME_NODE_FQDN=$FQDN".hadoop-nn-service" 
     sed -i 's/${NAME_NODE_SERVICE_NAME}/'$NAME_NODE_FQDN'/g' `grep '${NAME_NODE_SERVICE_NAME}' -rl $HADOOP_CONF_DIR`
     sed -i 's/${NAME_NODE_SERVICE_NAME}/'$NAME_NODE_FQDN'/g' `grep '${NAME_NODE_SERVICE_NAME}' -rl $HADOOP_HOME/etc/hadoop`     
     if [[ ! -e $HADOOP_CONF_DIR/namenode_memory_set ]];then
       # 修改NameNode启动时JVM参数
       echo "export HADOOP_NAMENODE_OPTS=\"-Xms${NAME_NODE_MEMORY} -Xmx${NAME_NODE_MEMORY}\"" >> $HADOOP_CONF_DIR/hadoop-env.sh
       echo "export HADOOP_NAMENODE_OPTS=\"-Xms${NAME_NODE_MEMORY} -Xmx${NAME_NODE_MEMORY}\"" >> $HADOOP_HOME/etc/hadoop/hadoop-env.sh
       echo 1 >> $HADOOP_CONF_DIR/namenode_memory_set
     fi

     if [[ ! -e $HADOOP_CONF_DIR/resourcemanager_memory_set ]];then
       # 修改ResouceManager启动时JVM参数
       echo "export YARN_RESOURCEMANAGER_OPTS=\"-Xms${RESOURCE_MANAGER_MEMORY} -Xmx${RESOURCE_MANAGER_MEMORY}\"" >> $HADOOP_CONF_DIR/yarn-env.sh
       echo "export YARN_RESOURCEMANAGER_OPTS=\"-Xms${RESOURCE_MANAGER_MEMORY} -Xmx${RESOURCE_MANAGER_MEMORY}\"" >> $HADOOP_HOME/etc/hadoop/yarn-env.sh
       echo 1 >> $HADOOP_CONF_DIR/resourcemanager_memory_set
     fi
     #mkdir -p /var/hadoop/dfs/name

      # Apply custom config file context
      #for cfg in ./*; do
      #  if [[ ! "$cfg" =~ bootstrap.sh ]]; then
      #    cat $cfg > $HADOOP_CONF_DIR/${cfg##*/}
      #  fi
      #done

      # Set nameNode's FQDN to file
      echo $FQDN > $HADOOP_CONF_DIR/NameNode

      # Format HDFS if not formatted yet
      if [[ ! -e $HADOOP_CONF_DIR/hdfs-namenode-format.out ]]; then
        $HADOOP_HOME/bin/hdfs namenode -format -force -nonInteractive &> $HADOOP_CONF_DIR/hdfs-namenode-format.out
        $HADOOP_HOME/bin/hdfs namenode -format -force -nonInteractive &> $HADOOP_CONF_DIR/hdfs-namenode-format.out
      fi

      if [ ! -f $HADOOP_CONF_DIR/namenode_formated ]; then
        # Only format if necessary
        $HADOOP_HOME/bin/hdfs namenode -format -force -nonInteractive && echo 1 > $HADOOP_CONF_DIR/namenode_formated
      fi

      # Start hadoop nameNode daemon
      $HADOOP_HOME/sbin/hadoop-daemon.sh start namenode

    fi


    # If this node is ResourceManager

    if [[ "$NODE_TYPE" =~ "RM" ]]; then
      $HADOOP_HOME/sbin/yarn-daemon.sh start resourcemanager
      $HADOOP_HOMEsbin/mr-jobhistory-daemon.sh start historyserver

    fi


    # If this node is nodeManager, add it to slave

    if [[ "$NODE_TYPE" =~ "NM" ]]; then
      #sed -i '/'$FQDN'/d' $HADOOP_CONF_DIR/workers
      #echo $FQDN >> $HADOOP_CONF_DIR/workers

      # Waiting nameNode set NAME_NODE_FQDN
      while [[ ! -e $HADOOP_CONF_DIR/NameNode || -z $NAME_NODE_FQDN ]]; do
        echo "Waiting for nameNode set NAME_NODE_FQDN" && sleep 2 && NAME_NODE_FQDN=`cat $HADOOP_CONF_DIR/NameNode`
      done
      
      sed -i '/localhost/d' $HADOOP_CONF_DIR/slaves
      sed -i '/'$FQDN'/d' $HADOOP_CONF_DIR/slaves
      echo $FQDN >> $HADOOP_CONF_DIR/slaves    
  
      NAME_NODE_HOSTNAME=`cat $HADOOP_CONF_DIR/NameNode`
      NAME_NODE_FQDN=$NAME_NODE_HOSTNAME".hadoop-nn-service"

      sed -i 's/${NAME_NODE_SERVICE_NAME}/'${NAME_NODE_FQDN}'/g' $HADOOP_CONF_DIR/yarn-site.xml      
      
      if [[ ! -e $HADOOP_CONF_DIR/nodemanager_memory_set ]];then
        #修改DataNode启动时JVM参数
        echo "export YARN_NODEMANAGER_OPTS=\"-Xms${NODE_MANAGER_MEMORY} -Xmx${NODE_MANAGER_MEMORY}\"" >> $HADOOP_CONF_DIR/yarn-env.sh
        echo "export YARN_NODEMANAGER_OPTS=\"-Xms${NODE_MANAGER_MEMORY} -Xmx${NODE_MANAGER_MEMORY}\"" >> $HADOOP_HOME/etc/hadoop/yarn-env.sh
        echo 1 >> $HADOOP_CONF_DIR/nodemanager_memory_set
      fi

      # Start hadoop nodeManager daemon
      while [[ -z `curl -sf http://$NAME_NODE_FQDN:8088/ws/v1/cluster/info` ]]; do
        echo "Waiting for $FQDN" && sleep 2
      done
      $HADOOP_HOME/sbin/yarn-daemon.sh start nodemanager
    fi


    # If this node is dataNode, add it to slave

    if [[ "$NODE_TYPE" =~ "DN" ]]; then
      #sed -i '/localhost/d' $HADOOP_CONF_DIR/workers
      #sed -i '/'$FQDN'/d' $HADOOP_CONF_DIR/workers
      #echo $FQDN >> $HADOOP_CONF_DIR/workers

      # Waiting nameNode set NAME_NODE_FQDN
      while [[ ! -e $HADOOP_CONF_DIR/NameNode || -z $NAME_NODE_FQDN ]]; do
        echo "Waiting for nameNode set NAME_NODE_FQDN" && sleep 2 && NAME_NODE_FQDN=`cat $HADOOP_CONF_DIR/NameNode`
      done

      sed -i '/localhost/d' $HADOOP_CONF_DIR/slaves
      sed -i '/'$FQDN'/d' $HADOOP_CONF_DIR/slaves
      echo $FQDN >> $HADOOP_CONF_DIR/slaves
     

      NAME_NODE_HOSTNAME=`cat $HADOOP_CONF_DIR/NameNode`
      NAME_NODE_FQDN=$NAME_NODE_HOSTNAME".hadoop-nn-service"

      sed -i 's/${NAME_NODE_SERVICE_NAME}/'${NAME_NODE_FQDN}'/g' $HADOOP_CONF_DIR/core-site.xml
      sed -i 's/${HOST_NAME}/'${FQDN}'/g' $HADOOP_CONF_DIR/hdfs-site.xml
      
      if [[ ! -e $HADOOP_CONF_DIR/datanode_memory_set ]];then 
        # 修改DataNode启动时JVM参数
        echo "export HADOOP_DATANODE_OPTS=\"-Xms${DATA_NODE_MEMORY} -Xmx${DATA_NODE_MEMORY}\"" >> $HADOOP_CONF_DIR/hadoop-env.sh
        echo "export HADOOP_DATANODE_OPTS=\"-Xms${DATA_NODE_MEMORY} -Xmx${DATA_NODE_MEMORY}\"" >> $HADOOP_HOME/etc/hadoop/hadoop-env.sh      
        echo 1 >> $HADOOP_CONF_DIR/datanode_memory_set
      fi


      # Start hadoop dataNode daemon
      while [[ -z `curl  http://$NAME_NODE_FQDN:8020` ]]; do
        echo "Waiting for $NAME_NODE_FQDN" && sleep 2
      done
      $HADOOP_HOME/sbin/hadoop-daemon.sh start datanode
    fi


    if [[ "$NODE_TYPE" =~ "HIVE" ]]; then
      while [[ ! -e $HADOOP_CONF_DIR/NameNode || -z $NAME_NODE_FQDN ]]; do
        echo "Waiting for nameNode set NAME_NODE_FQDN" && sleep 2 && NAME_NODE_FQDN=`cat $HADOOP_CONF_DIR/NameNode`
      done

      for cfg in ./*; do
        if [[ "$cfg" =~ hive-site.xml ]]; then
                cat $cfg > $HADOOP_CONF_DIR/${cfg##*/}
        fi
      done

      cp -a $HADOOP_CONF_DIR/hive-site.xml $HIVE_HOME/conf/
      
      # hive 
      if [ ! -f $HADOOP_CONF_DIR/hive_init_schema ]; then
        #hive  init schema 
        $HIVE_HOME/bin/schematool -dbType mysql -initSchema && echo 1 > $HADOOP_CONF_DIR/hive_init_schema
      fi
      cd $HIVE_HOME/bin
      nohup hive --service hiveserver2 >> /etc/hadoop/hive-hiveserver2.log 2>&1 &
      nohup hive --service metastore  >> /etc/hadoop/hive-metastore.log 2>&1 &
    fi


    # keep running

    sleep infinity
  hdfs-site.xml: |-
    <?xml version="1.0" encoding="UTF-8"?>
    <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
    <!--
      Licensed under the Apache License, Version 2.0 (the "License");
      you may not use this file except in compliance with the License.
      You may obtain a copy of the License at

        http://www.apache.org/licenses/LICENSE-2.0

      Unless required by applicable law or agreed to in writing, software
      distributed under the License is distributed on an "AS IS" BASIS,
      WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
      See the License for the specific language governing permissions and
      limitations under the License. See accompanying LICENSE file.
    -->

    <!-- Put site-specific property overrides in this file. -->

    >
      >
        >dfs.name.dir>
        >/dfs/nn>
      >
      >
        >dfs.data.dir>
        >/dfs/dn/data/>
      >
      >
        >dfs.replication>
        >3>
      >
      >
        >dfs.namenode.datanode.registration.ip-hostname-check>                   
        >false>
      >
      >
        >dfs.datanode.use.datanode.hostname>
        >true>
      >

    >
  core-site.xml: |-
    <?xml version="1.0" encoding="UTF-8"?>
    <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
    <!--
      Licensed under the Apache License, Version 2.0 (the "License");
      you may not use this file except in compliance with the License.
      You may obtain a copy of the License at

        http://www.apache.org/licenses/LICENSE-2.0

      Unless required by applicable law or agreed to in writing, software
      distributed under the License is distributed on an "AS IS" BASIS,
      WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
      See the License for the specific language governing permissions and
      limitations under the License. See accompanying LICENSE file.
    -->

    <!-- Put site-specific property overrides in this file. -->

    >
      >
        >fs.defaultFS>
        >hdfs://${NAME_NODE_SERVICE_NAME}:8020>
      >
      >
        >hadoop.tmp.dir>
        >/var/hadoop>
      >
      >
        >hadoop.proxyuser.root.hosts>
        >*
      >
      >
        >hadoop.proxyuser.root.groups>
        >*
      >
    >
  mapred-site.xml: |-
    <?xml version="1.0"?>
    <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
    <!--
      Licensed under the Apache License, Version 2.0 (the "License");
      you may not use this file except in compliance with the License.
      You may obtain a copy of the License at

        http://www.apache.org/licenses/LICENSE-2.0

      Unless required by applicable law or agreed to in writing, software
      distributed under the License is distributed on an "AS IS" BASIS,
      WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
      See the License for the specific language governing permissions and
      limitations under the License. See accompanying LICENSE file.
    -->

    <!-- Put site-specific property overrides in this file. -->

    >
      >
        >mapreduce.framework.name>
        >yarn>
      >
    >
  yarn-site.xml: |-
    <?xml version="1.0"?>
    <!--
      Licensed under the Apache License, Version 2.0 (the "License");
      you may not use this file except in compliance with the License.
      You may obtain a copy of the License at

        http://www.apache.org/licenses/LICENSE-2.0

      Unless required by applicable law or agreed to in writing, software
      distributed under the License is distributed on an "AS IS" BASIS,
      WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
      See the License for the specific language governing permissions and
      limitations under the License. See accompanying LICENSE file.
    -->
    
        
            yarn.acl.enable
            true
        
        
            yarn.admin.acl
            *
        
        
            yarn.resourcemanager.address
            ${NAME_NODE_SERVICE_NAME}:8032
        
        
            yarn.resourcemanager.admin.address
            ${NAME_NODE_SERVICE_NAME}:8033
        
        
            yarn.resourcemanager.scheduler.address
            ${NAME_NODE_SERVICE_NAME}:8030
        
        
            yarn.resourcemanager.resource-tracker.address
            ${NAME_NODE_SERVICE_NAME}:8031
        
        
            yarn.resourcemanager.webapp.address
            ${NAME_NODE_SERVICE_NAME}:8088
        
        
            yarn.resourcemanager.webapp.https.address
            ${NAME_NODE_SERVICE_NAME}:8090
        
        
            yarn.resourcemanager.client.thread-count
            50
        
        
            yarn.resourcemanager.scheduler.client.thread-count
            50
        
        
            yarn.resourcemanager.admin.client.thread-count
            1
        
        
            yarn.scheduler.minimum-allocation-mb
            1024
        
        
            yarn.scheduler.increment-allocation-mb
            512
        
        
            yarn.scheduler.maximum-allocation-mb
            49192
        
        
            yarn.scheduler.minimum-allocation-vcores
            1
        
        
            yarn.scheduler.increment-allocation-vcores
            1
        
        
            yarn.scheduler.maximum-allocation-vcores
            32
        
        
            yarn.resourcemanager.amliveliness-monitor.interval-ms
            1000
        
        
            yarn.am.liveness-monitor.expiry-interval-ms
            600000
        
        
            yarn.resourcemanager.am.max-attempts
            2
        
        
            yarn.resourcemanager.container.liveness-monitor.interval-ms
            600000
        
        
            yarn.resourcemanager.nm.liveness-monitor.interval-ms
            1000
        
        
            yarn.nm.liveness-monitor.expiry-interval-ms
            600000
        
        
            yarn.resourcemanager.resource-tracker.client.thread-count
            50
        
        
            yarn.application.classpath
            $HADOOP_CLIENT_CONF_DIR,$HADOOP_COMMON_HOME/*,$HADOOP_COMMON_HOME/lib/*,$HADOOP_HDFS_HOME/*,$HADOOP_HDFS_HOME/lib/*,$HADOOP_YARN_HOME/*,$HADOOP_YARN_HOME/lib/*
        
        
            yarn.resourcemanager.scheduler.class
            org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler
        
        
            yarn.scheduler.capacity.resource-calculator
            org.apache.hadoop.yarn.util.resource.DefaultResourceCalculator
        
        
            yarn.resourcemanager.max-completed-applications
            10000
        
        
            yarn.nodemanager.pmem-check-enabled
            false
        
        
            yarn.nodemanager.vmem-check-enabled
            false
        
        
            Whether to enable log aggregation
            yarn.log-aggregation-enable
            true
        
        
        yarn.log.server.url
        ${NAME_NODE_SERVICE_NAME}:19888/jobhistory/logs
         
    

  slaves: |-
    localhost

  hive-site.xml: |-
    >
        >
                >javax.jdo.option.ConnectionURL>
                >jdbc:mysql://192.168.0.220:3306/hive?createDatabaseIfNotExist=true>
        >
        >
                >javax.jdo.option.ConnectionDriverName>
                >com.mysql.jdbc.Driver>
        >
        >
                >javax.jdo.option.ConnectionUserName>
                >hive>
        >
        >
                >javax.jdo.option.ConnectionPassword>
                >hive>
        >
        >
                >hive.metastore.warehouse.dir>
                >/hive/warehouse>
        >
        >
                >hive.metastore.schema.verification>
                >false>
        >
    >

简洁版

apiVersion: v1
kind: ConfigMap
metadata:
  name: hadoop-custom-config-cm
  namespace: hadoop
  labels:
    app: hadoop
data:
  bootstrap.sh: |-
    #!/bin/bash
    NAME_NODE_MEMORY=900m
    DATA_NODE_MEMORY=1000m
    RESOURCE_MANAGER_MEMORY=900m
    NODE_MANAGER_MEMORY=900m

    cd /root/bootstrap


    # Don't override slaves、core-site.xml and yarn-site.xml
    if [[ ! -e $HADOOP_CONF_DIR/NameNode ]];then
      rm -f $HADOOP_HOME/etc/hadoop/slaves $HADOOP_HOME/etc/hadoop/core-site.xml $HADOOP_HOME/etc/hadoop/yarn-site.xml $HADOOP_HOME/etc/hadoop/hdfs-site.xml $HADOOP_HOME/etc/hadoop/mapred-site.xml

      # Copy original hadoop file to $HADOOP_CONF_DIR
      cp -a $HADOOP_HOME/etc/hadoop/* $HADOOP_CONF_DIR
    fi
    # Get this node's FQDN

    #FQDN=`ping $HOSTNAME -c 1 | grep PING | awk '{print $2}'`
    FQDN=$HOSTNAME
    
	$HADOOP_HOME/etc/hadoop`
    # If this node is nameNode, set it's FQDN to core-site.xml file and yarn-site.xml file

    if [[ "$NODE_TYPE" =~ "NN" ]]; then
     for cfg in ./*; do
        if [[ ! "$cfg" =~ bootstrap.sh ]]; then
                cat $cfg > $HADOOP_CONF_DIR/${cfg##*/}
        fi
     done
     
     for f in slaves core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml; do
      if [[ -e ${HADOOP_CONF_DIR}/$f ]]; then
        cp -a  ${HADOOP_CONF_DIR}/$f $HADOOP_HOME/etc/hadoop/$f
      else
        echo "ERROR: Could not find $f in $CONFIG_DIR"
        exit 1
      fi
     done
    

     NAME_NODE_FQDN=$FQDN".hadoop-nn-service" 
     sed -i 's/${NAME_NODE_SERVICE_NAME}/'$NAME_NODE_FQDN'/g' `grep '${NAME_NODE_SERVICE_NAME}' -rl $HADOOP_CONF_DIR`
     sed -i 's/${NAME_NODE_SERVICE_NAME}/'$NAME_NODE_FQDN'/g' `grep '${NAME_NODE_SERVICE_NAME}' -rl $HADOOP_HOME/etc/hadoop`     
     if [[ ! -e $HADOOP_CONF_DIR/namenode_memory_set ]];then
       # 修改NameNode启动时JVM参数
       echo "export HADOOP_NAMENODE_OPTS=\"-Xms${NAME_NODE_MEMORY} -Xmx${NAME_NODE_MEMORY}\"" >> $HADOOP_CONF_DIR/hadoop-env.sh
       echo "export HADOOP_NAMENODE_OPTS=\"-Xms${NAME_NODE_MEMORY} -Xmx${NAME_NODE_MEMORY}\"" >> $HADOOP_HOME/etc/hadoop/hadoop-env.sh
       echo 1 >> $HADOOP_CONF_DIR/namenode_memory_set
     fi


      # Set nameNode's FQDN to file
      echo $FQDN > $HADOOP_CONF_DIR/NameNode

      # Format HDFS if not formatted yet
      if [[ ! -e $HADOOP_CONF_DIR/hdfs-namenode-format.out ]]; then
        $HADOOP_HOME/bin/hdfs namenode -format -force -nonInteractive &> $HADOOP_CONF_DIR/hdfs-namenode-format.out
        $HADOOP_HOME/bin/hdfs namenode -format -force -nonInteractive &> $HADOOP_CONF_DIR/hdfs-namenode-format.out
      fi

      if [ ! -f $HADOOP_CONF_DIR/namenode_formated ]; then
        # Only format if necessary
        $HADOOP_HOME/bin/hdfs namenode -format -force -nonInteractive && echo 1 > $HADOOP_CONF_DIR/namenode_formated
      fi

      # Start hadoop nameNode daemon
      $HADOOP_HOME/sbin/hadoop-daemon.sh start namenode

    fi


    # If this node is dataNode, add it to slave

    if [[ "$NODE_TYPE" =~ "DN" ]]; then
      #sed -i '/localhost/d' $HADOOP_CONF_DIR/workers
      #sed -i '/'$FQDN'/d' $HADOOP_CONF_DIR/workers
      #echo $FQDN >> $HADOOP_CONF_DIR/workers

      # Waiting nameNode set NAME_NODE_FQDN
      while [[ ! -e $HADOOP_CONF_DIR/NameNode || -z $NAME_NODE_FQDN ]]; do
        echo "Waiting for nameNode set NAME_NODE_FQDN" && sleep 2 && NAME_NODE_FQDN=`cat $HADOOP_CONF_DIR/NameNode`
      done

      sed -i '/localhost/d' $HADOOP_CONF_DIR/slaves
      sed -i '/'$FQDN'/d' $HADOOP_CONF_DIR/slaves
      echo $FQDN >> $HADOOP_CONF_DIR/slaves
     

      NAME_NODE_HOSTNAME=`cat $HADOOP_CONF_DIR/NameNode`
      NAME_NODE_FQDN=$NAME_NODE_HOSTNAME".hadoop-nn-service"

      sed -i 's/${NAME_NODE_SERVICE_NAME}/'${NAME_NODE_FQDN}'/g' $HADOOP_CONF_DIR/core-site.xml
      sed -i 's/${HOST_NAME}/'${FQDN}'/g' $HADOOP_CONF_DIR/hdfs-site.xml
      
      if [[ ! -e $HADOOP_CONF_DIR/datanode_memory_set ]];then 
        # 修改DataNode启动时JVM参数
        echo "export HADOOP_DATANODE_OPTS=\"-Xms${DATA_NODE_MEMORY} -Xmx${DATA_NODE_MEMORY}\"" >> $HADOOP_CONF_DIR/hadoop-env.sh
        echo "export HADOOP_DATANODE_OPTS=\"-Xms${DATA_NODE_MEMORY} -Xmx${DATA_NODE_MEMORY}\"" >> $HADOOP_HOME/etc/hadoop/hadoop-env.sh      
        echo 1 >> $HADOOP_CONF_DIR/datanode_memory_set
      fi


      # Start hadoop dataNode daemon
      while [[ -z `curl  http://$NAME_NODE_FQDN:8020` ]]; do
        echo "Waiting for $NAME_NODE_FQDN" && sleep 2
      done
      $HADOOP_HOME/sbin/hadoop-daemon.sh start datanode
    fi


    if [[ "$NODE_TYPE" =~ "HIVE" ]]; then
      while [[ ! -e $HADOOP_CONF_DIR/NameNode || -z $NAME_NODE_FQDN ]]; do
        echo "Waiting for nameNode set NAME_NODE_FQDN" && sleep 2 && NAME_NODE_FQDN=`cat $HADOOP_CONF_DIR/NameNode`
      done

      for cfg in ./*; do
        if [[ "$cfg" =~ hive-site.xml ]]; then
                cat $cfg > $HADOOP_CONF_DIR/${cfg##*/}
        fi
      done

      cp -a $HADOOP_CONF_DIR/hive-site.xml $HIVE_HOME/conf/
      
      # hive 
      if [ ! -f $HADOOP_CONF_DIR/hive_init_schema ]; then
        #hive  init schema 
        $HIVE_HOME/bin/schematool -dbType mysql -initSchema && echo 1 > $HADOOP_CONF_DIR/hive_init_schema
      fi
      cd $HIVE_HOME/bin
      nohup hive --service hiveserver2 >> /etc/hadoop/hive-hiveserver2.log 2>&1 &
      nohup hive --service metastore  >> /etc/hadoop/hive-metastore.log 2>&1 &
    fi


    # keep running

    sleep infinity
  hdfs-site.xml: |-
    <?xml version="1.0" encoding="UTF-8"?>
    <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
    <!--
      Licensed under the Apache License, Version 2.0 (the "License");
      you may not use this file except in compliance with the License.
      You may obtain a copy of the License at

        http://www.apache.org/licenses/LICENSE-2.0

      Unless required by applicable law or agreed to in writing, software
      distributed under the License is distributed on an "AS IS" BASIS,
      WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
      See the License for the specific language governing permissions and
      limitations under the License. See accompanying LICENSE file.
    -->

    <!-- Put site-specific property overrides in this file. -->

    >
      >
        >dfs.name.dir>
        >/dfs/nn>
      >
      >
        >dfs.data.dir>
        >/dfs/dn/data/>
      >
      >
        >dfs.replication>
        >3>
      >
      >
        >dfs.namenode.datanode.registration.ip-hostname-check>                   
        >false>
      >
      >
        >dfs.datanode.use.datanode.hostname>
        >true>
      >

    >
  core-site.xml: |-
    <?xml version="1.0" encoding="UTF-8"?>
    <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
    <!--
      Licensed under the Apache License, Version 2.0 (the "License");
      you may not use this file except in compliance with the License.
      You may obtain a copy of the License at

        http://www.apache.org/licenses/LICENSE-2.0

      Unless required by applicable law or agreed to in writing, software
      distributed under the License is distributed on an "AS IS" BASIS,
      WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
      See the License for the specific language governing permissions and
      limitations under the License. See accompanying LICENSE file.
    -->

    <!-- Put site-specific property overrides in this file. -->

    >
      >
        >fs.defaultFS>
        >hdfs://${NAME_NODE_SERVICE_NAME}:8020>
      >
      >
        >hadoop.tmp.dir>
        >/var/hadoop>
      >
      >
        >hadoop.proxyuser.root.hosts>
        >*
      >
      >
        >hadoop.proxyuser.root.groups>
        >*
      >
    >

  slaves: |-
    localhost

  hive-site.xml: |-
    >
        >
                >javax.jdo.option.ConnectionURL>
                >jdbc:mysql://192.168.0.220:3306/hive?createDatabaseIfNotExist=true>
        >
        >
                >javax.jdo.option.ConnectionDriverName>
                >com.mysql.jdbc.Driver>
        >
        >
                >javax.jdo.option.ConnectionUserName>
                >hive>
        >
        >
                >javax.jdo.option.ConnectionPassword>
                >hive>
        >
        >
                >hive.metastore.warehouse.dir>
                >/hive/warehouse>
        >
        >
                >hive.metastore.schema.verification>
                >false>
        >
    >

hive

apiVersion: apps/v1
kind: StatefulSet
metadata:
  name: hive
  namespace: hadoop
spec:
  replicas: 1
  revisionHistoryLimit: 10
  selector:
    matchLabels:
      app: hive
  serviceName: hive-service
  template:
    metadata:
      labels:
        app: hive
    spec:
      containers:
        - name: hive
          image: registry.cn-hangzhou.aliyuncs.com/dockerxiahu/hadoop:2.7.2
          command: 
            - "/bin/bash"
            - "/root/bootstrap/bootstrap.sh"
            - "-d"
          env:
            - name: HADOOP_CONF_DIR
              value: /etc/hadoop
            - name: NODE_TYPE
              value: HIVE
          volumeMounts:
            - name: hadoop-config-volume
              mountPath: /etc/hadoop
            - name: hadoop-custom-config-volume
              mountPath: /root/bootstrap
      volumes:
        - name: hadoop-config-volume
          persistentVolumeClaim:
            claimName: hadoop-config-nfs-pvc
        - name: hadoop-custom-config-volume
          configMap:
            name: hadoop-custom-config-cm

---
apiVersion: v1
kind: Service
metadata:
  name: hive-service
  namespace: hadoop
  labels:
    app: hive
spec:
  ports:
    - nodePort: 10000 
      port: 10000
      targetPort: 10000
      name: hiveserver2
    - nodePort: 9083
      port: 9083
      targetPort: 9083
      name: metastore
    - nodePort: 10002
      port: 10002
      targetPort: 10002
      name: hiveweb
  selector:
    app: hive
  type: NodePort

5、启动

将上面的7个文件合成一个文件：start.yaml

# 创建命名空间
[root@master hadoop-config]# kubectl create namespace hadoop

[root@master hadoop-config]# kubectl apply -f start.yaml

[root@master hadoop-config]# kubectl get -n hadoop pod,svc,deployment,configmap,pv
NAME                    READY   STATUS    RESTARTS   AGE   IP               NODE           NOMINATED NODE   READINESS GATES
pod/hadoop-dn-node1-0   1/1     Running   0          49m   100.96.251.229   nfs-server     <none>           <none>
pod/hadoop-nn-0         1/1     Running   0          49m   100.124.32.186   k8s-master01   <none>           <none>
pod/hive-0              1/1     Running   0          45m   100.84.122.170   k8s-master02   <none>           <none>

NAME                        TYPE       CLUSTER-IP   EXTERNAL-IP   PORT(S)                                         AGE   SELECTOR
service/hadoop-nn-service   NodePort   10.96.2.17   <none>        50070:50070/TCP,8020:8020/TCP                   49m   app=hadoop-nn
service/hive-service        NodePort   10.96.1.64   <none>        10000:10000/TCP,9083:9083/TCP,10002:10002/TCP   45m   app=hive

6、验证

datanode

http://192.168.119.129:50070/

hive

http://192.168.119.130:10002

你可能感兴趣的:(Kubernetes,hadoop,hive,kubernetes)

nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
react-intl——react国际化使用方案苹果酱0567 面试题汇总与解析 java 开发语言中间件 spring boot 后端
国际化介绍i18n：internationalization国家化简称，首字母+首尾字母间隔的字母个数+尾字母，类似的还有k8s(Kubernetes)React-intl是React中最受欢迎的库。使用步骤安装#usenpmnpminstallreact-intl-D#useyarn项目入口文件配置//index.tsximportReactfrom"react";importReactDOMf
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
Kubernetes数据持久化看清所苡看轻 kubernetes(k8s)emptyDir HostPath pv pvc kubernetes
在k8s中，Volume（数据卷）存在明确的生命周期（与包含该数据卷的容器组（pod）相同）。因此Volume的生命周期比同一容器组（pod）中任意容器的生命周期要更长，不管容器重启了多少次，数据都被保留下来。当然，如果pod不存在了，数据卷自然退出了。此时，根据pod所使用的数据卷类型不同，数据可能随着数据卷的退出而删除，也可能被真正持久化，并在下次容器组重启时仍然可以使用。从根本上来说，一个数
Kubernetes部署MySQL数据持久化沫殇-MS Kubernetes MySQL数据库 kubernetes mysql 容器
一、安装配置NFS服务端1、安装nfs-kernel-server：sudoapt-yinstallnfs-kernel-server2、服务端创建共享目录#列出所有可用块设备的信息lsblk#格式化磁盘sudomkfs-text4/dev/sdb#创建一个目录：sudomkdir-p/data/nfs/mysql#更改目录权限：sudochown-Rnobody:nogroup/data/nfs
Hadoop 傲雪凌霜，松柏长青后端大数据 hadoop 大数据分布式
ApacheHadoop是一个开源的分布式计算框架，主要用于处理海量数据集。它具有高度的可扩展性、容错性和高效的分布式存储与计算能力。Hadoop核心由四个主要模块组成，分别是HDFS（分布式文件系统）、MapReduce（分布式计算框架）、YARN（资源管理）和HadoopCommon（公共工具和库）。1.HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生
Kubernetes的3种数据持久化方式 Seal^_^ 【云原生】容器化与编排技术持续集成 #Kubernetes kubernetes 容器云原生 EmptyDir 面试 HostPath
Kubernetes的3种数据持久化方式1.EmptyDir2.HostPath3.PersistentVolume(PV)TheBegin点点关注，收藏不迷路Kubernetes提供了几种数据持久化方式，以满足不同场景的需求：1.EmptyDir用途：临时数据存储，Pod内容器间共享。特点：生命周期与Pod相同，Pod删除时数据也删除。2.HostPath用途：访问宿主机特定文件或目录。特点：增
【Kubernetes】常见面试题汇总（十一） summer.335 Kubernetes kubernetes 容器云原生
目录33.简述Kubernetes外部如何访问集群内的服务？34.简述Kubernetesingress？35.简述Kubernetes镜像的下载策略？33.简述Kubernetes外部如何访问集群内的服务？（1）对于Kubernetes，集群外的客户端默认情况，无法通过Pod的IP地址或者Service的虚拟IP地址：虚拟端口号进行访问。（2）通常可以通过以下方式进行访问Kubernetes集群
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
k8s中Service暴露的种类以及用法听说唐僧不吃肉 K8S kubernetes 容器云原生
一、说明在Kubernetes中，有几种不同的方式可以将服务（Service）暴露给外部流量。这些方式通过定义服务的spec.type字段来确定。二、详解1.ClusterIP定义：默认类型，服务只能在集群内部访问。作用：通过集群内部IP地址暴露服务。示例：spec:type:ClusterIPports:-port:80targetPo
Kubernetes 自定义控制器开发 IT回忆录 Kubenetes kubernetes
目录前言一、CRD二、创建数据库表（Mysql）二、控制器开发1.使用kubernetes的examplecontroller模板2.在controller.go中新增数据表监听方法3.修改tools工具生成资源对象结构体定义这里记录开发k8s控制器的一般方式，controller开发主要使用k8s提供的client-go库进行。前言Controller监听集群内部资源对象的变化，编辑资源对象(增
用kubedam搭建的k8s证书过期处理方法我滴鬼鬼呀wks k8s 1024程序员节
kubeadm部署的k8s证书过期1、查看证书过期时间kubeadmalphacertscheck-expiration若证书已经过期无法试用kubectl命令建议修改服务器时间到未过期的时间段2、配置kube-controller-manager.yaml文件cat/etc/kubernetes/manifests/kube-controller-manager.yamlapiVersion:v
k8s证书过期问题处理 olina_qin kubernetes 容器云原生
k8s证书过期问题处理opensslx509-in/etc/kubernetes/pki/apiserver.crt-noout-dateskubeadmcertsrenewallsystemctlrestartkubeleopensslx509-in/etc/kubernetes/pki/apiserver.crt-noout-text|grep"NotAfter"cp/etc/kubernet
Kubernetes Ingress 控制器（Nginx）安装与使用教程农优影
KubernetesIngress控制器（Nginx）安装与使用教程kubernetes-ingressNGINXandNGINXPlusIngressControllersforKubernetes项目地址:https://gitcode.com/gh_mirrors/ku/kubernetes-ingress1.项目目录结构及介绍在nginxinc/kubernetes-ingress仓库中，
【K8s】专题十一：Kubernetes 集群证书过期处理方法行者Sun1989 Kubernetes kubernetes 云原生容器
本文内容均来自个人笔记并重新梳理，如有错误欢迎指正！如果对您有帮助，烦请点赞、关注、转发、订阅专栏！专栏订阅入口Linux专栏|Docker专栏|Kubernetes专栏往期精彩文章【Docker】（全网首发）KylinV10下MySQL容器内存占用异常的解决方法【Docker】（全网首发）KylinV10下MySQL容器内存占用异常的解决方法（续）【Docker】MySQL源码构建Docker镜
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
Docker学习十一：Kubernetes概述爱打羽球的程序猿 Docker学习系列 docker kubernetes 学习
一、Kubernetes简介2006年，Google提出了云计算的概念，当时的云计算领域还是以虚拟机为代表的云平台。2013年，Docker横空出世，Docker提出了镜像、仓库等核心概念，规范了服务的交付标准，使得复杂服务的落地变得更加简单，之后Docker又定义了OCI标准，Docker在容器领域称为事实的标准。但是，Docker诞生只是帮助定义了开发和交付标准，如果想要在生产环境中大批量的使
Cloud Native Weekly | 华为云抢先发布Redis5.0，红帽宣布收购混合云提供商 weixin_34302561 数据库 devops 大数据
1——华为云抢先发布Redis5.02——DigitalOceanK8s服务正式上线3——红帽宣布收购混合云提供商NooBaa4——微软发布多项AzureKubernetes服务更新1华为云抢先发布Redis5.012月17日，华为云在DCS2.0的基础上，快人一步，抢先推出了新的Redis5.0产品，这是一个崭新的突破。目前国内在缓存领域的发展普遍停留在Redis4.0阶段，华为云率先发布了Re
Presto【基础 01】简介+架构+数据源+数据模型 2401_84254343 程序员架构
一个Catalog包含Schema和Connector。例如，配置JMX的Catalog，通过JXMConnector访问JXM信息。当执行一条SQL语句时，可以同时运行在多个Catalog。Presto处理table时，是通过表的完全限定（fully-qualified）名来找到Catalog。例如，一个表的权限定名是hive.test_data.test，则test是表名，test_data是
（k8s）Kubernetes 从0到1容器编排之旅道不贱卖，法不轻传 kubernets kubernetes 容器云原生
一、引言在当今数字化的浪潮中，Kubernetes如同一艘强大的航船，引领着容器化应用的部署与管理。它以其卓越的灵活性、可扩展性和可靠性，成为众多企业和开发者的首选。然而，要真正发挥Kubernetes的强大威力，仅仅掌握基本操作是远远不够的。本文将带你深入探索Kubernetes使用过程中的奇技妙法，为你开启一段优雅的容器编排之旅。二、高级资源管理之精妙艺术1.资源配额与限制：雕琢资源之美•Ku
hbase介绍 CrazyL- 云计算+大数据 hbase
hbase是一个分布式的、多版本的、面向列的开源数据库hbase利用hadoophdfs作为其文件存储系统，提供高可靠性、高性能、列存储、可伸缩、实时读写、适用于非结构化数据存储的数据库系统hbase利用hadoopmapreduce来处理hbase、中的海量数据hbase利用zookeeper作为分布式系统服务特点：数据量大：一个表可以有上亿行，上百万列（列多时，插入变慢）面向列：面向列（族）的
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
【K8S】kubernetes集群架构与组件奇奇怪怪^ 云 Linux IT 运维服务器 linux
文章目录【K8S】kubernetes集群架构与组件kubernetes组件**master组件**node组件整体流程POD终止过程【K8S】kubernetes集群架构与组件kubernetes组件K8S是属于主从设备模型(Master-slave架构)，即有Master节点负责集群的调度、管理和运维，Slave节点是集群中的运算工作负载节点在K8S中，主节点一般被称为Master节点，而从节
K8S学习笔记02——K8S组件沉淅尘 #Docker #K8S kubernetes
Kubernetes组件一、控制平面组件（ControlPlaneComponents）(1)kube-apiserver(2)etcd(3)kube-scheduler(4)kube-controller-manager(5)cloud-controller-manager二、Node组件1.kubelet2.kube-proxy3.容器运行时（ContainerRuntime）三、插件（Add
Kubernetes——组件窒息う Kubernetes kubernetes 容器
文章目录K8S的优势核心架构角色与功能集群图例K8S的优势能管理大量跨主机容器快速部署应用快速扩展应用无缝对接新的应用节省资源，优化硬件资源的使用核心架构master（管理节点）node（计算节点）images（镜像节点）角色与功能Master功能提供集群的控制对集群进行全局决策检测和响应集群事件Master节点核心组件APIServer是整个系统的对外接口，提供客户端和其他组件调用后端元数据存储
Kubernetes组件汉只只网络 docker 大数据分布式 hadoop
Kubernetes核心组件Kubernetes定义了一组构建块，它们可以共同提供部署、维护和扩展应用程序的机制。组成Kubernetes的组件设计为松耦合和可扩展的，这样可以满足多种不同的工作负载。可扩展性在很大程度上由KubernetesAPI提供——它被作为扩展的内部组件以及Kubernetes上运行的容器等使用。Kubernetes主要由以下几个核心组件组成：etcd保存了整个集群的状态；
【Linux 从基础到进阶】Kubernetes 集群搭建与管理爱技术的小伙子 Linux从基础到进阶 linux kubernetes 运维
Kubernetes集群搭建与管理Kubernetes（简称K8s）是一个用于自动化部署、扩展和管理容器化应用程序的开源平台。它提供了容器编排功能，能够管理大量的容器实例，并支持应用的自动扩展、高可用性和自愈能力。本文将详细介绍如何在CentOS和Ubuntu系统上安装和配置Kubernetes集群，并讲解Kubernetes的基本概念和管理操作。1.Kubernetes基础概念在了解如何搭建Ku
Spark集群的三种模式 MelodyYN #Spark spark hadoop big data
文章目录1、Spark的由来1.1Hadoop的发展1.2MapReduce与Spark对比2、Spark内置模块3、Spark运行模式3.1Standalone模式部署配置历史服务器配置高可用运行模式3.2Yarn模式安装部署配置历史服务器运行模式4、WordCount案例1、Spark的由来定义：Hadoop主要解决，海量数据的存储和海量数据的分析计算。Spark是一种基于内存的快速、通用、可
【Kubernetes】常见面试题汇总（十三） summer.335 Kubernetes kubernetes 容器云原生
目录39.简述KubernetesScheduler使用哪两种算法将Pod绑定到worker节点？40.简述Kuberneteskubelet的作用？41.简述Kuberneteskubelet监控Worker节点资源是使用什么组件来实现的？39.简述KubernetesScheduler使用哪两种算法将Pod绑定到worker节点？KubernetesScheduler根据如下两种调度算法将Po
月度总结 | 2022年03月 | 考研与就业的抉择 | 确定未来走大数据开发路线「已注销」个人总结 hadoop
一、时间线梳理3月3日，寻找到同专业的就业伙伴3月5日，着手准备Java八股文，决定先走Java后端路线3月8月，申请到了校图书馆的考研专座，决定暂时放弃就业，先准备考研，买了数学和408的资料书3月9日-3月13日，因疫情原因，宿舍区暂封，这段时间在准备考研，发现内容特别多3月13日-3月19日，大部分时间在刷Hadoop、Zookeeper、Kafka的视频，同时在准备实习的项目3月20日，退
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发