错误1.阿里云机器重启后登陆不上服务器,描述:当时在服务器上已挂载磁盘,安装了docker/docker-compose/nginx/jdk/gitlab/harbor/nexus等软件,然后就重启了机器;但是后面怎么也登不上去服务器,使用阿里云页面上的workbench和SecureCRT都登陆不上去,最后使用阿里云页面上的另外一种方式VNC登陆上去了;(workbench相当于crt的终端 中止后,命令行的命令会终止,vnc相当于服务器本身 关掉终端,没有影响)
在VNC上看到挂载磁盘重启没有生效,查看之前的挂载命令;
#echo “UUID=4a444b42-bd06-41dd-8bb0-f2f63b727e86 /data xfs defaults 0 0”>>/etc/fstab
改成
# echo "/dev/sdc1 /data xfs defaults 0 0">>/etc/fstab
,重启机器,使用SecureCRT成功登录上服务器。
错误2.harbor小的镜像可以推上去,大的一直在不断的失败再重新推,描述:当然安装apollo发现镜像一直都推不到harbor上,镜像一直都是在重复推,就是不成功。
使用服务器已有的小的镜像,发现推上去了,修改harbor.yml里面oss的地址为内网地址,发现推上去了;后面部署微服务的时候发现拉不下来harbor的镜像,最后发现,没有打开8443的端口,打开后,发现拉取成功。
3.安装rabbitmq只起来了一个pod,描述:使用脚本安装rabbitmq,页面显示正常,但只起了一个pod,
发现storageclass没起作用,发现storageclass的脚本可能不支持了,参考https://help.aliyun.com/document_detail/144398.html,修改storageclass的部署文件,重新部署:
apiVersion: storage.k8s.io/v1
kind: StorageClass
metadata:
name: alicloud-nas
mountOptions:
- nolock,tcp,noresvport
- vers=3
parameters:
volumeAs: subpath
server: "---------------------------------------------"
provisioner: nasplugin.csi.alibabacloud.com
reclaimPolicy: Retain
,然后重新安装rabbitmq发现安装成功。
4.jenkins安装报错,查看日志,发现
mount.nfs: requested NFS version or transport protocol is not supported
查看jenkins的pv/pvc的yaml文件,与上述一样,脚本不支持,修改pv:
apiVersion: v1
kind: PersistentVolume
metadata:
name: jenkins-home
labels:
release: jenkins-home
spec:
# workspace 大小为50G
capacity:
storage: 50Gi
accessModes:
- ReadWriteMany
persistentVolumeReclaimPolicy: Retain
storageClassName: alicloud-nas
csi:
driver: nasplugin.csi.alibabacloud.com
volumeHandle: jenkins-home
volumeAttributes:
server: "--------------------------------------"
path: "/jenkins_home"
mountOptions:
- nolock,tcp,noresvport
- vers=3
重新安装jenkins,发现安装成功;
5.服务running,但是注册不上consul.
pod启动后,runing状态,但是没有注册上consul,查看服务的日志,发现redis有问题,在apollo上查看redis的配置发现没有问题,最后发现redis未打开白名单,然后打开了redis的白名单,发现服务成功注册
6.后端服务接口404
微服务都成功起来后,发现后端服务接口404,使用服务的域名服务也是404,
进入pod中,curl服务的域名发现有内容,最后确认和路由转发有关系,进入阿里云控制台查看路由,发现域名绑定后端的服务绑定错误,没有绑定zuul到服务,绑定了service的服务
解决:修改绑定的服务为zuul网关服务。