作者:车漾
前文回顾:
本系列将介绍如何基于 ACK Fluid 支持和优化混合云的数据访问场景,相关文章请参考:
基于 ACK Fluid 的混合云优化数据访问(一):场景与架构
在前文《场景与架构》中,重点介绍 ACK Fluid 支持混合云数据访问适用的不同应用场景和架构实现。在本文中会重点介绍如何通过 ACK Fluid 实现公共云的弹性计算实例访问云下存储系统的能力。
ACK(阿里云容器服务 Kubernetes)即开即用的弹性能力可以很好做自建IDC的弹性能力补充。特别是随着 AIGC 的流行,算力推动创新的理念深入人心,许多原本抵制计算上云的客户也开始在评估公共云。他们通常会选择使用 ECI(弹性计算实例)作为技术验证的第一步。但是,如何将自建存储与云上弹性资源对接,特别是 ECI 资源对接,就成了混合云客户使用阿里云的门槛。比如,用户想快速比较通过云上 ASK 和云下自建机房运行训练任务的成本,传统的做法需要把数据搬到云上,这就会涉及数据隐私问题,还有迁移的时间和金钱成本,无法做快速验证。甚至有些客户短期内无法通过内部安全评审,导致整个创新节奏受到严重的影响。
可以看到许多企业的数据都是存在线下,并且使用的存储类型多样,包括各种开源存储(Ceph,lustrure,JuiceFS,CubeFS)和自建存储。在使用公共云计算资源的时候,也存在挑战:
ACK Fluid 通过提供 ThinRuntime 扩展机制支持将基于 FUSE 实现第三方存储客户端以容器化的方式接入 Kubernetes 中,可以支持阿里云上标准 Kubernetes,边缘 Kubernetes,Serverless Kubernetes 多种形态。
总结:ACK Fluid 为云上计算访问云下数据提供了扩展性好,安全可控,低适配成本和与云平台实现无关的好处,应用案例参见小米 [ 1] 。
以开源 MinIO 为例,展示如何通过 Fluid 将第三方存储接入阿里云弹性计算资源(ECI)。
部署 Minio 存储到 ACK 集群中。
如下 YAML 文件 minio.yaml:
apiVersion: v1
kind: Service
metadata:
name: minio
spec:
type: ClusterIP
ports:
- port: 9000
targetPort: 9000
protocol: TCP
selector:
app: minio
---
apiVersion: apps/v1 # for k8s versions before 1.9.0 use apps/v1beta2 and before 1.8.0 use extensions/v1beta1
kind: Deployment
metadata:
# This name uniquely identifies the Deployment
name: minio
spec:
selector:
matchLabels:
app: minio
strategy:
type: Recreate
template:
metadata:
labels:
# Label is used as selector in the service.
app: minio
spec:
containers:
- name: minio
# Pulls the default Minio image from Docker Hub
image: bitnami/minio
env:
# Minio access key and secret key
- name: MINIO_ROOT_USER
value: "minioadmin"
- name: MINIO_ROOT_PASSWORD
value: "minioadmin"
- name: MINIO_DEFAULT_BUCKETS
value: "my-first-bucket:public"
ports:
- containerPort: 9000
hostPort: 9000
部署上述资源到 ACK 集群:
$ kubectl create -f minio.yaml
部署成功后,ACK 集群内的其他 Pod 即可通过 http://minio:9000的Minio API 端点访问 Minio 存储系统中的数据。上述 YAML 配置中,我们设置 Minio 的用户名与密码均为 minioadmin,并在启动 Minio 存储时默认创建一个名为 my-first-bucket 的存储桶,在接下来的示例中,我们将会访问 my-first-bucket 这个存储桶中的数据。在执行以下步骤前,首先执行以下命令,在 my-first-bucket 中存储示例文件:
$ kubectl exec -it minio-69c555f4cf-np59j -- bash -c "echo fluid-minio-test > testfile"
$ kubectl exec -it minio-69c555f4cf-np59j -- bash -c "mc cp ./testfile local/my-first-bucket/"
$ kubectl exec -it minio-69c555f4cf-np59j -- bash -c "mc cat local/my-first-bucket/testfile"
fluid-minio-test
作为一个 MinIO 存储管理员,接入 Fluid 的工作主要是三个步骤,以下调试过程可以在开源 Kubernetes 中完成:
Fluid 将会把 ThinRuntime 中 FUSE 所需的运行参数、Dataset 中描述数据路径的挂载点等参数传入到 ThinRuntime FUSE Pod 容器中。在容器内部,需要执行参数解析脚本,并将解析完的运行时参数传递给 FUSE 客户端程序,由客户端程序完成 Fuse 文件系统在容器内的挂载。
因此,使用 ThinRuntime CRD 描述存储系统时,需要使用特制的容器镜像,镜像中需要包括以下两个程序:
对于 FUSE 客户端程序,在本示例中选择 S3 协议兼容的 goofys 客户端连接并挂载 minio 存储系统。
对于运行时所需的参数解析脚本,定义如下 python 脚本 fluid-config-parse.py:
import json
with open("/etc/fluid/config.json", "r") as f:
lines = f.readlines()
rawStr = lines[0]
print(rawStr)
script = """
#!/bin/sh
set -ex
export AWS_ACCESS_KEY_ID=`cat $akId`
export AWS_SECRET_ACCESS_KEY=`cat $akSecret`
mkdir -p $targetPath
exec goofys -f --endpoint "$url" "$bucket" $targetPath
"""
obj = json.loads(rawStr)
with open("mount-minio.sh", "w") as f:
f.write("targetPath=\"%s\"\n" % obj['targetPath'])
f.write("url=\"%s\"\n" % obj['mounts'][0]['options']['minio-url'])
if obj['mounts'][0]['mountPoint'].startswith("minio://"):
f.write("bucket=\"%s\"\n" % obj['mounts'][0]['mountPoint'][len("minio://"):])
else:
f.write("bucket=\"%s\"\n" % obj['mounts'][0]['mountPoint'])
f.write("akId=\"%s\"\n" % obj['mounts'][0]['options']['minio-access-key'])
f.write("akSecret=\"%s\"\n" % obj['mounts'][0]['options']['minio-access-secret'])
f.write(script)
上述 python 脚本按以下步骤执行:
⚠️注意: 在 Fluid 中,/etc/fluid/config.json 文件中仅会提供各个加密参数具体值的存储路径,因此需要参数解析脚本额外执行文件读取操作(例如:上述示例中的 “export AWS_ACCESS_KEY_ID=cat $akId
”)。
接着,使用如下 Dockerfile 制作镜像,这里我们直接选择包含 goofys 客户端程序的镜像(i.e. cloudposse/goofys)作为 Dockerfile 的基镜像:
FROM cloudposse/goofys
RUN apk add python3 bash
COPY ./fluid-config-parse.py /fluid-config-parse.py
使用以下命令构建并推送镜像到镜像仓库:
$ IMG_REPO=
$ docker build -t $IMG_REPO/fluid-minio-goofys:demo .
$ docker push $IMG_REPO/fluid-minio-goofys:demo
在创建 Fluid Dataset 和 ThinRuntime 挂载 Minio 存储系统前,首先需要开发 ThinRuntimeProfile CR 资源。ThinRuntimeProfile 是一种 Kubernetes 集群级别的 Fluid CRD 资源,它描述了一类需要与 Fluid 对接的存储系统的基础配置(例如:容器、计算资源描述信息等)。集群管理员需提前在集群中定义若干 ThinRuntimeProfile CR 资源,在这之后,集群用户需要显示声明引用一个 ThinRuntimeProfile CR 来创建 ThinRuntime,从而完成对应存储系统的挂载。
以下为 MinIO 存储系统的 ThinRuntimeProfile CR 示例(profile.yaml):
apiVersion: data.fluid.io/v1alpha1
kind: ThinRuntimeProfile
metadata:
name: minio
spec:
fileSystemType: fuse
fuse:
image: $IMG_REPO/fluid-minio-goofys
imageTag: demo
imagePullPolicy: IfNotPresent
command:
- sh
- -c
- "python3 /fluid-config-parse.py && chmod u+x ./mount-minio.sh && ./mount-minio.sh"
在上述 CR 示例中:
创建 ThinRuntimeProfile CR minio 并且部署到 ACK 集群。
创建访问 minio 所需的凭证 Secret:
$ kubectl create secret generic minio-secret \
--from-literal=minio-access-key=minioadmin \
--from-literal=minio-access-secret=minioadmin
创建 Dataset 和 ThinRuntime CR 的示例(dataset.yaml),目的是生成用户可用的存储数据卷:
apiVersion: data.fluid.io/v1alpha1
kind: Dataset
metadata:
name: minio-demo
spec:
mounts:
- mountPoint: minio://my-first-bucket # minio://
name: minio
options:
minio-url: http://minio:9000 # minio service :
encryptOptions:
- name: minio-access-key
valueFrom:
secretKeyRef:
name: minio-secret
key: minio-access-key
- name: minio-access-secret
valueFrom:
secretKeyRef:
name: minio-secret
key: minio-access-secret
---
apiVersion: data.fluid.io/v1alpha1
kind: ThinRuntime
metadata:
name: minio-demo
spec:
profileName: minio
创建 Dataset 和 ThinRuntime CR:
$ kubectl create -f dataset.yaml
检查 Dataset 状态,一段时间后,可发现 Dataset 和 Phase 状态变为 Bound,Dataset 可正常挂载使用:
$ kubectl get dataset minio-demo
NAME UFS TOTAL SIZE CACHED CACHE CAPACITY CACHED PERCENTAGE PHASE AGE
minio-demo N/A N/A N/A Bound 2m18s
对于最终用户来说,访问 MinIO 的过程是非常简单的。以下为示例 Pod Spec 的 YAML 文件(pod.yaml),用户只需要使用和 Dataset 同名的 PVC:
apiVersion: v1
kind: Pod
metadata:
name: test-minio
labels:
alibabacloud.com/fluid-sidecar-target: eci
alibabacloud.com/eci: "true"
spec:
restartPolicy: Never
containers:
- name: app
image: nginx:latest
command: ["bash"]
args:
- -c
- ls -lh /data && cat /data/testfile && sleep 180
volumeMounts:
- mountPath: /data
name: data-vol
volumes:
- name: data-vol
persistentVolumeClaim:
claimName: minio-demo
创建数据访问Pod:
$ kubectl create -f pod.yaml
查看数据访问 Pod 结果:
$ kubectl logs test-minio -c app
total 512
-rw-r--r-- 1 root root 6 Aug 15 12:32 testfile
fluid-minio-test
可以看到,Pod test-minio 可正常访问 Minio 存储系统中的数据。
$ kubectl delete -f pod.yaml
$ kubectl delete -f dataset.yaml
$ kubectl delete -f profile.yaml
$ kubectl delete -f minio.yaml
⚠️注意
本示例用于展示整个数据接入流程,相关的 MinIO 环境配置仅作为演示目的。相关链接: [1] 小米*****https://www.infoq.cn/article/kco7hi5TcVE08ySwNIw7*
[2] 创建 ACK Pro 版集群
https://help.aliyun.com/zh/ack/ack-managed-and-ack-dedicated/user-guide/create-an-ack-managed-cluster-2#task-skz-qwk-qfb
[3] 安装云原生 AI 套件*****https://help.aliyun.com/zh/ack/cloud-native-ai-suite/user-guide/deploy-the-cloud-native-ai-suite#task-2038811*
[4] 通过部署 ACK 虚拟节点组件创建 ECI Pod
https://help.aliyun.com/zh/ack/ack-managed-and-ack-dedicated/user-guide/deploy-the-virtual-node-controller-and-use-it-to-create-elastic-container-instance-based-pods#task-1443354[5] 通过 kubectl 工具连接集群****
https://help.aliyun.com/zh/ack/ack-managed-and-ack-dedicated/user-guide/obtain-the-kubeconfig-file-of-a-cluster-and-use-kubectl-to-connect-to-the-cluster#task-ubf-lhg-vdb