转载自:https://www.qikqiak.com/post/gitlab-ci-docker-layer-cache-for-k8s-executor/
在 Kubernetes 集群中使用 GitLab CI 来实现 CI/CD,在构建镜像的环节我们基本上都是使用的 Docker On Docker 的模式,这是因为 Kubernetes 集群使用的是 Docker 这种容器运行时,所以我们可以将宿主机的 docker.sock 文件挂载到容器中构建镜像,而最近我们在使用 Kubernetes 1.22.X 版本后将容器运行时更改为了 Containerd,这样节点上没有可用的 Docker 服务了,这个时候就需要更改构建镜像的模式了,当然要实现构建镜像的方式有很多,我们这里还是选择使用 Docker 来构建我们的 Docker 镜像,也就是使用 Docker IN Docker 的模式。 在每次构建镜像的时候,GitLab Runner 都会启动一个包含3个容器的 Pod,其中一个就是运行 Docker 守护进程的 Docker DIND 容器,构建的容器会去连接到运行在同一个 Pod 上的 Docker 守护进程,由于 Pod 中的所有容器共享同一个 network namespace,构建镜像的 Docker CLI 能够通过 localhost 直接连接到 Docker 守护进程进行构建。但是这种方式最大的一个问题是每次构建都是启动一个全新的 Docker 守护进程,造成没有缓存 Docker layer 层,这会显著增加我们的构建时间。 这个问题的解决方法非常简单,与其为每个 Pod 运行一个 Docker DIND 服务的 sidecar 容器,不如让我们运行一个独立的 Docker DIND 容器,构建容器的所有 Docker CLI 都连接到这个一个 Docker 守护进程上,这个时候我们将 Docker layer 层进行持久化,也就起到了缓存的作用了。 首先创建一个 PVC 来存储 Docker 的持久化数据,为了性能考虑,这里我们使用的是一个 Local PV: apiVersion: storage.k8s.io/v1 kind: StorageClass metadata: name: local-volume provisioner: kubernetes.io/no-provisioner reclaimPolicy: Delete volumeBindingMode: WaitForFirstConsumer --- apiVersion: v1 kind: PersistentVolume metadata: name: docker-pv spec: capacity: storage: 5Gi accessModes: - ReadWriteOnce persistentVolumeReclaimPolicy: Retain storageClassName: local-volume local: path: /mnt/k8s/docker # 数据存储的目录 nodeAffinity: required: nodeSelectorTerms: - matchExpressions: - key: kubernetes.io/hostname operator: In values: - node1 # 运行在node1节点 --- apiVersion: v1 kind: PersistentVolumeClaim metadata: labels: app: docker-dind name: docker-dind-data namespace: kube-ops spec: accessModes: - ReadWriteOnce storageClassName: local-volume resources: requests: storage: 5Gi 然后使用 Deployment 部署一个 Docker DIND 服务: apiVersion: apps/v1 kind: Deployment metadata: name: docker-dind namespace: kube-ops labels: app: docker-dind spec: selector: matchLabels: app: docker-dind template: metadata: labels: app: docker-dind spec: containers: - image: docker:dind name: docker-dind args: - --registry-mirror=https://ot2k4d59.mirror.aliyuncs.com/ # 指定一个镜像加速器地址 env: - name: DOCKER_DRIVER value: overlay2 - name: DOCKER_HOST value: tcp://0.0.0.0:2375 - name: DOCKER_TLS_CERTDIR # 禁用 TLS value: "" volumeMounts: - name: docker-dind-data-vol # 持久化docker根目录 mountPath: /var/lib/docker/ ports: - name: daemon-port containerPort: 2375 securityContext: privileged: true # 需要设置成特权模式 volumes: - name: docker-dind-data-vol persistentVolumeClaim: claimName: docker-dind-data 然后创建一个 Service 以方便构建的 Docker CLI 与其连接: apiVersion: v1 kind: Service metadata: name: docker-dind namespace: kube-ops labels: app: docker-dind spec: ports: - port: 2375 targetPort: 2375 selector: app: docker-dind 将 Docker DIND 服务部署完成后,我们就可以在 Gitlab CI 中使用这个守护程序来构建镜像了,如下所示: tages: - image build_image: stage: image image: docker:latest variables: DOCKER_HOST: tcp://docker-dind:2375 # 通过 service dns 形式连接 docker dind 服务 script: - docker info - docker build -t xxxx . - docker push xxxx only: - tags 由于我们缓存了 Docker layer 层,这个时候构建的速度会明显提升。最后随着镜像的大量构建会产生很多镜像数据,我们可以写一个 Cronjob 用来定时清除缓存: apiVersion: batch/v1 kind: CronJob metadata: name: docker-dind-clear-cache namespace: kube-ops spec: schedule: 0 0 * * 0 # 每周清理一次 jobTemplate: metadata: labels: app: docker-dind name: docker-dind-clear-cache spec: template: spec: restartPolicy: OnFailure containers: - name: clear-cache image: docker:latest command: - docker - system - prune - -af env: - name: DOCKER_HOST value: tcp://docker-dind:2375