Dev-L

Docker学习笔记（二）——Docker底层技术

1. 基础知识：Linux namespace 的概念

Linux 内核从版本 2.4.19 开始陆续引入了 namespace 的概念。其目的是将某个特定的全局系统资源（global system resource）通过抽象方法使得namespace 中的进程看起来拥有它们自己的隔离的全局系统资源实例（The purpose of each namespace is to wrap a particular global system resource in an abstraction that makes it appear to the processes within the namespace that they have their own isolated instance of the global resource. ）。Linux 内核中实现了六种 namespace，按照引入的先后顺序，列表如下：

namespace	引入的相关内核版本	被隔离的全局系统资源	在容器语境下的隔离效果
Mount namespaces	Linux 2.4.19	文件系统挂接点	每个容器能看到不同的文件系统层次结构
UTS namespaces	Linux 2.6.19	nodename 和 domainname	每个容器可以有自己的 hostname 和 domainame
IPC namespaces	Linux 2.6.19	特定的进程间通信资源，包括System V IPC 和 POSIX message queues	每个容器有其自己的 System V IPC 和 POSIX 消息队列文件系统，因此，只有在同一个 IPC namespace 的进程之间才能互相通信
PID namespaces	Linux 2.6.24	进程 ID 数字空间（process ID number space）	每个 PID namespace 中的进程可以有其独立的 PID；每个容器可以有其 PID 为 1 的root 进程；也使得容器可以在不同的 host 之间迁移，因为 namespace 中的进程 ID 和 host 无关了。这也使得容器中的每个进程有两个PID：容器中的 PID 和 host 上的 PID。
Network namespaces	始于Linux 2.6.24 完成于 Linux 2.6.29	网络相关的系统资源	每个容器用有其独立的网络设备，IP 地址，IP 路由表，/proc/net 目录，端口号等等。这也使得一个 host 上多个容器内的同一个应用都绑定到各自容器的 80 端口上。
User namespaces	始于 Linux 2.6.23 完成于 Linux 3.8)	用户和组 ID 空间	在 user namespace 中的进程的用户和组 ID 可以和在 host 上不同；每个 container 可以有不同的 user 和 group id；一个 host 上的非特权用户可以成为 user namespace 中的特权用户；

Linux namespace 的概念说简单也简单说复杂也复杂。简单来说，我们只要知道，处于某个 namespace 中的进程，能看到独立的它自己的隔离的某些特定系统资源；复杂来说，可以去看看 Linux 内核中实现 namespace 的原理，网络上也有大量的文档供参考，这里不再赘述。

2. Docker 容器使用 linux namespace 做运行环境隔离

当 Docker 创建一个容器时，它会创建新的以上六种 namespace 的实例，然后把容器中的所有进程放到这些 namespace 之中，使得Docker 容器中的进程只能看到隔离的系统资源。

2.1 PID namespace

我们能看到同一个进程，在容器内外的 PID 是不同的：

在容器内 PID 是 1，PPID 是 0。
在容器外 PID 是 2198， PPID 是 2179 即 docker-containerd-shim 进程.
pid namespace 通过将 host 上 PID 映射为容器内的 PID，使得容器内的进程看起来有个独立的 PID 空间。

2.2 UTS namespace

类似地，容器可以有自己的 hostname 和 domainname：

root@onfocus:/home/lee# hostname
onfocus
root@devstack:/home/lee# docker exec -it web hostname
8b7dd09fbcae

2.3 user namespace

2.3.1 Linux 内核中的 user namespace

老版本中，Linux 内核里面只有一个数据结构负责处理用户和组。内核从3.8 版本开始实现了 user namespace。通过在 clone() 系统调用中使用 CLONE_NEWUSER 标志，一个单独的 user namespace 就会被创建出来。在新的 user namespace 中，有一个虚拟的用户和用户组的集合。这些用户和用户组，从 uid/gid 0 开始，被映射到该 namespace 之外的非 root 用户。

在现在的linux内核中，管理员可以创建成千上万的用户。这些用户可以被映射到每个 user namespace 中。通过使用 user namespace 功能，不同的容器可以有完全不同的 uid 和 gid 数字。容器 A 中的 User 500 可能被映射到容器外的 User 1500，而容器 B 中的 user 500 可能被映射到容器外的用户 2500.

为什么需要这么做呢？因为在容器中，提供 root 访问权限有其特殊用途。想象一下，容器 A 中的 root 用户（uid 0）被映射到宿主机上的 uid 1000，容器B 中的 root 被映射到 uid 2000.类似网络端口映射，这允许管理员在容器中创建 root 用户，而不需要在宿主机上创建。

2.3.2 Docker 对 user namespace 的支持

在 Docker 1.10 版本之前，Docker 是不支持 user namespace。也就是说，默认地，容器内的进程的运行用户就是 host 上的 root 用户，这样的话，当 host 上的文件或者目录作为 volume 被映射到容器以后，容器内的进程其实是有 root 的几乎所有权限去修改这些 host 上的目录的，这会有很大的安全问题。

举例：

启动一个容器： docker run -d -v /bin:/host/bin --name web34 training/webapp python app.py
此时进程的用户在容器内和外都是root，它在容器内可以对 host 上的 /bin 目录做任意修改

而 Docker 1.10 中引入的 user namespace 就可以让容器有一个 “假”的 root 用户，它在容器内是 root，它被映射到容器外一个非 root 用户。也就是说，user namespace 实现了 host users 和 container users 之间的映射。

启用步骤：

修改 /etc/default/docker 文件，添加行 DOCKER_OPTS="--userns-remap=default"
重启 docker 服务，此时 dockerd 进程为 /usr/bin/dockerd --userns-remap=default --raw-logs
然后创建一个容器：docker run -d -v /bin:/host/bin --name web35 training/webapp python app.py
查看进程在容器内外的用户：

root@onfocus:/home/lee# ps -ef | grep python
231072    1726  1686  0 01:44 ?        00:00:00 python app.py

root@onfocus:/home/lee# docker exec web35 ps -ef
UID        PID  PPID  C STIME TTY          TIME CMD
root         1     0  0 17:44 ?        00:00:00 python app.py

查看文件/etc/subuid 和 /etc/subgid，可以看到 dockermap 用户在host 上的 uid 和 gid 都是 231072：

root@onfocus:/home/lee# cat /etc/subuid
lee:100000:65536
stack:165536:65536
dockremap:231072:65536

root@onfocus:/home/lee# cat /etc/subgid
lee:100000:65536
stack:165536:65536
dockremap:231072:65536

再看文件/proc/1726/uid_map，它表示了容器内外用户的映射关系，即将host 上的 231072 用户映射为容器内的 0 （即root）用户。

root@onfocus:/home/lee# cat /proc/1726/uid_map
         0     231072      65536

现在，我们试图在容器内修改 host 上的 /bin 文件夹，就会提示权限不足了：

root@80993d821f7b:/host/bin# touch test2
touch: cannot touch 'test2': Permission denied

这说明通过使用 user namespace，使得容器内的进程运行在非 root 用户，我们就成功地限制了容器内进程的权限。

正是/proc//uid_map 和 /proc//gid_map 这两个文件，把容器中的uid和真实系统的uid给映射在一起。这两个文件的格式为：

ID-inside-ns ID-outside-ns length

其中：

第一个字段ID-inside-ns表示在容器显示的UID或GID，
第二个字段ID-outside-ns表示容器外映射的真实的UID或GID。
第三个字段表示映射的范围，一般填1，表示一一对应。

举个例子, 0 1000 256这条配置就表示父user namespace中的1000~1256映射到新user namespace中的0~256。

比如，把真实的uid=1000映射成容器内的uid=0：

把namespace内部从0开始的uid映射到外部从0开始的uid，其最大范围是无符号32位整形：

上面的截图中正是后面这种情形，也就是容器中的 uid 和宿主机上的 uid 是从0开始一一对应着映射的。

备注：linux user namespace 非常复杂，应该是所有 namespace 中最复杂的一个。这里只是一个简单介绍，还进一步理解，还需要阅读更多材料，比如https://lwn.net/Articles/532593/

2.4 network namespace

默认情况下，当 docker 实例被创建出来后，使用 ip netns 命令无法看到容器实例对应的 network namespace。这是因为 ip netns 命令是从 /var/run/netns 文件夹中读取内容的。

步骤：

1. 找到容器的主进程 ID

root@onfocus:/home/lee# docker inspect --format '{{.State.Pid}}' web5
2704

2. 创建 /var/run/netns 目录以及符号连接

root@onfocus:/home/lee# mkdir /var/run/netns
root@onfocus:/home/lee# ln -s /proc/2704/ns/net /var/run/netns/web5

3. 此时可以使用 ip netns 命令了

root@onfocus:/home/lee# ip netns
web5
root@onfocus:/home/lee# ip netns exec web5 ip addr
1: lo:  mtu 65536 qdisc noqueue state UNKNOWN group default
  link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
  inet 127.0.0.1/8 scope host lo
  valid_lft forever preferred_lft forever
  inet6 ::1/128 scope host
  valid_lft forever preferred_lft forever
15: eth0:  mtu 1500 qdisc noqueue state UP group default
  link/ether 02:42:ac:11:00:03 brd ff:ff:ff:ff:ff:ff
  inet 172.17.0.3/16 scope global eth0
  valid_lft forever preferred_lft forever
  inet6 fe80::42:acff:fe11:3/64 scope link
  valid_lft forever preferred_lft forever

其他的几个 namespace，比如 network，mnt 等，比较简单，这里就不多说了。总之，Docker 守护进程为每个容器都创建了六种namespace 的实例，使得容器中的进程都处于一种隔离的运行环境之中：

root@devstack:/proc/1726/ns# ls -l
total 0
lrwxrwxrwx 1 231072 231072 0 Sep 18 01:45 ipc -> ipc:[4026532210]
lrwxrwxrwx 1 231072 231072 0 Sep 18 01:45 mnt -> mnt:[4026532208]
lrwxrwxrwx 1 231072 231072 0 Sep 18 01:44 net -> net:[4026532213]
lrwxrwxrwx 1 231072 231072 0 Sep 18 01:45 pid -> pid:[4026532211]
lrwxrwxrwx 1 231072 231072 0 Sep 18 01:45 user -> user:[4026532207]
lrwxrwxrwx 1 231072 231072 0 Sep 18 01:45 uts -> uts:[4026532209]

3. Docker run 命令中 namespace 中相关参数

Docker run 命令有几个参数和 namespace 相关：

--ipc string IPC namespace to use
--pid string PID namespace to use
--userns string User namespace to use
--uts string UTS namespace to use

3.1 --userns

--userns：指定容器使用的 user namespace

'host': 使用 Docker host user namespace
'': 使用由 `--userns-remap‘ 指定的 Docker deamon user namespace

你可以在启用了 user namespace 的情况下，强制某个容器运行在 host user namespace 之中：

root@onfocus:/proc/2835# docker run -d -v /bin:/host/bin --name web37 --userns host training/webapp python app.py
9c61e9a233abef7badefa364b683123742420c58d7a06520f14b26a547a9476c
root@onfocus:/proc/2835# ps -ef | grep python
root      2962  2930  1 02:17 ?        00:00:00 python app.py

否则默认的话，就会运行在特定的 user namespace 之中了。

3.2 --pid

同样的，可以指定容器使用 Docker host pid namespace，这样，在容器中的进程，可以看到 host 上的所有进程。注意此时不能启用 user namespace。

3.3 --uts

同样地，可以使容器使用 Docker host uts namespace。此时，最明显的是，容器的 hostname 和 Docker hostname 是相同的。

扩展阅读：

http://lwn.net/Articles/531114/
Docker基础技术：Linux Namespace（上）
Docker基础技术：Linux Namespace（下）
https://github.com/crosbymichael/dockercon-2016/blob/master/Creating%20Containerd.pdf
https://events.linuxfoundation.org/sites/events/files/slides/User%20Namespaces%20-%20ContainerCon%202015%20-%2016-9-final_0.pdf
https://blog.yadutaf.fr/2016/04/14/docker-for-your-users-introducing-user-namespace/
https://success.docker.com/Datacenter/Apply/Introduction_to_User_Namespaces_in_Docker_Engine
https://segmentfault.com/a/1190000006913195
https://www.cnblogs.com/sammyliu/p/5878973.html

上前面讲到 Docker 容器使用 linux namespace 来隔离其运行环境，使得容器中的进程看起来就像爱一个独立环境中运行一样。但是，光有运行环境隔离还不够，因为这些进程还是可以不受限制地使用系统资源，比如网络、磁盘、CPU以及内存等。关于其目的，一方面，是为了防止它占用了太多的资源而影响到其它进程；另一方面，在系统资源耗尽的时候，linux 内核会触发 OOM，这会让一些被杀掉的进程成了无辜的替死鬼。因此，为了让容器中的进程更加可控，Docker 使用 Linux cgroups 来限制容器中的进程允许使用的系统资源。

4. 基础知识：Linux control groups

4.1 概念

Linux Cgroup 可让您为系统中所运行任务（进程）的用户定义组群分配资源 — 比如 CPU 时间、系统内存、网络带宽或者这些资源的组合。您可以监控您配置的 cgroup，拒绝 cgroup 访问某些资源，甚至在运行的系统中动态配置您的 cgroup。所以，可以将 controll groups 理解为 controller （system resource）（for）（process）groups，也就是是说它以一组进程为目标进行系统资源分配和控制。

它主要提供了如下功能：

Resource limitation: 限制资源使用，比如内存使用上限以及文件系统的缓存限制。
Prioritization: 优先级控制，比如：CPU利用和磁盘IO吞吐。
Accounting: 一些审计或一些统计，主要目的是为了计费。
Control: 挂起进程，恢复执行进程。

使用 cgroup，系统管理员可更具体地控制对系统资源的分配、优先顺序、拒绝、管理和监控。可更好地根据任务和用户分配硬件资源，提高总体效率。

在实践中，系统管理员一般会利用CGroup做下面这些事（有点像为某个虚拟机分配资源似的）：

隔离一个进程集合（比如：nginx的所有进程），并限制他们所消费的资源，比如绑定CPU的核。
为这组进程分配其足够使用的内存
为这组进程分配相应的网络带宽和磁盘存储限制
限制访问某些设备（通过设置设备的白名单）

查看 linux 内核中是否启用了 cgroup：

我们看到 /sys/fs/cgroup 目录中有若干个子目录，我们可以认为这些都是受 cgroups 控制的资源以及这些资源的信息。

blkio — 这个子系统为块设备设定输入/输出限制，比如物理设备（磁盘，固态硬盘，USB 等等）。
cpu — 这个子系统使用调度程序提供对 CPU 的 cgroup 任务访问。
cpuacct — 这个子系统自动生成 cgroup 中任务所使用的 CPU 报告。
cpuset — 这个子系统为 cgroup 中的任务分配独立 CPU（在多核系统）和内存节点。
devices — 这个子系统可允许或者拒绝 cgroup 中的任务访问设备。
freezer — 这个子系统挂起或者恢复 cgroup 中的任务。
memory — 这个子系统设定 cgroup 中任务使用的内存限制，并自动生成内存资源使用报告。
net_cls — 这个子系统使用等级识别符（classid）标记网络数据包，可允许 Linux 流量控制程序（tc）识别从具体 cgroup 中生成的数据包。
net_prio — 这个子系统用来设计网络流量的优先级
hugetlb — 这个子系统主要针对于HugeTLB系统进行限制，这是一个大页文件系统。

4.2 实验

4.2.1 通过 cgroups 限制进程的 CPU

写一段最简单的 C 程序：

int main(void)
{
    int i = 0;
    for(;;) i++;
    return 0;
}

编译，运行，发现它占用的 CPU 几乎到了 100%：

top - 22:43:02 up  1:14,  3 users,  load average: 0.24, 0.06, 0.06  PID USER      PR  NI    VIRT    RES    SHR S %CPU %MEM     TIME+ COMMAND
 2304 root      20   0    4188    356    276 R 99.6  0.0   0:11.77 hello

接下来我们做如下操作：

root@onfocus:/home/lee/c# mkdir /sys/fs/cgroup/cpu/hello
root@onfocus:/home/lee/c# cd /sys/fs/cgroup/cpu/hello
root@onfocus:/sys/fs/cgroup/cpu/hello# ls
cgroup.clone_children  cgroup.procs       cpu.cfs_quota_us  cpu.stat           tasks
cgroup.event_control   cpu.cfs_period_us  cpu.shares        notify_on_release
root@onfocus:/sys/fs/cgroup/cpu/hello# cat cpu.cfs_quota_us
-1
root@onfocus:/sys/fs/cgroup/cpu/hello# echo 20000 > cpu.cfs_quota_us
root@onfocus:/sys/fs/cgroup/cpu/hello# cat cpu.cfs_quota_us
20000
root@onfocus:/sys/fs/cgroup/cpu/hello# echo 2428 > tasks

然后再来看看这个进程的 CPU 占用情况：

 PID USER      PR  NI    VIRT    RES    SHR S %CPU %MEM     TIME+ COMMAND
 2428 root      20   0    4188    356    276 R 19.9  0.0   0:46.03 hello

它占用的 CPU 几乎就是 20%，也就是我们预设的阈值。这说明我们通过上面的步骤，成功地将这个进程运行所占用的 CPU 资源限制在某个阈值之内了。

如果此时再启动另一个 hello 进程并将其 id 加入 tasks 文件，则两个进程会共享设定的 CPU 限制：

  PID USER      PR  NI    VIRT    RES    SHR S %CPU %MEM     TIME+ COMMAND
 2428 root      20   0    4188    356    276 R 10.0  0.0 285:39.54 hello
12526 root      20   0    4188    356    276 R 10.0  0.0   0:25.09 hello

4.2.2 通过 cgroups 限制进程的 Memory

同样地，我们针对它占用的内存做如下操作：

root@onfocus:/sys/fs/cgroup/memory# mkdir hello
root@onfocus:/sys/fs/cgroup/memory# cd hello/
root@onfocus:/sys/fs/cgroup/memory/hello# cat memory.limit_in_bytes
18446744073709551615
root@onfocus:/sys/fs/cgroup/memory/hello# echo 64k > memory.limit_in_bytes
root@onfocus:/sys/fs/cgroup/memory/hello# echo 2428 > tasks
root@onfocus:/sys/fs/cgroup/memory/hello#

上面的步骤会把进程 2428 所占用的内存阈值设置为 64K。超过的话，它会被杀掉。

4.2.3 限制进程的 I/O

运行命令：

sudo dd if=/dev/sda1 of=/dev/null

通过 iotop 命令看 IO （此时磁盘在快速转动），此时其写速度为 242M/s：

 TID  PRIO  USER     DISK READ  DISK WRITE  SWAPIN     IO>    COMMAND
 2555 be/4 root      242.60 M/s    0.00 B/s  0.00 % 61.66 % dd if=/dev/sda1 of=/dev/null

接着做下面的操作：

root@onfocus:/home/lee# mkdir /sys/fs/cgroup/blkio/io
root@onfocus:/home/lee# cd /sys/fs/cgroup/blkio/io
root@onfocus:/sys/fs/cgroup/blkio/io# ls -l /dev/sda1
brw-rw---- 1 root disk 8, 1 Sep 18 21:46 /dev/sda1
root@onfocus:/sys/fs/cgroup/blkio/io# echo '8:0 1048576'  > /sys/fs/cgroup/blkio/io/blkio.throttle.read_bps_device
root@onfocus:/sys/fs/cgroup/blkio/io# echo 2725 > /sys/fs/cgroup/blkio/io/tasks

结果，这个进程的IO 速度就被限制在 1Mb/s 之内了：

 TID  PRIO  USER     DISK READ  DISK WRITE  SWAPIN     IO>    COMMAND
 2555 be/4 root      990.44 K/s    0.00 B/s  0.00 % 96.29 % dd if=/dev/sda1 of=/dev/null

4.3 术语

cgroups 的术语包括：

任务（Tasks）：就是系统的一个进程。
控制组（Control Group）：一组按照某种标准划分的进程，比如官方文档中的Professor和Student，或是WWW和System之类的，其表示了某进程组。Cgroups中的资源控制都是以控制组为单位实现。一个进程可以加入到某个控制组。而资源的限制是定义在这个组上，就像上面示例中我用的 hello 一样。简单点说，cgroup的呈现就是一个目录带一系列的可配置文件。
层级（Hierarchy）：控制组可以组织成hierarchical的形式，既一颗控制组的树（目录结构）。控制组树上的子节点继承父结点的属性。简单点说，hierarchy就是在一个或多个子系统上的cgroups目录树。
子系统（Subsystem）：一个子系统就是一个资源控制器，比如CPU子系统就是控制CPU时间分配的一个控制器。子系统必须附加到一个层级上才能起作用，一个子系统附加到某个层级以后，这个层级上的所有控制族群都受到这个子系统的控制。Cgroup的子系统可以有很多，也在不断增加中。

4.4 Docker run 命令中 cgroups 相关命令

block IO:
      --blkio-weight value          Block IO (relative weight), between 10 and 1000
      --blkio-weight-device value   Block IO weight (relative device weight) (default [])
      --cgroup-parent string        Optional parent cgroup for the container
CPU:
      --cpu-percent int             CPU percent (Windows only)
      --cpu-period int              Limit CPU CFS (Completely Fair Scheduler) period
      --cpu-quota int               Limit CPU CFS (Completely Fair Scheduler) quota
  -c, --cpu-shares int              CPU shares (relative weight)
      --cpuset-cpus string          CPUs in which to allow execution (0-3, 0,1)
      --cpuset-mems string          MEMs in which to allow execution (0-3, 0,1)
Device:    
      --device value                Add a host device to the container (default [])
      --device-read-bps value       Limit read rate (bytes per second) from a device (default [])
      --device-read-iops value      Limit read rate (IO per second) from a device (default [])
      --device-write-bps value      Limit write rate (bytes per second) to a device (default [])
      --device-write-iops value     Limit write rate (IO per second) to a device (default [])
Memory:      
      --kernel-memory string        Kernel memory limit
  -m, --memory string               Memory limit
      --memory-reservation string   Memory soft limit
      --memory-swap string          Swap limit equal to memory plus swap: '-1' to enable unlimited swap
      --memory-swappiness int       Tune container memory swappiness (0 to 100) (default -1)

扩展阅读：

Docker基础技术：Linux CGroup
http://blog.csdn.net/qinyushuang/article/details/46611709
http://www.funtoo.org/Traffic_Control
https://docs.docker.com/engine/admin/resource_constraints/

5. AUFS基础知识

5.1 Linux 的 rootfs 和 bootfs

一个典型的 Linux 系统要能运行的话，它至少需要两个文件系统：

boot file system （bootfs）：包含 boot loader 和 kernel。用户不会修改这个文件系统。实际上，在启动（boot）过程完成后，整个内核都会被加载进内存，此时 bootfs 会被卸载掉从而释放出所占用的内存。同时也可以看出，对于同样内核版本的不同的 Linux 发行版的 bootfs 都是一致的。
root file system （rootfs）：包含典型的目录结构，包括 /dev, /proc, /bin, /etc, /lib, /usr, and /tmp 等再加上要运行用户应用所需要的所有配置文件，二进制文件和库文件。这个文件系统在不同的Linux 发行版中是不同的。而且用户可以对这个文件进行修改。

Linux 系统在启动时，roofs 首先会被挂载为只读模式，然后在启动完成后被修改为读写模式，随后它们就可以被修改了。

5.2 AUFS

AUFS 是一种 Union File System（联合文件系统），又叫 Another UnionFS，后来叫Alternative UnionFS，再后来叫成高大上的 Advance UnionFS。所谓 UnionFS，就是把不同物理位置的目录合并mount到同一个目录中。UnionFS的一个最主要的应用是，把一张CD/DVD和一个硬盘目录给联合 mount在一起，然后，你就可以对这个只读的CD/DVD上的文件进行修改（当然，修改的文件存于硬盘上的目录里）。

举个例子，假设在 Ubuntu 系统上现有如下目录结构：

tree
.
├── fruits
│   ├── apple
│   └── tomato
└── vegetables
    ├── carrots
    └── tomato

# 创建一个mount目录
$ mkdir mnt
 
# 把水果目录和蔬菜目录union mount到 ./mnt目录中
$ sudo mount -t aufs -o dirs=./fruits:./vegetables none ./mnt
 
#  查看./mnt目录
$ tree ./mnt
./mnt
├── apple
├── carrots
└── tomato

我们可以看到在./mnt目录下有三个文件，苹果apple、胡萝卜carrots和蕃茄tomato。水果和蔬菜的目录被union到了./mnt目录下了。

我们来修改一下其中的文件内容：

$ echo mnt > ./mnt/apple
$ cat ./mnt/apple
mnt
$ cat ./fruits/apple
mnt

上面的示例，我们可以看到./mnt/apple的内容改了，./fruits/apple的内容也改了。

$ echo mnt_carrots > ./mnt/carrots
$ cat ./vegetables/carrots
 
$ cat ./fruits/carrots
mnt_carrots

关于 AUFS 的几个特点：

AUFS 是一种联合文件系统，它把若干目录按照顺序和权限 mount 为一个目录并呈现出来
默认情况下，只有第一层（第一个目录）是可写的，其余层是只读的。
增加文件：默认情况下，新增的文件都会被放在最上面的可写层中。
删除文件：因为底下各层都是只读的，当需要删除这些层中的文件时，AUFS 使用 whiteout 机制，它的实现是通过在上层的可写的目录下建立对应的whiteout隐藏文件来实现的。
修改文件：AUFS 利用其 CoW （copy-on-write）特性来修改只读层中的文件。AUFS 工作在文件层面，因此，只要有对只读层中的文件做修改，不管修改数据的量的多少，在第一次修改时，文件都会被拷贝到可写层然后再被修改。
节省空间：AUFS 的 CoW 特性能够允许在多个容器之间共享分层，从而减少物理空间占用。
查找文件：AUFS 的查找性能在层数非常多时会出现下降，层数越多，查找性能越低，因此，在制作 Docker 镜像时要注意层数不要太多。
性能：AUFS 的 CoW 特性在写入大型文件时第一次会出现延迟。

详情请转至Docker基础技术：AUFS

6. OverlayFS介绍

　　OverlayFS是一种堆叠文件系统，它依赖并建立在其它的文件系统之上（例如ext4fs和xfs等等），并不直接参与磁盘空间结构的划分，仅仅将原来底层文件系统中不同的目录进行“合并”，然后向用户呈现，这也就是联合挂载技术，对比于AUFS，OverlayFS速度更快，实现更简单。而Linux 内核为Docker提供的OverlayFS驱动有两种：overlay和overlay2。而overlay2是相对于overlay的一种改进，在inode利用率方面比overlay更有效。但是overlay有环境需求：docker版本17.06.02+，宿主机文件系统需要是ext4或xfs格式。

联合挂载

　　 overlayfs通过三个目录：lower目录、upper目录、以及work目录实现，其中lower目录可以是多个，work目录为工作基础目录，挂载后内容会被清空，且在使用过程中其内容用户不可见，最后联合挂载完成给用户呈现的统一视图称为为merged目录。以下使用mount将演示其如何工作的。

使用mount命令挂载overlayfs语法如下：

mount -t overlay overlay -o lowerdir=lower1:lower2:lower3,upperdir=upper,workdir=work merged_dir

创建三个目录A、B、C,以及worker目录：

然后使用mount联合挂载到/tmp/test 下：

然后我们再去查看/tmp/test目录，你会发现目录A、B、C被合并到了一起,并且相同文件名的文件会进行“覆盖”，这里覆盖并不是真正的覆盖，而是当合并时候目录中两个文件名称都相同时，merged层目录会显示离它最近层的文件：

同时我们还可以通过mount命令查看其挂载的选项：

以上这样的方式也就是联合挂载技术。

8. Docker中的overlay驱动

　　介绍了overlay驱动原理以后再来看Docker中的overlay存储驱动，以下是来自docker官网关于overlay的工作原理图：

在上述图中可以看到三个层结构，即：lowerdir、uperdir、merged，其中lowerdir是只读的image layer，其实就是rootfs，对比我们上述演示的目录A和B，我们知道image layer可以分很多层，所以对应的lowerdir是可以有多个目录。而upperdir则是在lowerdir之上的一层，这层是读写层，在启动一个容器时候会进行创建，所有的对容器数据更改都发生在这里层，对比示例中的C。最后merged目录是容器的挂载点，也就是给用户暴露的统一视角，对比示例中的/tmp/test。而这些目录层都保存在了/var/lib/docker/overlay2/或者/var/lib/docker/overlay/(如果使用overlay)。

演示

启动一个容器

查看其overlay挂载点,可以发现其挂载的merged目录、lowerdir、upperdir以及workdir：

overlay2的lowerdir可以有多个，并且是软连接方式挂载，后续我们会进行说明。

如何工作

当容器中发生数据修改时候overlayfs存储驱动又是如何进行工作的？以下将阐述其读写过程：

读：

如果文件在容器层（upperdir），直接读取文件；
如果文件不在容器层（upperdir），则从镜像层（lowerdir）读取；

修改：

首次写入：如果在upperdir中不存在，overlay和overlay2执行copy_up操作，把文件从lowdir拷贝到upperdir，由于overlayfs是文件级别的（即使文件只有很少的一点修改，也会产生的copy_up的行为），后续对同一文件的在此写入操作将对已经复制到容器的文件的副本进行操作。这也就是常常说的写时复制（copy-on-write）
删除文件和目录：当文件在容器被删除时，在容器层（upperdir）创建whiteout文件，镜像层(lowerdir)的文件是不会被删除的，因为他们是只读的，但without文件会阻止他们显示，当目录在容器内被删除时，在容器层（upperdir）一个不透明的目录，这个和上面whiteout原理一样，阻止用户继续访问，即便镜像层仍然存在。

注意事项

copy_up操作只发生在文件首次写入，以后都是只修改副本,
overlayfs只适用两层目录，,相比于比AUFS，查找搜索都更快。
容器层的文件删除只是一个“障眼法”，是靠whiteout文件将其遮挡,image层并没有删除，这也就是为什么使用docker commit 提交保存的镜像会越来越大，无论在容器层怎么删除数据，image层都不会改变。

overlay2镜像存储结构

从仓库pull一个ubuntu镜像，结果显示总共拉取了4层镜像如下：

此时4层被存储在了/var/lib/docker/overlay2/目录下：

这里面多了一个l目录包含了所有层的软连接，短链接使用短名称，避免mount时候参数达到页面大小限制（演示中mount命令查看时候的短目录）：

处于底层的镜像目录包含了一个diff和一个link文件，diff目录存放了当前层的镜像内容，而link文件则是与之对应的短名称：

在这之上的镜像还多了work目录和lower文件，lower文件用于记录父层的短名称，work目录用于联合挂载指定的工作目录。而这些目录和镜像的关系是怎么组织在的一起呢？答案是通过元数据关联。元数据分为image元数据和layer元数据。

image元数据

　　镜像元数据存储在了/var/lib/docker/image//imagedb/content/sha256/目录下，名称是以镜像ID命名的文件，镜像ID可通过docker images查看，这些文件以json的形式保存了该镜像的rootfs信息、镜像创建时间、构建历史信息、所用容器、包括启动的Entrypoint和CMD等等。例如ubuntu镜像的id为47b19964fb50:

查看其对应的元数据(使用vim :%!python -m json.tool格式化成json) 截取了其rootfs的构成：

上面的 diff_id 对应的的是一个镜像层，其排列也是有顺序的，从上到下依次表示镜像层的最低层到最顶层：

diff_id如何关联进行层？具体说来，docker 利用 rootfs 中的每个diff_id 和历史信息计算出与之对应的内容寻址的索引(chainID) ，而chaiID则关联了layer层，进而关联到每一个镜像层的镜像文件。

layer元数据

　　layer 对应镜像层的概念，在 docker 1.10 版本以前，镜像通过一个 graph 结构管理，每一个镜像层都拥有元数据，记录了该层的构建信息以及父镜像层 ID，而最上面的镜像层会多记录一些信息作为整个镜像的元数据。graph 则根据镜像 ID(即最上层的镜像层 ID) 和每个镜像层记录的父镜像层 ID 维护了一个树状的镜像层结构。

　　在 docker 1.10 版本后，镜像元数据管理巨大的改变之一就是简化了镜像层的元数据，镜像层只包含一个具体的镜像层文件包。用户在 docker 宿主机上下载了某个镜像层之后，docker 会在宿主机上基于镜像层文件包和 image 元数据构建本地的 layer 元数据，包括 diff、parent、size 等。而当 docker 将在宿主机上产生的新的镜像层上传到 registry 时，与新镜像层相关的宿主机上的元数据也不会与镜像层一块打包上传。

　　Docker 中定义了 Layer 和 RWLayer 两种接口，分别用来定义只读层和可读写层的一些操作，又定义了 roLayer 和 mountedLayer，分别实现了上述两种接口。其中，roLayer 用于描述不可改变的镜像层，mountedLayer 用于描述可读写的容器层。具体来说，roLayer 存储的内容主要有索引该镜像层的 chainID、该镜像层的校验码 diffID、父镜像层 parent、storage_driver 存储当前镜像层文件的 cacheID、该镜像层的 size 等内容。这些元数据被保存在 /var/lib/docker/image//layerdb/sha256// 文件夹下。如下：

每个chainID目录下会存在三个文件cache-id、diff、zize：

cache-id文件：

docker随机生成的uuid，内容是保存镜像层的目录索引，也就是/var/lib/docker/overlay2/中的目录，这就是为什么通过chainID能找到对应的layer目录。以chainID为d801a12f6af7beff367268f99607376584d8b2da656dcd8656973b7ad9779ab4 对应的目录为 130ea10d6f0ebfafc8ca260992c8d0bef63a1b5ca3a7d51a5cd1b1031d23efd5,也就保存在/var/lib/docker/overlay2/130ea10d6f0ebfafc8ca260992c8d0bef63a1b5ca3a7d51a5cd1b1031d23efd5

diff文件：

保存了镜像元数据中的diff_id（与元数据中的diff_ids中的uuid对应）

size文件：

保存了镜像层的大小

在 layer 的所有属性中，diffID 采用 SHA256 算法，基于镜像层文件包的内容计算得到。而 chainID 是基于内容存储的索引，它是根据当前层与所有祖先镜像层 diffID 计算出来的，具体算如下：

如果该镜像层是最底层(没有父镜像层)，该层的 diffID 便是 chainID。
该镜像层的 chainID 计算公式为 chainID(n)=SHA256(chain(n-1) diffID(n))，也就是根据父镜像层的 chainID 加上一个空格和当前层的 diffID，再计算 SHA256 校验码。

mountedLayer 信息存储的可读init层以及容器挂载点信息包括：容器 init 层ID（init-id）、联合挂载使用的ID（mount-id）以及容器层的父层镜像的 chainID(parent)。相关文件位于/var/lib/docker/image//layerdb/mounts// 目录下。

如下启动一个id为3c96960b3127的容器:

查看其对应的mountedLayer三个文件：

可以看到initID是在mountID后加了一个-init，同时initID就是存储在/var/lib/docker/overlay2/的目录名称：

查看mountID还可以直接通过mount命令查看对应挂载的mountID，对应着/var/lib/docker/overlay2/目录，这也是overlayfs呈现的merged目录:

在容器中创建了一文件：

此时到宿主的merged目录就能看到对应的文件：

关于init层

　　init层是以一个uuid+-init结尾表示，夹在只读层和读写层之间，作用是专门存放/etc/hosts、/etc/resolv.conf等信息，需要这一层的原因是当容器启动时候，这些本该属于image层的文件或目录，比如hostname，用户需要修改，但是image层又不允许修改，所以启动时候通过单独挂载一层init层，通过修改init层中的文件达到修改这些文件目的。而这些修改往往只读当前容器生效，而在docker commit提交为镜像时候，并不会将init层提交。该层文件存放的目录为/var/lib/docker/overlay2//diff

通过以上的内容介绍，一个容器完整的层应由三个部分组成，如下图：

镜像层：也称为rootfs，提供容器启动的文件系统
init层：用于修改容器中一些文件如/etc/hostname、/etc/resolv.conf等
容器层：使用联合挂载统一给用户提供的可读写目录。

以overlayfs作为存储驱动的的镜像存储原理其中每层的镜像数据保存在/var/lib/docker/overlay2//diff目录下，init层数据保存了在 /var/lib/docker/overlay2//diff目录下，最后统一视图（容器层）数据在 /var/lib/docker/overlay2//diff目录下，docker通过image元数据和layer元数据利用内容寻址（chainID）将这些目录组织起来构成容器所运行的文件系统。

参考：

《use overlayfs driver 》

《Docker 镜像之存储管理》

https://www.cnblogs.com/wdliu/p/10483252.html

你可能感兴趣的:(docker)

docker简介-学习与参考码农汉子 docker 容器运维
dockerDocker是一个开源的应用容器引擎，基于Go语言并遵从Apache2.0协议开源。Docker可以让开发者打包他们的应用以及依赖包到一个轻量级、可移植的容器中，然后发布到任何流行的Linux机器上，也可以实现虚拟化。容器是完全使用沙箱机制，相互之间不会有任何接口（类似iPhone的app）,更重要的是容器性能开销极低。Docker从17.03版本之后分为CE（CommunityEdi
cyber-docker填坑过程 whuzhang16 Apollo linux
ros改cyber，搭环境和运行时的一些填坑记录，对公司之外的同学可能没什么用处。一、在cyber-docker中执行catkin_make时：先安装pip2，再用pip2安装catkin_pkg安装catkin，sudoapt-getinstallcatkin看下默认python是哪个，执行/usr/bin/python，如果是python3，则解链接sudounlink/usr/bin/pyt
【大白学Docker】一文做到Docker基础知识整理爱折腾的黄馒头 Linux操作系统虚拟化技术 docker 容器
Docker基础知识整理单注：整理Docker基础的概念、原理、常用命令和常见问题和解决方法，作为备忘，也方便广大学生学习参考。一、什么是DockerDocker是一种开源的容器化平台，允许开发者将应用程序及其所有依赖项打包到一个标准化的单元中，称为容器。这个容器可以在任何支持Docker的环境中运行，提供了一种轻量级、可移植、自给自足的解决方案。小结一下：一次配置，处处运行，开箱即用！二、为什么
docker拉取乌班图并且ssh连接 cxyhl docker ssh 容器
拉取dockerpullubuntu:22.04进入容器首先，确保你的容器在运行状态。如果容器已经启动，可以使用dockerexec进入容器。假设容器名称是my_ubuntu_container，可以使用以下命令：dockerexec-itmy_ubuntu_containerbash更新包列表apt-getupdate安装OpenSSH服务器apt-getinstall-yopenssh-ser
docker-compose安装anythingLLM 非ban必选 deepseek docker java 容器
1、anythingLLM的docker-compose文件version:'3.8'services:anythingllm:image:mintplexlabs/anythingllm:latestcontainer_name:anythingllmports:-"23001:3001"cap_add:-SYS_ADMINenvironment:#Adjustforyourenvironmen
在 Ubuntu 系统 22.04 上安装 Docker ac.char Ubuntu docker ubuntu docker eureka
在Ubuntu系统22.04上安装Docker在Ubuntu系统22.04上安装Docker1.更新系统包2.安装依赖工具3.添加Docker官方GPG密钥4.添加Docker的APT仓库5.安装DockerEngine6.启动并设置Docker服务7.验证安装8.配置非Root用户权限（可选）9.配置镜像加速器（可选，推荐国内用户）10.检查Docker版本卸载Docker常见问题在Ubuntu
docker部署stable-diffusion-webui 特制蛋炒饭 docker stable diffusion 容器
大模型弄好了，想着玩玩stable-diffusion-webui，结果折腾了几天无果，最后使用大佬的docker镜像弄好了。Ubuntu20.4docker运行stablediffusionwebui_siutin/stable-diffusion-webui-docker-CSDN博客以下作为备忘：配置nvidia-docker2仓库：curl-s-Lhttps://nvidia.github
Linux之系统之配置HAProxy负载均衡服务器江湖有缘 Linux技术学习服务器 linux 负载均衡
Linux之系统之配置HAProxy负载均衡服务器前言一、HAProxy介绍1.1HAProxy简介1.2主要特点1.3使用场景二、本次实践介绍2.1本次实践简介2.2本次实践环境规划三、部署两台web服务器3.1运行两个Docker容器3.2编辑测试文件3.3访问测试四、安装HAProxy4.1更新系统软件源4.2安装HAProxy4.3验证安装五、配置HAProxy5.2备份默认配置文件5.2
Docker 学习（一）酥暮沐 docker 容器运维
一、Docker核心概念Docker是一个开源的容器化平台，允许开发者将应用及其所有依赖（代码、运行时、系统工具、库等）打包成一个轻量级、可移植的“容器”，实现“一次构建，随处运行”。1、容器（Container）轻量级、可执行的软件包，包含应用及其所有依赖（代码、运行时、系统工具、库等）。基于镜像运行，独立于宿主机操作系统，共享宿主内核。2、镜像（Image）只读模板，用于创建容器。由多层文件系
【实战 ES】实战 Elasticsearch：快速上手与深度实践-1.3.1单节点安装（Docker与手动部署）言析数智实战 elasticsearch docker 大数据
点击关注不迷路点击关注不迷路点击关注不迷路文章大纲10分钟快速部署`Elasticsearch`单节点环境1.系统环境要求1.1硬件配置推荐1.2软件依赖2.`Docker`部署方案2.1部署流程2.2参数说明2.3性能优化建议3.手动部署方案3.1安装步骤3.2核心配置项3.3启动服务4.部署方式对比5.验证安装结果5.1基础健康检查5.2性能测试6.常见问题排查6.1启动失败问题6.2性能优化
IoT安全软件：CyberX二次开发_CyberX二次开发入门 chenlz2007 物联网物联网安全网络协议网络 java
CyberX二次开发入门1.环境搭建1.1安装CyberX开发环境在开始CyberX二次开发之前，首先需要搭建一个合适的开发环境。CyberX支持多种开发语言和平台，但为了简化开发流程，建议使用Python和Docker。以下是一些基本步骤：1.1.1安装Python确保您的系统中已经安装了Python3.7以上版本。您可以使用以下命令检查Python版本：python--version如果未安装
3.8 Docker最新入门教程-Docker入门-使用 Docker Compose eyes-star docker docker 容器运维
3.8使用DockerComposeDockerCompose是一种旨在帮助定义和共享多容器应用程序的工具。使用Compose，我们可以创建一个YAML文件来定义服务，并使用一个命令，可以启动所有内容或将其全部拆除。使用Compose的一大优势是您可以在文件中定义您的应用程序堆栈，将其保存在项目存储库的根目录中（它现在是版本控制的），并且可以轻松地让其他人为您的项目做出贡献。有人只需要克隆您的存储
anolis-8.9通过docker导入WSL yolo_guo docker
1.起因之前一直使用VMware的方式安装虚拟机，但是其实只是用来充当编译服务而已。vmware虚拟机造成了大量的磁盘空间浪费。docker容器化的方式，可以轻量化的运行，存储空间需求少、分发部署。WSL+vscode可以在本机windows上就可以建立linux开发环境，代码编辑，编译、版本管理集成度高。环境：版本Windows11家庭中文版版本号23H2安装日期‎2023/‎7/‎19操作系统
如何修改已有容器的端口号九月 linux docker linux
如何修改已有容器的端口号问题：工作中很多人会遇到容器打开的时候报错，端口号被占用的情况，那这个端口号该怎么修改，去哪里修改想法：docker在创建容器的时候，会自动生成容易的配置文件，所以可以采取这个方式找到并修改容器的端口号思路：关服务，找配置文件改端口号，开服务，检查是否修改成功1-关闭服务systemctlstopdocker[root@localhost~]#systemctlstopdo
知识分享之Golang——Bleve中的Token filters各种标记过滤器 caihuayuan4 面试题汇总与解析 spring sql java 大数据课程设计
知识分享之Golang——Bleve中的Tokenfilters各种标记过滤器背景知识分享之Golang篇是我在日常使用Golang时学习到的各种各样的知识的记录，将其整理出来以文章的形式分享给大家，来进行共同学习。欢迎大家进行持续关注。知识分享系列目前包含Java、Golang、Linux、Docker等等。开发环境系统：windows10语言：Golang组件库：Blevegolang版本：1
Zookeeper - Docker安装，单机安装，单机三节点安装瑾析编程 zookeeper3.5.5 docker 一台服务器三个节点
该博客所有的文章都是自己的学习记录，方便后续复习，达到快速回顾知识点的作用。文章目录这篇文章主要记录Zookeeper的3.5.5版本下载，安装，启动。Docker-单机启动Linux(CentOS7.7)-单机启动Linux(CentOS7.7)-一台机器三节点启动Docker-单机启动下载dockerpullzookeeper:3.5.5注意事项image的版本对docker的版本也是有要求的
保姆级教程手把手教你如何快速部署一个属于你自己的微信AI机器人-支持群聊阿木木AEcru Docker容器化部署系列微信人工智能机器人
‍个人主页：阿木木AEcru(更多精彩内容可进入主页观看)系列专栏：《Docker容器化部署系列》《Java每日面筋》每一次技术突破，都是对自我能力的挑战和超越。目录一、前言二、部署方式选择三、申请讯飞星火大模型（免费）四、Docker部署机器人4.1获取部署文件4.2修改部署文件4.3启动脚本4.4绑定作为机器人的微信4.5测试五、结尾一、前言自从AI火了之后，相信大家也在不断的关注AI，从20
Ubuntu Docker 安装 Mr_One_Zhang 学习Docker ubuntu docker linux
DockerEngine-Community支持以下的Ubuntu版本：Xenial16.04(LTS)Bionic18.04(LTS)Cosmic18.10Disco19.04其他更新的版本……DockerEngine-Community支持上x86_64（或amd64）armhf，arm64，s390x（IBMZ），和ppc64le（IBM的Power）架构。使用官方安装脚本自动安装安装命令如
DeepSeek架构革命：动态异构计算伏羲栈人工智能架构
博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于分
模块一：Docker基础入门（一） GODLIKENESS Docker docker 容器深度学习运维
Docker革命：为什么容器化是云时代的基石？被依赖地狱折磨的开发者们“在我机器上是好的啊！”——这句开发者的经典辩解，背后暴露的是环境差异带来的致命问题。想象这样的场景：运维人员部署Python应用时发现，测试环境的requests2.25.1在生产环境变成了requests3.0.0团队新人花一整天配置RubyonRails环境，却因macOS与Linux的文件系统差异导致bundleinst
在 MacBook 上设置 DeepSeek R1 (8B) 的 3 个步骤知识大胖 NVIDIA GPU和大语言模型开发教程 deepseek ollama openwebui
简介DeepSeek最近发布了R1模型，该模型在本地AI推理方面表现出色。如果您希望在MacBook上运行它，Ollama提供了一种无缝的方式来下载和管理模型。此外，使用Docker，您可以设置WebUI以方便地与其交互。本指南将引导您逐步完成启动和运行所有操作的过程。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《
【随笔笔记】将mysql数据迁移到群晖NAS QTEASY量化交易随笔笔记笔记 mysql 数据库
将mysql数据迁移到群晖NAS情况和问题前提条件方法1，使用管道方式传递数据方法2，导出数据为文件，复制到NAS上再导入情况和问题原本大量的金融数据保存在电脑本地硬盘的mysql数据库中，随着数据量越来越大，电脑的硬盘吃紧，正好把我的群晖NAS升级到了DS923+并且增加了4T的存储空间，可以使用Docker安装mysql并且存储空间不再是个问题，因此打算将电脑中的数据全部迁移到群晖NAS中。这
在 Windows 上安装 Docker 雄哥007 docker 容器运维 windows
1前言要开始使用Docker，您首先需要在开发计算机上安装它。安装类型取决于您的操作系统。Windows10计算机上的安装与WindowsServer计算机上的安装不同。最低系统要求为进行了周年纪念更新的Windows10专业版或企业版（版本1607）、WindowsServer2016或WindowsServer2019。Docker上的Windows容器可以在两种不同的运行时隔离模式下运行：（
windows环境下，使用docker搭建redis集群一醉千秋 shell docker WebGIS web docker redis 容器
参考：https://blog.csdn.net/weixin_46594796/article/details/137864842https://www.cnblogs.com/niceyoo/p/14118146.html史上最详细Docker搭建RedisCluster集群环境值得收藏每步都有图，不用担心学不会-腾讯云开发者社区-腾讯云一、基础环境描述宿主机：192.168.8.209red
k8s面试题总结（六） a_j58 Kubernetes知识点汇总 kubernetes java 容器
1.说明一下kubernetes和docker的关系Docker的作用容器镜像管理：Docker可以将应用程序及其依赖打包成一个轻量级的、可移植的容器镜像。容器运行时：Docker提供了一个运行时环境，用于在主机上运行容器。Kubernetes的作用kubernetes是一个容器编排平台，主要用于管理大规模的容器化应用程序。Kubernetes和Docker的关系Docker负责容器的底层运行时：
在 Ubuntu20.04 上安装 Docker 并部署 Dify 奕997 ubuntu docker linux
1.安装Docker1.1更新系统软件包列表在终端执行以下命令更新软件包列表：sudoaptupdate1.2安装必要的依赖包为了能够通过HTTPS安装Docker，我们需要先安装一些必备包：sudoaptinstallapt-transport-httpsca-certificatescurlsoftware-properties-common1.3添加Docker官方GPG密钥执行以下命令，将
MinIO上传蹦跑的蜗牛 java
MinIO上传docker搭建minioxml配置文件yml配置文件获取yml配置参数minio配置上传服务类docker搭建minioversion:'3'services:minio:image:minio/minio:RELEASE.2023-04-13T03-08-07Zcontainer_name:minioports:#api端口-"9000:9000"#控制台端口-"9001:900
快速上手 Unstructured：安装、Docker部署及PDF文档解析示例大F的智能小课大模型理论和实战 docker pdf 容器
1.核心概念1.1Unstructured简介Unstructured是一个强大的Python库，专注于从非结构化数据中提取和预处理文本信息，广泛应用于PDF、Word文档、HTML等多种格式的文件处理。其核心功能包括分区、清理、暂存和分块，能够将复杂的非结构化文档转换为结构化输出，为后续的自然语言处理任务提供高质量的数据支持。分区功能：Unstructured能够将原始文档分解为标准的结构化元素
Flask在docker中运行 jackson_hou03 flask docker python
Flask在docker中运行FROMpython:3.11ADD./code/codeWORKDIR/codeRUNpipinstall-rrequirements.txt-ihttps://pypi.tuna.tsinghua.edu.cn/simple/CMD["python","/code/main.py"]dockerbuild-texecutor:1.0.0.
软件测试丨Docker容器网络模式详解霍格沃兹测试开发学社测试人社区 docker 网络容器软件测试测试开发
在Docker中，bridge、host和container是三种常见的网络模式，用于定义容器与主机及其他容器之间的网络通信方式。以下是它们的详细说明：1.Bridge模式Bridge模式是Docker默认的网络模式。在这种模式下，Docker会为每个容器创建一个虚拟网络接口，并将其连接到一个名为docker0的虚拟网桥上。容器通过这个网桥与主机和其他容器通信。特点：隔离性：每个容器都有自己的网络
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。