LWN: Docker 以及 OCI 容器生态！

关注了就能看到更多这么棒的文章哦～

Docker and the OCI container ecosystem

July 26, 2022
This article was contributed by Jordan Webb
DeepL assisted translation
https://lwn.net/Articles/902049/

Docker 已经改变了许多人开发以及部署软件的方式。它不是第一个在 Linux 上实现的容器方案，但 Docker 对于容器应该如何结构化以及管理的想法跟其他先行者很不一样。这些想法现在已经成为行业标准，围绕它们还发展出了一个软件生态系统。Docker 仍然是这个生态系统的主要参与者，但它不再是这个大海中唯一的鲸鱼了，因为 Red Hat 也在容器工具方面做了大量工作，而且现在 Docker 的许多产品都有了其他人实现的替代方案。

Anatomy of a container

容器有点像是一个轻量级的虚拟机；它与跟 host 共享同一个内核，但从在容器里面运行的软件看来，其他大多数内容都是跟 host 的软件无关联的。Linux 内核本身没有容器的概念；实际上是通过使用几个内核功能的组合来创建出来容器的。

bind mount 和 overlayfs，用来构建了容器的根文件系统。
cgroup 可以用来划分 host kernel 的 CPU、内存和 I/O 资源来独立使用。
namespace 用来给容器内运行的进程创建一个独立的系统视图。

Linux 的命名空间（namespace）是一个用来创建容器的关键因素。Linux 支持系统在好几个不同方面的命名空间，包括用于 user ID 和 group ID 的独立的 user namespace、用于不同进程 ID 的 PID namespace、用于不同网络接口组合的 network namespace，以及其他一些命名空间。在容器启动时，有一个运行时（runtime）会为容器创建适当的 cgroup、namespace 和文件系统 mount；然后在它所创建的环境中启动一个进程。

关于这个进程应该是什么，存在着一定程度的分歧。有些人喜欢启动一个像 systemd 这样的初始进程，在容器内运行一个完整的 Linux 系统。这种被称为 "系统容器（system container）"；在 Docker 之前，这是最常见的一类容器。系统容器目前仍然有 LXC 和 OpenVZ 等软件可以支持。

Docker 的开发者有一个不同的想法。Docker 认为，每个容器不应该在容器内运行整个系统，而应该只运行一个应用程序。这种风格的容器被称为 "应用容器（application container）"。应用容器是通过一个容器镜像文件（container image）来启动的，这个 image 里把应用程序本身以及它所依赖的内容捆绑在一起，并构造了最基本的 Linux 根文件系统来运行这个应用。

容器镜像通常不包括一个初始系统，甚至可能不包括一个软件包管理器，容器镜像通常会被替换成更新版本，而不是在容器里面进行软件更新。一个静态编译的应用程序的镜像可能是最小的，只包含一个二进制文件以及 /etc 中的几个支持文件。应用程序容器通常没有一个持久的根文件系统（persistent root filesystem）；相反，overlayfs 被用来在容器镜像的最上层创建了一个临时的 layer。当容器停止时，这个 layer 就被扔掉了。容器镜像之外的任何持久性数据（persistent data）都是通过将 host 上的另一个位置的目录 bind mount 来作为容器的文件系统的。

The OCI ecosystem

如今当人们谈论容器时，他们很可能是在谈论由 Docker 所推广的应用容器的这种方式。事实上，除非另有说明，他们说的很可能就是 Docker 软件所实现的那些具体的容器镜像格式、运行时环境（run-time environment）和 registry API。这些都已经被开放容器倡议（OCI, Open Container Initiative）标准化了，这是一个由 Docker 和 Linux 基金会在 2015 年所建立的行业机构。Docker 将其软件重构为一些较小的组件；其中一些组件及其规范都被 OCI 所涵盖。OCI 发布的软件和规范就形成了现在这样一个强大的容器相关软件生态系统的种子。

OCI image specification 就定义了容器图像格式，其是由 JSON 配置（包含环境变量、执行路径等）和一系列称为 "layer" 的 tarballs 组成。每层的内容都是相互堆叠起来，按顺序叠放在一起，从而构建出容器镜像的根文件系统。这些 layer 可以在镜像之间互相共享；如果一台服务器正在运行引用了相同 layer 的几个不同容器，它们就可以共享该 layer 的同一个副本。Docker 为几个流行的 Linux 发行版提供了最小的镜像，可以作为应用容器的基础 layer。

OCI 还发布了一个 distribution specification。在这里，"distribution" 指的并不是 Linux 发行版，而是更广泛的意义。该规范定义了一个 HTTP API，用于向服务器 push 和 pull 容器镜像文件；实现该 API 的服务器就被称为容器注册中心（container registry）。Docker 维护着一个名为 Docker Hub 的大型的公共注册服务，以及一个可以自我托管（self-hosted）的参考实现（称为 "Distribution"，这个名字有点让人困惑）。该规范还有其他实现版本，包括红帽的 Quay 和 VMware 的 Harbor，以及亚马逊、GitHub、GitLab 和谷歌所提供托管的产品。

实现 OCI runtime specification 的程序则负责与实际运行容器有关的一切内容。它设置了所有必需的 mount、cgroup 和 kernel namespace，并运行容器内的进程，也负责在容器内的所有进程退出后关闭任何与容器有关的资源。这个 runtime specification 的参考实现就是 runc，这是由 Docker 为 OCI 创建的。

还有一些其他的 OCI runtime 可供选择。例如，crun 提供了一个用 C 语言编写的 OCI 运行时，其目标是比 runc 更快、更轻量，而 runc 和 OCI 生态系统的其他大部分一样，是用 Go 编写的。谷歌的 gVisor 包括了一个 runsc，这通过在用户模式内核（user-mode kernel）上运行应用程序，从而提供了与 host 更好的隔离性。亚马逊的 Firecracker 是一个用 Rust 编写的最小的 hypervisor 程序，可以使用 KVM 来给每个容器提供自己的虚拟机；英特尔的 Kata Containers 工作方式类似，但支持多个 hypervisor（包括 Firecracker）。

容器引擎（container engine）是将这三种规范联系在一起的程序。它按照 distribution specification 实现了相应的客户端处理，从而可以在 registry 上检索容器镜像，根据 specification 来解释它获取到的镜像文件，并利用实现了 runtime specification 的程序来启动这个容器。容器引擎为用户提供了工具和 API，用来管理容器镜像、进程和存储。

Kubernetes 是一个容器协调器（container orchestrator），能够在数百甚至数千个服务器上调度以及运行容器。Kubernetes 本身并没有实现任何 OCI 规范。它需要与容器引擎相结合来使用，后者来替 Kubernetes 对容器进行管理和操作。它用来与容器引擎通信的接口就被称为容器运行时接口（CRI, Container Runtime Interface）。

Docker

Docker 是最初的 OCI 容器引擎，由两个用户可见的主要组件组成：一个名为 docker 的命令行界面（CLI）的客户端和一个服务器。服务器在 Docker 自己的软件包中被命名为 dockerd，但当 Docker 在 2017 年创建 Moby 项目时，这个代码库被重新命名为 moby。Moby 项目是一个包含了所有 Docker 和其他容器引擎使用的开源组件开发的总括性项目（umbrella organization）。当宣布 Moby 的时候，许多人发现 Docker 和 Moby 项目之间的关系是很混乱的，就类似于 Fedora 和 Red Hat 之间的关系。

dockerd 提供了一个 HTTP API；一般来说它会监听一个名为/var/run/docker.sock 的 Unix socket，但也可以让它监听一个 TCP socket。docker 命令只是这个 API 的一个客户端程序；服务器负责下载镜像和启动容器进程。客户端支持在前台来启动容器运行，因此在命令行上运行容器的行为就类似于运行其他任意程序一样，但这实际上只是模拟出来的效果。在这种工作模式下，容器进程仍然是由服务器启动的，input 和 output 会通过 API socket 来进行 stream 传输；当进程退出时，服务器会向客户端报告，然后客户端会相应地设置自己的退出状态。

这种设计是跟 systemd 或其他类似的进程监管工具无法兼容的，因为 CLI 从来没有自己的子进程。在进程监督程序下运行 docker CLI，只能监督 CLI 进程本身。这对这些工具的用户来说会有一些影响。例如，任何试图通过将 CLI 作为 systemd 服务运行来限制容器的内存使用量的做法都是无效的；这些限制将只适用于 CLI 以及它完全不存在的子进程上。此外，杀死客户端进程，无法做到终止容器中的所有进程。

如果不限制对 Docker socket 的访问权限，会有很大的安全隐患。默认情况下，dockerd 是以 root 身份运行的。任何能够连接到 Docker socket 的人都可以完全访问相关 API。由于 API 允许以特定的 UID 身份来运行容器，并将任意的文件系统位置 bind 进来，因此对于能够访问 socket 的人来说，可以轻松成为 host 上的 root 用户。2019 年增加了对 rootless 模式运行的支持，并在 2020 年稳定下来，但仍然不是默认使用模式。

Docker 可以被 Kubernetes 用来运行容器，但它并不直接支持 CRI 规范。最初，Kubernetes 包括了一个名为 dockershim 的组件，在 CRI 和 Docker API 之间提供了一个桥梁，但在 2020 年被废弃了。该代码已经从 Kubernetes 仓库中剥离出来，现在称为 cri-dockerd 进行单独维护了。

containerd & nerdctl

Docker 在 2015 年将其软件重构为一些独立的组件；containerd 就是这项工作的成果之一。2017 年，Docker 将 containerd 捐赠给了云原生计算基金会（CNCF, Cloud Native Computing Foundation），该基金会负责管理 Kubernetes 和其他工具的开发工作。此工具也仍然包含在 Docker 中，但它也可以作为一个独立的容器引擎来使用，或者通过一个内置的 CRI 插件与 Kubernetes 一起使用。containerd 的架构是高度模块化的。这种灵活性有助于它作为实验性功能的试验场。例如，可以使用 plugin 来支持不同的存储容器镜像的方式，或者支持其他镜像格式。

如果没有任何额外的插件的话，containerd 实际上是 Docker 的一个子集；其核心功能与 OCI 规范紧密相连。针对 Docker 的 API 设计的工具不能用于 containerd。相反，它提供了一个基于谷歌 gRPC 的 API。不幸的是，如果系统管理员希望能使用访问控制（access control）的话，这里是不具备此功能的；尽管与 Docker 的 API 不兼容，但是 containerd 的 API 的安全方面的假设似乎是跟 Docker API 一致的。

containerd 的文档指出，它遵循的是一个智能客户端模型（这一点是相对于 Docker 的 "dumb client" 而言的）。这意味着很多差异，其中之一就是 containerd 不与 container registry 服务器直接沟通；相反，（智能）客户端需要自己下载他们需要的任何镜像。尽管客户端模型不同，containerd 仍然有一个与 Docker 类似的进程模型；容器进程是从 containerd 进程 fork 出来的。一般来说，如果没有额外的软件的话，containerd 的工作与 Docker 没有什么不同，只是能做得工作比较少。

当 containerd 与 Docker 捆绑在一起时，dockerd 作为智能客户端，接受来自自己的 dumb client 的 Docker API 调用，并在调用 containerd API 之前做一些必需的额外工作；当与 Kubernetes 一起使用时，这些事情是由 CRI 插件来处理的。此外，containerd 直到最近才真正有了自己的客户端。它包括一个名为 ctr 的 bare-bone（底层） CLI，但这只是用来调试的。

在 2020 年 12 月随着 nerdctl 的发布，这一点发生了变化。自其发布以来，独立运行 containerd 的方式就变得更加实用了；nerdctl 的用户界面希望能与 Docker CLI 兼容，并提供了 Docker 用户发现的这个独立的 containerd 安装方式中所缺少的大部分功能。不需要与 Docker API 兼容的用户可能会发现 containerd 和 nertdctl 就足够使用了。

Podman

Podman 是红帽公司赞助的 Docker 的一个替代品，旨在直接替代 Docker。跟 Docker 和 containerd 一样，它是用 Go 语言编写的，并在 Apache 2.0 的许可条款下进行发布，但它不是一个 fork，而是一个独立的重新实现。红帽对 Podman 的资助可能部分是出于它在努力使 Docker 的软件与 systemd 配合工作时所遇到的困难。

从表面上看，Podman 似乎与 Docker 几乎完全一样。它可以使用相同的容器镜像、跟相同的 registry 服务器交流。Podman CLI 是 docker 的克隆，目的是让从 Docker 迁移过来的用户可以将 docker 直接 alias 为 podman，就可以继续像以前一样使用，感觉什么都没有改变一样。

最初，Podman 提供了一个基于 varlink 协议的 API。这意味着虽然 Podman 在 CLI 层面上与 Docker 是兼容的，但直接使用 Docker API 的工具却不能用于 Podman。在 3.0 版本中，varlink API 被废除，转而使用 HTTP API，其目的是与 Docker 提供的 API 相兼容，同时增加一些 Podman 特有的 endpoint。这个新的 API 正在迅速成熟，但为 Docker 设计的工具的用户最好在决定切换到 Podman 之前测试一下兼容性。

由于它在很大程度上是 Docker API 的复制，所以 Podman 的 API 没有任何 access control 功能，但 Podman 有一些架构上的差异，这可能使其变得不那么重要了。在开发初期，Podman 就支持了 rootless 运行模式。在这种模式下，除了 newuidmap 和 newgidmap 所提供的一些微小帮助之外，我们还可以在没有 root 权限或其他特殊权限的情况下创建容器了。与 Docker 有一点不同，Podman 在由非 root 用户调用时，默认会使用 rootless 模式。

Podman 的用户也可以通过简单地禁用 API socket 来规避对其安全的担忧。虽然它的界面与 Docker CLI 基本相同，但 podman 不是单纯的 API 客户端。它可以在不需要任何守护程序的帮助的情况下就自己创建出容器。因此，Podman 与 systemd 等工具就能很好地配合起来了；podman run 在进程监督工具看来是符合预期的，因为容器内的进程是 podman run 的子进程。Podman 的开发者通过为 Podman 容器生成 systemd unit 的命令来鼓励人们以这种方式运行。

除了进程模型方面的改进外，Podman 在其他方面也迎合了 systemd 用户的需求。虽然在容器中运行 systemd 这样的初始系统与 Docker 的每个容器只有一个应用程序的理念相悖，但 Podman 还是不遗余力地想让这种方式变得简单。如果容器指定运行的程序是一个 init 系统，那么 Podman 会自动挂载 systemd 运行所需的所有内核文件系统。它还支持通过 sd_notify()向 systemd 报告容器的状态，或者将 notification socket 移交给容器内的应用程序供其直接使用。

Podman 也有一些想用来吸引 Kubernetes 用户的功能。跟 Kubernetes 一样，它支持 "pod" 的概念，也就是一组共享了同一个 network namespace 的容器。它可以使用 Kubernetes 配置文件来运行容器，也可以生成 Kubernetes 配置文件。然而，与 Docker 和 containerd 不同，Podman 没有办法被 Kubernetes 利用来运行容器。这是故意为之的。红帽没有为 Podman（一个通用的容器引擎）添加 CRI 支持，而是选择了资助开发一个更专业的 CRI-O 形式的替代方案。

CRI-O

CRI-O 基于了许多与 Podman 相同底层设施。因此，CRI-O 和 Podman 之间的关系可以说是类似于 containerd 和 Docker 之间的关系；CRI-O 提供了许多与 Podman 相同的技术，但减少了一些装饰（frills）。不过，这个类比并不是很严格。与 containerd 和 Docker 不同，CRI-O 和 Podman 是完全独立的项目；两者都并不会包含另一个。

正如其名称所暗示的，CRI-O 实现了 Kubernetes CRI。事实上，这就是它所实现的一切了；CRI-O 是专门为 Kubernetes 使用而建立的。它是与 Kubernetes 的发布周期来同步开发的，任何不需要 CRI 的东西都被明确声明为不被支持。CRI-O 不能在没有 Kubernetes 的情况下使用，也不包括自己的 CLI；根据项目的既定目标，任何使 CRI-O 用来满足独立使用需求的工作，都可能被开发者视为不受欢迎的一些分散注意力的工作。

与 Podman 一样，CRI-O 的开发最初是由 Red Hat 所赞助的；与 containerd 一样，它后来在 2019 年被捐赠给了 CNCF。虽然它们现在都在同一个组织的支持下，但 CRI-O 的更加集中的关注点可能使它比 containerd 对 Kubernetes 管理员来说更有吸引力。CRI-O 的开发者可以完全根据 Kubernetes 用户的利益最大化来自由做出决定，而 containerd 和其他容器引擎的开发者则有许多其他类型的用户和使用场景需要考虑。

Conclusion

这些只是最流行的容器引擎中的几个而已；还有一些其他项目，如 Apptainer 和 Pouch，分别迎合了其他不同的生态环境。还有一些工具可用于创建和操作容器镜像，如 Buildah、Buildpacks、skopeo 和 umoci。Docker 在开放容器计划（Open Container Initiative）中功不可没；这个工作所产生的标准和软件为众多项目提供了基础。这个生态系统是强大的；如果一个项目关闭了，那么有多个替代项目早就准备好了可以随时替代它。因此，这项技术的未来不再与某个特定的公司或项目挂钩；Docker 所开创的容器风格似乎在未来很很长一段时间内都可以陪伴着我们了。

全文完
LWN 文章遵循 CC BY-SA 4.0 许可协议。

欢迎分享、转载及基于现有协议再创作～

长按下面二维码关注，关注 LWN 深度文章以及开源社区的各种新近言论～

android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
linux sdl windows.h,Windows下的SDL安装奔跑吧linux内核 linux sdl windows.h
首先你要下载并安装SDL开发包。如果装在C盘下，路径为C:\SDL1.2.5如果在WINDOWS下。你可以按以下步骤：1.打开VC++，点击"Tools",Options2,点击directories选项3.选择"Includefiles"增加一个新的路径。"C:\SDL1.2.5\include"4，现在选择"Libaryfiles“增加"C:\SDL1.2.5\lib"现在你可以开始编写你的第
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
linux中sdl的使用教程,sdl使用入门 Melissa Corvinus linux中sdl的使用教程
本文通过一个简单示例讲解SDL的基本使用流程。示例中展示一个窗口，窗口里面有个随机颜色快随机移动。当我们鼠标点击关闭按钮时间窗口关闭。基本步骤如下：1.初始化SDL并创建一个窗口。SDL_Init()初始化SDL_CreateWindow()创建窗口2.纹理渲染存储RGB和存储纹理的区别：比如一个从左到右由红色渐变到蓝色的矩形，用存储RGB的话就需要把矩形中每个点的具体颜色值存储下来；而纹理只是一
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
libyuv之linux编译 jaronho Linux linux 运维服务器
文章目录一、下载源码二、编译源码三、注意事项1、银河麒麟系统（aarch64）（1）解决armv8-a+dotprod+i8mm指令集支持问题（2）解决armv9-a+sve2指令集支持问题一、下载源码到GitHub网站下载https://github.com/lemenkov/libyuv源码，或者用直接用git克隆到本地，如：gitclonehttps://github.com/lemenko
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
docker igotyback eureka 云原生
Docker容器的文件系统是隔离的，但是可以通过挂载卷（Volumes）或绑定挂载（BindMounts）将宿主机的文件系统目录映射到容器内部。要查看Docker容器的映射路径，可以使用以下方法：查看容器配置：使用dockerinspect命令可以查看容器的详细配置信息，包括挂载的卷。例如：bashdockerinspect在输出的JSON格式中，查找"Mounts"部分，这里会列出所有的挂载信息
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s