程序员小乐

为什么 Google 和 Facebook 不用 Docker

点击上方 "编程技术圈"关注, 星标或置顶一起成长

后台回复“大礼包”有惊喜礼包！

每日英文

Some happened could not forget, even forget also only temporarily don't remember.

有些事发生了就不可能忘记，即使忘记也只是暂时的记不起。

每日掏心话

安静，明白了一个人的时光，人生，总有太多期待一直失望，总有太多梦想一直落空，总有太多言语无人可诉。

责编：乐乐 | 来自：分布式实验室

编程技术圈(ID:study_tech)第 1234 次推文

往日回顾：拜托！不要用“ ! = null ”做判空了！

正文

本文涉及的所有技术细节都可以在开源软件和论文中找到。
写作本文的起因是我想让修改后的分布式 PyTorch 程序能更快的在 Facebook 的集群上启动。探索过程很有趣。也展示了工业机器学习需要的知识体系。2007 年我刚毕业后在 Google 工作过三年。当时觉得分布式操作系统 Borg 真好用。从 2010 年离开 Google 之后就一直盼着它开源，直到 Kubernetes 的出现。
Kubernetes 调度的计算单元是 containers（准确的翻译是“集装箱”，而不是意思泛泛的“容器”，看看 Docker 公司的 Logo 上画的是啥就知道作者的心意了）。而一个 container 执行一个 image，就像一个 process 执行一个 program。
无论 Googlers 还是 ex-Googlers，恐怕在用 Borg 的时候都未曾接触过 container 和 image 这两个概念。为啥 Borg 里没有，而 Kubernetes 却要引入了这样两个概念呢？
这个曾经问题在我脑海中一闪而过就被忽略了。毕竟后来我负责开源项目比较多，比如百度 Paddle 以及蚂蚁的 SQLFlow 和 ElasticDL，Docker 用起来很顺手。于是也就没有多想。
今年（2021年）初，我加入 Facebook。恰逢 Facebook 发论文[1]介绍了其分布式集群管理系统 Tupperware。不过 Tupperware 是一个注册于 1946 年的品牌 https://en.wikipedia.org/wiki/Tupperware_Brands，所以在论文里只好起了另一个名字 Twine。因为行业里知道 Tupperware 这个名字的朋友很多，本文就不说 Twine 了。总之，这篇论文的发表又引发了我对于之前问题的回顾 —— Facebook 里也没有 Docker！
和 Facebook Tuppware 团队以及 Google Borg 几位新老同事仔细聊了聊之后，方才恍然。因为行业里没有看到相关梳理，本文是为记录。
一言蔽之简单的说，如果用 monolithic repository 来管理代码，则不需要 Docker image（或者 ZIP、tarball、RPM、deb）之类的“包”。
所谓 monolithic repo 就是一家公司的所有项目的所有代码都集中放在一个（或者极少数） repo 里。因为 monolithic repository 得有配套的统一构建系统（build system）否则编译不动那么老大一坨代码。而既然有统一的 build system，一旦发现某个集群节点需要执行的程序依赖的某个模块变化了，同步这个模块到此节点既可。完全不需要打包再同步。
反之，如果每个项目在一个独立的 git/svn repo 里，各自用不同的 build system，比如各个开源项目在不同的 GitHub repo 里，则需要把每个项目 build 的结果打包。而 Docker image 这样支持分层的包格式让我们只需要传输那些容纳被修改的项目的最上面几层，而尽量复用被节点 cache 了的下面的几层。
Google 和 Facebook 都使用 monolithic repository，也都有自己的 build systems（我这篇老文 寻找 Google Blaze[2] 解释过 Google 的 build system）所以不需要“包”，当然也就不需要 Docker images。
不过 Borg 和 Tupperware 都是有 container 的（使用 Linux kernel 提供的一些 system calls，比如 Google Borg 团队十多年前贡献给 Linux kernel 的 cgroup）来实现 jobs 之间的隔离。只是因为如果不需要大家 build Docker image 了，那么 container 的存在就不容易被关注到了。
如果不想被上述蔽之，而要细究这个问题，那就待我一层一层剥开 Google 和 Facebook 的研发技术体系和计算技术体系。
Packaging当我们提交一个分布式作业（job）到集群上去执行，我们得把要执行的程序（包括一个可执行文件以及相关的文件，比如 *.so，*.py）传送到调度系统分配给这个 job 的一些机器（节点、nodes）上去。
这些待打包的文件是怎么来的呢？当时是 build 出来的。在 Google 里有 Blaze，在 Facebook 里有 Buck。感兴趣的朋友们可以看看 Google Blaze 的“开源版本”Bazel[3]，以及 Facebook Buck 的开源版本[4]。不过提醒在先 —— Blaze 和 Facebook Buck 的内部版都是用于 monolithic repo 的，而开源版本都是方便大家使用非 mono repos 的，所以理念和实现上有不同，不过基本使用方法还是可以感受一下的。
假设我们有如下模块依赖（module dependencies），用 Buck 或者 Bazel 语法描述（两者语法几乎一样）：python_binary(name="A", srcs=["A.py"], deps=["B", "C"], ...)
python_library(name="B", srcs=["B.py"], deps=["D"], ...)
python_library(name="C", srcs=["C.py"], deps=["E"], ...)
cxx_library(name="D", srcs=["D.cxx", "D.hpp"], deps="F", ...)
cxx_library(name="E", srcs=["E.cxx", "E.hpp"], deps="F", ...)那么模块（build 结果）依赖关系如下：A.py --> B.py --> D.so -\
     \-> C.py --> E.so --> F.so如果是开源项目，请自行脑补，把上述模块（modules）替换成 GPT-3，PyTorch，cuDNN，libc++ 等项目（projects） —— 当然，每个 projects 里包含多个 modules 也依赖其他 projects，就像每个 module 有多个子 modules 一样。
Tarball最简单的打包方式就是把上述文件 {A,B,C}.py, {D,E,F}.so 打包成一个文件 A.zip，或者 A.tar.gz。
更严谨的说，文件名里应该包括版本号。比如 A-953bc.zip，其中版本号 953bc 是 git/Mercurial commit ID。引入版本号，可以帮助在节点本地 cache —— 下次运行同一个 tarball 的时候，就不需要下载这个文件了。请注意这里我引入了 package caching 的概念。为下文解释 Docker 预备。XARZIP 或者 tarball 文件拷贝到集群节点上之后，需要解压缩到本地文件系统的某个地方，比如：/var/packages/A-953bc/{A,B,C}.py,{D,E,F}.so。
一个稍显酷炫的方式是不用 Tarball，而是把上述文件放在一个 overlay filesystem 的 loopback device image 里。这样“解压”就变成了“mount”。请注意这里我引入了 loopback device image 的概念。为下文解释 Docker 预备。什么叫 loopback device image 呢？在 Unix 里，一个目录树的文件们被称为一个文件系统（filesystem）。通常一个 filesystem 存储在一个 block device 上。什么是 block device 呢？简单的说，但凡一个存储空间可以被看作一个 byte array 的，就是一个 block device。比如一块硬盘就是一个 block device。在一个新买的硬盘里创建一个空的目录树结构的过程，就叫做格式化（format）。
既然 block device 只是一个 byte array，那么一个文件不也是一个 byte array 吗？是的！在 Unix 的世界里，我们完全可以创建一个固定大小的空文件（用 truncate 命令），然后“格式化”这个文件，在里面创建一个空的文件系统。然后把上述文件 {A,B,C}.py,{D,E,F}.so 放进去。
比如 Facebook 开源的 XAR 文件[5]格式。这是和 Buck 一起使用的。如果我们运行 buck build A 就会得到 A.xar . 这个文件包括一个 header，以及一个 squashfs loopback device image，简称 squanshfs image。这里 squashfs 是一个开源文件系统。感兴趣的朋友们可以参考这个教程[6]，创建一个空文件，把它格式化成 squashfs，然后 mount 到本地文件系统的某个目录（mount point）里。待到我们 umount 的时候，曾经加入到 mount point 里的文件，就留在这个“空文件”里了。我们可以把它拷贝分发给其他人，大家都可以 mount 之，看到我们加入其中的文件。
因为 XAR 是在 squashfs image 前面加上了一个 header，所以没法用 mount -t squashf 命令来 mount，得用 mount -t xar 或者 xarexec -m 命令。比如，一个节点上如果有了 /packages/A-953bc.xar，我们可以用如下命令看到它的内容，而不需要耗费 CPU 资源来解压缩：xarexec -m A-953bc.xar这个命令会打印出一个临时目录，是 XAR 文件的 mount point。
分层如果我们现在修改了 A.py，那么不管是 build 成 tarball 还是 XAR，整个包都需要重新更新。当然，只要 build system 支持 cache，我们是不需要重新生成各个 *.so 文件的。但是这个不解决我们需要重新分发 .tar.gz 和 .xar 文件到集群的各个节点的麻烦 —— 之前节点上可能有老版本的 A-953bc87fe.{tar.gz,xar} 了，但是不能复用。
为了复用 ，需要分层。
对于上面情况，我们可以根据模块依赖关系图，构造多个 XAR 文件。A-953bc.xar --> B-953bc.xar --> D-953bc.xar -\
            \-> C-953bc.xar --> E-953bc.xar --> F-953bc.xar其中每个 XAR 文件里只有对应的 build rule 产生的文件。比如，F-953bc.xar 里只有 F.so。
这样，如果我们只修改了 A.py，则只有 A.xar 需要重新 build 和传送到集群节点上。这个节点可以复用之前已经 cache 了的 {B,C,D,E,F}-953bc.xar 文件。
假设一个节点上已经有 /packages/{A,B,C,D,E,F}-953bc.xar，我们是不是可以按照模块依赖顺序，运行 xarexec -m 命令，依次 mount 这些 XAR 文件到同一个 mount point 目录，既可得到其中所有的内容了呢？
很遗憾。不行。因为后一个 xarexec/mount 命令会报错 —— 因为这个 mount point 已经被前一个 xarexec/mount 命令占据了。
下面解释为什么文件系统 image 优于 tarball。
那退一步，不用 XAR 了，用 ZIP 或者 tar.gz 不行吗？可以，但是慢。我们可以把所有 .tar.gz 都解压缩到同一个目录里。但是如果 A.py 更新了，我们没法识别老的 A.py 并且替换为新的，而是得重新解压所有 .tar.gz 文件，得到一个新的文件夹。而重新解压所有的 {B,C,D,E,F}.tar.gz 很慢。
Overlay Filesystem有一个申请的开源工具 fuse-overlayfs。它可以把几个目录“叠加”（overlay）起来。比如下面命令把 /tmp/{A,B,C,D,E,F}-953bc 这几个目录里的内容都“叠加”到 /pacakges/A-953bc 这个目录里。fuse-overlayfs -o \
  lowerdir="/tmp/A-953bc:/tmp/B-953bc:..." \
  /packages/A-953bc而 /tmp/{A,B,C,D,E,F}-953bc 这几个目录来自 xarcexec -m /packages/{A,B,C,D,E,F}-953bc.xar。请注意这里我引入了 overlay filesystem 的概念。为下文解释 Docker 预备。fuse-overlayfs 是怎么做到这一点的呢？当我们访问任何一个文件系统目录，比如 /packages/A 的时候，我们使用的命令行工具（比如 ls ）调用 system calls（比如 open/close/read/write） 来访问其中的文件。这些 system calls 和文件系统的 driver 打交道 —— 它们会问 driver：/packages/A 这个目录里有没有一个叫 A.py 的文件呀？
如果我们使用 Linux，一般来说，硬盘上的文件系统是 ext4 或者 btrfs。也就是说，Linux universal filesystem driver 会看看每个分区的文件系统是啥，然后把 system call 转发给对应的 ext4/btrfs driver 去处理。
一般的 filesystem drivers 和其他设备的 drivers 一样运行在 kernel mode 里。这是为什么一般我们运行 mount 和 umount 这类操作 filesystems 的命令的时候，都需要 sudo。而 FUSE 是一个在 userland 开发 filesystem driver 的库。
fuse-overlayfs 这命令利用 FUSE 这个库，开发了一个运行在 userland 的 fuse-overlayfs driver。当 ls 命令询问这个 overlayfs driver /packages/A-953bc 目录里有啥的时候，这个 fuse-overlayfs driver 记得之前用户运行过 fuse-overlayfs 命令把 /tmp/{A,B,C,D,E}-953bc 这几个目录给叠加上去过，所以它返回这几个目录里的文件。
此时，因为 /tmp/{A,B,C,D,E}-953bc 这几个目录其实是 /packages/{A,B,C,D,E,F}-953bc.xar 的 mount points，所以每个 XAR 就相当于一个 layer。
搜索公众号顶级架构师后台回复“offer”，获取一份惊喜礼包。
像 fuse-overlayfs driver 这样实现把多个目录“叠加”起来的 filesystem driver 被称为 overlay filesystem driver，有时简称为 overlay filesystems。
Docker Image and Layer上面说到用 overlay filesystem 实现分层。用过 Docker 的人都会熟悉一个 Docker image 由多层构成。当我们运行 docker pull <image-name> 命令的时候，如果本机已经 cache 了这个 image 的一部分 layers，则省略下载这些 layers。这其实就是用 overlay filesystem 实现的。
Docker 团队开发了一个 filesystem（driver）叫做 overlayfs —— 这是一个特定的 filesystem 的名字。顾名思义，Docker overlayfs 也实现了“叠加”（overlay）的能力，这就是我们看到每个 Docker image 可以有多个 layers 的原因。
Docker 的 overlayfs 以及它的后续版本 overlayfs2 都是运行在 kernel mode 里的 —— 这也是 Docker 需要机器的 root 权限的原因之一，而这又是 Docker 被诟病容易导致安全漏斗的原因。
有一个叫 btrfs 的 filesystem，是 Linux 世界里最近几年发展很迅速的，用于管理硬盘效果很好。这个 filesystem 的 driver 也支持 overlay。所以 Docker 也可以被配置为使用这个 filesystem 而不是 overlayfs —— 不过只有 Docker 用户的电脑的 local filesystem 是 btrfs 的时候，Docker 才能用 btrfs 在上面叠加 layers。所以说，如果你用的是 macOS 或者 Windows，那肯定没法让 Docker 使用 btrfs 了。
不过如果你用的是 fuse-overlayfs，那就是用了一副万灵药了。只是通过 FUSE 在 userland 运行的 filesystem 的性能很一般，不过本文讨论的情形对性能也没啥需求。其实 Docker 也可以被配置使用 fuse-overlayfs。Docker 支持的分层 filesystem 列表在这里 Docker storage drivers[7]。
为什么需要 Docker Image总结上文所述，从编程到可以在集群上跑起来，我们要做几个步骤：
编译：把源码编译成可执行的形式。打包：把编译结果纳入一个“包”里，以便部署和分发传输：通常是集群管理系统（Borg、Kubernetes、Tupperware来做）。如果要在某个集群节点上启动 container，则需要把“包”传输到此节点上，除非这个节点曾经运行过这个程序，已经有包的 cache。解包：如果“包”是 tarball 或者 zip，到了集群节点上之后需要解压缩；如果“包”是一个 filesystem image，则需要 mount。
把源码分成模块，可以让 1. 编译 这步充分利用每次修改只改动一小部分代码的特点，只重新编译被修改的模块，从而节省时间。
为了节省 2.、3. 和 4. 的时间，我们希望“包”是分层的。每一层最好只包含一个或者几个代码模块。这样，可以利用模块之间的依赖关系，尽量复用容纳底层模块的“层”。
在开源的世界里，我们用 Docker image 支持分层的特点，一个基础层可能只包括某个 Linux distribution（比如 CentOS）的 userland programs，如 ls、cat、grep 等。在其上，可以有一个层包括 CUDA。再其上安装 Python 和 PyTorch。再再之上的一层里是 GPT-3 模型的训练程序。这样，如果我们只是修改了 GPT-3 训练程序，则不需要重新打包和传输下面三层。
这里的逻辑核心是：存在“项目”（project）的概念。每个项目可以有自己的 repo，自己的 building system（GNU make、CMake、Buck、Bazel 等），自己的发行版本（release）。所以每个项目的 release 装进 Docker image 的一层 layer —— 与其前置多层合称为一个 image。
为什么 Google 和 Facebook 不需要 Docker经过上述这么多知识准备，请我们终于可以点题了。因为 Google 和 Facebook 使用 monolithic repository，使用统一的 build system（Google Blaze 或者 Facebook Buck）。虽然也可以利用“项目”的概念，把每个项目的 build result 装入 Docker image 的一层。但是实际上并不需要。
利用 Blaze 和 Buck 的 build rules 定义的模块，以及模块之间依赖关系，我们可以完全去打包和解包的概念 —— 没有了包，当然就不需要 zip、tarball、以及 Docker image 和 layers 了。
直接把每个模块当做一个 layer 既可 —— 如果 D.so 因为我们修改了 D.cpp 被重新编译，那么只重新传输 D.so 既可，而不需要去传输一个 layer 其中包括 D.so。
于是，在 Google 和 Facebook 里，受益于 monolithic repository 和统一的 build 工具，我们把上述四个步骤省略成了两个：
编译：把源码编译成可执行的形式。传输：如果某个模块被重新编译，则传输这个模块。
Google 和 Facebook 没在用 Docker上一节说了 monolithic repo 可以让 Google 和 Facebook 不需要 Docker image。现实是 Google 和 Facebook 没有在使用 Docker。这两个概念有区别。
我们先说“没在用”。历史上，Google 和 Facebook 使用超大规模集群先于 Docker 和 Kubernetes 的出现。当时为了打包方便，连 tarball 都没有。对于 C/C++ 程序，直接全静态链接，根本没有 *.so。于是一个 executable binary file 就是“包”了。直到今天，大家用开源的 Bazel 和 Buck 的时候，仍然可以看到默认链接方式就是全静态链接。
Java 语言虽然是一种“全动态链接”的语言，不过其诞生和演进扣准了互联网历史机遇，其开发者发明 jar 文件格式，从而支持了全静态链接。
Python 语言本身没有 jar 包，所以 Blaze 和 Bazel 发明了 PAR 文件格式（英语叫 subpar），相当于为 Python 设计了一个 jar。开源实现在这里[8]。类似的，Buck 发明了 XAR 格式，也就是我上文所说的 squashfs image 前面加了一个 header。其开源实现在这里[9]。
搜索公众号后端架构师后台回复“架构整洁”，获取一份惊喜礼包。
Go 语言默认就是全静态链接的。在 Rob Pike 早期的一些总结里提到，Go 的设计，包括全静态链接，基本就是绕坑而行 —— 绕开 Google C/C++ 实践中遇到过的各种坑。熟悉 Google C++ style guide 的朋友们应该感觉到了 Go 语法覆盖了 guide 说的“应该用的 C++ 语法”，而不支持 guide 说的 “不应该用的 C++ 的部分”。
简单的说，历史上 Google 和 Facebook 没有在用 Docker image，很重要的一个原因是，其 build system 对各种常见语言的程序都可以全静态链接，所以可执行文件就是“包”。
但这并不是最好的解法 —— 毕竟这样就没有分层了。哪怕我只是修改了 main 函数里的一行代码，重新编译和发布，都需要很长时间 —— 十分钟甚至数十分钟 —— 要知道全静态链接得到的可执行文件往往大小以 GB 计。
所以全静态链接虽然是 Google 和 Facebook 没有在用 Docker 的原因之一，但是并不是一个好选择。所以也没被其他公司效仿。大家还是更愿意用支持分层 cache 的 Docker image。
完美解法的技术挑战完美的解法应该支持分层 cache（或者更精确的说是分块 cache）。所以还是应该用上文介绍的 monolithic repo 和统一 build system 的特点。
但是这里有一个技术挑战 —— build system 描述的模块，而模块通常比“项目”细粒度太多了。以 C/C++ 语言为例，如果每个模块生成一个 .so 文件，当做一个“层”或者“块”以便作为 cache 的单元，那么一个应用程序可能需要的 .so 数量就太多了。启动应用的时候，恐怕要花几十分钟来 resolve symbols 并且完成链接。
所以呢，虽然 monolithic repo 有很多好处，它也有一个缺点，不像开源世界里，大家人力的把代码分解成“项目”，每个项目通常是一个 GitHub repo，其中可以有很多模块，但是每个项目里所有模块 build 成一个 *.so 作为一个 cache 的单元。因为一个应用程序依赖的项目数量总不会太多，从而控制了 layer 的总数。
好在这个问题并非无解。既然一个应用程序对各个模块的依赖关系是一个 DAG，那么我们总可以想办法做一个 graph partitioning，把这个 DAG 分解成不那么多的几个子图。仍然以 C/C++ 程序为例，我们可以把每个子图里的每个模块编译成一个 .a，而每个子图里的所有 .a 链接成一个 *.so，作为一个 cache 的单元。
于是，如何设计这个 graph partitioning 算法就成了眼前最重要的问题了。
相关链接：
https://engineering.fb.com/2019/06/06/data-center-engineering/twine/https://zhuanlan.zhihu.com/p/55452964https://bazel.build/https://buck.build/https://github.com/facebookincubator/xarhttps://tldp.org/HOWTO/SquashFS-HOWTO/creatingandusing.htmlhttps://docs.docker.com/storage/storagedriver/select-storage-driver/https://github.com/google/subparhttps://github.com/facebookincubator/xar
原文链接：https://zhuanlan.zhihu.com/p/368676698PS：欢迎在留言区留下你的观点，一起讨论提高。如果今天的文章让你有新的启发，欢迎转发分享给更多人。
版权申明：内容来源网络，版权归原创者所有。除非无法确认，我们都会标明作者及出处，如有侵权烦请告知，我们会立即删除并表示歉意。谢谢!
欢迎加入后端架构师交流群，在后台回复“学习”即可。
最近面试BAT，整理一份面试资料《Java面试BAT通关手册》，覆盖了Java核心技术、JVM、Java并发、SSM、微服务、数据库、数据结构等等。在这里，我为大家准备了一份2021年最新最全BAT等大厂Java面试经验总结。别找了，想获取史上最简单的Java大厂面试题学习资料扫下方二维码回复「面试」就好了猜你还想看阿里、腾讯、百度、华为、京东最新面试题汇集阿里面试官的 "说一下从url输入到返回请求的过程" 问的难度就是不一样！
面试官：Java 反射是什么？我回答不上来！
Git使用的奇技淫巧，看这篇就够了！
嘿，你在看吗？

Java IO流：NIO 介绍及使用栗筝i 栗筝i 的 Java 技术栈（付费部分）#Java 基础 -专栏栗筝i 的 Java 技术栈 Java 基础 Java IO 流
大家好，我是栗筝i，这篇文章是我的“栗筝i的Java技术栈”专栏的第042篇文章，在“栗筝i的Java技术栈”这个专栏中我会持续为大家更新Java技术相关全套技术栈内容。专栏的主要目标是已经有一定Java开发经验，并希望进一步完善自己对整个Java技术体系来充实自己的技术栈的同学。与此同时，本专栏的所有文章，也都会准备充足的代码示例和完善的知识点梳理，因此也十分适合零基础的小白和要准备工作面试的同
Java IO模型：BIO、NIO、AIO讲解我心向阳iu #Java进阶 Java面试知识点精讲 java jvm linux
文章目录IO首先：什么是IO？为什么要改进IO？BIO、NIO、AIOBIONIONIO实现原理Channel(通道)：Buffer(缓冲区)：Selector(选择器)：AIOBIO、NIO、AIO比较NIO和BIO的比较怎么区别NIO与AIOBIO、NIO、AIO区别举例说明BIO、NIO、AIO适用场景分析:BIO、NIO、AIO代码实战BIO、NIO、AIO相关问题思考：怎么理解IO是面向
pex无人守护安装linux系统脚本 weixin_33800463
linux系统安装大体分为两个阶段1，anaconda阶段（anaconda程序借助linux内核和initrd文件实现），也称配置阶段在这个阶段是安装配置阶段，配置语言，键盘，等信息。同时boot提示符下能够向内核传递参数.2,安装阶段.安装前脚本配置安装软件包阶段安装后脚本配置...........................................................
PEX: Python Executable魔力工具箱史艾岭
PEX:PythonExecutable魔力工具箱pexAtoolforgenerating.pex(PythonEXecutable)files,lockfilesandvenvs.项目地址:https://gitcode.com/gh_mirrors/pe/pex项目基础介绍及主要编程语言PEX（PythonEXecutable）是Pantsbuild团队维护的一个强大开源项目，致力于简化Py
Multi-Planar U-Net: 开源3D医疗图像分割项目推荐郝茜润Respected
Multi-PlanarU-Net:开源3D医疗图像分割项目推荐MultiPlanarUNetMulti-PlanarUNetforautonomoussegmentationof3Dmedicalimages项目地址:https://gitcode.com/gh_mirrors/mu/MultiPlanarUNet1.项目基础介绍及编程语言Multi-PlanarU-Net是一个开源项目，旨在实
Pex 项目使用教程任翊昆Mary
Pex项目使用教程pexPexisajavascript3dlibrary/engineallowingforseamlessdevelopmentbetweenPlaskandWebGLinthebrowser.项目地址:https://gitcode.com/gh_mirrors/pex/pex1.项目的目录结构及介绍Pex项目的目录结构如下：pex-gl/├──assets/├──lib/├
U-Net 生物医学图像分割开源项目介绍祝珺月
U-Net生物医学图像分割开源项目介绍unetU-NetBiomedicalImageSegmentation项目地址:https://gitcode.com/gh_mirrors/une/unet1.项目基础介绍及主要编程语言U-Net是由IntelAI开发的一个生物医学图像分割的开源项目。该项目基于TensorFlow和Keras框架，使用Python语言编写，旨在为医学图像分析提供高效的解决
PEX 开源项目教程束静研Kody
PEX开源项目教程pexPexisajavascript3dlibrary/engineallowingforseamlessdevelopmentbetweenPlaskandWebGLinthebrowser.项目地址:https://gitcode.com/gh_mirrors/pex/pex项目介绍PEX（PolyethyleneExchange）是一个基于高密度聚乙烯（HDPE）的管道和
学习ASP.NET Core的身份认证（基于JwtBearer的身份认证9） gc_2299 网页编程 JwtBear 身份认证
测试数据库中只有之前记录温湿度及烟雾值的表中数据较多，在该数据库中增加AppUser表，用于登录用户身份查询，数据库表如下所示：项目中安装SqlSugarCore包，然后修改控制器类的登录函数及分页查询数据函数，将之前函数中的固定数据修改为从数据库中查询数据，并将分页查询数据函数中返回数据集合修改为返回环境检测数据的集合，主要调整的代码如下所示。客户端页面中的JavaScript代码主要修
华为OD机试E卷 - 最大相连男生数/学生方阵（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为od java python c语言 c++华为OD机试E卷 javascript
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述学校组织活动，将学生排成一个矩形方阵。请在矩形方阵中找到最大的位置相连的男生数量。这个相连位置在一个直线上，方向可以是水平的，垂直的，成对角线的或者呈反对角线的。注：学生个数不会超过10000输入描述输入的第一行为矩阵的行数和列数，接下来的n行为矩阵元素，元素间用”,”分隔。输出描述输出一个整数，表示矩阵中最长的位置相
openbmc csu_fky c++
openbmc这个开源项目编译出来的是固件，也可以说是镜像，它是一个可以运行在BMC芯片上的小型操作系统。我们可以在不同架构的CPU，不同的linux操作系统上面进行编译，最后得到的镜像适用于各个架构的CPU。在对固件进行测试时，可以通过网线与BMC开发板连接，进行相应的测试。在开发板资源不足时，可以通过qemu这个工具来代替。qemu可以虚拟出相应的硬件，例如它本身有x86或者arm架构的版本，
Apache POI Annaday Spring apache
ApachePOI概述ApachePOI是用于在Java环境中读写MicrosoftOffice格式文件的开源库。支持对Excel、Word、PowerPoint等多种Office文件格式进行创建、读取、修改操作。由于企业开发中最常用的就是导出Excel文件，所以本文就以此进行讲解入门案例首先看一个简单的案例，我们需要使用该技术来读和写一个Excel文件第一步导入坐标org.apache.poip
C51基础知识 promising-w 单片机单片机嵌入式硬件
1.什么是C51？计算机平台——C语言单片机平台——C51计算机平台的CPU主频，内存和硬盘相较于单片机平台都是巨大的量级，另一方面，计算机平台的有不同的操作系统，如Windows，Linux，macOS等，单片机一般是没有操作系统的，（也会有一些简单的操作系统如：RTOS,但与计算机平台的系统相比，还是较为简单的）代码直接运行在芯片上，我们常称为裸机开发，计算机平台的开发叫做基于系统的开发。另外
华为OD机试E卷 --学生方阵--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript c语言 python
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述学校组织活动，将学生排成一个矩形方阵。请在矩形方阵中找到最大的位置相连的男生数量。这个相连位置在一个直线上，方向可以是水平的，垂直的，成对角线的或者呈反对角线的。注:学生个数不会超过10000输入描述输入的第一行为矩阵的行数和列数，接下来的n行为矩阵元素，元素间用”,”分隔。
谷歌开发者模式调试Js代码 [保姆级教程] yunAike javascript 开发语言 ecmascript
开启开发者模式方法一：在网页中右键单击，选择“检查”选项，即可打开开发者工具。方法二：使用快捷键，在Windows/Linux系统中按Ctrl+Shift+I，在Mac系统中按Command+Option+I。开始调试JavaScript代码1.定位到源代码打开开发者工具后，点击上方的“Sources”（源代码）面板。该面板左侧是文件树，你可以从中找到要调试的JavaScript文件。如果是内联的
tomcat:Caused by:java.lang.ClassNotFoundException: javax.servlet.ServletContextListener解决方法码农研究僧 BUG java tomcat spring maven
目录1.找主问题2.普通方法3.进阶方法1.找主问题出现以下问题大概是在终端中这样显示让你去查看日志[2021-08-1909:20:24,031]Artifactssm项目:warexploded:Artifactisbeingdeployed,pleasewait...19-Aug-202121:20:26.871信息[RMITCPConnection(3)-127.0.0.1]org.apa
idea版本与maven版本不匹配问题报错java.lang.RuntimeException: java.lang.RuntimeException _ks℘ℳJJ、意中人๓ maven intellij-idea maven java
问题如下解决办法java.lang.RuntimeException:java.lang.RuntimeException:org.codehaus.plexus.component.repository.exception.ComponentLookupException:com.google.inject.ProvisionException:Unabletoprovision,seethef
Avalonia+ReactiveUI跨平台路由：打造丝滑UI交互的奇幻冒险步、步、为营 ui 交互 .net c#
一、引言在当今数字化时代，跨平台应用开发已成为大势所趋。开发者们迫切需要一种高效、灵活的方式，能够让应用程序在不同操作系统上无缝运行，为用户提供一致的体验。Avalonia和ReactiveUI的组合，宛如一对天作之合的舞者，在跨平台开发的舞台上翩翩起舞，为我们带来了前所未有的可能。Avalonia是一个开源的跨平台UI框架，它以其强大的跨平台能力而备受瞩目。无论是Windows、Linux还是m
从入门到精通：HttpClient深度剖析与实战指南步、步、为营 c#.netcore asp.net 微服务
一、引言1.1背景引入在当今数字化时代，网络编程已成为软件开发中不可或缺的一部分。而HTTP通信作为网络编程的核心，承担着客户端与服务器之间数据传输的重任。无论是Web应用、移动应用，还是分布式系统，HTTP协议都扮演着关键角色，它使得不同设备、不同平台之间能够高效地进行数据交互。在Java开发领域，为了实现HTTP通信，我们有众多工具可供选择，其中ApacheHttpClient脱颖而出，成为开
eclipse运行java报错,eclipse用maven运行项目报错java.lang.ArrayIndexOutOfBoundsException: 28054... 陈姜梅子 Maven 构建错误 XML解析 pom.xml
[ERROR]28054java.lang.ArrayIndexOutOfBoundsException:28054atorg.codehaus.plexus.util.xml.pull.MXParser.parsePI(MXParser.java:2502)atorg.codehaus.plexus.util.xml.pull.MXParser.parseEpilog(MXParser.java
桌面应用程序开发：跨平台方案方案有什么？柚米汇开发语言
目前市面上最流行的桌面开发程序框架和工具包括以下几种：1.Electron简介：使用Web技术（HTML、CSS、JavaScript）开发跨平台桌面应用，结合Node.js和Chromium。优点：广泛使用的Web技术，开发门槛低。丰富的插件和生态系统支持。许多成功的应用案例（如VisualStudioCode、Slack、Discord）。工具：VisualStudioCode、Atom。2.
16进制编辑器 linux,Tweak - Linux下的16进制编辑器 Melo的健身课堂 16进制编辑器 linux
tweak是可以在命令行方式下使用的16进制编辑器，在UbuntuLinux下可以用apt-getinstalltweak安装，用man可以看使用方法。命令格tweak是可以在命令行方式下使用的16进制编辑器，在UbuntuLinux下可以用apt-getinstalltweak安装，用man可以看使用方法。命令格式：tweak[‐l|‐f][‐e][‐wwidth][‐ooffset]filen
linux 二进制编辑工具,全网最全Linux的十大十进制编辑器，要接触Linux的你摆脱不了... 金雪锋 linux 二进制编辑工具
简单来说，十六进制编辑器允许您检查和编辑二进制文件。标准文本编辑器和十六进制编辑器之间的区别在于，逻辑文件内容由常规编辑器表示，而实际文件内容由十六进制编辑器表示。在本文中，我们将看到Linux的顶级十六进制编辑器。谁在使用十六进制编辑器：为了编辑数据的各个字节，使用了十六进制编辑器，程序员或系统管理员经常使用十六进制编辑器。调试或逆向工程二进制通信协议是一些最常用的情况。当然，您可以将十六进制编
NPM 常用命令 pumpkin84514 其它 npm
NPM常用命令NPM（NodePackageManager）是JavaScript生态系统中最流行的包管理工具，它不仅可以管理Node.js项目的依赖，还提供了丰富的命令来管理和发布你的代码。本文将从不同角度，深入浅出地介绍NPM的常用命令和实际应用。目录NPM基础什么是NPM安装NPM初始化项目(npminit)管理依赖安装依赖(npminstall)升级和卸载依赖(npmupdate,npmu
Java实现音频转文本（语音识别） Tech Synapse java 音视频语音识别
在Java中实现音频转文本（也称为语音识别或ASR）通常涉及使用专门的语音识别服务，如GoogleCloudSpeech-to-Text、IBMWatsonSpeechtoText、AmazonTranscribe、MicrosoftAzureSpeechServices，或者一些开源库如CMUSphinx。由于直接使用开源库或云服务的API进行完整演示可能涉及复杂的设置和依赖管理，这里将提供一个
Python生成成绩报告单：从理论到实践 Tech Synapse python 开发语言
在教育信息化日益普及的今天，自动化生成和处理学生成绩报告单已成为学校和教育机构的一项重要任务。Python作为一种功能强大且易于学习的编程语言，非常适合用于这种数据处理和报告生成任务。本文将详细介绍如何使用Python生成成绩报告单，包括理论概述和完整的代码示例。一、理论概述1.数据存储与处理生成成绩报告单的第一步是存储和处理学生成绩数据。常见的数据存储方式包括CSV文件、Excel文件和数据库。
Java SE与Java EE的区别 Tech Synapse java java-ee 前端
一、javase与javaee的区别在于领域不同和作用不同：1.领域不同：javase为平台标准版，可供任何领域使用。javaee为平台企业版，主要供应企业的使用。2.作用不同：javase提供了开发与运行Java软件的编译器等开发工具、软件库及Java虚拟机。它也是Java2平台、企业版本和Java网页服务的基础。编写一次、随处运行”的特性、方便存取数据库的JDBCAPI、CORBA技术以及能够
Error querying database. Cause: java.lang.IllegalArgumentException: Mapped Statements collection do leaftong java 数据库 mybatis
项目场景：背景：在练习mybatis的对象映射时，设置了一个嵌套查询
【Blazor】使用C#替代Java编写代码的前端开发框架雕技小虫系统开发 Windows Server Blazor .NET 前端开发框架 webassembly
Blazor是微软于2019年下半年开始陆续全新推出的前端开发框架。优势无需插件，基于Web标准可与JavaScript交互利用.NETCore优势Blazor有两个版本：Server||WebAssemblyBlazorServer可以理解为在服务器上运行的Blazor，客户端与服务器间通过SignalR实进通信，2019年09月正式发布。BlazorWebAssembly2020年05月正式发
自定义HTTPS证书用于内网环境小时候的阳光运维 https 证书内网自定义 nginx
自定义HTTPS证书用于内网环境，记录一下简单步骤，方便后面查看自定义HTTPS证书通常用于开发和测试环境，而不是生产环境，因为自签名证书不会被浏览器和操作系统默认信任，自签名证书主要用于内网加密。以下是创建自签名HTTPS证书的步骤：1.安装OpenSSL确保你的系统上安装了OpenSSL。大多数Linux发行版和macOS都预装了OpenSSL。对于Windows，你可能需要手动安装。2.生成
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户

为什么 Google 和 Facebook 不用 Docker

你可能感兴趣的:(java,编程语言,linux,大数据,xhtml)