红豆和绿豆

Docker 在分布式和大数据框架中的应用

Docker 是一个用来编译、迁移和执行分布式应用程序的开源容器引擎，这种容器技术为开发人员和运维人员带来了一种全新的体验。程序的发布方式可以变得非常简单，程序的运行环境也可以拥有系统级别的安全隔离。从 Docker 开源社区的火热程度大家就可以体会到，Docker 为程序的发布和运行带来了极大的便利。本文将从实际应用出发，介绍如何将 Docker 集成到分布式和大数据产品中。

简介

Docker 容器技术也是一种虚拟化技术，相比 KVM，VMWare 虚拟机，Docker 实现了一种轻量的虚拟化技术，具有很好的性能和安全性。基于 Docker 可以实现 CaaS（Containers as a Service）微服务架构，一般一个应用程序会提供多个服务，包括内部服务和外部服务，将所有的服务单独用容器包装起来，分别部署和运行，这样简化了整个应用程序维护的复杂度，同时解耦了模块之间的耦合性，便于不同模块单独开发和维护升级。

表 1.Docker 相关的术语

术语	简述
Docker	Docker 是一个开源的应用容器引擎，让开发者可以打包他们的应用以及依赖包到一个可移植的容器中，然后发布到任何流行的 Linux 机器上，也可以实现虚拟化。
Docker Container	Docker 容器由 Docker 镜像创建，Docker 容器持有应用程序运行所需要的所有环境。Docker 容器有 run，started，stopped，moved，和 deleted 这几种状态，每一个容器是一个隔离的，安全的应用程序运行平台，Docker 容器是 Docker 运行的组件。
Docker Image	一个 Docker 镜像是一个只读的模板，例如，一个容器可以包含一个 Ubuntu 操作系统和 Apache 程序。一个 Docker 镜像可以用来创建多个 Docker 容器。Docker 提供了简单的方式去编译一个新的 Docker 镜像或者更新一个新的镜像，同时可以从 Docker Registry 下载不同的镜像。
Docker Registry	Docker 仓库是 Docker 官方提供的一个开源程序，用来存储和分发 Docker 镜像。
Docker Hub	Docker 官方提供的公有 Docker Registry。

Docker 解决方案主要体现在如下三个方面：

编译

Docker 允许您用微服务方式组织您的应用程序，而不用担心上线环境和测试环境不一致，并且不用关心运行平台和语言，Docker 镜像是跨平台的，真正实现一次编译，到处运行。

装运

通过 Docker 可以设计应用程序开发，测试，发布的整个周期，并且用统一的用户接口去管理，Docker 提供了两个非常重要的概念，Docker 容器和 Docker 镜像，目前几乎成为企业标准。

运行

Docker 可以部署可扩展的服务，Docker 容器具有很好的隔离性，程序运行在 Docker 容器中更加安全可靠，可以部署运行在各种 Linux X64 平台上。

下面以一个典型的 Web 应用程序为例，来说明 Docker 如何用来发布和运行应用程序。通常 Web 程序包含一个或多个 Apache 程序用来对外提供服务，一个存储模块为 Apache 提供服务，一个数据库服务，之前这些服务都是安装在物理机上，需要在物理机上配置好权限和运行时环境，而且确保不同的程序之间的依赖不存在冲突（比如：不同的程序有可能需要不同 Python 版本）。如果使用 Docker，我们只需要在物理机上安装 Docker，将 Apache 和 Redis 应用放在单独的 Docker 镜像中。Docker 镜像可以用私有 Docker Registry 来存储和分发，Private Docker Registry 可以从 Docker Hub 同步一些镜像，这样 Docker host 在下载 Docker 镜像的时候可以直接从 Private Docker Registry 下载，速度会比较快。数据库这种基础数据服务可以不用放在 Docker 容器里面运行。这样搭建起来的应用程序结构清晰，升级以及管理维护会很简单（只需要更新 Docker Registry 中的 Docker 镜像即可）。

图 1. 程序部署模型

回页首

安装 Docker

由于 Docker 是基于 cGroup，namespace 等 Linux 内核技术实现对 Linux Container 的管理引擎，目前运行在 64 位的系统架构上，Docker 目前最新版本为 1.11.1，需要内核版本为 3.10 及以上，系统版本过低需要升级内核版本或更换系统。本文以企业最常用的 RedHat7.1 操作系统为例，来说明 Docker 的安装过程，其它操作系统请参考 Docker 官方文档。

1. 检查内核版本

$ uname -r
3.10.0-229.el7.x86_64

2. 安装 Docker

Docker 从 1.10 版本开始需要依赖 libsystemd 209 版本，如果低于版本，可以选择安装 Docker 1.9.1 版本。

$ sudo tee /etc/yum.repos.d/docker.repo <<-EOF
[dockerrepo]
name=Docker Repository
baseurl=https://yum.dockerproject.org/repo/main/centos/7
enabled=1
gpgcheck=1
gpgkey=https://yum.dockerproject.org/gpg
EOF

$ sudo yum install -y docker-engine-1.9.1
Loaded plugins: langpacks, product-id, subscription-manager

……

Installed:
 docker-engine.x86_64 0:1.9.1-1.el7.centos 

Dependency Installed:
 audit-libs-python.x86_64 0:2.4.1-5.el7 checkpolicy.x86_64 0:2.1.12-6.el7 
                docker-engine-selinux.noarch 0:1.11.1-1.el7.centos 
                     libcgroup.x86_64 0:0.41-8.el7 libsemanage-python.x86_64 0:2.1.10-16.el7 
 policycoreutils-python.x86_64 0:2.2.5-15.el7 python-IPy.noarch 0:0.75-6.el7 
                                                  setools-libs.x86_64 0:3.3.7-46.el7 

Complete!

3. 运行 Docker 服务并验证

$ sudo chkconfig docker on
Note: Forwarding request to 'systemctl enable docker.service'.
ln -s '/usr/lib/systemd/system/docker.service' '/etc/systemd/system/
                              multi-user.target.wants/docker.service'

$ sudo service docker start
Redirecting to /bin/systemctl start docker.service

$ docker run hello-world
Unable to find image 'hello-world:latest' locally
latest: Pulling from library/hello-world
79112a2b2613: Pull complete 
4c4abd6d4278: Pull complete 
Digest: sha256:4f32210e234b4ad5cac92efacc0a3d602b02476c754f13d517e1ada048e5a8ba
Status: Downloaded newer image for hello-world:latest

Hello from Docker.
This message shows that your installation appears to be working correctly.

To generate this message, Docker took the following steps:
 1. The Docker client contacted the Docker daemon.
 2. The Docker daemon pulled the "hello-world" image from the Docker Hub.
 3. The Docker daemon created a new container from that image which runs the
 executable that produces the output you are currently reading.
 4. The Docker daemon streamed that output to the Docker client, which sent it
 to your terminal.

To try something more ambitious, you can run an Ubuntu container with:
 $ docker run -it ubuntu bash

Share images, automate workflows, and more with a free Docker Hub account:
 https://hub.docker.com

For more examples and ideas, visit:
 https://docs.docker.com/engine/userguide/

打包应用程序到 Docker 镜像中

将应用程序运行在 Docker 中首先要考虑的问题就是如何将应用程序相关的文件打包到 Docker image 中。在 Docker 容器中访问文件有两种方式：一种不用拷贝文件到 Docker image，直接在 Docker container 启动的时候 mount 到 Docker container 中（docker run -v /host_data:/container_dir）；另一种就是 build Docker image 的时候直接将相关文件拷贝到 Docker image 中。对于以 Docker image 方式发布整个应用程序的场景来说，还是需要构建一个新的 Docker image 并且将所有相关文件和运行时依赖拷贝到 Docker image 中。

一般来说，可以通过 Docker Packer 或者 Dockerfile 来构建新的 Docker Image，本节通过 Docker CLI，使用 Dockerfile 来构建 Docker Image。

构建产品安装包的 Dockerfile：

FROM rhel
# RUN 命令可以执行 Linux 命令，用来向 image 中安装软件，改变 linux 配置等
# 同时可以安装 ssh-server 和其它 tools
# 配置 ssh 并确保 ssh 服务正确运行
RUN useradd -m usera \
 && yum install -y openssh-server which net-tools sudo wget hostname tar openssh-clients \
 && sed -i 's/UsePAM yes/UsePAM no/g' /etc/ssh/sshd_config \
 && ssh-keygen -t dsa -f /etc/ssh/ssh_host_dsa_key \
 && ssh-keygen -t rsa -f /etc/ssh/ssh_host_rsa_key \
&& mkdir /var/run/sshd
# ADD 命令用来将宿主机上的文件拷贝到容器中
ADD user.dat /opt/user.dat
# 对于比较大的安装包，一般采用网络下载的方式传输到镜像中，安装完后在同一行进行删除
# 每一个 Dockerfile 中的命令会在 Docker image 中生成一个新 layer，
# 在后面生成的 layer 中对文件的删除不会减少 image 的大小，
# 所以为了保证生成的 image 尽可能的小，把尽可能多的操作在同一个 RUN 命令中完成。
RUN wget -O wget -O /opt/pssasetup.bin https://www.myprivate.com/pssasetup.bin --no-check-certificate \
 && /opt/pssasetup.bin --quiet \
 && rm -f /opt/pssasetup.bin
USER usera
EXPOSE 22
CMD ["/usr/sbin/sshd", "-D"]

使用命令来构建 Docker 镜像：

$ docker -t myimage –f ./Dockerfile /opt

查看镜像已经构建成功：

$ docker images
REPOSITORY TAG IMAGE ID CREATED VIRTUAL SIZE
myimage latest dfe4a9ffe0f8 3 weeks ago 641 MB

Docker image 构建成功后，可以将该 image 发布到 Docker registry 中，便于集群中的其它 host 访问，下面会介绍如何搭建私有 Docker registry。

搭建 Docker Registry

默认情况下，用 Docker 镜像启动 container 的时候，Docker daemon 首先检查本地是否已经有该 Docker image，如果没有就从 Docker hub 下载。如果 image 名称带有私有 Docker registry 前缀，比如：127.0.0.5:5000:/ubuntu，那么 Docker daemon 会直接从私有 Docker registry 127.0.0.5:5000 下载 image。如果 Docker hub 和私有 Docker registry 都不能访问，还可以通过 docker save/docker load 命令以 tar 文件的方式导出/导入 Docker image 到不同的机器上去。

Docker提供了仓库管理的程序，用户可直接通过启动registry容器来部署私有仓库服务，registry程序会把Docker image存储在容器目录/var/lib/registry下，如果想要将regitry中的image存储到本机，可以mount一个本机目录到容器该目录（启动容器的时候通过参数-v /opt/registry: /var/lib/registry），默认情况下，registry采用5000端口作为服务端口，我们通过端口映射（-p 5000:5000）将容器的5000端口映射到本机的5000端口。

后台启动 registry 服务：

$ docker run -d --restart=always -v /opt/registry:/var/lib/registry -p 5000:5000 registry:2.1.1 
Unable to find image 'registry:2.1.1' locally
2.1.1: Pulling from library/registry
c63fb41c2213: Pull complete 
99fcaefe76ef: Pull complete 
5a4526e952f0: Pull complete 
1d073211c498: Pull complete 
b7bd2ae93cea: Pull complete 
d2c7f83c9942: Pull complete 
4ed3b9c6a5db: Pull complete 
ea256384d56e: Pull complete 
beda0ae408b7: Pull complete 
30c0b9757d78: Pull complete 
5d165b8e4b20: Pull complete 
Digest: sha256:4a9bc5424fa7cc4fafd88b5d8dfb102ceb339e8f418fdeca7f094c86db284f1c
Status: Downloaded newer image for registry:2.1.1
ea945cc2db69eb5f62f61b013863a9312a0a0fbdde0116577582ff38b90c144a

registry 服务启动后其实是在后台启动了一个容器，Docker 官方已经把 registry 相关的程序打包到名为 registry 的 docker image 中，这样用户可以很方便的部署和启动 registry 程序，通过 Docker image 打包发布程序也是目前比较流行的做法，有好多开源产品将自己的产品打包并在 Docker hub 中发布，比如 Docker 的第三方网络管理软件 weave，可以在 Docker hub 中 search 到 weaveworks 相关的 image。

$ docker search weaveworks
NAME DESCRIPTION STARS OFFICIAL AUTOMATED
weaveworks/scope Weave Scope - Monitoring, visualisation & ... 8 
weaveworks/weave Weave Net - container networking and servi... 8

查看 registry 容器处于运行状态。

$ docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
ea945cc2db69 registry:2.1.1 "/bin/registry /etc/d" 
                      7 seconds ago Up 5 seconds 0.0.0.0:5000->5000/tcp fervent_archimedes

registry 容器启动后，本机的 5000 端口映射到容器的 5000 端口，查看本机和容器都有一个 5000 端口的监听。registry 提供 REST 接口，可以输入网址访问 http://9.21.60.110:5000/v2/。

$ netstat -anp | grep 5000
tcp6 0 0 :::5000 :::* LISTEN 29687/docker-proxy

$ docker exec ea945cc2db69 netstat -anp | grep 5000
tcp6 0 0 :::5000 :::* LISTEN 1/registry 
图 2.Web 访问私有仓库

图 2.Web 访问私有仓库

接下来向这个 registry 服务中 push 一个 image，首先将需要 push 的 image 打个 tag，这个 tag 会成为该镜像在新的 registry 的名称。

为镜像 rhel 打 tag 并以 registry 地址作为前缀。

$ docker tag rhel 9.21.61.131:5000/rhel

通过 docker push 命令将 image 传输到仓库中。

$ docker push 9.21.61.131:5000/rhel 
The push refers to a repository [9.21.61.131:5000/rhel] (len: 1)
95612a3264fc: Pushed 
latest: digest: sha256:fbffddc419984335aa428abf11169f996618fe02a4954c28454daab5686dfdcc size: 1569

如果在其它机器上 push 的时候可能会失败，原因是与私有仓库的默认交互方式是 https，而私有仓库主机只提供 http 服务。可以在客户端 Docker 的启动配置文件中加入参数：-–insecure-registry=9.21.61.131:5000 来规避这个问题：

$ vi /usr/lib/systemd/system/docker.service
[Service]
Type=notify
ExecStart=/usr/bin/docker daemon -H fd:// --insecure-registry=9.21.61.131:5000

重启 Docker
$ systemctl daemon-reload
$ service docker restart

再次上传 Docker 镜像即可成功。

在其它机器上，我们通过带有 registry 地址前缀的这个新名称来访问这个镜像。

$ docker images 9.21.61.131:5000/rhel 
REPOSITORY TAG IMAGE ID CREATED VIRTUAL SIZE
9.21.61.131:5000/rhel latest 95612a3264fc 6 weeks ago 203.3 MB

访问 registry 的 REST 接口可以看到镜像列表：

图 3.Web 查询私有仓库镜像

回页首

Docker 与其他产品集成

Docker 使用 C/S 架构，Docker 引擎（Docker Daemon）作为服务器端，主要用来构建、发布、分发和运行 Docker 容器；而 Docker 客户端，目前提供 CLI 和 Remote API 两种方式，通过对 Docker Daemon 的通信，来控制管理远程服务器的进程。如下图所示，其中 Docker 客户端和 Server 可以运行在同一系统上，也可以通过 Docker 客户端连接远程的 Docker Daemon，他们之间主要通过 Socket 和 RESTful API 进行通信。

图 4. Docker 架构模型

Docker CLI 是作为 Docker 的主要客户端，主要负责与 Docker 引擎进行通信，从而构建、发布和管理 Docker 容器。

Docker-py 是另一个开源项目，它通过 Python 实现了对 Docker REST API 访问的封装，可以实现和 Docker CLI 相同的功能，如镜像的下载、安装、容器的运行、停止等管理，从而实现与 Docker 的集成。

下面将结合具体的企业级产品 IBM Platform Symphony 及开源 Hadoop Yarn 说明 Docker 如何与产品集成。

通过 docker-py 集成 Docker 到产品中（IBM Platform Symphony）

IBM Platform Symphony 是一款强大的企业级管理软件，用于在可扩展的共享网格上运行各种各样的分布式应用程序和大数据分析。它可加速数十个同时运行的应用，以加快实现成果并更好地利用所有可用资源。本节主要以 IBM Platform 为例，说明 Docker 如何通过 docker-py 集成到产品中去的。

在负载调度和管理方面，客户端通过 Symphony 提供的 API 发送计算请求并等待接收计算结果。Symphony 初始化 Service 并运行 Client 的请求，从 Service 得到结果再传递回 Client。

Service Session Manager (SSM) 负责连接 client application 和计算节点之间的任务输入输出，从 EGO 获得 session 需要的资源、记录状态和 session、task 的进展情况，管理 SIM 的生命周期，管理与 resource manager 的交互。Service 实例化之后产生一个 service instance manager。SIM 是被 SSM 创建和销毁的，它开始和管理一个 service instance 的生命周期并监控实例的健康运行，传送 session manager 和 service instance 之间的数据。

图 5.IBM Symphony Platform 组件交互图

IBM Platform Symphony 通过 Docker-py API，与 Docker Daemon 进行通信，将每一个 Service 运行在 Docker 容器里面，并且这些容器以不同的 OS 和用户运行。针对多 Application 的情况，将 Service 运行在 Docker Container 中，也可以充分利用 Docker Container 在隔离上的的优势，使 Service 运行具有更好的安全性。

如下图所示，一个 Host 上运行着多个 Service，之前这些 Service 直接由 SIM（Service Instance Manager）启动，现在 SIM 直接启动 Docker container，Service 运行在 container 中。

图 6.IBM Platform Symphony Service 运行方式

Docker 的 API 有版本号，通过 docker version 命令查看可以看到 docker 1.9.1 使用的 API version 为 1.21，对应的 docker-py 版本为 1.7.2。

$ docker version
Client:
 Version: 1.9.1
 API version: 1.21
 Go version: go1.4.2
 Git commit: a34a1d5
 Built: Fri Nov 20 13:25:01 UTC 2015
 OS/Arch: linux/amd64

Server:
 Version: 1.9.1
 API version: 1.21
 Go version: go1.4.2
 Git commit: a34a1d5
 Built: Fri Nov 20 13:25:01 UTC 2015
 OS/Arch: linux/amd64

下载 docker-py-1.7.2 并安装，安装需要 Python 版本大于 3.5。

$ ../Python-3.5.0/python ./setup.py install

Docker-py 通过 Socket 与 Docker Daemon 建立连接，Docker Daemon 启动时打开的 Socket 为 unix:///var/run/docker.sock，使用该 Socket 连接 Docker Daemon 并列出本机 Docker image（对应于 docker images 命令）。

$ ../Python-3.5.0/python
Python 3.5.0 (default, May 11 2016, 10:42:46) 
[GCC 4.8.5 20150623 (Red Hat 4.8.5-4)] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> from docker import Client
>>> client = Client(base_url='unix://var/run/docker.sock')
>>> for img in client.images() :
... print("%s" % img['RepoTags'])
... 
['myimage:latest']
['docker.io/weaveworks/weave:1.5.0']
['docker.io/weaveworks/plugin:1.5.0']
['docker.io/weaveworks/weaveexec:1.5.0']
['docker.io/weaveworks/weavedb:latest']
['docker.io/busybox:latest']

通过 docker-py 接口查找 Docker hub 中的 image。

$ ../Python-3.5.0/python 
Python 3.5.0 (default, May 11 2016, 10:42:46) 
[GCC 4.8.5 20150623 (Red Hat 4.8.5-4)] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> from docker import Client
>>> client = Client(base_url='unix://var/run/docker.sock')
>>> for img in client.search('ibm-java'):
... print("%s (%s)" % (img['name'], img['star_count']))
... 
stackinabox/ibm-java (0)
apexits/ubuntu-was-liberty-8.5.5-ibm-jdk8 (0)
>>>

用 docker-py 集成 Docker 最重要的是用来管理（启动和停止）容器，下面我们来看下如何用 docker-py 接口启动一个容器，通过 Docker 命令启动容器只需要用到一个 docker run 命令，而通过 remote API 启动容器需要用到两个接口 client.create_container 和 client.start(container)。这样如果有些容器不需要启动，则可以只创建出来，能够节省空间。像有些容器只用来存储数据，则只需要创建出来，不需要启动。

>>> imgs = client.images(cfilters={'RepoTags':'r`ubuntu'}) # Retrieve image reference
>>> len(imgs)
1
>>> iid = imgs[0]['Id'] # Obtain Image ID
>>> container = client.create_container(iid) # Create Container
>>> container
{u'Id': u'd965a507...', u'Warnings': None}
>>> client.start(container) # Start Container
# Or you can run container this way
>>> container = client.run(image=iid, name='my-container')
>>> container
{u'Id': u'169ac0d341a5a...', 'name': 'my-container', u'Warnings': None}

将程序运行在容器中需要考虑的元素有：镜像、容器用户、容器网络（采用 host mode network 使 Service Instance 具有和之前相同的网络环境）以及容器需要 mount 的文件目录。为了用户直观方便地使用这种功能，Symphony 通过 PMC 提供了这种配置界面，通过 GUI 页面配置不同的 Docker Container 定义，如下图所示。

图 7. 通过 Docker Container 定义配置页面

通过 Docker CLI 集成 Docker 到产品中（Open Source YARN）

作为下一代新的 MapReduce 框架 YARN，把资源调度和 task 管理监控分离开来，由资源管理器 Resource Manager 负责资源调度，每一个 application(job) 由一个 App Master 负责对 task 进行调度管理监控，并且可以监控 App Master 的状态，Node Manager 主要负责节点上的资源管理，启动 Container 运行 task 计算，上报资源、container 情况给 RM 和任务处理情况给 AM。

图 8.YARN 的架构模型

Docker 基于 Linux Container 技术整合了一组易用的接口用于构建非常轻量级的虚拟机。Docker Container Executor（DCE）使得 Yarn Node Manager 服务可以将其 container 进程运行在 Docker 容器中。这样可以有以下好处：

1. 用户可以定制 Yarn Container 的运行环境。

用户可以自定义运行 Yarn container 的 Docker 镜像，定制安装不同版本的软件包，如 Perl、Python、Java 等，而不用担心与其他运行环境的冲突。

2. Node Manager 与 Yarn Container 环境的隔离

在传统的 Yarn 环境中，Node Manager 对 Yarn Container 进行监管，且须运行在同一个机子上。他们之间的环境是共享的。而通过在 Docker Container 中指定运行作业所需要的环境和依赖库，将 Node Manager 和 Yarn Container 运行其中，实现了它们真正意义上的物理隔离。

Docker Container Executor 只能在非 Kerberos（安全）模式的 Yarn 和 HDFS 中运行，一旦 DCE 检测到运行在安全模式下，服务会立刻退出。

DCE 需要 Node Manager 节点上运行着 Docker 服务和 Docker client 用于启动 Docker container。且 Node Manager 和 Container 就是通过 Docker CLI 的方式来启动。

Yarn 启动的 Docker 容器同样使用了 host 模式的网络，同时 mount 了 log 目录、工作目录和一些本地目录到容器中，将这些参数全部拼在 docker run 的命令行中用 shell 启动。

Yarn 中启动 Docker Container 的代码示例：

 public int launchContainer(Container container,
 Path nmPrivateContainerScriptPath, Path nmPrivateTokensPath,
 String userName, String appId, Path containerWorkDir,
 List localDirs, List logDirs) throws IOException {
 String localDirMount = toMount(localDirs);
 String logDirMount = toMount(logDirs);
 String containerWorkDirMount = toMount(
                        Collections.singletonList(containerWorkDir.toUri().getPath()));
 StringBuilder commands = new StringBuilder();
 String commandStr = commands.append(dockerExecutor)
 .append(" ")
 .append("run")
 .append(" ")
 .append("--rm --net=host")
 .append(" ")
 .append(" --name " + containerIdStr)
 .append(localDirMount)
 .append(logDirMount)
 .append(containerWorkDirMount)
 .append(" ")
 .append(containerImageName)
 .toString();
 String dockerPidScript = "`" + dockerExecutor + " inspect 
                          --format {{.State.Pid}} " + containerIdStr + "`";
 // Create new local launch wrapper script
 LocalWrapperScriptBuilder sb =
 new UnixLocalWrapperScriptBuilder(containerWorkDir, commandStr, dockerPidScript);
 Path pidFile = getPidFilePath(containerId);
 if (pidFile != null) {
 sb.writeLocalWrapperScript(launchDst, pidFile);
 } else {
 LOG.info("Container " + containerIdStr
 + " was marked as inactive. Returning terminated error");
 return ExitCode.TERMINATED.getExitCode();
 }
 
 ShellCommandExecutor shExec = null;
 try {
 lfs.setPermission(launchDst,
 ContainerExecutor.TASK_LAUNCH_SCRIPT_PERMISSION);
 lfs.setPermission(sb.getWrapperScriptPath(),
 ContainerExecutor.TASK_LAUNCH_SCRIPT_PERMISSION);

 // Setup command to run
 String[] command = getRunCommand(sb.getWrapperScriptPath().toString(),
 containerIdStr, userName, pidFile, this.getConf());
 if (LOG.isDebugEnabled()) {
 LOG.debug("launchContainer: " + commandStr + " " + Joiner.on(" ").join(command));
 }
 shExec = new ShellCommandExecutor(
 command,
 new File(containerWorkDir.toUri().getPath()),
 container.getLaunchContext().getEnvironment()); // sanitized env
 if (isContainerActive(containerId)) {
 shExec.execute();
 } else {
 LOG.info("Container " + containerIdStr +
 " was marked as inactive. Returning terminated error");
 return ExitCode.TERMINATED.getExitCode();
 }
}

需要以下步骤来确保 Node Manager 和 Application Master 运行在 Docker Container 中。

步骤一，下载 Docker 镜像

为了避免超时，作业依赖的 Docker 镜像必须在 Node Manager 启动前预先下载好，运行以下命令下载 Hadoop docker 镜像：

# sudo docker pull sequenceiq/hadoop-docker:2.4.1

步骤二，配置 yarn-site.xml

在 yarn-site.xml 中增加如下配置：


 yarn.nodemanager.docker-container-executor.exec-name
  /usr/bin/docker
  
 Name or path to the Docker client. This is a required parameter. If this is empty,
     user must pass an image name as part of the job invocation(see below).  
  

  

  yarn.nodemanager.container-executor.class
  org.apache.hadoop.yarn.server.nodemanager.DockerContainerExecutor
  
     This is the container executor setting that ensures that all
jobs are started with the DockerContainerExecutor.

需要集群管理员注意目前 DCE 不提供用户命名空间隔离，这意味着在 Yarn container 中以 root 用户运行的程序会获得 Node Manager 的 root 权限，换句话说，DCE 目前没有提供比 Yarn 默认的 Container Executor 更好的安全保证。

步骤三：提交作业

hadoop jar $HADOOP_PREFIX/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0.jar \
 teragen \  
  -Dmapreduce.map.env="yarn.nodemanager.docker-container-executor.image-name=
                            sequenceiq/hadoop-docker:2.4.1" \  
 -Dyarn.app.mapreduce.am.env="yarn.nodemanager.docker-container-executor.image-name=
                             sequenceiq/hadoop-docker:2.4.1" \
  1000 \  
  /teragen_out_dir

在执行过程中，我们可以 check node manager 上的 container 状态：

# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
c8168112dc78 sequenceiq/hadoop-docker:2.4.1 "bash /tmp/hadoop-roo" 
                                    6 seconds ago Up 4 seconds container_1462644399680_0001_01_000003

执行成功后，可以在 yarn 的日志中验证 Docker 启动的 containers。

回页首

结束语

随着 Docker 容器技术带来的革命，分布式和大数据产品如何与 Docker 容器集成成为了一个持续关注的焦点话题。Docker 提供了两种与外界的交互方式，Command Line 和 docker-py，本文以 IBM Platform Symphony 和 Open Source 的 Yarn 为例，来说明如何有效的利用这两种方式将现有产品与 Docker 容器集成起来，从而阐述集成 Docker 容器所带来的优势。不过，目前 Docker 集成还有需要改进的空间，比如安全和网络方面的问题，同时集成方案仍未十分成熟，仍然需要完善和进一步改进，希望未来可以得到更多的关注和发展。

你可能感兴趣的:(docker)

亲测centos7安装docker可用 a4132447 云原生 docker linux 运维
1.配置yum下载源为aliyun源yum-config-manager--add-repohttps://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo备份当前的yum源mv/etc/yum.repos.d/CentOS-Base.repo/etc/yum.repos.d/CentOS-Base.repo.backup下载新的Ce
使用 Docker 基本命令创建并发布带有新功能的镜像到阿里云 2021级计算机网络技术2班梁嘉敏 docker 阿里云容器
1.关于Docker镜像1.基础假定您在开发一个网上商城，您使用的是一台笔记本电脑而且您的开发环境具有特定的配置。其他开发人员身处的环境配置也各有不同。您正在开发的应用依赖于您当前的配置且还要依赖于某些配置文件。此外，您的企业还拥有标准化的测试和生产环境，且具有自身的配置和一系列支持文件。您希望尽可能多在本地模拟这些环境而不产生重新创建服务器环境的开销。请问？您要如何确保应用能够在这些环境中运行和
容器docker k8s相关的问题汇总及排错 weixin_43806846 docker kubernetes 容器
1.明确问题2.排查方向2.1、docker方面dockerlogs-f容器IDdocker的网络配置问题。2.2、k8s方面node组件问题pod的问题（方式kubectldescribepopod的名称-n命名空间&&kubectllogs-fpod的名称-n命名空间）调度的问题（污点、节点选择器与标签不匹配、存储卷的问题）service问题（访问不了，ingress的问题、service标签
Maven 与 Docker 集成：构建 Docker 镜像并与容器化应用集成 drebander docker maven docker
在现代软件开发中，容器化已成为一种流行的部署和运行应用程序的方式。通过将应用程序及其所有依赖打包成Docker镜像，开发者可以确保应用能够在不同的环境中一致地运行。而Maven是广泛使用的构建工具，能够帮助管理项目的构建、依赖和发布。本文将介绍如何使用Maven构建Docker镜像，并将其与容器化应用集成，以便于自动化部署和管理。1.Maven与Docker集成概述Maven可以通过插件来构建Do
pgAdmin4在mac m1上面简单使用（Docker）亚林瓜子 macos docker 容器 pg pgAdmin4 postgredql GUI
问题想要在本地简单了解一下pgAdmin4一些简单功能。故需要在本机先安装看一看。安装步骤拉取docker镜像dockerpulldpage/pgadmin4直接简单运行pgAdmin4dockerrun--namepgAdmin4-p5050:80\-e"[email protected]"\-e"PGADMIN_DEFAULT_PASSWORD=Supe
docker配置Redis主从复制原理及操作纪佰伦 docker redis 主从分布式
一、前言要配置Redis主从复制，我默认是了解过Redis的持久化功能的，也就是RDB和AOF，只需要简单了解过即可。持久化的一个作用就是可以定期将内存中的数据备份到硬盘，在系统发生故障的时候，也可以通过持久化文件回复数据，二、关于主从复制1、什么是主从复制主从复制是一种分布式系统数据同步技术，其中主服务器负责处理所有写操作并将变更同步到一个或多个从服务器。从服务器接收这些变更并复制主服务器的数据
03.Docker 命令帮助转身後默落 Docker docker eureka 容器
Docker命令帮助Docker命令帮助1.docker命令帮助2.docker优化Docker命令帮助docker命令是最常使用的docker客户端命令，其后面可以加不同的参数以实现不同的功能。1.docker命令帮助官方文档：https://docs.docker.com/reference/cli/docker/docker[OPTIONS]COMMANDCOMMAND分为:Manageme
Fastgpt本地或服务器私有化部署常见问题泰山AI AI大模型应用开发 fastgpt rag llm
一、错误排查方式遇到问题先按下面方式排查。dockerps-a查看所有容器运行状态，检查是否全部running，如有异常，尝试dockerlogs容器名查看对应日志。容器都运行正常的，dockerlogs容器名查看报错日志带有requestId的，都是OneAPI提示错误，大部分都是因为模型接口报错。无法解决时，可以找找Issue，或新提Issue，私有部署错误，务必提供详细的日志，否则很难排查。
FastGPT接入向量模型 M3E 和重排模型 bge-reranker-large 福葫芦 M3E M3E FASTGPT
一、FastGPT接入向量模型M3E1.拉取m3e镜像#GPU模式启动，并把m3e加载到fastgpt同一个网络dockerpullregistry.cn-hangzhou.aliyuncs.com/fastgpt_docker/m3e-large-api2.查看镜像dockerimages可以按照有一个名称为registry.cn-hangzhou.aliyuncs.com/fastgpt_do
在Linux上安装和使用Docker 向着开发进攻 linux linux docker
在Linux上安装和使用Docker：一步步指南Docker是一种流行的容器化平台，它可以帮助开发者轻松构建、部署和运行应用程序。在本文中，我们将介绍如何在Linux系统上安装Docker，并提供一些常用的Docker命令和使用说明。1.安装DockerUbuntu系统更新包索引并安装必要的软件包以允许apt通过HTTPS使用存储库：sudoaptupdatesudoaptinstallapt-t
使用nginx+rtmp+ffmpeg实现桌面直播 handsomestWei 后端 nginx ffmpeg rtmp live直播推流拉流
使用nginx+rtmp+ffmpeg实现桌面直播流媒体服务器搭建dockerrundocker镜像基于添加了rtmp模块的nginx，和ffmpegdockerpullalfg/nginx-rtmpdockerrun-d-p1935:1935-p8080:80--name=nginx-rtmpalfg/nginx-rtmprtmp模块说明进入容器内部查看dockerps|grepalfg/ngi
在Linux系统下修改Docker的默认存储路径讓丄帝愛伱 Linux 环境 linux docker 运维
在Linux系统下修改Docker的默认存储路径可以通过多种方法实现，下边是通过修改daemon.json文件方式实现查看当前Docker存储路径使用命令dockerinfo|grep"DockerRootDir"查看当前Docker的存储路径，默认为/var/lib/docker停止Docker服务#停止Docker服务，以确保数据一致性sudosystemctlstopdocker#查看doc
Docker 私有仓库 Harbor 详解 drebander docker docker 容器运维
1.什么是Harbor？Harbor是一个开源的Docker镜像仓库管理平台，旨在提供更强大的企业级功能，支持私有Docker镜像仓库的管理。Harbor为Docker提供了集中式的镜像管理服务，支持用户和权限管理、镜像版本控制、安全扫描、LDAP集成等功能，是Docker镜像管理的最佳选择之一，特别适合需要高安全性、可扩展性的生产环境。Harbor的主要特点：企业级安全性：提供镜像扫描、安全策略
k8s篇-应用持久化存储（PV和PVC） jiam明 Kubernetes c语言开发语言后端
一、Volume一般来说，容器一旦被删除后，容器运行时内部产生的所有文件数据也会被清理掉，因此，Docker提供了Volume这种方式来将数据持久化存储。可以说，Volume是Pod与外部存储设备进行数据传递的通道，也是Pod内部容器间、Pod与Pod间、Pod与外部环境进行数据共享的方式。实际上，这个Volume也只是宿主机上本地磁盘中的一个目录，也就是说，volume方式是将容器里面的数据都保
如何使用 Docker 搭建 FastAPI 环境, 本地仅编辑代码 Acaibird. eureka 云原生
在开发FastAPI应用时，我们有时希望将应用容器化，以便于部署和管理，同时避免污染本地的Python环境。使用Docker可以轻松实现这一目标，但如果你想在容器中安装依赖并进行调试，如何在不破坏本地环境的情况下管理依赖呢？本文将介绍如何通过Docker将FastAPI应用容器化，并展示如何进入容器安装依赖。1.项目结构假设你已经有一个简单的FastAPI项目结构，主要包含以下文件：Dockerf
Docker 安全基础：权限、用户、隔离机制 drebander docker docker 安全容器
Docker是一个强大的容器化平台，广泛用于开发、部署和运行应用。由于Docker提供了强大的隔离性和便捷的容器管理功能，它成为了现代DevOps和微服务架构的重要组成部分。然而，随着Docker在生产环境中的广泛应用，容器的安全性也变得至关重要。在本文中，我们将探讨Docker的权限管理、用户管理以及隔离机制，帮助开发者更好地理解和实施Docker安全最佳实践。1.Docker安全基础概述Doc
ceph nautilus(14.2.22) 通过ansible部署grafana无法启动 Ethan@YL 运维 ceph 分布式存储
cephnautilus(14.2.22)通过ansible部署grafana无法启动一、ceph环境ceph版本：nautilus(14.2.22)二、cephansible部署1、在cephansible自动化部署的时候，到最后启动grafanadocker的时候，总是启动不了提示：“Timeoutwhenwaitingforxxx.xxx.xxx.xxx:3000”2、通过查看/var/lo
Scrapy分布式爬虫系统 ivwdcwso 开发运维 scrapy 分布式爬虫 python 开发
一、概述在这篇博文中,我们将介绍如何使用Docker来部署Scrapy分布式爬虫系统,包括Scrapyd、Logparser和Scrapyweb三个核心组件。这种部署方式适用于Scrapy项目和Scrapy-Redis分布式爬虫项目。需要安装的组件:Scrapyd-服务端,用于运行打包后的爬虫代码,所有爬虫机器都需要安装。Logparser-服务端,用于解析爬虫日志,配合Scrapyweb进行实时
使用 Docker 部署 Apache Spark 集群教程努力的小T docker docker spark linux 运维服务器云计算容器
简介ApacheSpark是一个强大的统一分析引擎，用于大规模数据处理。本文将详细介绍如何使用Docker和DockerCompose快速部署一个包含一个Master节点和两个Worker节点的Spark集群。这种方法不仅简化了集群的搭建过程，还提供了资源隔离、易于扩展等优势。前置条件在开始之前，请确保你的环境中已经准备好了以下组件：安装并运行DockerEngine。安装DockerCompos
Ubuntu下配置国内Docker镜像站,加速你的镜像拉取 Aaron own 开发小技巧 windows docker 容器 ubuntu linux
如果执行dockerpull拉取镜像速度慢,可以配置国内镜像站进行加速查看是否已添加镜像站首先执行dockerinfo查看是否有docker镜像站dockerinfo若没有RegistryMirrors字段则表示没有,可新增配置增加配置文件查看/etc/docker/目录下是否存在daemon.json文件ls/etc/docker/若不存在,则可使用如下命令新增sudonano/etc/dock
ubuntu配置docker镜像加速器黑色幽默ma linux ubuntu docker linux
安装docker。安装步骤可参考https://blog.csdn.net/weixin_42412462/article/details/109180600注册阿里云账号，到容器镜像服务这一栏目按照操作文档步骤操作。最后，检测是否安装成功sudodockerinfo
Dify实现text2sql工作流[SQL调用篇]，并查询Postgres数据库 or Mysql数据库(docker容器) 汀、人工智能 LLM工业级落地实践 sql mysql NL2SQL text2sql Dify
Dify实现text2sql，查询Postgres数据库1.Postgres数据库设置1.1.docker-compose.yml修改为了让sandbox容器能够与docker-db-1容器互相通信，你需要确保几个条件得到满足：网络配置：确保sandbox和db都位于同一个Docker网络中。如果它们不在同一个网络中，数据包将无法直接在容器间路由。从你提供的配置来看，sandbox已经定义了一个网
kafka消费能力压测：使用官方工具 ezreal_pan kafka 工具 kafka 分布式
背景在之前的业务场景中，我们发现Kafka的实际消费能力远低于预期。尽管我们使用了kafka-go组件并进行了相关测试，测试情况见《kafka-go:性能测试》这篇文章。但并未能准确找出消费能力低下的原因。我们曾怀疑这可能是由我的电脑网络带宽问题或Kafka部署时的某些未知配置所导致。为了进一步确定问题的根源，我们决定对Kafka的消费能力进行压力测试。在这篇《kafka的Docker镜像使用说明
MacOS Docker 安装指南 froginwe11 开发语言
MacOSDocker安装指南引言Docker是一个开源的应用容器引擎，它允许您将应用程序与基础设施分开，以此快速交付软件。Docker的核心思想是将应用程序及其依赖打包到一个可移植的容器中，然后发布到任何流行的Linux机器上，也可以实现虚拟化。本文将为您详细介绍如何在MacOS系统上安装Docker。安装Docker1.系统要求在开始安装Docker之前，请确保您的MacOS系统满足以下要求：
DeepSeek在linux下的安装部署与应用测试一望无际的大草原 deepseek 后端大模型部署 linux 大模型 deepseek
结合上一篇文章，本篇文章主要讲述在Redhatlinux环境下如何部署和使用DeepSeek大模型，主要包括ollama的安装配置、大模型的加载和应用测试。关于OpenWebUI在docker的安装部署，OpenWebUI官网也提供了完整的docker部署说明，大家可参考github，但对于OpenWebUI前后端分离的部署没有详细说明，这需要修改一部分前后端代码，后面会陆续分享给大家。ollam
静态网页部署docker+nginx CodeWielder 部署 nginx docker docker nginx 前端
静态网页部署docker+nginx1、拉取Nginx镜像dockerpullnginx:latest2、创建nginx临时容器dockerrun-d-p80:80--namenginx-tempnginx:latest3、进入容器内，查看镜像中nginx配置文件目录可省略dockerexec-itnginx-temp/bin/bash#退出容器内部exit4、将nginx配置文件导出到宿主机中m
快速在Ubuntu18.04系统中离线部署深度学习环境高次超静定的人 python docker ubuntu
快速在Ubuntu18.04系统中离线部署深度学习环境本文部署的环境前提为电脑上新装的Ubuntu18.04并且没有联网，一切所需的软件均通过离线包安装，旨在模拟实际项目部署中的过程，文章中提及的资源文件在文章最底部，不包含镜像，根据自己的需要去拉取镜像即可。一、服务器部署流程1、安装显卡驱动cuda、cudnn#安装gcc和makecd~/dockerDeploy/pool&&sudo./ins
Spring生态圈的概要说明志大洋 #开发 Java生态圈 spring 模块说明
《SpringCloud与Docker微服务架构实战》大多数Spring项目都是以“主版本号·次版本号·增量版本号·里程碑版本号”的形式命名版本号的。例如SpringFramework稳定版本4.3.5.RELEASE、里程碑版本5.0.0.M4等。其中，主版本号表示项目的重大重构；次版本号表示新特性的添加和变化；增量版本号一般表示Bug修复；里程碑版本号表示某版本号的里程碑。以下摘抄自《Spri
【异常】docker pull hello-world提示Error response from daemon: Get “https://registry-1.docker.io/v2/“解决本本本添哥 005 -研效与DevOps运维工具链 docker 容器运维
一、报错内容[root@VM-8-8-centos~]#dockerpullhello-worldUsingdefaulttag:latestErrorresponsefromdaemon:Get"https://registry-1.docker.io/v2/":net/http:requestcanceledwhilewaitingforconnection(Client.Timeoutexc
【好玩的Docker项目】使用Docker轻松搭建游戏化编程学习平台江湖有缘玩转小游戏合集 docker 游戏学习
【好玩的Docker项目】使用Docker轻松搭建游戏化编程学习平台前言一、项目介绍1.1项目简介1.2主要特点二、本次实践规划2.1本地环境规划2.2本次实践介绍三、本地环境检查3.1检查Docker服务状态3.2检查Docker版本3.3检查dockercompose版本四、部署游戏编程网站4.1拉取项目容器镜像4.2创建部署目录4.3下载数据4.4解压数据包4.5创建容器4.6查看容器状态4
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(