FanMY_71

[docker]七、docker镜像的制作（超详细）、docker镜像结构原理

1、镜像（images）

1.1、Dockerfile：是制作镜像的文件

2、镜像结构原理

2.1、base 镜像

2.1.1、rootfs

2.1.2、base 镜像提供的是最小安装的 Linux 发行版

2.2、镜像分层

2.2.1、为什么 Docker 镜像要采用这种分层结构呢？

2.3、容器可写层

3、制作镜像

3.1、制作镜像的过程

3.1.1、练习

3.2、Minimize the number of layers，减少层数

3.3、制作镜像的流程中可能会出现的问题

3.4、copy和add的区别

4、若是今后开发人员开发了新的代码，容器里的代码是否会自动更新？

5、为什么有些容器启动的时候需要使用 -it 有些不需要？

5.1、daemon off

1、镜像（images）

是打包好的软件，由程序代码、基础系统、依赖关系的软件包、系统库和工具组成。

官方解释：

A Docker container image is a lightweight, standalone, executable package of software that includes everything needed to run an application: code, runtime, system tools, system libraries and settings.

Docker容器映像是一个轻量级的、独立的、可执行的软件包，包含了运行应用程序所需的一切:代码、运行时、系统工具、系统库和设置。

[区分一下之前我们提到的centos镜像]

我们之前在linux安装centos提到的镜像是镜像站点的centos镜像，也叫映像文件。因为centos的官方是在国外，若是我们国内用户访问到国外的话，网速就特别慢。这个时候中国的企业就在中国搞一个镜像站点，把国外的东西复制一份放到国内来。那么国内的这个服务器就成为了国外服务器的镜像站点了。而我们现在要讲的这个镜像叫images，是docker容器里的镜像可以理解为是打包好的软件，是一个app的封装。

1.1、Dockerfile：是制作镜像的文件

参考文献：Docker Hub

点开里边的任意一个版本就能看到它的dockerfile

2、镜像结构原理

转载部分内容：第八篇：Docker镜像结构原理_Linux运维开发的技术博客_51CTO博客

2.1、base 镜像

base 镜像有两层含义：

不依赖其他镜像，从 scratch 构建。

scratch：是最基础的docker镜像，相当于一个地基。

其他镜像可以在此基础上进行扩展。

用别的镜像做基础镜像---》站在巨人的肩膀

base 镜像的通常都是各种 Linux 发行版的 Docker 镜像，比如 Ubuntu, Debian, CentOS 等，以 CentOS 为例学习 base 镜像包含哪些内容。

这里拉了很多镜像，是因为这个镜像就是在一些基础镜像的基础上加一些镜像组成了python这个镜像

使用docker pull centos下载最新版本的Centos镜像也就207M左右，而我们平时下载一个原生的centos镜像都是4G，对于 Docker 初学者都会有这个疑问。

下载python镜像：

下面来了解下Linux 操作系统由内核空间和用户空间组成，如下图所示：

2.1.1、rootfs

内核空间是 kernel，Linux 刚启动时会加载 bootfs 文件系统，之后 bootfs 会被卸载掉。用户空间的文件系统是 rootfs，包含我们熟悉的 /dev, /proc, /bin 等目录。对于 base 镜像来说，底层直接用 Host 的 kernel，自己只需要提供 rootfs 就行了。而对于一个精简的 OS，rootfs 可以很小，只需要包括最基本的命令、工具和程序库就可以了。相比其他 Linux 发行版，CentOS 的 rootfs 已经算臃肿的了，alpine 还不到 10MB。我们平时安装的 CentOS 除了 rootfs 还会选装很多软件、服务、图形桌面等，需要好几个 GB 就不足为奇了。

即我们的容器全部用宿主机的内核kernel，而容器提供的只是不同的系统文件。bootfs，容器启动的时候需要的内容；rootfs，容器内部的操作系统

2.1.2、base 镜像提供的是最小安装的 Linux 发行版

下面是 CentOS 镜像的 Dockerfile 的内容：

第二行 ADD 指令添加到镜像的 tar 包就是 CentOS 7 的 rootfs。在制作镜像时，这个 tar 包会自动解压到 / 目录下，生成 /dev, /porc, /bin 等目录。

2.2、镜像分层

Docker 支持通过扩展现有镜像，创建新的镜像。
实际上，Docker Hub 中 99% 的镜像都是通过在 base 镜像中安装和配置需要的软件构建出来的。比如我们现在制作一个镜像

root@dockerserever:~# docker pull debian  # 下载一个debian的镜像

① 新镜像不再是从 scratch 开始，而是直接在 Debian base 镜像上构建。
② 安装 emacs 编辑器。
③ 安装 apache2。
④ 容器启动时运行 bash。

构建过程如下图所示：

可以看到，新镜像是从 base 镜像一层一层叠加生成的。每安装一个软件，就在现有镜像的基础上增加一层。

2.2.1、为什么 Docker 镜像要采用这种分层结构呢？

最大的一个好处就是 - 共享资源。

比如：若是有多个镜像都从相同的 base 镜像构建而来，那么 Docker Host 只需在磁盘上保存一份 base 镜像；同时内存中也只需加载一份 base 镜像，就可以为所有容器服务了。而且镜像的每一层都可以被共享。

这时可能就有人会问了：如果多个容器共享一份基础镜像，当某个容器修改了基础镜像的内容，比如 /etc 下的文件，这时其他容器的 /etc 是否也会被修改？
答：不会！因为修改会被限制在单个容器内。因为它有Copy-on-Write特性。

2.3、容器可写层

当容器启动时，一个新的可写层被加载到镜像的顶部。
这一层通常被称作“容器层”，“容器层”之下的都叫“镜像层”。

所有对容器的改动 - 无论添加、删除、还是修改文件都只会发生在容器层中。
只有容器层是可写的，容器层下面的所有镜像层都是只读的。
下面我们深入讨论容器层的细节。
镜像层数量可能会很多，所有镜像层会联合在一起组成一个统一的文件系统。如果不同层中有一个相同路径的文件，比如 /a，上层的 /a 会覆盖下层的 /a，也就是说用户只能访问到上层中的文件 /a0.。在容器层中，用户看到的是一个叠加之后的文件系统。

1.添加文件
在容器中创建文件时，新文件被添加到容器层中。
2. 读取文件
在容器中读取某个文件时，Docker 会从上往下依次在各镜像层中查找此文件。一旦找到，打开并读入内存。
3. 修改文件
在容器中修改已存在的文件时，Docker 会从上往下依次在各镜像层中查找此文件。一旦找到，立即将其复制到容器层，然后修改之。
4. 删除文件
在容器中删除文件时，Docker 也是从上往下依次在镜像层中查找此文件。找到后，会在容器层中记录下此删除操作。

只有当需要修改时才复制一份数据，这种特性被称作 Copy-on-Write。可见，容器层保存的是镜像变化的部分，不会对镜像本身进行任何修改。
这样就解释了我们前面提出的问题：容器层记录对镜像的修改，所有镜像层都是只读的，不会被容器修改，所以镜像可以被多个容器共享。

3、制作镜像

[为什么要制作镜像？docker hub上不是有很多镜像吗？]

不能满足我们的需求
不够安全，有安全隐患

[谁去制作镜像？]

一般都是由开发人员去制作，也可以运维人员去制作或者权力比较大的工作人员，因为镜像里边涉及了公司里的机密代码等。

3.1、制作镜像的过程

第一步：新建一个空文件夹并pull一个python镜像

[root@centos7-docker ~]# mkdir /mydocker
[root@centos7-docker ~]# cd /mydocker/

第二步：新建Dockerfile

这里要注意，不要把注释放在代码的后边，不然待会run的时候运行不出来。

FROM python
# 我们在docker容器的工作目录。即进入docker容器的时候，所在的目录
WORKDIR /app 

# 复制当前目录下的所有内容到容器里边/app目录下
ADD . /app 

# 定义一个数据卷
VOLUME ["/data_flask"]

# requirements.txt会写明我这个项目会需要一些什么python库；\
# 这条命令是告诉容器把requirements.txt里需要的库到pypi.python.org这个网站里边下载
# 这条命令是在制作镜像的时候要运行的，而不是在启动容器的时候运行的，这个要记住很容易混淆
RUN pip install  --trusted-host pypi.python.org -r requirements.txt

# 暴露我们的端口号，即容器对外开放哪个端口
EXPOSE 80

# 定义环境变量
ENV NAME World
ENV AUTHOR fan

# 容器起来之后运行的第一个程序，这个是容器启动的时候运行，要和上边区分开来
CMD ["python", "app.py"]

第三步：新建requirements.txt文件

Flask
Redis

第四步：新建app.py文件

from flask import Flask
from redis import Redis,RedisError
import os
import socket

# Connect to Redis   连接redis数据库
redis = Redis(host="redis", db=0,socket_connect_timeout=2, socket_timeout=2)

app = Flask(__name__)

# 访问这台机器的根"/"
@app.route("/")
def hello():
	try:
		# 若是有人访问，会往redis数据库里增加一个值
		visits = redis.incr("counter")
	except RedisError:
		# 这个visits是从redis数据库里获取的
		visits = "cannot connect to REdis, counter disabled"

	html = "Hello {name}!" \
			"Hostname:{hostname}
" \
			"Visits: {visits}"
	# 返回这个主机名(socket.gethostname())和访问的次数(visits)
	return html.format(name=os.getenv("NAME", "world"), hostname=socket.gethostname(),visits=visits)

if __name__ == "__main__":
	app.run(host='0.0.0.0', port=80)

第五步：生成镜像，需要一点时间，因为要下载很多东西

# -t，打个标记，等于给这个镜像取个名字
[root@centos7-docker mydocker]# docker build -t friendlyhello_1 .

生成镜像的时候，背后会自动生成临时的容器去执行Dockerfile里的命令，检测这个命令是否可以运行

[查看结果]

[root@centos7-docker ~]# docker images
REPOSITORY          TAG       IMAGE ID       CREATED         SIZE
friendlyhello_1     latest    82dda8055795   7 hours ago     935MB

第六步：运行容器

[root@centos7-docker docker]# docker run -d -p 5080:80 --name hello-1 friendlyhello_1
[root@centos7-docker docker]# docker ps
CONTAINER ID   IMAGE             COMMAND           CREATED         STATUS         PORTS                                   NAMES
c6dbd5383c7a   friendlyhello_1   "python app.py"   7 minutes ago   Up 7 minutes   0.0.0.0:5080->80/tcp, :::5080->80/tcp   hello-1
# 一定要做端口映射，不然到时候我们无法访问应用程序

[注意]：若是我们使用"daocker ps"没有看到我们创建的容器在启动，那么就是我们之前编辑app.py Dockerfile requirements.txt，这三个文件有误。我们可以使用"docker logs + 容器名字"来看运行这个容器的时候出现了什么错误。

[root@centos7-docker mydocker]# docker logs hello-2
 * Serving Flask app 'app' (lazy loading)
 * Environment: production
   WARNING: This is a development server. Do not use it in a production deployment.
   Use a production WSGI server instead.
 * Debug mode: off
 * Running on all addresses (0.0.0.0)
   WARNING: This is a development server. Do not use it in a production deployment.
 * Running on http://127.0.0.1:80
 * Running on http://172.17.0.3:80 (Press CTRL+C to quit)
192.168.29.1 - - [22/Apr/2022 13:19:18] "GET / HTTP/1.1" 200 -
192.168.29.1 - - [22/Apr/2022 13:19:18] "GET /favicon.ico HTTP/1.1" 404 -

# 我这是执行成功了的情况

[结果查看]

因为redis服务没有安装，所以连接不到redis数据库，可以启动一个redis的容器，链接到现在这个容器

第七步：起一个redis容器

[root@centos7-docker docker]# docker run -d -p 6379:80 --name fan-redis-1 redis
a2b9a2ec08fa9efa1276efbefed4beaef25033bd56d8d888f3e61bfa46afad8b
[root@centos7-docker docker]# docker ps
CONTAINER ID   IMAGE             COMMAND                  CREATED          STATUS          PORTS                                             NAMES
a2b9a2ec08fa   redis             "docker-entrypoint.s…"   4 seconds ago    Up 3 seconds    6379/tcp, 0.0.0.0:6379->80/tcp, :::6379->80/tcp   fan-redis-1
c6dbd5383c7a   friendlyhello_1   "python app.py"          22 minutes ago   Up 22 minutes   0.0.0.0:5080->80/tcp, :::5080->80/tcp             hello-1

起完之后，页面还是没有变化。因为我们虽然起了reids容器，但是不知道redis服务的IP地址是多少，所以连不过去。

[root@centos7-docker docker]# docker exec -it hello-1 /bin/bash
root@c6dbd5383c7a:/app# cat /etc/hosts
127.0.0.1	localhost
::1	localhost ip6-localhost ip6-loopback
fe00::0	ip6-localnet
ff00::0	ip6-mcastprefix
ff02::1	ip6-allnodes
ff02::2	ip6-allrouters
172.17.0.2	c6dbd5383c7a  # 这里可以看到这个机器只知道自己的IP地址

因为这个镜像的命令太过于少了，所以没有vim和vi命令能够直接修改这个文件。但是我感觉直接修改这个文件，添加一条标明redis容器的IP地址的内容就可以访问到了。这里我们直接新建一个容器吧。

[root@centos7-docker mydocker]# docker run  -d --name hello-2 -p  5081:80 --link fan-redis-1:redis friendlyhello_1
ad7d079f9aa87da741303fc366311166b020617d4b5729916444881c75983647
[root@centos7-docker mydocker]# docker ps
CONTAINER ID   IMAGE             COMMAND                  CREATED             STATUS         PORTS                                             NAMES
ad7d079f9aa8   friendlyhello_1   "python app.py"          6 seconds ago       Up 6 seconds   0.0.0.0:5081->80/tcp, :::5081->80/tcp             hello-2
a2b9a2ec08fa   redis             "docker-entrypoint.s…"   About an hour ago   Up 6 minutes   6379/tcp, 0.0.0.0:6379->80/tcp, :::6379->80/tcp   fan-redis-1

# 这里我们可以看到新建的hello-2有redis的IP地址
root@ad7d079f9aa8:/app# cat /etc/hosts
127.0.0.1	localhost
::1	localhost ip6-localhost ip6-loopback
fe00::0	ip6-localnet
ff00::0	ip6-mcastprefix
ff02::1	ip6-allnodes
ff02::2	ip6-allrouters
172.17.0.2	redis a2b9a2ec08fa fan-redis-1
172.17.0.3	ad7d079f9aa8

[结果查看]

# 进入docker里边查看用制作的镜像启动的容器的环境变量是否和之前我们定义的一样（在Dockerfile里边定义的）
[root@centos7-docker mydocker]# docker exec -it hello-2 /bin/bash
root@ad7d079f9aa8:/app# echo $NAME
World
root@ad7d079f9aa8:/app# echo $AUTHOR
fan

3.1.1、练习

跟着官网的步骤来进行：Sample application | Docker Documentation

[root@centos7-docker app]# yum install git -y
[root@centos7-docker app]# git clone https://github.com/docker/getting-started.git
# 把官网给的代码下载一下，下载之后会得到一个getting-started的文件夹，进入里边的app文件夹，在里边创建一个Dockerfile文件
[root@centos7-docker app]# cat Dockerfile 
# syntax=docker/dockerfile:1
FROM node:12-alpine
RUN apk add --no-cache python2 g++ make
WORKDIR /app
COPY . .
RUN yarn install --production
CMD ["node", "src/index.js"]
EXPOSE 3000
[root@centos7-docker app]# docker build -t fan-getting-started .  # 制作镜像
# 起一个容器
[root@centos7-docker app]# docker run -dp 3000:3000 --name fan-node  fan-getting-started
39a2b7dd5d49537e078cd3a39690b0787413696b193306b3dfac587ccdc884a9

[结果查看]

3.2、Minimize the number of layers，减少层数

在旧版本的Docker中，最小化图像中的图层数量以确保它们的性能是很重要的。增加了以下功能来减少这一限制:

只有指令:run、copy、add才会增加层。其他指令创建临时中间映像，并且不增加构建的大小。

在可能的情况下，使用多阶段构建，只复制你需要的工件到最终的图像。这允许你在中间构建阶段包含工具和调试信息，而不会增加最终图像的大小。

因为Dockerfile的指令每执行一次都会在docker上新建一层，所以过多无意义的层，会造成镜像膨胀过大。

所以在装软件或者其他安装命令的时候，使用到run、copy、add命令的时候，能用一条命令执行完毕就用一条命令执行。

参考资料：Docker Dockerfile | 菜鸟教程

3.3、制作镜像的流程中可能会出现的问题

第一种情况：docker没有IP的问题

解决办法：重启docker服务，使用"service docker restart"。若是还是不行就重启linux系统。并且关闭selinux。若是你需要关闭防火墙，你需要先关闭防火墙，再启动docker服务。

3.4、copy和add的区别

Dockerile中的COPY命令和ADD命令都可以将主机上的资源复制或加入到容器镜像中，都是在构建镜像的过程中完成的。

COPY命令和ADD命令的唯一区别在于是否支持从远程URL获取资源。COPY命令只能从执行docker build所在的主机上读取资源并复制到镜像中。而ADD命令还支持通过URL从远程服务器读取资源并复制到镜像中。Docker开发者推荐:满足同等功能的情况下，推荐使用COPY命令。ADD命令更擅长读取本地tar文件并解压缩。

但是ADD命令有如下的优点:

1、如果源路径是个文件，且目标路径是以/结尾，则docker会把目标路径当作一个目录，会把源文件拷贝到该目录下。如果目标路径不存在，则会自动创建目标路径。

2、如果源路径是个文件，且目标路径是不是以/结尾，则docker会把目标路径当作一个文件。如果目标路径不存在，会以目标路径为名创建一个文件，内容同源文件;如果目标文件是个存在的文件，会用源文件覆盖它，当然只是内容覆盖，文件名还是目标文件名。如果目标文件实际是个存在的目录，则会源文件拷贝到该目录下。注意，这种情况下，最好显示的以/结尾，以避免混淆。

3、如果源路径是个目录，且目标路径不存在，则docker会自动以目标路径创建一个目录，把源路径目录下的文件拷贝进来。如果目标路径是个已经存在的目录，则docker会把源路径目录下的文件拷贝到该目录下。

4、如果源文件是个归档文件（压缩文件)，则docker会自动帮解压。

4、若是今后开发人员开发了新的代码，容器里的代码是否会自动更新？

答案：不会。若是把代码放在镜像文件里的话，每次代码更新都要制作成一个镜像。那么有什么办法可以不用做呢？即，只要代码更新里，只需要把代码放在容器里就行了。我们可以使用数据卷，或者说直接把代码写到（copy）镜像中去。

5、为什么有些容器启动的时候需要使用 -it 有些不需要？

比如：Ubuntu镜像的Dockerfile是这么写的

FROM scratch
ADD ubuntu-jammy-oci-amd64-root.tar.gz /
CMD ["bash"]  # 容器启动的时候运行的程序是bash

运行程序：

在前台运行：容器就会一直运行，即状态是up的
在后台运行或者程序运行完成后：容器就会退出，即状态是Exited

即我们若是在制作镜像的时候，CMD的命令是可以一直在前台运行的命令，那么我们用这个个镜像制作的容器，就不需要加上"-it"

-i：以交互模式运行容器
-t：容器创建成功后我们可以进入到容器中

下面我们直接制作一个镜像起一个容器，不需要使用-it，也能是up状态的。

[root@centos7-docker mydocker]# docker pull busybox
[root@centos7-docker busybox]# cat Dockerfile 
FROM busybox
WORKDIR /
ENV author fan

CMD ["/bin/sh", "-c", "echo FanMy; sleep 120;echo ok"]
[root@centos7-docker busybox]# docker build -t fan-busybox .
[root@centos7-docker busybox]# docker run -d --name fan-busybox-1 fan-busybox
c0892557525d970e5974862331f3757ccfe280f8de0c112608f21fb8f0da4570
[root@centos7-docker busybox]# docker ps
CONTAINER ID   IMAGE         COMMAND                  CREATED         STATUS         PORTS     NAMES
c0892557525d   fan-busybox   "/bin/sh -c 'echo Fa…"   5 seconds ago   Up 4 seconds             fan-busybox-1

5.1、daemon off

CMD ["nginx", "-g", "daemon off;"]，这个命令是表示在前台启动nginx程序;"nginx"，启动nginx程序；"-g daemon off"，将off的值赋给daemon这个变量，告诉nginx不要在后台启动，要在前台启动。
daemon是守护进程，默认在后台运行
nginx -g，选项的作用是设置一个全局变量，给它赋值

你可能感兴趣的:(docker,镜像的制作)

多线程的pthread_exit函数 lichao268089 C语言 pthread_exit函数
pthread_exit（void*）用于线程的退出函数，不会导致主进程退出，intmain中的return语句会导致进程退出，在线程中不能使用exit函数，这会导致整个进程退出；1#include2#include3#include4#include56void*thread_func(void*arg)7{8inti=(int)arg;9printf("inthread:threadid=%l
【AI量金术师：简易代码领悟高深金融术语】02.马科维茨资产组合模型Python实战金融OG 高深金融术语私厨人工智能金融 python
目录1.马科维茨资产组合模型简介1.1模型的起源与发展1.2核心概念2.模型的基本假设2.1投资者行为假设2.2市场环境假设3.模型的应用与局限性3.1实际应用3.2局限性探讨4.Python代码案例：实现马科维茨资产组合模型4.1环境准备与数据获取4.2数据收集4.3计算收益率与协方差矩阵4.4随机生成投资组合4.5绘制有效前沿4.6优化求解最优投资组合5.结论与展望1.马科维茨资产组合模型简介
svm python 模型绘图_1SVM处理数据并绘图张炜大师傅 svm python 模型绘图
爬虫Python基础、数据分析扩展包Numpy、pandas、matplotlib，Python读取MySQL数据，Python爬虫及Scrapy框架，无监督机器学习算法聚类分析等，以及案例：互联网金融行业客户价值分析等。机器学习机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有
php linux 常用命令,Linux常用命令大全潘儒锋 php linux 常用命令
Linux常用命令大全,以前收集的系统信息arch显示机器的处理器架构(1)uname-m显示机器的处理器架构(2)uname-r显示正在使用的内核版本dmidecode-q显示硬件系统部件-(SMBIOS/DMI)hdparm-i/dev/hda罗列一个磁盘的架构特性hdparm-tT/dev/sda在磁盘上执行测试性读取操作cat/proc/cpuinfo显示CPUinfo的信息cat/pro
服务器ibmc无法加载js文件,华为服务器IBMC批量巡检代码 1ce0ear 服务器ibmc无法加载js文件
selenium需要下载Chrome驱动webdriver，具体下载的版本根据自己的谷歌浏览器版本进行下载，然后将下载好的驱动webdriver放到自己python解释器同级目录中即可，下载地址http://npm.taobao.org/mirrors/chromedriver/此代码可用于华为服务器批量巡检，前提要在脚本存放的同级目录下建立一个ipList.txt文件存储服务器管理IP地址格式为
linux操作命令comm,史上最全的Linux常用命令云小牙 linux操作命令comm
系统信息arch显示机器的处理器架构(1)uname-m显示机器的处理器架构(2)uname-r显示正在使用的内核版本dmidecode-q显示硬件系统部件-(SMBIOS/DMI)hdparm-i/dev/hda罗列一个磁盘的架构特性hdparm-tT/dev/sda在磁盘上执行测试性读取操作cat/proc/cpuinfo显示CPUinfo的信息cat/proc/interrupts显示中断c
深入理解 Spring 的 Lazy Loading：原理、实现与应用场景 Ray.1998 spring java 开发语言后端 spring
延迟加载（LazyLoading）是Spring容器管理Bean的一种策略，指只有在需要时（调用getBean()方法获取Bean时）才会实例化该Bean。这是Spring提供的一种优化机制，用于提高启动效率和降低资源占用。1.延迟加载的含义在延迟加载模式下，Spring容器初始化时不会立即实例化所有Bean，而是等到真正需要使用时（即调用getBean()方法时），才创建Bean实例。如果不启用
Flink 的核心特点和概念 Ray.1998 大数据大数据数据分析数据仓库 flink
Flink是一个流式处理框架，专注于高吞吐量、低延迟的数据流处理。它能处理无限流（即实时数据流）和有限流（批处理），具有很强的灵活性和可扩展性，广泛应用于实时数据分析、监控系统、数据处理平台等场景。下面是一些关于Flink的核心特点和概念：1.流处理和批处理流处理（StreamProcessing）:Flink的核心就是流处理，它能够实时处理不断到达的数据流。Flink会将数据划分成时间窗口来处理
Flink的流处理和批处理 Ray.1998 大数据 flink 大数据数据挖掘数据分析
1.流处理（StreamProcessing）流处理是Flink的核心功能之一，主要用于处理无限流数据，也就是不断到达的数据。它能够实时处理数据流，并对每个数据元素执行操作。流处理中的数据没有预定的边界，它的特征是持续到达，因此，流处理必须实时处理每个事件，而不能等到所有数据都到齐后再进行处理。核心特点：实时性：流处理的最大优势是实时性。Flink允许对实时数据流进行分析，计算和处理，几乎是对数据
VUE3-修改element-plus-el-select的下拉框样式 Anastasia289 vue.js javascript 前端 vue
样式如图：参考博客链接：修改el-select和el-input样式；修改element-plus的下拉框el-select样式；修改placeholder样式_elementplusel-select样式修改-CSDN博客.el-select{--el-select-border-color-hover:rgb(0,162,255)!important;//修改下拉框hover的默认样式}.el
【设计模式】观察者模式在java中的应用 CC大煊 Java基础 java 观察者模式开发语言
文章目录引言观察者模式的定义观察者模式的应用场景观察者模式的基本概念主题（Subject）和观察者（Observer）的关系观察者模式的优缺点优点缺点Java中的观察者模式实现Java内置的观察者模式`java.util.Observer`接口`java.util.Observable`类示例代码自定义实现观察者模式自定义接口和类具体代码示例使用`java.util.Observer`和`java
深入MapReduce——引入黄雪超大数据基础 #深入MapReduce mapreduce 大数据 hadoop
引入前面我们已经深入了HDFS的设计与实现，对于分布式系统也有了不错的理解。但HDFS仅仅解决了海量数据存储和读写的问题。但要想让数据产生价值，一定是需要从数据中挖掘出价值才行，这就需要我们拥有海量数据的计算处理能力。下面我们还是老样子，来数据一下要实现海量计算处理能力，有些什么核心痛点大数据计算核心痛点量级大在稍微大一点的互联网企业，需要计算处理的数据量都开始以PB计了。而传统的计算处理模型中，
一个可以根据题目得分显示不同题目的答题demo qq_41759752 javascript html5 vue.js 前端
前段时间有幸参与到一个全国性的某心理健康测评平台的开发工作，其答题部分的前端开发工作由我完成，现将该平台前端的主要交互逻辑重新实现做成demo，有需要的小伙伴或客户可以联系我获取了，有类似开发需求的老板和可以联系我哟。其中主要实现的交互有：1、在excel录入题目信息，后台写脚本将excel数据转化为前端页面需要的试题数据，前端通过接口拿到所有的试题数据。（后台操作，demo中数据写成了静态数据）
【软件设计】常用设计模式--观察者模式秦哈哈软件设计设计模式观察者模式
软件设计模式（四）观察者模式一、观察者模式（ObserverPattern）1.概念2.模式结构3.UML类图4.实现方式C#示例步骤1：定义观察者接口步骤2：定义主题接口步骤3：实现具体主题步骤4：实现具体观察者步骤5：使用观察者模式Java示例步骤1：定义观察者接口步骤2：定义主题接口步骤3：实现具体主题步骤4：实现具体观察者步骤5：使用观察者模式5.优点6.缺点7.应用场景二、观察者模式的变
【设计模式-行为型】状态模式博一波设计模式状态模式
一、什么是状态模式什么是状态模式呢，这里我举一个例子来说明，在自动挡汽车中，挡位的切换是根据驾驶条件（如车速、油门踏板位置、刹车状态等）自动完成的。这种自动切换挡位的过程可以很好地用状态模式来描述。状态模式（StatePattern）是一种行为型设计模式，它允许一个对象在其内部状态发生变化时（加速或者减速）改变其行为（换挡）。状态模式的核心思想是将对象的行为封装在不同的状态类中，使得对象的行为随着
Git分布式版本控制系统之SSH协议访问饶子文 git 分布式
目录前言：我来公司上班day1正文：Git的SSH协议访问步骤一.安装Git软件二.SSH密钥生成三.添加SSH公钥到远端仓库四.配置Git使用SSH协议来连接远程仓库五.使用Git命令进行测试结尾：前言：我来公司上班day1回顾我的毕业季，那是一段充斥着投递简历和准备面试的青葱岁月。都说23年学计算机，如同49年入国军。但已经投入过多的沉没成本的在计算机上的我也别无选择，在历经浪潮般的简历投递和
如何在 Linux 上安装 C 和 GCC 编译器？新华编程 C语言教程 linux c语言
概述Linux是一组开源的类UNIX操作系统，Ubuntu是一种基于Linux的操作系统，通常用于运行基于Linux的应用程序。要在Linux上安装C并在Ubuntu上构建和运行C程序文件，我们需要安装GCC编译器。在Ubuntu存储库中，GCC编译器是我们需要安装的构建基本包的一部分。我们知道在Linux上安装C语言可能看起来令人生畏，但不要担心;我们已经为您提供了分步指南！在Linux中使用终
NIO 和 Netty 在 Spring Boot 中的集成与使用阿乾之铭 java 网络开发语言
Netty到底是个啥，有啥子作用1.Netty的本质：对NIO的封装NIO的原生问题：Java的NIO提供了非阻塞I/O和多路复用机制，但其使用较为复杂（如Selector、Channel、Buffer的配置和管理）。开发者需要自己处理线程模型、资源管理、协议解析等底层细节，代码冗长且容易出错。Netty的改进：Netty对NIO进行了高级封装，提供了更加易用的API和灵活的抽象层，例如：Chan
Mysql数据库索引阿乾之铭 MySQL Spring Data JPA 数据库 mysql
SpringDataJPA建立索引所使用的语法@Entity@Table(name="user",indexes={@Index(name="idx_user_username",columnList="username"),@Index(name="idx_user_email_status",columnList="email,status")},uniqueConstraints={@Uni
Lombok 在 IntelliJ IDEA 中的使用步骤阿乾之铭 intellij-idea java ide
Lombok是一个非常流行的Java库，它通过注解简化Java类的开发，特别是在处理POJO（PlainOldJavaObjects）类时，如生成getter、setter、toString等常用方法。Lombok在减少样板代码（boilerplatecode）方面非常有用。在IntelliJIDEA中使用Lombok插件，可以极大简化开发过程。1.安装Lombok插件要在IntelliJIDEA
MySQL中的嵌套查询阿乾之铭 MySQL 数据库 sql mysql
1.嵌套查询的定义嵌套查询指在一个查询语句的某个部分嵌入一个子查询。嵌套查询的执行过程遵循“先子查询、后外层查询”的逻辑。首先，子查询执行并返回一个结果集，可能是一个值、一行或多行数据。接着，外层查询使用子查询的结果继续对数据进行筛选或处理。通过这种方式，嵌套查询可以处理更复杂的逻辑，如多层条件过滤、数据对比等。子查询：首先执行，返回符合条件的结果。外层查询：利用子查询返回的结果进行筛选或其他逻辑
C语言学习：指针 wsy0903@@@ Linux编程嵌入式学习日记 c语言学习开发语言
1.指针指针本质上就是内存地址。inta=10;//定义一个整型变量int*p=&a;//定义一个指针变量，指向a的地址在这个例子中：a是一个普通的整型变量，值为10&a获取变量a的内存地址p是一个指针变量，存储了a的地址*p可以访问a中存储的值2.指针的定义语法指针的定义遵循以下格式：基类型*指针变量名;这里的基类型决定了指针指向的数据类型。例如：int*p;//指向整型的指针char*p;//
K8S中Service详解（二）元气满满的热码式 kubernetes 网络 linux
Service类型Service的资源清单文件：---kind:Service#资源类型apiVersion:v1#资源版本metadata:#元数据name:service#资源名称namespace:dev#命名空间spec:#描述selector:#标签选择器，用于确定当前service代理哪些podapp:nginxtype:ClusterIP#Service类型，指定service的访问
锁争用详解缘来是黎 linux service java jvm 开发语言
锁争用（LockContention）是并发编程中常见的问题，特别是在多线程或多进程环境下。当多个线程或进程竞争同一把锁时，会导致系统负载升高，性能下降。以下是锁争用导致系统负载高的详细原理：1.锁的基本概念锁：用于控制对共享资源的访问，确保同一时间只有一个线程或进程可以访问资源。锁争用：当多个线程或进程同时尝试获取同一把锁时，只有一个线程或进程能够成功获取锁，其他线程或进程会被阻塞，直到锁被释放
Nginx部署Vue项目添加访问后缀星巡打杂工 vue.js nginx javascript
有时候会根据需要，区分不同的vue项目，这样要加一个后缀，不加后缀，访问是http://localhost/，加一个后缀，app，访问路径就是http://localhost/app一、vue工程配置:1.vue.config.jspublicPath配置为/app/2.route配置base为/app,model为history将打包后vue工程文件放入/usr/share/nginx/html
用增结算数仓化改造：在/离线调度系统的构建与应用百度Geek说百度架构大数据重构
导读移动运营推广平台（OPS）承载着百度内部移动应用/移动搜索业务的用户增长预算的全流程结算线上化管控功能，为了解决用增业务发展规模扩大、原有技术架构老旧、无离线数仓系统等一系列的问题，针对全域结算数据启动了整体的架构改造。为了解决业务中存在的问题，本文深入探讨并提出了一类在线、离线结合的任务调度解决方案，完成了结算业务架构更新换代，更好地服务于业务发展。01背景简述1.1业务/技术背景移动运营推
Spring Boot 集成 RabbitMQ 一叶飘零_sweeeet MQ Springboot 果酱紫 java-rabbitmq spring boot rabbitmq
在现代分布式系统中，消息队列扮演着至关重要的角色。它能够实现系统间的异步通信、解耦组件以及提高系统的可扩展性和可靠性。RabbitMQ作为一款广泛使用的开源消息中间件，具有强大的功能和灵活的配置。而SpringBoot则是一种流行的Java开发框架，能够快速构建应用程序。本文将详细介绍如何在SpringBoot项目中集成RabbitMQ，包括安装和配置RabbitMQ、在SpringBoot中使用
Linux 权限体系详解:、777、755、644、600、chmod、chown、chgrp 和 umask；SUID、SGID 和 Sticky Bit；ACL (访问控制列表) 是什么？小胡说技书手册/开发图谱运维 linux 运维服务器
文章目录1.引言1.1为什么学习Linux权限？1.2本文目标2.Linux权限基础概念2.1权限模型2.2权限类型2.3权限表示法2.3.1字母表示法2.3.2数字表示法2.3.3字母与数字表示法对比2.3.4案例：字母与数字的权限切换3.常见权限分配方法对比表格3.1使用`chmod`分配权限3.2使用`chown`和`chgrp`修改拥有者和用户组3.3使用`umask`设置默认权限4.高级
套接字API - socket 弘毅_Hao Sockets套接字编程 socket 套接字
套接字是网络编程中的基本概念，它提供了进程间通信的一种抽象。作用socket函数的主要作用是创建一个新的套接字，该套接字可以用于网络通信。通过套接字，进程可以与其他进程（无论在同一台机器上还是不同机器上）进行数据传输。函数原型#include#includeintsocket(intdomain,inttype,intprotocol);参数说明1.domain（地址族）：指定了协议族，决定了套接
探秘ARMv7-M架构：打造高效嵌入式系统指南嵇影钰
探秘ARMv7-M架构：打造高效嵌入式系统指南【下载地址】ARMv7-M架构参考手册及应用指南分享本资源包包含：-**ARMv7-MArchitectureReferenceManual**：这是ARM官方发布的权威文档，全面深入地介绍了ARMv7-M架构的核心概念、指令集、内存模型和编程模型等，是开发高性能、低功耗嵌入式系统的理论基础。-**ARMv7-MApplicationLevelRefe
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文