OpenStack是一个分布式系统,完成一件事,基本上都会涉及到一系列的组件,这些组件协同工作,在云中扮演着各种角色。

OpenStack是一个云平台管理的项目,它不是一个软件。这个项目由几个主要的组件组合起来完成一些具体的工作。

OpenStack是一个旨在为公共及私有云的建设与管理提供软件的开源项目,OpenStack被公认作为基础设施即服务(简称IaaS)资源的通用前端。

openstack自身包括以下是5个的重要构成部分:

l Nova – 计算服务

l Swift – 存储服务

l Glance – 镜像服务

l Keystone – 认证服务

l Horizon – UI服务

(1)keystone负责为每个服务进行认证、授权、租户管理、项目权限和配额以及服务目录管理。

(2)Glance负责提供Nova创建实例所需要的镜像文件,镜像格式如raw、qcow2。

(3)Nova负责云主机实例生命周期的管理,以及宿主机资源调度;Nova还决定了虚拟机实例在哪一台Hypervisior物理机上运行。

(4)Horzion将用户的http请求转换为RESTful请求,然后将RESTful请求分发给Nova API,进行实例的创建。

(5)cinder提供块存储,目的是用来做持久存储的,典型软件如ceph;swift提供对象存储,用来文件共享的。

(6)neutron服务为云主机实例提供网络服务,比如私有IP的地址分配问题,访问外网的浮动IP、NAT路由、防火墙,以及云主机实例彼此之间的vxlan通信。


在OpenStack中,用户PUT和GET都是同一个对象,说说存储节点Swift存取的工作原理

(1)上传文件时,PUT请求经过负载均衡机器通过一致性哈希算法随机选择一台代理服务器,再将请求转发数据存储节点,代理服务器通过查找本地的Ring(环)文件,包括account环、container环、object环选择3个不同的区域(zone),zone保证了数据的副本不会都放在同一个存储节点上,从而避免了单点故障的可能性,可以使用3个磁盘来替代3个节点。而后,向3个数据节点都进行写操作,只有当至少2个节点都确认写成功后,再向用户返回写成功信息。

(2)而后,当用户需要get请求该对象(对象=元数据+内容)下载文件时,也需要经过负载均衡随机挑选一台代理服务器,代理服务器上的环文件能查询到这个文件存储在哪三个节点中,然后同时向后端查询,当前仅当至少2个存储节点表示可以提供该文件,然后代理服务器才从中选择一个节点下载文件。


创建虚拟机的流程

(1)Horizon通过Keystone获取nova-Compute组件的的访问地址(即URL),并获取令牌token。

(2)Horizion携带授权令牌,发送创建虚拟机指令。

(3)Nova-compute组件通过glance-api下载虚拟机镜像,glance镜像中有缓存机制,通常把缓存文件放入名为_base的目录,如果_base缓存没有镜像文件,那么就会从glance下载镜像到base缓存,然后再从base缓存通过TCP/IP网络复制到计算节点云主机实例下的镜像目录里。

(4)glance检索后端镜像,glance后端存储不一定要使用swift,只要是存放镜像文件的系统都可以。

(5)获取网络信息,决定虚拟机的网络模式以及建立网络连接。

(6)nova-compute发送启动虚拟机指令,至此经过虚拟机服务任务状态的变化,正常过后创建即可完成。


Opnstack启动虚拟机实例后,虚拟机的状态变化:

(1)管理员发出创建虚拟机的命令,决定从镜像文件或是快照文件进行启动。

(2)当创建后,虚拟机实例进入Build状态,任务状态是Spawning孵化。

(3)期间,将会从控制节点上的Glance组件把相应的镜像文件从中下载到Nova计算节点,并进行一些虚拟机的初始参数配置,如内存、CPU、磁盘空间。

(4)当一切正常后,虚拟机将会将会进入Active状态,此后,用户便可以使用云主机了。创建实例的时间一般由镜像文件的大小、网络传输带宽、以及创建的Hypervisor磁盘性能大小。

(5)虚拟机创建完毕,可以经过Horzion的web界面进行管理,也可以基于Python Nova client的命令行管理。


创建网络时,Neutron做了什么?

    创建虚拟机时,Neutron会根据选择的网络,首先给虚拟机分配一个tap设备作为虚拟的网卡,命名为tapXXX , XXX是一串数字和字母的组合,用来标识的,譬如tap8eaf6158-80,

在系统中使用ifconfig命令可以看到新增了这个网口。建立一个Linux网桥,命名为qbr8eaf6158-80。把上面那个新增的tap网口接在这个qbr的交换机上,使用命令“brctl show”可以列出存在的网桥设备和端口。现在,虚拟机上已经有了一个接在虚拟网桥上的网

口,接下来是如何把这个网口与OVS的br-tun连接起来。

    这时会有一对veth设备出现。veth是Linux中的虚拟网络设备,总是成对出现,一对veth设备的数据总是从一个流人,从另一个流出。Neut1-on会建立一对分别命名为qvbXXX和qvoXXX的veth设备,并且把它们分别连接到前面提到的qbr8eaf6158和br-int这两个交换机上。可以使用命令“brctl show”和“ovs-vsctl show”分别查询qbrXXX和br-int这两个

交换机是否已经串联起来了。


云主机实例1和云主机实例2彼此通信,基于VXLAN的工作原理

(1)VM1要向VM2发送数据前,必须要知道VM2的MAC地址,其获取过程如下:

         1、VM1发送ARP请求包,请求192.168.0.101[VM2_IP]的MAC地址;

         2、ARP请求包被VTEP1封装成多播包,发给VNI=864的多播组;

         3、所有的VTEP接收此多播包,并添加(VNI–VTEP1–VM1_MAC Address)映射关系到自己的VXLAN表中;

         4、目的主机上的VTEP2接收到多播包后将其解开,并向本主机上VNI=864的所有虚拟机发送广播包;

         5、VM2看到了ARP包后,回应了自己的MAC地址;

         6、VTEP2再次封装回应的单播包,通过路由发给VTEP1;

         7、VTEP1解包,并将包传给VM1,则最终获取了VM2的MAC地址;

         8、VTEP1将(VNI–VTEP2–VM2_MAC Address)映射关系添加到自己的VXLAN表中;

(2)VM1获知VM2的MAC地址后,发送数据包,过程如下:

   1、VM1发送IP数据包到VM2,即192.168.0.100 到 192.168.0.101;

   2、VTEP1查找自己的VXLAN表知道要发给VTEP2,然后依次封装以下数据包头;

  a)VXLAN包头,VNI=864;

  b)标准UDP包头,校验和checksum为0x0000,目标端口号4789;

  c)标准IP包头,目标地址为VTEP2的IP地址,协议号设为0x11表面为UDP包。

  d)标准MAC数据包,目标地址为下一跳设备(虚拟路由器)的MAC地址00:10:11:FE:D8:D2,可路由到目标隧道端VTEP2。

   3、VTEP2接收数据包,根据UDP的destination端口找到VXLAN数据包。接着查找所有所在VXLAN的VNI为864的端口组,找到VM2的

   4、VM2接收并处理数据包,拿到Payload数据.(vxlan有2^24个逻辑网络,所以称为扩展vlan)