Openstack 03 - Nova Compute

1.前言

很早之前就开始着手写Openstack 系列的博客了,在写了总体架构和Keystone之后,准备写Nova,但是每次写到一半,自己心里就觉得不踏实,因为似乎我并没有真正理解Nova,或者说根本就没理解Compute的真正意义。Nova 或许并不仅仅只是Openstack整体架构中的一个组件那么简单。今天准备开始写Nova,但是我依然觉得距离完全理解Nova还有一段距离,但我打算先写出来,读者可以一起探讨。

2.背景

之前与同事在讨论云计算的时候,他说云计算其实是一个伪命题,因为根本不存在什么云,这些概念是说给外行或者不懂技术的客户听的。云本质上就是一个操作系统,作用是调度各类基础资源,以服务的形式暴露出来。想想我们的计算机操作系统,不也是把硬盘、网络、CPU这些作为基础资源暴露出来,供上层应用来调用嘛.我对这个观点表示深深地认同,真正的专家是把高深的概念用通俗的方式解释出来,解开云计算神秘的面纱,我们再次审视我们每天所谓的云,其实就是一个大型的分布式、高可用的基础资源管理系统。云计算的计算概念是如何理解呢?个人认为计算即调度,云操作系统不仅仅要能够管理资源,而且必须知道何时提供多少资源,这样才能够让云智能起来,说得通俗点就是资源的调度过程,用一个高大上的词汇就是智能。比如在Openstack中,如果集成了KVM和VMWare,那么用户在创建资源的时候,Openstack必须知道哪个节点资源的占用情况,从而讲任务分配到空闲的节点,甚至能够在资源池之间自动漂移。这才是计算最本质的东西。

当然Nova 还需要管理实例的生命周期的各个状态,比如虚拟机的创建,挂起,停止,重启等等。不过目前不支持动态扩容,因为扩容需要重启实例,这需要高可用特性的支持.

3.Nova

Nova 是Openstack整个体系中的计算组件。从背景一节中,我提出了计算即调度的概念。那么Nova 必须要与存储,网络等模块打交道(当然还有keystone),与此同时,Nova 并没有具体实现虚拟化(具体的虚拟化是KVM,VMWare,Xen),Nova 通过librivt调用具体的虚拟化平台。所以我们就很容易得出结论,nova的架构如下:

Openstack 03 - Nova Compute_第1张图片

总结下来,nova的主要组件如下:

- API Server (nova-api)

- Message Queue (rabbit-mq server)

- Compute Workers (nova-compute)

- Network Controller (nova-network)

- Volume Worker (nova-volume)

- Scheduler (nova-scheduler)

下面逐一介绍下各个组件的基本功能:

API Server(nova-api)

API Server对外提供一个与云基础设施交互的接口,也是外部可用于管理基础设施的唯一组件。管理使用EC2 API通过web services调用实现。然后API Server通过消息队列(Message Queue)轮流与云基础设施的相关组件通信。作为EC2 API的另外一种选择,OpenStack也提供一个内部使用的“OpenStack API”。

Message Queue(Rabbit MQ Server)

OpenStack 节点之间通过消息队列使用AMQP(Advanced Message Queue Protocol)完成通信。Nova 通过异步调用请求响应,使用回调函数在收到响应时触发。因为使用了异步通信,不会有用户长时间卡在等待状态。这是有效的,因为许多API调用预期的行为都非常耗时,例如加载一个实例,或者上传一个镜像。

Compute Worker(nova-compute)

Compute Worker处理管理实例生命周期。他们通过Message Queue接收实例生命周期管理的请求,并承担操作工作。在一个典型生产环境的云部署中有一些compute workers。一个实例部署在哪个可用的compute worker上取决于调度算法。

Network Controller(nova-network)

Network Controller 处理主机地网络配置。它包括IP地址分配、为项目配置VLAN、实现安全组、配置计算节点网络。

Volume Workers(nova-volume)

Volume Workers用来管理基于LVM(Logical Volume Manager)的实例卷。Volume Workers有卷的相关功能,例如新建卷、删除卷、为实例附加卷,为实例分离卷。卷为实例提供一个持久化存储,因为根分区是非持久化的,当实例终止时对它所作的任何改变都会丢失。当一个卷从实例分离或者实例终止(这个卷附加在该终止的实例上)时,这个卷保留着存储在其上的数据。当把这个卷重附加载相同实例或者附加到不同实例上时,这些数据依旧能被访问。

一个实例的重要数据几乎总是要写在卷上,这样可以确保能在以后访问。这个对存储的典型应用需要数据库等服务的支持。

Scheduler(nova-scheduler)

调度器Scheduler把nova-API调用映射为OpenStack组件。调度器作为一个称为nova-schedule守护进程运行,通过恰当的调度算法从可用资源池获得一个计算服务。Scheduler会根据诸如负载、内存、可用域的物理距离、CPU构架等作出调度决定。nova scheduler实现了一个可插入式的结构。

当前nova-scheduler实现了一些基本的调度算法:
◾随机算法:计算主机在所有可用域内随机选择
◾可用域算法:跟随机算法相仿,但是计算主机在指定的可用域内随机选择。
◾简单算法:这种方法选择负载最小的主机运行实例。负载信息可通过负载均衡器获得。

关于这部分的源码解读,请参考博客:

1) Scheduler 源码解析 

http://blog.csdn.net/gaoxingnengjisuan/article/details/15615743

2)Nova-Schedluer 的调度

http://lynnkong.iteye.com/blog/1699413

这里着重需要强调下,Nova 虚拟机的创建,启动过程,请参考这篇:

1)openstack之虚拟机的创建流程

http://www.tuicool.com/articles/MbIRN3

2)openstack 虚拟机启动

http://www.aboutyun.com/thread-6882-1-1.html

4.总结

Nova 模块是非常核心的部分,理解起来需要结合架构设计来理解,注意与其他模块的交互。







你可能感兴趣的:(Openstack 03 - Nova Compute)