centos7 kvm虚拟化
一、检查是否支持硬件虚拟化

cat /proc/cpuinfo | egrep -o "vmx|smv"

二、安装epel源和kvm软件

yum install epel-release qemu-kvm libvirt libvirt-python libguestfs-tools virt-install virt-manager python-virtinst libvirt-client virt-viewer

systemctl start libvirtd && systemctl enable libvirtd

三、查看kvm模块支持

lsmod | grep kvm

四、手动配置虚拟网桥

cd /etc/sysconfig/network-scripts/

cp ifcfg-em1 ifcfg-br0

vim ifcfg-br0

TYPE=Bridge
BOOTPROTO=static
UUID=77321f0a-3b31-4805-8ae0-8646d99da775
DEVICE=br0
ONBOOT=yes
IPADDR=172.20.120.21
PREFIX=24
GATEWAY=172.20.120.1
DNS1=202.96.134.133
DNS2=114.114.114.114
NM_CONTROLLED=no

vim ifcfg-em1

TYPE=Ethernet
BOOTPROTO=static
BRIDGE=br0
UUID=77321f0a-3b31-4805-8ae0-8646d99da775
DEVICE=em1
ONBOOT=yes
IPADDR=172.20.120.21
PREFIX=24
GATEWAY=172.20.120.1
DNS1=202.96.134.133
DNS2=114.114.114.114
NM_CONTROLLED=no

systemctl restart network

brctl show

五、Kvm的管理工具webvirtmgr安装和使用,前提安装epel-release

yum -y install git python-pip libvirt-python libxml2-python python-websockify supervisor nginx

yum -y install gcc python-devel

pip install numpy

六、安装python需求并设置Django环境

git clone git://github.com/retspen/webvirtmgr.git

cd webvirtmgr

pip install -r requirements.txt

./manage.py syncdb

./manage.py collectstatic

./manage.py createsuperuser

七、设置nginx

CPU虚拟化:

1、模拟:emulation;

2、虚拟:virtualization;

a、完全虚拟化(full-virtualization):BT:二进制翻译(软件)、HVM:硬件辅助的虚拟化(硬件)

b、半虚拟化(para-virtualization):

Memory虚拟化:

进程:线性地址空间

内核:物理地址空间

MMU   virtualization:

1、intel:EPT,extended page table

2、amd:NPT,nested page  table

TLB(Translation Lookaside Buffer)转换检测缓冲区  virtualization:tagged TLB

I/O 虚拟化:

外存:硬盘、光盘、U盘

网络设备:网卡

显示设备:VGA;frame buffer(帧缓存)机制

键盘鼠标:ps/2、usb

总结I/O虚拟化的方式:

1、模拟:完全使用软件来模拟真实硬件;

2、半虚拟化:通常仅适用于硬盘、网卡设备;

3、IO-through:IO透传;intel:VT-d

虚拟化模型:即实现方式

类型一:在系统上电之后首先加载运行虚拟机监控程序,而传统的操作系统则是运行在其创建的虚拟机中。代表:xen、vmware esx/esxi;

类型二:在系统上电之后仍然运行一般意义上的操作系统(也就是俗称的宿主操作系统),虚拟机监控程序作为特殊的应用程序,可以视作操作系统功能的扩展。代表:kvm、vmware workstation、virtualbox;

Intel硬件辅助的虚拟化:
CPU: vt-x, EPT, tagged-TLB
IO/CPU: vt-d, IOV, VMDq
第一类:跟处理器相关:vt-x
第二类:跟芯片相关:vt-d
第三类:跟IO相关:VMDq和SR-IOV

虚拟化技术的分类:
模拟:著名的模拟器,PearPC, Bochs, QEMU
完全虚拟化:也称为native virtulization
两种加速方式:
BT
HVM
VMware Workstation, VMware Server, Parallels Desktop, KVM, Xen(HVM)
半虚拟化:para-virtualization
xen, uml(user-mode linux)
OS级别的虚拟化:
OpenVZ, lxc
Solaris Containers
FreeBSD jails
库虚拟化:
wine
应用程序虚拟化:
jvm

虚拟化网络:
nat mode
bridge mode
routed mode
isolation mode

使用brctl的配置的过程示例:

brctl addbr br0

brctl stp br0 on

ifconfig eth0 0 up

brctl addif br0 eth0

ifconfig br0 IP/NETMASK up

route add default gw GW

KVM: Kernel-based Virtual Machine, Qumranet公司, 依赖于HVM;Intel VT-x, ADM ADM-V;

KVM模块载入后的系统的运行模式:
内核模式:GuestOS执行I/O类操作,或其它的特殊指令的操作;称作“来宾-内核”模式;
用户模式:代表GuestOS请求I/O类操作;
来宾模式:GuestOS的非I/O类操作;事实上,它被称作“来宾-用户”模式;
kvm hypervisor:

KVM的组件:
两类组件:
/dev/kvm:工作于hypervisor,在用户空间可通过ioctl()系统调用来完成VM创建、启动等管理功能;它是一个字符设备,功能:
创建VM、为VM分配内存、读写VCPU的寄存器、向VCPU注入中断、运行VCPU等等;
qemu进程:工作于用户空间,主要用于实现模拟PC机的IO设备;

KVM特性:
内存管理:
将分配给VM的内存交换至SWAP;
支持使用Huge Page;
支持使用Intel EPT或AMD RVI技术完成内存地址映射;GVA-->GPA-->HPA
支持KSM (Kernel Same-page Merging)
硬件支持:
取决于Linux内核;
存储:
本地存储:
网络附加存储:
存储区域网络:
分布式存储:例如GlustFS
实时迁移:
支持的GuestOS:
Linux, Windows, OpenBSD, FreeBSD, OpenSolaris;
设备驱动:
IO设备的完全虚拟化:模拟硬件
IO设备的半虚拟化:在GuestOS中安装驱动;virtio
virtio-blk, virtio-net, virtio-pci, virtio-console, virtio-ballon

KVM局限性:
1、一般局限性:
a、CPU overcommit
b、时间记录难以精确,依赖于时间同步机制
2、MAC地址:
a、VM量特别大时,存在冲突的可能性;
b、实时迁移:
c、性能局限性:

KVM的工具栈:
1、qemu:
qemu-kvm
qemu-img
qemu-io
2、libvirt:
GUI: virt-manager, virt-viewer
CLI: virt-install, virsh

QEMU主要提供了以下几个部分:
处理器模拟器
仿真IO设备
关联模拟的设备至真实设备;
调试器
与模拟器交互的用户接口

安装:
(1) 确保CPU支持HVM

grep -E --color=auto "(vmx|svm)" /proc/cpuinfo

(2) 装载模块

modprobe kvm

modprobe kvm-intel

(3) 验正:
/dev/kvm

管理工具栈:
1、使用qemu-kvm管理工具:

yum install qemu-kvm

ln -sv /usr/libexec/qemu-kvm /usr/bin/

2、libvirt:
安装:virt-install、virt-manager
管理:virsh、virt-manager、virt-viewer

qemu-kvm [options] [disk_image]
options分类:
◇ 标准选项;
◇块设备选项;
◇显示选项;
◇i386平台专用选项;
◇网络选项;
◇字符设备选项;
◇蓝牙相关选项;
◇Linux系统引导专用选项;
◇调试/专家模式选项;
◇PowerPC专用选项;
◇Sparc32专用选项;

qemu-kvm的标准选项
qemu-kvm的标准选项主要涉及指定主机类型、CPU模式、NUMA、软驱设备、光驱设备及硬件设备等。
◇-name name:设定虚拟机名称;
◇-M machine:指定要模拟的主机类型,如Standard PC、ISA-only PC或Intel-Mac等,可以使用“qemu-kvm -M ?”获取所支持的所有类型;
◇-m megs:设定虚拟机的RAM大小;
◇-cpu model:设定CPU模型,如coreduo、qemu64等,可以使用“qemu-kvm -cpu ?”获取所支持的所有模型;
◇-smp n[,cores=cores][,threads=threads][,sockets=sockets][,maxcpus=maxcpus]:设定模拟的SMP架构中CPU的个数等、每个CPU的核心数及CPU的socket数目等;PC机上最多可以模拟255颗CPU;maxcpus用于指定热插入的CPU个数上限;
◇-numa opts:指定模拟多节点的numa设备;
◇-fda file
◇-fdb file:使用指定文件(file)作为软盘镜像,file为/dev/fd0表示使用物理软驱;
◇-hda file
◇-hdb file
◇-hdc file
◇-hdd file:使用指定file作为硬盘镜像;
◇-cdrom file:使用指定file作为CD-ROM镜像,需要注意的是-cdrom和-hdc不能同时使用;将file指定为/dev/cdrom可以直接使用物理光驱;
◇-drive option[,option[,option[,...]]]:定义一个硬盘设备;可用子选项有很多。
file=/path/to/somefile:硬盘映像文件路径;
if=interface:指定硬盘设备所连接的接口类型,即控制器类型,如ide、scsi、sd、mtd、floppy、pflash及virtio等;
index=index:设定同一种控制器类型中不同设备的索引号,即标识号;
media=media:定义介质类型为硬盘(disk)还是光盘(cdrom);
snapshot=snapshot:指定当前硬盘设备是否支持快照功能:on或off;
cache=cache:定义如何使用物理机缓存来访问块数据,其可用值有none、writeback回写、unsafe和writethrough通写四个;
format=format:指定映像文件的格式,具体格式可参见qemu-img命令;
◇-boot [order=drives][,once=drives][,menu=on|off]:定义启动设备的引导次序,每种设备使用一个字符表示;不同的架构所支持的设备及其表示字符不尽相同,在x86 PC架构上,a、b表示软驱、c表示第一块硬盘,d表示第一个光驱设备,n-p表示网络适配器;默认为硬盘设备;
-boot order=dc,once=d

qemu-kvm的显示选项
显示选项用于定义虚拟机启动后的显示接口相关类型及属性等。
◇-nographic:默认情况下,qemu使用SDL来显示VGA输出;而此选项用于禁止图形接口,此时,qemu类似一个简单的命令行程序,其仿真串口设备将被重定向到控制台;
◇-curses:禁止图形接口,并使用curses/ncurses作为交互接口;
◇-alt-grab:使用Ctrl+Alt+Shift组合键释放鼠标;
◇-ctrl-grab:使用右Ctrl键释放鼠标;
◇-sdl:启用SDL;
◇-spice option[,option[,...]]:启用spice远程桌面协议;其有许多子选项,具体请参照qemu-kvm的手册;
◇-vga type:指定要仿真的VGA接口类型,常见类型有:
cirrus:Cirrus Logic GD5446显示卡;
std:带有Bochs VBI扩展的标准VGA显示卡;
vmware:VMWare SVGA-II兼容的显示适配器;
qxl:QXL半虚拟化显示卡;与VGA兼容;在Guest中安装qxl驱动后能以很好的方式工作,在使用spice协议时推荐使用此类型;
none:禁用VGA卡;
◇-vnc display[,option[,option[,...]]]:默认情况下,qemu使用SDL显示VGA输出;使用-vnc选项,可以让qemu监听在VNC上,并将VGA输出重定向至VNC会话;使用此选项时,必须使用-k选项指定键盘布局类型;其有许多子选项,具体请参照qemu-kvm的手册;

display:
(1)host:N
172.16.100.7:1, 监听于172.16.100.7主的5900+N的端口上
(2) unix:/path/to/socket_file
(3) none

options:
password: 连接时需要验正密码;设定密码通过monitor接口使用change
reverse: “反向”连接至某处于监听状态的vncview上;

-monitor stdio:表示在标准输入输出上显示monitor界面
-nographic
Ctrl-a, c: 在console和monitor之间切换
Ctrl-a, h: 显示帮助信息

网络属性相关选项
网络属性相关选项用于定义网络设备接口类型及其相关的各属性等信息。这里只介绍nic、tap和user三种类型网络接口的属性,其它类型请参照qemu-kvm手册。
◇-net nic[,vlan=n][,macaddr=mac][,model=type][,name=name][,addr=addr][,vectors=v]:创建一个新的网卡设备并连接至vlan n中;PC架构上默认的NIC为e1000,macaddr用于为其指定MAC地址,name用于指定一个在监控时显示的网上设备名称;emu可以模拟多个类型的网卡设备,如virtio、i82551、i82557b、i82559er、ne2k_isa、pcnet、rtl8139、e1000、smc91c111、lance及mcf_fec等;不过,不同平台架构上,其支持的类型可能只包含前述列表的一部分,可以使用“qemu-kvm -net nic,model=?”来获取当前平台支持的类型;
注意:macaddr默认为:52:54:00:12:34:56;需要特别指定。
◇-net tap[,vlan=n][,name=name][,fd=h][,ifname=name][,script=file][,downscript=dfile]:通过物理机的TAP网络接口连接至vlan n中,使用script=file指定的脚本(默认为/etc/qemu-ifup)来配置当前网络接口,并使用downscript=file指定的脚本(默认为/etc/qemu-ifdown)来撤消接口配置;使用script=no和downscript=no可分别用来禁止执行脚本;
◇-net user[,option][,option][,...]:在用户模式配置网络栈,其不依赖于管理权限;有效选项有:
vlan=n:连接至vlan n,默认n=0;
name=name:指定接口的显示名称,常用于监控模式中;
net=addr[/mask]:设定GuestOS可见的IP网络,掩码可选,默认为10.0.2.0/8;
host=addr:指定GuestOS中看到的物理机的IP地址,默认为指定网络中的第二个,即x.x.x.2;
dhcpstart=addr:指定DHCP服务地址池中16个地址的起始IP,默认为第16个至第31个,即x.x.x.16-x.x.x.31;
dns=addr:指定GuestOS可见的dns服务器地址;默认为GuestOS网络中的第三个地址,即x.x.x.3;
tftp=dir:激活内置的tftp服务器,并使用指定的dir作为tftp服务器的默认根目录;
bootfile=file:BOOTP文件名称,用于实现网络引导GuestOS;如:qemu -hda linux.img -boot n -net user,tftp=/tftpserver/pub,bootfile=/pxelinux.0

cat /etc/qemu-ifup

#!/bin/bash
#
bridge=br0

if [ -n "$1" ]; then
ip link set $1 up
sleep 1
brctl addif $bridge $1
[ $? -eq 0 ] && exit 0 || exit 1
else
echo "Error: no interface specified."
exit 1
fi

cat /etc/qemu-ifdown

#!/bin/bash
#
bridge=br0

if [ -n "$1" ];then
brctl delif $bridge $1
ip link set $1 down
exit 0
else
echo "Error: no interface specified."
exit 1
fi

qemu-img:qemu磁盘管理工具
qemu-img是qemu用来实现磁盘映像管理的工具组件,其有许多子命令,分别用于实现不同的管理功能,而每一个子命令也都有一系列不同的选项。其使用语法格式为“qemu-img  subcommand  [options]”,支持的子命令如下。
◇create:创建一个新的磁盘映像文件;
◇check:检查磁盘映像文件中的错误;
◇convert:转换磁盘映像的格式;
◇info:显示指定磁盘映像的信息;
◇snapshot:管理磁盘映像的快照;
◇commit:提交磁盘映像的所有改变;
◇rbase:基于某磁盘映像创建新的映像文件;
◇resize:增大或缩减磁盘映像文件的大小;

qemu-img command [command options]
常用command:
1、create [-q] [-f fmt] [-o options] filename [size]
2、convert [-c] [-p] [-q] [-n] [-f fmt] [-t cache] [-T src_cache] [-O output_fmt] [-o options] [-s snapshot_name] [-S sparse_size] filename [filename2 [...]] output_filename
3、snapshot [-q] [-l | -a snapshot | -c snapshot | -d snapshot] filename
4、resize [-q] filename [+ | -]size

qemu-kvm:常用选项:
标准选项:-m,-cpu;-name;-smp;
块设备选项:-drive file=/path,if=,media;-boot order=dc,once=d   (其中d表示光驱,c表示硬盘,n表示网卡);
显示选项:-vnc  host:number;-nographic;-monitor  stdio;-vga qxl;
网络选项:-net nic,macaddr=mac,mode=virtio;-net tap,ifname=,script=/etc/qemu-ifup,downscript=/etc/qemu-ifdown;
-daemonize:让qemu-kvm的虚拟机运行于后台
-usbdevice  tablet:鼠标轨迹同步
-balloon virtio:让VM中运行的GuestOS动态调整其内存大小;

案例:qemu-kvm创建xp虚拟机
1、创建磁盘文件winxp.qcow2

qemu-img create -o size=20G -f qcow2 winxp.qcow2

2、启动xp虚拟机

qemu-kvm -name "xp" -m 512 -smp 4 -cpu host -drive file=xp_sp3.iso,media=cdrom -drive file=winxp.qcow2,media=disk,cache=writeback,format=qcow2 -boot order=dc,once=d

virtio半虚拟化:
HVM:虚拟化CPU
I/O半虚拟化分成两段:
a、前端驱动(virtio前半段):virtio-blk, virtio-net, virtio-pci, virtio-balloon, virtio-console
                 Linux:CentOS 4.8+, 5.3+, 6.0+, 7.0+
                 Windows:
b、virtio: 虚拟队列,virt-ring
c、transport:
d、后端处理程序(virt backend drivers):在QEMU中实现;

virtio-balloon:
ballooning: 让VM中运行的GuestOS动态调整其内存大小;

qemu-kvm  -balloon virtio

手动查看GuestOS的内存用量:
info balloon
balloon N

virtio-net:
其依赖于GuestOS中的驱动,及Qemu中的后端驱动
GuestOS: virtio_net.ko
Qemu: qemu-kvm -net nic,model=?

qemu-kvm  -net nic,model=virtio

Host中的GSO, TSO
关掉可能会提升性能:
ethtool -K $IF gso off
ethtool -K $IF tso off
ethtool -k $IF

vhost-net:用于取代工作于用户空间的qemu中为virtio-net实现的后端驱动以实现性能提升的驱动;

-net tap[,vnet_hdr=on|off][,vhost=on|off]

qemu-kvm -net tap,vnet_hdr=on,vhost=on

virtio-blk:
其依赖于GuestOS中的驱动,及Qemu中的后端驱动

-drive file=/path/to/some_image_file,if=virtio

kvm_clock: 半虚拟化的时钟

grep -i "paravirt" /boot/config-2.6.32-504.el6.x86_64

CONFIG_PARAVIRT_GUEST=y
CONFIG_PARAVIRT=y
CONFIG_PARAVIRT_CLOCK=y

VM Migration:虚拟机迁移:前提是需要共享存储;
1、static migration
2、live migration
整体迁移时间
服务器停机时间
对服务的性能的影响

在待迁入主机使用

qemu-kvm    -vnc :N -incoming tcp:0:7777

vncviewer :590N

在源主机使用:
monitor接口:
migrate tcp:DEST_IP:DEST:PORT

隔离模型:
激活tap,并将其加入到指定的bridge;

路由模型:
激活tap,并将其加入到指定的bridge;
额外:给虚拟的bridge添加地址,打开核心转发;

nat模型:
激活tap,并将其加入到指定的bridge;
额外:打开核心转发,并添加nat规则;

桥接模型:
激活tap,并将其加入到指定的bridge;

libvirt工具栈:
支持的虚拟化技术:KVM,XEN,VMWARE,Qemu,LXC,OpenVZ;
被管理的各节点运行libvirtd;管控端运行libvirt工具;

命令行模式:virt-install:虚拟机创建和安装的工具;virsh:虚拟机的命令行管理工具
图形化模式:virt-manager:全生命周期的图形化管理工具;

guestfish:检查和修改虚拟机磁盘映像;

安装:
centos6:# yum install libvirt libvirt-client python-virtinst virt-manager
centos7:# yum install libvirt libvirt-client virt-install virt-manager

libvirt和libvirtd的配置文件:
libvirt配置文件:/etc/libvirt/libvirt.conf
守护进程配置文件:/etc/libvirt/libvirtd.conf

virt-install是一个命令行工具,它能够为KVM、Xen或其它支持libvirt API的hypervisor创建虚拟机并完成GuestOS安装;此外,它能够基于串行控制台、VNC或SDL支持文本或图形安装界面。安装过程可以使用本地的安装介质如CDROM,也可以通过网络方式如NFS、HTTP或FTP服务实现。对于通过网络安装的方式,virt-install可以自动加载必要的文件以启动安装过程而无须额外提供引导工具。当然,virt-install也支持PXE方式的安装过程,也能够直接使用现有的磁盘映像直接启动安装过程。

virt-install命令有许多选项,这些选项大体可分为下面几大类,同时对每类中的常用选项也做出简单说明。
◇一般选项:指定虚拟机的名称、内存大小、VCPU个数及特性等;
-n NAME, --name=NAME:虚拟机名称,需全局惟一;
-r MEMORY, --ram=MEMORY:虚拟机内在大小,单位为MB;
--vcpus=VCPUS[,maxvcpus=MAX][,sockets=#][,cores=#][,threads=#]:VCPU个数及相关配置;
--cpu=CPU:CPU模式及特性,如coreduo等;可以使用qemu-kvm -cpu ?来获取支持的CPU模式;
◇安装方法:指定安装方法、GuestOS类型等;
-c CDROM, --cdrom=CDROM:光盘安装介质;
-l LOCATION, --location=LOCATION:安装源URL,支持FTP、HTTP及NFS等,如http://172.16.0.1/cobbler/ks_mirror/CentOS-7-x86_64;
--pxe:基于PXE完成安装;
--livecd: 把光盘当作LiveCD;
--os-type=DISTRO_TYPE:操作系统类型,如linux、unix或windows等;
--os-variant=DISTRO_VARIANT:某类型操作系统的变体,如rhel5、fedora8等;
-x EXTRA, --extra-args=EXTRA:根据--location指定的方式安装GuestOS时,用于传递给内核的额外选项,例如指定kickstart文件的位置,--extra-args "ks=http://172.16.0.1/class.cfg"
--boot=BOOTOPTS:指定安装过程完成后的配置选项,如指定引导设备次序、使用指定的而非安装的kernel/initrd来引导系统启动等 ;例如:
--boot  cdrom,hd,network:指定引导次序;
--boot kernel=KERNEL,initrd=INITRD,kernel_args=”console=/dev/ttyS0”:指定启动系统的内核及initrd文件;
◇存储配置:指定存储类型、位置及属性等;
--disk=DISKOPTS:指定存储设备及其属性;格式为--disk /some/storage/path,opt1=val1,opt2=val2等;常用的选项有:
device:设备类型,如cdrom、disk或floppy等,默认为disk;
bus:磁盘总线类型,其值可以为ide、scsi、usb、virtio或xen;
perms:访问权限,如rw、ro或sh(共享的可读写),默认为rw;
size:新建磁盘映像的大小,单位为GB;
cache:缓存模型,其值有none、writethrouth(缓存读)及writeback(缓存读写);
format:磁盘映像格式,如raw、qcow2、vmdk等;
sparse:磁盘映像使用稀疏格式,即不立即分配指定大小的空间;
--nodisks:不使用本地磁盘,在LiveCD模式中常用;
◇网络配置:指定网络接口的网络类型及接口属性如MAC地址、驱动模式等;
-w NETWORK, --network=NETWORK,opt1=val1,opt2=val2:将虚拟机连入宿主机的网络中,其中NETWORK可以为:
bridge=BRIDGE:连接至名为“BRIDEG”的桥设备;
network=NAME:连接至名为“NAME”的网络;
   其它常用的选项还有:
model:GuestOS中看到的网络设备型号,如e1000、rtl8139或virtio等;
mac:固定的MAC地址;省略此选项时将使用随机地址,但无论何种方式,对于KVM来说,其前三段必须为52:54:00;
--nonetworks:虚拟机不使用网络功能;
◇图形配置:定义虚拟机显示功能相关的配置,如VNC相关配置;
--graphics TYPE,opt1=val1,opt2=val2:指定图形显示相关的配置,此选项不会配置任何显示硬件(如显卡),而是仅指定虚拟机启动后对其进行访问的接口;
TYPE:指定显示类型,可以为vnc、sdl、spice或none等,默认为vnc;
port:TYPE为vnc或spice时其监听的端口;
listen:TYPE为vnc或spice时所监听的IP地址,默认为127.0.0.1,可以通过修改/etc/libvirt/qemu.conf定义新的默认值;
password:TYPE为vnc或spice时,为远程访问监听的服务进指定认证密码;
--noautoconsole:禁止自动连接至虚拟机的控制台;
◇设备选项:指定文本控制台、声音设备、串行接口、并行接口、显示接口等;
--serial=CHAROPTS:附加一个串行设备至当前虚拟机,根据设备类型的不同,可以使用不同的选项,格式为“--serial type,opt1=val1,opt2=val2,...”,例如:
--serial pty:创建伪终端;
--serial dev,path=HOSTPATH:附加主机设备至此虚拟机;
--video=VIDEO:指定显卡设备模型,可用取值为cirrus、vga、qxl或vmvga;

◇虚拟化平台:虚拟化模型(hvm或paravirt)、模拟的CPU平台类型、模拟的主机类型、hypervisor类型(如kvm、xen或qemu等)以及当前虚拟机的UUID等;
-v, --hvm:当物理机同时支持完全虚拟化和半虚拟化时,指定使用完全虚拟化;
-p, --paravirt:指定使用半虚拟化;
--virt-type:使用的hypervisor,如kvm、qemu、xen等;所有可用值可以使用’virsh capabilities’命令获取;
◇其它:
--autostart:指定虚拟机是否在物理启动后自动启动;
--print-xml:如果虚拟机不需要安装过程(--import、--boot),则显示生成的XML而不是创建此虚拟机;默认情况下,此选项仍会创建磁盘映像;
--force:禁止命令进入交互式模式,如果有需要回答yes或no选项,则自动回答为yes;
--dry-run:执行创建虚拟机的整个过程,但不真正创建虚拟机、改变主机上的设备配置信息及将其创建的需求通知给libvirt;
-d, --debug:显示debug信息;

--import:导入已存在系统的磁盘映像;

尽管virt-install命令有着类似上述的众多选项,但实际使用中,其必须提供的选项仅包括--name、--ram、--disk(也可是--nodisks)及安装过程相关的选项。此外,有时还需要使用括--connect=CONNCT选项来指定连接至一个非默认的hypervisor。

注意:每个虚拟机创建后,其配置信息保存在/etc/libvirt/qemu目录中,文件名与虚拟机相同,格式为XML。

示例:利用已经存在的磁盘映像文件(已经有安装好的系统)创建一个名为cirros的虚拟机
方法1:# virt-install --name=cirros --ram=1024 --vcpus=4 --cpu=host --disk=/images/cirros/cirros-no_cloud-0.3.0-x86_64-disk.img --import --graphics vnc
方法2(直接启动终端):# virt-install --name=cirros --ram=1024 --vcpus=4 --cpu=host --disk=/images/cirros/cirros-no_cloud-0.3.0-x86_64-disk.img --import --nographics --serial=pty --console=pty
退出控制端:ctrl +  ];重新连接控制端:virsh   console

virsh的几个常用命令:
virt-install:创建虚拟机,并安装OS;也可创建虚拟机并导入Image文件;
根据xml文件创建:
create:创建并启动
define:创建但不启动
关闭domain:
destroy
shutdown
reboot
删除domain:
undefine
连接至console:
console
列出:
list
附加或拆除disk:
attach-disk
detach-disk
附加或拆除网卡:
attach-interface
detach-interface
保存状态至磁盘文件或从磁盘文件恢复:
save
restore
暂停于内存或继续运行:
suspend
resume

virt-manager:GUI工具

kvm虚拟机管理平台:
oVirt、ConVirt等较轻量化:;
OpenStack、CloudStack、OpenNebula、openQRM等云计算平台
http://www.linux-kvm.org/page/Management_Tools

网络虚拟化技术

OpenVSwitch: 虚拟交换机

VLAN, VXLAN

虚拟路由器

什么是VLAN?
Virtual LAN; LAN即为广播帧能够到的节点范围,也即能够直接通信的范围;

VLAN:
基于MAC地址
基于交换机Port实现
基于IP地址实现
基于用户实现

交换机接口的类型:
访问链接:access link
汇聚链接:trunk link

VLAN的汇聚方式:
IEEE 802.1q
ISL: Inter Switch Link(思科专有协议)

VLAN间路由:
路由器:
访问链接:router为每个VLAN提供一个接口
汇聚链接:router只向交换提供一个接口
三层交换机

虚拟化技术:
cpu, memory, i/o

IaaS(Infrastructure as a Service),即基础设施即服务。
PaaS(Platform as a Service),即平台即服务。
SaaS(Software as a Service),即软件即服务

Linux内核:
namespace
文件系统隔离;
网络隔离: 主要用于实现网络资源的隔离,包括网络设备、IPv4以及IPv6地址、IP路由表、防火墙、/proc/net、/sys/class/net以及套接字等;
IPC隔离;
用户和用户组隔离:
PID隔离:对名称空间内的PID重新标号,两个不同的名称空间可以使用相同的PID;
UTS隔离:Unix Time-sharing System,提供主机名称和域名的隔离;
cgroups
用于完成资源配置;用于实现限制被各namespace隔离起来的资源,还可以为资源设置权重 、计算使用量、完成各种所需的管理任务等;

Linux Network NameSpace:注意其核心转发功能直接依赖于宿主机的net.ipv4.ip_forward参数设置;
注意:netns在内核实现,其控制功能由iproute所提供的netns这个OBJECT来提供;CentOS6.6提供的iproute不具有此OBJECT,需要依赖于OpenStack Icehouse的EPEL源来提供;

网络虚拟化中:
交换机功能模拟:1、brctl创建bridge;2、openvswitch创建bridge;
路由器功能模拟:通过linux network namespace模拟隔离的空间,开启路由或者snat、dhcp等实现;

成对虚拟网卡的创建:ip link add FRONTEND-NAME type veth peer name BACKEND-NAME
将网卡分配给namespace:ip link set  DEVICE  netns  NAME
将网卡分配给bridge:brctl addif  BRIDGE   DEVICE
在namespace开启dhcp和网关:1、yum install dnsmasq;2、ip netns  exec r1  dnsmasq   -F   192.168.71.100,192.168.71.200   --dhcp-option=option:router,192.168.71.1

netns基本命令:
ip netns list
ip netns add NAME
ip netns del NAME
ip netns exec NAME COMMAND:在隔离的namespace执行命令

复杂的虚拟化网络:
netns
OpenVSwitch

OVS:基于C语言研发;特性:
802.1q, trunk, access
NIC bonding
NetFlow, sFlow
QoS配置及策略
GRE, VxLAN,
OpenFlow

OVS的组成部分:
ovs-vswitchd:OVS daemon, 实现数据报文交换功能,和Linux内核兼容模块一同实现了基于流的交换技术;
ovsdb-server:轻量级的数据库服务,主要保存了整个OVS的配置信息,例如接口、交换和VLAN等等;ovs-vswithed的交换功能基于此库实现;
ovs-dpctl:
ovs-vsctl:用于获取或更改ovs-vswitchd的配置信息,其修改操作会保存至ovsdb-server中;
ovs-appctl
ovsdbmonitor:gui工具,显示OVS的数据库信息;
ovs-controller
ovs-ofctl
ovs-pki

ovs-vsctl命令的使用:
            show: ovsdb配置内容查看
            add-br NAME:添加桥设备;
            list-br: 显示所有已定义BRIDGE
           del-br BRIDGE: 删除桥
           add-port BRIDGE PORT: 将PORT添加至指定的BRIDGE
           list-ports BRIDGE: 显示指定BRIDGE上已经添加的所有PORT
           del-port [BRIDGE] PORT: 从指定BRIDGE移除指定的PORT
           set  port  vif0.0  tag=10:设置vif0.0的vlan为10
           remove  port vif0.0  tag 10:移除vif0.0的vlan设置

/etc/if-up脚本:
#!/bin/bash
#
bridge=br-in

if [ -n "$1" ]; then
   ip link set $1 up
   sleep 1
   ovs-vsctl add-port $bridge $1
   [ $? -eq 0 ] && exit 0 || exit 1
else
   echo "Error: no port specified."
   exit 2
fi

/etc/if-down脚本:
#!/bin/bash
#
bridge=br-in

if [ -n "$1" ]; then
   ip link set $1 down
   sleep 1
   ovs-vsctl del-port $bridge $1
   [ $? -eq 0 ] && exit 0 || exit 1
else
   echo "Error: no port specified."
   exit 2
fi

一、同一个物理宿主机上的虚拟机通信:
a、在同一个ovs构建的虚拟交换机中,通过设置tap来划分vlan

ovs-vsctl  set   port   vif0.0 tag=10

b、在不同的ovs构建的虚拟交换机中,需要生成一对网卡,各接入虚拟交换中,并设置端口的trunks、vlan_mode的值;

二、不在同一个物理宿主机上的虚拟机通信:
GRE: Generic Routing Encapsulation,通用路由封装;是一种隧道技术;
a、宿主机物理接口桥接到虚拟交换机上,并在虚拟交换机上配置ip地址;
b、通过GRE隧道技术来实现;需额外添加一个gre0到虚拟交换机上;

ovs-vsctl add-port  br-in   gre0

ovs-vsctl set interface  gre0  type=gre  options:remote_ip=192.168.20.2     #此IP为宿主机间的物理网卡间通信的ip

c、通过配置vxlan;需额外添加一个vx0到虚拟交换机上;

ovs-vsctl add-port  br-in   vx0

ovs-vsctl set interface  vx0  type=vxlan  options:remote_ip=192.168.20.2     #此IP为宿主机间的物理网卡间通信的ip