第一周作业

1.什么是虚拟化?

虚拟化是指通过虚拟化技术将一台计算机虚拟为多台逻辑计算机。在一台计算机上同时运行多个逻辑计算机,每个逻辑计算机可运行不同的操作系统,并且应用程序都可以在相互独立的空间内运行而互不影响,从而显著提高计算机的工作效率。

2.什么是云计算?和虚拟化的关系?

云计算是一种基于因特网的超级计算模式,在远程的数据中心里,成千上万台电脑和服务器连接成一片电脑云,是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,

进入可配置的计算资源共享池(资源包括网络,服务器,存储,应用软件,服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。

云计算的核心技术之一就是虚拟化技术。

3.什么是大数据技术?

大数据技术一般包括:大数据采集、大数据预处理、大数据存储及管理、大数据分析及挖掘、大数据展现和应用(大数据检索、大数据可视化、大数据应用、大数据安全等)。

4.什么是OpenStack云计算平台?

OpenStack是一个开源的云计算管理平台项目,由几个主要的组件组合起来完成具体工作,首要任务是简化云的部署过程并为其带来良好的可扩展性,旨在为公共及私有云的建设与管理提供软件的开源项目。OpenStack支持几乎所有类型的云环境,项目目标是提供实施简单、可大规模扩展、丰富、标准统一的云计算管理平台。OpenStack通过各种互补的服务提供了基础设施即服务(IaaS)的解决方案,

它包含两个主要模块:Nova 和Swift,前者是 NASA

开发的虚拟服务器部署和业务计算模块;后者是Rackspace开发的分布式云存储模块,两者可以一起用,也可以分开单独用。

5.什么是Hadoop平台?和OpenStack的区别?

Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用java语言实现开源软件框架,实现在大量计算机组成的集群中对海量数据进行分布式计算。

OpenStack注重的是虚拟化/虚拟机及其配套的服务,hadoop注重的是海量的数据分析和处理。前者主要目的是做一整套的云计算基础构架,包括

云计算(Compute), 网络(Network),对象存贮(Object Store),镜像文件存储

(Image),身份认证(Authentication),BlockStorage 以及 前端UI

,OpenStack的每个模块都对外提供API,可以独立供云用户调用,在OpenStack内部,每个模块之间的相互调用也是用这些API,而后者是一个分布式数据库。OpenStack是管理虚拟机的,hadoop是负责分布式计算和分布式存储。OpenStack是IaaS(基础设施即服务)‎虚拟机管理软件,让任何人都可以自行建立和提供云端运算服务,而hadoop是一个分布式文件系统+分布式计算平台的开源方案,侧重于hdfs云存储与mapreduce云数据分析等方面。OpenStack主要做资源的虚拟化,Hadoop主要用来做超大数据处理,还可以做数据挖掘。Openstack是把大机器虚拟成很多小机器从而达到大的分成小的来用,大大提高资源使用率,Hadoop是把小机器合起来用,用于解决单台大机器无法解决的计算和存储等问题。

6.Hadoop实现的功能?

Hadoop框架中最核心设计就是:HDFS和MapReduce。

分布式文件系统:HDFS —— 提供了海量数据的存储,将文件分布式存储在很多的服务器上

分布式运算编程框架:MAPREDUCE —— 提供了对数据的计算,在很多机器上分布式并行运算




信管1152 赖柳帆 201511671213

你可能感兴趣的:(第一周作业)