《大数据可视化》课后习题答案-何光威版

大数据可视化

本篇只包含部分简答

  • 第一章

一、填空与选择题
1.数据可视化的主要作用包括___ 数据记录和表达_____、数据操作_____和____数据分析_ 三个方面,这也是可视化技术支持计算机辅助数据认知的三个基本阶段。
2.在医学可视化领域上要包含三方面的研究热点: 图像分割技术__、____实时渲染技术____和___多重数据集合_____技术。
3.据Ward M O(2010)的研究,超过( B ) 的人脑功能用于视觉信息的处理,视觉信息处理是人脑的最主要功能之一。
A.30% B.50% C.70% D.40%
4.当前,市场上已经出现了众多的数据可视化软件和工具,下面工具不是大数据可视化工具的是( D )。
A.Tableau B. Datawatch C. Platfora D.Photoshop
5.从宏观角度看,数据可视化的功能不包括( C )。
A.信息记录 B.信息的推理分析 C.信息清洗 D.信息传播
二:简答
1.大数据可视化内涵是什么?

  1. 数据可视化是关于数据视觉表现形式的科学技术研究。
  2. 数据可视化能将复杂的数据转换为更容易理解的方式传递给受众。
  3. 数据可视化主要是通过计算机图形图像等技术手段展现数据的基本特征和隐含规律,辅助人们更好地认识和理解数据,进而支持从庞杂混乱的数据中获取需要的领域信息和知识。
    2.简述数据可视化的起源。
    答:数据可视化起源于图形学、计算机图形学、人工智能、科学可视化以及用户界面等领域的相互促进和发展,是当前计算机科学的一个重要研究方向,它利用计算机对抽象信息进行直观的表示,以利于快速检索信息和增强认知能力。科学可视化—>信息可视化<—>数据可视化
    3.总结数据可视化的意义。
    答:
  4. 真(真实性):指是否正确地反映了数据的本质,以及对所反映的事物和规律有无正确的感受和认识。
  5. 善(倾向性):是可视化所表达的意象对于社会和生活具有什么意义和影响。
  6. 美(艺术完美型):指其形式与内容是否和谐统一,是否有艺术个性,是否有创新和发展。
  • 第二章

–、填空与选择题
1.科学可视化常用方法有_____等值线法___、颜色映射方法__、立体图法层次分割法__、矢量数据场的直接法__、流线法____等(选写三个)。
2.科学可视化最初被称为“科学计算__之中的可视化”。
3.根据数据种类的划分,科学可视化可以分为___体可视化
流场可视化
_、大规模数据可视化_____等。
4.等值线是制图对象某一数量指标值____相等____的各点连成的平滑曲线,由地图上标出的表示制图对象数量的各点,采用____内插法____找出各整数点绘制而成的。
5.信息可视化____是利用计算机支撑的、交互的、对抽象数据的可视表示,来增强人们对这些抽象信息的认知。
6.平行坐标系是一种____多维数据可视化____技术, 使用____平行的竖直轴线____来代表维度,通过在轴上刻划多维数据的数值并用
折线_____连接某一数据项在所有轴上的坐标点,从而在二维空间内展示多维数据。
7. Ben Fry把数据可视化的流程分为了七步:获取
分析过滤挖掘
表示__、修饰__、交互__。
8. 可视分析流程图中的起点是____输入的数据____,终点是___提炼的知识_____。
9. Sacha 的意义建构循环模型包含计算机和人两部分。在计算机部分中,数据被绘制为__ 可视化图表__,同时也通过模型进行整理和挖掘。在人的部分中,提出了___探索循环_____、验证循环____和___知识产生循环_ 三层循环。
10.平行坐标系使用( A ) 来代表维度,通过在轴上刻刘多维数据的数值并用折线相连某一数据项在所有轴上的坐标点,从而在二维空间内展示多维数据。
A.平行的竖直轴线 B.交叉的横直轴线
C.平行的横直轴线 D.交叉的坚直轴线
11.散点图矩阵通过( B ) 坐标系中的一组点来展示变量之间的关系。
A.一维 B.二维 C.三维 D.多维
12.目前有多种成熟的知识可视化工具,下面( D ) 不属于这类可视化工具。
A.概念图 B.思维导图 C.认知地图 D.趋势图
13.可视化模型有助于理解可视化的具体过程,常用的可视化模型不包括( C )。
A.循环模型 B.分析模型 C.递归模型 D.顺序模型
14.极坐标图形是使用( B ) 来绘制的。
A.原点和半径 B.相角和距离 C.横纵坐标 D.原点和相角

二、简答题
1.对数据可视化的三种类型进行对比分析。
三种数据类型:

  1. 类别型数据:用于区分物体,可以用于区分一组对象,但是无法提供对象的定量数据。
  2. 有序型数据:用于表示对象间的顺序关系,但是根据对象的顺序,并不一定能得到准确的定量比较。
  3. 数值型数据:分为区间型数据(用于得到对象间的定量比较)和比值型数据(用于比较数值间的比例关系)
    2.对数据可视化的三种基本模型进行对比分析。
  4. 顺序模型:数据可视化的流程分为了七步:获取、分析、过滤、挖掘、表示、修饰、交互。为了使这个流程更便于理解,把这七步归纳为三大部分,即原始数据的转换(原始数据的转换包括 7 个阶段里的获取、分析、过滤和挖掘)、数据的视觉转换(包括 7 个阶段里的表示和修饰)以及界面交互(包括 7 个阶段里的交互)。
  5. 分析模型:
    (1)数据表示与转换(2)数据的可视化呈现
    (3)用户交互 (4)分析推理
  6. 循环模型:
    (1)探索循环:(2)验证循环(3)知识产生循环
  • 第三章

–、填空与选择题
1.混色特性包括___时间混色_____、__空间混色____和____双眼混色____等。
2.可视化是对数据的透彻理解、深入分析和综合运用,主要包括数据采集、数据处理
、___可视化模式_____和____可视化应用____四个环节。
3.彩色电影中彩色的形成属于相减混色,相减混色中采用品、黄、( C ) 3种颜色作为基色,它们各是绿、蓝、红的补色。
A.红 B.橙 C.青 D.紫
4.在明亮环境下,人眼对波长为555nm的( B )最为敏感。
A.红黄光 B.黄绿光 C.红蓝光 D.紫绿光
5.人眼的视觉有惰性,这种惰性现象也称为视觉暂留,视觉暂留时间约为0.05~( C )。
A.10ms B.50ms C.0.2s D.0.5s
6.人眼的视场是很宽的,垂直方向能超过80°,水平方向能超过( C )。书P51第三段
A.1800 B.170 C.160° D.150°
7.图表类型的选择有依赖于所要处理和展现的数据类型,例如离散数据的数值可清晰计数,最适合用( D ) 展示。
A.曲线图 B.柱状图 C.饼图 D.气泡图
8.雷达图适用于( D )数据,且每个维度必须可以排序。
A. 一维 B.二维 C.三维 D.多维

二、简答题
1.彩色电视系统中的三基色是什么颜色,是如何选定的?
答:三基色是红、绿、蓝;选用红绿蓝三种色光可混配出的颜色最多,使用彩色电视所能重现的色域最宽。
2.何谓明视觉和暗视觉,比较在明视觉条件下对辐射功率相同的510nm绿光和610nm橙光的亮度感觉谁高谁低?
视觉有两重功能:视网膜中央的“视锥细胞视觉”和视网膜边缘的“视杆细胞视觉”,也叫做明视觉和暗视觉。明视觉和暗视觉(PhotopicandScotopicVision)不同波长的光刺激在两种亮度范围内作用于视觉器官而产生的视觉现象。
明视觉:在明亮环境中的亮度感觉
暗视觉:在黑暗环境中的亮度感觉;
比较:在名视觉下,波长自555其,向左右两边减小,510nm绿光的亮度感觉比较高,610nm橙光的亮度感觉比较低
3.何谓视敏函数和相对视敏函数?
视敏函数:通常用辐射功率的倒数来衡量人眼对波长“入”光的敏感程度。把辐射功率的倒数称为视敏函数
相对视敏函数:通常把任意波长光的视敏函数与最大视敏函数的比值称为相对视敏函数
4.何请对比度和亮度层次,它们之间存在什么关系?
对比度:景物或重现图像最大亮度和最小亮度的比值
亮度层次:画面最大亮度与最小亮度之间可分辨的亮度级差数
关系:亮度层次与对比度的对数成正比

  • 第四章

一、选择题
1.基于任务分类学的数据类型定义了7个基本任务,分别是:总览、( ABC ) 、关联、历史和提取。(多选)
A.缩放 B.过滤 C.按需细化 D.删减
2.柱状图可视化的方法的特点,包括( ABC )。 (多选)
A.是一种以长方形的长度为变量的表达图形的统计报告图
B.用来比较两个或以上的价值(不同时间或者不同条件)
C.利用柱子的高度,反映数据的差异
D.适用大规模的数据集
3.可视分析的运行过程可看作是( A ) 的循环过程。(单选)
A.“数据→知识→数据” B.“知识→知识→知识”
C.“数据→数据→数据” D.“知识→数据→数据”
4.常常用图论可视化来表述常见的关系模型,例如( ABC )。(多选)
A.“公司组织结构图” B.“人类关系网”
C.“家谱树” D.“城市 人流检测”
5.方法论的角度,数据可视化可以分为三个层次,分别是( ABC )。 (多选)
A.视觉编码层 B.基本方法层
C.方法应用层 D.界面展示层

  • 第五章

一、选择题
1.与大数据密切相关的技术是( B )。
A.蓝牙 B.云计算 C.博弈论 D.Wifi
2.大数据应用需依托的新技术有( D )。
A.大规模存储与计算 B.数据分析处理 C.智能化 D.三个选项都是
3.将原始数据进行集成、变换、维度规约、数值规约是在( C )步骤的任务。
A.频繁模式挖掘 B.分类和预测 C.数据预处理 D.数据流挖掘
4.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的( A )问题。
A.关联规则发现 B.聚类 C.分类 D.自然语言处理
5.当不知道数所带标签时,可以使用( B )技术位使带同类标签的数据与带其他标签的数据相分离。
A.分类 B.聚类 C. 关联分析 D.隐马尔可夫链
6.下面( A )属于映射数据到新的空间的方法。
A.傅里叶变换 B.特征加权 C.渐进抽样 D.维归约
7.下列( B ) 不是专门用于可视化时间空间数据的技术。
A.等高线图 B.饼图 C.曲面图 D.矢量场图
8.可用作数据挖掘分析中的关联规则算法有( C )。
A.决策树、对数回归、关联模式 B.K均值法、SOM 神经网络
C.Apriori算法、FP-Tree 算法 D.RBF神经网络、K均值法、决策树
9. 用于分类与回归应用的主要算法有( D )。
A.Apriori算法、HotSpot 算法 B. RBI神经网络、K均值法、决策树
C.K均值法、SOM神经网络 D.决策树、BP神经网络、贝叶斯
10.在基本K均值算法里,当邻近度函数采用( A )时,合适的质心是簇中各点的中位数。
A.曼哈顿距离 B.平方欧几里得距离 C.余弦距离 D.Bregman散度

二、简答题
1.描述大数据3个内涵特征是什么,简述大数据内涵的数据特征。
三个内涵特征:大数据的数据特征,大数据技术特征,大数据应用特征
大数据的数据特征,可用4v,5v,7v或11v等来描述。其中7v特征的含义如下:
容量:数据的大小决定所考虑的数据的价值和潜在的信息(量)
速度:获得数据的速度,实时获取需要的信息(速)
种类:结构化数据、半结构化数据和非结构化数据(类)
价值:价值密度低;合理运用大数据,以低成本创造高价值(价)
真实性:数据的质量,数据清洗,去伪存真(真)
可视化:可视化可推动大数据的普及应用(普)
黏性:改善用户体验,增加用户对媒体的黏性(黏)
2.简述总体大数据参考架构。
大数据参考架构总体上可以概括为“一个概念体系,两个价值链维度”。“一个概念体系”是指它为大数据参考价值架构中使用的概念提供了一个构件层级分类体系,“两个价值链维度”分别为“IT价值链”和“信息价值链”
3.大数据核心技术有那些,对大数据参考框架,应该重点关注哪两类问题?
大数据核心技术有数据收集、数据预处理、数据存储、数据处理、数据分析、数据治理。
对大数据参考框架,应关注信息价值链(水平轴)和IT价值链(垂直轴)。
4.大数据可视化关键技术有哪些?
大数据可视化关键技术有:数据信息的符号表达技术、数据渲染技术、数据交互技术、数据表达模型技术、可视化设计与开发模型。

  • 第六章

一、选择题
1.下列( C )不是可视化交互方法。书P126
A.概览+细节技术 B.焦点+上下文技术
C.概览+缩放技术 D.平移+缩放技术
2.鱼眼视图属于( B ) 可视化交互方法。书P129
A.概览+细节技术 B.焦点+上下文技术
C.平移+缩放技术 D.概览+缩放技术
3.多尺度导航属于( C )可视化交互方法。书P126
A.概览+细节技术 B.焦点+上下文技术
C.平移+缩放技术 D.概览+缩放技术
4.下列( D )属于可视化交互设备。书P143
A.平板电脑 B.触摸屏 C.立体眼镜 D.以上都是
5.按照Robert Spence的交互类型分类方法, 下列( B )不属于交互类型。书P143
A.连续式交互 B.主动式交互 C.渐进式交互
D.混合式交互 E.被动式交互

二、简答题
1.结合自己的专业知识,你认为人机交互与数据交互是一回事吗?若不是,真正的区别是什么?
人机交互:人机交互过程实际是一个输入和输出的过程,人通过人机界面向计算机输入指令,计算机处理后把输出结果呈现给用户。
数据交互:人通过输入数据的方式与计算机进行交流的一种方式,是人机交互的重要内容与方式。

你可能感兴趣的:(《大数据可视化》课后习题答案-何光威版)