数据可视化习题

一.单选题

1.下列哪一项是对文本关键词进行可视化的方法?(A)

A标签云B短语网络C文本流D词语树

2.针对比例数据,研究者关心的是(B)

A各比例的顺序

B各比例的分布和相互关系

C各比例的变化

D各比例的大小

3.堆叠柱形图除了可以展示离散型时间数据,还可以展示(C)

A比例的变化情况

B数据随时间变化的趋势

C多个部分到整体的关系

D一个部分到整体的关系

4.对于关系数据,我们要做的是尝试着探索事物的(D)

A因果关系B线性关系C逻辑关系D相关关系

5.下列哪一项不属于导航的基本操作?(B)

A平移B指示C缩放D旋转

6.下列选项哪一个不是数据中所包含的信息(C)

A模式B关系C原理D异常

7.我们用散点图可以推断出变量间的(B)

A分布性B相关性C因果性D结构性

8.用于发现两个变量之间的数理关系的图是(B)

A散点图B拟合曲线C折线图D气泡图

9.(B)可一次完成统计分组和次数分配,其图形直观且保留原始信息,平均值、中位数和众数均可按照原始数据准确、方便地算出。

A密度图B茎叶图C饼图D直方图

10.如果数据存在子分类,而这些分类相加有意义的话,为了展示数据的数值差异,应该选择(A)

A堆叠柱形图B柱状图C堆叠折线图D直方图

11.下列那一项属于格式塔原则(D)

A间断原则B分组原则C相邻原则D闭合原则

12.高维多元数据中高维指数据具有多个(B)属性。

A互斥B独立C不相关D相关

13.对于折线图来说,合理设置横轴长度的原因是(B)

A使得折线剧烈变化,方便观察

B正确展示折线变化趋势

C正确设置横轴刻度

D规范图的大小

14.可以在二维平面上展示三个变量关系的单一图表是(D)

A散点图矩阵B散点图C堆叠面积图D气泡图

15.饼图不太适合表示精确数据的原因是(A)

A人眼对面积的大小不敏感

B饼图的角度不能精确展示数据

C饼图上只能标记比例,不能标记数据值

D对圆的设置会影响饼图对数据的展示

16.文档散是对文本的(B)进行可视化

A短语B关键词C句子D主题

17.以宽度相等的条形高度或长度的差异来显示统计单个指标数值多少或大小的一种图形是(B)

A茎状图B柱状图C直方图D堆叠柱状图

18.(D)允许同时看到多个单独变量的分布和它们两两之间的关系。

A气泡图B雷达图C平行坐标D散点矩阵图

19.几何体表达法对数据的不确定性可视化的缺点是(B)

A需要精心选择视觉元素才能有效表达不确定性

B易污染原有的确定性数据的可视化结果

C容易产生视觉混淆问题

D理解曲线较长,易引起疲劳

20.环形图采用(B)表示各类别的占比。

A角度B弧度C颜色D宽度

21.下列哪一个不属于高维多元数据可视化中的空间映射法?(A)

A雷达图B表格透镜C气泡图D平行坐标

22.下列哪一项不是定量或定序的视觉通道(D)

A面积B角度C长度D位置

23.下列哪一项是定性或分类的视觉通道(A)

A形状B包含C相似D直线的长度

24.矩形树图可以呈现树状结构数据的(C)关系。

A因果B同异C比例D关联

25.可视化的精髓与核心是(C)

A图表B视觉编码C数据D视觉通道

26.大数据分析和可视化中分而治之的思想没有体现在下列那一层?(B)

A统计分析层B数据采集层

C数据挖掘层D数据可视化层

27.对于带有连续时间属性的比例数据,可以选择(A)进行可视化。

A堆叠面积图B堆叠折线图

C堆叠柱形图D冲击图

28.下列哪个技术可用于解决由于空间距离拉大导致数据属性关联性降低的问题?(B)

A关联技术B导航技术C过滤技术D重配技术

29.数据不确定性来源于哪里?(A)

A以上全部B可视化C测量D建模

30.平行坐标的缺点是(C)

A数据维度大于四时,会由于视觉通道太多而降低可读性

B随着维度的扩展,子图会成指数增加,在有限的屏幕空间中会降低可读性

C难同时表现多个维度间的关系

D数据细节无法清楚展示

31.下列哪一项不属于文本信息层级?(C)

A语义级B语法级C语句级D词汇级

二.填空题

32.数据分布的实质是,在各组按顺序排列的基础上,列出每个组的总体单位数,形成一个数列,各组的总体单位数叫___次数;频数________。

33.直方图的取值区间是___连续_______、____不重叠_____的变量间隔。

34.如果变量之间不存在相互关系,那么,在散点图上就会表现为______随机分布的离散的点_________。

35.异构数据,是指在同一个数据集中存在的如___结构____或者____属性____不同的数据情况。

36.数据可视化的目的,是对_____数据____进行可视化处理,以使得能够明确地、有效地传递__信息______。

37.提取文本信息需要采用适当的文本度量方法,_____向量空间模型_______是常用的方法。

38._____视觉编码______描述数据与可视化结果的映射关系。

39.视觉编码描述数据与可视化结果的______映射关系________。

40.数据可视化的美学原则有____简单原则_____、_____平衡原则_______和________聚焦原则_______。

41.______视觉高级感知_____层次包括对物体的识别和分类。

42._____拟合曲线______是指选择适当的曲线类型来拟合离散数据点,建立数据关系(数学模型),分析两变量间的关系。

43.视觉感知的进一步就是______视觉认知_______。

44.高维多元数据中高维指数据具有多个______独立______属性,多元指数据具有多个_____相关__属性。

45.数据中所包含的信息为___模式_________、_______关系_______和__________异常______。

46.星系视图是对文档______关系______进行可视化的方法。

47.可视化编码由______标记;图形元素_____(点、线、面)和_____视觉通道_____(颜色、位置、尺寸)两部分组成。

48.数据的____关联性_____,其核心就是指量化的两个数据间的数理关系。

49.________矩形树图________是一种基于面积的呈现树状结构的数据的可视化方式。

50.交互有效缓解了____可视化空间_________和______数据过载________之间的矛盾。

51.茎叶图的基本思想是将数组或序列中的变化不大或不变的位作为______茎;主干______,将变化大的数作为______叶;分枝____排在后面。

52.大数据分析和可视化中分而治之的思想体现在______统计分析_______层、_____数据挖掘_________层、_______数据可视化_______层。

53.异构数据,是指在同一个数据集中存在的如_______结构____或者_____属性___不同的数据情况。

54._______比例_______数据是根据类别、子类别和群体进行划分的数据。

55.柱形图是以宽度相等的条形的_____高度;长度___________的差异来显示统计指标数值多少或大小的一种图形。

56.不确定性可视化的方法有_______图标法____、____几何体表达法__、______视觉元素编码法______、_____动画表达法_______。

57.文本信息层级为____词汇级______、______语法级______和_____语义级______。

58.数据的关联性主要有_______正相关_____、____负相关______和_____不相关关系_________。

59.雷达图可以看成平行坐标的_____极坐标_________。

60.文本弧是对文本_____分布_____的可视化。

61.关系数据具有_____关联___性和______分布____性。

62.主题河流图是对___时序______文本进行可视化。

63.数据可视化中将数据类型分为三种:__类别型数据_____、___有序型数据___和___数值型数据_____

64.时间数据可以分为______连续型_____时间数据和______离散型_____时间数据两种。

65.时间数据可视化的目的是从中发现_______趋势____。

66.交互就是用户通过与系统之间的互动来___理解数据_______的过程。

67.密度图用曲线代替柱形图的效果,曲线以下的总面积等于______1;一______。

三.判断题

68.√暖色调颜色常常给人兴奋、愉快、活泼、亲切的感受,适用于积极、健康、努力等方面的表现内容。

69.√数据分布是指在统计分组的基础上,将总体中各单位按组归类整理,按一定顺序排列,形成的总体

70.√时间型数据包含时间属性,不仅要表达数据随时间变化的规律,还需表达数据分布的时间规律。

71.×视觉通道的表现力和有效性中的可辨性指不同视觉通道的编码对象放置到一起,是否容易分辨。

72.×不确定性可视化对确定性数据可视化结果没有负面影响。

73.×视觉的高级感知层次与物体性质相关,包括深度、形状、边界、表面材质等。

74.√数据不确定性可视化有助于帮助用户准确地理解数据并做出正确决策。

75.√交互技术可以帮助用户处理更庞大的数据,但是用户额外的时间成本也会增加。

76.×文本主题的抽取算法大致可分为两类:基于贝叶斯的非概率模型和基于矩阵分解的概率模型。

77.√关联技术可以通过交互的方式向用户展现数据之间的联系。

78.×分组的视觉通道适合于编码分类的数据信息。

79.×异常的数据一定都是错误的数据。

80.√密度图表现与数据值对应的边界或域对象的一种理论图形表示方法。

81.×视觉感知是把看的信息加以整合、解释、赋以意义的心理活动。

82.×数据中所包含的信息,归纳起来,主要有三种:变化、关系和分类。

83.×关系数据的相关性既能告诉人们事物为何产生,也可以给人们一个事物正在发生的提醒。

84.√在数据可视化中,通常并不区分区间型数据和比值型数据。

85.√冷色系颜色是以蓝色为中心的色群,这个色群常会给人造成寒冷、清爽、收缩的感受,适用于表现商业、科技、学习等方面的表现内容。

86.×一个好的可视化必须展示所有的信息内容,以保证用户一次获取全部数据信息。

87.×人们在获取视觉感知的时候,会倾向于将事物理解为组成该事物所有部分的集合,而不是将事物解为一个整体。

88.√数据间的关系大多可分为三类:数据间的比较,数据的构成,以及数据的分布或联系。

89.×可视化之前不需要将原始数据转换成用户可以理解的模式和特征并显示出来。

90.√气泡图的优势在于它便于我们在二维平面上一次比较3-4个变量。

91.×原始的文本数据无需处理,可以直接用来进行可视化。

92.√在数据的测量、清洗、建模、可视化过程中,都可能产生数据不确定性。

93.√人们天然对大自然的色彩变化感到舒适,所以应该更多地去应用自然中的色彩过渡。

94.×传统的可视化方法可以支持对复杂数据的分析。

95.√可视化系统的目的不是单纯地向用户传递信息,而是提供平台和工具让用户探索数据。

96.√如果两个变量之间存在某种相关性,那么散点图的大部分数据点就会相对密集并呈现出某种趋势。

97.×交互延时的长短对用户体验的效果没有太大影响,设计人员可以自行设置延时时间。

98.×视觉高级感知层次与物体性质相关。

99.√当数据维度非常高的时候,我们需要使用降维的方法降低数据维度,并且保证数据的特征不变。

100.√饼图用圆饼状方式显示一个数据系列中各项的大小、各项总和以及在整体中的比例。

101.×命名实体识别属于语义级信息的提取。

102.√一个有效的可视化是可以在短时间内把数据信息以用户容易理解的方式显示出来。

你可能感兴趣的:(信息可视化,python)