数据集(dataset)
是专门用来管理数据的组件。虽然每个系列都可以在 series.data
中设置数据,但是从 ECharts4 支持 数据集
开始,更推荐使用 数据集
来管理数据。因为这样,数据可以被多个组件复用,也方便进行 “数据和其他配置” 分离的配置风格。毕竟,在运行时,数据是最常改变的,而其他配置大多并不会改变。
如果数据设置在 系列(series)
中,例如:
黄子涵学习Echarts
在系列中设置数据
这种方式的优点是,适于对一些特殊的数据结构(如“树”、“图”、超大数据)进行一定的数据类型定制。 但是缺点是,常需要用户先处理数据,把数据分割设置到各个系列(和类目轴)中。此外,不利于多个系列共享一份数据,也不利于基于原始数据进行图表类型、系列的映射安排。
而数据设置在 数据集(dataset)
中,会有这些好处:
下面是一个最简单的 dataset
的例子:
黄子涵学习Echarts
一个最简单的 dataset 的例子
或者也可以使用常见的“对象数组”的格式:
黄子涵学习Echarts
使用常见的“对象数组”的格式
如上所述,数据可视化的一个常见思路是:(I)提供数据,(II)指定数据到视觉的映射。
简而言之,可以进行这些映射的设定:
指定 数据集
的列(column)还是行(row)映射为 系列(series)
。这件事可以使用 series.seriesLayoutBy 属性来配置。默认是按照列(column)来映射。
指定维度映射的规则:如何从 dataset 的维度(一个“维度”的意思是一行/列)映射到坐标轴(如 X、Y 轴)、提示框(tooltip)、标签(label)、图形元素大小颜色等(visualMap)。这件事可以使用 series.encode 属性,以及 visualMap 组件来配置(如果有需要映射颜色大小等视觉维度的话)。上面的例子中,没有给出这种映射配置,那么 ECharts 就按最常见的理解进行默认映射:X 坐标轴声明为类目轴,默认情况下会自动对应到 dataset.source
中的第一列;三个柱图系列,一一对应到 dataset.source
中后面每一列。
下面详细解释这些映射的设定。
有了数据表之后,使用者可以灵活地配置:数据如何对应到轴和图形系列。
用户可以使用 seriesLayoutBy
配置项,改变图表对于行列的理解。seriesLayoutBy
可取值:
dataset
的列上面。dataset
的行上面。看这个例子:
黄子涵学习Echarts
把数据集( dataset )的行或列映射为系列(series)
常用图表所描述的数据大部分是“二维表”结构,上述的例子中,我们都使用二维数组来容纳二维表。现在,当我们把系列( series )对应到“列”的时候,那么每一列就称为一个“维度( dimension )”,而每一行称为数据项( item )。反之,如果我们把系列( series )对应到表行,那么每一行就是“维度( dimension )”,每一列就是数据项( item )。
维度可以有单独的名字,便于在图表中显示。维度名( dimension name )可以在定义在 dataset 的第一行(或者第一列)。例如上面的例子中,'score'
、'amount'
、'product'
就是维度名。从第二行开始,才是正式的数据。dataset.source
中第一行(列)到底包含不包含维度名,ECharts 默认会自动探测。当然也可以设置 dataset.sourceHeader: true
显示声明第一行(列)就是维度,或者 dataset.sourceHeader: false
表明第一行(列)开始就直接是数据。
维度的定义,也可以使用单独的 dataset.dimensions
或者 series.dimensions
来定义,这样可以同时指定维度名,和维度的类型( dimension type ):
var option1 = {
dataset: {
dimensions: [
{ name: 'score' },
// 可以简写为 string ,表示 dimension name 。
'amount',
// 可以在 type 中指定维度类型。
{ name: 'product', type: 'ordinal' }
],
source: [
//...
]
}
// ...
};
var option2 = {
dataset: {
source: [
// ...
]
},
series: {
type: 'line',
// series.dimensions 会更优先于 dataset.dimension 采纳。
dimensions: [
null, // 可以设置为 null 表示不想设置维度名
'amount',
{ name: 'product', type: 'ordinal' }
]
}
// ...
};
大多数情况下,我们并不需要去设置维度类型,因为 ECharts 会自动尝试判断。但是如果不足够准确时,可以手动设置维度类型。
维度类型( dimension type )可以取这些值:
'number'
: 默认,表示普通数据。'ordinal'
: 对于类目、文本这些 string 类型的数据,如果需要能在数轴上使用,须是 ‘ordinal’ 类型。ECharts 默认会试图自动判断这个类型。但是自动判断也可能不准确,所以使用者也可以手动强制指定。'time'
: 表示时间数据。设置成 'time'
则能支持自动解析数据成时间戳(timestamp),比如该维度的数据是 ‘2017-05-10’,会自动被解析。如果这个维度被用在时间数轴(axis.type 为 'time'
)上,那么会被自动设置为 'time'
类型。时间类型的支持参见 data。'float'
: 如果设置成 'float'
,在存储时候会使用 TypedArray
,对性能优化有好处。'int'
: 如果设置成 'int'
,在存储时候会使用 TypedArray
,对性能优化有好处。了解了维度的概念后,我们就可以使用 series.encode 来做映射。总体是这样的感觉:
黄子涵学习Echarts
数据到图形的映射( series.encode )
series.encode
声明的基本结构如下。其中冒号左边是坐标系、标签等特定名称,如 'x'
, 'y'
, 'tooltip'
等,冒号右边是数据中的维度名(string 格式)或者维度的序号(number 格式,从 0 开始计数),可以指定一个或多个维度(使用数组)。通常情况下,下面各种信息不需要所有的都写,按需写即可。
下面是 series.encode
支持的属性:
// 在任何坐标系和系列中,都支持:
encode: {
// 使用 “名为 product 的维度” 和 “名为 score 的维度” 的值在 tooltip 中显示
tooltip: ['product', 'score']
// 使用 “维度 1” 和 “维度 3” 的维度名连起来作为系列名。(有时候名字比较长,这可以避免在 series.name 重复输入这些名字)
seriesName: [1, 3],
// 表示使用 “维度2” 中的值作为 id。这在使用 setOption 动态更新数据时有用处,可以使新老数据用 id 对应起来,从而能够产生合适的数据更新动画。
itemId: 2,
// 指定数据项的名称使用 “维度3” 在饼图等图表中有用,可以使这个名字显示在图例(legend)中。
itemName: 3
}
// 直角坐标系(grid/cartesian)特有的属性:
encode: {
// 把 “维度1”、“维度5”、“名为 score 的维度” 映射到 X 轴:
x: [1, 5, 'score'],
// 把“维度0”映射到 Y 轴。
y: 0
}
// 单轴(singleAxis)特有的属性:
encode: {
single: 3
}
// 极坐标系(polar)特有的属性:
encode: {
radius: 3,
angle: 2
}
// 地理坐标系(geo)特有的属性:
encode: {
lng: 3,
lat: 2
}
// 对于一些没有坐标系的图表,例如饼图、漏斗图等,可以是:
encode: {
value: 3
}
这是个更丰富的 series.encode
的 示例 。
series.encode
值得一提的是,当 series.encode
并没有指定时,ECharts 针对最常见直角坐标系中的图表(折线图、柱状图、散点图、K 线图等)、饼图、漏斗图,会采用一些默认的映射规则。默认的映射规则比较简单,大体是:
encode
,也并不复杂。这是一个 例子:
黄子涵学习Echarts
自己来配置 encode
答:
option = {
series: {
encode: { x: 2, y: 4 },
seriesLayoutBy: 'row'
// ...
}
};
答: 关于标签的显示 label.formatter,现在支持引用特定维度的值,例如:
series: {
label: {
// `'{@score}'` 表示 “名为 score” 的维度里的值。
// `'{@[4]}'` 表示引用序号为 4 的维度里的值。
formatter: 'aaa{@product}bbb{@score}ccc{@[4]}ddd';
}
}
答:
option = {
series: {
encode: {
tooltip: [1, 2]
// ...
}
// ...
}
};
答:
var option = {
dataset: {
dimensions: ['score', 'amount'],
source: [
[89.3, 3371],
[92.1, 8123],
[94.4, 1954],
[85.4, 829]
]
}
};
答:
黄子涵学习Echarts
把第三列映射为气泡图的点的大小
答:可以查查有没有拼错,比如,维度名是:'Life Expectancy'
,encode 中拼成了 'Life Expectency'
。
我们可以使用 visualMap 组件进行视觉通道的映射。详见 visualMap 文档的介绍。这是一个 示例:
黄子涵学习Echarts
视觉通道(颜色、尺寸等)的映射
多数常见图表中,数据适于用二维表的形式描述。广为使用的数据表格软件(如 MS Excel、Numbers)或者关系数据数据库都是二维表。他们的数据可以导出成 JSON 格式,输入到 dataset.source 中,在不少情况下可以免去一些数据处理的步骤。
假如数据导出成 csv 文件,那么可以使用一些 csv 工具如 dsv 或者 PapaParse 将 csv 转成 JSON。
在 JavaScript 常用的数据传输格式中,二维数组可以比较直观的存储二维表。前面的示例都是使用二维数组表示。
除了二维数组以外,dataset 也支持例如下面 key-value 方式的数据格式,这类格式也非常常见。但是这类格式中,目前并不支持 seriesLayoutBy 参数。
dataset: [
{
// 按行的 key-value 形式(对象数组),这是个比较常见的格式。
source: [
{ product: 'Matcha Latte', count: 823, score: 95.8 },
{ product: 'Milk Tea', count: 235, score: 81.4 },
{ product: 'Cheese Cocoa', count: 1042, score: 91.2 },
{ product: 'Walnut Brownie', count: 988, score: 76.9 }
]
},
{
// 按列的 key-value 形式。
source: {
product: ['Matcha Latte', 'Milk Tea', 'Cheese Cocoa', 'Walnut Brownie'],
count: [823, 235, 1042, 988],
score: [95.8, 81.4, 91.2, 76.9]
}
}
];
可以同时定义多个 dataset。系列可以通过 series.datasetIndex 来指定引用哪个 dataset。例如:
var option = {
dataset: [
{
// 序号为 0 的 dataset。
source: []
},
{
// 序号为 1 的 dataset。
source: []
},
{
// 序号为 2 的 dataset。
source: []
}
],
series: [
{
// 使用序号为 2 的 dataset。
datasetIndex: 2
},
{
// 使用序号为 1 的 dataset。
datasetIndex: 1
}
]
};
ECharts 4 之前一直以来的数据声明方式仍然被正常支持,如果系列已经声明了 series.data, 那么就会使用 series.data 而非 dataset
。
黄子涵学习Echarts
ECharts 3 的数据设置方式
其实,series.data 也是种会一直存在的重要设置方式。一些特殊的非 table 格式的图表,如 treemap、graph、lines 等,现在仍不支持在 dataset 中设置,仍然需要使用 series.data。另外,对于巨大数据量的渲染(如百万以上的数据量),需要使用 appendData 进行增量加载,这种情况不支持使用 dataset
。
目前并非所有图表都支持 dataset。支持 dataset 的图表有: line
、bar
、pie
、scatter
、effectScatter
、parallel
、candlestick
、map
、funnel
、custom
。 后续会有更多的图表进行支持。
最后,给出这个 示例,多个图表共享一个 dataset,并带有联动交互:
黄子涵学习Echarts
多个图表共享一个 dataset