提示:
数据版本:MySQL 8 +
首先需要知道,创建json数据字段的索引和普通字段的索引,在本质上没有区别。
为什么没什么区别?我们思考一下,创建一个索引的要素有哪些?我们需要提供什么信息?
- 表名,即要知道你要操作哪张表。
- 待创建索引的字段,毕竟索引是根据一个或多个字段来创建的。
- 待创建索引字段的数据类型。
- 待创建的索引名称, 需要唯一。
普通数据类型的字段, 如:int, char, unsigned等,我们很好提供上面的信息,例如:为student
表的name CHAR(32)
字段创建一个索引,语句为:【ALTER TABLE student
ADD INDEX student_name_index
(name
);】,该语句中,student
提供了1. 表名
, name
同时提供2. 待创建索引的字段,即student.name
和3.待创建索引字段的数据类型, 即CHAR(32)
两种信息,student_name_index
提供了4. 待创建的索引名称
。拥有了这4个信息,我们可成功创建索引。
但可惜的是,MySQL不支持直接
为json数据类型
创建索引,因此无法成功执行 【ALTER TABLE student ADD INDEX student_name_index(json_field_name
);】。
因此,MySQL8引入了间接创建的方式。也就是,可以间接指定
json数据的成员或者元素作为创建索引的字段,而字段对应的数据类型我们手动指定。
换句话说,就是为json数据的成员,提供2. 待创建索引的字段
和3.待创建索引字段的数据类型
两种信息,从而拥有创建索引的4要素
, 即可创建索引。因此,创建的语句区别,为标【有所区别,需要做改动的地方】
的地方,
【ALTER TABLE student ADD INDEX student_name_index(【有所区别,需要做改动的地方】
);】,而本质上没有任何区别。
接下来将围绕着这一个区别 进行细致的讲解。
由于json有两类不同的数据形式,即:json对象
(如:{"id": 1, "name":"he"}
),json数组
(如:["1","2","3"]
),因为进行分开讲解。
json对象
例如:有student
表,拥有一个json类型
的字段data
,数据形如:{"id": 1, "name":"he"}
【内容】
为需要自行替换的部分
语法:ALTER Table 【表名】 ADD INDEX 索引名( ( CAST(【表中json的字段名】-> "$.【需要建立索引的数据成员名】" as【需要建立索引的数据成员的数据类型】 ARRAY) ) )
其中,【成员名对应的数据类型】
自行参考数据MySQL8
拥有的数据类型,例如可填:CHAR(32)
, UNSIGNED
等。
data
字段数据中的name
成员创建索引。创建索引语句:ALTER Table
student
ADD INDEXstudent_name_index
( ( CAST(data
-> “$.name
” asCHAR(32)
ARRAY) );
json数组
例如: 例如:有student
表,拥有一个json类型
的字段data
,数据形如:["1","2"]
或[{"id": 1, "name":"he"},{"id": 2, "name":"zhi"}]
【内容】
为需要自行替换的部分
语法:ALTER Table 【表名】 ADD INDEX 索引名( ( CAST(【表中json的字段名】 -> '$[*].【需要作为索引的json数据的成员名】' as 【成员名对应的数据类型】‘ ARRAY) ) )
其中, $[*]
代表数据中的每个元素,也就是将会让所有的元素加入索引,例如:第x行的数据为["1","2"]
,索引中将有"1"
和"2"
都对应到x行;若为$[0]
,那么只会将每行的第一个元素加入索引。
此外,【成员名对应的数据类型】
自行参考数据mysql拥有的数据类型,例如:CHAR(32), UNSIGNED等。
data
字段数据为["1","2"]
,为数组中所有元素创建索引。创建索引语句:ALTER Table
student
ADD INDEXstudent_data_index
( ( CAST(data
-> “$[*]
” asCHAR(32)
ARRAY) );
data
字段数据为[{"id": 1, "name":"he"},{"id": 2, "name":"zhi"}]
,为数组中所有元素的成员id
创建索引。创建索引语句:ALTER Table
student
ADD INDEXstudent_data_index
( ( CAST(data
-> “$[*].id
” asUNSIGNED
ARRAY) );
json数组
,但内部元素不为json对象
例如:["1","2", "3"]
就是为json数组
,但内部元素不为json对象
的数据,使用上述的1.
和2.
的语法都可,推荐使用2.
语义更为明确。下方的示例,展示这种特殊的情况。
json对象
的json数组
)-- 创建表
DROP TABLE IF EXISTS `test`;
CREATE TABLE test (
id BIGINT NOT NULL AUTO_INCREMENT PRIMARY KEY,
jchararr JSON NOT NULL COMMENT "元素为char类型的json数组"
);
-- 插入数据
INSERT INTO
test (jchararr)
VALUES
('["1","2","3"]'),
('["1"]'),
('[]'),
('["4","2","3"]');
jchararr
字段中的每个元素创建索引接下来将展示两种不同的方式。
ALTER Table test ADD INDEX jchararr_index(
/* 由于数组中的元素类型,sql不知道,需要手动指定数组中的元素的类型为Char*/
( CAST(`jchararr` as CHAR(32) ARRAY) )
);
SELECT * FROM test WHERE '2' MEMBER OF(jchararr);
EXPLAIN SELECT * FROM test WHERE '2' MEMBER OF(jchararr);
只适用于当字段的数据为
[1,2,3,4,4]
或者['a','b','c']
的json数组,而若是[{"id": 1},{"d": 2'}]
这样的数据,需创建id
的索引,并不支持,因为仅通过CAST(jchararr as CHAR(32) ARRAY)
是无法让mysql知道[{"id": 1},{"d": 2'}]
中有id
这个成员和它的数据类型。当然方式2可以通过$[*].member_name
json内部成员访问符,进行指定,从而解决该问题。
ALTER Table test ADD INDEX jchararr_index_2(
/* 由于数组中的元素类型,sql不知道,需要手动指定数组中的元素的类型为Char*/
( CAST(`jchararr`->'$[*]' as CHAR(32) ARRAY) )
);
上述的
$[*]'
代表json数组中的所有元素,若元素类型为json对象,如:[{"id": 1},{"d": 2'}]
,则需改成$[*].id
。
SELECT * FROM test WHERE '2' MEMBER OF(jchararr->'$[*]');
上述的
$[*]'
代表json数组中的所有元素,若元素类型为json对象,如:[{"id": 1},{"d": 2'}]
,则需改成$[*].id
。
EXPLAIN SELECT * FROM test WHERE '2' MEMBER OF(jchararr->'$[*]');
花了一整天写的文章,如果对你有帮助,希望能够点赞收藏一下,谢谢支持。