简要介绍联合索引

联合索引(Composite Index 或 Multiple-Column Index)是数据库索引的一种类型,它由多个列组合在一起创建。联合索引的主要作用是加速包含多个列的查询,特别是涉及多列条件的查询语句。

举例说明:

假设有一个包含 first_namelast_name 列的 users 表:

CREATE TABLE users (
    user_id INT PRIMARY KEY,
    first_name VARCHAR(255),
    last_name VARCHAR(255),
    email VARCHAR(255)
);

现在如果经常执行以下查询:

SELECT * FROM users WHERE first_name = 'John' AND last_name = 'Doe';

为加速这个查询,我们可以创建一个包含 first_namelast_name 的联合索引:

CREATE INDEX idx_name ON users (first_name, last_name);

这个联合索引将会加速查询时对这两列的查找。

联合索引的工作原理:

  1. 列顺序重要:在联合索引中,列的顺序至关重要。数据库会首先根据第一个列(在例子中是 first_name)排序,然后基于第二个列(last_name)排序。因此,查询时如果只使用联合索引的前缀列,数据库仍然可以利用索引。

    例如,以下查询可以有效利用上述联合索引:

    SELECT * FROM users WHERE first_name = 'John';
    

    但是,如果你只查询 last_name 列,联合索引无法被利用:

    SELECT * FROM users WHERE last_name = 'Doe';
    

    这种查询需要全表扫描,因为 last_name 列不是联合索引的前缀部分。

  2. 匹配前缀原则:联合索引遵循最左前缀匹配原则。这意味着数据库可以利用联合索引的前几列进行优化,而不一定需要使用所有列。例如,包含前两个列的索引也可以加速只针对第一列或前两列的查询。

  3. 查询优化:联合索引在处理多列条件查询时非常高效,尤其是涉及 WHERE 子句中的多个列的查询。它能够避免全表扫描,提高查询速度。

示例:

假设你有一个电商订单表 orders,包括 customer_idorder_datestatus 等列:

CREATE TABLE orders (
    order_id INT PRIMARY KEY,
    customer_id INT,
    order_date DATE,
    status VARCHAR(20)
);

如果你经常按 customer_idorder_date 进行查询:

SELECT * FROM orders WHERE customer_id = 123 AND order_date = '2024-09-01';

你可以创建一个联合索引来加速该查询:

CREATE INDEX idx_order_customer_date ON orders (customer_id, order_date);

这样查询将会使用该联合索引,加速查找。

优点:

  • 提高查询性能:联合索引可以显著提高涉及多列条件的查询的性能,避免全表扫描。
  • 减少单列索引的需求:联合索引可以同时覆盖多个列,减少为每个列单独创建索引的需求。

缺点:

  • 索引大小增加:由于联合索引涉及多个列,索引的大小可能会显著增加,占用更多的存储空间。
  • 写操作开销增加:每当有插入、更新或删除操作时,索引也需要被更新,涉及多个列的联合索引比单列索引的开销更大。

总结:

联合索引通过将多个列组合成一个索引,提高了复杂查询的性能,特别是在涉及多列条件的查询场景中。但它的设计需要谨慎考虑列的顺序,以及是否真的需要多个列一起作为查询条件。

你可能感兴趣的:(八股-数据库,数据库,联合索引)