为什么 shift 比 pop 慢?JS 中队列的实现

我们知道在 JS 中,删除数组元素有两个方法:popshift,分别可以删除末尾与开头的元素。

然而同样是删除元素,它们的执行时间确实不同的。

当数组项目较多时,shift 的执行时间明显长于 pop

const test = (arrLength) => {
  let arr1 = []
  console.time(`${arrLength}-arr1`)
  for (let i = 0; i < arrLength; i++) {
    arr1.push(i)
  }
  for (let i = 0; i < arrLength; i++) {
    arr1.pop()
  }
  console.timeEnd(`${arrLength}-arr1`)

  let arr2 = []
  console.time(`${arrLength}-arr2`)
  for (let i = 0; i < arrLength; i++) {
    arr2.push(i)
  }
  for (let i = 0; i < arrLength; i++) {
    arr2.shift()
  }
  console.timeEnd(`${arrLength}-arr2`)
}

test(10 ** 5)
test(10 ** 6)

结果如下:

为什么 shift 比 pop 慢?JS 中队列的实现_第1张图片

这是因为 pop 删除元素后不需要改变其他元素的索引,时间复杂度为 O(1);而调用 shift 方法删除开头元素后,需要维护数组的索引,相当于对数组中的所有元素都进行了一次赋值操作,其时间复杂度为 O(n)

栈与队列

栈与队列是我们常用的两种数据结构。

栈的元素先进后出,比如函数栈,函数递归调用时,后调用的函数先执行完。

队列的元素先进先出,比如任务队列,任务按照派发的顺序依次执行。

在 JS 中,栈可以看成只调用 pushpop 方法的数组,队列可以看成是只调用 shiftpush 方法的数组。

然而在之前的例子中也看到了,当处理大量数据时,把数组直接当成队列使用性能非常差。

所以,我们要设法实现队列这一数据结构。

如何实现?

开始之前我们要明确实现的目标,我们实现的队列要提供以下几个功能:

  • 存储数据:队列要能够按序存储数据
  • push:添加元素的唯一方法,将元素添加进队列尾部的方法,并返回队列长度
  • shift:删除元素的唯一方法,将队首元素删除的方法,并返回删除的元素
  • length:可以通过 length 属性访问队列的长度
  • 访问元素:一般队列会允许访问队头与队尾的元素

这里介绍通过 假删除数组元素 的方式实现队列。

我们知道数组的不能当作队列使用的原因是直接使用 shift 删除元素后会移动其余元素的索引。

我们可以自己维护数组的索引,避免删除后频繁移动。

具体实现是定义一个 offset 变量,记录索引的偏移。

在访问元素时,通过偏移量的计算,获取正确的结果。

在删除元素时,只用把数组首元素置空,然后偏移加 1。

这期间不进行真实的删除操作,这就是所谓的假删除

但为了避免数组大小无限增大,我们设置当偏移量(空元素)大于数组的长度的一半时,就将空元素删除,保证占用空间不超过使用队列大小的两倍。

具体实现代码及注释如下

// 创建一个队列
function createQueue() {
  const arr = [] // 内部的数组
  let offset = 0 // 偏移

  // 添加元素,返回队列的长度
  const push = (...arg) => {
    return arr.push(...arg) - offset
  }
  // 删除元素,返回被删除的元素
  const shift = () => {
    const res = arr[offset] // 要返回的删除元素
    // 假删除
    arr[offset] = undefined
    offset++

    // 避免数组无限扩大,定期一次性删除前面的空元素
    if (offset > arr.length / 2) {
      arr.splice(0, offset)
      offset = 0
    }

    return res
  }

  // 通过 Proxy 拦截队列的操作
  const p = new Proxy(
    {},
    {
      get(target, prop) {
        switch (prop) {
          case 'push': {
            return push
          }
          case 'shift': {
            return shift
          }
          case 'length': {
            // 队列长度 = 数组实际长度 - 偏移
            return arr.length - offset
          }
          default: {
            // 元素真实索引 = 要访问的索引 + 偏移
            return arr[Number(prop) + offset]
          }
        }
      },
    }
  )

  return p
}

const queue = createQueue()

console.log(queue.push(0, 1, 2, 3, 4)) // 5
console.log(queue[0]) // 0
console.log(queue.length) // 5

console.log(queue.shift()) // 0
console.log(queue[0]) // 1
console.log(queue.length) // 4

console.log(queue.shift()) // 1
console.log(queue.push(5)) // 4
console.log(queue[0]) // 2
console.log(queue[queue.length - 1]) // 5

测试性能

进行 10/100/1000 万次增删操作,测试队列的性能

const test = (arrLength) => {
  let arr1 = []
  console.time(`${arrLength}-arr1`)
  for (let i = 0; i < arrLength; i++) {
    arr1.push(i)
  }
  for (let i = 0; i < arrLength; i++) {
    arr1.pop()
  }
  console.timeEnd(`${arrLength}-arr1`)

  let arr2 = createQueue()
  console.time(`${arrLength}-arr2`)
  for (let i = 0; i < arrLength; i++) {
    arr2.push(i)
  }
  for (let i = 0; i < arrLength; i++) {
    arr2.shift()
  }
  console.timeEnd(`${arrLength}-arr2`)
}

test(10 ** 5)
test(10 ** 6)
test(10 ** 7)

function createQueue() {……}

测量结果如下:

为什么 shift 比 pop 慢?JS 中队列的实现_第2张图片

可以看出,不管数据多大,性能也只差 4 倍。

因为要进行操作的拦截与索引偏移的计算,格外的性能开销不可避免,常数倍的性能差距已经可以满足要求。

结语

如果文中有不理解或不严谨的地方,欢迎评论提问。

如果喜欢或有所启发,希望能点赞关注,鼓励一下作者。

你可能感兴趣的:(为什么 shift 比 pop 慢?JS 中队列的实现)