GraphQL（八）：GraphQL集成DataLoader

N+1问题

首先来看看什么是N+1问题，假设我们有如下模型：

image.png

然后我们有这样的查询：

  school(schoolId:"school1"){
    teachers
    {
      teacherName
    }
  }

会得到类似下面的结果：

  "data": {
    "school": {
      "teachers": [
        {
          "teacherName": "老师11"
        },
        {
          "teacherName": "老师12"
        },
        {
          "teacherName": "老师13"
        }
      ]
    }
  }

根据我们之前的经验，GraphQL会这样执行查询逻辑：

根据schoolId查到学校里的teacherId列表
遍历TeacherId列表，查到每个Teacher对象
获取Teacher对象的teacherName属性

很容易发现，遍历teacherId列表取查询每个Teacher对象是极不经济的，而N+1指的就是N次Teacher查询+1次teacherId列表的查询。

Java-DataLoader

DataLoader通过将多次查询合并成一次来减少查询次数。比如上面的例子，需要执行三次对Teacher对象的查询，DataLoader会自动将三次查询合并成一次批量查询。除此之外，就算是不同层级的查询，DataLaoder也会自动进行合并，比如将上面的查询改成：

## 查询全校老师名字和每个班级里的老师名字
school(schoolId:"school1"){
  classList{
    teachers{
      teacherName
    }
  }
  teachers
  {
    teacherName
  }
}

虽然是不同层级，DataLoader也会将针对Teacher对象的查询合并成一次批量查询，同时会过滤掉重复的TeacherId，保证最佳的查询性能。

GraphQL集成Java-DataLoader

这里以优化Teacher对象的查询演示如何集成Java-DataLoader（GraphQL-JAVA默认引入了Java-DataLoader，不需要额外引入）。

1. 实现TeacherDataLoader

class TeacherDataLoader : BatchLoader {
    override fun load(keys: List): CompletableFuture> {
        return CompletableFuture.supplyAsync {
            // 这里是根据ID批量查询Teacher列表
            DataStore.getTeachersByTeacherIds(keys)
        }
    }
}

2. 注入DataLoader

val executionInputBuilder = ExecutionInput.Builder()

// 省略其他内容的注入
// ...

val dataLoaderRegister = DataLoaderRegistry()
dataLoaderRegister.register("teacherBatchLoader", DataLoader.newDataLoader(TeacherDataLoader))
executionInputBuilder.dataLoaderRegistry(buildDataLoaderRegistry())

val executionResult = graphQL.execute(executionInput)

3. 改写Resolver

将所有对Teacher的Fetch修改为通过DataLoader中间层取获取数据（这里以需改SchoolResolver中的teachers为例）：

class SchoolResolver : GraphQLResolver {
    fun teachers(school: School, env: DataFetchingEnvironment): CompletableFuture> {
        val teacherIds = DataStore.schoolStore.first { it.schoolId == school.schoolId }.teachers
        val dataLoader = env.getDataLoader(DataLoaderConstants.TEACHER_DATA_LOADER)
        return dataLoader.loadMany(teacherIds)
    }
}

通过以上三步就完成了DataLoader的集成，接下来分析DataLoader的工作原理。

DataLoader原理

DataLoader主要利用了Java的CompletableFuture异步任务收集再批量处理，最后将结果写回对应任务。