Koa入门教程[6]-初探源码

本文大纲

  • express与koa的对比
  • Koa1 内核源码
  • 简要介绍 Koa2 内核与 koa1 的区别
  • 了解 Koa 中 http 协商缓存的实现机制
  • koa-router 源码
  • koa-view 源码

express

本文我们不讲解express的源码。但是express的实现机制对于我们了解 TJ 在设计框架时的思路有一定的参考意义。express 实现了一个类似于流的请求处理过程,其源码比 Koa 还要稍微复杂一点(主要是其内置了Router概念来实现路由)。如果对 express 的源码感兴趣的可以参考这两篇文章:

从express源码中探析其路由机制

NodeJS框架之Express4.x源码分析

exporess和koa都是用来对http请求进行 接收、处理、响应。在这个过程中,express和koa都有提供中间件的能力来对请求和响应进行串联。同时要提供一个封装好的 执行上下文 来串联中间件。

因此,koa和express就是把这些http处理能力打包在一起的一个完整的后端应用框架。涉及到了一个请求处理的完整流程,其中包含了这些知识概念:Application、Request、Response、COntext、Session、Cookie。

express跟koa的区别是,express使用的ES5时代的语言能力(没有使用generator和async),因此express实现的中间件机制是传统的串行的流式运行(从第一个运行到最后一个后输出响应);而koa使用了generator或async从而实现了一种洋葱模型的中间件机制,所谓洋葱模型实际上就是中间件函数在运行过程中可以停下来,把执行权交给后面的中间件,等到合适的时机再回到函数内继续往下执行

Koa1 内核

本文我们还是主要分析 Koa1 的代码(因为 Generator 比 async 要绕一些难一些),我看的代码是基于 Koa 1.6.0。

对于 Koa1 来说,其实现是基于 ES6 的 Generator 函数。Generator 给了我们用同步代码编写异步的可能,他可以让程序执行流 流向 下方,在异步结束之后再返回之前的地方执行。Generator 就像一个迭代器,可以通过它的 next 方法不断去迭代来实现函数的步进式执行。对于 Generator 函数解决异步问题的学习可以参考 阮一峰的 ES6 教程 Generator函数与异步

Koa 内核只有 1千 行左右的代码。共包含 4 个文件:

application.js
request.js
response.js
context.js

我们从 package.json 中可以看到 Koa 的主入口是 lib/application.js. 这个入口做的事情便是导出了一个 Application 的class类。(可以看到 Koa 的实现相比express已经比较面向对象了)

而 Application 的 prototype 上被挂载了我们常用的 application 的方法,例如 use, listen, callback, onerror

咦?是不是少了点 API? app.env,app.proxy这些呢?

原来,这些是 Application 的实例属性,在 Application 实例化的时候会同步初始化。来看一下 Application 构造函数的代码:

function Application() {
  if (!(this instanceof Application)) return new Application; // 支持工厂函数模式创建
  this.env = process.env.NODE_ENV || 'development'; // 设置当前环境
  this.subdomainOffset = 2; // 应用的子域偏移(这个主要是控制request.subdomain如何返回当前域名的哪个部分;具体可参考文档的request.subdomains)
  this.middleware = []; // 存放应用中间件的数组
  this.proxy = false; // 是否信任代理。为true时会让request.ips/hosts等字段读取X-Forward-*头
  this.context = Object.create(context); // 在app挂载一个继承 context 对象的对象。
  this.request = Object.create(request); // 在app挂载一个继承 request 对象的对象
  this.response = Object.create(response); // 在app挂载一个继承 response 对象的对象
}

Application 类型的实现就是如此简单,除此之外,还继承了 EventEmitter 从而提供事件能力:

Object.setPrototypeOf(Application.prototype, Emitter.prototype);

至此,Application 上的方法和属性我们都找到源头了,暂且先不分析其方法的具体实现。我们再来看看 request 和 response 对象。

而从 request.js 中可以看到,该文件就仅仅导出了一个Object对象,对象中所有函数和属性即是 Koa 中间件中 request api 的所有方法。简要摘录下该文件源码结构:

// request.js
module.exports = {
  get header() {
    return this.req.headers;
  }
}

注意到这里面的 api 基本上就是对 Node.js 原生的 http.IncomingMessage 类型 API 的封装; response.js 也是类似的; context.js 也是类似的,并代理挂载了 request 和 response 的一些方法。那这里问题就来了: 上面代码中 this.req 为什么可以拿到 IncomingMessage 对象呢?这就要从 Koa 中间件是如何运行说起了。

中间件是如何运行起来的?

我们先看下中间件是如何注入到应用中的。我们在开发 Koa 应用时,通常是使用 app.use 来注册中间件。

app.use(function * (next) {
  this.body = '123'
  yield next
})

而 use 函数做了一件很简单的事情: 把你的中间件置入 app.middleware 数组。

// 简化后的 use 函数
app.use = function(fn){
  this.middleware.push(fn);
  return this;
};

由于 use 函数同时返回了 this 指针,因此 app.use 得以可以链式调用。再回到我们的话题: 中间件是如何运行起来的。 我们看下 Koa 的启动代码:

http.createServer(app.callback()).listen(3000);
// 或
app.listen(3000)

由于 listen 是一个语法糖,因此 http请求 最终都是被 app.callback() 函数返回的一个 function 来执行。 我们看看 callback 到底返回了一个什么函数, 下面是我去掉了一些无关紧要的 error 处理代码之后的源码:

app.callback = function(){
  var fn = co.wrap(compose(this.middleware)); // 把所有中间件包装成一个fn函数
  var self = this;
  // 返回一个闭包
  return function handleRequest(req, res){
    var ctx = self.createContext(req, res); // 把Node原生的req和res包装成Koa的context对象
    self.handleRequest(ctx, fn); // 开始执行中间件
  }
};

其实原理很简单了,就是把 http 请求利用 createContext函数包装为 context 对象,然后调用 app.handleRequest 把应用内所有中间件执行一遍并返回结果给浏览器。

还记得上文提到的一个问题: 为什么 request对象内可以用 this.req 拿到原生请求? 原理在这里就显而易见了,正是 self.createContext 把原生 req 设置在了 ctx 对象上(这里就不展开源码讲解了)

现在流程基本清楚了。但这里有个难点:

  1. fn 函数是如何能够把所有 Generator 中间件执行的?
  2. 中间件执行完成后是如何响应给浏览器结果的?

delegates 挂载属性到context

我们如果读过koa文档,会发现在中间件中 this/ctx 上是可以访问到 ctx.request 对象上的属性的。这个是因为 koa 在初始化context对象的过程中,把request上相关的属性挂载到了ctx.

这是中间件执行之前创建ctx的过程:

app.createContext = function(req, res){
  var context = Object.create(this.context);
  var request = context.request = Object.create(this.request); // ctx可以访问request对象
  var response = context.response = Object.create(this.response);
  context.app = request.app = response.app = this; // ctx可以访问app对象
  context.req = request.req = response.req = req; //ctx可以访问原生req对象
  context.res = request.res = response.res = res;
  request.ctx = response.ctx = context; // request对象可以访问ctx
  request.response = response; // request和rewspinse可以互相访问
  response.request = request;
  context.onerror = context.onerror.bind(context);
  context.originalUrl = request.originalUrl = req.url;
  context.cookies = new Cookies(req, res, {
    keys: this.keys,
    secure: request.secure
  });
  context.accept = request.accept = accepts(req);
  context.state = {};
  return context;
};

这段代码还是无法解释为什么ctx上可以访问request对象的上的属性。但是这里有一点是有作用的:ctx对象上面挂载了request对象。因此,在ctx的方法中可以通过 this.request 访问到request对象,这为ctx提供了访问request属性的基础。

上述的问题的答案,其实在context对象初始化的过程当中。我们看看context对象的初始化时做了个什么事情:


delegate(proto, 'request')
  .method('acceptsLanguages')
  .method('acceptsEncodings')
  .method('acceptsCharsets')
  .access('querystring')
  .access('idempotent')
  .access('socket')
  .access('search')
  ...

可以看到,这里调用delegate这个库,给context对象添加了很多方法。实际上从deleteate源码中得知,delegate原型是这样的:

Delegator.prototype.method = function(name){
  var proto = this.proto;
  var target = this.target;
  this.methods.push(name);
  proto[name] = function(){
    return this[target][name].apply(this[target], arguments);
  };
  return this;
};

这个很明显就是给ctx添加方法函数,函数内调用目标对象的方法。access是通过getter,setter来访问this[target]的属性。
至此,ctx可以访问request和response属性的谜底就解开了。

中间件的合并和执行

中间件的执行流程和koa2是一致的。把中间件想作一个栈,请求会从顶部的第一个中间件开始处理,遇到yield next调用,就会进入下一个中间件中,直到最后没有yield next调用,再从栈底反弹,一个一个执行之前next之后的代码。

上文讲到了中间件执行主要靠这句代码合并为一个fn函数:

var fn = co.wrap(compose(this.middleware))

这里 compose 是来自 koa-compose 这个模块。 在前文《Koa教程-常用中间件》中,我们已经了解了中间件的合并方式以及 koa-compose 的运作原理:总之就是通过 不断实例化Generator并作为参数传递给前一个Generator函数 的方式把多个 Generator 串联起来,最终执行第一个中间件就相当于串联执行所有中间件。

那么,co.wrap 是什么呢? 这里看下 co 源码 (co源码4.6.0加注释总共才237行):

co.wrap = function (fn) {
  createPromise.__generatorFunction__ = fn;
  return createPromise;
  function createPromise() {
    return co.call(this, fn.apply(this, arguments));
  }
};

function co(gen) {
  ...
}

可以看到,co.wrap 仅仅就是返回了一个闭包,该闭包用于利用 co 来执行原函数(关于co是如何执行Generator的,本文暂不讲解)。看到这里,会有点疑惑,wrap包裹一层这是不是有点多此一举啊?实际上我上面省略了一点点代码,这里 Koa 是为了兼容 ES7 可能不需要co来运行中间件的情况。这里fn函数赋值的原始代码如下:

// ES7 合并后的中间件函数可以直接执行。ES6 generator的方式需要借助CO执行。 fn函数屏蔽了底层差异
var fn = this.experimental
? compose_es7(this.middleware)
: co.wrap(compose(this.middleware));

至此,我们已经梳理出整个 http 请求的流程,即: Koa 收到 http 连接回调后,对InCompingMessage进行包装为 ctx, 并调用中间件合并后的函数 fn 进行业务处理。业务处理的代码非常简单,就是以ctx为上下文执行中间件:

// handleRequest便是收到网络请求后中间件运行的起点
app.handleRequest = function(ctx, fnMiddleware){
  ctx.res.statusCode = 404;
  onFinished(ctx.res, ctx.onerror);
  // 注意这里: fnMiddleware.call(ctx) 就把中间件执行上下文设置为了 context 对象
  fnMiddleware.call(ctx).then(function handleResponse() {
    respond.call(ctx);
  }).catch(ctx.onerror);
};

在开发 Koa 应用时,我们知道在中间件中使用 this 就是在访问 context 对象. 正是因为在 Koa 执行中间件函数时将上下文设置为了 context 对象。

response如何响应给浏览器的?

这个主要是在 co 执行中间件 resolve 之后利用了上文代码中看到的 respond 函数来实现。

  fnMiddleware.call(ctx).then(function handleResponse() {
    respond.call(ctx);
  }).catch(ctx.onerror);

respond函数主要是对ctx上设置的body内容进行解析,并选择合适的方法响应给浏览器。这里限于篇幅不再具体讲解了。

为什么可以不用 yield *

另外我们发现,在 Koa 的中间件里,我们通常用:

 yield next

来运行下一个中间件。通过上面的原理,我们了解到所谓的 next 变量 实际上就是下一个中间件 Generator函数的实例,可是我们会疑惑右值是一个Generator对象的时候 运行 Generator实例为什么没有使用 yield *? 理论上,如果按照 Generator的原始执行方式,没有使用 yield * 的话,这个语句只会返回 next 这个遍历器对象而已,是无法运行 next 函数的

这个问题的答案就在 co 源码里面,如果看过 co 的源码,会发现它是通过 右值.then(data=>{...}) 回调里不断递归调用 gen.next(data) 来实现自动执行。而 gen.next 又会返回一个新的右值 {value: xx, done:false} ,co通过 toPromise 函数对右值进行Promise化从而可以调用 then,而 toPromise函数中如果检测到这个右值是一个Generator遍历器对象,则会重新用 co 来 run 这个对象。

因此,co 里面可以支持使用了 yield * 的方式(这种方式 Generator默认会展开下一层的遍历器);也可以支持 yield + 遍历器 的方式,这种方式是 co 自己检测到并运行这个迭代器的。

Koa2 内核

Koa2 主要是用 async await 代替了 Generator,用起来更方便了。async await 是 Generator 的语法糖,可以这样理解:

await --> 等于 yield
async --> 等于 Generator函数声明: function * () {}
调用 async 函数 --> 等于利用 co 来自动执行 Generator: co(function*(){})

co 运行器返回的是一个 Promise, async 函数运行后也是返回一个 Promise。

Koa2 里面直接使用了 ES6 语法来创建 Application 类型:

module.exports = class Application extends Emitter {}

Koa2 中的 app.use、app.listen 等实现与 Koa1 基本完全一致。区别开始出现在 app.callback 函数里:

  callback() {
    const fn = compose(this.middleware); // 合并中间件

    if (!this.listenerCount('error')) this.on('error', this.onerror);

    const handleRequest = (req, res) => {
      const ctx = this.createContext(req, res);
      return this.handleRequest(ctx, fn);
    };

    return handleRequest;
  }

  handleRequest(ctx, fnMiddleware) {
    const res = ctx.res;
    res.statusCode = 404;
    const onerror = err => ctx.onerror(err);
    const handleResponse = () => respond(ctx);
    onFinished(res, onerror);
    return fnMiddleware(ctx).then(handleResponse).catch(onerror);
  }

可以看到 handleRequest 里面调用中间件函数 fnMiddleware 时不再设置上下文,而是直接传递 ctx 到中间件中。因此 Koa 在中间件里不是通过 this 获取上下文,而是用 ctx 变量。

另外一个主要区别就在于上面代码中这个 compose 了。

koa2的 compose模块

Koa2 使用了 4.x 版本的 koa-compose, 其实现有一些变化:

function compose (middleware) {
  if (!Array.isArray(middleware)) throw new TypeError('Middleware stack must be an array!')
  for (const fn of middleware) {
    if (typeof fn !== 'function') throw new TypeError('Middleware must be composed of functions!')
  }

  return function (context, next) {
    // last called middleware #
    let index = -1
    return dispatch(0)
    function dispatch (i) {
      if (i <= index) return Promise.reject(new Error('next() called multiple times'))
      index = i
      let fn = middleware[i]
      if (i === middleware.length) fn = next
      if (!fn) return Promise.resolve()
      try {
        return Promise.resolve(fn(context, dispatch.bind(null, i + 1)));
      } catch (err) {
        return Promise.reject(err)
      }
    }
  }
}

这个 compose 就是专门针对 async 函数而设计的了。 它最终返回的是个 function (context, next) 这样的闭包函数。 在上文讲到的 Koa2 的请求入口里 fnMiddleware(ctx) 的 fnMiddleware 实际上就是在调用这个函数。可以看到这个函数只接收了 context 参数,而 next 参数是 undefined。

我们再来看看这个函数内部做了啥。它实际上从 middleware数组的第 0 项开始触发执行(dispath(0)),相当于主动在调用中间件async函数:

 yourmid(ctx, next)

而这个 next 实际上传入的是下一个中间件函数。由此形成了递归调用。直到最后中间件没有了, fn = next 被赋值为undefined(因为next的值是undefined),然后回溯。回溯后返回的 Promise 交给 handleResponse 响应或错误处理:

const onerror = err => ctx.onerror(err);
return fnMiddleware(ctx).then(handleResponse).catch(onerror);

可以看到 Koa2 的错误处理机制,跟 Koa1 也是一样的,都是中间件中一旦发生 throw Error,则会触发 fnMiddleware 的 catch,进而触发 context 对象的 onerror,在 ctx.onerror 里面会做出浏览器响应并调用 app.onerror 兜底。

以上就是 Koa2 的执行流程。跟 Koa1 差别不是很大,这里没有再过多展开了,如果希望了解更详细的 Koa2 源码解读,这里推荐一篇知乎专栏

Koa 中协商缓存实现机制

我们知道在 http 协议中, 服务器端一般使用 http 报文的 if-none-match if-modify-since 字段来进行缓存协商。 Koa 提供了一个 request.fresh 函数来帮助你确定是否返回 304.

这个 fresh 函数的实现基于 npm 模块 fresh. 它内部会检查当前 response 响应头的 etag 和 last-modifyed 与 请求头里的 对应字段进行比对判断。

这个可以用在 Node 响应浏览器的最后一环时。

koa-route

我们先看一个简陋版的router是怎么做的。这个库叫做 koa-route (注意不是koa-router哦)

这个route库只做了一件事,就是帮我们生成简单的 generator 中间件,中间件的内容就是判断当前请求的路径是否是符合我们的配置要求,符合才执行。

其用法如下:

var _ = require('koa-route');

app.use(_.get('/pets', pets.list));
app.use(_.get('/pets/:name', pets.show));

其中pets.list假设就是我们针对 /pets 路径的处理函数。

实际上 _.get() 会把你传入的path包装成一个对其进行判断的generator中间件。类似于:

function * (next) {
    if (this.path === '/pets' && this.method === 'get') {
        ...
    }
    else {
        yield next
    }
}

看他的源码也只有聊聊几行,核心在于这个create函数:

Koa入门教程[6]-初探源码_第1张图片

这个红圈圈出来的部分就是实际的 _.get返回值,作为中间件给注册进了 Koa

koa-view

TODO

KOA源码学习

Koa1源码学习+co源码学习
Koa2源码学习
你知道koa中间件执行原理吗

你可能感兴趣的:(koa)