C++ 20 协程 Coroutine

C++20 协程

C++ 20有一个新玩意,协程。这玩意对C++的未来可能是重要一环,也会是让C++成为服务器编程有力工具。

对C++20的协程,最简单的理解协程是可以重入的特殊函数。就是这个函数在执行的过程,可以(通过co_await ,或者co_yield)挂起,然后在外部(通过coroutine_handle)恢复运行。

我测试的代码都是在Visual studio 2022上运行的。据说GCC 10.0 也已经支持。

协程是特殊的函数

首先再次强调,C++ 20的协程是一个特殊函数。只是这个函数具有挂起和恢复的能力,可以被挂起(挂起后调用代码继续向后执行),而后可以继续恢复其执行。如下图:

C++ 20 协程 Coroutine_第1张图片

如图所示,协程并没有一次执行完成,可以被反复挂起,挂起后可以恢复到挂起的点继续运行。

C++ 20协程的特点

那我们来看看C++ 20 协程的一些特点和用途。

首先,C++ 20 协程是一个无栈(stackless)的协程。同时,C++ 20 协程是非对称的协程,和Linux传统的Context Switch有区别。更像Windows的纤程。和C#的协程也比较相像,毕竟是微软的提案。

传统的Context Switch是有栈协程,你可以认为Context 协程都是运行在栈上,Context 协程的切换就是切换栈。同时因为其是有栈协程。切换是对称的,都是栈切换。你可以从主线程上切换为另外一个Context 协程栈,也可以从一个Context 协程切换为主线程,也可以Context 协程之间切换。Context 协程的状态也就是保存在栈上。

C++ 20的协程可以用来干啥呢?和大部分协程用途类似,就是异步编程用的。看图1就可以明白,每次一次协程的挂起都可以视为协程进入一个等待状态,比如请求一个网络,需要HTTP get一个文件,然后对文件进行分析。那么就可以用协程来包装整个处理,在发起HTTP请求后,挂起协程(处理其他事情),等待应答或者超时后,再恢复协程的运行。

但不足的是目前C++ 20的协程才是一个开始,说实话,目前的协程只提供基本框架,写起来并不舒服。C++目前在IO方面,特别是网络IO方面还不完善。需要一个大量异步IO库,才能用好C++ 20协程。

如果C++ 20的协程周边更加完整,也许C++又能在服务器编程这块能重新面对Go这类语言的威胁。

C++协程的是三个关键字

C++的协程(协程函数)内部可以用co_await , co_yield.两个关键字挂起协程,co_return,关键字进行返回。

co_await

co_await调用一个awaiter对象(可以认为是一个接口),根据其内部定义决定其操作是挂起,还是继续,以及挂起,恢复时的行为。其呈现形式为

cw_ret = co_await  awaiter;

cw_ret 记录调用的返回值,其是awaiter的await_resume 接口返回值。

co_await 相对比较复杂,后面开一章详细讲。

co_yield

挂起协程。其出现形式是

co_yield  cy_ret;

cy_ret会保存在promise承诺对象中(通过yield_value函数)。在协程外部可以通过promise得到。

co_return

协程返回。其出现形式是

co_return cr_ret;

cr_ret会保存在promise承诺对象中(通过return_value函数)。在协程外部可以通过promise得到。要注意,cr_ret并不是协程的返回值。这个是有区别的。

C++协程的重要概念

C++ 的编译器如何识别协程函数呢?是通过函数返回值。C++ 协程函数的返回类型有要求,返回类型是result ,而result里面必须有一个子类型承诺对象(promise),呈现为Result::promise_type。承诺对象(promise)是一个接口,里面实现get_return_object等接口。而通过std::coroutine_handle::from_promise( promise& p )这个静态函数,我们可以得到协程句柄(coroutine handle)。而协程的运行状态 ,协程函数的形参,内部变量,临时变量,挂起暂停在什么点,被保存在协程状态 (coroutine state)中。

好了上面的描述,我们可以看出协程的几个重要概念。

  • 协程状态 (coroutine state),记录协程状态,是分配于堆的内部对象:

承诺对象

形参(协程函数的参数)

协程挂起的点

临时变量

  • 承诺对象(promise),从协程内部操纵。协程通过此对象提交其结果或异常。
  • 协程句柄(coroutine handle),协程的唯一标示。用于恢复协程执行或销毁协程帧。
  • 等待体(awaiter),co_await 关键字调用的对象。

协程状态(coroutine state)

协程状态(coroutine state)是协程启动开始时,new空间存放协程状态,协程状态记录协程函数的参数,协程的运行状态,变量。挂起时的断点。

注意,协程状态 (coroutine state)并不是就是协程函数的返回值RET。虽然我们设计的RET一般里面也有promise和coroutine handle,大家一般也是通过RET去操作协程的恢复,获取返回值。但coroutine state理论上还应该包含协程运行参数,断点等信息。而协程状态 (coroutine state)应该是协程句柄(coroutine handle)对应的一个数据,而由系统管理的。

承诺对象(promise)

承诺对象的表现形式必须是result::promise_type,result为协程函数的返回值。

承诺对象是一个实现若干接口,用于辅助协程,构造协程函数返回值;提交传递co_yield,co_return的返回值。明确协程启动阶段是否立即挂起;以及协程内部发生异常时的处理方式。其接口包括:

  • auto get_return_object() :用于生成协程函数的返回对象。
  • auto initial_suspend():用于明确初始化后,协程函数的执行行为,返回值为等待体(awaiter),用co_wait调用其返回值。返回值为std::suspend_always 表示协程启动后立即挂起(不执行第一行协程函数的代码),返回std::suspend_never 表示协程启动后不立即挂起。(当然既然是返回等待体,你可以自己在这儿选择进行什么等待操作)
  • void return_value(T v):调用co_return v后会调用这个函数,可以保存co_return的结果
  • auto yield_value(T v):调用co_yield后会调用这个函数,可以保存co_yield的结果,其返回其返回值为std::suspend_always表示协程会挂起,如果返回std::suspend_never表示不挂起。
  • auto final_suspend() noexcept:在协程退出是调用的接口,返回std::suspend_never ,自动销毁 coroutine state 对象。若 final_suspend 返回 std::suspend_always 则需要用户自行调用 handle.destroy() 进行销毁。但值得注意的是返回std::suspend_always并不会挂起协程。

前面我们提到在协程创建的时候,会new协程状态(coroutine state)。你可以通过可以在 promise_type 中重载 operator new 和 operator delete,使用自己的内存分配接口。(请参考再探 C++20 协程)

协程句柄(coroutine handle)

协程句柄(coroutine handle)是一个协程的标示,用于操作协程恢复,销毁的句柄。

协程句柄的表现形式是std::coroutine_handle,其模板参数为承诺对象(promise)类型。句柄有几个重要函数:

  • resume()函数可以恢复协程。
  • done()函数可以判断协程是否已经完成。返回false标示协程还没有完成,还在挂起。

协程句柄和承诺对象之间是可以相互转化的。

  • std::coroutine_handle::from_promise : 这是一个静态函数,可以从承诺对象(promise)得到相应句柄。
  • std::coroutine_handle::promise() 函数可以从协程句柄coroutine handle得到对应的承诺对象(promise)

等待体(awaiter)

co_wait 关键字会调用一个等待体对象(awaiter)。这个对象内部也有3个接口。根据接口co_wait  决定进行什么操作。

  • bool await_ready():等待体是否准备好了,返回 false ,表示协程没有准备好,立即调用await_suspend。返回true,表示已经准备好了。
  • auto await_suspend(std::coroutine_handle<> handle)如果要挂起,调用的接口。其中handle参数就是调用等待体的协程,其返回值有3种可能

void 同返回true

bool 返回true 立即挂起,返回false 不挂起。

返回某个协程句柄(coroutine handle),立即恢复对应句柄的运行。

  • auto await_resume() :协程挂起后恢复时,调用的接口。返回值作为co_wait 操作的返回值。

等待体(awaiter)值得用更加详细的笔墨书写一章,我们就放一下,先了解其有2个特化类型。

  • std::suspend_never类,不挂起的的特化等待体类型。
  • std::suspend_always类,挂起的特化等待体类型。

前面不少接口已经用了这2个特化的类,同时也可以明白其实协程内部不少地方其实也在使用co_wait 关键字。

例子,“七进七出”的协程。

好了。所有概念我们介绍基本完成了。先来段代码吧。否则实在憋屈。

这个例子主要展现的是协程函数和主线程之间的切换。协程反复中断,然后在main函数内部又恢复其运行。直至最后co_return。

这个例子虽然简单,但如果你对异步编程有所了解也能明白如何利用C++20完成一段异步编程了。源代码获取地址请点击

下面例子中:

  • coro_ret coroutine_7in7out() 就是协程函数。
  • coro_ret c_r 就是协程的返回值。在后续,都是通过c_r和协程进行交互。
  • coro_ret::promise_type 就是承诺对象
  • std::coroutine_handle 就是句柄。
#include 
#include 
#include 
#include 


//!coro_ret 协程函数的返回值,内部定义promise_type,承诺对象
template 
struct coro_ret
{
   struct promise_type;
   using handle_type = std::coroutine_handle;
   //! 协程句柄
   handle_type coro_handle_;

   coro_ret(handle_type h)
      : coro_handle_(h)
  {
  }
   coro_ret(const coro_ret&) = delete;
   coro_ret(coro_ret&& s)
      : coro_handle_(s.coro_)
  {
       s.coro_handle_ = nullptr;
  }
   ~coro_ret()
  {
       //!自行销毁
       if (coro_handle_)
           coro_handle_.destroy();
  }
   coro_ret& operator=(const coro_ret&) = delete;
   coro_ret& operator=(coro_ret&& s)
  {
       coro_handle_ = s.coro_handle_;
       s.coro_handle_ = nullptr;
       return *this;
  }

   //!恢复协程,返回是否结束
   bool move_next()
  {
       coro_handle_.resume();
       return coro_handle_.done();
  }
   //!通过promise获取数据,返回值
   T get()
  {
       return coro_handle_.promise().return_data_;
  }
   //!promise_type就是承诺对象,承诺对象用于协程内外交流
   struct promise_type
  {
       promise_type() = default;
       ~promise_type() = default;

       //!生成协程返回值
       auto get_return_object()
      {
           return coro_ret{handle_type::from_promise(*this)};
      }

       //! 注意这个函数,返回的就是awaiter
       //! 如果返回std::suspend_never{},就不挂起,
       //! 返回std::suspend_always{} 挂起
       //! 当然你也可以返回其他awaiter
       auto initial_suspend()
      {
           //return std::suspend_never{};
           return std::suspend_always{};
      }
       //!co_return 后这个函数会被调用
       void return_value(T v)
      {
           return_data_ = v;
           return;
      }
       //!
       auto yield_value(T v)
      {
           std::cout << "yield_value invoked." << std::endl;
           return_data_ = v;
           return std::suspend_always{};
      }
       //! 在协程最后退出后调用的接口。
       //! 若 final_suspend 返回 std::suspend_always 则需要用户自行调用
       //! handle.destroy() 进行销毁,但注意final_suspend被调用时协程已经结束
       //! 返回std::suspend_always并不会挂起协程(实测 VSC++ 2022)
       auto final_suspend() noexcept
      {
           std::cout << "final_suspend invoked." << std::endl;
           return std::suspend_always{};
      }
       //
       void unhandled_exception()
      {
           std::exit(1);
      }
       //返回值
       T return_data_;
  };
};


//这就是一个协程函数
coro_ret coroutine_7in7out()
{
   //进入协程看initial_suspend,返回std::suspend_always{};会有一次挂起

   std::cout << "Coroutine co_await std::suspend_never" << std::endl;
   //co_await std::suspend_never{} 不会挂起
   co_await std::suspend_never{};
   std::cout << "Coroutine co_await std::suspend_always" << std::endl;
   co_await std::suspend_always{};

   std::cout << "Coroutine stage 1 ,co_yield" << std::endl;
   co_yield 101;
   std::cout << "Coroutine stage 2 ,co_yield" << std::endl;
   co_yield 202;
   std::cout << "Coroutine stage 3 ,co_yield" << std::endl;
   co_yield 303;
   std::cout << "Coroutine stage end, co_return" << std::endl;
   co_return 808;
}

int main(int argc, char* argv[])
{
   bool done = false;
   std::cout << "Start coroutine_7in7out ()\n";
   //调用协程,得到返回值c_r,后面使用这个返回值来管理协程。
   auto c_r = coroutine_7in7out();
   //第一次停止因为initial_suspend 返回的是suspend_always
   //此时没有进入Stage 1
   std::cout << "Coroutine " << (done ? "is done " : "isn't done ")
       << "ret =" << c_r.get() << std::endl;
   done = c_r.move_next();
   //此时是,co_await std::suspend_always{}
   std::cout << "Coroutine " << (done ? "is done " : "isn't done ")
       << "ret =" << c_r.get() << std::endl;
   done = c_r.move_next();
   //此时打印Stage 1
   std::cout << "Coroutine " << (done ? "is done " : "isn't done ")
       << "ret =" << c_r.get() << std::endl;
   done = c_r.move_next();
   std::cout << "Coroutine " << (done ? "is done " : "isn't done ")
       << "ret =" << c_r.get() << std::endl;
   done = c_r.move_next();
   std::cout << "Coroutine " << (done ? "is done " : "isn't done ")
       << "ret =" << c_r.get() << std::endl;
   done = c_r.move_next();
   std::cout << "Coroutine " << (done ? "is done " : "isn't done ")
       << "ret =" << c_r.get() << std::endl;
   return 0;
}

本章总结

C++ 20 的协程是一个用于异步模型,主要用于服务开发的东东,由于概念和传统的同步变成有区别,同时自身的概念,接口,关键字很多。理解起来有点难度。

  • C++ 20的协程是一个特殊的可以挂起,恢复(重入)的函数。
  • 协程内部可以出现三个关键字。co_await awaiter用于和等待体交互,可以挂起和恢复。co_yield 用于挂起协程,co_return用于返回。
  • 编译器通过返回值(类型result)里面result::promise(承诺对象)来识别什么函数是协程函数。承诺对象(promise)是用于协程和外部代码做交互。
  • 系统在进入协程时,会new构建一个协程状态(coroutine state),协程状态(coroutine state)里面保存协程的参数,运行(暂停)的位置,临时变量,承诺对象等。
  • 每个协程都有一个协程句柄(coroutine handle)标示。协程句柄(coroutine handle)可以和承诺对象直接相互转化。在协程外部,可以用协程句柄恢复(resume)已经挂起的协程。

如果你对协程的各种接口调用顺序有疑惑,可以自己调试一下,比看文字记忆深刻。如果您没有耐心也可以看看第三章的文字。

参考文档

初探 C++20 协程

再探 C++20 协程,这两篇文字都不错。

Coroutines (C++20)

协程(coroutine)简介

The Coroutine in C++ 20 协程之诺

 

你可能感兴趣的:(计算机,程序员,编程,windows)