对‘pthread_create’未定义的引用_深入浅出 C++ 11 右值引用

微信限制:不能放置链接样式比较奇怪,发布后不能更新。。。

推荐 阅读原文

对‘pthread_create’未定义的引用_深入浅出 C++ 11 右值引用_第1张图片

旧文翻新,最新版本请阅读原文

1 写在前面

如果你还不知道 C++ 11 引入的右值引用是什么,可以读读这篇文章,看看有什么 启发;如果你已经对右值引用了如指掌,也可以读读这篇文章,看看有什么 补充。欢迎交流~

尽管 C++ 17 标准 在去年底已经正式发布了,但由于 C++ 语言变得 越来越复杂,让许多人对很多新特性 望而却步。

对于 2011 年发布的 C++ 11 标准,很多人虽然对 右值引用/移动语义/拷贝省略/通用引用/完美转发 之类的概念都 有所耳闻,却没有详细了解其 设计初衷/实现原理,甚至对一些细节 有所误解(包括我 )。

我刚开始学习 C++ 的时候,也常常 混淆 这几个 概念。但随着深入了解、与人探讨,才逐步理清楚这几个概念的来龙去脉。先分享几个我曾经犯过的错误。

1.1 误解:返回前,移动局部变量

ES.56: Write std::move() only when you need to explicitly move an object to another scope

std::

上述代码的问题在于:使用 std::move() 移动局部变量 base_url,会导致后续代码不能使用该变量;如果使用,会出现 未定义行为 (undefined behavior)(参考:std::basic_string(basic_string&&))。

如何检查 移动后使用 (use after move)

  • 运行时,在移动构造函数中,将被移动的值设置为无效状态,并在每次使用前检查有效性

  • 编译时,使用 Clang 标记对移动语义进行静态检查(参考:Consumed Annotation Checking | Attributes in Clang)

1.2 误解:被移动的值不能再使用

C.64: A move operation should move and leave its source in a valid state

auto p = 

很多人认为:被移动的值会进入一个 非法状态 (invalid state),对应的内存不能再访问。

其实,C++ 标准要求对象 遵守 § 3 移动语义:被移动的对象进入一个 合法但未指定状态 (valid but unspecified state),调用该对象的方法不会出现异常。要求处于这个状态的对象:

  • (基本要求)能正确析构(不会重复释放已经被移动了的资源,例如 std::unique_ptr::~unique_ptr() 检查指针是否需要 delete)

  • (一般要求)重新赋值后,和新的对象没有差别(C++ 标准库基于这个假设)

  • (更高要求)恢复为默认值(例如 std::unique_ptr 恢复为 nullptr)

另外,基本类型的值(例如 int/double)的移动和拷贝相同。例如,int i = 42; 被移动后,保持为原有值 i == 42

1.3 误解:移动返回值

F.48: Don’t return std::move(local)

std::unique_ptr foo() {

上述代码的问题在于:没必要使用 std::move() 移动返回值。

C++ 会把 即将离开作用域的 返回值 当成 右值(参考 § 2.1),对返回的对象进行 § 3 移动构造(语言标准);如果编译器允许 § 4 拷贝省略,还可以省略这一步的构造,直接把 ret 存放到返回值的内存里(编译器优化)。

Never apply std::move() or std::forward() to local objects if they would otherwise be eligible for the return value optimization. —— Meyer Scott, Effective Modern C++

另外,误用 std::move() 会 阻止 编译器的拷贝省略 优化。不过聪明的 Clang 会提示 -Wpessimizing-move 警告。

1.4 误解:不移动右值引用参数

F.18: For “will-move-from” parameters, pass by X&& and std::move() the parameter

std::unique_ptr bar(std::unique_ptr&& val) {

上述代码的问题在于:没有对返回值使用 std::move()(编译器提示 std::unique_ptr(const std::unique_ptr&) = delete 错误)。

If-it-has-a-name Rule:

  • Named rvalue references are lvalues.

  • Unnamed rvalue references are rvalues.

因为不论 左值引用 还是 右值引用 的变量(或参数)在初始化后,都是左值(参考 § 2.1):

  • 在作用域内,左值 可以 被取地址、被赋值

  • 命名的右值引用变量 (named rvalue reference variable) 是 左值,但变量类型 却是 右值引用

所以,返回右值引用变量时,需要使用 std::move()/std::forward() 显式的 § 5.4 移动转发 或 § 5.3 完美转发,将变量的类型 “还原” 为右值引用。

1.5 误解:手写错误的移动构造函数

C.20: If you can avoid defining default operations, do

C.21: If you define or =delete any default operation, define or =delete them all

C.80: Use =default if you have to be explicit about using the default semantics

C.66: Make move operations noexcept

实际上,多数情况下:

  • 如果 没有定义 构造/析构函数,编译器会 自动生成 移动构造/赋值函数(rule of zero)

  • 如果 需要定义 构造/析构函数,不要忘了 移动构造/赋值函数,否则对象会 不可移动(rule of five)

  • 尽量使用 =default 让编译器生成 移动构造/赋值函数,否则 容易写错

  • 如果 需要自定义 移动构造/赋值函数,尽量定义为 noexcept 不抛出异常(编译器生成的版本会自动添加),否则 不能高效 使用标准库和语言工具

例如,标准库容器 std::vector 在扩容时,会通过 std::vector::reserve() 重新分配空间,并转移已有元素。如果扩容失败,std::vector 满足 强异常保证 (strong exception guarantee),可以回滚到失败前的状态。

为此,std::vector 使用 std::move_if_noexcept() 进行元素的转移操作:

  • 优先 使用 noexcept 移动构造函数(高效;不抛出异常)

  • 其次 使用 拷贝构造函数(低效;如果异常,可以回滚)

  • 再次 使用 非 noexcept 移动构造函数(高效;如果异常,无法回滚)

  • 最后 如果 不可拷贝、不可移动,编译失败

如果 没有定义移动构造函数 或 自定义的移动构造函数没有 noexcept,会导致 std::vector 扩容时执行无用的拷贝,不易发现。

2 基础知识

之所以会出现上边的误解,往往是因为 C++ 语言的复杂性 和 使用者对基础知识的掌握程度 不匹配。

2.1 值类别 vs 变量类型

划重点 —— 值 (value) 和 变量 (variable) 是两个独立的概念:

  • 值 只有 类别 (category) 的划分,变量 只有 类型 (type) 的划分

  • 值 不一定拥有 身份 (identity),也不一定拥有 变量名(例如 表达式中间结果 i + j + k)

值类别 (value category) 可以分为两种:

  • 左值 (lvalue, left value) 是 能被取地址、不能被移动 的值

  • 右值 (rvalue, right value) 是 表达式中间结果/函数返回值(可能拥有变量名,也可能没有)

C++ 17 细化了 prvalue/xvalue/lvalue 和 rvalue/glvalue 类别,本文不详细讨论。

引用类型 (reference type) 属于一种 变量类型 (variable type),将在 § 2.2 详细讨论。

在变量 初始化 (initialization) 时,需要将 初始值 (initial value) 绑定到变量上;但 引用类型变量 的初始化 和其他变量不同:

  • 创建时,必须显式初始化(和指针不同,不允许 空引用 (null reference);但可能存在 悬垂引用 (dangling reference))

  • 相当于是 其引用的值 的一个 别名 (alias)(例如,对引用变量的 赋值运算 (assignment operation) 会赋值到 其引用的值 上)

  • 一旦绑定了初始值,就 不能重新绑定 到其他值上了(和指针不同,赋值运算不能修改引用的指向;而对于 Java/JavaScript 等语言,对引用变量赋值 可以重新绑定)

2.2 左值引用 vs 右值引用 vs 常引用

引用类型 可以分为两种:

  • 左值引用 (l-ref, lvalue reference) 用 & 符号引用 左值(但不能引用右值)

  • 右值引用 (r-ref, rvalue reference) 用 && 符号引用 右值(也可以移动左值)

void f(Data&  data);  
  • 左值引用 变量 data1 在初始化时,不能绑定右值 Data{}

  • 右值引用 变量 data2 在初始化时,不能绑定左值 data

    • 但可以通过 std::move() 将左值 转为右值引用(参考 § 5.4)

  • 右值引用 变量 data2 被初始化后,在作用域内是 左值(参考 § 1.4),所以匹配 f() 的 重载 2

另外,C++ 还支持了 常引用 (c-ref, const reference),同时接受 左值/右值 进行初始化:

void g(const Data& data);  

常引用和右值引用 都能接受右值的绑定,有什么区别呢?

  • 通过 右值引用/常引用 初始化的右值,都可以将 生命周期扩展 (lifetime extension) 到 绑定该右值的 引用的生命周期

  • 初始化时 绑定了右值后,右值引用 可以修改 引用的右值,而 常引用 不能修改

  • 如果函数同时接受 右值引用/常引用 参数,编译器 优先重载 右值引用参数

const Data& data1 = Data{};   

2.3 引用折叠

引用折叠 (reference collapsing) 是 std::move()/std::forward() 的实现基础:

using Lref = Data&;

3 移动语义

在 C++ 11 强化左右值概念后,我们可以针对右值进行优化。于是,C++ 11 中就提出了 移动语义 (move semantic)

  • 由于右值对象一般是临时对象,在移动时,对象包含的资源 不需要先复制再删除,只需要直接 从旧对象移动到新对象

  • 要求被移动的对象,能正确析构(参考 § 1.2)

由于基本类型不包含资源,其移动和拷贝相同:被移动后,保持为原有值。

3.1 避免先复制再释放资源

针对包含了资源的对象,我们可以通过移动对象的资源进行优化。例如,常用的 STL 类模板都有:

  • 以常引用作为参数的 拷贝构造函数 (copy constructor)

  • 以右值引用作为参数的 移动构造函数 (move constructor)

template<

上述代码中,构造函数 vector::vector() 根据参数的左右值类型判断:

  • 参数为左值时,拷贝构造,使用 new[]/std::copy_n 拷贝原对象的内存(本方案有一次冗余的默认构造,可优化)

  • 参数为右值时,移动构造,把指向原对象内存的指针 data_、内存大小 size_ 复制到新对象,并把原对象这两个成员置 0

析构函数 vector::~vector() 检查 data_ 是否有效,决定是否需要释放资源。

除了能判断参数是否为左右值,成员函数还可以判断当前对象的左右值类型:给成员函数加上 引用限定符 (reference qualifier),针对对象本身的左右值类型进行优化。

class Foo {

3.2 转移不可复制的资源

在之前写的 资源管理小记 提到:如果资源是不可复制的,那么装载资源的对象也应该是不可复制的。

如果资源对象不可复制,那么只能通过移动,创建新对象。例如,智能指针 std::unique_ptr 只允许移动构造,不允许拷贝构造。

template<

上述代码中,unique_ptr 的移动构造过程和 vector 类似:

  • 把指向原对象内存的指针 data_ 复制到新对象

  • 把原对象的指针 data_ 置为空

3.3 反例:不遵守移动语义

移动语义只是语言上的一个 概念,具体是否移动对象的资源、如何移动对象的资源,都需要通过编写代码 实现。而移动语义常常被 误认为,编译器 自动生成 移动对象本身的代码(§ 4 拷贝省略)。

为了证明这一点,我们可以实现不遵守移动语义的 bad_vec::bad_vec(bad_vec&& rhs),执行拷贝语义:

new T[rhs.size_]) {

那么,一个 bad_vec 对象在被 move 移动后仍然可用:

int> v_old { 

虽然代码可以那么写,但是在语义上有问题:进行了拷贝操作,违背了移动语义的初衷。

4 拷贝省略

尽管 C++ 引入了移动语义,移动的过程 仍有优化的空间 —— 与其调用一次 没有意义的移动构造函数,不如让编译器 直接跳过这个过程 —— 于是就有了 拷贝省略 (copy elision)

然而,很多人会把移动语义和拷贝省略 混淆:

  • 移动语义是 语言标准 提出的概念,通过编写遵守移动语义的 移动构造函数、右值限定成员函数,逻辑上 优化 对象内资源 的转移流程

  • 拷贝省略是(C++ 17 前)非标准的 编译器优化,跳过移动/拷贝构造函数,让编译器直接在 移动后的对象 内存上,构造 被移动的对象(例如 § 1.3 的代码,直接在 函数返回值对象 的内存上,构造 函数局部对象 ret —— 在 不同作用域 里,共享 同一块内存)

C++ 17 要求编译器对 纯右值 (prvalue, pure rvalue) 进行拷贝省略优化。(参考)

Data f() {

初始化 局部变量、函数参数时,传入的纯右值可以确保被优化 —— Return Value Optimization (RVO);而返回的 将亡值 (xvalue, eXpiring value) 不保证被优化 —— Named Return Value Optimization (NRVO)

5 通用引用和完美转发

揭示 std::move()/std::forward() 的原理,需要读者有一定的 模板编程基础。

5.1 为什么需要通用引用

C++ 11 引入了变长模板的概念,允许向模板参数里传入不同类型的不定长引用参数。由于每个类型可能是左值引用或右值引用,针对所有可能的左右值引用组合,特化所有模板 是 不现实的。

假设没有 通用引用的概念,模板 std::make_unique<> 至少需要两个重载:

templateunique_ptrmake_unique(const Args&... args) {
  • 对于传入的左值引用 const Args&... args,只要展开 args... 就可以转发这一组左值引用

  • 对于传入的右值引用 Args&&... args,需要通过 std::move() 转发出去,即 std::move(args)...(为什么要转发:参考 § 1.4)

上述代码的问题在于:如果传入的 args 既有 左值引用 又有 右值引用,那么这两个模板都 无法匹配。

5.2 通用引用

Item 24: Distinguish universal references from rvalue references. —— Meyer Scott, Effective Modern C++

Meyer Scott 指出:有时候符号 && 并不一定代表右值引用,它也可能是左值引用 —— 如果一个引用符号需要通过 左右值类型推导(模板参数类型 或 auto 推导),那么这个符号可能是左值引用或右值引用 —— 这叫做 通用引用 (universal reference)

// rvalue ref: no type deduction

上述代码中,前三个 && 符号不涉及引用符号的左右值类型推导,都是右值引用;而后两个 && 符号会 根据初始值推导左右值类型:

  • 对于 var2

    • 因为 var1 是左值,所以 var2 也是左值引用

    • 推导不会参考 var1 的变量类型

  • 对于 T&&

    • 如果 param 传入左值,T&& 是左值引用 std::remove_reference_t&

    • 如果 param 传入右值,T&& 是右值引用 std::remove_reference_t&&

基于通用引用,§ 5.1 的模板 std::make_unique<> 只需要一个重载:

templateunique_ptrmake_unique(Args&&... args) {

其中,std::forward() 实现了 针对不同左右值类型的转发 —— 完美转发。

5.3 完美转发

什么是 完美转发 (perfect forwarding)

  • 如果参数是 左值引用,直接以 左值引用 的形式,转发给下一个函数

  • 如果参数是 右值引用,要先 “还原” 为 右值引用 的形式,再转发给下一个函数

因此,std::forward() 定义两个 不涉及 左右值类型 推导 的模板(不能使用 通用引用参数):

template <
实参/返回值 类型 左值引用返回值 右值引用返回值
(重载 1)左值引用实参 完美转发 移动转发
(重载 2)右值引用实参 语义错误 完美转发
  • 尽管初始化后的变量都是 左值(参考 § 1.4),但原始的 变量类型 仍会保留

  • 因此,可以根据 实参类型 选择重载,和 T 的类型无关

  • 返回值 static_cast(val) 通过 § 2.3 引用折叠 实现 完美转发 或 移动转发,和实参类型无关

5.4 移动转发

类似的,std::move() 只转发为右值引用类型:

template <
实参/返回值 类型 右值引用返回值
左值引用实参 移动转发
右值引用实参 移动转发/完美转发
  • 接受 通用引用参数 T&& val(无需两个模板,使用时无需指出 T 的类型)

  • 返回值 static_cast<:remove_reference_t>&&>(val) 直接转为右值引用类型

  • 所以 std::move() 等价于 std::forward<:remove_reference_t>&&>()

写在最后

虽然这些东西你不知道,也不会伤害你;但如果你知道了,就可以合理利用,从而提升开发效率,避免不必要的问题。

感谢 @flythief 的修改建议,感谢 @泛化之美 对 § 1.5 的补充~

如果有什么问题,欢迎交流

Delivered under MIT License © 2020, BOT Man


左下角 阅读原文

右上角 关注公众号 ❤ / 分享文章

右下角 留言评论~ / 觉得好看 

你可能感兴趣的:(返回引用一个对象)