C++引入了右值引用和移动语义,可以避免无谓的复制,提高程序性能。
(1)左值和右值
C++中所有的是必然属于左值、右值二者之一。
左值:指的是表达式结束后依然存在的持久化对象。
右值:指的是表达式结束时就不再存在的临时对象。
所有的具名变量或对象都是左值,而右值不具名。
区分左值和右值的便捷方法:看能不能对表达式取地址,如果能,则为左值,否则为右值。
右值又分为将亡值和纯右值。
int i=0;// i是左值, 0是右值
class A {
public:
int a;
};
A getTemp()
{
return A();
}
A a = getTemp(); // a是左值 getTemp()的返回值是右值(临时变量)
(2)左值引用、右值引用
c++98中的引用很常见了,就是给变量取了个别名,在c++11中,因为增加了右值引用(rvalue reference)的概念,所以c++98中的引用都称为了左值引用(lvalue reference)。
int a = 10;
int &reA = a; //refA是a的别名,修改refA就是修改a,a是左值,左移是左值引用
int &b = 1; //编译错误!1是右值,不能够使用左值引用
C++11中的右值引用使用的符号是 &&,如:
int &&a = 1; //实质上就是将不具名(匿名)变量取了个别名
int b = 1;
int &&c = b; //编译错误!不能将一个左值复制给一个右值引用
class A {
public:
int a;
};
A getTemp()
{
return A();
}
A && a = getTemp(); //getTemp()的返回值是右值(临时变量)
getTemp()返回的右值本来在表达式语句结束后,其生命也就该终结了(因为是临时变量),而通过右值引用,该右值又重获新生,其生命期将与右值引用类型变量a的生命期一样,只要a还活着,该右值临时变量将会一直存活下去。实际上就是给那个临时变量取了个名字。
注意:这里a的类型是右值引用类型(int &&),但是如果从左值和右值的角度区分它,它实际上是个左值。因为可以对它取地址,而且它还有名字,是一个已经命名的右值。
所以,左值引用只能绑定左值,右值引用只能绑定右值,如果绑定的不对,编译就会失败。
但是,常量左值引用却是个奇葩,它可以算是一个“万能”的引用类型,它可以绑定非常量左值、常量左值、右值,而且在绑定右值的时候,常量左值引用还可以像右值引用一样将右值的生命期延长,缺点是,只能读不能改。
const int & a = 1; //常量左值引用绑定 右值, 不会报错
class A {
public:
int a;
};
A getTemp()
{
return A();
}
const A &a = getTemp(); //不会报错 而 A& a 会报错
事实上,很多情况下我们用来常量左值引用的这个功能却没有意识到,如下面的例子:
#include
using namespace std;
class Copyable {
public:
Copyable(){}
Copyable(const Copyable &o) {
cout << "Copied" << endl;
}
};
Copyable ReturnRvalue() {
return Copyable(); //返回一个临时对象
}
void AcceptVal(Copyable a) {
}
void AcceptRef(const Copyable& a) {
}
int main()
{
cout << "pass by value: " << endl;
AcceptVal(ReturnRvalue()); // 应该调用两次拷贝构造函数??
cout << "pass by reference: " << endl;
AcceptRef(ReturnRvalue()); //应该只调用一次拷贝构造函数??
}
当我敲完上面的源码运行后,发现结果跟我想象的完全不一样。期望中:
如果是你,上述源码你觉得最后的输出结果是什么?
下图是运行的输出结果,不知与你期望中的是否一样?
实际上,不管哪种方式,一次拷贝构造函数都没有调用!
原因:编译器默认开启了返回值优化(RVO/NRVO, RVO, Return Value Optimization 返回值优化,或者NRVO, Named Return Value Optimization)。编译器很聪明,发现在ReturnRvalue内部生成了一个对象,返回之后还需要生成一个临时对象调用拷贝构造函数,很麻烦,所以直接优化成了1个对象,避免拷贝,而这个临时变量又被赋值给了函数的形参,还是没必要,所以最后这三个变量都用一个变量替代了,不需要调用拷贝构造函数。
总结,其中T是一个具体类型:
1)左值引用, 使用T&,只能绑定左值。
2)右值引用,使用T&&,只能绑定右值。
3)常量左值,使用const T&,既可以绑定左值也可以绑定右值。
4)已命名的右值引用,编译器会认为是左值。
5)编译器有返回值优化,但不要过于依赖。
回顾一下如何使用C++实现一个字符串类MyString,MyString内部管理一个C语言的char*数组,这个时候一般都需要实现拷贝构造函数和拷贝赋值函数,因为默认的拷贝是浅拷贝,而指针这种资源不能共享,不然一个析构,另一个也就完蛋了。
先来看一段代码:
class MyString
{
public:
static size_t CCtor; //统计调用拷贝构造函数的次数
// static size_t CCtor; //统计调用拷贝构造函数的次数
public:
// 构造函数
MyString(const char* cstr = 0)
{
if (cstr)
{
m_data = new char[strlen(cstr) + 1];
strcpy(m_data, cstr);
}
else
{
m_data = new char[1];
*m_data = '\0';
}
}
// 拷贝构造函数
MyString(const MyString& str)
{
CCtor++;
m_data = new char[strlen(str.m_data) + 1];
strcpy(m_data, str.m_data);
}
// 拷贝赋值函数 =号重载
MyString& operator=(const MyString& str)
{
if (this == &str) // 避免自我赋值!!
return *this;
delete[] m_data;
m_data = new char[strlen(str.m_data) + 1];
strcpy(m_data, str.m_data);
return *this;
}
~MyString()
{
delete[] m_data;
}
char* get_c_str() const { return m_data; }
private:
char* m_data;
};
size_t MyString::CCtor = 0;
int main(void)
{
vector<MyString> vecStr;
vecStr.reserve(1000); //先分配好1000个空间,不这么做,调用的次数可能远大于1000
for (int i = 0;i < 1000;i++)
{
vecStr.push_back(MyString("hello"));
}
cout << MyString::CCtor << endl;
return 0;
}
上面的代码看出什么问题了吗?
存在的问题:
在for循环中,执行了1000次拷贝构造函数,如果MyString(“hello”)构造出来的字符串本来就很长,构造一遍就很耗时了,最后却还要拷贝一遍,而MyString(“hello”)只是临时对象,拷贝完就没什么用了,这就造成了没有意义的资源申请和释放,如果能够直接使用临时对象已经申请的资源,既能节省资源,又能节省资源申请和释放的时间。
而C++11新增加的移动语义就能做到这一点。
要实现移动语义就必须增加两个函数:移动构造函数和移动赋值函数。
#include
#include
#include
using namespace std;
class MyString
{
public:
static size_t CCtor; //统计调用拷贝构造函数的次数
static size_t MCtor; //统计调用移动构造函数的次数--新增
static size_t CAsgn; //统计调用拷贝赋值函数的次数
static size_t MAsgn; //统计调用移动赋值函数的次数--新增
public:
// 构造函数
MyString(const char* cstr=0){
if (cstr) {
m_data = new char[strlen(cstr)+1];
strcpy(m_data, cstr);
}
else {
m_data = new char[1];
*m_data = '\0';
}
}
// 拷贝构造函数
MyString(const MyString& str) {
CCtor ++;
m_data = new char[ strlen(str.m_data) + 1 ];
strcpy(m_data, str.m_data);
}
// 移动构造函数--新增
MyString(MyString&& str) noexcept
:m_data(str.m_data) {
MCtor ++;
str.m_data = nullptr; //不再指向之前的资源了
}
// 拷贝赋值函数 =号重载
MyString& operator=(const MyString& str){
CAsgn ++;
if (this == &str) // 避免自我赋值!!
return *this;
delete[] m_data;
m_data = new char[ strlen(str.m_data) + 1 ];
strcpy(m_data, str.m_data);
return *this;
}
// 移动赋值函数 =号重载--新增
MyString& operator=(MyString&& str) noexcept{
MAsgn ++;
if (this == &str) // 避免自我赋值!!
return *this;
delete[] m_data;
m_data = str.m_data;
str.m_data = nullptr; //不再指向之前的资源了
return *this;
}
~MyString() {
delete[] m_data;
}
char* get_c_str() const { return m_data; }
private:
char* m_data;
};
size_t MyString::CCtor = 0;
size_t MyString::MCtor = 0;
size_t MyString::CAsgn = 0;
size_t MyString::MAsgn = 0;
int main()
{
vector<MyString> vecStr;
vecStr.reserve(1000); //先分配好1000个空间
for(int i=0;i<1000;i++){
vecStr.push_back(MyString("hello"));
}
cout << "CCtor = " << MyString::CCtor << endl;
cout << "MCtor = " << MyString::MCtor << endl;
cout << "CAsgn = " << MyString::CAsgn << endl;
cout << "MAsgn = " << MyString::MAsgn << endl;
}
下面这张图可以解释copy和move的区别:
不用奇怪为什么可以抢别人的资源,临时对象的资源不好好利用也是浪费,因为生命周期本来就是很短,在你执行完这个表达式之后,它就毁灭了,充分利用资源,才能高效。
对于一个左值,肯定是调用拷贝构造函数了,但是有些左值是局部变量,生命周期也很短,能不能移动而不是拷贝呢?
**C++11为了解决这个问题,提供了std::move()方法来将左值转换为右值,从而方便应用移动语义。**我觉得它其实是告诉编译器,虽然我是左值,但是不要对我用拷贝构造函数,而是使用移动构造函数吧。
int main()
{
vector<MyString> vecStr;
vecStr.reserve(1000); //先分配好1000个空间
for(int i=0;i<1000;i++){
MyString tmp("hello");
vecStr.push_back(tmp); //调用的是拷贝构造函数
}
cout << "CCtor = " << MyString::CCtor << endl;
cout << "MCtor = " << MyString::MCtor << endl;
cout << "CAsgn = " << MyString::CAsgn << endl;
cout << "MAsgn = " << MyString::MAsgn << endl;
cout << endl;
MyString::CCtor = 0;
MyString::MCtor = 0;
MyString::CAsgn = 0;
MyString::MAsgn = 0;
vector<MyString> vecStr2;
vecStr2.reserve(1000); //先分配好1000个空间
for(int i=0;i<1000;i++){
MyString tmp("hello");
vecStr2.push_back(std::move(tmp)); //调用的是移动构造函数
}
cout << "CCtor = " << MyString::CCtor << endl;
cout << "MCtor = " << MyString::MCtor << endl;
cout << "CAsgn = " << MyString::CAsgn << endl;
cout << "MAsgn = " << MyString::MAsgn << endl;
}
MyString str1("hello"); //调用构造函数
MyString str2("world"); //调用构造函数
MyString str3(str1); //调用拷贝构造函数
MyString str4(std::move(str1)); // 调用移动构造函数、
// cout << str1.get_c_str() << endl; // 此时str1的内部指针已经失效了!不要使用
//注意:虽然str1中的m_dat已经称为了空,但是str1这个对象还活着,知道出了它的作用域才会析构!而不是move完了立刻析构
MyString str5;
str5 = str2; //调用拷贝赋值函数
MyString str6;
str6 = std::move(str2); // str2的内容也失效了,不要再使用
上面例子需要注意以下几点:
当右值引用和模版结合的时候,就复杂了。
T&& 并不一定表示右值引用,也可能是左值引用。
例如:
template<typename T>
void f( T&& param){
}
f(10); //10是右值
int x = 10; //
f(x); //x是左值
如果上面的函数模板表示的是右值引用的话,肯定是不能传递左值的,但事实却是可以。这里的&&是一个未定义的引用类型,称为universal reference,它必须被初始化,它是左值引用还是右值引用取决于它的初始化,如果它被一个左值初始化,它就是一个左值引用,如果被一个右值初始化,它就是一个右值引用。
注意:只有当发生自动类型推断时(如函数模板的类型自动推导,或auto关键字),&&才是一个universal reference。
例如:
template<typename T>
void f( T&& param); //这里T的类型需要推导,所以&&是一个 universal references
template<typename T>
class Test {
Test(Test&& rhs); //Test是一个特定的类型,不需要类型推导,所以&&表示右值引用
};
void f(Test&& param); //右值引用
//复杂一点
template<typename T>
void f(std::vector<T>&& param); //在调用这个函数之前,这个vector中的推断类型
//已经确定了,所以调用f函数的时候没有类型推断了,所以是 右值引用
template<typename T>
void f(const T&& param); //右值引用
// universal references仅仅发生在 T&& 下面,任何一点附加条件都会使之失效
所以最终还是要看T被推导成什么类型,如果T被推导成了string,那么T&& 就是string&&,是个右值引用;如果T被推导为string&,就会发生类似string& &&的情况,对于这种情况,C++11增加了引用折叠的规则,总结如下:
1)所有的右值引用叠加到右值引用上仍然是一个右值引用。
2)所有的其他引用类型之间的叠加都将变成左值引用。
如上面的T& &&其实就被折叠成了个string&,是一个左值引用。
#include
#include
#include
using namespace std;
template<typename T>
void f(T&& param){
if (std::is_same<string, T>::value)
std::cout << "string" << std::endl;
else if (std::is_same<string&, T>::value)
std::cout << "string&" << std::endl;
else if (std::is_same<string&&, T>::value)
std::cout << "string&&" << std::endl;
else if (std::is_same<int, T>::value)
std::cout << "int" << std::endl;
else if (std::is_same<int&, T>::value)
std::cout << "int&" << std::endl;
else if (std::is_same<int&&, T>::value)
std::cout << "int&&" << std::endl;
else
std::cout << "unkown" << std::endl;
}
int main()
{
int x = 1;
f(1); // 参数是右值 T推导成了int, 所以是int&& param, 右值引用
f(x); // 参数是左值 T推导成了int&, 所以是int&&& param, 折叠成 int&,左值引用
int && a = 2;
f(a); //虽然a是右值引用,但它还是一个左值, T推导成了int&
string str = "hello";
f(str); //参数是左值 T推导成了string&
f(string("hello")); //参数是右值, T推导成了string
f(std::move(str));//参数是右值, T推导成了string
}
归纳一下:传递左值进去,进去就是左值引用,传递右值进去,就是右值引用。
所谓转发,就是通过一个函数将参数继续转交给另一个函数进行处理,原参数可能是右值,可能是左值,如果还能继续保持参数的原有特征,那么它就是完美的。
void process(int& i){
cout << "process(int&):" << i << endl;
}
void process(int&& i){
cout << "process(int&&):" << i << endl;
}
void myforward(int&& i){
cout << "myforward(int&&):" << i << endl;
process(i);
}
int main()
{
int a = 0;
process(a); //a被视为左值 process(int&):0
process(1); //1被视为右值 process(int&&):1
process(move(a)); //强制将a由左值改为右值 process(int&&):0
myforward(2); //右值经过forward函数转交给process函数,却称为了一个左值,
//原因是该右值有了名字 所以是 process(int&):2
myforward(move(a)); // 同上,在转发的时候右值变成了左值 process(int&):0
// forward(a) // 错误用法,右值引用不接受左值
}
上面的例子就是不完美转发,而c++中提供了一个std::forward()模板函数解决这个问题。将上面的myforward()函数简单改写一下:
void myforward(int&& i){
cout << "myforward(int&&):" << i << endl;
process(std::forward<int>(i));
}
myforward(2); // process(int&&):2
上面修改过后还是不完美转发,myforward()函数能够将右值转发过去,但是并不能够转发左值,解决办法就是借助universal references通用引用类型和std::forward()模板函数共同实现完美转发。例子如下:
#include
#include
#include
using namespace std;
void RunCode(int &&m) {
cout << "rvalue ref" << endl;
}
void RunCode(int &m) {
cout << "lvalue ref" << endl;
}
void RunCode(const int &&m) {
cout << "const rvalue ref" << endl;
}
void RunCode(const int &m) {
cout << "const lvalue ref" << endl;
}
// 这里利用了universal references,如果写T&,就不支持传入右值,而写T&&,既能支持左值,又能支持右值
template<typename T>
void perfectForward(T && t) {
RunCode(forward<T> (t));
}
template<typename T>
void notPerfectForward(T && t) {
RunCode(t);
}
int main()
{
int a = 0;
int b = 0;
const int c = 0;
const int d = 0;
notPerfectForward(a); // lvalue ref
notPerfectForward(move(b)); // lvalue ref
notPerfectForward(c); // const lvalue ref
notPerfectForward(move(d)); // const lvalue ref
cout << endl;
perfectForward(a); // lvalue ref
perfectForward(move(b)); // rvalue ref
perfectForward(c); // const lvalue ref
perfectForward(move(d)); // const rvalue ref
}
上面的代码测试结果表明,在universal references和std::forward的合作下,能够完美的转发这4种类型。
我们之前使用vector一般都喜欢用push_back(),由上文可知容易发生无谓的拷贝,解决办法是为自己的类增加移动拷贝和赋值函数,但其实还有更简单的办法!就是使用emplace_back()替换push_back(),如下面的例子:
#include
#include
#include
using namespace std;
class A
{
public:
A(int i)
{
// cout << "A()" << endl;
str = to_string(i);
}
~A(){}
A(const A& other): str(other.str)
{
cout << "A&" << endl;
}
public:
string str;
};
int main()
{
vector<A> vec;
vec.reserve(10);
for(int i=0;i<10;i++)
{
vec.push_back(A(i)); //调用了10次拷贝构造函数
// vec.emplace_back(i); //一次拷贝构造函数都没有调用过
}
for(int i=0;i<10;i++)
cout << vec[i].str << endl;
}
可以看到效果是明显的,虽然没有测试时间,但是确实可以减少拷贝。**emplace_back()**可以直接通过构造函数的参数构造对象,但前提是要有对应的构造函数。
对于map和set,可以使用emplace()。基本上emplace_back()对应push_bakc(), emplce()对应insert()。
移动语义对**swap()**函数的影响也很大,之前实现swap可能需要三次内存拷贝,而有了移动语义后,就可以实现高性能的交换函数了。
template <typename T>
void swap(T& a, T& b)
{
T tmp(std::move(a));
a = std::move(b);
b = std::move(tmp);
}
如果T是可移动的,那么整个操作会很高效,如果不可移动,那么就和普通的交换函数是一样的,不会发生什么错误,很安全。