【重学C++】04 | 说透C++右值引用(上)
大家好,我是只讲技术干货的会玩code,今天是【重学C++】的第四讲,在前面《03 | 手撸C++智能指针实战教程》中,我们或多或少接触了右值引用和移动的一些用法。
右值引用是 C++11 标准中一个很重要的特性。第一次接触时,可能会很乱,不清楚它们的目的是什么或者它们解决了什么问题。接下来两节课,我们详细讲讲右值引用及其相关应用。内容很干,注意收藏!
简单来说,左值是指可以使用&
符号获取到内存地址的表达式,一般出现在赋值语句的左边,比如变量、数组元素和指针等。
int i = 42; i = 43; // ok, i是一个左值 int* p = &i; // ok, i是一个左值,可以通过&符号获取内存地址 int& lfoo() { // 返回了一个引用,所以lfoo()返回值是一个左值 int a = 1; return a; }; lfoo() = 42; // ok, lfoo() 是一个左值 int* p1 = &lfoo(); // ok, lfoo()是一个左值
相反,右值是指无法获取到内存地址的表达是,一般出现在赋值语句的右边。常见的有字面值常量、表达式结果、临时对象等。
int rfoo() { // 返回了一个int类型的临时对象,所以rfoo()返回值是一个右值 return 5; }; int j = 0; j = 42; // ok, 42是一个右值 j = rfoo(); // ok, rfoo()是右值 int* p2 = &rfoo(); // error, rfoo()是右值,无法获取内存地址
C++中的引用是一种别名,可以通过一个变量名访问另一个变量的值。
上图中,变量a和变量b指向同一块内存地址,也可以说变量a是变量b的别名。
在C++中,引用分为左值引用和右值引用两种类型。左值引用是指对左值进行引用的引用类型,通常使用&
符号定义;右值引用是指对右值进行引用的引用类型,通常使用&&
符号定义。
class X {...}; // 接收一个左值引用 void foo(X& x); // 接收一个右值引用 void foo(X&& x); X x; foo(x); // 传入参数为左值,调用foo(X&); X bar(); foo(bar()); // 传入参数为右值,调用foo(X&&);
所以,通过重载左值引用和右值引用两种函数版本,满足在传入左值和右值时触发不同的函数分支。
值得注意的是,void foo(const X& x);
同时接受左值和右值传参。
void foo(const X& x); X x; foo(x); // ok, foo(const X& x)能够接收左值传参 X bar(); foo(bar()); // ok, foo(const X& x)能够接收右值传参 // 新增右值引用版本 void foo(X&& x); foo(bar()); // ok, 精准匹配调用foo(X&& x)
到此,我们先简单对右值和右值引用做个小结:
&
符号获取变量内存地址的,称为右值。&&
符号定义。右值引用主要解决一下两个问题:
这一节我们先详细讲讲右值是如何实现移动效果的,以及相关的注意事项。完美转发篇幅有点多,我们留到下节讲。
假设有一个自定义类X
,该类包含一个指针成员变量,该指针指向另一个自定义类对象。假设O
占用了很大内存,创建/复制O
对象需要较大成本。
class O { public: O() { std::cout << "call o constructor" << std::endl; }; O(const O& rhs) { std::cout << "call o copy constructor." << std::endl; } }; class X { public: O* o_p; X() { o_p = new O(); } ~X() { delete o_p; } };
X
对应的拷贝赋值函数如下:
X& X::operator=(X const & rhs) { // 根据rhs.o_p生成的一个新的O对象资源 O* tmp_p = new O(*rhs.o_p); // 回收x当前的o_p; delete this->o_p; // 将tmp_p 赋值给 this.o_p; this->o_p = tmp_p; return *this; }
假设对X
有以下使用场景:
X x1; X x2; x1 = x2;
上述代码输出:
call o constructor call o constructor call o copy constructor
x1
和x2
初始化时,都会执行new O()
, 所以会调用两次O
的构造函数;执行x1=x2
时,会调用一次O
的拷贝构造函数,根据x2.o_p
复制一个新的O
对象。
由于x2
在后续代码中可能还会被使用,所以为了避免影响x2
,在赋值时调用O
的拷贝构造函数复制一个新的O
对象给x1
在这种场景下是没问题的。
但在某些场景下,这种拷贝显得比较多余:
X foo() { return X(); }; X x1; x1 = foo();
代码输出与之前一样:
call o constructor call o constructor call o copy constructor
在这个场景下,foo()
创建的那个临时X
对象在后续代码是不会被用到的。所以我们不需要担心赋值函数中会不会影响到那个临时X
对象,没必要去复制一个新的O
对象给x1
。
更高效的做法,是直接使用swap
交换临时X
对象的o_p
和x1.o_p
。这样做有两个好处:1. 不用调用耗时的O
拷贝构造函数,提高效率;2. 交换后,临时X
对象拥有之前x1.o_p
指向的资源,在析构时能自动回收,避免内存泄漏。
这种避免高昂的复制成本,而直接将资源从一个对象"移动"到另外一个对象的行为,就是C++的移动语义。
哪些场景适用移动操作呢?无法获取内存地址的右值就很合适,我们不需要担心后续的代码会用到该右值。
最后,我们看下移动版本的赋值函数
X& operator=(X&& rhs) noexcept { std::swap(this->o_p, rhs.o_p); return *this; };
看下使用效果:
X x1; x1 = foo();
输出结果:
call o constructor call o constructor
假设我们有以下代码:
class X { public: // 复制版本的赋值函数 X& operator=(const X& rhs); // 移动版本的赋值函数 X& operator=(X&& rhs) noexcept; }; void foo(X&& x) { X x1; x1 = x; }
类X
重载了复制版本和移动版本的赋值函数。现在问题是:x1=x
这个赋值操作调用的是X& operator=(const X& rhs)
还是 X& operator=(X&& rhs)
?
针对这种情况,C++给出了相关的标准:
Things that are declared as rvalue reference can be lvalues or rvalues. The distinguishing criterion is: if it has a name, then it is an lvalue. Otherwise, it is an rvalue.
也就是说,只要一个右值引用有名称,那对应的变量就是一个左值,否则,就是右值。
回到上面的例子,函数foo
的入参虽然是右值引用,但有变量名x
,所以x
是一个左值,所以operator=(const X& rhs)
最终会被调用。
再给一个没有名字的右值引用的例子
X bar(); // 调用X& operator=(X&& rhs),因为bar()返回的X对象没有关联到一个变量名上 X x = bar();
这么设计的原因也挺好理解。再改下foo
函数的逻辑:
void foo(X&& x) { X x1; x1 = x; ... std::cout << *(x.inner_ptr) << std::endl; }
我们并不能保证在foo
函数的后续逻辑中不会访问到x
的资源。所以这种情况下如果调用的是移动版本的赋值函数,x
的内部资源在完成赋值后就乱了,无法保证后续的正常访问。
反过来想,如果我们明确知道在x1=x
后,不会再访问到x
,那有没有办法强制走移动赋值函数呢?
C++提供了std::move
函数,这个函数做的工作很简单: 通过隐藏掉入参的名字,返回对应的右值。
X bar(); X x1 // ok. std::move(x1)返回右值,调用移动赋值函数 X x2 = std::move(x1); // ok. std::move(bar())与 bar()效果相同,返回右值,调用移动赋值函数 X x3 = std::move(bar());
最后,用一个容易犯错的例子结束这一环节
class Base { public: // 拷贝构造函数 Base(const Base& rhs); // 移动构造函数 Base(Base&& rhs) noexcept; }; class Derived : Base { public: Derived(Derived&& rhs) // wrong. rhs是左值,会调用到 Base(const Base& rhs). // 需要修改为Base(std::move(rhs)) : Base(rhs) noexcept { ... } }
依照惯例,还是先给出类X
的定义
class X { public: // 构造函数 X() { std::cout << "call x constructor" <<std::endl; }; // 拷贝构造函数 X(const X& rhs) { std::cout << "call x copy constructor" << std::endl; }; // 移动构造函数 X(X&& rhs) noexcept { std::cout << "call x move constructor" << std::endl }; }
大家先思考下以下两个函数哪个性能比较高?
X foo() { X x; return x; }; X bar() { X x; return std::move(x); }
很多读者可能会觉得foo
需要一次复制行为:从x
复制到返回值;bar
由于使用了std::move
,满足移动条件,所以触发的是移动构造函数:从x
移动到返回值。复制成本 > 移动成本,所以bar
性能更好。
实际效果与上面的推论相反,bar
中使用std::move
反倒多余了。现代C++编译器会有返回值优化。换句话说,编译器将直接在foo
返回值的位置构造x
对象,而不是在本地构造x
然后将其复制出去。很明显,这比在本地构造后移动效率更快。
以下是foo
和bar
的输出:
// foo call x constructor // bar call x constructor call x move constructor
细心的读者可能已经发现了,在前面的几个小节中,移动构造/赋值函数我都在函数签名中加了关键字noexcept
,这是向调用者表明,我们的移动函数不会抛出异常。
这点对于移动函数很重要,因为移动操作会对右值造成破坏
。如果移动函数中发生了异常,可能会对程序造成不可逆的错误。以下面为例
class X { public: int* int_p; O* o_p; X(X&& rhs) { std::swap(int_p, rhs.int_p); ... 其他业务操作 ... std::swap(o_p, rhs.o_p); } }
如果在「其他业务操作」中发生了异常,不仅会影响到本次构造,rhs
内部也已经被破坏
了,后续无法重试构造。所以,除非明确标识noexcept
,C++在很多场景下会慎用
移动构造。
比较经典的场景是std::vector
扩缩容。当vector
由于push_back
、insert
、reserve
、resize
等函数导致内存重分配时,如果元素提供了一个noexcept
的移动构造函数,vector
会调用该移动构造函数将元素移动
到新的内存区域;否则,则会调用拷贝构造函数,将元素复制过去。
今天我们主要学了C++中右值引用的相关概念和应用场景,并花了很大篇幅讲解移动语义及其相关实现。
右值引用主要解决实现移动语义和完美转发的问题。我们下节接着讲解右值是如何实现完美转发。欢迎关注,及时收到推送~