lambda表达式的本质就是重载了()运算符的类,这种类通常被称为functor,即行为像函数的类。因此lambda表达式对象其实就是一个匿名的functor。
一个标准的lambda表达式包括:捕获列表、参数列表、mutable指示符、尾置返回类型(->返回类型)和函数体:
[capture list] (params list) mutable exception-> return type { function body }
各项具体含义如下
此外,我们还可以省略其中的某些成分来声明“不完整”的lambda表达式,常见的有以下几种:
序号 | 格式 |
---|---|
1 | [capture list] (params list) -> return type {function body} |
2 | [capture list] (params list) {function body} |
3 | [capture list] {function body} |
其中:
在VS2017中构造一个简单的lambda表达式如下:
auto f = [] (int a, int b) -> int
{
return a + b + 42;
};
003A3BC0 6A 03 push 3
003A3BC2 6A 04 push 4
003A3BC4 8D 4D EB lea ecx,[f]
003A3BC7 E8 04 E4 FF FF call ::operator() (03A1FD0h)
cout << f(4, 3) << endl;
可以看到,调用该functor时,call到的是一个lambda对象的operator()位置,该位置反汇编代码如下:
00BA1FD0 55 push ebp
00BA1FD1 8B EC mov ebp,esp
00BA1FD3 81 EC CC 00 00 00 sub esp,0CCh
; 省略一堆东西
00BA1FF0 89 4D F8 mov dword ptr [this],ecx
49: return a + b + 42;
00BA1FF3 8B 45 0C mov eax,dword ptr [b]
00BA1FF6 8B 4D 08 mov ecx,dword ptr [a]
00BA1FF9 8D 44 01 2A lea eax,[ecx+eax+2Ah]
50: };
; 省略一堆东西
00BA2000 8B E5 mov esp,ebp
00BA2002 5D pop ebp
00BA2003 C2 08 00 ret 8
注意:
由于lambda表达式是在某函数内定义的,因此我们可能希望其能使用函数内的局部变量,这时则可以使用所谓捕获列表。总体说来,一共有三种捕获方式:值捕获、引用捕获和外部捕获。
值捕获和参数传递中的值传递类似,被捕获的变量的值在Lambda表达式创建时通过值拷贝的方式传入,因此随后对该变量的修改不会影响影响Lambda表达式中的值。在VS2017中创建如下代码并加以分析:
int testFunc1()
{
int nTest1 = 23;
auto f = [nTest1] (int a, int b) -> int
{
return a + b + 42 + nTest1;
//nTest1 = 333; 不能在lambda表达式中修改捕获变量的值
};
cout << f(4, 3) << "&nTest1=" << nTest1 << endl;
}
需要注意的是,不能在lambda表达式中修改捕获变量的值。其实根据上面的反汇编分析,我们已经知道,lambda表达式中的代码是在一个单独的函数中执行的,这个函数在调用时创建了自己的栈帧,而其使用的nTest1局部变量在testFunc1的栈帧中,虽然通过ebp可以进行栈帧回溯,但显然这是一种不合情理的做法。因此可以断定,捕获列表中出现的局部变量一定会通过某种方式传递给lambda匿名类。到底采用的是哪种方式呢?我们来揭晓答案:
49: auto f = [nTest1] (int a, int b) -> int
50: {
51: return a + b + 42 + nTest1;
52: };
01183C08 8D 45 E8 lea eax,[nTest1]
01183C0B 50 push eax
01183C0C 8D 4D DC lea ecx,[f]
01183C0F E8 0C E3 FF FF call :: (01181F20h)
; 省略无关代码
54: cout << f(4, 3) << "&nTest1=" << nTest1 << endl;
01183C1D 8B 45 E8 mov eax,dword ptr [nTest1]
01183C20 50 push eax
01183C21 68 40 BE 18 01 push offset string "&nTest1=" (0118BE40h)
01183C26 6A 03 push 3
01183C28 6A 04 push 4
01183C2A 8D 4D DC lea ecx,[f]
01183C2D E8 4E F7 FF FF call ::operator() (01183380h)
基本可以断定,nTest是在lambda匿名类构造时传入的。并且传入的是nTest1的引用(由于C++的引用本身就是语法糖,反汇编层面看到的是指针,但是结合源码分析不难得出这里应该是引用)。下面跟踪进其构造函数一探究竟:
01181F20 55 push ebp
01181F21 8B EC mov ebp,esp
01181F23 81 EC CC 00 00 00 sub esp,0CCh
; 省略部分现场保护和堆栈填充int 3的代码
01181F40 89 4D F8 mov dword ptr [this],ecx
; 01181F40 89 4D F8 mov dword ptr [ebp-8],ecx
01181F43 8B 45 F8 mov eax,dword ptr [this]
; 01181F43 8B 45 F8 mov eax,dword ptr [ebp-8]
01181F46 8B 4D 08 mov ecx,dword ptr []
; 01181F46 8B 4D 08 mov ecx,dword ptr [ebp+8]
01181F49 8B 11 mov edx,dword ptr [ecx]
01181F4B 89 10 mov dword ptr [eax],edx
01181F4D 8B 45 F8 mov eax,dword ptr [this]
; 01181F4D 8B 45 F8 mov eax,dword ptr [ebp-8]
; 省略部分现场恢复代码
01181F53 8B E5 mov esp,ebp
01181F55 5D pop ebp
01181F56 C2 04 00 ret 4
由此可以确定,lambda匿名类会将捕获参数中的变量添加到其成员变量中,并设置一个带有该参数引用类型的构造函数。最后再来看看在其operator()函数中是怎样使用捕获变量的:
49: auto f = [nTest1] (int a, int b) -> int
50: {
01183380 55 push ebp
01183381 8B EC mov ebp,esp
01183383 81 EC CC 00 00 00 sub esp,0CCh
; 省略部分现场保护和堆栈填充int 3的代码
011833A0 89 4D F8 mov dword ptr [this],ecx
51: return a + b + 42 + nTest1;
011833A3 8B 45 08 mov eax,dword ptr [a]
011833A6 03 45 0C add eax,dword ptr [b]
011833A9 8B 4D F8 mov ecx,dword ptr [this]
011833AC 8B 11 mov edx,dword ptr [ecx]
011833AE 8D 44 10 2A lea eax,[eax+edx+2Ah]
52: };
; 省略部分现场恢复代码
011833B5 8B E5 mov esp,ebp
011833B7 5D pop ebp
011833B8 C2 08 00 ret 8
真相大白了,值捕获时,C++编译器在构建lambda表达式的匿名类时将局部变量的引用传入,并在构造函数中完成对相应成员变量的赋值。在调用其operator()函数时,如果用到了捕获列表中的局部变量,则从给匿名类对象的成员变量中取出。
使用引用捕获一个外部变量,需在捕获列表变量前面加上一个引用说明符&。如下:
void fnTest()
{
int nTest1 = 23;
auto f = [&nTest1] (int a, int b) -> int
{
cout << "In functor before change nTest=" << nTest1 << endl; //nTest1=23333
nTest1 = 131;
cout << "In functor after change nTest=" << nTest1 << endl; // nTest1 = 131
return a + b + 42 + nTest1;
};
nTest1 = 23333;
cout << f(4, 3) << "&nTest1=" << nTest1 << endl; //nTest1 = 23333
}
这个结果有点诡异,按说传递引用并进行修改以后,结果应该会对外部的局部变量产生影响,但这里并没有。反汇编看看什么情况:
00C23C01 C7 45 E8 17 00 00 00 mov dword ptr [nTest1],17h
48:
49: auto f = [&nTest1] (int a, int b) -> int
50: {
51: cout << "In functor before change nTest=" << nTest1 << endl; //nTest1=23333
52: nTest1 = 131;
53: cout << "In functor after change nTest=" << nTest1 << endl; // nTest1 = 131
54: return a + b + 42 + nTest1;
55: };
00C23C08 8D 45 E8 lea eax,[nTest1]
00C23C0B 50 push eax
00C23C0C 8D 4D DC lea ecx,[f]
00C23C0F E8 0C E3 FF FF call :: (0C21F20h)
56:
57: nTest1 = 23333;
00C23C14 C7 45 E8 25 5B 00 00 mov dword ptr [nTest1],5B25h
58:
59: cout << f(4, 3) << "&nTest1=" << nTest1 << endl; //nTest1 = 23333
00C23C1B 8B F4 mov esi,esp
00C23C1D 68 DC 10 C2 00 push offset std::endl<char,std::char_traits<char> > (0C210DCh)
58:
59: cout << f(4, 3) << "&nTest1=" << nTest1 << endl; //nTest1 = 23333
00C23C22 8B FC mov edi,esp
00C23C24 8B 45 E8 mov eax,dword ptr [nTest1]
00C23C27 50 push eax
00C23C28 68 90 BB C2 00 push offset string "&nTest1=" (0C2BB90h)
00C23C2D 6A 03 push 3
00C23C2F 6A 04 push 4
00C23C31 8D 4D DC lea ecx,[f]
00C23C34 E8 B7 02 00 00 call ::operator() (0C23EF0h)
可以看到,lambda表达式匿名对象在构造函数中依然传入了nTest的地址(引用),下面看看构造函数:
; 省略一大堆现场保护代码
00C21F40 89 4D F8 mov dword ptr [this],ecx
00C21F43 8B 45 F8 mov eax,dword ptr [this]
00C21F46 8B 4D 08 mov ecx,dword ptr []
00C21F49 89 08 mov dword ptr [eax],ecx
00C21F4B 8B 45 F8 mov eax,dword ptr [this]
; 省略一大堆现场恢复代码
哈哈,注意这句 mov dword ptr [eax],ecx ,由于构造函数调用时,传入的是nTest1的地址,这里渠道地址后,直接存到了成员对象中。而在其operator()函数中,取出nTest1值的代码如下:
00C23F1A 8B 45 F8 mov eax,dword ptr [this]
00C23F1D 8B 08 mov ecx,dword ptr [eax]
00C23F1F 8B FC mov edi,esp
00C23F21 8B 11 mov edx,dword ptr [ecx]
可以看到,是通过成员变量中的指针完成的。此外再看看对其赋值的操作:
52: nTest1 = 131;
00C23F55 8B 45 F8 mov eax,dword ptr [this]
00C23F58 8B 08 mov ecx,dword ptr [eax]
00C23F5A C7 01 83 00 00 00 mov dword ptr [ecx],83h
也是用指针完成的。其实这时nTest1的值已经被修改了。但是为什么cout打印出来还是2333呢?这其实是由于cout时从由向左压入参数的结果,再仔细看看:
00C23C24 8B 45 E8 mov eax,dword ptr [nTest1]
00C23C27 50 push eax ; eax=2333
00C23C28 68 90 BB C2 00 push offset string "&nTest1=" (0C2BB90h)
00C23C2D 6A 03 push 3
00C23C2F 6A 04 push 4
注意前两句,已将调用lambda对象前的值压栈了,则传入的值当然是2333。但在cout语句执行后查看nTest1的值,其实已经被修改为131了。
上面的值捕获和引用捕获都需要我们在捕获列表中显示列出Lambda表达式中使用的外部变量。除此之外,我们还可以让编译器根据函数体中的代码来推断需要捕获哪些变量,这种方式称之为隐式捕获。隐式捕获有两种方式,分别是[=]和[&]。[=]表示以值捕获的方式捕获外部变量,[&]表示以引用捕获的方式捕获外部变量。
下面将所有捕获方式总结如下:
捕获形式 | 说明 |
---|---|
[] | 不捕获任何外部变量 |
[变量名, …] | 默认以值得形式捕获指定的多个外部变量(用逗号分隔),如果引用捕获,需要显示声明(使用&说明符) |
[this] | 以值的形式捕获this指针 |
[=] | 以值的形式捕获所有外部变量 |
[&] | 以引用形式捕获所有外部变量 |
[=, &x] | 变量x以引用形式捕获,其余变量以传值形式捕获 |
[&, x] | 变量x以值的形式捕获,其余变量以引用形式捕获 |