这门课主要偏重于泛型编程(generic programming)以及底层对象模型(this,vptr,vtbl,多态(polymorphism)等)。
首先提到的类成员函数是转换函数(conversion function)和隐式单参数构造函数(non-explicit one argument constructor).如讲义中提到的下面例子:
#include
using namespace std;
class Fraction
{
public:
Fraction(int num, int den = 1)
: m_numerator(num), m_denominator(den) {
if(m_denominator != 0)
{
int gcd_val = gcd(m_numerator, m_denominator);
if(gcd_val != 1)
{
m_numerator = m_numerator / gcd_val;
m_denominator = m_denominator / gcd_val;
}
}
}
#if 1
operator double() const {
return (double)(m_numerator/m_denominator);
}
#endif
static int gcd(int a, int b)
{
if(b == 0)
return a;
else
return gcd(b, a%b);
}
Fraction operator+(const Fraction& f) {
return Fraction(m_numerator * f.m_denominator + m_denominator * f.m_numerator, m_denominator * f.m_denominator);
}
friend ostream& operator<<(ostream& os, const Fraction& f);
private
int m_numerator; //分子
int m_denominator; //分母
};
ostream& operator<<(ostream& os, const Fraction& f)
{
os << f.m_numerator << '/' << f.m_denominator;
return os;
}
int main(void)
{
Fraction f1(3,5);
Fraction f2 = f1 + 4;
cout << f1 << " " << f2 << endl;
return 0;
}
这个类中double()是conversion function,此处构造函数是隐式单参数构造函数。
这种情况下,有可能将将f转换成double,然后将得到double与4相加,得到结果转换成Fraction.也可能对4使用构造函数转换成Fraction,然后将f和构造生成的Fraction对象相加,将最终结果赋给f2.这时候会产生二义性。编译时有下面的错误信息:
error: use of overloaded operator '+' is ambiguous (with operand types 'Fraction' and 'int')
如果将double()函数的定义注释掉就可以正常编译执行,并能得到下面输出信息:
3/5 23/5
另一个有趣的类是智能指针(shared_ptr、unique_ptr等),智能指针是像指针的类,其定义如下:
template
{
public:
T& operator*() const { return *px; }
T* operator->() const { return px; }
shared_ptr(T* p) : px(p) {}
private:
T *px;
....
}
struct Foo
{
...
void method(void) {...}
};
shared_ptr
Foo f(*sp);
sp->method();
对于这里的sp对象调用*或者->,实际作用的是该对象内的指针成员变量px.
另外sp->method()中sp->对应于px,那么貌似px后直接跟随method(),感觉会有奇怪。而事实上sp后会一直带有隐式的->,所以仍可以调用px->method函数。
还有一个比较有趣的是迭代器对象,例如__list_iterator对象如下:
template
struct __list__iterator {
typedef __list_iterator
typedef Ptr pointer;
typedef Ref reference;
typedef __list__node
link_type node;
reference operator*() const { return (*node).data; }
pointer operator->() const { return &(operator*()); }
self & operator++ () { node = (link_type)((*node).next); return *this; } //后置++操作符
self operator++(int) { self tmp = *this; ++*this; return tmp; } //前置++操作符
};
template
struct __list__node{
void *prev;
void *next;
T data;
};
list
*ite;
ite->method();
//相当于调用(&(*node).data)->method();
//相当于调用(*node).data.method()
另外有意思的一种类是类似于函数的类(function-like class),一个简单的小例子,代码如下:
#includeusing namespace std;
class A
{
public:
A(int m=0,int n=0):x(m), y(n) {}
int operator()()
{
return x + y;
}
int operator()(int z)
{
return x + y + z;
}
int operator() (int z, int r)
{
return x + y + z + r;
}
private:
int x;
int y;
};
int main(void)
{
A a(3,4);
cout << a() << endl;
cout << a(2) << endl;
cout << a(2,3) << endl;
return 0;
}
在使用时可以创建对象,然后像使用函数一样给这个对象传递参数,就会调用重载()的函数。
这节课中提到模板类重载()操作符的情况,课堂中提到下面例子:
template
struct identity {
const T& operator()(const T& x) const { return x; }
};
template
{
struct plus T operator() (const T&x, const T& y) const { return x + y; }
};
这两个模板类在重载()操作符时会隐含的用到下面这两个特殊的基类:
template
typedef Arg_argument_type;
typedef Result result_type;
};
template
typedef Arg1 first_argument_type;
typedef Arg2 second_argument_type;
typedef Result result_type;
};
这两个基类参数分别为1个或者2个。
我查看了STL网页上关于Functors 的介绍,这里面提到,所有的函数、函数指针以及重载()操作符的类都可以被称为functor(或者function object)。而在STL算法中functor只需要零个、一个或者两个参数,分别用generator、unary_function、binary_function,这三个functor对应于函数f(), f(x)和f(x,y).
另外,有趣的是,c++11中认为unary_function和binary_function已经过时了,不建议使用,貌似c++标准委员会建议c++17将它们删除,stackoverflow上面有讨论的页面 ,不过我没看懂。
课堂中还讲到namespace,写个测试小函数:
#includeusing namespace std;
namespace yy1
{
int sum(const int& x,const int& y)
{
return x + y;
}
}
int main(void)
{
cout << yy1::sum(4,5) << endl;
return 0;
}
还讲到了类模板和函数模板。
类模板定义如下:
template
class Point
{
public:
Point(T m = 0, T n = 0):x(m), y(n) {}
T DistanceFromOrigin() {return sqrt(x * x + y * y); }
private:
int x;
int y;
};
使用方式如下:
Point
而函数模板定义如下:
template
{
return b < a ? b : a;
}
在使用min函数时,会对T的类型进行推导。
另外还有类成员函数模板,其用法跟函数模板类似。
对于模板,还可以用template specialization,讲义中提到下面的例子:
template
struct hash {};
template<> struct hash
size_t operator()(char x) const { return x; }
};
template<> struct hash
size_t operator()(int x) const { return x; }
};
还有部分特例化(partial specialization),讲义中例子如下;
template
{
...
};
template
{ ... }
还有比较有趣的模板模板参数(template template parameter), 看下面例子:
template
class XCls
{
private:
SmartPtr
public:
XCls:sp(new T) {}
};
使用上面定义的例子如下:
XCls
可以编写在程序中输出__cplusplus的值来判断当前使用的c++标准。
我当前使用的是clang 3.4,如果使用默认编译选项,那么输出结果是199711 对应c++0x
如果添加-std=c++11,那么输出结果是201103 对应c++11
如果添加-std=c++1y,那么输出结果是201305.
c++11中支持auto,可以自动推断变量类型,并且c++11支持范围操作,看下面例子:
vector v = {1,2,3,4,5};
for(auto item: v)
cout << item << endl;
另外,c++中,如果输出对象和reference的大小和地址,其值是相等的。
但实际上reference应该是用指针来实现的。reference通常不直接定义,主要用于参数和返回类型。
类之间的关系有继承(inheritance)和复合(composition)以及二者的结合。
而其构造函数是从内到外执行,析构函数是从外到内执行。
本节有一个有趣的习题,就是对象内存布局,看下面例子:
#include
using namespace std;
class Base
{
int x;
char y;
public:
void f1() const{
cout << "f1" << endl;
}
virtual void g1() const {}
};
class Derived:public Base
{
char z;
public:
void s1() const{
cout << "s1" << endl;
}
virtual void g1() const{}
};
int main(void)
{
Base b1,b2;
b1.f1();
Derived d1,d2;
d1.s1();
return 0;
}
对上面程序(名称为object_model.cpp)进行编译,:
clang++ object_model.cpp -g -o object_model
nm 命令查看object_model,然后能找到其中几个函数地址:
08048880 W _ZNK4Base2f1Ev
08048950 W _ZNK4Base2g1Ev
08048940 W _ZNK7Derived2g1Ev
08048900 W _ZNK7Derived2s1Ev
使用c++filt 对demange这几个函数名称,得到下面信息:
mangled name demangled name
_ZNK4Base2f1Ev Base::f1() const
_ZNK4Base2g1Ev Base::g1() const
_ZNK7Derived2g1Ev Derived::g1() const
_ZNK7Derived2s1Ev Derived::s1() const
使用gdb调试object_model,然后在main函数末尾处打断点:
(gdb) p &b1
$1 = (Base *) 0xffffced8
(gdb) p &(b1.x)
$2 = (int *) 0xffffcedc
(gdb) p &(b1.y)
$3 = 0xffffcee0 "p\211\004\b"
(gdb) p b1.f1
$4 = {void (const Base * const)} 0x8048880
(gdb) p b1.g1
$5 = {void (const Base * const)} 0x8048950
(gdb) info vtbl b1
vtable for 'Base' @ 0x8048a64 (subobject @ 0xffffced8):
[0]: 0x8048950
类似地,对b2也执行类似的操作,结果如下:
(gdb) p &b2
$6 = (Base *) 0xffffcec8
(gdb) p &(b2.x)
$7 = (int *) 0xffffcecc
(gdb) p &(b2.y)$8 = 0xffffced0 "p\211\004\b\200\206\004\bd\212\004\b\364\277\200Ap\211\004\b"
(gdb) p b2.f1
$9 = {void (const Base * const)} 0x8048880
(gdb) p b2.g1
$10 = {void (const Base * const)} 0x8048950
(gdb) info vtbl b2
vtable for 'Base' @ 0x8048a64 (subobject @ 0xffffcec8):
[0]: 0x8048950
再分别打印b1和b2这两个变量:
(gdb) p b1
$12 = {_vptr$Base = 0x8048a64, x = 1098956788, y = 112 'p'}
(gdb) p b2
$13 = {_vptr$Base = 0x8048a64, x = 1098956788, y = 112 'p'}
(gdb) p sizeof(b1)
$14 = 12
(gdb) p sizeof(b2)
$15 = 12
可以画出b1内存布局如下:
_______________ ---------------------------(vtbl)
| vptr(0x8048a64) | --------> | 0x8048950 () |
________________ __________________
| x (4 byte) |
__________________
| y (1 byte) |
___________________
| padding(3 bytes) |
___________________
b2的vptr和vtbl中保存的值跟b1完全相等。但是x和y的地址完全不同。
使用gdb打印d1和d2相关信息:
(gdb) p &d1
$16 = (Derived *) 0xffffceb8
(gdb) p &(d1.x)
$17 = (int *) 0xffffcebc
(gdb) p &(d1.y)
$18 = 0xffffcec0 "\001"
(gdb) p d1.f1
$19 = {void (const Base * const)} 0x8048880
(gdb) p d1.s1
$20 = {void (const Derived * const)} 0x8048900
(gdb) p d1.g1
$21 = {void (const Derived * const)} 0x8048940
(gdb) info vtbl d1
vtable for 'Derived' @ 0x8048a30 (subobject @ 0xffffceb8):
[0]: 0x8048940
(gdb) p &d2
$22 = (Derived *) 0xffffcea8
(gdb) p &(d2.x)
$23 = (int *) 0xffffceac
(gdb) p &(d2.y)
$24 = 0xffffceb0 "\b\206\377\367`\235\004\b0\212\004\b\273\211\004\b\001"
(gdb) p d2.f1
$25 = {void (const Base * const)} 0x8048880
(gdb) p d2.s1
$26 = {void (const Derived * const)} 0x8048900
(gdb) p d2.g1
$27 = {void (const Derived * const)} 0x8048940
(gdb) info vtbl d2
vtable for 'Derived' @ 0x8048a30 (subobject @ 0xffffcea8):
[0]: 0x8048940
d1内存布局如下(12 bytes):
_______________ ---------------------------(vtbl)
| vptr(0x8048a30) | --------> | 0x8048940 (Derived::g1()) |
________________ __________________
| x (4 bytes) |
__________________
| y (1 bytes) |
___________________
| z (1 byte) |
____________________
| padding(2 bytes) |
___________________
d2中vptr和vtbl的值也是完全相等的,但x、y和z的地址不相等。
可以使用clang打印出对象的布局信息,使用下面命令(可能需要先将std以及cout注释掉):
clang -cc1 -fdump-record-layouts object_model.cpp
生成一个object_model.cpp.002t.class文件,里面有类似下面的信息(要先用c++filt对符号进行转换得到下面信息):
Vtable for Base
Base::vtable for Base: 3u entries
0 (int (*)(...))0
4 (int (*)(...))(& typeinfo for Base)
8 Base::g1
Class Base
size=12 align=4
base size=9 base align=4
Base (0x7f23ee353a80) 0
vptr=((& Base::vtable for Base) + 8u)
Vtable for Derived
Derived::vtable for Derived: 3u entries
0 (int (*)(...))0
4 (int (*)(...))(& typeinfo for Derived)
8 Derived::g1
Class Derived
size=12 align=4
base size=10 base align=4
Derived (0x7f23ee353e70) 0
vptr=((& Derived::vtable for Derived) + 8u)
Base (0x7f23ee353ee0) 0
primary-for Derived (0x7f23ee353e70)
按照这个生成信息可以知道,clang 3.4采用4字节对齐,并且虚函数表中有三项:
第一项是0
第二项是其type info
第三项才是其中的虚函数
g++中也有类似命令:
g++ -fdump-class-hierarchy object_model.cpp
在review其它同学的笔记时,有提到new/delete和malloc/free的区别。new/delete在自由存储区,而malloc/free是在堆上,new/delete是类型安全的,而malloc/free不是类型安全。在c++中只应当使用new/delete,尽量不要使用malloc/free.虽然二者有free storage和堆的差别,但实际上跟编译器实现有关,可能这两个区域位于相同的区域,也可能位于不同的区域。关于二者的比较可以参看下面的文章:
http://www.cnblogs.com/jiayouwyhit/archive/2013/08/06/3242124.html
http://stackoverflow.com/questions/240212/what-is-the-difference-between-new-delete-and-malloc-free