原文
正如在一篇专门的帖子中看到的,C++标准模板库(STL)是一个神奇的工具,它使代码更加正确和富有表现力。主要分为两部分:
- 容器,例如std::vector或者std::map等。
- 算法,大多数用来操作容器的众多通用函数。它们大多在
头文件中找到。
对于很多使用for循环遍历容器的手工操作都可以用调用STL的算法来代替。这样做的效果是使代码更清晰,因为代码的阅读者不必在脑海中分析复杂的for循环,只要将循环语句用std::copy,std::partition或者std::rotate等显式名称代替,就可以立即理解所发生的事情。
然而,STL有几个方面可以改进。在本帖中,我们将重点讨论其中的两个问题:
-
所有算法操作指向它们所操作的容器的迭代器。虽然在一些特殊的情况下,如在容器的某一精确点停止,这样做很方便,但通常的情况是遍历整个容器,从它的.begin ()到它的.end ()。使用STL的代码部分最终会充满迭代器:
std::copy(v1.begin(), v1.end(), std::back_inserter(v2)); std::set_difference(v2.begin(), v2.end(), v3.begin(), v3.end(), std::back_inserter(v4)); std::transform(v3.begin(), v3.end(), std::back_inserter(v4));
(注:上面使用的std::back_inserter是一个输出迭代器,它每次被分配给容器时,都使用容器的push_back方法。这减轻了程序员对输出大小的估量)
-
算法不好组合使用。我发现使用STL的C++开发人员经常遇到的一个需求是,只在容器中满足谓词的元素上应用函数。对容器输入的所有元素应用函数f并将结果放入vector中输出是通过std::transform:
std::transform(input.begin(), input.end(), std::back_inserter(output), f);
根据谓词p过滤元素是使用std::copy_if:
std::copy_if(input.begin(), input.end(), std::back_inserter(output), p);
但是,要合并这两个调用并不容易,也没有“transform_if”算法这样的东西。
ranges以一种非常优雅的方式来解决STL的这两个问题。ranges最初是在Boost中引入的,现在正在走向标准化。我相信它们将对我们处理代码中容器的方式产生重大影响。
Range的概念
Range的概念是重中之重。从本质上讲,Range是可以遍历的东西。更确切地说,Range是一个包含begin()和end()方法的东西,它返回对象(迭代器)来允许你遍历Range(即沿着Range的元素移动,并以解引用的方式访问这些元素)。
用伪代码表示的Range符合以下接口:
Range
{
begin()
end()
}
请注意,这意味着所有STL容器本身都是Range。
在定义Range概念之前,使用STL的代码已经以某种方式使用了Range,但是使用起来很笨拙。正如本文开头所看到的,它们直接由两个迭代器操作,典型的一个begin,一个end。但是对于Range,通常看不到迭代器。他们在这里,但被Range的概念所抽象化。
理解这一点很重要。迭代器是允许你对容器进行迭代的技术性数据结构,但它们通常对于函数代码来说太技术性了。在大多数情况下,你真正想表示的是一个范围,它更符合代码的抽象级别。就像现金流的范围,屏幕上的行的范围,或者从数据库中出来的条目的范围。
因此,从range的角度进行编码是一个巨大的改进,因为从这个意义上说迭代器违反了尊重抽象层次的原则,我认为这是设计好代码最重要的原则。
在range库中,STL算法被重新定义,以直接将range作为参数,而不是两个迭代器,例如:
ranges::transform(input, std::back_inserter(output), f);
而不是:
std::transform(input.begin(), input.end(), std::back_inserter(output), f);
此类算法在实现中重用STL版本,方法是将range的begin和end转发给原始STL版本。
智能迭代器
尽管用range做了抽象了,但是range遍历还是用迭代器实现的。range的全部能力来自它与智能迭代器的组合。一般来说,容器的迭代器有两个职责:
- 沿着容器的元素移动(++、--等)
- 访问容器元素(*, ->)
例如,一个vector迭代器可以完成这个任务。但是源于boost的“智能”迭代器定制了其中一种或两种行为。例如:
- transform_iterator由另一个迭代器it和一个函数(或函数对象)f构造,并自定义它访问元素的方式:当解引用时,transform_iterator将f应用到*it并返回结果。
- filter_iterator由另一个迭代器it和一个谓词p构造。它定制它的移动方式:当向前移动一个( ++ ) filter_iterator时,它向前移动它的基础迭代器,直到它到达满足谓词或容器结尾的元素。
结合range和智能迭代器:range适配器
range的全部能力来自它们与智能迭代器的关联。这是用range适配器完成的。
range适配器是一种对象,它可以与range组合以产生新的range。它们的一个子部分是视图适配器:对于它们,初始的被适配的range保持不变,而生成的range不包含元素,因为它与初始range相比更像是视图,但具有定制的迭代行为。
为了说明这一点,我们以view::transformadaptor为例。这个适配器用一个函数初始化,并且可以与一个range组合以产生一个视图,这个视图具有一个transform_iterator在这个范围内的迭代行为。range适配器可以与range结合使用,使用运算符|,这为它们提供了优雅的语法。
使用如下的数字容器:
std::vector numbers = { 1, 2, 3, 4, 5 };
range:
auto range = numbers | view::transform(multiplyBy2);
是具有transform_iterator的迭代行为的数字容器的视图,其函数为multiplyBy2。所以当你遍历这个视图时,你得到的结果就是这些数字乘以2。例如:
ranges::accumulate(numbers | view::transform(multiplyBy2), 0);
返回12 + 22 + 32 + 42 + 5*2 = 30 (类似 std::accumulate).
还有许多其他range适配器。例如,view::filter接受一个谓词,并且可以与range组合以通过filter_iterator的行为在谓词上构建视图:
ranges::accumulate(numbers | view::filter(isEven), 0);
返回 22 + 42 = 12。这为最初不能将算法组合在一起的问题提供了一个解决方案。
结论
Range提高了使用STL的抽象级别,通过删除多余的迭代器来清理代码。Range适配器是一种非常强大和富有表达性的工具,它以模块化的方式对容器的元素进行操作。
Range是STL的未来。要进一步了解,你可以查看一下初始range库,或者看看EricNiebler的标准化提案。由于该提案依赖于C++17中未包含的概念,因此range尚未标准化。在此之前,你可以深入研究Eric Niebler的range库range-v3 ,它与C++语言的当前版本兼容。它可在VisualStudio2015Update3中找到,并带有流行的range-v3库的分支。