简单的c++函数式编码

下面用一个例子来用函数式方式实现某个需求，看下在函数式的思想下是如何一层层进行抽象的：

/*
 * 需求：从给定的无序整数序列中取出所有大于10且小于50的偶数，对其加倍后求和
 * 例如：
 * 原始序列：[32, 14, 3, 21, 109, 50, 25, 26, 18]
 * 操作一：过滤，留下大于10小于50:[32， 14， 21， 25， 26， 18]
 * 操作二：过滤，留下偶数：[32, 14, 26, 18]
 * 操作三：加倍：[64, 28, 52, 36]
 * 操作四：求和：180
*/

面向过程的一般写法：

int f1(const vector &input)
{
    int sum = 0;
    for(int ele : input) {
        if (ele > 10 && ele < 50) {
            if (ele % 2 == 0) {
                sum += ele * 2;
            }
        }
    }
    return sum;
}

这种写法，第一眼看过去是不知道该函数在做什么，需要一点点代码分析。原因就在于缺乏抽象。
我们先来进行最容易想到的第一层抽象：

bool isBetween(int input)
{
    return input > 10 && input < 50;
}

bool isEven(int input)
{
    return input % 2 == 0;
}

int f2(const vector &input)
{
    int sum = 0;
    for(int ele : input) {
        if (isBetween(ele)) {
            if (isEven(ele)) {
                sum += ele * 2;
            }
        }
    }
    return sum;
}

比之前好一些么？大概也就只强了那么一点点……

下面展示下使用stl算法库的写法，相对来说每个操作的可读性变强了不少：

int f3(const vector &input)
{
    vector filtRange;
    copy_if(begin(input), end(input), back_inserter(filtRange), isBetween);  // 操作一，通过copy_if过滤，条件是isBetween
    vector filtEven;
    copy_if(begin(filtRange), end(filtRange), back_inserter(filtEven), isEven);  // 操作二，通过copy_if过滤，条件是isEven
    vector doubleValue;
    transform(begin(filtEven), end(filtEven), back_inserter(doubleValue), [](int x) { return x * 2; });  //操作三，通过transform修改每条数据，修改方式是×2
    return accumulate(begin(doubleValue), end(doubleValue), 0);  // 操作四，从0开始累加
}

使用stl算法库看起来已经很好阅读了，那么对于函数式来说，我们还有什么可以抽象的呢？
抽象一方面是为了增强可读性，另一方面是为了增强普适性，便于复用。
从复用角度来看，之前的isBetween只能判断在10和50之间，不能适用其他范围，因此进一步的抽象可以优化这里：

// 过滤器
using Filter = function;

// 生成一种过滤器的函数
Filter isBetween(int left, int right)
{
    // 返回值是一个函数
    return [=](int input) {
        return input > left && input < right;
    };
}

这里的isBetween是之前的isBetween的抽象，该函数调用的返回值其实就是原来的isBetween函数。

这样，完整调用流程就变成了这样：

int f4(const vector &input)
{
    vector filtRange;
    copy_if(begin(input), end(input), back_inserter(filtRange), isBetween(10, 50));
    vector filtEven;
    copy_if(begin(filtRange), end(filtRange), back_inserter(filtEven), isEven);
    vector doubleValue;
    transform(begin(filtEven), end(filtEven), back_inserter(doubleValue), [](int x) { return x * 2; });
    return accumulate(begin(doubleValue), end(doubleValue), 0);
}

isBetween(10, 50)相比之前的isBetween，明确了判断是在10到50之间，相比之前读起来更直观一些；同时也可以在别的代码处对不同的范围条件复用。
这里其实就用到了函数式的基础——将函数作为返回值。难道所谓的函数式就这？？？

来吧，展示：

如果我们要做进一步抽象，考虑到这里都是对一个数据序列做操作，一共四步操作：前两步操作都是过滤，第三步操作是对每条数据做转换，第四步操作是对所有数据一起做个整合；
我们把“过滤”、“数据转换”、“数据整合”作为一个抽象层级，再利用pipeline方式做形式化处理。对于过滤，我们定义如下形式：

// 输入一个序列和过滤器，输出过滤后的序列
vector operator | (const vector &input, Filter filter)
{
    vector output;
    copy_if(begin(input), end(input), back_inserter(output), filter);
    return output;
}

使用过滤器之后，我们的完整处理流程形式如下：

int f5(const vector &input)
{
    auto filt = input | isBetween(10, 50) | isEven;  // isBetween(10, 50)和isEven是两个过滤器，对input做过滤后的结果是filt
    vector doubleValue;
    transform(begin(filt), end(filt), back_inserter(doubleValue), [](int x) { return x * 2; });
    return accumulate(begin(doubleValue), end(doubleValue), 0);
}

对于数据转换，我们做如下定义：

// 数据转换器
using Transformer = function;

// 输入一个序列和转换器，输出转换后的序列
vector operator | (const vector &input, Transformer trans)
{
    vector output;
    transform(begin(input), end(input), back_inserter(output), trans);
    return output;
}

然后我们再对乘2动作再做一次抽象级别的提升，可指定任意倍数扩展：

Transformer multiplyBy(int x)
{
    return [x](int input) {
        return input * x;
    };
}

注意到multiplyBy也是一个高阶函数，它返回了一个转换器函数。

这时候我们的完整处理流程变成了如下形式：

int f6(const vector &input)
{
    auto out = input | Filter(isBetween(10, 50)) | Filter(isEven) | Transformer(multiplyBy(2));
    return accumulate(begin(out), end(out), 0);
}

至此，我们阅读上面的代码，已经可以“口述”了：

对序列input元素按是否在10到50之间过滤，再按是否偶数过滤，再做乘2转换得到新序列out；返回out序列从0开始的累加结果

直接口述代码，意味着我们不需要再去思考这段代码的意图，阅读代码变得简单。
这就体现出函数式宣称的一大好处：描述做什么，而非怎么做。

我们再来看看数据整合怎么实现：

template
using FoldFunc = function;

template
struct Fold {
    Fold(FoldFunc f, const T &in) : func(f), init(in) {};
    FoldFunc func;  // 折叠函数，表示数据整合的方法
    T init;  // 初值
};

template
T operator | (const vector &input, const Fold &fold)
{
    T result = fold.init;
    for (int i : input) {
        result = fold.func(result, i);
    }
    return result;
}

完成数据整合之后，处理的完整流程如下：

// 对于累加来说，折叠函数就是Add:
int Add(int a, int b)
{
    return a + b;
}

int f7(const vector &input)
{
    return input | Filter(isBetween(10, 50)) | Filter(isEven) | Transformer(multiplyBy(2)) | Fold(Add, 0);
}

我们可以看到，一行代码就完成了整个功能，且达成了“口述”代码流程：

“过滤input中10到50之间的偶数，再乘2之后从0开始累加”。

对比我们的原始需求描述：

“从给定的无序整数序列中取出所有大于10且小于50的偶数，对其加倍后求和”

不能说完全相同，只能说是一模一样

可能有同学有疑问，accumulate已经很直观了，搞个Fold没看出来有多大好处呀？
其实这东西在函数式中是很基础和常见的。比如我们打印一个vector，可以利用Fold这样实现：

void print(const vector &input)
{
    string content = input | Fold([](const string &s, int i) { return s + " " + to_string(i); }, "[");
    cout << content << " ]" << endl;
}

可能有的同学会说了，你这个打印只能打印int元素的vector，其他的搞不定！
说起来，我们上面的Fold其实限定了一个条件：每个元素的类型和折叠后的结果类型是一致的。
如果我们放开这个限制，比如如下形式定义，就可以搞定其他情况了：

template
using FoldFunc2 = function;

template
struct Fold2 {
    Fold2(FoldFunc2 f, const T &in) : func(f), init(in) {};
    FoldFunc2 func;
    T init;
};

template
T operator | (const vector &input, const Fold2 &fold)
{
    T result = fold.init;
    for (const U &i : input) {
        result = fold.func(result, i);
    }
    return result;
}

简单的c++函数式编码

你可能感兴趣的:(简单的c++函数式编码)