初探 Swift Sequences 和 Generators

作者:uraimo,原文链接,原文日期:2015-11-12
译者:CoderAFI;校对:Cee;定稿:numbbbbb

在这篇文章中我们将介绍 Swift 2 自定义序列,并举例说明有限序列和无限序列的区别,本文是 Swift and the functional approach 系列其中一篇。

初探 Swift Sequences 和 Generators_第1张图片
sequences

你可以访问 GitHub 或下载 zip 文件来获取本文示例程序的 playground。

SequenceType 标准协议在官方文档中被定义为一种简单的数据类型,该类型可以用 for...in 来循环遍历。协议中最重要的定义是在上半部分:

public protocol SequenceType {
    typealias Generator : GeneratorType
    /// Return a *generator* over the elements of this *sequence*.
    ///
    /// - Complexity: O(1).
    public func generate() -> Self.Generator
    ...
    ...
}

上面的协议中关联了另一个 GeneratorType 协议类型(Swift 让协议泛型化的独特方式)。当我们要自定义序列的时候,我们同时也要自定义一个实现这个协议的生成器,保证我们自定义的 SequenceType 在调用 generate() 方法时能够返回指定元素类型的生成器。

序列协议中提供了许多有意思的方法,这些方法很多都已经在扩展中实现了,例如 mapflatmap(深入了解可以参看 map and flatMap)、filterreducesubsequence functions 等。

这些方法让 SequenceType 协议的作用远远大于只进行 for each 遍历。

让我们来看下 GeneratorType 的定义:

public protocol GeneratorType {
    typealias Element
    /// Advance to the next element and return it, or `nil` if no next
    /// element exists.
    public mutating func next() -> Self.Element?
}

这个简单的协议只包含了一个 next() 方法,该方法用来返回生成器管理的下一个元素。至关重要的一点是,当序列遍历到最后时,生成器应该返回 nil。接下来当我们构造一个无限序列的时候,来看看为什么这里要返回 nil

首先,我们来写一个简单的斐波那契数序列生成器:

class FibonacciGenerator : GeneratorType {
    var last = (0,1)
    var endAt:Int
    var lastIteration = 0

    init(end:Int){
        endAt = end
    }

    func next() -> Int?{
        guard lastIteration

为了定义一个有限序列,我们需要一个自定义构造函数来指定一个序列长度。当到达这个长度时 next() 方法就返回 nil。这里我们用元组(Tuple)实现起来会节省很多代码量,让我们看下如何使用这个生成器:

var fg = FibonacciGenerator(end:10)

while let fib = fg.next() {
    print(fib)
}

用这种方式我们就可以遍历生成器中的元素,直到生成器返回 nil

根据这个生成器实现一个 SequenceType 轻而易举。

class FibonacciSequence : SequenceType {
    var endAt:Int

    init(end:Int){
        endAt = end
    }

    func generate() -> FibonacciGenerator{
        return FibonacciGenerator(end: endAt)
    }
}

let arr = Array(FibonacciSequence(end:10))

for f in FibonacciSequence(end: 10) {
    print(f)
}

上面的序列正如预期那样,可以在 foreach 遍历中使用,同样也可以用来生成其他类型的序列,比如数组。

其实我们没有必要单独定义一种生成器类型,我们可以用 anyGenerator 工具方法和 AnyGenerator 类来降低序列定义的耦合性:

class CompactFibonacciSequence : SequenceType {
    var endAt:Int

    init(end:Int){
        endAt = end
    }

    func generate() -> AnyGenerator {
        var last = (0,1)
        var lastIteration = 0

        return anyGenerator({
            guard lastIteration

这种定义方式跟上面序列的最终效果是一样的。唯一的区别就是 generate 方法返回了 AnyGenerator 类型。它已经不是我们开始的时候定义的简单生成器类型

这种做法在这里看起来可能没太大用处,但是在很多情况下,相较于让一个生成器嵌入一个序列集合中,用一个简单 anyGenerator() 方法来生成的序列更具扩展性。

例如,我们用 Lucas 序列的前 10 个数来创建一个序列。Lucas 序列与斐波那契序列非常相似,不同之处是斐波那契序列以 0,1 开头而 Lucas 序列以 2,1 开头,所以当然最终会生成截然不同的序列,例如:2,1,3,4,7,11,18,29...下面我们只定义一个生成器,并用它来初始化一个数组。

var last = (2,1)
var c = 0

let lucas = anyGenerator{
    ()->Int? in
    guard c<10 else {
        return nil
    }

    c++
    let next = last.0
    last = (last.1,last.0+last.1)
    return next
}

let a = Array(lucas) //[2, 1, 3, 4, 7, 11, 18, 29, 47, 76]

看起来不错,我们删除了一些无用的代码,我们也可以扩展我们的算法,让它返回一个黄金分割比,让我们试试:

import Darwin

let Phi = (sqrt(5)+1.0)/2
let phi = 1/Phi

func luc(n:Int)->Int {
    return Int(pow(Phi, Double(n))+pow(-phi,Double(n)))
}

c = 0
var compactLucas = anyGenerator{ c<10 ? luc(c++): nil }

let a2 = Array(compactLucas) //[2, 1, 3, 4, 7, 11, 18, 29, 47, 76]

这样确实行得通吗?当然,你可以下载 playground 或打包的 zip 文件来验证。

为了尝试 SequenceType 提供的一些特性方法。我们构建一个只返回偶数的 Lucas 数字序列:

c = 0
var evenCompactLucas = anyGenerator{ c<10 ? luc(c++): nil }.filter({$0 % 2 == 0})
let a3 = Array(evenCompactLucas) //[2, 4, 18, 76]

注意,这里我们其实是重新定义了 AnyGenerator,由于前面的序列是有限的,当遍历到最后时,就会产生另一个有限的序列。这从另一方面也可以说明,我们很容易就能改变原有序列,返回一组新的数据集。我们也可以用 map 方法来做一些更直接的转换。

无限序列

现在,我们移除 nil 的返回值限制,这样就能根据 Lucas 算法生成一个无限序列。

c = 0
var infiniteLucas = anyGenerator{luc(c++)}

可见,将一个有限序列转换成无限序列是非常容易的。现在我们生成了一个没有数量限制的新序列。但是我们需要另外一种方式来限制序列元素数,从而让无限序列元素数更可控。

幸运的是 SequenceType 协议提供了一个方法来解决这个问题:

let a4 = Array(infiniteLucas.prefix(10)) //[2, 1, 3, 4, 7, 11, 18, 29, 47, 76]

for var f in infiniteLucas.prefix(10){
    print(f)
}

这种方式将会从当前序列筛选出 10 个元素并添加到一个新的序列中,而且新序列使用起来跟前面的无限序列是一样的。

让我们进一步来看一下 filter 方法的用法,看看怎么样用它来获取 Lucas 偶数。

var onlyEvenLucas = infiniteLucas.filter({$0 % 2 == 0})
for var f in onlyEvenLucas.prefix(10){
    print(f)
}

然而,上面的代码并不会像预期那样工作。

如果是在 playground 运行,在声明 onlyEventLucas 时你会看到高亮报错。如果是在应用程序中写了这段代码,你的应用程序会崩溃。

要了解问题的原因,必须要了解 filter 函数的工作原理。 当对一个序列进行 filter 操作时,我们
必须要把序列的所有元素都获取到,但是如果没有 nil 限制,序列元素是无限的,就无法确认元素的遍历操作什么时候结束。

让我们在每次从生成器获取元素时都打印一段文本,来更形象的看下原因:

class InfiniteSequence :SequenceType {
    func generate() -> AnyGenerator {
        var i = 0
        return anyGenerator({
            print("# Returning "+String(i))
            return i++
        })
    }
}

var fs = InfiniteSequence().filter({$0 % 2 == 0}).generate()

for i in 1...5 {
    print(fs.next())
}

如果你运行这段代码,会发现在 InfiniteSequence 上的过滤处理一直在运行,直到一段时间后处理器无法再继续运行,程序就崩溃了。

幸运的是,解决上面的问题也很容易。我们只需要延迟计算(Lazily evaluate)这个无限的 Lucas 序列:

var onlyEvenLucas = infiniteLucas.lazy.filter({$0 % 2 == 0})
for var f in onlyEvenLucas.prefix(10){
    print(f)
}

使用无限序列的 .lazy 属性就能获取一个新的 LazySequenceType 类型,该类型会让 mapflatmapreduce 或者 filter 这些方法延迟执行,也就是说真正的计算会等到例如 next 这样的终端操作(Terminal Operation)(其他语言是这么叫的)执行时才会被执行。

让无限序列支持延迟计算是一个必要步骤,默认情况下 Swift 的序列不能延迟计算(该特性是在 Swift 1.0 发布的)。具体你可以通过官方文档来详细了解如何自定义一个 LazySequence(大多数情况可能是解决问题的最好办法),我也会就该内容进行讲解,敬请期待。

本文由 SwiftGG 翻译组翻译,已经获得作者翻译授权,最新文章请访问 http://swift.gg。

你可能感兴趣的:(初探 Swift Sequences 和 Generators)