Clojure 学习笔记 :8 遍历元素

Clojure 零基础 学习笔记 遍历 map filter reduce 匿名函数


体验声明式[1]的 “自动化” 遍历

遍历是一个非常常见的需求,我们经常需要把一个集合中的每一个元素都取出来捣鼓点什么。这次我们来介绍一下函数式世界里非常实用的几个函数,它们能非常方便地处理这些遍历问题:

  1. 依次把集合中的每一个元素取出来执行某种操作。
  2. 找出集合中所有满足某一指定条件的元素。
  3. 依次取出元素,进行一系列操作后,把这次操作返回值和下一个元素一起,再次进行操作...直至最后一个元素。

解决第一个问题的函数是我们已经见过的 map 函数,它能把集合中的元素依次取出作为指定函数的参数,并把每次执行的返回值以列表形式返回。
第二个“筛选”问题,我们使用 filter 函数来解决,我们会在接下来的内容中来一起认识一下这个新伙伴。
前两个问题比较容易理解,第三个问题看起来比较麻烦, reduce 函数可以用来处理这种问题,这个过程称为“规约”,我们马上就会了解到如何来使用它。


首先我们来和们的老朋友 map 函数打个招呼。我们来看看如何使用它来把一个数字集合中所有的数字都加上 1:

=> (defn plus-one
      [x]
      (+ x 1))
#'user/plus-one
=> (map plus-one [41 443 24346 23 54 3 35])
(42 444 24347 24 55 4 36)
; 事实上 Clojure 已经内置了函数 inc,
; 它与我们自己实现的 plus-one 函数在功能上一模一样
=> (map inc [41 443 24346 23 54 3 35])
(42 444 24347 24 55 4 36)

非常的简便,如果你想进行其他操作,只需修改map 函数的第二个参数。

比如,我们想操作某个保存“用户信息”的复合数据结构,把出生月份在9月份之前的用户年龄增加 1:

=> (map (fn [map-person-info]
          (if (< (:birthmonth map-person-info) 9)
            (assoc map-person-info :age (inc (:age map-person-info)))
            map-person-info)) 
        [{:name "sun" :birthmonth 12 :age 24} {:name "li" :birthmonth 5 :age 20}])

({:name "sun", :birthmonth 12, :age 24} {:name "li", :birthmonth 5, :age 21})

注意这里我们使用了匿名函数 fn。当你想使用这种使用一次就丢弃的“一次性”函数时,就可以考虑使用匿名函数。
不过,Clojure 还提供了一种更为炫酷的匿名函数形式,它看起来是这样子的:

#(+ % 1)
;上面的形式等价于下面的形式
(fn [some-num]
  (+ some-num 1))

不难看出,其实这种形式就是把参数列表和参数名用 % 来代替,然后直接在 #() 里填写函数体。如果有多个参数,就以 %1 %2 ... 来代替。
所以上面的给用户年龄加一的例子使用精简版匿名函数来写,看起来就会是这个样子:

(map #(if (< (:birthmonth %) 9)
       (assoc % :age (inc (:age %)))
       %) 
     [{:name "sun" :birthmonth 12 :age 24} {:name "li" :birthmonth 5 :age 20}])

不过要注意,匿名函数的语法糖形式不可嵌套!!!fn 则可以嵌套。一个原因是,如果你使用非常炫酷的 #() 进行了过多层次的嵌套,可能连你自己也读不懂。另一个重要原因是,很难去区别处理 % 到底是属于外层还是内层。
它们之间还有一些不同,鉴于篇幅,你可以自行查阅相关文档来了解。


现在出场的是 filter 函数,正如同它的名字“过滤”,我们可以使用它进行方便的过滤工作。
比如我们要过滤数字集合中大于 8 的数字:

=> (filter #(> % 8) [3 5 426 676 55475 12 4 78 2 48])
(426 676 55475 12 78 48)

filter 函数的使用方法也很简单,它的第一个参数是一个返回值类型是布尔型(boolean)的函数(也就是返回值是 true 或者 false 的函数),第二个参数是待过滤的集合。filter 函数会一一检查集合中的元素是否满足条件,即依次取出集合中的元素作为我们提供的布尔型函数的参数,把结果为 true 的元素留下。

再来看一个例子,找到 1 到 10 之间的奇数:

=> (defn odd-number? ; Clojure 里把返回布尔型的函数命名为 xx? 的形式 
     [number]
     (not= (mod number 2) 0)) ; 除以2余数不为0的数字即为奇数
#'user/odd-number?
=> (filter odd-number? (range 1 11))
(1 3 5 7 9)
; 事实上 Clojure 已经提供了 odd? 函数,和我们自己实现的版本功能上一样
=> (filter odd? (range 1 11)) 
(1 3 5 7 9)

如果加强一点,还可以找到质数:

=> (defn prime?
     [number]
     (empty? (filter #(= 0 (mod number %)) (range 2 number))))
#'user/prime?
=> (filter prime? (range 1 101))
(1 2 3 5 7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 67 71 73 79 83 89 97)

当然我们这个函数的速度还有很大的进步空间,进一步优化就交给有兴趣的同学了。


最后我们来看看 reduce 函数,文字上很难描述它的功能,不过看了它的例子之后会发现它也是很容易的,这个例子是简单的加法:

=> (reduce + [1 2 3 4 5])
15

虽然我们的 + 函数支持多个参数,但是我们假设加法函数只支持两个数字的加法,那么就需要使用 reduce 函数来完成多参数的加法了。它的执行过程是这样的:

  1. 首先取出集合的前两个元素作为 + 的参数,执行函数得到返回值 3
  2. 然后把上一步骤得到的返回值 3,和集合的第三个元素 3,作为 + 的参数,执行函数得到返回值 6
  3. 然后把上一步骤得到的返回值 6,和集合的第四个元素 4,作为 + 的参数,执行函数得到返回值 10
  4. ...
  5. 直到集合中的所有元素都被处理,返回最终返回值 15。

这种把上一次的结果和下一个元素作为接下来的函数参数,重复直到遍历元素的过程,称为“规约”。
由于这种特性,它第二个参数接受的函数必须支持传递两个参数。

我们还可以给规约过程提供一个初始值,比如下面这个例子,可以把一个集合中的元素添加进另一个集合中:

=> (reduce conj [1 3] [1 2 3])
[1 3 1 2 3]

这个例子中,[1 3] 是初始值,第一次执行会从 [1 2 3] 中取出第一个元素 1 ,通过 conj 添加进 [1 3] 中,得到结果 [1 3 1],以此类推,最终结果是 [1 3 1 2 3]


最后总结,在函数式语言中,遍历是声明式的,你无需控制遍历过程,只需使用相应的高阶函数,往高阶函数中传递不同的函数,再通过函数之间灵活自由的组合,即可轻松应对。
实际上,往往需要把本次介绍的函数结合起来使用,以此应对更为复杂的问题。
比如先使用 map 进行初步处理,再使用 filter 过滤,最后使用 reduce 规约,得到最终结果。


  1. 声明式编程:告诉程序你想要的是什么,剩下的交给程序来自动处理。命令式编程:一步一步的命令程序如何操作,程序会按照你的命令去进行操作。 ↩

你可能感兴趣的:(Clojure 学习笔记 :8 遍历元素)