对任何编程语言来说,都离不开判断、选择、循环等基本的程序控制结构。自然,Scala也实现了必需的基本控制结构,只不过这些内建控制结构的语法更贴近函数式的风格。本章内容将对这些语法逐一讲解,这些语法在Chisel里编写电路逻辑时也是经常出现的。
用于判断的“if......else if......else”语法想必是所有编程语言都具备的。Scala的if表达式与大多数语言是一样的。在if和每个else if后面都将接收一个Boolean类型的表达式作为参数,如果表达式的结果为true,就执行对应的操作,否则跳过。每个分支都可以包含一个表达式作为执行体,如果有多个表达式,则应该放进花括号里。对整个if表达式而言,实际是算作一个表达式。例如:
scala> def whichInt(x: Int) = {
| if(x == 0) "Zero"
| else if(x > 0) "Positive Number"
| else "Negative Number"
| }
whichInt: (x: Int)Stringscala> whichInt(-1)
res0: String = Negative Number
Scala的“while”语法与C语言一致,都是当判别式的结果为true时,一直执行花括号里的循环体,直到判别式为false。“do......while”也是一样的,先执行一次循环体,再来进行判别,直到判别式为false。例如要计算两个整数的最大公约数:
def gcdLoop(x: Long, y: Long): Long = {
var a = x
var b = y
while (a != 0) {
val temp = a
a = b % a
b = temp
}
b
}
从上述代码可以看出,while语法的风格是指令式的。实际上,Scala把“if”叫“表达式”,是因为if表达式能返回有用的值,而“while”叫循环,是因为while循环不会返回有用的值,主要作用是不断重写某些var变量,所以while循环的类型是Unit。在纯函数式的语言里,只有表达式,不会存在像while循环这样的语法。Scala兼容两种风格,并引入了while循环,是因为某些时候用while编写的代码可阅读性更强。但其实所有的while循环都可以通过其它函数式风格的语法来实现,常见做法就是函数的自我递归调用。例如,一个函数式风格的求取最大公约数的函数定义如下:
def gcd(x: Long, y: Long): Long =
if (y == 0) x else gcd(y, x % y)
要实现循环,在Scala里推荐使用for表达式。不过,Scala的for表达式是函数式风格的,没有引入指令式风格的“for(i = 0; i < N; i++)”。一个Scala的for表达式的一般形式如下:
for( seq ) yield expression
整个for表达式算一个语句。在这里,seq代表一个序列。换句话说,能放进for表达式里的对象,必须是一个可迭代的集合。比如常用的列表(List)、数组(Array)、映射(Map)、区间(Range)、迭代器(Iterator)、流(Stream)和所有的集(Set),它们都混入了特质Iterable。可迭代的集合对象能生成一个迭代器,用该迭代器可以逐个交出集合中的所有元素,进而构成了for表达式所需的序列。关键字“yield”是“产生”的意思,也就是把前面序列里符合条件的元素拿出来,逐个应用到后面的“expression”,得到的所有结果按顺序产生一个新的集合对象。如果把seq展开来,其形式如下:
for {
p <- persons // 一个生成器
n = p.name // 一个定义
if(n startsWith "To") // 一个过滤器
} yield n
seq是由“生成器”、“定义”和“过滤器”三条语句组成,以分号隔开,或者放在花括号里让编译器自动推断分号。生成器“p <- persons”的右侧就是一个可迭代的集合对象,把它的每个元素逐一拿出来与左侧的模式进行匹配(有关模式匹配请见后续章节)。如果匹配成功,那么模式里的变量就会绑定上该元素对应的部分;如果匹配失败,并不会抛出匹配错误,而是简单地丢弃该元素。在这个例子里,左侧的p是一个无需定义的变量名,它构成了变量模式,也就是简单地指向persons的每个元素。大多数情况下的for表达式的生成器都是这么简单。定义就是一个赋值语句,这里的n也是一个无需定义的变量名。定义并不常用,比如这里的定义就可有可无。过滤器则是一个if语句,只有if后面的表达式为true时,生成器的元素才会继续向后传递,否则就丢弃该元素。这个例子中,是判断persons的元素的name字段是否以“To”为开头。最后,name以“To”为开头的persons元素会应用到yield后面的表达式,在这里仅仅是保持不变,没有任何操作。总之,这个表达式的结果就是遍历集合persons的元素,按顺序找出所有name以“To”为开头的元素,然后把这些元素组成一个新的集合。例如:
// test.scala
class Person(val name: String)
object Alice extends Person("Alice")
object Tom extends Person("Tom")
object Tony extends Person("Tony")
object Bob extends Person("Bob")
object Todd extends Person("Todd")
val persons = List(Alice, Tom, Tony, Bob, Todd)
val To = for {
p <- persons
n = p.name
if(n startsWith "To")
} yield n
println(To)
PS E:\Microsoft VS\Scala> scala test.scala
List(Tom, Tony, Todd)
每个for表达式都以生成器开始。如果一个for表达式中有多个生成器,那么出现在后面的生成器比出现在前面的生成器变得更频繁,也就是指令式编程里的嵌套的for循环。例如计算乘法口诀表:
scala> for {
| i <- 1 to 9
| j <- i to 9
| } yield i * j
res0: scala.collection.immutable.IndexedSeq[Int] = Vector(1, 2, 3, 4, 5, 6, 7, 8, 9, 4, 6, 8, 10, 12, 14, 16, 18, 9, 12, 15, 18, 21, 24, 27, 16, 20, 24, 28, 32, 36, 25, 30, 35, 40, 45, 36, 42, 48, 54, 49, 56, 63, 64, 72, 81)
每当生成器生成一个匹配的元素,后面的定义就会重新求值。这个求值是有必要的,因为定义很可能需要随生成器的值变化而变化。为了不浪费这个操作,定义应尽量用到相关生成器绑定的变量,否则就没必要使用定义。例如:
for(x <- 1 to 1000; y = expensiveComputationNotInvolvingX) yield x * y
不如写成:
val y = expensiveComputationNotInvolvingX
for(x <- 1 to 1000) yield x * y
如果只想把每个元素应用到一个Unit类型的表达式,那么就是一个“for循环”,而不再是一个“for表达式”。关键字“yield”也可以省略。例如:
scala> var sum = 0
sum: Int = 0scala> for(x <- 1 to 100) sum += x
scala> sum
res0: Int = 5050
如果操作非法,那么JVM会自动抛出异常。当然,也可以手动抛出异常。只需要用new构造一个异常对象,并用关键字“throw”抛出即可,语法与Java一样。例如:
scala> throw new IllegalArgumentException
java.lang.IllegalArgumentException
... 28 elidedscala> throw new RuntimeException("RuntimeError")
java.lang.RuntimeException: RuntimeError
... 28 elided
try后面可以用花括号包含任意条代码,当这些代码产生异常时,JVM并不会立即抛出,而是被catch捕获。catch捕获异常后,按其后面的定义进行相应的处理。处理的方式一般借助偏函数,在详细了解模式匹配前,只需要了解这些语法即可。例如处理除零异常:
scala> def intDivision(x: Int, y: Int) = {
| try {
| x / y
| } catch {
| case ex: ArithmeticException => println("The divisor is Zero!")
| }
| }
intDivision: (x: Int, y: Int)AnyValscala> intDivision(10, 0)
The divisor is Zero!
res0: AnyVal = ()scala> intDivision(10, 2)
res1: AnyVal = 5
try表达式的完整形式是“try-catch-finally”。不管有没有异常产生,finally里的代码一定会执行。通常finally语句块都是执行一些清理工作,比如关闭文件。尽管try表达式可以返回有用值,但是最好不要在finally语句块里这么做。因为Java在显式声明“return”时,会用finally的返回值覆盖前面真正需要的返回值。为了以防万一,最好不要这样做。例如:
scala> def a(): Int = try return 1 finally return 2
a: ()Intscala> a
res0: Int = 2scala> def b(): Int = try 1 finally 2
b: ()Intscala> b
res1: Int = 1
match表达式的作用相当于“switch”,也就是把作用对象与定义的模式逐个比较,按匹配的模式执行相应的操作。在详细了解模式匹配之前,先看一个简单的例子粗浅地了解一番:
scala> def something(x: String) = x match {
| case "Apple" => println("Fruit!")
| case "Tomato" => println("Vegetable!")
| case "Cola" => println("Beverage!")
| case _ => println("Huh?")
| }
something: (x: String)Unitscala> something("Cola")
Beverage!scala> something("Toy")
Huh?
对于指令式编程而言,循环里经常用到关键字“continue”和“break”,例如下面的Java程序:
// Java
int i = 0;
boolean foundIt = false;
while (i < args.length) {
if (args[i].startsWith("-")) {
i = i + 1;
continue;
}
if (args[i].endsWith(".scala")) {
foundIt = true;
break;
}
i = i + 1;
}
实际上,这两个关键字对循环而言并不是必须的。例如可以改写成如下Scala代码:
// bad Scala
var i = 0
var foundIt = false
while (i < args.length && !foundIt) {
if (!args(i).startsWith("-")) {
if (args(i).endsWith(".scala"))
foundIt = true
}
i = i + 1
}
又因为这两个关键字过于偏向指令式风格,就像“return”,所以Scala并没有引入它们。而且,Scala并不提倡使用循环,可以通过函数的递归调用达到相同的效果。一个更好的、函数式风格的Scala代码如下:
// good Scala
def searchFrom(i: Int): Int =
if (i >= args.length) -1
else if (args(i).startsWith("-")) searchFrom(i + 1)
else if (args(i).endsWith(".scala")) i
else searchFrom(i + 1)
val i = searchFrom(0)
如果实在想用,那么Scala的标准库里提供了break方法。通过“import scala.util.control.Breaks._”可以导入Breaks类,该类定义了一个名为“break”的方法。那么,在写下break的地方,就会被编译器标记为可中断。
在使用控制结构的时候,尤其是有嵌套时,必然要搞清楚变量的作用范围。Scala变量作用范围很明确,边界就是花括号。例如:
def printMultiTable() = {
var i = 1
// 只有i在作用域内
while (i <= 10) {
var j = 1
// i和j都在作用域内
while (j <= 10) {
val prod = (i * j).toString
// i、j和prod都在作用域内
var k = prod.length
// i、j、prod和k都在作用域内
while (k < 4) {
print(" ")
k += 1
}
print(prod)
j += 1
}
// i和j仍在作用域内;prod和k已经超出作用域
println()
i += 1
}
// i仍在作用域内;j、prod和k已经超出作用域
}
如果内、外作用域有同名的变量,那么内部作用域以内部变量为准,超出内部的范围以外部变量为准。例如:
scala> def f() = {
| val a = 1
| do {
| val a = 10
| println(a)
| } while(false)
| println(a)
| }
f: ()Unitscala> f
10
1
本章介绍了Scala的内建控制结构,尤其是for表达式,在Chisel里面也是经常用到。对于重复逻辑、连线等,使用for表达式就很方便。尽管Verilog也有for语法,但是使用较为麻烦,而且不能像Chisel一样支持泛型。
除此之外,Chisel也有自定义的控制结构,这些内容会在后续章节讲解。