1. 模式匹配简介
模式匹配是 Scala 的重要特性之一,前面两篇笔记Scala学习笔记(六) Scala的偏函数和偏应用函数、Scala学习笔记(七) Sealed Class 和 Enumeration都是为了这一篇而铺垫准备的。
在jdk1.7之前,Java的 switch 关键字只可以处理原生类型(int 、short 、byte 、char)和枚举类型。在jdk1.7以后,switch新增了对String类型的处理。Scala 虽然没有switch关键词,但是它的模式匹配可以看做是 switch 的加强版,能够处理更加复杂的类型和场景。
先来看一个简单的例子。
scala> def judgeGrade(name:String,grade:String) {
| grade match {
| case "A" => println(name+", you are excellecnt")
| case "B" => println(name+", you are good")
| case "C" => println(name+", you are just so so")
| case _ if name == "Tony" => println(name+", you are a good boy,come on")
| case _ => println("you need to work harder")
| }
| }
judgeGrade: (name: String, grade: String)Unit
scala> judgeGrade("Monica","A")
Monica, you are excellecnt
scala> judgeGrade("Lily","B")
Lily, you are good
scala> judgeGrade("Tom","C")
Tom, you are just so so
scala> judgeGrade("Tony","D")
Tony, you are a good boy,come on
scala> judgeGrade("Jacky","D")
you need to work harder
通过这个例子,可以看到模式匹配的语法大致是这样的。
变量 match {
case 值1 => 代码
case 值2 => 代码
...
case 值N if (...) => 代码
case _ => 代码
}
注意,case后面的值1到值N,可以是相同类型也可以是不同类型的。
if (...) 是守卫条件,后面的例子会看到。
在最后一行指令中_
是一个通配符,它保证了我们可以处理所有的情况。否则当传进一个不能被匹配的值的时候,你将获得一个运行时错误。
2. 模式匹配类型
Scala的模式匹配可以支持常量模式、变量模式、序列模式、元组模式、变量绑定模式等等。
2.1常量匹配
case 后面的值是常量。
scala> def matchConstant(x:Any) = x match {
| case 1 => "One"
| case "two" => "Two"
| case "3" => "Three"
| case true => "True"
| case null => "null value"
| case Nil => "empty list"
| case _ => "other value"
| }
matchConstant: (x: Any)String
scala> println(matchConstant(1))
One
scala> println(matchConstant(true))
True
scala> println(matchConstant(null))
null value
scala> println(matchConstant(List())) //匹配到Nil
empty list
scala> println(matchConstant(false))
other value
特别需要注意的是,Nil是一个空的List,定义为List[Nothing]。iOS开发者会比较熟悉Nil,但是这里的Nil跟OC中的Nil是两个完全不同的概念。
2.2 变量匹配
case 后面的值是变量
scala> def matchVariable(x:Any) = x match {
| case x if(x==1) => x
| case x if(x=="Tony") => x
| case x:String => "other value:" + x
| case _ => "unexpected value:"+x
| }
matchVariable: (x: Any)Any
scala> println(matchVariable(1))
1
scala> println(matchVariable("Tony"))
Tony
scala> println(matchVariable("Scala"))
other value:Scala
scala> println(matchVariable(2))
unexpected value:2
2.3 序列匹配
case 后面的值是数组、List、Range等集合。
scala> def matchSeq(x:Any) = x match {
| case List("Tony",_,_*) => "Tony is in the list"
| case List(_,second,_*) => "The second is:"+second
| case Array(first,second,_*) => "first:"+first+",second:"+second
| case _ => "Other seq"
| }
matchSeq: (x: Any)String
scala> val list1 = List("Tony","Cafei","Aaron")
list1: List[String] = List(Tony, Cafei, Aaron)
scala> val list2 = "android"::"iOS"::"H5"::Nil
list2: List[String] = List(android, iOS, H5)
scala> val array1 = Array("Hadoop","Spark","ES")
array1: Array[String] = Array(Hadoop, Spark, ES)
scala> val array2 = Array("Scala")
array2: Array[String] = Array(Scala)
scala> println(matchSeq(list1))
Tony is in the list
scala> println(matchSeq(list2))
The second is:iOS
scala> println(matchSeq(array1))
first:Hadoop,second:Spark
scala> println(matchSeq(array2))
Other seq
需要注意的是,
val list2 = "android"::"iOS"::"H5"::Nil
看上去很奇怪,其实等价于
val list2 = List("android","iOS","H5")
list分为head和tail两个部分,head是list的第一个元素,tail是list中除了head外的其余元素组成的list。用::连接list时,尾节点要声明成Nil。
所以呢,在case后面可以使用::的形式,例如:
scala> def matchSeq2(x:Any) = x match {
| case x::y::Nil => x+" "+y
| case _ => "Something else"
| }
matchSeq2: (x: Any)String
scala> val list3 = List(1,2)
list3: List[Int] = List(1, 2)
scala> println(matchSeq2(list2))
Something else
scala> println(matchSeq2(list3))
1 2
2.4 元组匹配
case 后面的值是元组类型。
scala> def matchTuple(x:Any) = x match {
| case (first,_,_) => first
| case _ => "Something else"
| }
matchTuple: (x: Any)Any
scala> val t = ("Tony","Cafei","Aaron")
t: (String, String, String) = (Tony,Cafei,Aaron)
scala> println(matchTuple(t))
Tony
值得注意的是,在元组模式中不能使用_*
来匹配剩余的元素,_*
只适用于序列模式。
2.5 类型匹配
它可以匹配输入待匹配变量的类型。
scala> def matchType(x:Any) = x match {
| case s:String => "the string length is:"+s.length
| case m:Map[_,_] => "the map size is:"+m.size
| case _:Int | _:Double => "the number is:"+x
| case _ => "unexpected value:"+x
| }
matchType: (x: Any)String
scala> println(matchType("test"))
the string length is:4
scala> println(matchType(1))
the number is:1
scala> println(matchType(1.0d))
the number is:1.0
scala> println(matchType(true))
unexpected value:true
scala> val map = Map("one"->1,"two"->2,"three"->3)
map: scala.collection.immutable.Map[String,Int] = Map(one -> 1, two -> 2, three -> 3)
scala> println(matchType(map))
the map size is:3
在这里,case 子句支持"或"逻辑,使用|
即可。
如果上述代码使用Java来改写的话,需要不断地使用instanceof来做判断类型。
类型擦除(Type erasure)
上面的类型模式示例中的Map部分,其实只是匹配了该变量是否为Map类型,并没有匹配其中的key和value的类型。如果同时需要匹配精确的key和value的类型的话,例如下面代码中匹配key和value都是Int类型的Map,会提示警告。
scala> def isIntIntMap(x: Any) = x match {
| case m: Map[Int, Int] => true
| case _ => false
| }
:12: warning: non-variable type argument Int in type pattern scala.collection.immutable.Map[Int,Int] (the underlying of Map[Int,Int]) is unchecked since it is eliminated by erasure
case m: Map[Int, Int] => true
^
isIntIntMap: (x: Any)Boolean
由于Scala 使用了泛型的类型擦除模式,代码在运行时会将类型参数忽略掉。所以上面的代码在运行时并不能去判断当前Map对象的key和value类型是否为Int或其他类型。
scala> isIntIntMap(Map(1->1))
res10: Boolean = true
scala> isIntIntMap(Map("string"->"value"))
res11: Boolean = true
但是Array不会类型擦除,可以指定Array对象中元素的类型。
2.6 变量绑定匹配
可以将匹配的对象绑定到变量上。首先写一个变量名,然后写一个@符号,最后写入该匹配的对象。如果匹配成功,则将变量设置为匹配的对象。
scala> case class Person(name: String, age: Int)
defined class Person
scala> val person = Person("Tony",18)
person: Person = Person(Tony,18)
scala> person match {
| case p @Person(_,age) => println(s"${p.name},age is $age")
| case _ => println("Not a person")
| }
Tony,age is 18
3. 模式匹配和Case Class
Case Class在Scala学习笔记(四) 类的初步中有提到。
3.1构造器模式匹配
case 后面的值是类构造器。
scala> case class Person(name:String,age:Int)
defined class Person
scala> val tony = Person("Tony",18)
tony: Person = Person(Tony,18)
scala> val monica = Person("Monica",15)
monica: Person = Person(Monica,15)
scala> val tom = Person("Tom",20)
tom: Person = Person(Tom,20)
scala> def matchConstructor(x:Any) = x match {
| case Person("Tony",18) => println("Hi Tony")
| case Person("Monica",15)=> println("Hi Monica")
| case Person(name,age) => println(s"Who are you,$age year-old person named $name?")
| }
matchConstructor: (x: Any)Unit
scala> matchConstructor(tony)
Hi Tony
scala> matchConstructor(monica)
Hi Monica
scala> matchConstructor(tom)
Who are you,20 year-old person named Tom?
如果在类中声明了与该类相同的名字的 object 则该object 是该类的“伴生对象”。伴生对象有一个apply()用于构造对象,跟apply()对偶的是unapply()用于提取和“解构”。上面例子的匹配,就是用了Person.unapply(...)。
Person类是case class,创建时就帮我们实现了一个伴生对象,这个伴生对象里定义了apply()和unapply()。
3.2 Sealed Class的模式匹配
使用Sealed Class能保证所有的匹配情况都列举出来。
其实,在Scala学习笔记(七) Sealed Class 和 Enumeration中,已经提到了Sealed Class的模式匹配
4.模式匹配的其他用法
模式匹配并不仅仅局限于case语句。在定义变量时,也可以使用模式匹配。
例如:
scala> val (x,y) = (1,2)
x: Int = 1
y: Int = 2
4.1 for循环中使用
foreach方法
scala> for (i<-List("Java","Scala","Kotlin","Groovy"))
| println(i)
Java
Scala
Kotlin
Groovy
变量绑定,相当于给Scala设置别名index
scala> for(index@"Scala" <- List("Java","Scala","Kotlin","Groovy"))
| println(index)
Scala
条件表达格式
scala> for((language,"Hadoop") <- Set("Scala" -> "Spark","Java" -> "Hadoop")){
| println(language)
| }
Java
4.2 正则表达式中使用
scala> val pattern="(S|s)cala".r
pattern: scala.util.matching.Regex = (S|s)cala
scala> val str="Scala is scalable and cool language"
str: String = Scala is scalable and cool language
scala> println(pattern findFirstIn str)
Some(Scala)
scala> println((pattern findAllIn str).mkString(", "))
Scala, scala
scala> println(pattern replaceFirstIn(str, "Java"))
Java is scalable and cool language
Scala 的正则表达式就是提取器,Scala会把每个括号里的匹配都展开到一个模式变量里。比如"(S|s)cala".r有一个unapply()方法,它返回Option[String]。另一方面"(S|s)(cala)".r的unapply会返回Option[String,String]。
scala> val numitemPattern="""([0-9]+) ([a-z]+)""".r
numitemPattern: scala.util.matching.Regex = ([0-9]+) ([a-z]+)
scala> val line="9527 scala"
line: String = 9527 scala
scala> line match{
| case numitemPattern(num,blog)=> println(num+"\t"+blog)
| case _=>println("hahaha...")
| }
9527 scala
4.3 异常处理中使用
Scala 抛出异常的语法和 Java 中的抛出异常语法是一致的。
但是Scala 的try...catch语句和 Java 的有些不一样,catch语句中通过case语句来捕获对应的异常。
catch {
case e: IllegalArgumentException => println("illegal arg. exception");
case e: IllegalStateException => println("illegal state exception");
case e: IOException => println("IO exception");
}
再结合一下final语句。
try {
throwsException();
} catch {
case e: IllegalArgumentException => println("illegal arg. exception");
case e: IllegalStateException => println("illegal state exception");
case e: IOException => println("IO exception");
} finally {
println("this code is always executed");
}
4.4 Option类中使用
Scala 语言中包含一个标准类型 Option 类型,代表可选值。Option 类型的值有两个可能的值,一个为 Some(x) 其中 x 为有效值,另外一个为 None 对象,代表空值。
scala> val books=Map("hadoop"->5,"spark"->6,"hbase"->7)
books: scala.collection.immutable.Map[String,Int] = Map(hadoop -> 5, spark -> 6, hbase -> 7)
scala> books.get("hadoop")
res0: Option[Int] = Some(5)
scala> books.get("hive")
res1: Option[Int] = None
scala> books.get("hive").getOrElse("No such book") // 不存在的元素则使用其默认的值
res2: Any = No such book
将 Option 类型的值放开,使用模式匹配:
scala> def matchOption(x:Option[Int]) = x match {
| case Some(s) => s
| case None => "?"
| }
matchOption: (x: Option[Int])Any
scala> matchOption(books.get("hadoop"))
res3: Any = 5
scala> matchOption(books.get("hive"))
res4: Any = ?
scala>
Option[T]实际上就是一个容器,可以把它看做是一个集合,只不过这个集合中要么只包含一个元素(被包装在Some中返回),要么就不存在元素(返回None)。既然是一个集合,那么可以对它使用map、foreach或者filter等方法。
总结
模式匹配是 Scala 区别于 Java 的重要特征。我们看到了模式匹配的各种用法,在实际开发中模式匹配也应用于各个方面。
先前的文章:
Scala学习笔记(七) Sealed Class 和 Enumeration
Scala学习笔记(六) Scala的偏函数和偏应用函数
Scala学习笔记(五) 抽象类以及类中的一些语法糖
Scala学习笔记(四) 类的初步
Scala学习笔记(三)
Scala学习笔记(二)
Scala学习笔记(一)