Scala基本数据结构用法异于Java的部分

转载请注明出处[https://www.jianshu.com/p/116e26e668df]

Scala中的同样实现了各种各样的基本数据结构类型,其中一些异于Java的使用方法需要特别注意。
需要特别注意的是,Scala中的基本数据类型(list,set,map,iterator,array,tuple)由两种容器类继承而来的:
1、scala.collection.immutable --> 不可变容器类
2、scala.collection.mutable --> 可变容器类

List

Scala中,List是一种共享相同类型的不可变的对象序列。
不同于Java的java.util.List,scala的list一旦被定义,其值就不能改变,因此声明List时需要初始化。
(这里说的值不能变是指所指向的对象地址不能变,对象本省的值是可以发生变化!!)

List操作符:
++ 从列表的尾部添加另外一个列表

++: 在列表的头部添加一个列表

+: 在列表的头部添加一个元素

:+ 在列表的尾部添加一个元素

:: 在列表的头部添加一个元素

Set

集合Set是不重复元素的容器。元素按照插入顺序排序,以Hash的方法来对元素的值进行排序组织。

Set包含可变集和不可变集,分别位于scala.collection.mutable包和scala.collection.immutable包中,缺省状况是不可变集。

var mySet = Set("Hadoop","Spark")
mySet += "Scala"

上面代码定义了可变的var类型变量,但是Set缺省状态下是不可变集合,注意这里需要理解不可变指的是对象所开辟的空间不可变,添加了元素后相当于重新生成了新的Set在新的空间。

如果要声明一个可变集则需要导入包:

import scala.collection.mutable.Set
val myMutableSet = Set("Data","BigData")  
myMutableSet += "Cloud"

上面的代码我们指定所使用的Set为可变的,但是定义变量myMutableSet 时用了val来指定其不可变,那为什么可以往里面添加新的元素呢?
这里需要理解:不可变指的是对象所在地址不变,即指向的空间指针不变,而集合本身是可以发生变化的。

Map

映射Map是一系列键值对的容器。
与Set一样,Map也分为可变与不可变,缺省默认是不可变,如需使用可变,需要导入scala.collection.mutable.Map包。
格式:Map(key1->value1, key2->value2)
在取出一个key所对应的value时,为了避免盲目期间,若想先判断是否key存在可以使用下面的例子来取值:

val myMap = Map("a"->1, "b"->2)
val r = if (myMap.contains("a")) myMap("a") else 0
println(r)

Map遍历:
for ((k,v) <- myMap) 语句块
例如:for ((k,v) <- myMap) printf("Code is : %s and name is %s\n",k,v) 即可遍历mySet全部的key和value。

也可以只遍历全部的key或是value:
for (k <- mySet.keys) println(k) 打印全部的key;
for (v <- mySet.values) println(v) 打印全部的values

迭代器

Scala中,迭代器Iterator不是一个集合,但是其提供一个访问集合的方法。
迭代器两个基本操作:next和hasNext

如何通过迭代器访问集合内容:

while循环来访问:
val iter = Iterator("Hadoop", "Spark")
while (iter.hasNext) {
    println(iter.next())
}

for循环来访问:
val iter = Iterator("Hadoop", "Spark")
for (elem <- iter) {
    println(elem)
}

Iterator继承自Iterable类,其类提供两个方法返回一个迭代器(这个返回的迭代器不是单个元素,而是原容器元素的全部子序列):grouped和sliding。
groubed返回元素的增量分块;
sliding返回一个滑动元素的窗口。

val list1 = List(1,2,3,4,5)
val list_g = list1 grouped 3
list_g.next()
    -->输出:List(1,2,3)
list_g.next()
    -->输出:List(4,5)

val list_s = list1 sliding 3
list_s.next()
    -->输出:List(1,2,3)
list_s.next()
    -->输出:List(2,3,4)

数组Array

Array定义的数组属于定长数组,一旦初始化,不可改变。
Scala中可以不指明初始化数组的类型,Scala可以根据数据元素自行推断元素类型:
val intArray = Array(12,14,45)
val strArray = array("hadoop","spark")

Scala中定义多维数组(矩阵)的方法:
scala Array提供了函数ofDim来定义二维和三维数组,用法如下:
val myMatrix = Array.ofDim[int](3,4) 等同于Array[Array[int]]

如果要定义变长Array,可使用ArrayBuffer类型:

import scala.collection.mutable.ArrayBuffer
val arr = ArrayBuffer(10,20,30)
arr += 40
arr.insert(2,60,40)    //从第二个元素后面插入60和40
arr -= 40   //把第一个为40的值删掉
var temp = arr.remove(2)

元组 Tuple

元组是不同类型的值的聚集。元组和List不同,列表中各个元素必须是相同类型,而元组可以包含不同类型元素。注意取出一个元素的方法是 下划线.num

val tu = ("bigdata","hadoop","spark")
println(tu._1)
    ->输出"bigdata"
println(tu._2)
    -->输出"hadoop"

你可能感兴趣的:(Scala基本数据结构用法异于Java的部分)