Map存储一个键-值对的集合。键和值都可以是任何数据类型的对象,无论是基本数据类型还是其它映射。然而,使用关键字来作为映射的键非常合适,因此它们经常在应用映射的场合被使用。clojure的Map有三种实现方式:数组映射、哈希映射和有序映射。它们分别使用数组、哈希表和二叉树来作为底层实现。数组映射适用于较小的映射,而对哈希映射和有序映射的比较则要基于特定应用场合的情况。Map形式以“{:a 1 :b 2}“符号表示
创建Map的方式:
1、简单定义
直接通过def绑定某个符号为映射形式,如下:
user=> (def my-map {:a 1 :b 2 :c 3}) #'user/my-map user=> (type my-map);type查看符号的类型,这里默认采用哈希映射 clojure.lang.PersistentHashMap
2、hash-map:
创建哈希映射
user=> (hash-map) {} user=> (hash-map :key1 1, :key2 2) {:key2 2, :key1 1} user=> (def user {:name "steve" :age 24 :salary 8000 :company "ibm"}) #'user/user
3、array-map:
array-map创建数组映射,也有资料说是有序映射(不是根据key排序的意思,而是根据元素的初始顺序,相对于hash-map中key的位置不确定而言)
user=> (array-map :b 1 :a 2 :c 3) {:b 1, :a 2, :c 3} user=> (def am (array-map :b 1 :a 2 :c 3)) #'user/am user=> (type am) clojure.lang.PersistentArrayMap
4、sorted-map:
sorted-map对键进行比较:根据数字或者字母表进行排序。
user=> (type (sorted-map));底层实现方式为PersistentTreeMap clojure.lang.PersistentTreeMap user=> (sorted-map :b 2 :a 1) {:a 1, :b 2} user=> (sorted-map 0 0 2 2 1 1) {0 0, 1 1, 2 2}
5、zipmap:
zipmap使用给定的keys映射到匹配的vals,返回一个数组映射,如下:
user=> (def zm (zipmap [:a :b :c :d :e] [1 2 3 4 5])) #'user/zm user=> (type zm) clojure.lang.PersistentArrayMap user=> zm {:e 5, :d 4, :c 3, :b 2, :a 1} user=> (zipmap [:a :b :c] [1 2 3 4]) {:c 3, :b 2, :a 1}
6、sorted-map-by:
使用提供的比较器,返回一个新建的有序映射。如下:
user=> (sorted-map-by > 1 "a", 2 "b", 3 "c") {3 "c", 2 "b", 1 "a"} user=> (sorted-map-by < 1 "a", 2 "b", 3 "c") {1 "a", 2 "b", 3 "c"}
7、bean:
根据java对象,返回该对象的属性构成的map,这里待分析与java互操作时再说明。
8、frequencies:
根据集合中元素出现的次数,构成一个数组映射。如下:
user=> (frequencies [1 2 1 1 "a" "b" "a"]) {1 3, 2 1, "a" 2, "b" 1} user=> (type (frequencies [1 2 1 1 "a" "b" "a"])) clojure.lang.PersistentArrayMap
操作Map的函数:
1、assoc(更新):
在vector部分已经提到assoc,不过assoc函数作用在map上,相当于把参数中的key value对添加到已有map中,如果key相同,则更新成参数中的value。
user=> (assoc {} :key1 "value1" :key2 2) {:key2 2, :key1 "value1"} user=> (assoc {:key1 "old value"} :key1 "new value") {:key1 "new value"}
2、dissoc(删除):
dissoc函数是将map中指定的key丢弃掉,并返回新的map
user=> (dissoc {:a 1 :b 2 :c 3} :b);丢弃key为:b的元素 {:a 1, :c 3} user=> (dissoc {:a 1 :b 2 :c 3});没有key的参数时,直接返回 {:a 1, :c 3, :b 2} user=> (dissoc {:a 1 :b 2 :c 3} :d); {:a 1, :c 3, :b 2} user=> (dissoc {:a 1 :b 2 :c 3} :a :b :c) {}
3、find:
find函数接收两个参数,第一个参数为map,第二个参数为key,在map中查找key对应的元素,找不到返回nil,找到返回该元素(即键值对),如下:
user=> (find {:a 1 :b 2} :c) nil user=> (find {:a 1 :b 2} :a) [:a 1]
实际上,find也可作用在vector上,从vector中查找索引对应的元素,找到后,返回索引位置与值组成的新的vector,找不到,直接返回nil。代码如下:
user=> (find [1 2 3] 2) [2 3] user=> (find [1 2 3] 4) nil
4、key:
key的参数为map中的元素(entry),所以不能直接把key作用在map上。key用于返回元素的key名称
user=> (map key {:a 1 :b 2});map的作用在后续详细介绍 (:a :b) user=> (key (first {:a 1 :b 2}));first函数返回map的第一个元素作为key的参数 :a
5、keys:
keys的参数为map,返回map中的key组成列表
user=> (keys {:a 1 :b 2}) (:a :b)
6、val:
与key类似,参数为map元素(entry),返回元素的value值
user=> (val (first {:one :two})) :two
7、vals:
与keys类似,参数为map,返回map中的value组成的列表
user=> (vals {:a 1 :b 2}) (1 2)
8、get:
在vector时也用到get,用于返回指定位置的元素。get作用在map上,是返回指定key的对应的value,如果找不到,也可返回指定的提示信息,如下:
user=> (get {:a 1 :b 2} :b) 2 user=> (get {:a 1 :b 2} :z "missing") "missing"
9、get-in:
get-in适用于多层嵌套的情况,如下:
user=> (((({:n "qh", :addr {:cn {:bj {:hd "tsinghua"}}}} :addr) :cn) :bj) :hd);不用get-in时 "tsinghua" user=> (get-in {:n "qh", :addr {:cn {:bj {:hd "tsinghua"}}}} [:addr :cn :bj :hd]);使用get-in方式 "tsinghua"
10、select-keys:
用于选择key,返回包含指定key的map
user=> (select-keys {:a 1 :b 2} [:a]) {:a 1} user=> (select-keys {:a 1 :b 2} [:a :c]) {:a 1}
11、assoc-in(更新):
assoc-in函数用于更新map中指定key对应的值:
user=> (assoc-in {:name "tom" :age 26} [:age] 36) {:age 36, :name "tom"}
12、update-in(更新):
update-in函数用于更新map中指定key对应的值,不过更新方式使用第三个参数(函数)
user=> (update-in {:name "qh" :age 30} [:age] #(inc %)) {:age 31, :name "qh"} user=> (update-in {:a 3} [:a] / 4 5) {:a 3/20}
13、merge(更新):
merge函数用于合并多个map为一个新的map,如果key相同,则保留后一个参数map的key对应值
user=> (merge {:name "qh" :age 30} {:gender 'm :mail "qh@mail"}) {:mail "qh@mail", :gender m, :age 30, :name "qh"} ;这里也可以用conj user=> (conj {:name "qh" :age 30} {:gender 'm :mail "qh@mail"}) {:mail "qh@mail", :gender m, :age 30, :name "qh"}
14、merge-with(更新):
merge-with可以作为merge的升级版,不仅合并map,还能以第一个参数(函数)对key相同的value做处理。
user=> (merge-with + {:a 1 :b 2} {:a 2 :b 98 :c 0}) {:c 0, :a 3, :b 100}
操作SortedMap的函数:
1、rseq:
对有序映射的逆转函数,如下:
user=> (rseq (sorted-map :a 1 :c 2 :b 4)) ([:c 2] [:b 4] [:a 1])
2、subseq:
对有序映射执行比较(支持>、>=、<、<=),比较结果为true,添加到列表中,并返回
user=> (subseq (sorted-map :a 1 :c 2 :b 4) < :b) ([:a 1]) user=> (subseq (sorted-map :a 1 :c 2 :b 4) >= :b) ([:b 4] [:c 2])
3、rsubseq:
对有序映射执行比较(支持>、>=、<、<=),比较结果为true,添加到列表中,并对列表结果逆转后返回,如下:
user=> (rsubseq (sorted-map :a 1 :c 2 :b 4) >= :b) ([:c 2] [:b 4])
四、集合Set
Set是一个包含不重复元素的集合。当我们要求集合里面的元素不可以重复,并且我们不要求集合里面的元素保持它们添加时候的顺序,那么使用set比较合适。Set形式以“#{1,2,3}”符号表示。Set可以使用哈希表或二叉树来实现,使用 hash-set 或者 sorted-set 函数
创建集合Set的方式:
1、简单定义:
user=> (def languages #{:java :list :c++}) #'user/languages user=> languages #{:c++ :list :java}
2、set:
使用set函数转换其他集合类型为set类型,并且去除重复元素,如下:
user=> (set '(1 1 2 3 4 4 5)) #{1 2 3 4 5} user=> (set [1 1 2 3 4 4 5]) #{1 2 3 4 5} user=> (set "abcd") #{\a \b \c \d} user=> (set "abccdd") #{\a \b \c \d} user=> (set {:one 1 :two 2 :three 3}) #{[:two 2] [:three 3] [:one 1]}
3、hash-set:
使用hash-set创建基于哈希表的集合,如下:
user=> (hash-set :a :b :c) #{:a :c :b} user=> (hash-set 3 2 1 2);通过hash-set创建set时,需要检查给定的key是否重复 IllegalArgumentException Duplicate key: 2 clojure.lang.PersistentHashSet.create WithCheck (PersistentHashSet.java:80)
4、sorted-set:
使用sorted-set创建基于二叉树的集合,如下:
user=> (sorted-set 3 2 1) #{1 2 3} user=> (sorted-set 3 2 1 1);通过sorted-set创建set时,不检查key是否重复 #{1 2 3}
为何这里不检查key重复,而hash-set检查出现重复时抛出异常?
原因如下:
;使用source查看函数的源码 user=> (source hash-set) (defn hash-set "Returns a new hash set with supplied keys." {:added "1.0" :static true} ([] #{}) ([& keys] (clojure.lang.PersistentHashSet/[color=red]createWithCheck[/color] keys))) nil user=> (source sorted-set) (defn sorted-set "Returns a new sorted set with supplied keys." {:added "1.0" :static true} ([& keys] (clojure.lang.PersistentTreeSet/[color=red]create[/color] keys))) nil
hash-set函数调用clojure.lang.PersistentHashSet类的createWithCheck方法(一般clojure里集合创建时,方法名称为createWithCheck的就表示创建时需要检查参数的合法性),而sorted-set函数调用clojure.lang.PersistentTreeSet的create方法(一般方法名称为create表示对参数不做检查)
5、sorted-set-by:
sorted-set-by方法根据比较函数,确定set的排序规则,如下:
user=> (sorted-set-by > 3 5 8 2 1) #{8 5 3 2 1} user=> (sorted-set-by < 3 5 8 2 1) #{1 2 3 5 8}
操作Set的常用函数:
1、conj:
根据给定的元素增加到第一个参数指向的set集合中,如下:
user=> (conj #{1 3} 1 5 7) #{1 3 5 7}
2、disj:
根据给定的元素,从第一个参数指向的set集合中删除匹配的元素,如下:
user=> (disj #{1 3 5 7} 3 7) #{1 5}
3、其它方式:
user=> (clojure.set/union #{1 2 3} #{1 2 4});合并子集 #{1 2 3 4} user=> (clojure.set/select even? #{1 2 3 4 5});根据条件选择 #{2 4} user=> (clojure.set/difference #{1 2 3} #{1 2 4});取差集 #{3} user=> (clojure.set/intersection #{1 2 3} #{1 2 4});取交集 #{1 2}