Map 和 Set 是一种专门用来进行搜索的容器或者数据结构,其搜索的效率与其具体的实例化子类有关。以前常见的搜索方式有:
1、直接遍历:时间复杂度O(N),元素如果比较多效率会非常慢
2、二分查找,时间复杂度O(log2 N),但搜索前必须要求序列是有序的
上述搜索比较适合静态类型的查找,即一般不会对区间进行插入和删除操作。
而现实中的查找比如:
1、根据姓名查询考试成绩
2、通讯录,即根据姓名查询联系方式
3、不重复集合,即需要先搜索关键字是否已在集合中
可能在查找时进行一些插入和删除的操作,即动态查找,那上述两种方式就不太适合了。
Map 和 Set 就是一种适合动态查找的集合容器。
一般把搜索的数据称为关键字(Key),和关键字对应的称为值(value),将其称之为 Key - Value的“键值对”,所以模型会有两种:1、纯key 模型 ,2、Key - Value 模型
1、有一个英文字典,快速查找一个单词是否在词典中
2、快速查找某个名字在不在通讯录中
1、 统计文件中每个单词的出现次数,统计结果是每个单词都有 与其对应的次数:<单词(Key),单词的出现次数(Value)>
2、梁山好汉的江湖绰号:每个好汉都有自己的江湖绰号(Key 及时雨,Value宋江)
Map 中存储的就是 Key - Value 的“键值对”,Set中只存储了Key。
Map 是一个接口类,该类没有继承自Collection,该类中存储的是
结构的“键值对”,并且K一定是唯一的,不能重复。
由于 HashM安排 和 TrreMap 没有特别大的区别。几乎是一样的功能。
所以,我们以讲解 HashMap 为主。
方法 | 解释 |
---|---|
V get(Object key) | 返回 key 对应的 value |
V getOrDefault(Object key, V defaultValue) | 返回 key 对应的 value,key 不存在,返回默认值 |
V put(K key, V value) | 设置 key 对应的 value |
V remove(Object key) | 删除 key 对应的映射关系 |
Set keySet() | 返回所有 key 的不重复集合 |
Collection values() | 返回所有 value 的可重复集合 |
Set |
返回所有的 key-value 映射关系 |
boolean containsKey(Object key) | 判断是否包含 key |
boolean containsValue(Object value) | 判断是否包含 value |
问题就来了!为什么 存入数据的顺序 和 打印数据的顺序 不一样?
这是因为 HashMap 在存储数据的时候,不是按照存储顺序来进行存储。而是根据一个函数来进行存储的。也就是说:具体存储到哪里?是有函数决定的。这个函数就是哈希函数。
所以才会导致 打印的顺序 和 存入的数据的顺序不一样。
但如果只是 Value 为空的话,就不会出现异常。(也就是说 在TreeMap 存储数据的时候,Key 不能为null)
至于为什么说 keySet方法 是返回不重复的集合。
是因为 Set 中 相同的数据只能存储一次。也就说Set里面存储的元素都是不同的。
这个在讲到Set的时候,你们就明白了。
而在 Map 中 存储 相同的元素,也有着自身的特点。
其 value 会根据最后一次的put的value值,进行更新。
1、Map 是一个接口,不能直接实例化对象,如果实例化对象只能实例化其实现类 TreeMap 和 HashMap。
2、Map中存储“键值对” 的 Key 是唯一的,value 是可重复的。
3、在 TreeMap 中插入“键值对”时,key不能为null,否则就会抛出【NullPointerException异常】,但是Value可以为null。【HashMap 就没有这个问题】
4、Map 中的 Key 可以全部分离出来,存储到 Set中来进行访问(因为 Key 是不能重复)。
5、Map 中的 Value 可以全部分离出来,存储在 Collection 的 任何一个子集合中(value可能有重复)。
6**、Map 中 “键值对” 的 Key 不能直接修改**,value可以修改,如果要修改 Key,只能先将Key删除掉,然后再来进行重新插入。
7、TreeMap 和 HashMap 的区别
Map 底层结构 | TreeMap | HashMap |
---|---|---|
底层结构 | 红黑树 | 哈希桶 |
插入/删除/查找时间复杂度 | O(log2 N) | O(1)【HashMap的效率非常高】 |
是否有序 | 关于 Key 有序【因为TreeMap 实现了 SortedMap接口,所以放入TreeMap 的数据是一定可以比较,即内部实现了 comparable接口】 | 无序 |
线程安全 | 不安全 | 不安全 |
插入./删除/查找区别 | Key必须能够比较,否则会抛出ClassCastException 异常 | 自定义类型需要覆写 equals 和 hashCode方法 |
应用场景 | 需要Key 有序场景下 | Key 是否有序不关心,需要更高的时间性能 |
Set 的官方文档
Set 和 Map 主要的不用有两点:Set 继承自 Collection的接口类,Set 中只存储了 Key。
而 Map 是一个单独的接口,Map 中 存储 Key - Value
另外,Set 又称集合【Set 的汉语意思就是 集合】,它具有去重的功能,相同的元素,它只存储一个。
方法 | 解释 |
---|---|
boolean add(E e) 添加元素 | 但重复元素不会被添加成功 |
void clear() | 清空集合 |
boolean contains(Object o) | 判断 o 是否在集合中 |
Iterator iterator() | 返回迭代器 |
boolean remove(Object o) | 删除集合中的 o |
int size() | 返回set中元素的个数 |
boolean isEmpty() | 检测set是否为空,空返回true,否则返回false |
Object[] toArray() | 将set中的元素转换为数组返回 |
boolean containsAll(Collection> c) | 集合c中的元素是否在set中全部存在,是返回true,否则返回false |
boolean addAll(Collection extendsE> c) | 将集合c中的元素添加到set中,可以达到去重的效果 |
可参考 List 接口相关知识 - ArrayList数据结构
1、Set 是继承自 Collection 的 接口类
2、Set 中 值存储了 Key,并且要求 Key 一定要唯一
3、Set 的底层是 使用 Map 来实现,其使用 Key 与 Object 的 一个默认对象作为 “键值对” 插入到Map中的
4、Set 最大的功能就是集合中的元素进行去重
5、 实现 Set 接口的常用类 有 TreeSet 和 HashSet,还有一个linkedHashSet,LinkedHashSet 是在 HashSet 的基础上 维护了一个双向链表来记录元素的插入次序。
6、Set 中 Key 不能修改,如果要修改,先将原来的删除掉,然后再重新插入。
7、Set 中不能插入 null 的 key
8、TreeSet 和 HashSet 的区别
Set底层结构 | TreeSet | HashSet |
---|---|---|
底层结构 | 红黑树 | 哈希桶 |
插入/删除/查找时间 | O(log2 N) | O(1) |
是否有序 | 关于Key有序 | 不一定有序 |
线程安全 | 不安全 | 不安全 |
插入/删除/查找区别 | 按照红黑树的特性来进行插入和删除 | 1. 先计算key哈希地址 2. 然后进行插入和删除 |
比较与覆写 | key必须能够比较,否则会抛出ClassCastException异常 | 自定义类型需要覆写equals和hashCode方法 |
应用场景 | 需要Key有序场景下 | Key是否有序不关心,需要更高的时间性能 |
将所有数据存储 HashSet 中,根据 Set 的 特性,我们明白 Set 具有去重的功能。
所以,我们不能一股脑全部将数据存入,需要作出判断。
思路:在存入数据的时候,去判断存入的数据,在Set 中 是否存在,如果存在,则将该数据删除。
不存在就存入。
【注意题干!最多就两个相同数据】
取出的时候,只需要遍历数组,通过 contains 方法,判断是否包含元素 Key。找到了就返回 Key。
如果没有找到那个只出现一次的 Key,就返回 -1。
class Solution {
public int singleNumber(int[] nums) {
Set<Integer> set = new HashSet<>();
for(int i : nums){
if(set.contains(i)){
set.remove(i);
}else{
set.add(i);
}
}
int result = 0;
for(int i : nums){
if( set.contains(i)){
result = i;
}
}
return result;
}
}
将数据全部存入 HashMap 中,并在存入的过程中判断该元素 在HashMap 中是否存在。
如果存在,说明它已经有一个了【value = 1】,即我们需要在此基础上加上1。反之,如果 HashMap中不存在该元素,返回的Value 为 null,此时就是第一次存入,将 对应 Key - Value 存入。
取出的时候,只需要遍历数组,通过 get 方法,返回其 Value 值,如果等于1,就返回 对应 Key。
如果没有找到那个只出现一次的 Key,就返回 -1。
class Solution {
public int singleNumber(int[] nums) {
Map<Integer,Integer> map = new HashMap<>();
for(int i : nums){
Integer count = map.get(i);
count = count == null ? 1 : ++count;
map.put(i, count);
}
for(int i : nums){
Integer count = map.get(i);
if(count == 1){
return i;
}
}
return -1;
}
}
利用异或的特性: 相同为零,相异为1。
而题目说: 数组中只有一个出现一次的元素,其它都是两次。也就是说 一旦进行异或,这些出现2次的元素最终异或的结果为 零,而 只出现一次的元素 与 零进行异或,其结果还是 只出现一次的元素。
所以,我们要做的就是将数组的所有元素进行异或,其结果就是 只出现一次的元素。
class Solution {
public int singleNumber(int[] nums) {
int result = nums[0];
for(int i = 1;i < nums.length;i++){
result ^= nums[i];
}
return result;
}
}
你们可以直接看我这篇博客复制带随机指针的链表 - Java - 迭代实现
class Solution {
public Node copyRandomList(Node head) {
Map<Node,Node> map = new HashMap<>();
Node tmp = head;
while(tmp != null){
Node node = new Node(tmp.val);
map.put(tmp,node);
tmp = tmp.next;
}
tmp = head;
while(tmp != null){
map.get(tmp).next = map.get(tmp.next);
map.get(tmp).random = map.get(tmp.random);
tmp = tmp.next;
}
return map.get(head);
}
}
利用HashSet的去重机制,去记录 jewels 字符串中的 “宝石类型”/ 字符。
至于为什么用HashSet:是因为我们不需要去记录每个类型宝石的对应的个数。
只需要去统计宝石的总个数。
后面,创建一个整形变量result去记录宝石的个数,只需要去 遍历stones字符串,利用 HashSet 的 contains 方法去判断 stones 字符串里的 字符 是在存在HashSet 中,如果存在就加一。最终返回累加结果。
// 时间复杂度:O(m+n),其中m是字符串jewels 的长度,n 是字符串stones 的长度。
// 空间复杂度:O(m),其中 m 是字符串jewels 的长度。使用哈希集合存储字符串jewels 中的字符个数。
class Solution {
public int numJewelsInStones(String jewels, String stones) {
Set<Character> set = new HashSet<>();
for(int i = 0;i < jewels.length();i++){
set.add(jewels.charAt(i));
}
int result = 0;
for(int i = 0;i < stones.length();i++){
if(set.contains(stones.charAt(i))){
result++;
}
}
return result;
}
}
双重循环:外层 遍历 jewels,内层遍历 stones。
思路:先定义一个整形变量 result ,每拿到一个 jewels的字符,就到 stones 去里看看有没有“符合条件的宝石”。
有 : result++。
最后返回累加的结果。
//时间复杂度:O(mn),其中 m 是字符串 jewels 的长度,n 是字符串stones 的长度。
// 空间复杂度:O(1)。只需要维护常量的额外空间
class Solution {
public int numJewelsInStones(String jewels, String stones) {
int result = 0;
for(int i = 0;i < jewels.length();i++){
char ch = jewels.charAt(i);
for(int j = 0;j < stones.length();j++){
if(stones.charAt(j) == ch){
result++;
}
}
}
return result;
}
}
import java.util.*;// 导包
public class Main{
public static void function(String strExpect,String strActtal){
Set<Character> setA = new HashSet<>();
// strActtal 先转大写,再转为数组
for(char ch : strActtal.toUpperCase().toCharArray()){
setA.add(ch);
}
Set<Character> setP = new HashSet<>();
// strExpect 先转大写,再转为数组
for(char ch : strExpect.toUpperCase().toCharArray()){
if(!setA.contains(ch) && !setP.contains(ch)){
System.out.print(ch);
setP.add(ch);
}
}
}
public static void main(String[] args){
// 循环输入
Scanner sc = new Scanner(System.in);
while(sc.hasNextLine()){
String strExpect = sc.nextLine();
String strActtal = sc.nextLine();
function(strExpect,strActtal);
}
sc.close();// 资源回收
}
}
看到上面框选的文字,我们脑中的第一个想法:这涉及到 TopK - 问题。
既然是TopK 问题,再加上题目要求返回的是 前k个出现次数最多额单词。
那么,我们就需要建立一个 小根堆。
但这不是难点,难点下面图所框选的。
下面我们就分析一下这两个条件。
下面,我们一个个来解决问题。 先来解决第一个问题:返回的答案应该按单词出现频率由高到低排序
import java.util.*;
public class Manuscript{
public static List<String> topKFrequent(String[] words, int k) {
// 1、 统计 每个单词的出现的次数 》》 map
HashMap<String,Integer> map = new HashMap<>();
for(String s : words){
if(map.get(s) == null){
map.put(s,1);
}else{
int val = map.get(s);
map.put(s,val+1);
}
}
// 第二步 建立一个 大小为 K 的小根堆。【Key - word,Value - 出现次数】
// 利用 entrySet 方法,将 Key - Value 结合。看作一个整体
PriorityQueue<Map.Entry<String,Integer>> minHeap = new PriorityQueue<>(k, new Comparator<Map.Entry<String, Integer>>() {
@Override
public int compare(Map.Entry<String, Integer> o1, Map.Entry<String, Integer> o2) {
return o1.getValue() - o2.getValue();
// 以 出现次数 大小 为比较规则。
}
});
// 遍历map,建堆。
for (Map.Entry<String,Integer> entry:map.entrySet()) {
// 先放入 K 个 元素。
if(minHeap.size() < k){
minHeap.offer(entry);
}else {
// 说明堆中 已经放满了 K 个元素,接下里需要看堆顶元素的数据 和 当前的数据的大小关系
Map.Entry<String,Integer> top = minHeap.peek();
//判断频率是否相同,如果相同,比较单词的大小,单词ASCII小 的 入队。
// 因为题目要求:如果不同的单词有相同出现频率, 按字典顺序 排序
// a ~ z ASCII码:97 ~ 122
if(entry.getValue().compareTo(top.getValue()) == 0 ){
if(top.getKey().compareTo(entry.getKey()) > 0){
minHeap.poll();
minHeap.offer(entry);
}
}else{
// 出现频率高:入堆。
if(entry.getValue().compareTo(top.getValue()) > 0){
minHeap.poll();
minHeap.offer(entry);
}
}
}
}
System.out.println(minHeap);
// 返回值类型 创建
List<String> ret = new ArrayList<>();
for(int i = 0;i < k;i++){
Map.Entry<String,Integer> top = minHeap.poll();
ret.add(top.getKey());
}
// 反转/ 逆置
Collections.reverse(ret);
return ret;
}
public static void main(String[] args) {
String[] worlds = {"the", "day", "is", "sunny", "the", "the", "the", "sunny", "is", "is"};
List<String> list = topKFrequent(worlds,4);
System.out.println(list);
}
}
但是,还没完。还有一个点没有解决 : 就是在前 K个出现次数最多的单词里,存在两个出现次数一样的不同单词。需要按照字母表顺序排序排列。
就比如,我们代入示例1的结果。
这个问题出在哪里呢?就在下图的代码位置
public class Manuscript{
public List<String> topKFrequent(String[] words, int k) {
// 1、 统计 每个单词的出现的次数 》》 map
HashMap<String,Integer> map = new HashMap<>();
for(String s : words){
if(map.get(s) == null){
map.put(s,1);
}else{
int val = map.get(s);
map.put(s,val+1);
}
}
// 第二步 建立一个 大小为 K 的小根堆。
PriorityQueue<Map.Entry<String,Integer>> minHeap = new PriorityQueue<>(k, new Comparator<Map.Entry<String, Integer>>() {
@Override
public int compare(Map.Entry<String, Integer> o1, Map.Entry<String, Integer> o2) {
if(o1.getValue().compareTo(o2.getValue()) == 0){
return o2.getKey().compareTo(o1.getKey());
}
return o1.getValue() - o2.getValue();
}
});
// 遍历map,建堆。
for (Map.Entry<String,Integer> entry:map.entrySet()) {
if(minHeap.size() < k){
minHeap.offer(entry);
}else {
// 说明堆中 已经放满了 K 个元素,需要看堆顶元素的数据 和 当前的数据的大小关系
Map.Entry<String,Integer> top = minHeap.peek();
//判断频率是否相同,如果相同,比较单词的大小,单词ASCII小 的 入队。
if(entry.getValue().compareTo(top.getValue()) == 0 ){
if(top.getKey().compareTo(entry.getKey()) > 0){
minHeap.poll();
minHeap.offer(entry);
}
}else{
if(entry.getValue().compareTo(top.getValue()) > 0){
minHeap.poll();
minHeap.offer(entry);
}
}
}
}
List<String> ret = new ArrayList<>();
for(int i = 0;i < k;i++){
Map.Entry<String,Integer> top = minHeap.poll();
ret.add(top.getKey());
}
Collections.reverse(ret);
return ret;
}
}