框架——集合

1、arraylist和linkedList的区别

ArrayListLinkedList的大致区别如下:
1.ArrayList是实现了基于动态数组的数据结构,LinkedList基于链表的数据结构。 
2.对于随机访问getsetArrayList觉得优于LinkedList,因为LinkedList要移动指针。 
3.对于新增和删除操作addremoveLinedList比较占优势,因为ArrayList要移动数据。 

ArrayList继承AbstractList类,并且实现了List,RandomAccess,Clonable,Serializable四个接口
然后LinkedList继承AbstractSequentialList类,并且实现了List,Deque,Clonable,Serializable四个接口

 

Arraylist怎么实现扩容

根据新的容量创建一个新的数组,再根据System.arrayCopy()方法进行数组的复制

2、hashmap、hashtable、concurrentHashmap

HashTable

  • 底层数组+链表实现,无论key还是value不能为null,线程安全,实现线程安全的方式是在修改数据时锁住整个HashTable,效率低,ConcurrentHashMap做了相关优化
  • 初始size11,扩容:newsize = olesize*2+1
  • 计算index的方法:index = (hash & 0x7FFFFFFF) % tab.length

HashMap

  • 底层数组+链表实现,可以存储null键和null,线程不安全
  • 初始size16,扩容:newsize = oldsize*2size一定为2n次幂
  • 扩容针对整个Map,每次扩容时,原来数组中的元素依次重新计算存放位置,并重新插入
  • 插入元素后才判断该不该扩容,有可能无效扩容(插入后如果扩容,如果没有再次插入,就会产生无效扩容)
  • Map中元素总数超过Entry数组的75%,触发扩容操作,为了减少链表长度,元素分配更均匀
  • 计算index方法:index = hash & (tab.length – 1)

 

HashMap的初始值还要考虑加载因子:

  •  哈希冲突:若干Key的哈希值按数组大小取模后,如果落在同一个数组下标上,将组成一条Entry链,对Key的查找需要遍历Entry链上的每个元素执行equals()比较。
  • 加载因子:为了降低哈希冲突的概率,默认当HashMap中的键值对达到数组大小的75%时,即会触发扩容。因此,如果预估容量是100,即需要设定100/0.75134的数组大小。
  • 空间换时间:如果希望加快Key查找的时间,还可以进一步降低加载因子,加大初始大小,以降低哈希冲突的概率。

HashMapHashtable都是用hash算法来决定其元素的存储,因此HashMapHashtablehash表包含如下属性:

  • 容量(capacity):hash表中桶的数量
  • 初始化容量(initial capacity):创建hash表时桶的数量,HashMap允许在构造器中指定初始化容量
  • 尺寸(size):当前hash表中记录的数量
  • 负载因子(load factor):负载因子等于“size/capacity”。负载因子为0,表示空的hash表,0.5表示半满的散列表,依此类推。轻负载的散列表具有冲突少、适宜插入与查询的特点(但是使用Iterator迭代元素时比较慢)

除此之外,hash表里还有一个负载极限负载极限是一个01的数值,负载极限决定了hash表的最大填满程度。当hash表中的负载因子达到指定的负载极限时,hash表会自动成倍地增加容量(桶的数量),并将原有的对象重新分配,放入新的桶内,这称为rehashing

HashMapHashtable的构造器允许指定一个负载极限,HashMapHashtable默认的负载极限0.75,这表明当该hash表的3/4已经被填满时,hash表会发生rehashing

负载极限的默认值(0.75)是时间和空间成本上的一种折中:

  • 较高的负载极限可以降低hash表所占用的内存空间,但会增加查询数据的时间开销,而查询是最频繁的操作(HashMapget()put()方法都要用到查询)
  • 较低的负载极限会提高查询数据的性能,但会增加hash表所占用的内存开销

程序猿可以根据实际情况来调整负载极限值。

HashtableHashMap另一个区别是HashMap的迭代器(Iterator)是fail-fast迭代器,而Hashtableenumerator迭代器不是fail-fast的。所以当有其它线程改变了HashMap的结构(增加或者移除元素),将会抛出ConcurrentModificationException,但迭代器本身的remove()方法移除元素则不会抛出ConcurrentModificationException异常

ConcurrentHashMap

  • 底层采用分段的数组+链表实现,线程安全
  • 通过把整个Map分为NSegment,可以提供相同的线程安全,但是效率提升N倍,默认提升16倍。(读操作不加锁,由于HashEntryvalue变量是 volatile的,也能保证读取到最新的值。)
  • Hashtablesynchronized是针对整张Hash表的,即每次锁住整张表让线程独占,ConcurrentHashMap允许多个修改操作并发进行,其关键在于使用了锁分离技术
  • 有些方法需要跨段,比如size()containsValue(),它们可能需要锁定整个表而而不仅仅是某个段,这需要按顺序锁定所有段,操作完毕后,又按顺序释放所有段的锁
  • 扩容:段内扩容(段内元素超过该段对应Entry数组长度的75%触发扩容,不会对整个Map进行扩容),插入前检测需不需要扩容,有效避免无效扩容

ConcurrentHashMap默认将hash表分为16个桶,诸如getputremove等常用操作只锁住当前需要用到的桶。这样,原来只能一个线程进入,现在却能同时有16个写线程执行,并发性能的提升是显而易见的。

3、CAS算法的原理

1、什么是CAS

 

CASCompare and Swap,即比较再交换。

 

jdk5增加了并发包java.util.concurrent.*,其下面的类使用CAS算法实现了区别于synchronouse同步锁的一种乐观锁。JDK 5之前Java语言是靠synchronized关键字保证同步的,这是一种独占锁,也是是悲观锁。

 

2CAS算法理解

        

CAS的理解,CAS是一种无锁算法,CAS3个操作数,内存值V,旧的预期值A,要修改的新值B。当且仅当预期值A和内存值V相同时,将内存值V修改为B,否则什么都不做。


 

CAS比较与交换的伪代码可以表示为:

do{   
      
备份旧数据;  
      
基于旧数据构造新数据;  
}while(!CAS(
内存地址,备份的旧数据,新数据 ))  

 

4CAS算法在JDK中的应用


 

在原子类变量中,如java.util.concurrent.atomic中的AtomicXXX,都使用了这些底层的JVM支持为数字类型的引用类型提供一种高效的CAS操作,而在java.util.concurrent中的大多数类在实现时都直接或间接的使用了这些原子变量类。

Java 1.7AtomicInteger.incrementAndGet()的实现源码为:

https://img-blog.csdn.net/20180429193554836?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L21vYWt1bg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70

https://img-blog.csdn.net/20180429193559962?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L21vYWt1bg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70

由此可见,AtomicInteger.incrementAndGet的实现用了乐观锁技术,调用了类sun.misc.Unsafe库里面的 CAS算法,用CPU指令来实现无锁自增。所以,AtomicInteger.incrementAndGet的自增比用synchronized的锁效率倍增。

 

4、volitate关键词

作用:volatile关键字的作用是:使变量在多个线程间可见(具有可见性),但是仅靠volatile是不能保证线程的安全性,volatile关键字不具备synchronized关键字的原子性。

当多个线程之间需要根据某个条件确定 哪个线程可以执行时,要确保这个条件在 线程之间是可见的。因此,可以用volatile修饰。

volatile synchronized 的比较:

volatile轻量级,只能修饰变量。synchronized重量级,还可修饰方法

volatile只能保证数据的可见性,不能用来同步,因为多个线程并发访问volatile修饰的变量不会阻塞。

synchronized不仅保证可见性,而且还保证原子性,因为,只有获得了锁的线程才能进入临界区,从而保证临界区中的所有语句都全部执行。多个线程争抢synchronized锁对象时,会出现阻塞。

 

线程安全性包括两个方面,可见性。原子性。

从上面自增的例子中可以看出:仅仅使用volatile并不能保证线程安全性。而synchronized则可实现线程的安全性。

 

5、arraylist怎么进行深拷贝

浅拷贝和深拷贝的区别:

浅拷贝:被复制对象的任何变量都含有和原来的对象相同的值,而任何的对其他对象的引用仍然指向原来的对象。对拷贝后的引用的修改,还能影响原来的对象。

深拷贝:把要复制的对象所引用的对象都复制了一遍,对现在对象的修改不会影响原有的对象。

深拷贝的方法

1.使用序列化方法

public static List deepCopy(List src) throws IOException, ClassNotFoundException { 

    ByteArrayOutputStream byteOut = new ByteArrayOutputStream(); 

    ObjectOutputStream out = new ObjectOutputStream(byteOut); 

    out.writeObject(src); 

 

    ByteArrayInputStream byteIn = new ByteArrayInputStream(byteOut.toByteArray()); 

    ObjectInputStream in = new ObjectInputStream(byteIn); 

    @SuppressWarnings("unchecked") 

    List dest = (List) in.readObject(); 

    return dest; 

 

List destList=deepCopy(srcList);  //调用该方法

 

2.clone方法

public class A implements Cloneable {  

    public String name[];  

 

    public A(){  

        name=new String[2];  

    }  

 

    public Object clone() {  

        A o = null;  

        try {  

            o = (A) super.clone();  

        } catch (CloneNotSupportedException e) {  

            e.printStackTrace();  

        }  

        return o;  

    }  

for(int i=0;i

copy.add((A)src.get(i).clone());

}

Java对对象和基本的数据类型的处理是不一样的。在Java中用对象的作为入口参数的传递则缺省为”引用传递”,也就是说仅仅传递了对象的一个”引用”,这个”引用”的概念同C语言中的指针引用是一样的。当函数体内部对输入变量改变时,实质上就是在对这个对象的直接操作。 除了在函数传值的时候是”引用传递”,在任何用”=”向对象变量赋值的时候都是”引用传递”。

在浅复制的情况下,源数据被修改破坏之后,使用相同引用指向该数据的目标集合中的对应元素也就发生了相同的变化。因此,在需求要求必须深复制的情况下,要是使用上面提到的方法,请确保List中的T类对象是不易被外部修改和破坏的。

 

6、红黑树原理

红黑树和平衡二叉树的主要区别如下:

平衡二叉树(AVL)树是严格的平衡二叉树,平衡条件必须满足(所有节点的左右子树高度差不超过1)。不管我们是执行插入还是删除操作,只要不满足上面的条件,就要通过旋转来保持平衡,而旋转非常耗时的。所以平衡二叉树(AVL)适合用于插入与删除次数比较少,但查找多的情况。

框架——集合_第1张图片

红黑树在二叉查找树的基础上增加了着色和相关的性质使得红黑树相对平衡,从而保证了红黑树的查找、插入、删除的时间复杂度最坏为O(log n)。所以红黑树适用于搜索,插入,删除操作较多的情况。

红黑树的原理参照treemap的实现原理

新增或删除节点后会进行左旋、右旋、着色操作。

你可能感兴趣的:(面试题,框架,集合)