不得不说,阿里的面试给我的感觉和前两次完全不一样,普通面经过程中了解的东西是无法完成回答好面试官的问题的。我遇到的面试官问的问题很有技术含量,每个问题都是从一个当前现有的已有的场景出发,然后一步一步从表象问到原因,然后牵引到某个常考的面经问题上,然后再深层次的问这个情况的原理。所以大部分问题我答的都不是很好,所幸这位面试官人非常好,他在我答不出来的时候就会给我一个方向牵引,让我了解到该考虑什么,如果我能正确回答出来会得到表扬,回答不出来也会得到面试官再深一步的提示,直到他觉得我不可能回答出来或者放弃回答,就会认真的从最底层的实现给我讲一遍这个原理到底是什么样子的。面试经历了1个小时,前5分钟是面试官和我的自我介绍和彼此了解,然后面试大约持续了40分钟,先是十五分钟左右的项目问题,然后25分钟的面试问题。最后十分钟面试官指出了我的不足并告诉我应该如何进行下一步的学习,感觉这次面试帮助很大。
1.面试官进行了自我介绍,介绍了团队的主要工作,讲了组织的架构,说明了他们需要提供高性能,高稳定,高并发的服务
2.自己的个人介绍,没有突出重点,内容较少项目描述应突出技术用了哪些而不是逻辑结构
3.项目介绍,按照这几次面试来看一般只会介绍一个项目,应该认真准备其中一个,了解的十分深入,其他项目就了解大体框架结构就足够了。介绍某个项目应从功能是什么,你在里面负责了什么模块的功能的开发工作,你是怎么设计这块功能的,在开发过程中遇到了什么样的问题,你是怎么解决它的,可以提出没有解决的较为困难的部分,比如在极高并发下出现了什么问题,你们尝试过如何解决,为什么没有成功,现在暂时怎么处理的,需提前按照这个模板准备项目介绍
4.对自己模块的了解要从数据库表的设计,为什么这样设计,凡是相关联的表都应该记下来,相似的东西数据库能不能进行抽象来把数据库表合并(前瞻性,能想到业务的扩展怎么处理)
5.问题:hygl项目能不能将产品进行一个抽象,不管是对于酒店,门票,机票,接送服务,都能用一套抽象的模板去解决,淘宝产品种类十分繁多,那么它应该是怎么实现这个产品摸板的,不然淘宝的数据库产品表会多得要死。那么每个产品数据不同部分,应该是需要其他的方法来标识的,比如机票有始发地目的地座位号,酒店有床型平米,不同产品个性化的部分如何抽象出一个概念模型呢?
6.你刚才说了你项目中用了spring,hibernate,那么能说一说spring是如何进行IOC控制反转的吗(它是怎么实现的)?—实际上问的是spring bean 的加载过程,比如配置一个xml文件的时候配置了很多bean在上面,spring是怎么读xml文件,把他们放到IOC容器中组装起来的
在我看到的一个比较易于理解的图中,传统的对象调用是如下过程
而使用了控制反转的spring是如下过程,使得客户端类不需要去考虑用户类是什么样的,只需要和容器要就可以了。
下面就某大佬写一个Ioc DI的程序来分析一下。Spring就相当于一个Bean工厂,你写好自己的bean,输入配置文件,Spring就可以帮你自动生成bean对象。下面我们创建一个java工程SimulateIoc 我们先写两个Bean。内容都一样,只是类名不一样。定义一个Spring配置文件,我们起名字叫IocConfig.xml。下面我们来看一下TestIoc.Java文件。看一下运行结果:
通过这个文件我们可以看出,我们先创建了一个BeanFactory工厂,然后通过getBean方法获得指定的Bean对象。是不是很神奇,只要通过不同的名字,我们就可以获得我们想要的对象。BeanFactory里面到底做了什么那?这就是整个BeanFactory实现了。里面很多都是处理xml的部分,我们主要看下面两个的地方。
Class bean = Class.forName(cls.getText());
Object obj = bean.newInstance();
Class.forName获得指定类的类名。newInstance()获得指定类的对象。
Method entryPoint = bean.getMethod(attributename, String.class);
entryPoint.invoke(obj,value);
getMethod获得指定方法的方法调用入口。然后调用invoke就会执行方法。
那么下面我们来学习IOC的实现原理,也就是bean的加载机制
1. 整个bean加载的过程步骤相对繁琐,下面我先整理一下spring代码的调用过程
factory.getBean() //这个是位于AbstractBeanFactory的抽象类中,这个类调用了doGetBean()方法
doGetBean() //该方法用于完成bean的加载 调用了getSingleton(beanName)方法,createBean()方法
getSingleton() //Spring中使用getSingleton重载来实现bean的加载过程
createBean() //该方法在AbstractAutowireCapableBeanFactory类中,调用了doCreateBean方法
doCreateBean() //调用了createBeanInstance(),populateBean(),initializeBean()方法
所以整个调用是如下结构
getBean{
doGetBean{
getSingleton{}
createBean{
doCreateBean{
createBeanInstance{}
populateBean{}
initializeBean{}
}
}
}
}
下面细说一下每个函数的功能
getSingleton 重载了两个方法,先要尝试从缓存中加载,再次就是从singletonFactories中加载如果上面缓存中不存在已经加载的单例bean就要重新开始bean的加载过程了,Spring中使用getSingleton重载方法实现bean的加载过程。
从**createBean()**方法源码可以看出主要做了以下操作:
从**docreateBean()**方法源码可以看出主要做了以下操作:
在populateBean方法的中的主要处理流程:(处理属性填充)
initializeBean() :
bean配置时有一个init-method属性,这个属性的作用是在bean实例化前调用init-method指定的方法进行需要的实例化操作,现在就进入这个方法了;Spring中程序已经执行过bean的实例化,并且进行了属性的填充,而就在这时将会调用用户设定的初始化方法。
2. 所以综上所述,我们来整理一下bean的加载过程
1) 转换beanName
要知道平时开发中传入的参数name可能只是别名,也可能是FactoryBean,所以需要进行解析转换,一般会进行以下解析:
(1)消除修饰符,比如name="&test",会去除&使name=“test”;
(2)取alias表示的最后的beanName,比如别名test01指向名称为test02的bean则返回test02。
2) 从缓存中加载实例
实例在Spring的同一个容器中只会被创建一次,后面再想获取该bean时,就会尝试从缓存中获取;如果获取不到的话再从singletonFactories中加载。
3) 实例化bean
缓存中记录的bean一般只是最原始的bean状态,这时就需要对bean进行实例化。如果得到的是bean的原始状态,但又要对bean进行处理,这时真正需要的是工厂bean中定义的factory-method方法中返回的bean,上面源码中的getObjectForBeanInstance就是来完成这个工作的。
4) 检测parentBeanFacotory
从源码可以看出如果缓存中没有数据会转到父类工厂去加载,源码中的!containsBeanDefinition(beanName)就是检测如果当前加载的xml配置文件中不包含beanName所对应的配置,就只能到parentBeanFacotory去尝试加载bean。
5) 存储XML配置文件的GernericBeanDefinition转换成RootBeanDefinition
之前的文章介绍过XML配置文件中读取到的bean信息是存储在GernericBeanDefinition中的,但Bean的后续处理是针对于RootBeanDefinition的,所以需要转换后才能进行后续操作。
6) 初始化依赖的bean
这里应该比较好理解,就是bean中可能依赖了其他bean属性,在初始化bean之前会先初始化这个bean所依赖的bean属性。
7) 创建bean
Spring容器根据不同scope创建bean实例。
7.那么除了bean的加载机制,你对java中ClassLoader的加载机制有什么了解嘛
如果一个类加载器收到了类加载请求,它并不会自己先去加载,而是把这个请求委托给父类的加载器去执行,如果父类加载器还存在其父类加载器,则进一步向上委托,依次递归,请求最终将到达顶层的启动类加载器,如果父类加载器可以完成类加载任务,就成功返回,倘若父类加载器无法完成此加载任务,子加载器才会尝试自己去加载,这就是双亲委派模式
8.那么如果我写了一个类String,然后包也故意写成java.lang.String,那么加载类的时候加载的是我写的还是自己写的那个
加载原有的,因为加载的时候委派给父亲,然后父亲加载了已有的string,然后自己发现string被加载了就不加载了。
9.java的hashmap的jdk1.8是怎么优化的
就是链表变成红黑树
10.java的currenthashmap的jdk1.8是怎么优化的
在Java7中,ConcurrentHashMap由Segment数组结构和HashEntry数组组成。Segment是一种可重入锁,是一种数组和链表的结构,一个Segment中包含一个HashEntry数组,每个HashEntry又是一个链表结构。正是通过Segment分段锁,ConcurrentHashMap实现了高效率的并发。
在Java8中,ConcurrentHashMap去除了Segment分段锁的数据结构,主要是基于CAS操作保证保证数据的获取以及使用synchronized关键字对相应数据段加锁实现了主要功能,这进一步提高了并发性。同时同时为了提高哈希碰撞下的寻址性能,Java 8在链表长度超过一定阈值(8)时将链表(寻址时间复杂度为O(N))转换为红黑树(寻址时间复杂度为O(long(N)))。
11.有了解过Link的Hashmap吗,如果了解过给我说说它的应用场景
LinkHashMap详解
大多数情况下,只要不涉及线程安全问题,Map基本都可以使用HashMap,不过HashMap有一个问题,就是迭代HashMap的顺序并不是HashMap放置的顺序,也就是无序。HashMap的这一缺点往往会带来困扰,因为有些场景,我们期待一个有序的Map。
这个时候,就需要LinkedHashMap就闪亮登场了,它虽然增加了时间和空间上的开销,但是通过维护一个运行于所有条目的双向链表,LinkedHashMap保证了元素迭代的顺序。
12.红黑树和二叉查找树有什么区别,和AVL树有什么区别,为什么选择了使用红黑树实现hashmap
二叉查找树:对于某些情况,二叉查找树会退化成一个有n个节点的线性链,不够稳定
AVL:由于维护高度平衡所付出的代价比从中获得的效率收益还大,故而实际的应用不多,更多的地方是用追求局部而不是非常严格整体平衡的红黑树.当然,如果应用场景中对插入删除不频繁,只是对查找要求较高,那么AVL还是较优于红黑树.比如Windows NT内核
红黑树:稳定,不过分追求平衡,适合插入删除查找
13.讲述一下红黑树的插入
1)如果插入的节点是根节点,也就是说初始的红黑树为空,这是最简单的情况,直接将该节点标识成黑色即可。
2) 如果新插入的节点不是红黑树的根节点,如果新插入的节点的父节点是黑色的话,那么红黑树是不需要调整的
3)如果新插入的节点的父节点是红色,叔叔节点是红色的话,我们仅仅需要将祖父节点改成红色,同时将父节点和叔叔节点改成黑色即可,然后递归的形式来对祖父节点之上的节点进行调整,如果调整到把根节点变红则直接把根节点再变回黑,如果遇到红父黑叔,则用方法4进行 。
4)如果新插入的节点的父节点是红色,叔叔节点是黑色的话,就要进行旋转了。
14.mysql的两种数据库引擎是什么,有什么区别
MyIsam与InnoDB主要有以下4点大的区别,缓存机制,事物支持,锁定实现,数据物理存储方式(包括索引和数据)。
1. 缓存机制
myisam 仅仅缓存索引,不会缓存实际数据信息,他会将这一工作交给OS级别的文件系统缓存。所以mysiam缓存优化工作集中在索引缓存优化上。
InnoDB 有自己的缓存(buffer pool),不仅仅缓存索引,还缓存表数据。
(由于myisam不会缓存表数据文件(.MYD),每次读取数据文件都需要调用文件系统的相关指令从磁盘上读取物理文件。所以每次读取数据文件所需的内存缓冲区的设置就对数据文件的访问性能非常重要。mysql提供了以下两种读取数据文件缓冲区,Sequential Scan方式(如全表扫描)Random Scan(如通过索引扫描),这两个缓冲区不是某个存储引擎特有的,都是线程独享,每个线程在需要的时候都会创建一个(或者两个)系统中设置设置大小的缓冲区。)
2. 事物支持
myisam 不支持事物。
InnoDB 支持事物,也支持主外键。
3. 锁定实现
myisam 锁定是由mysql服务控制,只支持表级锁。
innoDB 锁定交由InnoDB存储引擎,支持行级锁,页级锁等粒度更小的锁定级别。由于锁定级别的差异,在更新并行度上InnoDB会比myisam好很多
4. 数据物理存储方式(包括索引和数据)。
1)文件存放方式
myisam 每个表有三个文件,.frm 存放表结构数据.MYI 存放索引信息.MYD存放表数据
innodb 存储数据有.FRM存放表定义,.ibd(独享表空间),.ibdata(共享表空间).innodb存储数据分独立表空间和共享表空间(具体使用哪个由innodb_file_per_table变量确定),独享表空间存储方式使用“.ibd”文件来存放数据,且每个表一个“.ibd”文件,文件存放在和MyISAM 数据相同的位置,由datadir确定。如果选用共享存储表空间来存放数据,则会使用ibdata 文件来存放,所有表共同使用一个(或者多个,可自行配置)ibdata 文件。ibdata 文件可以通过innodb_data_home_dir 和innodb_data_file_path
两个参数共同配置组成, innodb_data_home_dir 配置数据存放的总目录。
2)表数据物理存放方式
myisam 表数据存放在.MYD文件里,没有使用页来存储数据,也没有表空间的概念。myisam没有聚集索引。myisam有三种存储格式:静态格式,动态格式,压缩格式。
InnoDB 将所有数据存放在数据页中(page),一般情况下非压缩页大小16K。InnoDB的数据文件本身要按主键聚集,所以InnoDB要求表必须有主键(MyISAM可以没有),如果没有显式指定,则MySQL系统会自动选择一个可以唯一标识数据记录的列作为主键,如果不存在这种列,则MySQL自动为InnoDB表生成一个隐含字段作为主键,这个字段长度为6个字节,类型为长整形。innod有共享表空间和独享表空间之分,由innodb_file_per_table参数控制。
3)索引数据存储方式
MyIsam 索引文件和数据文件是分离的,索引文件仅保存数据记录的地址。主索引和辅助索引没有区别都是非聚集索引。索引页正常大小为1024字节,索引页存放在.MYI 文件中。InnoDB 引擎使用B+Tree作为索引结构,叶节点的data域存放的是数据记录的地址。
15.我现在有一张表有ABCDEFG七个字段,那么我在搜索这张表的时候,比如我要进行分页查询应该怎么办
SELECT * FROM 某表 WHERE 条件 LIMIT 从第m条数据开始,筛选n条数据出来;
16.在limit m n的时候,如果m特别大而n不是很大的时候,查询效率会有变化的,那么如何优化呢
该语句存在的最大问题在于limit M,N中偏移量M太大,我们下一次的查询从前一次查询结束后标记的位置开始查找,找到满足条件的100条记录,并记下下一次查询应该开始的位置,以便于下一次查询能直接从该位置 开始,这样就不必每次查询都先从整个表中先找到满足条件的前M条记录,舍弃,在从M+1开始再找到100条满足条件的记录了。所以我们使用主键来完成标记。
SELECT * FROM 某表 WHERE 条件 LIMIT 从第m条数据开始,筛选n条数据出来;
处理查询效率低的原因
17.如果我的查询条件是where A=?and B = ? and C = ?,你觉得要提高查找效率应该怎么做呢,那么如果我要做分页呢,这个里面没有id字段哦
建立一个 A B C的组合索引,将A当做聚集的字段完成limit的设置
18. 那如果我把这个abc组合索引建好了,我把查询条件改成了C = ?and B = ? and A = ?,索引会工作吗 ,改成了B = ?and C = ?
索引的最左前缀和和B+Tree中的“最左前缀原理”有关,举例来说就是如果设置了组合索引
根据最左前缀原则,我们一般把排序分组频率最高的列放在最左边
19.那么索引的数据结构是什么呢,尝试从B+树的角度讲一下上面问题的原因
B+Tree索引
B+Tree中的非叶子结点不存储数据,只存储键值;
B+Tree的叶子结点没有指针,所有键值都会出现在叶子结点上,且key存储的键值对应的数据的物理地址;
下面就是一张联合索引的表
也就是说,联合索引(col1, col2, col3)也是一棵B+树,他的比较器是先比col1,然后比col2,最后比col3,如果没有col1比较器无法生效,就没有办法查下去。
B+树讲索引
索引相关知识
20.你自己有什么喜好吗,玩过什么东西吗,比如自己做个无线端开发啊,写过一个小app啊,实现了一个小游戏啊,做过一个爬虫啊
21.你在学习或做项目的过程中,遇到问题是怎么寻求帮助呢,找到问以后是怎么记录下来的
22.你有没有比如说经常泡的技术论坛,尝尝看看前沿的技术资料
面试官建议:在学习过程中呢,我们在探究问题的时候,往往要知其然而知其所以然,所以我们学索引的时候,我们会讨论到B+树,讨论hashmap的时候,会和你讨论红黑树,所以在平时你用到的很多东西,都是有他原本的数据结构知识在里面的,比如kafaka是如何利用寄存器缓存内存缓存来提高读取效率的和patition分区来实现消息有序性的,其实我们常说的设计模式,只是一些前人的设计常用场景,我们要学习这些面向对象的设计原则,把这些东西学习到自己的脑海里,从中提炼出自己的设计模式,在脱离了设计模式的框架以后,用这个思想来实现自己的东西,把学习的东西活学活用。
博文参考:
Java Spring的Ioc控制反转Java反射原理
bean加载机制的源码层分析
红黑树的插入