1、理论基础知识
· JAVA基础
· 通用问题
· 开放式问题
· 设计模式相关问题
· 代码设计相关问题
· 语言相关问题
· Web相关问题
· 数据库相关问题
· 非关系型数据库相关问题
· 代码版本管理相关问题
· 并发问题
· 分布式系统相关问题
· 软件生命周期和团队管理相关问题
· 逻辑和算法相关问题
· 软件架构相关问题
· 面向服务架构(SOA)和微服务(Microservice)相关问题
· 安全相关问题
· 比尔盖茨式问题
· 代码示例问题
[↑] Java基础知识:
三家公司都问了java集合类的相关概念,各种集合结构之间内在区别:
ArrayList,Vector,LinkList区别
HashMap,HashTable,ConCurrentHashMap区别
Collections.synchronizedXX 方法的原理
设计模式,这种问题感觉没啥意义,工作中用哪个模式还是靠感觉和经验
Java某些原理:RPC,注解,反射,内存,GC,其中Java内存模型和GC过程几乎必问,通常也比较深入,有时候甚至会跳到其他语言的内存机制上,JVM参数以及相关调优,不过还遇到要求JVM调优经验的(-。-)
Java多线程:对多线程包java.util.concurrent的了解,多线程设计模式Future,ThreadLocal使用及原理,多线程协同demo(纸上代码)
Java新技术:NIO,Java 8、9,如果对这方面很熟悉,能够给人一种geek范,也许会有加分(如果之前基础知识不好就变成自黑了)
数据库知识:
SQL语句的书写,由于某些支付公司采用oracle数据库,所以对这个数据库最好有一定的了解。
数据库基础知识,join操作,数据库锁,数据库事物特性ACID
NOSQL,memcache,redis区别,使用时数据一致性的解决,负载均衡
数据库索引,索引的添加修改对性能有何影响,其内在数据结构,联合查询的索引使用,为了配合索引sql语句书写规范。
数据库锁,悲观锁乐观锁,锁的粒度以及相应SQL语句,锁隔离界别
企业开发相关框架
这部分各个公司通常都会考察spring-AOP/IOC,然后考察在工作中的使用,这部分是我的弱点,因为实在是没用过。
Tomcat性能调优,相关参数
Nginx,负载均衡
Memcache 一致性Hash
Zookeeper master/slave协同
SSH使用,MyBatis使用,基本框架与原理
·
[↑] 通用问题:
· 语言设计中空引用(null reference)的存在有什么问题?假设你想要将空引用的概念从你的首选语言中移除,可能导致什么结果?
· 为什么函数式编程重要?什么时候适用函数式语言?
· 设计(design)、架构(architecture)、功能(functionality)和美学(aesthetic)之间有什么区别?讨论一下。
· 微软、谷歌、欧朋(opera)和火狐这类公司是如何从他们的浏览器中获利的?
· 为什么打开TCP套接字有很大的开销?
· 封装的重要性体现在哪儿?
· 什么是实时系统?它与普通系统有什么区别?
· 实时语言(real-time language)和堆内存分配(heap memory allocation)之间的关系是什么?
· 不变性(Immutability)是指: (变量的)值只能在创建的时候被设置一次,之后就不能被改变。为什么不变性对写更加安全的代码有帮助?
· 可变值(mutable values)和不可变值(immutable values)有哪些优缺点?
· 什么是O/R阻抗失衡(Object-Relational impedence mismatch)?
· 如果你需要使用缓存,你使用哪些原则来确定缓存的大小?
· TCP和HTTP有什么区别?
· 在客户端渲染(client-side rendering)和服务端渲染(server-side rendering)之间,你是如何权衡的?
· 如何在一个不可靠的协议之上构建一个可靠的通信协议?
[↑] 开放式问题:
· 为什么人们会抵制变化?
· 如何向你的祖母解释什么是线程?
· 作为一个软件工程师,你想要既要有创新力,又要产出具有可预测性。采用什么策略才能使这两个目标可以共存呢?
· 什么是好的代码?
· 解释什么是流(Streaming)和如何实现一个流?
· 假设你的公司给你一周的时间,用来改善你和同事的生活: 你将如何使用这一周?
· 本周你学了什么?
· 所有的设计中都会有美学元素(aesthetic element)的存在。问题是,你认为美学元素是你的朋友还是敌人?
· 列出最近你读过的5本书。
· 假设目前有个大型公司(非常有钱),他们的开发流程是瀑布式流程(Waterfall),如果需要你在他们公司引入持续交付(Continue Devivery),你会怎么做?
· 我们来谈谈"重复造轮子","非我发明症", "吃自己做出来的狗粮"的这些做法吧。
(注: 重复造轮子: Reinventing the wheel; 非我发明症:Not Invented Here Syndrome; 吃自己做出来的狗粮: Eating Your Own Dog Food)
· 在你当前的工作流中,什么事情是你计划下一步需要自动化的?
· 为什么写软件是困难的?是什么使软件的维护变得困难?
· 你更喜欢在全新项目(Green Field Project)上工作还是在已有项目(Brown Field Project)基础上工作?为什么?
· 当你在浏览器地址栏输入google.com回车之后都发生了什么?
· 当操作系统CPU处于空闲的时候,它可能在处理哪些事情?
· 如何向一个5岁的孩子解释什么是Unicode/数据库事务?
· 如何维护单体架构(monolithic architecture)?
· 一个"专业的开发者"意味着什么?
· 软件开发是艺术、是技艺还是工程?你的观点是什么?
· "喜欢这个的人也喜欢...",如何在一个电子商务商店里实现这种功能?
· 为什么在创新上,企业会比创业公司慢些?
· 为什么说,你不应该尝试应用自己发明或者设计的密码学?
[↑] 设计模式相关问题:
· 请用一个例子表明,全局对象是邪恶的存在。
· 假设你工作的系统不支持事务性,你会如何从头开始实现它?
· 什么是好莱坞原则(Hollywood Principles)?
· 关于迪米特法则(最少知识原则): 写一段代码违反它, 然后修复它。
(注: 迪米特法则:the Law of Demeter, 最少知识原则: the Principle of Least Knowledge)
· Active-Record模式有什么限制和缺陷?
· Data-Mapper模式和Active-Record模式有什么区别?
· 空对象模式(Null Object Pattern)的目的是什么?
· 为什么组合(Composition)比继承(Inheritance)更好?
· 什么是反腐败层(Anti-corruption Layer)?
· 你可以写一个线程安全的单例(Singleton)类吗?
· 数据抽象(Data Abstraction)能力是指能改变实现而不影响客户端的这种能力。请构造一个一个例子,违反这个特性,并且尝试修复它。
· 你是如何处理依赖关系地狱(Dependency Hell)的?
· 为什么说goto语句是恶魔般的存在?
· 健壮性是进行软件设计时的一个通用原则,它建议 “发送时要保守,接收时要开放”。这也经常被写成,“做一个有耐心的读者,做一个谨慎的作者”。你能解释一些这背后的逻辑吗?
译者注: "发送时要保守,接收时要开发"的原文是: "Be conservative in what you send, be liberal in what you accept",有点类似于“严于律己,宽于待人”的意味。
[↑] 代码设计相关问题:
· 你在进行软件设计时会考虑软件测试吗?软件测试是如何影响软件设计的?
· 内聚和耦合的区别是什么?
· 重构在哪些场景下有用?
· 代码中的注释有用吗?
· 设计和架构有什么区别?
· 为什么在测试驱动开发(TDD)中是先写测试,再写代码?
· C++支持多继承,Java允许类实现多个接口。这些特性对正交性有什么影响?使用多继承和使用多接口有区别吗?[这个问题来自Andrew .Hunt 和 David Thomas写的《程序员修炼之道》]
· 在存储过程(Stored Procedures)中写业务逻辑有什么优缺点?
[↑] 语言相关问题:
· 告诉我你的首选语言的三个最坏的缺陷。
· 为什么现在函数式编程这么越来越受关注?
· 闭包是什么?它有什么用途?闭包和类有什么共同点?
· 泛型有什么用途?
· 什么是高阶函数?有什么用途?用你的首选语言写个例子出来。
· 讨论一下,如何写一个循环,然后把它转换成递归函数,要避免易变性。
· 有些语言将函数视为第一公民,这是什么意思?
· 用一个例子说明匿名函数是有用的。
· 什么是动态方法调度(Dynamic Method Dispatch)?
· 名字空间(Namespace)有什么用?有什么可以替代它的吗?
· 谈谈Java和C#之间的互操作性(Interoperability) (任选其他两门语言都行)
· 为什么很多软件工程师不喜欢Java?
· 你认为好的语言好在哪里?差的语言差在哪里?
· 写两个函数,一个是"引用透明的(Referentially Transparent)",另一个是"引用不透明的(Referentially Opaque)"。讨论之。
· 什么是栈?什么是堆?
· 为什么一个语言中,"函数是第一公民"是很重要的?
· 模式匹配(Pattern Matching)和Switch语句(Switch clauses)的区别在哪儿?
· 为什么有些语言设计上没有异常机制?这有什么优缺点?
· 如果Cat是一个Animal, 那么TaskCare<Cat>是一个TakeCare<Animal>吗?
[↑] web相关问题:
· 为什么"第一方cookie(first-party cookie)"和"第三方cookie(third-party cookie)"被如此不同的对待?
[↑] 数据库相关问题:
· 如果要你将一个项目从MySQL迁移至PostgreSQL中,你会如何迁移?
· 为什么SELECT * FROM table WHERE field = null不能匹配空的字段?
· 什么是ACID(原子性,一致性,隔离性,持久性)原则?
· 你是如何进行数据库模式(Database schema)迁移的?
· 延迟加载(lazy loading)是如何实现的?什么场景下有用?他有什么缺陷?
· 什么是N+1问题?
· 如何找出应用中开销最大的查询?
[↑] 非关系型数据库相关问题:
· 什么是最终一致性(Eventual Consistency)?
· 关于CAP理论,举一些CP、AP、CA系统的例子。
· NoSQL是如何解决可伸缩性的挑战的?
· 什么情况下你会使用类似于MongoDB的文档数据库而不是关系型数据库(如Mysql或者PostgreSQL)?
[↑] 代码版本管理相关问题:
· 为什么在Mercurial或者git中(管理)分支比SVN容易?
· 分散式版本控制系统(比如git),相比集中式版本控制系统(如svn)有哪些优势和劣势?
(注:集中式版本控制系统: Centralized Version Control Systems;分散式版本控制系统: Distributed Version Control Systems)
· 能描述一下什么是GitHubFlow和GitFlow工作流吗?
· 什么是rebase?
· 为什么合并操作(merge)在Mercurial和git中比在SVN和CVS中容易?
[↑] 并发问题:
· 为什么我们需要并发呢?解释一下。
· 为什么测试多线程/并发代码这么困难?
· 什么是竞争条件(Race Condition)?用任何一个语言写一个例子。
· 什么是死锁?用代码解释一下。
· 什么是饿死?
· 什么是Wait-Free算法?
[↑] 分布式系统相关问题:
· 怎么测试一个分布式系统?
· 什么场景下你会在两个系统中采用异步通信机制?
· 远程过程调用的通用缺点是什么?
· 如果你为了可扩展性和鲁棒性而构建一个分布式的系统,分别在封闭安全的网络环境情况下,和地理上的位置不同但是网络环境不是封闭和安全的情况下,你会考虑什么不同的事情?
· 在Web应用中如何管理容错性?在桌面端呢?
· 在分布式系统中,如何处理故障?
· 让我们来谈谈网络分裂(network partitions)后有的几种恢复的手段吧。
· 你认为分布式计算中有哪些谬论?
· 你在什么时候会使用Request/Response模式,什么时候使用Publish/Subscribe模式?
[↑] 软件生命周期和团队管理相关问题:
· 什么是敏捷(Agility)?
· 你是如何处理遗留代码(Legacy Code)的?
· 假设我是你们公司的CEO,请向我解释什么是看板,并且说服我在它上面投资。
· 敏捷(Agility)和瀑布(Waterfall)之间的最大区别是什么?
· 作为团队管理者,你对会议太多这个问题是如何处理的?
· 你会如何处理延期很长时间了的项目?
"个体与交互重于过程和工具"和"客户协作重于合同谈判"占了敏捷宣言(Agile Manifesto)的一半,谈论一下这两个观念。
如果你是你们公司的CTO,你会采取什么样的决策?
· 你觉得项目经理有用吗?
· 如果要你组织一个弹性工作制的开发团队(即没有强制工作时间的要求),并且假期制度是"按需休假",你会如何做?
· 你会如何管理一个人员流动非常高的团队?如何在不加薪的条件下说服团队成员不要离开?
· 除了代码之外,你最关注你的同事的哪3项素质?
· 关于代码,你最希望非技术人员能知道的的三件事是什么?
[↑] 逻辑和算法相关问题:
· 只用LIFO栈如何构造一个FIFO队列?只用FIFO队列如何构造一个LIFO栈?
· 写一段有栈溢出的代码。
· 写一个尾递归版本的阶乘函数。
· 使用任何一个语言,写一个REPL,功能是echo你输入的字符串。然后将它演化成一个逆波兰表达式的计算器。
· 如果需要你设计一个文件系统磁盘碎片整理程序,你会如何设计?
· 写一个生成随机迷宫的程序。
· 写一段有内存泄漏的示例代码。
· 随机生成一个的数字序列,里面每个数字都不同。
· 写一个简单的垃圾回收系统。
· 使用任何一门语言,写一个基本的消息代理。
· 写一个基础的web服务器,然后画一张线路图,展示你将来还想要实现的功能。
· 如何对一个10GB的文件进行排序?如果是10TB的数据,你会采用什么方法?
· 请实现rnd()函数
[↑] 软件架构相关问题:
· 什么情况下缓存是没用的,甚至是危险的?
· 为什么事件驱动的架构能提高可扩展性(scalability)?
· 什么样的代码是可读性强的代码?
· 紧急设计(Emergent Design)和演化架构(Evolutionary Architecture)之间的区别是什么?
· 横向扩展(scale out) vs 纵向扩展(scale up): 有什么区别?分别在什么场景下使用?
· 分布式系统中如何处理"故障切换(failover)"和"用户会话(user session)"?
· 什么是CQRS(Command Query Responsibility Segregation)?他和最早的Command-Query Separation原则有什么区别?
· 什么是三层架构?
· 如何设计一个可扩展性高的系统?
· 处理C10k问题的策略有哪些?
· 如果让你来设计一个去中心化的P2P系统,你会如何设计?
· 为什么CGI的扩展性不好?
· 在设计系统时,你如何防止供应商依赖(Vendor Lock-in)?
· 在可扩展性上,发布/订阅(Publish-Subscribe)模式有什么缺点?
· 80年代以后,CPU有哪些变化?这些变化,对编程产生了什么影响?
· 性能生命周期(performace lifecycle)中,你认为哪个部分是需要考虑进去的? 如何管理?
· 除了恶意攻击造成的拒绝服务现象以外,哪些设计或者架构上的问题会导致拒绝服务?
· 性能和可扩展性之间有什么关系?
· 什么时候紧耦合是OK的?
· 一个系统要有什么特征才能适配云计算环境(Cloud Ready)?
· Does unity of design imply an aristocracy of architects?
[↑] 面向服务架构(SOA)和微服务(Microservice)相关问题:
· 在SOA中,为什么长期存活的事务(Long-lived transation)不被看好,而Saga却被看好?
· SOA和MicroService之间有什么区别?
· 我们来谈谈Web服务的版本管理、版本兼容性、重大变更管理这些事情吧.
· 在saga中事务和补偿操作(compensation operation)之间的区别是什么?在SOA中呢?
· 微服务不能做得太"微",你认为什么时候微服务太"微"了?
· MicroService架构的优劣是什么?
[↑] 安全相关问题:
· 什么是双因素认证(Two Factor Authentication)?在一个已有的Web应用中,你如何实现这种机制?
[↑] 比尔盖茨式问题:
· 如果你把一面镜子放在扫描仪上,会发生什么?
· 假设有一个和你完全一样的克隆人,而他是你的上司,你愿意和他工作吗?
· 现在请你面试一下我。
· 为什么Quora上的回答会比Yahoo Answer上的回答好?
· 对手是现代语言,你的任务是要为Cobol辩护,你会如何进行?
· 10年后的你是什么样子?
· 假设你是我老板,我被解雇了。你会如何通知我?
· 我想要重构一个系统,而你想要从头重写。我们来争论一下该怎么弄吧。然后我们反转角色,再争论一下。
· 老板要你对公司撒谎,你的反应是什么?
· 如果你可以穿越到以前,你会给年轻时候的你什么建议?
[↑] 代码示例问题:
· 这段Javascript函数的输出是什么?
function hookupevents() {
for (var i = 0; i < 3; i++) {
document.getElementById("button" + i)
.addEventListener("click", function() {
alert(i);
});
}
}
· 关于类型擦除(Type Erasure),这段Java代码的输出是什么?为什么?
ArrayList<Integer> li = new ArrayList<Integer>();
ArrayList<Float> lf = new ArrayList<Float>();
if (li.getClass() == lf.getClass()) // evaluates to true
System.out.println("Equal");
· 你能指出哪儿有内存泄漏吗?
public class Stack {
private Object[] elements;
private int size = 0;
private static final int DEFAULT_INITIAL_CAPACITY = 16;
public Stack() {
elements = new Object[DEFAULT_INITIAL_CAPACITY];
}
public void push(Object e) {
ensureCapacity();
elements[size++] = e;
}
public Object pop() {
if (size == 0)
throw new EmptyStackException();
return elements[--size];
}
/**
* Ensure space for at least one more element, roughly
* doubling the capacity each time the array needs to grow.
*/
private void ensureCapacity() {
if (elements.length == size)
elements = Arrays.copyOf(elements, 2 * size + 1);
}
}
· if语句,或者更加通用点,条件表达式通常是过程式编程/命令式编程的形式。你能去掉这段代码中的switch语句,用面向对象的方式来修改这段代码吗?
public class Formatter {
private Service service;
public Formatter(Service service) {
this.service = service;
}
public String doTheJob(String theInput) {
String response = service.askForPermission();
switch (response) {
case "FAIL":
return "error";
case "OK":
return String.format("%s%s", theInput, theInput);
default:
return null;
}
}
}
· 你能去掉这里的if语句,将它改成更加面向对象吗?
public class TheService {
private final FileHandler fileHandler;
private final FooRepository fooRepository;
public TheService(FileHandler fileHandler, FooRepository fooRepository) {
this.fileHandler = fileHandler;
this.fooRepository = fooRepository;
}
public String Execute(final String file) {
final String rewrittenUrl = fileHandler.getXmlFileFromFileName(file);
final String executionId = fileHandler.getExecutionIdFromFileName(file);
if ((executionId == "") || (rewrittenUrl == "")) {
return "";
}
Foo knownFoo = fooRepository.getFooByXmlFileName(rewrittenUrl);
if (knownFoo == null) {
return "";
}
return knownFoo.DoThat(file);
}
}
· 如何重构这段代码?
function()
{
HRESULT error = S_OK;
if(SUCCEEDED(Operation1()))
{
if(SUCCEEDED(Operation2()))
{
if(SUCCEEDED(Operation3()))
{
if(SUCCEEDED(Operation4()))
{
}
else
{
error = OPERATION4FAILED;
}
}
else
{
error = OPERATION3FAILED;
}
}
else
{
error = OPERATION2FAILED;
}
}
else
{
error = OPERATION1FAILED;
}
return error;
}
2、思路考题
2.1 把文件从计算机A 复制到计算机B, 如果要求越快越好, 你怎么做?如果计算机B是10000台机器,你怎么做?如果要求绝对不能出错, 你怎么做?如果要求断点续传,你怎么做?请问在拷贝过程当中有可能出什么样的错误?
这个题我觉得最重要的,就是要体现“渐进增强”这个思想特点。即规模小怎么干都行,随着要求一点点增多或者差异化的时候,再去一点点加以约束,寻找可行的做法。
越快越好:也要看具体是怎么个快。如果是追求绝对的传输速度,那么就是追究物理层速度和双方的缓存策略。如果是追求差分传输,就要上rsync了。
B是10000台机器:一主多从分发,并且这么大的范围往往是必须用互联网连接的。
绝对不能出错:hash等校验,并且话下的这么死,估计SHA-1都有点不够用。这句话还有个潜台词是“发现错了要有办法”,也就是说还要准备部分验证和部分重传的方案,其实多半也用rsync。
断点续传:如果只是要这个那就太灵活了。
可能出什么样的错误:其实大部分真真正正的传输错误,都在数据链路层就被控制了下来。所以错误往往更多的出在双方——通信一方无响应或意外中止传输,存储空间满,不一而足。
注意错误和设计缺欠并不一样。例如数据储存和处理速度不同步(这个的典型表现就是缓存区欠载或缓存区爆仓)这就是设计缺欠,而不是传输过程中出的错误。
· rsync -z, 使用尽可能快的传输线路;
· bt 或者多播;
· sha1sum 和/或 gpg 签名校验;(当然,文件很多的情况下对 tar / cpio 包进行签名,这样就需要额外的磁盘空间)
· rsync;据说 FTP 也可以。HTTP 下载也是支持续传的
· 传输信道中断、读取/写入被操作系统拒绝(因为权限、磁盘空间/配额、磁盘故障)、系统宕机(电源中断、系统故障等)。