[置顶] 后台开发工程师面试题

1、理论基础知识

· JAVA基础

· 通用问题

· 开放式问题

· 设计模式相关问题

· 代码设计相关问题

· 语言相关问题

· Web相关问题

· 数据库相关问题

· 非关系型数据库相关问题

· 代码版本管理相关问题

· 并发问题

· 分布式系统相关问题

· 软件生命周期和团队管理相关问题

· 逻辑和算法相关问题

· 软件架构相关问题

· 面向服务架构(SOA)和微服务(Microservice)相关问题

· 安全相关问题

· 比尔盖茨式问题

· 代码示例问题

[] Java基础知识:

三家公司都问了java集合类的相关概念,各种集合结构之间内在区别:

ArrayListVectorLinkList区别

HashMapHashTableConCurrentHashMap区别

Collections.synchronizedXX 方法的原理

设计模式,这种问题感觉没啥意义,工作中用哪个模式还是靠感觉和经验

Java某些原理:RPC,注解,反射,内存,GC,其中Java内存模型和GC过程几乎必问,通常也比较深入,有时候甚至会跳到其他语言的内存机制上,JVM参数以及相关调优,不过还遇到要求JVM调优经验的(--

Java多线程:对多线程包java.util.concurrent的了解,多线程设计模式FutureThreadLocal使用及原理,多线程协同demo(纸上代码)

Java新技术:NIOJava 89,如果对这方面很熟悉,能够给人一种geek范,也许会有加分(如果之前基础知识不好就变成自黑了)

数据库知识:

SQL语句的书写,由于某些支付公司采用oracle数据库,所以对这个数据库最好有一定的了解。

数据库基础知识,join操作,数据库锁,数据库事物特性ACID

NOSQLmemcacheredis区别,使用时数据一致性的解决,负载均衡

数据库索引,索引的添加修改对性能有何影响,其内在数据结构,联合查询的索引使用,为了配合索引sql语句书写规范。

数据库锁,悲观锁乐观锁,锁的粒度以及相应SQL语句,锁隔离界别

企业开发相关框架

这部分各个公司通常都会考察spring-AOP/IOC,然后考察在工作中的使用,这部分是我的弱点,因为实在是没用过。

Tomcat性能调优,相关参数

Nginx,负载均衡

Memcache 一致性Hash

Zookeeper master/slave协同

SSH使用,MyBatis使用,基本框架与原理

· 

[] 通用问题:

· 语言设计中空引用(null reference)的存在有什么问题?假设你想要将空引用的概念从你的首选语言中移除,可能导致什么结果?

· 为什么函数式编程重要?什么时候适用函数式语言?

· 设计(design)、架构(architecture)、功能(functionality)和美学(aesthetic)之间有什么区别?讨论一下。

· 微软、谷歌、欧朋(opera)和火狐这类公司是如何从他们的浏览器中获利的?

· 为什么打开TCP套接字有很大的开销?

· 封装的重要性体现在哪儿?

· 什么是实时系统?它与普通系统有什么区别?

· 实时语言(real-time language)和堆内存分配(heap memory allocation)之间的关系是什么?

· 不变性(Immutability)是指: (变量的)值只能在创建的时候被设置一次,之后就不能被改变。为什么不变性对写更加安全的代码有帮助?

· 可变值(mutable values)和不可变值(immutable values)有哪些优缺点?

· 什么是O/R阻抗失衡(Object-Relational impedence mismatch)

· 如果你需要使用缓存,你使用哪些原则来确定缓存的大小?

· TCPHTTP有什么区别?

· 在客户端渲染(client-side rendering)和服务端渲染(server-side rendering)之间,你是如何权衡的?

· 如何在一个不可靠的协议之上构建一个可靠的通信协议?

[] 开放式问题:

· 为什么人们会抵制变化?

· 如何向你的祖母解释什么是线程?

· 作为一个软件工程师,你想要既要有创新力,又要产出具有可预测性。采用什么策略才能使这两个目标可以共存呢?

· 什么是好的代码?

· 解释什么是流(Streaming)和如何实现一个流?

· 假设你的公司给你一周的时间,用来改善你和同事的生活你将如何使用这一周?

· 本周你学了什么?

· 所有的设计中都会有美学元素(aesthetic element)的存在。问题是,你认为美学元素是你的朋友还是敌人?

· 列出最近你读过的5本书。

· 假设目前有个大型公司(非常有钱),他们的开发流程是瀑布式流程(Waterfall),如果需要你在他们公司引入持续交付(Continue Devivery),你会怎么做?

· 我们来谈谈"重复造轮子","非我发明症", "吃自己做出来的狗粮"的这些做法吧。

(重复造轮子: Reinventing the wheel; 非我发明症:Not Invented Here Syndrome; 吃自己做出来的狗粮: Eating Your Own Dog Food)

· 在你当前的工作流中,什么事情是你计划下一步需要自动化的?

· 为什么写软件是困难的?是什么使软件的维护变得困难?

· 你更喜欢在全新项目(Green Field Project)上工作还是在已有项目(Brown Field Project)基础上工作?为什么?

· 当你在浏览器地址栏输入google.com回车之后都发生了什么?

· 当操作系统CPU处于空闲的时候,它可能在处理哪些事情?

· 如何向一个5岁的孩子解释什么是Unicode/数据库事务?

· 如何维护单体架构(monolithic architecture)

· 一个"专业的开发者"意味着什么?

· 软件开发是艺术、是技艺还是工程?你的观点是什么?

· "喜欢这个的人也喜欢...",如何在一个电子商务商店里实现这种功能?

· 为什么在创新上,企业会比创业公司慢些?

· 为什么说,你不应该尝试应用自己发明或者设计的密码学?

[] 设计模式相关问题:

· 请用一个例子表明,全局对象是邪恶的存在。

· 假设你工作的系统不支持事务性,你会如何从头开始实现它?

· 什么是好莱坞原则(Hollywood Principles)?

· 关于迪米特法则(最少知识原则): 写一段代码违反它然后修复它。

(注迪米特法则:the Law of Demeter, 最少知识原则: the Principle of Least Knowledge

· Active-Record模式有什么限制和缺陷?

· Data-Mapper模式和Active-Record模式有什么区别?

· 空对象模式(Null Object Pattern)的目的是什么?

· 为什么组合(Composition)比继承(Inheritance)更好?

· 什么是反腐败层(Anti-corruption Layer)?

· 你可以写一个线程安全的单例(Singleton)类吗?

· 数据抽象(Data Abstraction)能力是指能改变实现而不影响客户端的这种能力。请构造一个一个例子,违反这个特性,并且尝试修复它。

· 你是如何处理依赖关系地狱(Dependency Hell)的?

· 为什么说goto语句是恶魔般的存在?

· 健壮性是进行软件设计时的一个通用原则,它建议 “发送时要保守,接收时要开放”。这也经常被写成,“做一个有耐心的读者,做一个谨慎的作者”。你能解释一些这背后的逻辑吗?

译者注: "发送时要保守,接收时要开发"的原文是: "Be conservative in what you send, be liberal in what you accept",有点类似于“严于律己,宽于待人”的意味。

[] 代码设计相关问题:

· 你在进行软件设计时会考虑软件测试吗?软件测试是如何影响软件设计的?

· 内聚和耦合的区别是什么?

· 重构在哪些场景下有用?

· 代码中的注释有用吗?

· 设计和架构有什么区别?

· 为什么在测试驱动开发(TDD)中是先写测试,再写代码?

· C++支持多继承,Java允许类实现多个接口。这些特性对正交性有什么影响?使用多继承和使用多接口有区别吗?[这个问题来自Andrew .Hunt 和 David Thomas写的《程序员修炼之道》]

· 在存储过程(Stored Procedures)中写业务逻辑有什么优缺点?

[] 语言相关问题:

· 告诉我你的首选语言的三个最坏的缺陷。

· 为什么现在函数式编程这么越来越受关注?

· 闭包是什么?它有什么用途?闭包和类有什么共同点?

· 泛型有什么用途?

· 什么是高阶函数?有什么用途?用你的首选语言写个例子出来。

· 讨论一下,如何写一个循环,然后把它转换成递归函数,要避免易变性。

· 有些语言将函数视为第一公民,这是什么意思?

· 用一个例子说明匿名函数是有用的。

· 什么是动态方法调度(Dynamic Method Dispatch)

· 名字空间(Namespace)有什么用?有什么可以替代它的吗?

· 谈谈JavaC#之间的互操作性(Interoperability) (任选其他两门语言都行)

· 为什么很多软件工程师不喜欢Java

· 你认为好的语言好在哪里?差的语言差在哪里?

· 写两个函数,一个是"引用透明的(Referentially Transparent)",另一个是"引用不透明的(Referentially Opaque)"。讨论之。

· 什么是栈?什么是堆?

· 为什么一个语言中,"函数是第一公民"是很重要的?

· 模式匹配(Pattern Matching)Switch语句(Switch clauses)的区别在哪儿?

· 为什么有些语言设计上没有异常机制?这有什么优缺点?

· 如果Cat是一个Animal那么TaskCare<Cat>是一个TakeCare<Animal>吗?

[] web相关问题:

· 为什么"第一方cookie(first-party cookie)""第三方cookie(third-party cookie)"被如此不同的对待?

[] 数据库相关问题:

· 如果要你将一个项目从MySQL迁移至PostgreSQL中,你会如何迁移?

· 为什么SELECT * FROM table WHERE field = null不能匹配空的字段?

· 什么是ACID(原子性,一致性,隔离性,持久性)原则?

· 你是如何进行数据库模式(Database schema)迁移的?

· 延迟加载(lazy loading)是如何实现的?什么场景下有用?他有什么缺陷?

· 什么是N+1问题?

· 如何找出应用中开销最大的查询?

[] 非关系型数据库相关问题:

· 什么是最终一致性(Eventual Consistency)

· 关于CAP理论,举一些CPAPCA系统的例子。

· NoSQL是如何解决可伸缩性的挑战的?

· 什么情况下你会使用类似于MongoDB的文档数据库而不是关系型数据库(如Mysql或者PostgreSQL)?

[] 代码版本管理相关问题:

· 为什么在Mercurial或者git(管理)分支比SVN容易?

· 分散式版本控制系统(比如git),相比集中式版本控制系统(如svn)有哪些优势和劣势?

(:集中式版本控制系统: Centralized Version Control Systems;分散式版本控制系统: Distributed Version Control Systems)

· 能描述一下什么是GitHubFlowGitFlow工作流吗?

· 什么是rebase

· 为什么合并操作(merge)Mercurialgit中比在SVNCVS中容易?

[] 并发问题:

· 为什么我们需要并发呢?解释一下。

· 为什么测试多线程/并发代码这么困难?

· 什么是竞争条件(Race Condition)?用任何一个语言写一个例子。

· 什么是死锁?用代码解释一下。

· 什么是饿死?

· 什么是Wait-Free算法?

[] 分布式系统相关问题:

· 怎么测试一个分布式系统?

· 什么场景下你会在两个系统中采用异步通信机制?

· 远程过程调用的通用缺点是什么?

· 如果你为了可扩展性和鲁棒性而构建一个分布式的系统,分别在封闭安全的网络环境情况下,和地理上的位置不同但是网络环境不是封闭和安全的情况下,你会考虑什么不同的事情?

· Web应用中如何管理容错性?在桌面端呢?

· 在分布式系统中,如何处理故障?

· 让我们来谈谈网络分裂(network partitions)后有的几种恢复的手段吧。

· 你认为分布式计算中有哪些谬论?

· 你在什么时候会使用Request/Response模式,什么时候使用Publish/Subscribe模式?

[] 软件生命周期和团队管理相关问题:

· 什么是敏捷(Agility)?

· 你是如何处理遗留代码(Legacy Code)的?

· 假设我是你们公司的CEO,请向我解释什么是看板,并且说服我在它上面投资。

· 敏捷(Agility)和瀑布(Waterfall)之间的最大区别是什么?

· 作为团队管理者,你对会议太多这个问题是如何处理的?

· 你会如何处理延期很长时间了的项目?

"个体与交互重于过程和工具""客户协作重于合同谈判"占了敏捷宣言(Agile Manifesto)的一半,谈论一下这两个观念。

如果你是你们公司的CTO,你会采取什么样的决策?

· 你觉得项目经理有用吗?

· 如果要你组织一个弹性工作制的开发团队(即没有强制工作时间的要求),并且假期制度是"按需休假",你会如何做?

· 你会如何管理一个人员流动非常高的团队?如何在不加薪的条件下说服团队成员不要离开?

· 除了代码之外,你最关注你的同事的哪3项素质?

· 关于代码,你最希望非技术人员能知道的的三件事是什么?

[] 逻辑和算法相关问题:

· 只用LIFO栈如何构造一个FIFO队列?只用FIFO队列如何构造一个LIFO栈?

· 写一段有栈溢出的代码。

· 写一个尾递归版本的阶乘函数。

· 使用任何一个语言,写一个REPL,功能是echo你输入的字符串。然后将它演化成一个逆波兰表达式的计算器。

· 如果需要你设计一个文件系统磁盘碎片整理程序,你会如何设计?

· 写一个生成随机迷宫的程序。

· 写一段有内存泄漏的示例代码。

· 随机生成一个的数字序列,里面每个数字都不同。

· 写一个简单的垃圾回收系统。

· 使用任何一门语言,写一个基本的消息代理。

· 写一个基础的web服务器,然后画一张线路图,展示你将来还想要实现的功能。

· 如何对一个10GB的文件进行排序?如果是10TB的数据,你会采用什么方法?

· 请实现rnd()函数

[] 软件架构相关问题:

· 什么情况下缓存是没用的,甚至是危险的?

· 为什么事件驱动的架构能提高可扩展性(scalability)

· 什么样的代码是可读性强的代码?

· 紧急设计(Emergent Design)和演化架构(Evolutionary Architecture)之间的区别是什么?

· 横向扩展(scale out) vs 纵向扩展(scale up): 有什么区别?分别在什么场景下使用?

· 分布式系统中如何处理"故障切换(failover)""用户会话(user session)"

· 什么是CQRS(Command Query Responsibility Segregation)?他和最早的Command-Query Separation原则有什么区别?

· 什么是三层架构?

· 如何设计一个可扩展性高的系统?

· 处理C10k问题的策略有哪些?

· 如果让你来设计一个去中心化的P2P系统,你会如何设计?

· 为什么CGI的扩展性不好?

· 在设计系统时,你如何防止供应商依赖(Vendor Lock-in)

· 在可扩展性上,发布/订阅(Publish-Subscribe)模式有什么缺点?

· 80年代以后,CPU有哪些变化?这些变化,对编程产生了什么影响?

· 性能生命周期(performace lifecycle)中,你认为哪个部分是需要考虑进去的? 如何管理?

· 除了恶意攻击造成的拒绝服务现象以外,哪些设计或者架构上的问题会导致拒绝服务?

· 性能和可扩展性之间有什么关系?

· 什么时候紧耦合是OK的?

· 一个系统要有什么特征才能适配云计算环境(Cloud Ready)

· Does unity of design imply an aristocracy of architects?

[] 面向服务架构(SOA)和微服务(Microservice)相关问题:

· SOA中,为什么长期存活的事务(Long-lived transation)不被看好,而Saga却被看好?

· SOAMicroService之间有什么区别?

· 我们来谈谈Web服务的版本管理、版本兼容性、重大变更管理这些事情吧.

· saga中事务和补偿操作(compensation operation)之间的区别是什么?在SOA中呢?

· 微服务不能做得太"",你认为什么时候微服务太""了?

· MicroService架构的优劣是什么?

[] 安全相关问题:

· 什么是双因素认证(Two Factor Authentication)?在一个已有的Web应用中,你如何实现这种机制?

[] 比尔盖茨式问题:

· 如果你把一面镜子放在扫描仪上,会发生什么?

· 假设有一个和你完全一样的克隆人,而他是你的上司,你愿意和他工作吗?

· 现在请你面试一下我。

· 为什么Quora上的回答会比Yahoo Answer上的回答好?

· 对手是现代语言,你的任务是要为Cobol辩护,你会如何进行?

· 10年后的你是什么样子?

· 假设你是我老板,我被解雇了。你会如何通知我?

· 我想要重构一个系统,而你想要从头重写。我们来争论一下该怎么弄吧。然后我们反转角色,再争论一下。

· 老板要你对公司撒谎,你的反应是什么?

· 如果你可以穿越到以前,你会给年轻时候的你什么建议?

[] 代码示例问题:

· 这段Javascript函数的输出是什么?

function hookupevents() {

  for (var i = 0; i < 3; i++) {

    document.getElementById("button" + i)

      .addEventListener("click"function() { 

        alert(i); 

      });

  }

}

· 关于类型擦除(Type Erasure),这段Java代码的输出是什么?为什么?

ArrayList<Integer> li = new ArrayList<Integer>();

ArrayList<Float> lf = new ArrayList<Float>();

if (li.getClass() == lf.getClass()) // evaluates to true

  System.out.println("Equal");

· 你能指出哪儿有内存泄漏吗?

public class Stack {

    private Object[] elements;

    private int size = 0;

    private static final int DEFAULT_INITIAL_CAPACITY = 16;

 

    public Stack() {

        elements = new Object[DEFAULT_INITIAL_CAPACITY];

    }

 

    public void push(Object e) {

        ensureCapacity();

        elements[size++= e;

    }

 

    public Object pop() {

        if (size == 0)

            throw new EmptyStackException();

        return elements[--size];

    }

 

    /**

     * Ensure space for at least one more element, roughly

     * doubling the capacity each time the array needs to grow.

     */

    private void ensureCapacity() {

        if (elements.length == size)

            elements = Arrays.copyOf(elements, 2 * size + 1);

    }

}

· if语句,或者更加通用点,条件表达式通常是过程式编程/命令式编程的形式。你能去掉这段代码中的switch语句,用面向对象的方式来修改这段代码吗?

public class Formatter {

 

    private Service service;

 

    public Formatter(Service service) {

        this.service = service;

    }

 

    public String doTheJob(String theInput) {

        String response = service.askForPermission();

        switch (response) {

        case "FAIL":

            return "error";

        case "OK":

            return String.format("%s%s", theInput, theInput);

        default:

            return null;

        }

    }

}

· 你能去掉这里的if语句,将它改成更加面向对象吗?

public class TheService {

    private final FileHandler fileHandler;

    private final FooRepository fooRepository;

 

    public TheService(FileHandler fileHandler, FooRepository fooRepository) {

        this.fileHandler = fileHandler;

        this.fooRepository = fooRepository;

    }

 

    public String Execute(final String file) {

 

        final String rewrittenUrl = fileHandler.getXmlFileFromFileName(file);

        final String executionId = fileHandler.getExecutionIdFromFileName(file);

 

        if ((executionId == ""|| (rewrittenUrl == "")) {

            return "";

        }

 

        Foo knownFoo = fooRepository.getFooByXmlFileName(rewrittenUrl);

 

        if (knownFoo == null) {

            return "";

        }

 

        return knownFoo.DoThat(file);

    }

}

· 如何重构这段代码?

function()

{

    HRESULT error = S_OK;

 

    if(SUCCEEDED(Operation1()))

    {

        if(SUCCEEDED(Operation2()))

        {

            if(SUCCEEDED(Operation3()))

            {

                if(SUCCEEDED(Operation4()))

                {

                }

                else

                {

                    error = OPERATION4FAILED;

                }

            }

            else

            {

                error = OPERATION3FAILED;

            }

        }

        else

        {

            error = OPERATION2FAILED;

        }

    }

    else

    {

        error = OPERATION1FAILED;

    }

 

    return error;

}

 

 

2、思路考题

2.1 把文件从计算机复制到计算机B 如果要求越快越好, 你怎么做?如果计算机B10000台机器,你怎么做?如果要求绝对不能出错, 你怎么做?如果要求断点续传,你怎么做?请问在拷贝过程当中有可能出什么样的错误?

 

这个题我觉得最重要的,就是要体现“渐进增强”这个思想特点。即规模小怎么干都行,随着要求一点点增多或者差异化的时候,再去一点点加以约束,寻找可行的做法。

越快越好:也要看具体是怎么个快。如果是追求绝对的传输速度,那么就是追究物理层速度和双方的缓存策略。如果是追求差分传输,就要上rsync了。

B10000台机器:一主多从分发,并且这么大的范围往往是必须用互联网连接的。

绝对不能出错:hash等校验,并且话下的这么死,估计SHA-1都有点不够用。这句话还有个潜台词是“发现错了要有办法”,也就是说还要准备部分验证和部分重传的方案,其实多半也用rsync

断点续传:如果只是要这个那就太灵活了。

可能出什么样的错误:其实大部分真真正正的传输错误,都在数据链路层就被控制了下来。所以错误往往更多的出在双方——通信一方无响应或意外中止传输,存储空间满,不一而足。
注意错误和设计缺欠并不一样。例如数据储存和处理速度不同步(这个的典型表现就是缓存区欠载或缓存区爆仓)这就是设计缺欠,而不是传输过程中出的错误。

· rsync -z, 使用尽可能快的传输线路;

· bt 或者多播;

· sha1sum /或 gpg 签名校验;(当然,文件很多的情况下对 tar / cpio 包进行签名,这样就需要额外的磁盘空间)

· rsync;据说 FTP 也可以。HTTP 下载也是支持续传的

· 传输信道中断、读取/写入被操作系统拒绝(因为权限、磁盘空间/配额、磁盘故障)、系统宕机(电源中断、系统故障等)。

 

 

你可能感兴趣的:([置顶] 后台开发工程师面试题)