Python后端工程师面试题（附答案）终结版

之前在网上搜集python面试题，这是最流行的一个版本。但是没有答案，故自己搜集或回答了一部分。现分享给大家，有些题目

回答的并不准确，望各路大神纠正，完善！！！

python语法以及其他基础部分

1.可变与不可变类型；

不可变类型（数字、字符串、元组、不可变集合）不可变类型不能被修改。

可变类型（列表、字典、可变集合）

2.浅拷贝与深拷贝的实现方式、区别；deepcopy如果你来设计，如何实现；

基本类型 :

基本类型在内存中分别占有固定大小的空间，他们的值保存在栈空间，我们是通过按值来访问的。

引用类型 :

引用类型，值大小不固定，栈内存中存放地址指向堆内存中的对象。是按引用访问的。

栈内存中存放的只是该对象的访问地址，在堆内存中为这个值分配空间。由于这种值的大小不固定，

因此不能把它们保存到栈内存中。但内存地址大小的固定的，因此可以将内存地址保存在栈内存中。

这样，当查询引用类型的变量时，先从栈中读取内存地址，然后再通过地址找到堆中的值。对于这种，

我们把它叫做按引用访问。

浅拷贝只复制指向某个对象的引用地址，而不复制对象本身（只复制一层对象的属性），新旧对象还是共享同一块内存。

但深拷贝会另外创造一个一模一样的对象，新对象跟原对象不共享内存，修改新对象不会改到原对象。

浅复制只复制一层对象的属性，而深复制则递归复制了所有层级。

import copy as cp

L=[1,[2,3]]

L1=cp.copy(L) #浅拷贝: 只是引用，并不会开辟新的内存空间，

L1与L指向同一片内存空间。L改变,L1也会锁着改变。

L2=cp.deepcopy(L) #深拷贝：会为数据重新开辟一片内存空间，L的变化不会影响L2。

3.__new__() 与 __init__()的区别；

_new_作用于_init_之前。前者可以决定是否调用后者，或者说可以决定调用哪个类的_init_方法。

首先要知道在面向对象编程中，实例化基本遵循创建实例对象、初始化实例对象、最后返回实例对象这么一个过程。

Python 中的 _new_ 方法负责创建一个实例对象，_init_ 方法负责将该实例对象进行初始化；

4.你知道几种设计模式；

单例模式：保证一个类仅有一个实例，并提供一个访问他的全局访问点，例如框架中的数据库连接

装饰器模式：不修改元类代码和继承的情况下动态扩展类的功能，例如框架中的每个controller文件会提供before和after方法。

迭代器模式：提供一个方法顺序访问一个聚合对象中各个元素，在PHP中将继承 Iterator 类

命令模式: 将”请求”封闭成对象, 以便使用不同的请求,队列或者日志来参数化其他对象. 命令模式也支持可撤销的操作.

5.编码和解码你了解过么；

数据通过编码decode转换成Unicode编码，编码的同时会将数据变成byte类型，通过解码encode转换为utf-8。

6.列表推导list comprehension和生成器的优劣；

[expr for iter_var in iterable] 列表推导式是将所有的值一次性加载到内存中

(expr for iter_var in iterable)

在大数据量处理时，生成器表达式的优势就体现出来了，因为它的内存使用方式更好，

效率更高，它并不创建一个列表，只是返回一个生成器。

7.什么是装饰器；如果想在函数之后进行装饰，应该怎么做；

装饰器是一个函数，这个函数的主要作用是包装另一个函数或类

包装的目的是在不改变原函数名的情况下改变被包装对象的行为。

接收一个函数，内部对其包装，然后返回一个新函数，这样子动态的增强函数功能

通过高阶函数传递函数参数，新函数添加旧函数的需求，然后执行旧函数。

8.手写个使用装饰器实现的单例模式；

该模式的主要目的是确保某一个类只有一个实例存在。

from functools import warps

def My_decorate(f):

@warps(f)

def fn(*args,**kwargs):

print('decorate called')

return f(*args,**kwargs)

return fn

@My_decorate

def fx():

pring('fx called')

fx()

9.使用装饰器的单例和使用其他方法的单例，在后续使用中，有何区别；

使用装饰器单例属性不会被覆盖。因为装饰器单例模式是直接返回之前生成的对象,

并不会重新初始化对象。像new方法构建的单例模式会重新调用init方法,为实例重新初始化属性。

10.手写：正则邮箱地址；

pattern = '[a-zA-Z0-9_.-]+@[a-zA-Z0-9]+\.[a-z]'

匹配身份证：

pattern = '(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)'

pattern = '^[1-9]\d{5}(18|19|([23]\d))\d{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)\d{3}[0-9Xx]$'

11.介绍下垃圾回收：引用计数/分代回收/孤立引用环；

垃圾回收：python解释器对正在使用的对象保持计数，当某个对像的引用计数降为0时，垃圾收集器就可以释放

该对象，获取分配的内存。当分配对象和取消分配对象的差值高于阈值时垃圾回收才会启动。

分代回收：python将所有的对象分为0,1,2三代。所有的新建对象都是0代对象。当某一代对象经历过垃圾回收，

依然存活，那么它就被归入下一代对象。垃圾回收启动时，一定会扫描所有的0代对象。

如果0代经过一定次数垃圾回收，那么就启动对0代和1代的扫描清理。

当1代也经历了一定次数的垃圾回收后，那么会启动对0，1，2，即对所有对象进行扫描。

孤立引用环：

12.多进程与多线程的区别；CPU密集型适合用什么；

多线程：在单个程序中同时运行多个线程完成不同的工作，称为多线程。

线程共享内存空间；进程的内存是独立的，

同一个进程的线程之间可以直接交流；两个进程想通信，必须通过一个中间代理来实现，

一个线程可以控制和操作同一进程里的其他线程；但是进程只能操作子进程

优缺点：1.多进程的优点是稳定性好，一个子进程崩溃了，不会影响主进程以及其余进程。

但是缺点是创建进程的代价非常大，因为操作系统要给每个进程分配固定的资源。

2.多线程优点是效率较高一些，但是致命的缺点是任何一个线程崩溃都可能

造成整个进程的崩溃，因为它们共享了进程的内存资源池。

*CPU密集型适合用多进程开发

13.进程通信的方式有几种；

进程间通信主要包括管道, 系统IPC(包括消息队列,信号量,共享存储), SOCKET

14.介绍下协程，为何比线程还快；

高并发+高扩展性+低成本：一个CPU支持上万的协程都不是问题。所以很适合用于高并发处理

协程能保留上一次调用时的状态，管是进程还是线程，每次阻塞、切换都需要陷入系统调用，

使用线程时需要非常小心地处理同步问题，而协程完全不存在这个问题。

15.range和xrange的区别

xrange和range 的用法完全相同，但是返回的是一个生成器。

算法排序部分

16.手写快排；堆排；几种常用排序的算法复杂度是多少；快排平均复杂度多少，最坏情况如何优化；

17.手写：已知一个长度n的无序列表，元素均是数字，要求把所有间隔为d的组合找出来，你写的解法算法复杂度多少；

def func(x, d):

L = []

n = len(x)

if d > n:

return None

L.append(x[0])

a = d + 1

while a < n:

L.append(x[a])

a = a + d + 1

return L

list = [x for x in range(100)]

result = func(list, 10)

print(result)

我写的只考虑到从第一个元素开始组合。没有考虑从第二个，第三个元素开始......求大神提供完全正确方法。

18.手写：一个列表A=[A1，A2，…,An]，要求把列表中所有的组合情况打印出来；

19.手写：用一行python写出1+2+3+…+10**8 ；

s = sum([x for x in range(1,10**8+1)])

20.手写python：用递归的方式判断字符串是否为回文；

def isHuiWen(str):

if(len(str) <2):

return True

if str[0] !=str[-1]:

return False

return isHuiWen(str[1:-1])

str = input("请输入一个字符串：")

if isHuiWen(str):

print("该字符串为回文字符串")

else:

print("该字符串不是回文")

21.单向链表长度未知，如何判断其中是否有环；

22.单向链表如何使用快速排序算法进行排序；

23.手写：一个长度n的无序数字元素列表，如何求中位数，如何尽快的估算中位数，

你的算法复杂度是多少；

def func(list):

if len(list) <= 1:

return list

L = sorted(list)

n = len(list) % 2

m = len(list) // 2

if n == 0:

s = (L[m] + L[m-1]) / 2

return s

s = L[m]

return s

l = [1,2,6,84,12,62,100]

print(func(l))

24.如何遍历一个内部未知的文件夹（两种树的优先遍历方式）

网络基础部分

25.TCP/IP分别在模型的哪一层；

TCP 在传输层，

IP在网络层

26.socket长连接是什么意思；

在一个TCP连接上可以连续发送多个数据包，在TCP连接保持期间，如果没有数据包发送，

需要双方发检测包以维持此链接，一般需要自己做在线维持。

长连接指建立SOCKET连接后不管是否使用都保持连接，但安全性较差

数据库的连接用长连接。如果用短连接频繁的通信会造成socket错误，

而且频繁的socket创建也是对资源的浪费

27.select和epoll你了解么，区别在哪；

28.TCP UDP区别；三次握手四次挥手讲一下；

TCP协议: (在传输之前先建立连接)面向连接(的通信服务):可靠地数据传输，失序,无差错,无丢失,无重复

用途:适用于传输内容比较大,网络情况比较好,需要提供准确的情况.比如:聊天信息,文字传输,邮件传输。

udp 协议:面向无连接的服务，不可靠，发送时由发送端自主进行,不考虑接收端。

用途:适用于网络较差,对传输准确性要求低,广播组播.比如:视频会议,广播数据。

三次握手:

1.客户端向服务器发起链接请求(问是否可以连接)

2.服务器接受到请求后进行确认(允许连接)返回报文

3.客户端收到许可,建立连接

四次挥手:

1.主动方发送报文告知被动方要断开连接

2.被动发返回报文没告知收到请求,准备断开

3.被动发发送报文给主动方告知准备就绪可以断开

4.主动方发送报文确定断开

29.TIME_WAIT过多是因为什么；

30.http一次连接的全过程：你来说下从用户发起request——到用户接收到response；

域名解析 --> 发起TCP的3次握手 --> 建立TCP连接后发起http请求 --> 服务器响应http请求，

浏览器得到html代码 --> 浏览器解析html代码，并请求html代码中的资源（如js、css、图片等）

--> 浏览器对页面进行渲染呈现给用户.

参考大神文章：https://www.cnblogs.com/engeng/articles/5959335.html

31.http连接方式。get和post的区别，你还了解其他的方式么；

get是从服务器上获取数据，post是向服务器传送数据。在客户端， get方式在通过URL提交数据，

数据在URL中可以看到；post方式，数据放置在HTML HEADER内提交。

对于get方式，服务器端用Request.QueryString获取变量的值，

对于post方式，服务器端用Request.Form获取提交的数据。

Get 方式提交数据，会带来安全问题，比如一个登陆页面，通过 Get 方式提交数据时，

用户名和密码将出现在 URL 上，如果页面可以被缓存或者其他人可以访问客户这台机器，

就可以从历史记录获得该用户的帐号和密码，所以表单提交建议使用 Post 方法。

32.restful你知道么；

33.状态码你知道多少，比如200/403/404/504等等；

200：操作成功。

403：访问受限，授权过期（错误提示）

404：资源，服务器未找到

504：网关超时，服务器作为网关或代理，但是没有及时从上游服务器收到请求。

Python后端工程师面试题（附答案）终结版

你可能感兴趣的:(Python后端工程师面试题（附答案）终结版)