Python后端工程师面试题(附答案)终结版

之前在网上搜集python面试题,这是最流行的一个版本。但是没有答案,故自己搜集或回答了一部分。现分享给大家,有些题目

回答的并不准确,望各路大神纠正,完善!!!

python语法以及其他基础部分

1.可变与不可变类型;
    不可变类型(数字、字符串、元组、不可变集合)不可变类型不能被修改。
    可变类型(列表、字典、可变集合)

2.浅拷贝与深拷贝的实现方式、区别;deepcopy如果你来设计,如何实现;

    基本类型 :
    基本类型在内存中分别占有固定大小的空间,他们的值保存在栈空间,我们是通过按值来访问的。
    引用类型 :
    引用类型,值大小不固定,栈内存中存放地址指向堆内存中的对象。是按引用访问的。
    栈内存中存放的只是该对象的访问地址,在堆内存中为这个值分配空间。由于这种值的大小不固定,
    因此不能把它们保存到栈内存中。但内存地址大小的固定的,因此可以将内存地址保存在栈内存中。
    这样,当查询引用类型的变量时, 先从栈中读取内存地址, 然后再通过地址找到堆中的值。对于这种,
    我们把它叫做按引用访问。

    浅拷贝只复制指向某个对象的引用地址,而不复制对象本身(只复制一层对象的属性),新旧对象还是共享同一块内存。
    但深拷贝会另外创造一个一模一样的对象,新对象跟原对象不共享内存,修改新对象不会改到原对象。
    浅复制只复制一层对象的属性,而深复制则递归复制了所有层级。
    import copy as cp
    L=[1,[2,3]]
    L1=cp.copy(L) #浅拷贝: 只是引用,并不会开辟新的内存空间,
                                                 L1与L指向同一片内存空间。L改变,L1也会锁着改变。
    L2=cp.deepcopy(L) #深拷贝:会为数据重新开辟一片内存空间,L的变化不会影响L2。


3.__new__() 与 __init__()的区别;
    _new_作用于_init_之前。前者可以决定是否调用后者,或者说可以决定调用哪个类的_init_方法。
    首先要知道在面向对象编程中,实例化基本遵循创建实例对象、初始化实例对象、最后返回实例对象这么一个过程。
    Python 中的 _new_ 方法负责创建一个实例对象,_init_ 方法负责将该实例对象进行初始化;

4.你知道几种设计模式;
    单例模式:保证一个类仅有一个实例,并提供一个访问他的全局访问点,例如框架中的数据库连接
    装饰器模式:不修改元类代码和继承的情况下动态扩展类的功能,例如框架中的每个controller文件会提供before和after方法。
    迭代器模式: 提供一个方法顺序访问一个聚合对象中各个元素,在PHP中将继承 Iterator 类
    命令模式: 将”请求”封闭成对象, 以便使用不同的请求,队列或者日志来参数化其他对象. 命令模式也支持可撤销的操作.

5.编码和解码你了解过么;
    数据通过编码decode转换成Unicode编码,编码的同时会将数据变成byte类型,通过解码encode转换为utf-8。

6.列表推导list comprehension和生成器的优劣;
    [expr for iter_var in iterable] 列表推导式是将所有的值一次性加载到内存中
    (expr for iter_var in iterable)
    在大数据量处理时,生成器表达式的优势就体现出来了,因为它的内存使用方式更好,
    效率更高,它并不创建一个列表,只是返回一个生成器。

7.什么是装饰器;如果想在函数之后进行装饰,应该怎么做;
    装饰器是一个函数,这个函数的主要作用是包装另一个函数或类
    包装的目的是在不改变原函数名的情况下改变被包装对象的行为。
    接收一个函数,内部对其包装,然后返回一个新函数,这样子动态的增强函数功能
    通过高阶函数传递函数参数,新函数添加旧函数的需求,然后执行旧函数。

8.手写个使用装饰器实现的单例模式;

    该模式的主要目的是确保某一个类只有一个实例存在。
    from functools import warps
    def My_decorate(f):
        @warps(f)
        def fn(*args,**kwargs):
            print('decorate called')
            return f(*args,**kwargs)
        return fn
    @My_decorate
    def fx():
        pring('fx called')
    fx()

9.使用装饰器的单例和使用其他方法的单例,在后续使用中,有何区别;
    使用装饰器单例属性不会被覆盖。因为装饰器单例模式是直接返回之前生成的对象,
    并不会重新初始化对象。像new方法构建的单例模式会重新调用init方法,为实例重新初始化属性。

10.手写:正则邮箱地址;
    pattern = '[a-zA-Z0-9_.-]+@[a-zA-Z0-9]+\.[a-z]'    
    匹配身份证:
    pattern = '(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)'
    pattern = '^[1-9]\d{5}(18|19|([23]\d))\d{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)\d{3}[0-9Xx]$'

11.介绍下垃圾回收:引用计数/分代回收/孤立引用环;
    垃圾回收:python解释器对正在使用的对象保持计数,当某个对像的引用计数降为0时,垃圾收集器就可以释放
                        该对象,获取分配的内存。当分配对象和取消分配对象的差值高于阈值时垃圾回收才会启动。
    分代回收:python将所有的对象分为0,1,2三代。所有的新建对象都是0代对象。当某一代对象经历过垃圾回收,
                        依然存活,那么它就被归入下一代对象。垃圾回收启动时,一定会扫描所有的0代对象。
                        如果0代经过一定次数垃圾回收,那么就启动对0代和1代的扫描清理。
                        当1代也经历了一定次数的垃圾回收后,那么会启动对0,1,2,即对所有对象进行扫描。
    孤立引用环:
    
12.多进程与多线程的区别;CPU密集型适合用什么;
    多线程:在单个程序中同时运行多个线程完成不同的工作,称为多线程。
    线程共享内存空间;进程的内存是独立的,
    同一个进程的线程之间可以直接交流;两个进程想通信,必须通过一个中间代理来实现,
    一个线程可以控制和操作同一进程里的其他线程;但是进程只能操作子进程
    优缺点:1.多进程的优点是稳定性好,一个子进程崩溃了,不会影响主进程以及其余进程。
                    但是缺点是创建进程的代价非常大,因为操作系统要给每个进程分配固定的资源。
                    2.多线程优点是效率较高一些,但是致命的缺点是任何一个线程崩溃都可能
                    造成整个进程的崩溃,因为它们共享了进程的内存资源池。
    *CPU密集型适合用多进程开发

13.进程通信的方式有几种;
    进程间通信主要包括管道, 系统IPC(包括消息队列,信号量,共享存储), SOCKET

14.介绍下协程,为何比线程还快;
    高并发+高扩展性+低成本:一个CPU支持上万的协程都不是问题。所以很适合用于高并发处理
    协程能保留上一次调用时的状态,管是进程还是线程,每次阻塞、切换都需要陷入系统调用,
    使用线程时需要非常小心地处理同步问题,而协程完全不存在这个问题。
    
15.range和xrange的区别
    xrange和range 的用法完全相同,但是返回的是一个生成器。
 
算法排序部分
 
16.手写快排;堆排;几种常用排序的算法复杂度是多少;快排平均复杂度多少,最坏情况如何优化;

17.手写:已知一个长度n的无序列表,元素均是数字,要求把所有间隔为d的组合找出来,你写的解法算法复杂度多少;
    def func(x, d):
        L = []
        n = len(x)
        if d > n:
            return None
        L.append(x[0])
        a = d + 1
        while a < n:
            L.append(x[a])
            a = a + d + 1
        return L

    list = [x for x in range(100)]
    result = func(list, 10)
    print(result)
    我写的只考虑到从第一个元素开始组合。没有考虑从第二个,第三个元素开始......求大神提供完全正确方法。
        
        
18.手写:一个列表A=[A1,A2,…,An],要求把列表中所有的组合情况打印出来;
    
19.手写:用一行python写出1+2+3+…+10**8 ;
    s = sum([x for x in range(1,10**8+1)])

20.手写python:用递归的方式判断字符串是否为回文;
    def isHuiWen(str):
        if(len(str) <2):
            return True
        if str[0] !=str[-1]:
            return False
        return isHuiWen(str[1:-1])

    str = input("请输入一个字符串:")
    if isHuiWen(str):
        print("该字符串为回文字符串")
    else:
        print("该字符串不是回文")
            
21.单向链表长度未知,如何判断其中是否有环;
22.单向链表如何使用快速排序算法进行排序;
23.手写:一个长度n的无序数字元素列表,如何求中位数,如何尽快的估算中位数,
    你的算法复杂度是多少;
def func(list):
    if len(list) <= 1:
        return list
    L = sorted(list)
    n = len(list) % 2
    m = len(list) // 2
    if n == 0:
        s = (L[m] + L[m-1]) / 2
        return s
    s = L[m]
    return s

l = [1,2,6,84,12,62,100]
print(func(l))

24.如何遍历一个内部未知的文件夹(两种树的优先遍历方式)
 
网络基础部分
 
25.TCP/IP分别在模型的哪一层;
    TCP 在传输层,
    IP在网络层

26.socket长连接是什么意思;
    在一个TCP连接上可以连续发送多个数据包,在TCP连接保持期间,如果没有数据包发送,
    需要双方发检测包以维持此链接,一般需要自己做在线维持。
    长连接指建立SOCKET连接后不管是否使用都保持连接,但安全性较差
    数据库的连接用长连接。如果用短连接频繁的通信会造成socket错误,
    而且频繁的socket创建也是对资源的浪费

27.select和epoll你了解么,区别在哪;

28.TCP UDP区别;三次握手四次挥手讲一下;
    TCP协议:  (在传输之前先建立连接)面向连接(的通信服务):可靠地数据传输,失序,无差错,无丢失,无重复
    用途:适用于传输内容比较大,网络情况比较好,需要提供准确的情况.比如:聊天信息,文字传输,邮件传输。
    udp 协议:面向无连接的服务,不可靠,发送时由发送端自主进行,不考虑接收端。
    用途:适用于网络较差,对传输准确性要求低,广播组播.比如:视频会议,广播数据。

    三次握手:
    1.客户端向服务器发起链接请求(问是否可以连接)
    2.服务器接受到请求后进行确认(允许连接)返回报文
    3.客户端收到许可,建立连接

    四次挥手:
    1.主动方发送报文告知被动方要断开连接
    2.被动发返回报文没告知收到请求,准备断开
    3.被动发发送报文给主动方告知准备就绪可以断开
    4.主动方发送报文确定断开
29.TIME_WAIT过多是因为什么;
30.http一次连接的全过程:你来说下从用户发起request——到用户接收到response;
    域名解析 --> 发起TCP的3次握手 --> 建立TCP连接后发起http请求 --> 服务器响应http请求,
    浏览器得到html代码 --> 浏览器解析html代码,并请求html代码中的资源(如js、css、图片等)
    --> 浏览器对页面进行渲染呈现给用户.
    参考大神文章:https://www.cnblogs.com/engeng/articles/5959335.html
31.http连接方式。get和post的区别,你还了解其他的方式么;
    get是从服务器上获取数据,post是向服务器传送数据。在客户端, get方式在通过URL提交数据,
    数据在URL中可以看到;post方式,数据放置在HTML HEADER内提交。
    对于get方式,服务器端用Request.QueryString获取变量的值,
    对于post方式,服务器端用Request.Form获取提交的数据。
    Get 方式提交数据,会带来安全问题,比如一个登陆页面,通过 Get 方式提交数据时,
    用户名和密码将出现在 URL 上,如果页面可以被缓存或者其他人可以访问客户这台机器,
    就可以从历史记录获得该用户的帐号和密码,所以表单提交建议使用 Post 方法。
32.restful你知道么;
33.状态码你知道多少,比如200/403/404/504等等;
 200:操作成功。
 403:访问受限,授权过期(错误提示)
 404:资源,服务器未找到
 504:网关超时,服务器作为网关或代理,但是没有及时从上游服务器收到请求。

你可能感兴趣的:(python)