Python常见面试题

Python 30道高频面试题及详细解答

1.如何用一行代码生成[1,3,5,7,9,11,13,15,17,19]
Python常见面试题_第1张图片
2 .写一个等差数列
产生一个首项为8,公差为12,末项不大于100的列表
Python常见面试题_第2张图片
3.一行代码求1到1000内的整数和
Python常见面试题_第3张图片
4.字典按Value排序并返回新字典
简单的一个字典排序问题,字典是Python最重要的三大基础数据结构
Python常见面试题_第4张图片
5. 打乱一个列表
使用random模块可以轻松搞定,不得不说这个random库其实很有用,里面有很多重要的函数值得大家熟练掌握
Python常见面试题_第5张图片
6.如何删除list里面的重复的元素并保证顺序并不变化
很多人第一时间会想到set(),set可以去重复的,但是不能保证列表元素的顺序,正确的玩法是这样的:
Python常见面试题_第6张图片
7.字符串处理成字典
输入一个长的字符串,如何快速的编程字典,简单的规则可以用split,如果是复杂的需要构造自定义的正则去处理。
Python常见面试题_第7张图片
8.怎么找出两个列表的相同元素和不同元素
给定两个列表,需要你快速的寻找相同的元素,可以用很多方法,自己写算法也可以直接用set里面的内置函数intersection()和difference()
Python常见面试题_第8张图片
9.输入一个日期,判断这一天是今年的哪一天
日期的使用也是非常常见的,面试的时候会经常问,Python里面的datatime模块能轻松处理大部分的日期问题
Python常见面试题_第9张图片
10.遍历目录内子目录,抓取zip文件
利用os模块,walk方法进行层层遍历所有的文件,os.path.splittext()返回文件的名字和扩展名,然后过滤。这道题的出镜率还是很高,小编曾经面试某H公司就被问到的
Python常见面试题_第10张图片
11.如果你的PC是4G内存,如何处理1个10G的csv文件
可以用两种方法,使用Python的生成器yield 分行读取,还有就是用Python里面的神器pandas,这个库是Python玩数据分析最最厉害的库,设置里面的read_csv函数的chunk值即可,pandas是用c语言写的,处理大数据速度很快
Python常见面试题_第11张图片
12.统计一个单词本里面频次最高的10个单词
使用yield进行数据读取逐行读取,然后用正则进行清洗,最后保存到defaultdict对象中。
Python常见面试题_第12张图片
13.如何反转一个整数,比如-12345 变成-54321
这道题目还是稍微有点复杂的,需要化解为下面几步处理:

  • 如何x位于(-10,10)区间,直接返回;
  • 然后把x转换为字符串的对象sx;
  • 如果x是负数,截取sx[1:],并反转字符串;
  • 如果x是正数,直接反转字符串;
  • 最后使用内置函数int()转为整数;
    Python常见面试题_第13张图片
    14.lambda函数的形参和返回值
    key值为lambda函数,说说lambda函数的形参和返回值?lambda函数在Python里面颇为神秘,用的好可以事半功倍,但是你是否真的理解它。
    Python常见面试题_第14张图片
    lambda的函数的形参为s,解包之后的元素值为{1,3,5,7},{1,5,7},{2,4,6,7,8}然后取它们的长度为4,3,5

15.使用filter()来求出列表中大于10的元素
filter函数配合lambda函数,可以轻松过滤
Python常见面试题_第15张图片
16.可变类型和不可变类型,列举3个
可变类型有list,dict,deque
不可变类型有字符串str,int,float,tuple

17. is 和==有什么区别
is 是用来判断两个对象的标示号(内存地址)是否相等
==是用来判断或者内容值是否相等

18.有什么方法可以获取类的所有属性和方法?
获取一个下面的类的所有属性和方法,可以使用dir()内置函数
Python常见面试题_第16张图片

1、 遇到过得反爬虫策略以及解决方法?

1.通过headers反爬虫
2.基于用户行为的发爬虫:(同一IP短时间内访问的频率)
3.动态网页反爬虫(通过ajax请求数据,或者通过JavaScript生成)
4.对部分数据进行加密处理的(数据是乱码)

解决方法:

对于基本网页的抓取可以自定义headers,添加headers的数据 使用多个代理ip进行抓取或者设置抓取的频率降低一些, 动态网页的可以使用selenium + phantomjs 进行抓取 对部分数据进行加密的,可以使用selenium进行截图,使用python自带的pytesseract库进行识别,但是比较慢最直接的方法是找到加密的方法进行逆向推理。

1、urllib 和 urllib2 的区别?

  • urllib
    和urllib2都是接受URL请求的相关模块,但是urllib2可以接受一个Request类的实例来设置URL请求的headers,urllib仅可以接受URL。urllib不可以伪装你的User-Agent字符串。
  • urllib提供urlencode()方法用来GET查询字符串的产生,而urllib2没有。这是为何urllib常和urllib2一起使用的原因。

2、列举网络爬虫所用到的网络数据包,解析包?

  • 网络数据包 urllib、urllib2、requests
  • 解析包 re、xpath、beautiful soup、lxml

3、简述一下爬虫的步骤?

  • 确定需求;
  • 确定资源;
  • 通过url获取网站的返回数据;
  • 定位数据;
  • 存储数据。

遇到反爬机制怎么处理?

反爬机制:

headers方向 判断User-Agent、判断Referer、判断Cookie。将浏览器的headers信息全部添加进去 注意:Accept-Encoding;gzip,deflate需要注释掉

5、常见的HTTP方法有哪些?

  • GET:请求指定的页面信息,返回实体主体;
  • HEAD:类似于get请求,只不过返回的响应中没有具体的内容,用于捕获报头;
  • POST:向指定资源提交数据进行处理请求(比如表单提交或者上传文件),。数据被包含在请求体中。
  • PUT:从客户端向服务端传送数据取代指定的文档的内容;
  • DELETE:请求删除指定的页面;
  • CONNNECT:HTTP1.1协议中预留给能够将连接方式改为管道方式的代理服务器;
  • OPTIONS:允许客户端查看服务器的性能
    TRACE:回显服务器的请求,主要用于测试或者诊断。

6、说一说redis-scrapy中redis的作用?

它是将scrapy框架中Scheduler替换为redis数据库,实现队列管理共享。

优点:

可以充分利用多台机器的带宽;
可以充分利用多台机器的IP地址。

7 遇到的反爬虫策略以及解决方法?

  • 通过headers反爬虫:自定义headers,添加网页中的headers数据。
  • 基于用户行为的反爬虫(封IP):可以使用多个代理IP爬取或者将爬取的频率降低。
  • 动态网页反爬虫(JS或者Ajax请求数据):动态网页可以使用 selenium + phantomjs 抓取。
  • 对部分数据加密处理(数据乱码):找到加密方法进行逆向推理。

9、如果让你来防范网站爬虫,你应该怎么来提高爬取的难度 ?

  • 判断headers的User-Agent;
  • 检测同一个IP的访问频率;
  • 数据通过Ajax获取;
  • 爬取行为是对页面的源文件爬取,如果要爬取静态网页的html代码,可以使用jquery去模仿写html。

10、scrapy分为几个组成部分?分别有什么作用?

分为5个部分;Spiders(爬虫类),Scrapy Engine(引擎),Scheduler(调度器),Downloader(下载器),Item Pipeline(处理管道)。

  • Spiders:开发者自定义的一个类,用来解析网页并抓取指定url返回的内容。
  • Scrapy Engine:控制整个系统的数据处理流程,并进行事务处理的触发。
  • Scheduler:接收Engine发出的requests,并将这些requests放入到处理列队中,以便之后engine需要时再提供。
  • Download:抓取网页信息提供给engine,进而转发至Spiders。
  • Item Pipeline:负责处理Spiders类提取之后的数据。比如清理HTML数据、验证爬取的数据(检查item包含某些字段)、查重(并丢弃)、将爬取结果保存到数据库中

11、简述一下scrapy的基本流程?

Python常见面试题_第17张图片

scrapy分为9个步骤:

  • Spiders需要初始的start_url或则函数stsrt_requests,会在内部生成Requests给Engine;
  • Engine将requests发送给Scheduler;
  • Engine从Scheduler那获取requests,交给Download下载;
  • 在交给Dowmload过程中会经过Downloader Middlewares(经过process_request函数);
  • Dowmloader下载页面后生成一个response,这个response会传给Engine,这个过程中又经过了Downloader Middlerwares(经过process_request函数),在传送中出错的话经过process_exception函数;
  • Engine将从Downloader那传送过来的response发送给Spiders处理,这个过程经过Spiders Middlerwares(经过process_spider_input函数);
  • Spiders处理这个response,返回Requests或者Item两个类型,传给Engine,这个过程又经过Spiders Middlewares(经过porcess_spider_output函数);
  • Engine接收返回的信息,如果使Item,将它传给Items Pipeline中;如果是Requests,将它传给Scheduler,继续爬虫;
  • 重复第三步,直至没有任何需要爬取的数据。

python2020年最新面试题

1:Python有哪些特点和优点?

答:作为一门编程入门语言,Python主要有以下特点和优点:
可解释
具有动态特性
面向对象
简明简单
开源
具有强大的社区支持

2:深拷贝和浅拷贝之间的区别是什么?

答:深拷贝就是将一个对象拷贝到另一个对象中,这意味着如果你对一个对象的拷贝做出改变时,不会影响原对象。在Python中,我们使用函数deepcopy()执行深拷贝,导入模块copy,如下所示:

>>> import copy
>>> b=copy.deepcopy(a)

Python常见面试题_第18张图片
而浅拷贝则是将一个对象的引用拷贝到另一个对象上,所以如果我们在拷贝中改动,会影响到原对象。我们使用函数function()执行浅拷贝,使用如下所示:

>>> b=copy.copy(a)

Python常见面试题_第19张图片

3. 列表和元组之间的区别是?

答:二者的主要区别是列表是可变的,而元组是不可变的。举个例子,如下所示:

>>> mylist=[1,3,3]
>>> mylist[1]=2
>>> mytuple=(1,3,3)
>>> mytuple[1]=2
Traceback (most recent call last):
File "", line 1, in <module>
mytuple[1]=2

会出现以下报错:

TypeError: ‘tuple’ object does not support item assignment

关于列表和元组的更多内容,可以查看这里:
从Q4到Q20都是针对新手的Python面试基础试题,不过有经验的人也可以看看这些问题,复习一下基础概念。

4. 解释一下Python中的三元运算子

不像C++,我们在Python中没有?:,但我们有这个:

[on true] if [expression] else [on false]

如果表达式为True,就执行[on true]中的语句。否则,就执行[on false]中的语句。
下面是使用它的方法:

>> a,b=2,3
>>> min=a if a<b else b
>>> min

运行结果:2
>>> print("Hi") if a<b else print("Bye")

运行结果:Hi

5. 在Python中如何实现多线程?

一个线程就是一个轻量级进程,多线程能让我们一次执行多个线程。我们都知道,Python是多线程语言,其内置有多线程工具包。
Python中的GIL(全局解释器锁)确保一次执行单个线程。一个线程保存GIL并在将其传递给下个线程之前执行一些操作,这会让我们产生并行运行的错觉。但实际上,只是线程在CPU上轮流运行。当然,所有的传递会增加程序执行的内存压力。

6. 解释一下Python中的继承

当一个类继承自另一个类,它就被称为一个子类/派生类,继承自父类/基类/超类。它会继承/获取所有类成员(属性和方法)。
继承能让我们重新使用代码,也能更容易的创建和维护应用。Python支持如下种类的继承:
单继承:一个类继承自单个基类
多继承:一个类继承自多个基类
多级继承:一个类继承自单个基类,后者则继承自另一个基类
分层继承:多个类继承自单个基类
混合继承:两种或多种类型继承的混合

7. 什么是Flask?

Flask是Python编写的一款轻量级Web应用框架。其 WSGI 工具箱采用 Werkzeug ,模板引擎则使用 Jinja2。Flask使用 BSD 授权。其中两个环境依赖是Werkzeug和jinja2,这意味着它不需要依赖外部库。正因如此,我们将其称为轻量级框架。
Flask会话使用签名cookie让用户查看和修改会话内容。它会记录从一个请求到另一个请求的信息。不过,要想修改会话,用户必须有密钥Flask.secret_key。

8. 在Python中是如何管理内存的?

Python有一个私有堆空间来保存所有的对象和数据结构。作为开发者,我们无法访问它,是解释器在管理它。但是有了核心API后,我们可以访问一些工具。Python内存管理器控制内存分配。
另外,内置垃圾回收器会回收使用所有的未使用内存,所以使其适用于堆空间。

9. 解释Python中的help()和dir()函数

Help()函数是一个内置函数,用于查看函数或模块用途的详细说明:

>>> import copy
>>> help(copy.copy)

运行结果为:

Help on function copy in module copy:
copy(x)
 Shallow copy operation on arbitrary Python objects.
 See the module’s __doc__ string for more info.

Dir()函数也是Python内置函数,dir() 函数不带参数时,返回当前范围内的变量、方法和定义的类型列表;带参数时,返回参数的属性、方法列表。

>>> dir(copy.copy)

运行结果为:
[‘annotations’, ‘call’, ‘class’, ‘closure’, ‘__code

10. 当退出Python时,是否释放全部内存?

答案是No。循环引用其它对象或引用自全局命名空间的对象的模块,在Python退出时并非完全释放。
另外,也不会释放C库保留的内存部分。

11. 什么是猴子补丁?

在运行期间动态修改一个类或模块。

>>> class A:
    def func(self):
        print("Hi")
>>> def monkey(self):
print "Hi, monkey"
>>> m.A.func = monkey
>>> a = m.A()
>>> a.func()

运行结果为:
Hi, Monkey

12. Python中的字典是什么?

字典是C++和Java等编程语言中所没有的东西,它具有键值对。

>>> roots={25:5,16:4,9:3,4:2,1:1}
>>> type(roots)
<class 'dict'>
>>> roots[9]

运行结果为:
3
字典是不可变的,我们也能用一个推导式来创建它。

>>> roots={x**2:x for x in range(5,0,-1)}
>>> roots

运行结果:
{25: 5, 16: 4, 9: 3, 4: 2, 1: 1}

13. 请解释使用args和*kwargs的含义

当我们不知道向函数传递多少参数时,比如我们向传递一个列表或元组,我们就使用*args。

>>> def func(*args):
    for i in args:
        print(i)  
>>> func(3,2,1,4,7)

运行结果为:
3

2

1

4

7
在我们不知道该传递多少关键字参数时,使用**kwargs来收集关键字参数。

>>> def func(**kwargs):
    for i in kwargs:
        print(i,kwargs[i])
>>> func(a=1,b=2,c=7)

运行结果为:
a.1

b.2

c.7

14. 请写一个Python逻辑,计算一个文件中的大写字母数量

>>> import os

>>> os.chdir('C:\\Users\\lifei\\Desktop')
>>> with open('Today.txt') as today:
    count=0
    for i in today.read():
        if i.isupper():
            count+=1
print(count)

运行结果:
26

15. 什么是负索引?

我们先创建这样一个列表:

>>> mylist=[0,1,2,3,4,5,6,7,8]

负索引和正索引不同,它是从右边开始检索。

>>> mylist[-3]

运行结果:
6
它也能用于列表中的切片:

>>> mylist[-6:-1]

结果:
[3, 4, 5, 6, 7]

16. 如何以就地操作方式打乱一个列表的元素?

为了达到这个目的,我们从random模块中导入shuffle()函数。

>>> from random import shuffle
>>> shuffle(mylist)
>>> mylist

运行结果:
[3, 4, 8, 0, 5, 7, 6, 2, 1]

17. 解释Python中的join()和split()函数

Join()能让我们将指定字符添加至字符串中。

>>> ','.join('12345')

运行结果:
‘1,2,3,4,5’
Split()能让我们用指定字符分割字符串。

>>> '1,2,3,4,5'.split(',')

运行结果:
[‘1’, ‘2’, ‘3’, ‘4’, ‘5’]

18. Python区分大小写吗?

如果能区分像myname和Myname这样的标识符,那么它就是区分大小写的。也就是说它很在乎大写和小写。我们可以用Python试一试:

>>> myname='Ayushi'
>>> Myname
Traceback (most recent call last):
File "", line 1, in <module>

运行结果:
Myname

NameError: name ‘Myname’ is not defined
可以看到,这里出现了NameError,所以Python是区分大小写的。

19. Python中的标识符长度能有多长?

在Python中,标识符可以是任意长度。此外,我们在命名标识符时还必须遵守以下规则:
只能以下划线或者 A-Z/a-z 中的字母开头
其余部分可以使用 A-Z/a-z/0-9
区分大小写
关键字不能作为标识符,Python中共有如下关键字:
Python常见面试题_第20张图片

20. 怎么移除一个字符串中的前导空格?

字符串中的前导空格就是出现在字符串中第一个非空格字符前的空格。我们使用方法Istrip()可以将它从字符串中移除。

>>> '   Ayushi '.lstrip()

结果:
‘Ayushi ’
可以看到,该字符串既有前导字符,也有后缀字符,调用Istrip()去除了前导空格。如果我们想去除后缀空格,就用rstrip()方法。

>>> '   Ayushi '.rstrip()

结果:
‘ Ayushi’
从Q 21到Q 35是为有Python经验者准备的进阶版Python面试题。

21. 怎样将字符串转换为小写?

我们使用lower()方法。

>>> 'AyuShi'.lower()

结果:
‘ayushi’
使用upper()方法可以将其转换为大写。

>>> 'AyuShi'.upper()

结果:
‘AYUSHI’
另外,使用isupper()和islower()方法检查字符春是否全为大写或小写。

>>> 'AyuShi'.isupper()
False
 
>>> 'AYUSHI'.isupper()
True
 
>>> 'ayushi'.islower()
True
 
>>> '@yu$hi'.islower()
True
 
>>> '@YU$HI'.isupper()
True

那么,像@和$这样的字符既满足大写也满足小写。
Istitle()能告诉我们一个字符串是否为标题格式。

>>> 'The Corpse Bride'.istitle()
True

22. Python中的pass语句是什么?

在用Python写代码时,有时可能还没想好函数怎么写,只写了函数声明,但为了保证语法正确,必须输入一些东西,在这种情况下,我们会使用pass语句。

 >>> def func(*args):
           pass 
>>>

同样,break语句能让我们跳出循环。

>>> for i in range(7):
    if i==3: break
print(i)

结果:
0

1

2
最后,continue语句能让我们跳到下个循环。

>>> for i in range(7):
    if i==3: continue
print(i)

结果:
0

1

2

4

5

6

23. Python中的闭包是什么?

当一个嵌套函数在其外部区域引用了一个值时,该嵌套函数就是一个闭包。其意义就是会记录这个值。

>>> def A(x):
    def B():
        print(x)
    return B
>>> A(7)()

结果:
7

24. 解释一下Python中的//,%和 ** 运算符

//运算符执行地板除法(向下取整除),它会返回整除结果的整数部分。

>> 7//2
3

这里整除后会返回3.5。
同样地,执行取幂运算。ab会返回a的b次方。

>>> 2**10
1024

最后,%执行取模运算,返回除法的余数。

>>> 13%7
6
>>> 3.5%1.5
0.5

25. 在Python中有多少种运算符?解释一下算数运算符。

在Python中,我们有7种运算符:算术运算符、关系运算符、赋值运算符、逻辑运算符、位运算符、成员运算符、身份运算符。
我们有7个算术运算符,能让我们对数值进行算术运算:
1.加号(+),将两个值相加

>>> 7+8
15

2.减号(-),将第一个值减去第二个值

>>> 7-8
-1

3.乘号(*),将两个值相乘

>>> 7*8
56

4.除号(/),用第二个值除以第一个值

>>> 7/8
0.875
>>> 1/1
1.0

5.向下取整除、取模和取幂运算,参见上个问题。

26. 解释一下Python中的关系运算符

关系运算符用于比较两个值。
1.小于号(<),如果左边的值较小,则返回True。

>>> 'hi'<'Hi'
False

2.大于号(>),如果左边的值较大,则返回True。

>>> 1.1+2.2>3.3
True

3.小于等于号(<=),如果左边的值小于或等于右边的值,则返回Ture。

>>> 3.0<=3
True

4.大于等于号(>=),如果左边的值大于或等于右边的值,则返回True。

>>> True>=False
True

5.等于号(==),如果符号两边的值相等,则返回True。

>>> {1,3,2,2}=={1,2,3}
True

6.不等于号(!=),如果符号两边的值不相等,则返回True。

>>> True!=0.1
True
>>> False!=0.1
True

27. 解释一下Python中的赋值运算符

这在Python面试中是个重要的面试问题。
我们将所有的算术运算符和赋值符号放在一起展示:

>>> a=7
>>> a+=1
>>> a
8
 
>>> a-=1
>>> a
7
 
>>> a*=2
>>> a
14
 
>>> a/=2
>>> a
7.0 
 
>>> a**=2
>>> a
49
 
>>> a//=3
>>> a
16.0
 
>>> a%=4
>>> a
0.0

28. 解释一下Python中的逻辑运算符

Python中有3个逻辑运算符:and,or,not。

>>> False and True
False
 
>>> 7<7 or True
True
 
>>> not 2==2
False

29. 解释一下Python中的成员运算符

通过成员运算符‘in’和‘not in’,我们可以确认一个值是否是另一个值的成员。

>>> 'me' in 'disappointment'
True
 
>>> 'us' not in 'disappointment'
True

30. 解释一下Python中的身份运算符

这也是一个在Python面试中常问的问题。
通过身份运算符‘is’和‘is not’,我们可以确认两个值是否相同。

>>> 10 is '10'
False
 
>>> True is not False
True

31. 讲讲Python中的位运算符

该运算符按二进制位对值进行操作。
1.与(&),按位与运算符:参与运算的两个值,如果两个相应位都为1,则该位的结果为1,否则为0

>>> 0b110 & 0b010
2

2.或(|),按位或运算符:只要对应的二个二进位有一个为1时,结果位就为1。

>>> 3|2
3

3.异或(^),按位异或运算符:当两对应的二进位相异时,结果为1

>>> 3^2
1

4.取反(~),按位取反运算符:对数据的每个二进制位取反,即把1变为0,把0变为1

>>> ~2
-3

5.左位移(<<),运算数的各二进位全部左移若干位,由 << 右边的数字指定了移动的位数,高位丢弃,低位补0

>>> 1<<2
4

6.右位移(>>),把">>"左边的运算数的各二进位全部右移若干位,>> 右边的数字指定了移动的位数

>> 4>>2
1

32. 在Python中如何使用多进制数字?

我们在Python中,除十进制外还可以使用二进制、八进制和十六进制。
1.二进制数字由0和1组成,我们使用 0b 或 0B 前缀表示二进制数。

>>> int(0b1010)
10

2.使用bin()函数将一个数字转换为它的二进制形式。

>>> bin(0xf)0b1111’

3.八进制数由数字 0-7 组成,用前缀 0o 或 0O 表示 8 进制数。

>>> oct(8)0o10’

4.十六进数由数字 0-15 组成,用前缀 0x 或者 0X 表示 16 进制数。

>>> hex(16)0x10>>> hex(15)0xf

33. 怎样获取字典中所有键的列表?

使用 keys() 获取字典中的所有键

>>> mydict={'a':1,'b':2,'c':3,'e':5}
>>> mydict.keys()
dict_keys(['a', 'b', 'c', 'e'])

34. 为何不建议以下划线作为标识符的开头

因为Python并没有私有变量的概念,所以约定速成以下划线为开头来声明一个变量为私有。所以如果你不想让变量私有,就不要使用下划线开头。

35. 怎样声明多个变量并赋值?

一共有两种方式:

>>> a,b,c=3,4,5 #This assigns 3, 4, and 5 to a, b, and c respectively
>>> a=b=c=3 #This assigns 3 to a, b, and c

36. 元组的解封装是什么?

首先我们来看解封装:

>>> mytuple=3,4,5
>>> mytuple
(3, 4, 5)

这将 3,4,5 封装到元组 mytuple 中。
现在我们将这些值解封装到变量 x,y,z 中:

>>> x,y,z=mytuple
>>> x+y+z







参考链接 :

Python 30道高频面试题及详细解答 : https://mp.weixin.qq.com/s/sLsNDRbD7s9rHDlNZK-nLA

python2020年最新面试题 : https://mp.weixin.qq.com/s/_uj-COBQL1rvZ_KhvOi6Zg
作者:Python芸芸
链接:https://www.jianshu.com/p/232d3798af55

2020十大Python面试题 :
https://mp.weixin.qq.com/s/MekML5Tt1RHFo0-YVGwdSw

你可能感兴趣的:(python编程,面试)