1.如何用一行代码生成[1,3,5,7,9,11,13,15,17,19]
2 .写一个等差数列
产生一个首项为8,公差为12,末项不大于100的列表
3.一行代码求1到1000内的整数和
4.字典按Value排序并返回新字典
简单的一个字典排序问题,字典是Python最重要的三大基础数据结构
5. 打乱一个列表
使用random模块可以轻松搞定,不得不说这个random库其实很有用,里面有很多重要的函数值得大家熟练掌握
6.如何删除list里面的重复的元素并保证顺序并不变化
很多人第一时间会想到set(),set可以去重复的,但是不能保证列表元素的顺序,正确的玩法是这样的:
7.字符串处理成字典
输入一个长的字符串,如何快速的编程字典,简单的规则可以用split,如果是复杂的需要构造自定义的正则去处理。
8.怎么找出两个列表的相同元素和不同元素
给定两个列表,需要你快速的寻找相同的元素,可以用很多方法,自己写算法也可以直接用set里面的内置函数intersection()和difference()
9.输入一个日期,判断这一天是今年的哪一天
日期的使用也是非常常见的,面试的时候会经常问,Python里面的datatime模块能轻松处理大部分的日期问题
10.遍历目录内子目录,抓取zip文件
利用os模块,walk方法进行层层遍历所有的文件,os.path.splittext()返回文件的名字和扩展名,然后过滤。这道题的出镜率还是很高,小编曾经面试某H公司就被问到的
11.如果你的PC是4G内存,如何处理1个10G的csv文件
可以用两种方法,使用Python的生成器yield 分行读取,还有就是用Python里面的神器pandas,这个库是Python玩数据分析最最厉害的库,设置里面的read_csv函数的chunk值即可,pandas是用c语言写的,处理大数据速度很快
12.统计一个单词本里面频次最高的10个单词
使用yield进行数据读取逐行读取,然后用正则进行清洗,最后保存到defaultdict对象中。
13.如何反转一个整数,比如-12345 变成-54321
这道题目还是稍微有点复杂的,需要化解为下面几步处理:
15.使用filter()来求出列表中大于10的元素
filter函数配合lambda函数,可以轻松过滤
16.可变类型和不可变类型,列举3个
可变类型有list,dict,deque
不可变类型有字符串str,int,float,tuple
17. is 和==有什么区别
is 是用来判断两个对象的标示号(内存地址)是否相等
==是用来判断或者内容值是否相等
18.有什么方法可以获取类的所有属性和方法?
获取一个下面的类的所有属性和方法,可以使用dir()内置函数
1.通过headers反爬虫
2.基于用户行为的发爬虫:(同一IP短时间内访问的频率)
3.动态网页反爬虫(通过ajax请求数据,或者通过JavaScript生成)
4.对部分数据进行加密处理的(数据是乱码)
对于基本网页的抓取可以自定义headers,添加headers的数据 使用多个代理ip进行抓取或者设置抓取的频率降低一些, 动态网页的可以使用selenium + phantomjs 进行抓取 对部分数据进行加密的,可以使用selenium进行截图,使用python自带的pytesseract库进行识别,但是比较慢最直接的方法是找到加密的方法进行逆向推理。
反爬机制:
headers方向 判断User-Agent、判断Referer、判断Cookie。将浏览器的headers信息全部添加进去 注意:Accept-Encoding;gzip,deflate需要注释掉
它是将scrapy框架中Scheduler替换为redis数据库,实现队列管理共享。
优点:
可以充分利用多台机器的带宽;
可以充分利用多台机器的IP地址。
分为5个部分;Spiders(爬虫类),Scrapy Engine(引擎),Scheduler(调度器),Downloader(下载器),Item Pipeline(处理管道)。
答:作为一门编程入门语言,Python主要有以下特点和优点:
可解释
具有动态特性
面向对象
简明简单
开源
具有强大的社区支持
答:深拷贝就是将一个对象拷贝到另一个对象中,这意味着如果你对一个对象的拷贝做出改变时,不会影响原对象。在Python中,我们使用函数deepcopy()执行深拷贝,导入模块copy,如下所示:
>>> import copy
>>> b=copy.deepcopy(a)
而浅拷贝则是将一个对象的引用拷贝到另一个对象上,所以如果我们在拷贝中改动,会影响到原对象。我们使用函数function()执行浅拷贝,使用如下所示:
>>> b=copy.copy(a)
答:二者的主要区别是列表是可变的,而元组是不可变的。举个例子,如下所示:
>>> mylist=[1,3,3]
>>> mylist[1]=2
>>> mytuple=(1,3,3)
>>> mytuple[1]=2
Traceback (most recent call last):
File "" , line 1, in <module>
mytuple[1]=2
会出现以下报错:
TypeError: ‘tuple’ object does not support item assignment
关于列表和元组的更多内容,可以查看这里:
从Q4到Q20都是针对新手的Python面试基础试题,不过有经验的人也可以看看这些问题,复习一下基础概念。
不像C++,我们在Python中没有?:,但我们有这个:
[on true] if [expression] else [on false]
如果表达式为True,就执行[on true]中的语句。否则,就执行[on false]中的语句。
下面是使用它的方法:
>> a,b=2,3
>>> min=a if a<b else b
>>> min
运行结果:2
>>> print("Hi") if a<b else print("Bye")
运行结果:Hi
一个线程就是一个轻量级进程,多线程能让我们一次执行多个线程。我们都知道,Python是多线程语言,其内置有多线程工具包。
Python中的GIL(全局解释器锁)确保一次执行单个线程。一个线程保存GIL并在将其传递给下个线程之前执行一些操作,这会让我们产生并行运行的错觉。但实际上,只是线程在CPU上轮流运行。当然,所有的传递会增加程序执行的内存压力。
当一个类继承自另一个类,它就被称为一个子类/派生类,继承自父类/基类/超类。它会继承/获取所有类成员(属性和方法)。
继承能让我们重新使用代码,也能更容易的创建和维护应用。Python支持如下种类的继承:
单继承:一个类继承自单个基类
多继承:一个类继承自多个基类
多级继承:一个类继承自单个基类,后者则继承自另一个基类
分层继承:多个类继承自单个基类
混合继承:两种或多种类型继承的混合
Flask是Python编写的一款轻量级Web应用框架。其 WSGI 工具箱采用 Werkzeug ,模板引擎则使用 Jinja2。Flask使用 BSD 授权。其中两个环境依赖是Werkzeug和jinja2,这意味着它不需要依赖外部库。正因如此,我们将其称为轻量级框架。
Flask会话使用签名cookie让用户查看和修改会话内容。它会记录从一个请求到另一个请求的信息。不过,要想修改会话,用户必须有密钥Flask.secret_key。
Python有一个私有堆空间来保存所有的对象和数据结构。作为开发者,我们无法访问它,是解释器在管理它。但是有了核心API后,我们可以访问一些工具。Python内存管理器控制内存分配。
另外,内置垃圾回收器会回收使用所有的未使用内存,所以使其适用于堆空间。
Help()函数是一个内置函数,用于查看函数或模块用途的详细说明:
>>> import copy
>>> help(copy.copy)
运行结果为:
Help on function copy in module copy:
copy(x)
Shallow copy operation on arbitrary Python objects.
See the module’s __doc__ string for more info.
Dir()函数也是Python内置函数,dir() 函数不带参数时,返回当前范围内的变量、方法和定义的类型列表;带参数时,返回参数的属性、方法列表。
>>> dir(copy.copy)
运行结果为:
[‘annotations’, ‘call’, ‘class’, ‘closure’, ‘__code
答案是No。循环引用其它对象或引用自全局命名空间的对象的模块,在Python退出时并非完全释放。
另外,也不会释放C库保留的内存部分。
在运行期间动态修改一个类或模块。
>>> class A:
def func(self):
print("Hi")
>>> def monkey(self):
print "Hi, monkey"
>>> m.A.func = monkey
>>> a = m.A()
>>> a.func()
运行结果为:
Hi, Monkey
字典是C++和Java等编程语言中所没有的东西,它具有键值对。
>>> roots={25:5,16:4,9:3,4:2,1:1}
>>> type(roots)
<class 'dict'>
>>> roots[9]
运行结果为:
3
字典是不可变的,我们也能用一个推导式来创建它。
>>> roots={x**2:x for x in range(5,0,-1)}
>>> roots
运行结果:
{25: 5, 16: 4, 9: 3, 4: 2, 1: 1}
当我们不知道向函数传递多少参数时,比如我们向传递一个列表或元组,我们就使用*args。
>>> def func(*args):
for i in args:
print(i)
>>> func(3,2,1,4,7)
运行结果为:
3
2
1
4
7
在我们不知道该传递多少关键字参数时,使用**kwargs来收集关键字参数。
>>> def func(**kwargs):
for i in kwargs:
print(i,kwargs[i])
>>> func(a=1,b=2,c=7)
运行结果为:
a.1
b.2
c.7
>>> import os
>>> os.chdir('C:\\Users\\lifei\\Desktop')
>>> with open('Today.txt') as today:
count=0
for i in today.read():
if i.isupper():
count+=1
print(count)
运行结果:
26
我们先创建这样一个列表:
>>> mylist=[0,1,2,3,4,5,6,7,8]
负索引和正索引不同,它是从右边开始检索。
>>> mylist[-3]
运行结果:
6
它也能用于列表中的切片:
>>> mylist[-6:-1]
结果:
[3, 4, 5, 6, 7]
为了达到这个目的,我们从random模块中导入shuffle()函数。
>>> from random import shuffle
>>> shuffle(mylist)
>>> mylist
运行结果:
[3, 4, 8, 0, 5, 7, 6, 2, 1]
Join()能让我们将指定字符添加至字符串中。
>>> ','.join('12345')
运行结果:
‘1,2,3,4,5’
Split()能让我们用指定字符分割字符串。
>>> '1,2,3,4,5'.split(',')
运行结果:
[‘1’, ‘2’, ‘3’, ‘4’, ‘5’]
如果能区分像myname和Myname这样的标识符,那么它就是区分大小写的。也就是说它很在乎大写和小写。我们可以用Python试一试:
>>> myname='Ayushi'
>>> Myname
Traceback (most recent call last):
File "" , line 1, in <module>
运行结果:
Myname
NameError: name ‘Myname’ is not defined
可以看到,这里出现了NameError,所以Python是区分大小写的。
在Python中,标识符可以是任意长度。此外,我们在命名标识符时还必须遵守以下规则:
只能以下划线或者 A-Z/a-z 中的字母开头
其余部分可以使用 A-Z/a-z/0-9
区分大小写
关键字不能作为标识符,Python中共有如下关键字:
字符串中的前导空格就是出现在字符串中第一个非空格字符前的空格。我们使用方法Istrip()可以将它从字符串中移除。
>>> ' Ayushi '.lstrip()
结果:
‘Ayushi ’
可以看到,该字符串既有前导字符,也有后缀字符,调用Istrip()去除了前导空格。如果我们想去除后缀空格,就用rstrip()方法。
>>> ' Ayushi '.rstrip()
结果:
‘ Ayushi’
从Q 21到Q 35是为有Python经验者准备的进阶版Python面试题。
我们使用lower()方法。
>>> 'AyuShi'.lower()
结果:
‘ayushi’
使用upper()方法可以将其转换为大写。
>>> 'AyuShi'.upper()
结果:
‘AYUSHI’
另外,使用isupper()和islower()方法检查字符春是否全为大写或小写。
>>> 'AyuShi'.isupper()
False
>>> 'AYUSHI'.isupper()
True
>>> 'ayushi'.islower()
True
>>> '@yu$hi'.islower()
True
>>> '@YU$HI'.isupper()
True
那么,像@和$这样的字符既满足大写也满足小写。
Istitle()能告诉我们一个字符串是否为标题格式。
>>> 'The Corpse Bride'.istitle()
True
在用Python写代码时,有时可能还没想好函数怎么写,只写了函数声明,但为了保证语法正确,必须输入一些东西,在这种情况下,我们会使用pass语句。
>>> def func(*args):
pass
>>>
同样,break语句能让我们跳出循环。
>>> for i in range(7):
if i==3: break
print(i)
结果:
0
1
2
最后,continue语句能让我们跳到下个循环。
>>> for i in range(7):
if i==3: continue
print(i)
结果:
0
1
2
4
5
6
当一个嵌套函数在其外部区域引用了一个值时,该嵌套函数就是一个闭包。其意义就是会记录这个值。
>>> def A(x):
def B():
print(x)
return B
>>> A(7)()
结果:
7
//运算符执行地板除法(向下取整除),它会返回整除结果的整数部分。
>> 7//2
3
这里整除后会返回3.5。
同样地,执行取幂运算。ab会返回a的b次方。
>>> 2**10
1024
最后,%执行取模运算,返回除法的余数。
>>> 13%7
6
>>> 3.5%1.5
0.5
在Python中,我们有7种运算符:算术运算符、关系运算符、赋值运算符、逻辑运算符、位运算符、成员运算符、身份运算符。
我们有7个算术运算符,能让我们对数值进行算术运算:
1.加号(+),将两个值相加
>>> 7+8
15
2.减号(-),将第一个值减去第二个值
>>> 7-8
-1
3.乘号(*),将两个值相乘
>>> 7*8
56
4.除号(/),用第二个值除以第一个值
>>> 7/8
0.875
>>> 1/1
1.0
5.向下取整除、取模和取幂运算,参见上个问题。
关系运算符用于比较两个值。
1.小于号(<),如果左边的值较小,则返回True。
>>> 'hi'<'Hi'
False
2.大于号(>),如果左边的值较大,则返回True。
>>> 1.1+2.2>3.3
True
3.小于等于号(<=),如果左边的值小于或等于右边的值,则返回Ture。
>>> 3.0<=3
True
4.大于等于号(>=),如果左边的值大于或等于右边的值,则返回True。
>>> True>=False
True
5.等于号(==),如果符号两边的值相等,则返回True。
>>> {1,3,2,2}=={1,2,3}
True
6.不等于号(!=),如果符号两边的值不相等,则返回True。
>>> True!=0.1
True
>>> False!=0.1
True
这在Python面试中是个重要的面试问题。
我们将所有的算术运算符和赋值符号放在一起展示:
>>> a=7
>>> a+=1
>>> a
8
>>> a-=1
>>> a
7
>>> a*=2
>>> a
14
>>> a/=2
>>> a
7.0
>>> a**=2
>>> a
49
>>> a//=3
>>> a
16.0
>>> a%=4
>>> a
0.0
Python中有3个逻辑运算符:and,or,not。
>>> False and True
False
>>> 7<7 or True
True
>>> not 2==2
False
通过成员运算符‘in’和‘not in’,我们可以确认一个值是否是另一个值的成员。
>>> 'me' in 'disappointment'
True
>>> 'us' not in 'disappointment'
True
这也是一个在Python面试中常问的问题。
通过身份运算符‘is’和‘is not’,我们可以确认两个值是否相同。
>>> 10 is '10'
False
>>> True is not False
True
该运算符按二进制位对值进行操作。
1.与(&),按位与运算符:参与运算的两个值,如果两个相应位都为1,则该位的结果为1,否则为0
>>> 0b110 & 0b010
2
2.或(|),按位或运算符:只要对应的二个二进位有一个为1时,结果位就为1。
>>> 3|2
3
3.异或(^),按位异或运算符:当两对应的二进位相异时,结果为1
>>> 3^2
1
4.取反(~),按位取反运算符:对数据的每个二进制位取反,即把1变为0,把0变为1
>>> ~2
-3
5.左位移(<<),运算数的各二进位全部左移若干位,由 << 右边的数字指定了移动的位数,高位丢弃,低位补0
>>> 1<<2
4
6.右位移(>>),把">>"左边的运算数的各二进位全部右移若干位,>> 右边的数字指定了移动的位数
>> 4>>2
1
我们在Python中,除十进制外还可以使用二进制、八进制和十六进制。
1.二进制数字由0和1组成,我们使用 0b 或 0B 前缀表示二进制数。
>>> int(0b1010)
10
2.使用bin()函数将一个数字转换为它的二进制形式。
>>> bin(0xf)
‘0b1111’
3.八进制数由数字 0-7 组成,用前缀 0o 或 0O 表示 8 进制数。
>>> oct(8)
‘0o10’
4.十六进数由数字 0-15 组成,用前缀 0x 或者 0X 表示 16 进制数。
>>> hex(16)
‘0x10’
>>> hex(15)
‘0xf’
使用 keys() 获取字典中的所有键
>>> mydict={'a':1,'b':2,'c':3,'e':5}
>>> mydict.keys()
dict_keys(['a', 'b', 'c', 'e'])
因为Python并没有私有变量的概念,所以约定速成以下划线为开头来声明一个变量为私有。所以如果你不想让变量私有,就不要使用下划线开头。
一共有两种方式:
>>> a,b,c=3,4,5 #This assigns 3, 4, and 5 to a, b, and c respectively
>>> a=b=c=3 #This assigns 3 to a, b, and c
首先我们来看解封装:
>>> mytuple=3,4,5
>>> mytuple
(3, 4, 5)
这将 3,4,5 封装到元组 mytuple 中。
现在我们将这些值解封装到变量 x,y,z 中:
>>> x,y,z=mytuple
>>> x+y+z
参考链接 :
Python 30道高频面试题及详细解答 : https://mp.weixin.qq.com/s/sLsNDRbD7s9rHDlNZK-nLA
python2020年最新面试题 : https://mp.weixin.qq.com/s/_uj-COBQL1rvZ_KhvOi6Zg
作者:Python芸芸
链接:https://www.jianshu.com/p/232d3798af55
2020十大Python面试题 :
https://mp.weixin.qq.com/s/MekML5Tt1RHFo0-YVGwdSw