1. python多线程
(1)python下多线程的限制以及多进程中传递参数的方式
python多线程有个全局解释器锁(global interpreter lock),这个锁的意思是任一时间只能有一个线程使用解释器,跟单cpu跑多个程序一个意思,大家都是轮着用的,这叫“并发”,不是“并行”。
多进程间共享数据,可以使用 multiprocessing.Value 和 multiprocessing.Array
(2)python多线程与多进程的区别
在UNIX平台上,当某个进程终结之后,该进程需要被其父进程调用wait,否则进程成为僵尸进程(Zombie)。所以,有必要对每个Process对象调用join()方法 (实际上等同于wait)。对于多线程来说,由于只有一个进程,所以不存在此必要性。
多进程应该避免共享资源。在多线程中,我们可以比较容易地共享资源,比如使用全局变量或者传递参数。在多进程情况下,由于每个进程有自己独立的内存空间,以上方法并不合适。此时我们可以通过共享内存和Manager的方法来共享资源。但这样做提高了程序的复杂度,并因为同步的需要而降低了程序的效率。
2.Python是如何进行内存管理的?
Python引用了一个内存池(memory pool)机制,即Pymalloc机制(malloc:n.分配内存),用于管理对小块内存的申请和释放
内存池(memory pool)的概念:
当 创建大量消耗小内存的对象时,频繁调用new/malloc会导致大量的内存碎片,致使效率降低。内存池的概念就是预先在内存中申请一定数量的,大小相等 的内存块留作备用,当有新的内存需求时,就先从内存池中分配内存给这个需求,不够了之后再申请新的内存。这样做最显著的优势就是能够减少内存碎片,提升效率。
内存池的实现方式有很多,性能和适用范围也不一样。
python中的内存管理机制——Pymalloc:
python中的内存管理机制都有两套实现,一套是针对小对象,就是大小小于256bits时,pymalloc会在内存池中申请内存空间;当大于256bits,则会直接执行new/malloc的行为来申请内存空间。
关于释放内存方面,当一个对象的引用计数变为0时,python就会调用它的析构函数。在析构时,也采用了内存池机制,从内存池来的内存会被归还到内存池中,以避免频繁地释放动作。
3.什么是lambda函数?它有什么好处?
lambda 函数是一个可以接收任意多个参数(包括可选参数)并且返回单个表达式值的函数。lambda 函数不能包含命令,它们所包含的表达式不能超过一个。不要试图向lambda 函数中塞入太多的东西;如果你需要更复杂的东西,应该定义一个普通函数,然后想让它多长就多长。
4.如何用Python输出一个Fibonacci数列?
1 a,b = 0, 1
2 while b<100:
3 print (b),
4 a, b = b, a+b
5.介绍一下Python中webbrowser的用法?
webbrowser模块提供了一个高级接口来显示基于Web的文档,大部分情况下只需要简单的调用open()方法。
webbrowser定义了如下的异常:
exception webbrowser.Error, 当浏览器控件发生错误是会抛出这个异常
webbrowser有以下方法:
webbrowser.open(url[, new=0[, autoraise=1]])
这个方法是在默认的浏览器中显示url, 如果new = 0, 那么url会在同一个浏览器窗口下打开,如果new = 1, 会打开一个新的窗口,如果new = 2, 会打开一个新的tab, 如果autoraise = true, 窗口会自动增长。
webbrowser.open_new(url)
在默认浏览器中打开一个新的窗口来显示url, 否则,在仅有的浏览器窗口中打开url
webbrowser.open_new_tab(url)
在默认浏览器中当开一个新的tab来显示url, 否则跟open_new()一样
webbrowser.get([name]) 根据name返回一个浏览器对象,如果name为空,则返回默认的浏览器
webbrowser.register(name, construtor[, instance])
注册一个名字为name的浏览器,如果这个浏览器类型被注册就可以用get()方法来获取。
6.解释一下python的and-or语法
http://www.kuqin.com/diveinto_python_document/apihelper_andor.html
与C表达式 bool ? a : b类似,但是bool and a or b,当 a 为假时,不会象C表达式 bool ? a : b 一样工作
应该将 and-or 技巧封装成一个函数:
def choose(bool, a, b):
return (bool and [a] or [b])[0]
因为 [a] 是一个非空列表,它永远不会为假。甚至 a 是 0 或 '' 或其它假值,列表[a]为真,因为它有一个元素。
7.how do I iterate over a sequence in reverse order
for x in reversed(sequence):
… # do something with x..
如果不是list, 最通用但是稍慢的解决方案是:
for i in range(len(sequence)-1, -1, -1):
x = sequence[i]
8.Python是如何进行类型转换的?
1 函数 描述
2 int(x [,base ]) 将x转换为一个整数
3 long(x [,base ]) 将x转换为一个长整数
4 float(x ) 将x转换到一个浮点数
5 complex(real [,imag ]) 创建一个复数
6 str(x ) 将对象 x 转换为字符串
7 repr(x ) 将对象 x 转换为表达式字符串
8 eval(str ) 用来计算在字符串中的有效Python表达式,并返回一个对象
9 tuple(s ) 将序列 s 转换为一个元组
10 list(s ) 将序列 s 转换为一个列表
11 chr(x ) 将一个整数转换为一个字符
12 unichr(x ) 将一个整数转换为Unicode字符
13 ord(x ) 将一个字符转换为它的整数值
14 hex(x ) 将一个整数转换为一个十六进制字符串
15 oct(x ) 将一个整数转换为一个八进制字符串
9.Python里面如何实现tuple和list的转换?
1 >>> l = tuple(iplist)
2 >>> print l
3 ('217.169.209.2:6666', '192.227.139.106:7808', '110.4.12.170:83', '69.197.132.80:7808', '205.164.41.101:3128', '63.141.249.37:8089', '27.34.142.47:9090')
4 >>> t = list(l)
5 >>> print t
6 ['217.169.209.2:6666', '192.227.139.106:7808', '110.4.12.170:83', '69.197.132.80:7808', '205.164.41.101:3128', '63.141.249.37:8089', '27.34.142.47:9090']
10.请写出一段Python代码实现删除一个list里面的重复元素
1 >>> l = [1,1,2,3,4,5,4]
2 >>> list(set(l))
3 [1, 2, 3, 4, 5]
4 或者
5 d = {}
6 for x in mylist:
7 d[x] = 1
8 mylist = list(d.keys())
11.Python如何实现单例模式?其他23种设计模式python如何实现?
1 #使用__metaclass__(元类)的高级python用法
2 class Singleton2(type):
3 def __init__(cls, name, bases, dict):
4 super(Singleton2, cls).__init__(name, bases, dict)
5 cls._instance = None
6 def __call__(cls, *args, **kw):
7 if cls._instance is None:
8 cls._instance = super(Singleton2, cls).__call__(*args, **kw)
9 return cls._instance
10
11 class MyClass3(object):
12 __metaclass__ = Singleton2
13
14 one = MyClass3()
15 two = MyClass3()
16
17 two.a = 3
18 print one.a
19 #3
20 print id(one)
21 #31495472
22 print id(two)
23 #31495472
24 print one == two
25 #True
26 print one is two
27 #True
1 #使用装饰器(decorator),
2 #这是一种更pythonic,更elegant的方法,
3 #单例类本身根本不知道自己是单例的,因为他本身(自己的代码)并不是单例的
4 def singleton(cls, *args, **kw):
5 instances = {}
6 def _singleton():
7 if cls not in instances:
8 instances[cls] = cls(*args, **kw)
9 return instances[cls]
10 return _singleton
11
12 @singleton
13 class MyClass4(object):
14 a = 1
15 def __init__(self, x=0):
16 self.x = x
17
18 one = MyClass4()
19 two = MyClass4()
20
21 two.a = 3
22 print one.a
23 #3
24 print id(one)
25 #29660784
26 print id(two)
27 #29660784
28 print one == two
29 #True
30 print one is two
31 #True
32 one.x = 1
33 print one.x
34 #1
35 print two.x
36 #1
12.Python里面如何拷贝一个对象?
标准库中的copy模块提供了两个方法来实现拷贝.一个方法是copy,它返回和参数包含内容一样的对象.
使用deepcopy方法,对象中的属性也被复制
13.介绍一下except的用法和作用?
Python的except用来捕获所有异常,因为Python里面的每次错误都会抛出一个异常,所以每个程序的错误都被当作一个运行时错误。
14.Python中pass语句的作用是什么?
pass语句什么也不做,一般作为占位符或者创建占位程序,pass语句不会执行任何操作
15.如何知道一个python对象的类型?
type()
16.介绍一下Python下range()函数的用法?
http://docs.python.org/library/functions.html#range
range(start, stop[, step])
17.如何用Python来进行查询和替换一个文本字符串?
可以使用sub()方法来进行查询和替换,sub方法的格式为:sub(replacement, string[, count=0])
replacement是被替换成的文本
string是需要被替换的文本
count是一个可选参数,指最大被替换的数量
18.Python里面search()和match()的区别?
match()函数只检测RE是不是在string的开始位置匹配,search()会扫描整个string查找匹配, 也就是说match()只有在0位置匹配成功的话才有返回,如果不是开始位置匹配成功的话,match()就返回none
19.用Python匹配HTML tag的时候,<.>和<.?>有什么区别?
前者是贪婪匹配,会从头到尾匹配 xyz,而后者是非贪婪匹配,只匹配到第一个 >。
20.Python里面如何生成随机数?
import random
random.random()
它会返回一个随机的0和1之间的浮点数
21.如何用Python来发送邮件?
python实现发送和接收邮件功能主要用到poplib和smtplib模块。
poplib用于接收邮件,而smtplib负责发送邮件。
代码如下:
1 #! /usr/bin/env python
2 #coding=utf-8
3 import sys
4 import time
5 import poplib
6 import smtplib
7 #邮件发送函数
8 def send_mail():
9 try:
10 handle = smtplib.SMTP('smtp.126.com',25)
11 handle.login('[email protected]','**********')
12 msg = 'To: [email protected]\r\nFrom:[email protected]\r\nSubject:hello\r\n'
13 handle.sendmail('[email protected]','[email protected]',msg)
14 handle.close()
15 return 1
16 except:
17 return 0
18 #邮件接收函数
19 def accpet_mail():
20 try:
21 p=poplib.POP3('pop.126.com')
22 p.user('[email protected]')
23 p.pass_('**********')
24 ret = p.stat() #返回一个元组:(邮件数,邮件尺寸)
25 #p.retr('邮件号码')方法返回一个元组:(状态信息,邮件,邮件尺寸)
26 except poplib.error_proto,e:
27 print "Login failed:",e
28 sys.exit(1)
29
30 #运行当前文件时,执行sendmail和accpet_mail函数
31 if __name__ == "__main__":
32 send_mail()
33 accpet_mail()
22.Python如何定义一个函数?
定义函数的格式是: def functionName(arg):
23.有没有一个工具可以帮助查找python的bug和进行静态的代码分析?
pycheck pylint
24.如何在一个function里面设置一个全局的变量?
global
25.有两个序列a,b,大小都为n,序列元素的值任意整形数,无序;
要求:通过交换a,b中的元素,使[序列a元素的和]与[序列b元素的和]之间的差最小。
分别计算a,b序列的和;
求a序列和与b序列和的差值的一半,记为half;
在和值大的序列中找出一个与和值小的序列中的元素max的差值最接近half的元素,记为min;
将max与min互换即可。
26.如何用Python删除一个文件?
使用os.remove(filename)或者os.unlink(filename);
27.Python如何copy一个文件?
shutil模块有一个copyfile函数可以实现文件拷贝
28.python程序中文输出问题怎么解决?
方法一:用encode和decode
如:
1 import os.path
2 import xlrd,sys
3
4 Filename=’/home/tom/Desktop/1234.xls’
5 if not os.path.isfile(Filename):
6 raise NameError,”%s is not a valid filename”%Filename
7
8 bk=xlrd.open_workbook(Filename)
9 shxrange=range(bk.nsheets)
10 print shxrange
11
12 for x in shxrange:
13 p=bk.sheets()[x].name.encode(‘utf-8′)
14 print p.decode(‘utf-8′)
方法二:
在文件开头加上
1 reload(sys)
2 sys.setdefaultencoding(‘utf8′)
29.python代码得到列表list的交集与差集
交集
1 b1=[1,2,3]
2 b2=[2,3,4]
3 b3 = [val for val in b1 if val in b2]
4 print b3
差集
1 b1=[1,2,3]
2 b2=[2,3,4]
3 b3 = [val for val in b1 if val not in b2]
4 print b3
30.写一个简单的python socket编程
python 编写server的步骤:
1.第一步是创建socket对象。调用socket构造函数。如:
socket = socket.socket( family, type )
family参数代表地址家族,可为AF_INET或AF_UNIX。AF_INET家族包括Internet地址,AF_UNIX家族用于同一台机器上的进程间通信。
type参数代表套接字类型,可为SOCK_STREAM(流套接字)和SOCK_DGRAM(数据报套接字)。
2.第二步是将socket绑定到指定地址。这是通过socket对象的bind方法来实现的:
socket.bind( address )
由AF_INET所创建的套接字,address地址必须是一个双元素元组,格式是(host,port)。host代表主机,port代表端口号。如果端口号正在使用、主机名不正确或端口已被保留,bind方法将引发socket.error异常。
3.第三步是使用socket套接字的listen方法接收连接请求。
socket.listen( backlog )
backlog指定最多允许多少个客户连接到服务器。它的值至少为1。收到连接请求后,这些请求需要排队,如果队列满,就拒绝请求。
4.第四步是服务器套接字通过socket的accept方法等待客户请求一个连接。
connection, address = socket.accept()
调用accept方法时,socket会进入“waiting”状态。客户请求连接时,方法建立连接并返回服务器。accept方法返回一个含有两个元素的元组(connection,address)。第一个元素connection是新的socket对象,服务器必须通过它与客户通信;第二个元素 address是客户的Internet地址。
5.第五步是处理阶段,服务器和客户端通过send和recv方法通信(传输 数据)。服务器调用send,并采用字符串形式向客户发送信息。send方法返回已发送的字符个数。服务器使用recv方法从客户接收信息。调用recv 时,服务器必须指定一个整数,它对应于可通过本次方法调用来接收的最大数据量。recv方法在接收数据时会进入“blocked”状态,最后返回一个字符 串,用它表示收到的数据。如果发送的数据量超过了recv所允许的,数据会被截短。多余的数据将缓冲于接收端。以后调用recv时,多余的数据会从缓冲区 删除(以及自上次调用recv以来,客户可能发送的其它任何数据)。
6.传输结束,服务器调用socket的close方法关闭连接。
python编写client的步骤:
创建一个socket以连接服务器:socket = socket.socket( family, type )
2.使用socket的connect方法连接服务器。对于AF_INET家族,连接格式如下:
socket.connect( (host,port) )
host代表服务器主机名或IP,port代表服务器进程所绑定的端口号。如连接成功,客户就可通过套接字与服务器通信,如果连接失败,会引发socket.error异常。
处理阶段,客户和服务器将通过send方法和recv方法通信。
传输结束,客户通过调用socket的close方法关闭连接。
下面给个简单的例子:
server.py
1 #coding:utf-8
2
3 import socket
4 if __name__ == '__main__':
5 sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
6 sock.bind(('localhost', 8001))
7 sock.listen(5)
8
9 while True:
10 connection,address = sock.accept()
11 try:
12 connection.settimeout(5)
13 buf = connection.recv(1024)
14 if buf == '1':
15 connection.send('welcome to server!')
16 else:
17 connection.send('please go out!')
18 except socket.timeout:
19 print 'time out'
20
21 connection.close()
client.py
1 #coding:utf-8
2
3 import socket
4 import time
5
6 if __name__ == '__main__':
7 sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
8 sock.connect(('localhost', 8001))
9 time.sleep(2)
10 sock.send('1')
11 print sock.recv(1024)
12 sock.close()
在终端运行server.py,然后运行clien.py,会在终端打印“welcome to server!"。
31.python如何捕获异常
(1)使用try和except语句来捕获异常
1 try:
2 block
3 except [exception,[data…]]:
4 block
5
6 try:
7 block
8 except [exception,[data...]]:
9 block
10 else:
11 block
捕获到的IOError错误的详细原因会被放置在对象e中,然后运行该python 异常处理的except代码块捕获所有的异常
(2)用raise语句手工引发一个异常:
1 raise [exception[,data]]
2
3 try:
4 raise MyError #自己抛出一个异常
5 except MyError:
6 print 'a error'
7
8 raise ValueError,’invalid argument’
(3)采用sys模块回溯最后的异常
1 import sys
2 try:
3 block
4 except:
5 info=sys.exc_info()
6 print info[0],":",info[1]
32.src = "security/afafsff/?ip=123.4.56.78&id=45",请写一段代码用正则匹配出ip
匹配ip地址的python正则表达式
pattern =
'^([01]?\d\d?|2[0-4]\d|25[0-5]).([01]?\d\d?|2[0-4]\d|25[0-5]).([01]?\d\d?|2[0-4]\d|25[0-5]).([01]?\d\d?|2[0-4]\d|25[0-5])$'
故本题答案
1 >>> re.findall(r'([01]?\d\d?|2[0-4]\d|25[0-5]).([01]?\d\d?|2[0-4]\d|25[0-5]).([01]?\d\d?|2[0-4]\d|25[0-5]).([01]?\d\d?|2[0-4]\d|25[0-5])', src)
2 [('123', '4', '56', '78')]
33.写一段代码用json数据的处理方式获取{"persons":[{"name":"yu","age":"23"},{"name":"zhang","age":"34"}]}这一段json中第一个人的名字。
1 json读取
2 >>> import json
3 >>> j = json.loads('{"persons":[{"name":"yu","age":"23"},{"name":"zhang","age":"34"}]}')
4 >>> print j
5 {u'persons': [{u'age': u'23', u'name': u'yu'}, {u'age': u'34', u'name': u'zhang'}]}
6 >>> print j.keys()
7 [u'persons']
8 >>> print j.values()
9 [[{u'age': u'23', u'name': u'yu'}, {u'age': u'34', u'name': u'zhang'}]]
10 >>> print j.values()[0]
11 [{u'age': u'23', u'name': u'yu'}, {u'age': u'34', u'name': u'zhang'}]
12 >>> print j.values()[0][0]
13 {u'age': u'23', u'name': u'yu'}
14 >>> print j.values()[0][0]['name']
15 yu
34.平衡点问题
平衡点:比如int[] numbers = {1,3,5,7,8,25,4,20}; 25前面的总和为24,25后面的总和也是24,25这个点就是平衡点;假如一个数组中的元素,其前面的部分等于后面的部分,那么这个点的位序就是平衡点
要求:返回任何一个平衡点
使用sum函数累加所有的数。
使用一个变量fore来累加序列的前部。直到满足条件fore<(total-number)/2;
python代码如下:
1 numbers = [1,3,5,7,8,2,4,20]
2
3 #find total
4 total=sum(numbers)
5
6 #find num
7 fore=0
8 for number in numbers:
9 if fore<(total-number)/2 :
10 fore+=number
11 else:
12 break
13
14 #print answer
15 if fore == (total-number)/2 :
16 print number
17 else :
18 print r'not found'
算法简单,而且是O(n)的,12行代码搞定。参考:http://blog.renren.com/share/235087438/3004327956
35.支配点问题:
支配数:数组中某个元素出现的次数大于数组总数的一半时就成为支配数,其所在位序成为支配点;比如int[] a = {3,3,1,2,3};3为支配数,0,1,4分别为支配点;
要求:返回任何一个支配点
1 li = [3,3,1,2,3]
2 def main():
3 mid = len(li)/2
4 for l in li:
5 count = 0
6 i = 0
7 mark = 0
8 while True:
9 if l == li[i]:
10 count += 1
11 temp = i
12 i += 1
13 if count > mid:
14 mark = temp
15 return (mark,li[mark])
16 if i > len(li) - 1:
17 break
18
19 if __name__ == "__main__":
20 print main()
36.什么是PEP 8
参考:http://www.python.org/dev/peps/pep-0008/
37.Python2.x和Python3.x的区别
从Python2到Python3,很多基本的函数接口变了,甚至是,有些库或函数被去掉了,改名了。