宣布一个事情,那就是我找到工作了!
还是做openstack的,我比较欣慰,我不知道自己适不适合做openstack,但是我肯定不喜欢做7*24的系统运维,我一点都不喜欢加班,我更加鄙视值夜班。也许就是命吧,经历那么多次面试,能进入实习公司学习openstack,虽然我离开了99,但是我觉得做这门会比其他运维好多了,学习压力至少少了一部分,什么各种乱七八糟的数据库我也不用太花时间了,各种复杂的应用服务器软件我也许不需要管。我的重点就是openstack和python,甚至ansible或salt,再用一些Linux基本的服务软件和shell,现在对我这个应届生来说,最大的困难就是服务器硬件设备本身了,这一点我有点难搞!
这次我进的是南京一个很小的创业公司,去年才成立,不是我没有野心去幻想大公司了,而是遭遇到了失败,或者说此时的心气已经没了。在面小公司之前,春招我也面过苏宁,上午很easy,下午一个是笑都不笑的面庞,表现很差,算了吧,进不去就进不去,我也不想做那种没完没完了的工作。如果小公司发展好了,我就是元老,几年后也就是技术总监,如果发展不好就会倒闭,我就又要找工作了,我一定要有随时准备面试的意识呀,我怕到时候压力一来,没做准备,容易扛不住!现在看来,运维真的是一个屌丝行业,运维开发才是主流,趁还有时间,我这python必须好好学了。
有段时间没写博客了,其实这篇面经也是整理很久了,不知道为什么我比较懒,现在才发出来,签了三方协议后,说玩也没有玩,反正就是偏向实践的学习了,理论方面有些放松。以后上班了就不再是系统的学习,而是遇到问题再学习,那时候的压力和急性子就是让人失望了。
不知道接下来还会遇到什么坎,希望勤于思考吧...
1、求10次以内的斐波那契数列,初始值是0
答:
def foo(list,num):
if num == 1:
list.append(0)
elif num == 2:
foo(list,1)
list.append(1)
elif num > 2:
foo(list,num-1) ##从10一直遍历到0为止,才执行下一句话
list.append(list[-1]+list[-2]) ##从倒数第1个,倒数第2个
mylist = []
foo(mylist,10)
print (mylist) ##输出[0, 1, 1, 2, 3, 5, 8, 13, 21, 34]
2、合并两个有序列表?
答:思想就是制造空列表,再填数据,这个方法我记得最熟了
list1 = [1,3,5]
list2 = [2,4,6,8]
temp = []
for i in range(len(list1)):
if list1[i] not in temp:
temp.append(list1[i])
for j in range(len(list2)):
if list2[j] not in temp:
temp.append(list2[j])
temp.sort() ##这里就不需要赋值了
print ("合并后的列表是",temp)
3、列表和字符串如何相互转换?
答:>>> str1 = 'abcdef'
>>> list(str1)
['a', 'b', 'c', 'd', 'e', 'f']
>>> mylist = list(str1)
>>> ''.join(list(mylist)) ##引号之间不加任何东西,结果就直接粘在一起,注意有一个点,点与单引号之间没有空格
'abcdef'
>>> '->'.join(list(mylist)) ##单引号之间加入任意字符,那么字符串结果就是以连接符构成的
'a->b->c->d->e->f'
4、分析a、b、c、d的值?
>>> a = [1, 2, 3, 4, ['a', 'b']]
>>> b = a ##赋值,就是把a对象的引用(地址)传给b,b相当于是a的标签
>>> import copy
>>> c = copy.copy(a) ##浅拷贝:只拷贝外围的对象的值,意思说外围值不会发生变化,以后内围对象的值随a的变化而变化
>>> d = copy.deepcopy(a) ##深拷贝,外围对象和內围对象的值都进行拷贝,以后都不会发生变化。
>>> a.append(5)
>>> a[4].append('c')
答:>>> print ('a = ', a)
a = [1, 2, 3, 4, ['a', 'b', 'c'], 5]
>>> print ('b = ', b)
b = [1, 2, 3, 4, ['a', 'b', 'c'], 5]
>>> print ('c = ', c)
c = [1, 2, 3, 4, ['a', 'b', 'c']]
>>> print ('d = ', d)
d = [1, 2, 3, 4, ['a', 'b']]
5、select、poll、epoll之间的区别?(反正我是记不住的)
答:select的几大缺点:
(1)每次调用select,都需要把fd集合从用户态拷贝到内核态,这个开销在fd很多时会很大
(2)同时每次调用select都需要在内核遍历传递进来的所有fd,这个开销在fd很多时也很大
(3)select支持的文件描述符数量太小了,默认是1024
poll改善了第三个缺点,epoll改善了三个缺点。
参考文档:http://www.cnblogs.com/Anker/p/3265058.html
6、Linux系统的CPU和内存使用率比较高怎么办?(居然这个问题问开发,果然是大厂,就是叼,就算我运维我一时也拿不出最好的解决办法,这不是一件容易的事情)
答:(1)用top命令查看哪个进程占用CPU高,[root@python ~]# top -b -n 1 >top.txt ## -b bacth mode,-n 1次循环
(2)用top -H -p pid命令查看进程内各个线程占用的CPU百分比
(3)查看这个线程所有系统调用所花费时间 strace -p 【线程ID】
(4)使用nice命令降低该进程任务的优先级
参考文档:http://blog.sina.com.cn/s/blog_48eef8410101fl4p.html
7、Linux中进程A能否直接访问进行进程B?为什么?(我擦,拓麻这种问题太底层了,不过是操作系统概念,说到linux就反而觉得太高深了)
答:显然不能。(1)B进程为避免破坏数据的一致性,可能有互斥锁。(2)A与B的进程通信需要一些手段如消息队列、共享内存、socket、信号量、管道等实现。(3)A进程的三态(运行、就绪、阻塞)都需要CPU来调度,而调度又有一些算法(先来先服务、最高优先级、最短时间优先)才能来实现进程的状态转换,如果进程B在使用CPU,A进程就只能阻塞,那么A进程又怎么能访问B呢。
8、如何实现对cinder进行备份?(这个被问到过,想了半天说快照,其实错了)
答:(1)首先快照不是备份,没有冗余作用,只是用来恢复某个时间点的状态,如果原有卷挂掉,卷也是不能用的。因为快照要求卷是available的(即不能被挂载),所以一旦原有卷做了快照,是不能删除原有卷的,必须先删除其关联的快照才行。在快照的基础上,再进行创建volume(如果基于快照创建了硬盘,快照删除不掉)。快照命令:cinder snapshot-list
参考文档:http://blog.csdn.net/hhp_hhp/article/details/49175101
(2)备份前,卷需要是available状态(即不能被挂载),备份一旦完成,对卷就不具有依赖性。cinder backup-create
(3)使用后端驱动进行备份,比如swift或NFS共享存储,块存储节点写入数据,而后上传到NFS服务端(局域网中的另一个节点)。
(4)目前Freezer已正式引入OpenStack,能够进行数据库和nova实例、cinder卷的备份。
参考文档:http://www.aixchina.net/Article/159885
9、某公司系统突然发生访问异常,经程序员排查确定程序里没有死循环和定时任务等,该线上系统采用的是nginx+tomcat方式部署,现在让你快速分析系统最有可能的异常原因,后期防范这种异常可以采用什么方案。其他信息和答题要求如下:
(1)该线上系统周一到周五压力较高,周六周日压力较低;
(2)异常发生在周日;
(3)外界只能通过nginx访问到系统,不能通过tomcat直接访问;
(4)系统分配给tomcat的内存被耗尽了;
(5)nginx已经记录了详细的访问日志;
(6)定位异常原因的主要操作步骤和主要命令写出来;
(7)防范方案的原理和主要命令要写出来
分析:(1)周一周五压力高,说明访问量和负载比较大,用户人群多,但是周末压力很小,异常却发生在周末,说明不是并发连接数受限的问题,nginx和数据库肯定还撑得住。
(2)外界只能通过Nginx代理到tomcat,tomcat自身不开放8080端口,这一点是完全可以的,让tomcat专心处理动态页面
(3)系统分配给tomcat的内存用光了,这句话不太好理解,是说tomcat内存利用率高达95%以上吗?按理说服务器的内存一般都是够的,那么内存使用率很高,不知道CPU使用率高不高,使用top命令查看一下,另外查杀相应的僵死进程。
(4)awk '{arr[$1++]}END {for i in arr {print i ,arr[i]}}' nginx.log 统计nginx每个IP的访问人数,判断有没有恶意***,另外分析服务
器响应的状态码,这一点可能是排错的关键,如果都是200 OK或则304都没啥大问题,。
10、linux下的压力测试工具有哪些?注意事项有什么?
答:(1)webbench、ab:访问web服务器的压力测试
1、压力及性能测试工作应该放到产品上线之前,而不是上线以后;
2、测试时并发应当由小逐渐加大,比如并发100时观察一下网站负载是多少、打开页面是否流畅,并发200时又是多少、网站打开缓慢时并发是多少、网站打不开时并发又是多少;
3、更详细的进行某个页面测试,如电商网站可以着重测试购物车、推广页面等,因为这些页面占整个网站访问量比重较大。
备注:webbench 做压力及性能测试时,该软件自身也会消耗CPU和内存资源,为了测试准确,建议将 webbench安装在其他的服务器上,已达到测试数据更加精确
(2)mysqlslap对数据库的并发连接测试、sysbench对磁盘IO进行压力测试,两者可以结合起来。
参考文档:http://www.cnblogs.com/chenmh/p/5866058.html
(3)除了这些之外,还可以说系统性能测试命令,如top、vmstat、free等常用命令,其实对于uptime命令我始终无法衡量它的上限达到怎样才算不合适?还有top的CPU使用率描述太混乱了!
(4)ipperf测试网络带宽和丢包率,突然想起pstree命令是个好东西 ,找父进程,多线程。[root@kvm ~]# yum -y install psmisc 依赖安装pstree
11、如何在Linux多级目录下,搜索某个关键字?
答:[root@python ppp]# grep -Rn 'mask' ./ ##用grep递归查找,但是find仅仅能够找到该关键字是否存在,暂时不知道如何打印该关键字所在的文件
12、迭代器和生成器?
答:(1)迭代器(iterator)代表一个数据流对象,不断重复调用迭代器的next()方法可以逐次地返回数据流中的每一项,当没有更多数据可用时,next()方法会抛出异常StopIteration。
(2)生成器(generator)也是一个迭代器,但是你只可以迭代他们一次,不能重复迭代,因为它并没有把所有值存储在内存中,而是实时地生成值。Yield是关键字,它类似于return,只是函数会返回一个生成器。对于类似资源的访问控制等场景,生成器显得很实用。其实最好的理解就是,每执行这个函数,yield都会保存结果值,打印的时候全部打印所有结果。
val = False
while not val:
print '这句话的意思是当val变量为假的时候死循环执行!'
def test():
yield "$1000"
13、zabbix如何去监控一个web服务器的性能?
答:监控指标:(1)打开网页的响应时间(2)每秒的下载速度(3)服务器返回的http状态码(4)验证用户密码登录是否成功
14、Python是强类型还是弱类型的语言?(这个东西我肯定要说错)
答:python是强类型。强弱是对类型而言的。强类型,你有一个值之后这个值是什么类型是确定的,比如n='1',n的类型是确定的(字符串),因此你不能在Python做n='3'm=n+1运算。而弱类型就不是这样的,值的类型可以在需要的时候再去确定,比如PHP里面你可以$n='3'; $m=$n+1,运算的时候'3'就可以当作整型来进行计算。
参考文档:https://segmentfault.com/q/1010000002230156
15、python的动态性体现在哪?
答:(1)定义变量的时候无需指定它的数据类型,根据运行时具体情况确定。
(2)类class不提供private私有属性的关键字;无法定义常量;函数参数无类型
(3)python中的namespace是可以动态变化的,类的成员,类实例的成员都可以动态添加
16、python的namespace有几种?
答:(1)locals:函数内部的名字空间,一般包括函数的局部变量以及形式参数。
(2)enclosing function:在嵌套函数中外部函数的名字空间。
(3)globals:当前的模块空间,模块就是一些py文件。也就是说,globals()类似全局变量。
(4)__builtins__: 内置模块空间,也就是内置变量或者内置函数的名字空间。比如len()等函数的命名空间就是BIF命名空间
参考文档:http://www.jianshu.com/p/7f3fdd41096f
17、awk实现下列文本的转换?
[root@ssd tmp]# cat 5.sh
1
D
2
E
3
V
[root@ssd tmp]# cat 5.sh |awk '{if(NR%2!=0)ORS=" ";else ORS="\n";print}'
1 D
2 E
3 V
18、怎么实现迭代器?迭代器比for循环有什么优势吗?(这个东西我怎么就记不住呢!)
答:迭代器和经典for循环的索引访问相比并无优势,反而丢失了索引值(可以使用内建函数enumerate()找回这个索引值)。但对于无法随机访问的数据结构(比如set)而言,迭代器是唯一的访问元素的方式。
next方法:返回迭代器的下一个元素
__iter__方法:返回迭代器对象本身
参考文档:http://www.cnblogs.com/kaituorensheng/p/3826911.html
19、python的三目运算符有吗? 怎么用一行代码实现三目运算?
答:python没有三目运算符。使用If-else可以模拟三目运算
>>> x, y = 50, 25
>>> small = x if x < y else y
>>> small
25
>>>
20、磁盘利用率快用尽时,如何看哪个目录使用的最多?
答:(1)find命令:find / -type d -size +2G -print
(2)du -sh /etc ##×××了,这个命令没记住,记成df了
21、python多线程与多进程有何区别?
答:多线程用来并行处理多个任务,以提高处理效率,在python中导入threading模块。join()方法的作用是必须在子线程运行完毕之后,父线程才能运行,即父线程被阻塞,因为如果父线程一旦运行完毕,子线程就不会再运行了。
(1)多线程可以共享全局变量(内存地址空间),当然锁问题也变成麻烦了;多进程独占资源,进程通信变得就比较麻烦了。
(2)多线程中,所有子线程的线程号相同;多进程中,不同的子进程进程号不同
(3)多线程只使用一颗CPU内核,属于IO密集型,比如在读取文件以及网络IO的时候使用多线程;多进程充分发挥多核的优势,属于计算密集型执行任务。
22、简要说明nova compute创建实例的大体步骤?(这个问题总结很多遍了,但是下面是最简单的描述)
答:(1)nova compute准备创建虚拟机实例的资源,比如根据flavor配置使用多大内存、多少颗CPU、多大磁盘?
(2)nova 从glance下载镜像文件,会对计算节点的_base目录进行缓存
(3)定义实例的XML文件,描述实例的元数据信息,以便下次可以正常启动
(4)nova请求neutron获取虚拟网卡的参数,实例得到诸如IP地址、MAC地址的信息,而后引导虚拟机。
23、虚拟机迁移如何防止调度到源节点的机制?
答:nova-compute 在做 migrate 的时候会检查目标节点,如果发现目标节点与源节点相同,会抛出 UnableToMigrateToSelf 异常。Nova-compute 失败之后,scheduler 会重新调度,由于有RetryFilter,会将之前选择的源节点过滤掉,这样就能选到不同的
计算节点了。
24、计算节点宕机,虚拟机实例还能运行吗?如果不能,怎么恢复呢?
答:虚拟机实例当然不能运行,如果只是nova-compute进程已经挂掉,Rebuild 可以恢复损坏的 instance。
但是计算节点宕机就不行,可以把虚拟机实例撤离到正常的计算节点上去。Evacuate可在 nova-compute 无法工作的情况下将节点上的instance 迁移到其他计算节点上。但有个前提: Instance 的镜像文件必须放在共享存储上。
流程:(只能在后台执行)
执行命令nova evacuate 主机名 --no-shared-storage -> 消息下发到nova-api -> nova-schedule筛选好主机 -> nova-compute分配资源,使用共享存储上的镜像文件 -> 启动instance
参考文档:http://www.mamicode.com/info-detail-1608057.html
25、网卡绑定的工作模式?(这个问题曾经在去年6月份才学过这点,现在都忘了,只记得3种,而且平衡二字又说不出来)
答:如果不同主机的网卡绑定的话,交换机也要进行配置链路聚合才行。总共7种,主要3种
(1)平衡模式
(2)主动备份
(3)广播
bond的好处:(1)提高整体带宽(2)负载均衡
参考文档:http://alanwu.blog.51cto.com/3652632/1095566
26、MySQL 5.5是单线程复制还是多线程复制?如果有大量的DML语句,如何解决主从延迟同步问题?(卧了个槽,这种
问题从来没思考过,又差点栽在数据库集群上了)
答:mysql从5.6才开始支持多线程复制。DML(一瞬间有点懵逼,反应好久才想起来是数据库操作语言)就是Insert、update等。
呵,我是记得到被思必驰狠狠虐过,固态硬盘做RAID阵列和分库分表记得最熟了。
MySQL的高可用知道多少?MMM、MHA架构熟悉吗?(日了狗,我又不是DBA,只听说过,又没做过)
答:只知道一主多从中,对从集群的HAProxy+Keepalived架构。
27、Linux Bridge与Open Vswitch有什么区别?(这段时间我没有全身心放在openstack上,知识尚缺,以后还会补充)
答:(1)基于vlan的隔离方式不同,ovs使用flow rule实现外部vlan以及内部vlan的转换
(2)iptables只能用于linux bridage而非OVS bridge,linux bridge 不支持GRE,但OVS支持。
(3)OVS的patch port用来连接集成网桥br-int和隧道网桥br-tun,而linux bridage使用veth对连接br-int和外部网桥br-eth1
(4)OVS的功能应该强于Linux Bridge,否则官网使用Linux Bridge,但是很多企业都用的是OVS。根据测试结果,Linux Bridge的性能(如网络吞吐量、虚拟之间的文件传输速度)略强于OVS。
(5)OVS 将各种功能都原生地实现在其中,而Linux Bridge依赖各种其他模块来实现各种功能。
参考文档:http://www.cnblogs.com/sammyliu/p/4985907.html
28、数据包流过OVS的过程?(先来个很简单的印象吧,其实OVS的很多桥还是比较麻烦的,脑壳里一定要想那个拓扑图)
答:1 VM实例instance的网络协议栈产生一个数据包并发送至实例内的虚拟网络接口VNIC,就是instance中的eth0.
2 这个数据包会传送到物理节点上的VNIC接口,就是vnet接口。
3 数据包从vnet NIC出来,到达桥(虚拟交换机)br100上.
4 数据包经过交换机的处理,从物理节点上的物理接口发出,如物理节点上的eth0.
5 数据包从eth0出去的时候,是按照物理节点上的二层交换机以及默认网关操作的,这个时候该数据包其实已经不受OVS的控制了
29、python要求输入一个列表,其中值为整数,输出为偶数,并且偶数所在的索引值也是偶数,例:输入[1,3,2,5,4,6],输出[2,4]
答:这个最大问题是要求随机输入,那么输入的列表就变成字符串型了,必须想个办法替换掉列表外边的单引号,使用eval方法
list1 = eval(input("请输入一个列表:")) ##如果不加eval.那么list1就是
list2 = [] ##eval将字符串str当成有效的表达式来求值并返回计算结果
def fun(list1):
count = len(list1)
for i in range(count):
if list1[i] % 2 == 0 and i%2 == 0:
list2.append(list1[i])
print ('输出后的列表是:',list2)
return list2
fun(list1)
30、分析简单代码,求输出结果。
class p(object):
attr = 'a'
class c1(p):
pass
class c2(p):
attr = 'd'
class c3(p):
pass
print ('第1次',p.attr,c1.attr,c2.attr)
c1.attr = 'b'
print ('第2次',p.attr,c1.attr,c2.attr)
p.attr= 'c'
print ('第3次',p.attr,c1.attr,c2.attr,c3.attr)
答:#第1次 a a d
#第2次 a b d
#第3次 c b d c