python面试问题题目

python面试题目

面试的是爬虫类岗位,一些问题答得不好,记录下来,作为个人总结。

1.GET和POST区别

表单提交中get和post方式的区别有5点
1.get是从服务器上获取数据,post是向服务器传送数据。
2.get是把参数数据队列加到提交表单的ACTION属性所指的URL中,值和表单内各个字段一一对应,在URL中可以看到。post是通过HTTPpost机制,将表单内各个字段与其内容放置在HTMLHEADER内一起传送到ACTION属性所指的URL地址。用户看不到这个过程。
3.对于get方式,服务器端用Request.QueryString获取变量的值,对于post方式,服务器端用Request.Form获取提交的数据。
4.get传送的数据量较小,不能大于2KB。post传送的数据量较大,一般被默认为不受限制。但理论上,IIS4中最大量为80KB,IIS5中为100KB。
5.get安全性非常低,post安全性较高。

2.数据库内容查找

要求手写,忘记了基本的语法,没有答出。

SELECT 列名称 FROM 表名称

SELECT * FROM 对象A WHERE 小丽=”美女” AND 小丽=”人人爱”

3.HTML中 class的含义

答 :class 指定标签的类名。如

< input type=button class=”btnsubmit” />

4.beautifulsoup有几种方式查找

答: 文档地址:http://www.crummy.com/software/BeautifulSoup/bs4/doc/

(1)find_all( name , attrs , recursive , text , **kwargs )
(2)find( name , attrs , recursive , text , **kwargs )
(3)find_parents() find_parent()
(4)find_next_siblings() find_next_sibling()
(5)find_previous_siblings() find_previous_sibling()
(6)find_all_next() find_next()
(7)find_all_previous() 和 find_previous()

5.模拟浏览器请求时,头内部内容的含义

答:Host,主机名
User-Agent, 浏览器名和版本号. 操作系统名和版本号. 默认语言.
Accept-Language,默认语言设置
Accept-Encoding,gzip压缩,服务器就会压缩过的HTML发送给浏览器。这可以减少近80%的文件大小,以节省下载时间和带宽
Cookie,发送你浏览器中存储的Cookie信息给服务器
Referer,头部将会包含referring url信息
Authorization,一个页面需要授权,包含在头部的这部分信息是base64 encoded
Cache-Control: max-age=3600, public “public”意味着这个响应可以被任何人缓存,“max-age” 则表明了该缓存有效的秒数。允许你的网站被缓存降大大减少下载时间和带宽,同时也提高的浏览器的载入速度。也可以通过设置 “no-cache” 指令来禁止缓存:
Content-Type: text/html; charset=UTF-8 ,这个头部包含了文档的”mime-type”。浏览器将会依据该参数决定如何对文档进行解析。‘text’ 是文档类型,‘html’则是文档子类型。 这个头部还包括了更多信息,例如 charset。

待更新

你可能感兴趣的:(python,面试)