爬虫(17) - 面试(2) | 爬虫面试题库

1.什么是爬虫 爬虫就是爬取网页数据,只要网页上有的,都可以通过爬虫爬取下来,比如图片、文字评论、商品详情等。 一般二言,Python爬虫需要以下几步: 找到网页URL,发起请求,等待服务器响应 获取服务器响应内容 解析内容(正则表达式、xpath、bs4等) 保存数据(本地文件、数据库等) 2.爬

你可能感兴趣的:(爬虫(17) - 面试(2) | 爬虫面试题库)