2018-09-29

1.对爬虫的理解:
它就是请求网站并提取数据的自动换的程序。
请求就是你要模仿浏览器去请求资源获取HTML,从这里提出你要的东西。
自动化就是你写完之后的程序自动的去爬取数据,代替人力做的事。

实际操作:访问https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&tn=baidu&wd=%E6%96%B0%E9%97%BB&oq=www.baidu&rsv_pq=ac16559700034e94&rsv_t=e966suftTwhfvF%2B4kx1q7SORa9ziOs8uRsIOTr7E1qOac6Y4RJt3AbjkA%2Bg&rqlang=cn&rsv_enter=1&rsv_sug3=17&rsv_sug1=11&rsv_sug7=101&rsv_sug2=0&inputT=3328&rsv_sug4=3935
之后右键点击检查 这就是看到源码
2.爬虫的基本流程 (此图看不到要点击)
![PO3K`X$Z@JTCLM{93(D(VW.png

你可能感兴趣的:(2018-09-29)