Python实战计划学习笔记:爬取商品信息

之前装python3.5跟第三方库花了一些时间,总算弄好了,正式开始了学习。
加入实战计划的第二天,用BeautifulSoup爬取了一个网页的商品信息。
最终成果是这样子的:

Python实战计划学习笔记:爬取商品信息_第1张图片
Paste_Image.png

以下是我的代码:

Python实战计划学习笔记:爬取商品信息_第2张图片
Paste_Image.png

总结:
1.可能网页中有中文注释,起初一直爬不下来,后来在open方法里加了一个encoding参数。
2.在评级上面花了很多时间,尝试用count方法计数可是不行,后来还想用for循环来计数,后来看了参考答案才知道这么简单,直接用len()就可以了;
3.原先为什么要在评级的select路径用nth-of-type(2)没有弄清楚,现在大致懂了,这是div.ratings下面的第二个p标签。
4.用了一个for循环对抓取的标签进行遍历,这方面用法不太熟悉,要多练习。

你可能感兴趣的:(Python实战计划学习笔记:爬取商品信息)