Python动态网页爬虫经验小谈

也曾多次迷茫过，该如何爬取动态网页。
静态网页的爬取，无非就那么几下子，再怎么来也是解析和算法的设计问题了，但总有种不知道该怎么进步的感觉。
由于身边的动态网页太多，要想练练手，接触到动态网页的机会实在是太多了。

对于动态网页的爬取，一般来说，有两招：

Selenium技术，俗称“霸王硬上弓”。
通俗易懂。这项技术，也有个名字叫做自动化测试，也就是说，自动的打开浏览器，自动的运行起来。想想其实这个也是很酷的。
但说实话，这个东西一般很少用。原因很简单。因为这个实在是太慢了（模拟人使用网页的方式，比电脑还是慢很多的啦~）。不过了，要是对于爬虫的理解还不够，先学学这个也挺好的。
为什么呢？ 这个库，除了安装的时候需要将自动化的浏览器driver放到python所在路劲下以外，其他都是一样，直接安装包就好了。要说到它的使用，只能说这个好用，它代码写的太漂亮了，所有的函数都是跟英语一样。你只要看到函数名，基本上就可以知道这个函数是干嘛的呢。这么看来，这个库确实适合理解了点静态网页的新手还是非常友好的！

当然，肯定还是有很多其他类似技术的，但这些都是技术类爬取方式，掌握一个也就够了。下面的方法才是正道

最后，想说的是。那个网页只要找到了对应的想要的包的请求方法，就直接看Chrome是怎么得到对应为网页信息的。自己做类似的操作，就可以进行所谓的动态网页爬取了。
其实就这么简单，希望能帮到更多的人吧。当然，欢迎有不同意见的人进行讨论和指正！