爬虫解析器

我们可以先用requests.get获取网页源码()或selenium自动测试网页,获取到数据之后,我们在使用xpath、beautifulsoup、pyquery、re等解析器

匹配想要得到的数据

可以用多进程,多线程来使自己的程序运行变快

你可能感兴趣的:(爬虫解析器)