R爬虫必备基础—动态异步加载

上一期简单说明了rvest为什么不用于动态网页的抓取,其中简单提及异步加载的动态网页,它属于动态网页的一种加载形式。一般来说,网页加载模式主要有两种:同步加载和异步加载。

同步加载

同步模式,又称阻塞模式,会阻止浏览器的后续处理,停止了后续的解析,因此停止了后续的文件加载(如图像)、渲染、代码执行。js 之所以要同步执行,是因为 js 中可能有输出 document 内容、修改dom、重定向等行为,所以默认同步执行才是安全的。 以前的一般建议是把

异步加载

异步加载又叫非阻塞,浏览器在下载执行 js 同时,还会继续进行后续页面的处理。这种方法是在页面中

你可能感兴趣的:(R爬虫必备基础—动态异步加载)