[开源 .NET 跨平台 Crawler 数据采集 爬虫框架: DotnetSpider] [五] 如何做全站采集?
[DotnetSpider系列目录]一、初衷与架构设计二、基本使用三、配置式爬虫四、JSON数据解析与配置系统五、如何做全站采集如何做全站采集?很多同学加群都在问,如何使用DotnetSpider做全站采集呢?其实很简单,只要你们想通爬虫的整个逻辑就能明白了。简而言之,步骤如下:1.使用指定URL下载HTML2.分析,保存HTML数据3.从HTML中分析出符合规则的新的URL,并用新URL重复1,