爬虫入门——爬虫可以采集哪些格式的数据?

上一篇为大家介绍了爬虫可以采集的数据范围及采集场景,今天来为大家继续介绍一下爬虫可以采集的数据格式有哪些。

1.采集文本数据

也就是文字,爬虫可以采集网页/app中公开展示的文字内容。这是最最常见的数据格式。

爬虫入门——爬虫可以采集哪些格式的数据?_第1张图片

ForeSpider数据采集器,可以使用定位采集法、脚本采集法等来提取网页中的文本内容。

爬虫入门——爬虫可以采集哪些格式的数据?_第2张图片

2.采集图片数据

爬虫可以采集网页/App中公开展示的各种格式的图片数据,包括但不限于:bmp、jpg、tiff、gif、pcx、tga、exif、fpx、svg、psd、cdr、pcd、dxf、ufo、eps、ai、raw等。

爬虫入门——爬虫可以采集哪些格式的数据?_第3张图片

ForeSpider数据采集分析引擎可采集网页、APP中公开的图片数据。

3.采集视频数据

爬虫可以采集网页/App中公开展示的各种格式的视频数据及直播数据。

爬虫入门——爬虫可以采集哪些格式的数据?_第4张图片

ForeSpider爬虫软件爬虫可直接采集并下载网页/App中公开的视频或直播数据:

爬虫入门——爬虫可以采集哪些格式的数据?_第5张图片

4. 采集附件数据

爬虫可采集网页/App中公开展示的各种格式的附件数据,包括但不限于:word、pdf、excel等类型数据。

爬虫入门——爬虫可以采集哪些格式的数据?_第6张图片

ForeSpider数据采集分析系统,可批量下载网页/App中公开展示的各种格式的附件数据。

爬虫入门——爬虫可以采集哪些格式的数据?_第7张图片

你可能感兴趣的:(爬虫,职场和发展,python,开发语言,学习,大数据,数据分析)