浏览器怎样从网页抓取数据

      在浏览网页的过程中,需要保存网页数据,把它复制下来保存到文件就好啦;但是,如果数据量大或者需要经常保存数据,简单重复的操作让人发狂。这时候就需要一个可以自动抓取数据的浏览器。
      1、先观察我们抓取数据的网页,以抓取城市名称和天气信息为例。首先打开【自动控制】菜单中的【项目管理器】窗口。 

浏览器怎样从网页抓取数据_第1张图片


      2、新建【打开网页】步骤,添加抓取页面的网址,其它选项使用默认值。
浏览器怎样从网页抓取数据_第2张图片
      3、再新建【抓取内容】步骤,添加抓取网页元素,点击【自动获取】按钮,浏览器自动进入元素获取模式。
浏览器怎样从网页抓取数据_第3张图片
      4、将鼠标指针移动需要抓取的元素位置,确定所需内容全部在红色方框内,点击鼠标右键,选择【获取元素并返回】,返回项目管理器窗口。
浏览器怎样从网页抓取数据_第4张图片
      5、选择通过【class】属性作为元素标识,抓取元素后获得【text】文本内容。元素别外命名为”天气“。
浏览器怎样从网页抓取数据_第5张图片
      6、新建【保存内容】步骤,选择保存为”Excel文档“格式,设定文件路径。点击【设置内容】按钮,勾选日期和天气两个字段。
浏览器怎样从网页抓取数据_第6张图片
      7、最后点击项目管理器工具栏上的保存,保存所有项目设置,下次使用时可直接打开执行项目。点击【开始】按钮执行项目,可以看到项目执行日志,最后打开保存的Excel文档,日期和抓取网页天气信息都保存到表格里了。
浏览器怎样从网页抓取数据_第7张图片
      按照这个方法,可以抓取任何显示在网页上的信息,并自动保存到文件。如果有多个网址,就增加自动循环抓取信息。

 

 

 

 

 

 

你可能感兴趣的:(数据抓取,网页采集)