网络爬虫(网络蜘蛛)之网页抓取举例说明(HttpClient,Jsoup,HtmlUnit,W...
当“蜘蛛”程序出现时,现代意义上的搜索引擎才初露端倪。它实际上是一种电脑“机器人”(ComputerRobot),电脑“机器人”是指某个能以人类无法达到的速度不间断地执行某项任务的软件程序。由于专门用于检索信息的“机器人”程序就象蜘蛛一样在网络间爬来爬去,反反复复,不知疲倦。所以,搜索引擎的“机器人”程序就被称为“蜘蛛”程序。现在有越来越多的人热衷于做网络爬虫(网络蜘蛛),也有越来越多的地方需要网