今天修正了网页抽取器,一个小时可抽取10W笔黄页信息

在上周弄好了网页抽取器,今天修正了一些bug,能顺利抽取里面的企业信息了。
VS2005 C# + Datawindow.net2.0写成。数据存入SQL.总控信息也由SQL统一管理。
今天修正了网页抽取器,一个小时可抽取10W笔黄页信息_第1张图片
这个是蜘蛛,现在能准确下载,并保存为txt文本。
今天修正了网页抽取器,一个小时可抽取10W笔黄页信息_第2张图片
这个是link分析器。分析哪些链接是自己需要下载的。
今天修正了网页抽取器,一个小时可抽取10W笔黄页信息_第3张图片
 
 

你可能感兴趣的:(今天修正了网页抽取器,一个小时可抽取10W笔黄页信息)