全网邮箱email地址采集api接口及实现分析

先上一个在线邮箱采集demo样例:http://www.jsanai.com/emailcollect.html

全网邮箱email地址采集api接口及实现分析_第1张图片

这样的在线工具原理与普通的客户端工具(例如八鱼采集工具等)是一样的,所以这里以这个在线工具作为参考进行实现分析。

邮箱采集原理:

1、根据要采集的url地址,获取页面html内容,然后采用正则匹配出页面的url列表、邮箱地址列表。

2、分两个进程:

①保存邮箱地址;

②分析采集子页面url的邮箱地址;

基本源码(golang):

//采集入口方法
func CollectEmail(hosturl string) (EmailObj, []string, error) {
	emailObj := new(EmailObj)
	var inhost []string
	//获取主域名
	uparse, err := url.Parse(hosturl)
	if err != nil {
		return *emailObj, inhost, err
	}
	emailObj.Surl = hosturl
	//
	bodystr, e

你可能感兴趣的:(源码开发,邮箱采集,email采集原理,邮箱采集接口)