tldextract
是一个第三方模块,意思就是Top Level Domain extract
,即顶级域名提取
最近在做恶意域名的学习,需要用到这个工具,所以记录下来
import tldextract
tld = tldextract.extract('http://www.baidu.com/')
print(tld)
# result: ExtractResult(subdomain='www', domain='baidu', suffix='com')
返回结果为subdomain='www' 万维网, domain='baidu ' 主机名, suffix='com' 顶级域名
域名或称网域,是由一串用点分隔的名字组成的Internet上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位(有时也指地理位置)。
域名分为顶级域名、二级域名、三级域名等。
顶级域名就是com.cn.org等这种按照国家或者组织用途规定好的
二级域名(SLD,second-level domain),就是最靠近顶级域名左侧的字段。如:zh.wikipedia.org中,wikipedia就是二级域名(有资料认为, 在顶级域名后面, 还存在一级域名, 那么zh就是二级域名)。
再下来就是三级域名,即最靠近二级域名左侧的字段,从右向左便可依次有四级域名、五级域名等等。