查看图像文件的元数据

#!/usr/bin/python
#coding=utf-8
import optparse
from PIL import Image
from PIL.ExifTags import TAGS
import urllib2
from bs4 import BeautifulSoup as BS
from os.path import basename
from urlparse import urlsplit


# 通过BeautifulSoup查找URL中所有的img标签
def findImages(url):
    print '[+] Finding images on ' + url
    '''
    #urllib2.urlopen(url[, data][, timeout]) 打开URL网址
    #url参数可以是一个字符串url或者是一个Request对象
    #可选的参数timeout,阻塞操作以秒为单位,尝试连接
    '''
    urlContent = urllib2.urlopen(url).read()
    soup = BS(urlContent, 'lxml')
    #搜索当前节点的所有tag子节点
    imgTags = soup.findAll('img')
    return imgTags


# 通过img标签的src属性的值来获取图片URL下载图片
def downloadImage(imgTag):
    try:
        print '[+] Dowloading image...'
        imgSrc = imgTag['src']
        #连接文件
        imgContent = urllib2.urlopen(imgSrc).read()
        #url分割,取出完整的文件名('scr=file')
        imgFileName = basename(urlsplit(imgSrc)[2])
        #二进制方式新建文件
        imgFile = open(imgFileName, 'wb')
        #将目录文件写入
        imgFile.write(imgContent)
        #关闭
        imgFile.close()
        return imgFileName
    except:
        return ' '


# 获取图像文件的元数据,并寻找是否存在Exif标签“GPSInfo”
def testForExif(imgFileName):
    try:
        exifData = {}
        #从文件加载图像
        imgFile = Image.open(imgFileName)
        #获得图片exif信息
        info = imgFile._getexif()
        if info:
            for (tag, value) in info.items():
                decoded = TAGS.get(tag, tag)
                exifData[decoded] = value
            #将GPS信息存入exifGPS
            exifGPS = exifData['GPSInfo']
            if exifGPS:
                print '[*] ' + imgFileName + ' contains GPS MetaData'
    except:
        pass


def main():
    parser = optparse.OptionParser('[*]Usage: python Exif.py -u ')
    parser.add_option('-u', dest='url', type='string', help='specify url address')
    (options, args) = parser.parse_args()
    url = options.url
    if url == None:
        print parser.usage
        exit(0)
    else:
        imgTags = findImages(url)
        for imgTag in imgTags:
            imgFileName = downloadImage(imgTag)
            testForExif(imgFileName)


if __name__ == '__main__':
    main()

你可能感兴趣的:(查看图像文件的元数据)