pythonの鉴黄之路(二)——图片转base64码

上篇博客的YCbCr鉴黄有些过于浮夸

http://blog.csdn.net/sm9sun/article/details/53319959

于是经过慎重决定,我们打算采取调用外部成熟的接口来完成鉴黄,这里就涉及数据传输的问题,当然不可能传图片啦~

为了便于网络通信,我们采取将图片转为Base64码再进行后续的工作~

先介绍一下Base64码:

Base64是网络上最常见的用于传输8Bit字节代码的编码方式之一,大家可以查看RFC2045~RFC2049,上面有MIME的详细规范。Base64编码可用于在HTTP环境下传递较长的标识信息。例如,在Java Persistence系统Hibernate中,就采用了Base64来将一个较长的唯一标识符(一般为128-bit的UUID)编码为一个字符串,用作HTTP表单和HTTP GET URL中的参数。在其他应用程序中,也常常需要把二进制数据编码为适合放在URL(包括隐藏表单域)中的形式。此时,采用Base64编码具有不可读性,即所编码的数据不会被人用肉眼所直接看到。

转码过程例子:
38=46
内存1个字符占8位
转前: s 1 3
先转成ascii:对应 115 49 51
2进制: 01110011 00110001 00110011
6个一组(4组) 011100110011000100110011
然后才有后面的 011100 110011 000100 110011
然后计算机是8位8位的存数 6不够,自动就补两个高位0了
所有有了 高位补0
科学计算器输入 00011100 00110011 00000100 00110011
得到 28 51 4 51
查对下照表 c z E z
  先以“迅雷下载”为例: 很多下载类网站都提供“迅雷下载”的链接,其地址通常是加密的迅雷专用下载地址。
其实迅雷的“专用地址”也是用Base64"加密"的,其过程如下:
一、在地址的前后分别添加AA和ZZ
二、对新的字符串进行Base64编码
另: Flashget的与迅雷类似,只不过在第一步时加的“料”不同罢了,Flashget在地址前后加的“料”是[FLASHGET]
而QQ旋风的干脆不加料,直接就对地址进行Base64编码了

python自带的base64模块内置了此部分功能

import sys
import os
import base64 
f=open(sys.argv[1],'rb')
ls_f=base64.b64encode(f.read())
f.close()

file_object = open('base64.txt', 'w')
file_object.write(ls_f)
file_object.close( )

print ls_f
image
image

原文地址:http://m.blog.csdn.net/sm9sun/article/details/53321678

你可能感兴趣的:(pythonの鉴黄之路(二)——图片转base64码)