用C语言代码进行BASE64的编码和解码,可以使用第三方库OpenSSL的相关函数,但在编译后的程序运行时依赖 LIBEAY32.DLL 或者 libcrypto-3-x64.dll 文件,缺点显而易见:编译后的程序在缺乏这些.DLL文件的系统里无法正常运行。要么使用静态编译,在编译的参数里增加:-static -lssl -lcrypto -lz -lpthread -lgdi32,使得生成的exe程序具备可移植性,能在别人的Windows系统里正常运行,但程序的体积增加不少。
我在寻求不依赖第三方库,仅使用C语言自带库的来进行BASE64编码解码的原生代码。于是在网上找到这个:
Base64 Encode and Decode in C
作者:John,发表日期:2017年11月18日
该代码用 gcc 或 clang 均可成功编译,运行起来看起来没问题。
但作者只是示范了对英文字符进行编码解码,当我尝试对中文编码解码时,发现编码没问题,倒是解码出了问题,多出一个不可识别的字符:
而且解码字符串末尾多出来的字符随着每次运行都不一样。
于是怀疑是解码字符串在分配内存环节上有问题。
作者在代码里对声明 out_len 变量一行作了注释:+1是为了留多一个字节的空间来加上“\0”终止符。
// +1 for the NULL terminator.
out_len = b64_decoded_size(enc)+1;
我尝试一下把这一行代码末尾的“+1”去掉,变成:out_len = b64_decoded_size(enc);
这样一来,解码后的字符串在分配内存上就刚刚好,没有多余的空间,解码后的字符串末尾就不会有奇怪的字符了。
完整的代码如下:
#include
#include
#include
#include
const char b64chars[] = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
int b64invs[] = { 62, -1, -1, -1, 63, 52, 53, 54, 55, 56, 57, 58,
59, 60, 61, -1, -1, -1, -1, -1, -1, -1, 0, 1, 2, 3, 4, 5,
6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20,
21, 22, 23, 24, 25, -1, -1, -1, -1, -1, -1, 26, 27, 28,
29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42,
43, 44, 45, 46, 47, 48, 49, 50, 51 };
size_t b64_encoded_size(size_t inlen) {
size_t ret;
ret = inlen;
if (inlen % 3 != 0)
ret += 3 - (inlen % 3);
ret /= 3;
ret *= 4;
return ret;
}
char *b64_encode(const unsigned char *in, size_t len) {
char *out;
size_t elen;
size_t i;
size_t j;
size_t v;
if (in == NULL || len == 0)
return NULL;
elen = b64_encoded_size(len);
out = malloc(elen+1);
out[elen] = '\0';
for (i=0, j=0; i> 18) & 0x3F];
out[j+1] = b64chars[(v >> 12) & 0x3F];
if (i+1 < len) {
out[j+2] = b64chars[(v >> 6) & 0x3F];
} else {
out[j+2] = '=';
}
if (i+2 < len) {
out[j+3] = b64chars[v & 0x3F];
} else {
out[j+3] = '=';
}
}
return out;
}
size_t b64_decoded_size(const char *in) {
size_t len;
size_t ret;
size_t i;
if (in == NULL)
return 0;
len = strlen(in);
ret = len / 4 * 3;
for (i=len; i-->0; ) {
if (in[i] == '=') {
ret--;
} else {
break;
}
}
return ret;
}
void b64_generate_decode_table(){
int inv[80];
size_t i;
memset(inv, -1, sizeof(inv));
for (i=0; i= '0' && c <= '9')
return 1;
if (c >= 'A' && c <= 'Z')
return 1;
if (c >= 'a' && c <= 'z')
return 1;
if (c == '+' || c == '/' || c == '=')
return 1;
return 0;
}
int b64_decode(const char *in, unsigned char *out, size_t outlen) {
size_t len;
size_t i;
size_t j;
int v;
if (in == NULL || out == NULL)
return 0;
len = strlen(in);
if (outlen < b64_decoded_size(in) || len % 4 != 0)
return 0;
for (i=0; i> 16) & 0xFF;
if (in[i+2] != '=')
out[j+1] = (v >> 8) & 0xFF;
if (in[i+3] != '=')
out[j+2] = v & 0xFF;
}
return 1;
}
int main(int argc, char **argv)
{
// 自动切换至UTF-8环境输出
if (GetConsoleOutputCP() != CP_UTF8) SetConsoleOutputCP(CP_UTF8);
// const char *data = "ABC123Test Lets Try this' input and see What \"happens\"";
const char *data = "一二三四五六七八九零壹贰叁肆伍陆柒捌玖0123456789";
char *enc;
char *out;
size_t out_len;
printf("data: '%s'\n", data);
enc = b64_encode((const unsigned char *)data, strlen(data));
printf("encoded: '%s'\n", enc);
printf("dec size %s data size\n", b64_decoded_size(enc) == strlen(data) ? "==" : "!=");
// +1 for the NULL terminator.
// out_len = b64_decoded_size(enc)+1;
// 原作者在这里末尾+1,会导致解码的字符串多出一个额外字符,现在去掉“+1”
out_len = b64_decoded_size(enc);
out = malloc(out_len);
if (!b64_decode(enc, (unsigned char *)out, out_len)) {
printf("Decode Failure\n");
return 1;
}
out[out_len] = '\0';
printf("dec: '%s'\n", out);
printf("data %s dec\n", strcmp(data, out) == 0 ? "==" : "!=");
free(out);
return 0;
}
运行结果:
data: '一二三四五六七八九零壹贰叁肆伍陆柒捌玖0123456789'
encoded: '5LiA5LqM5LiJ5Zub5LqU5YWt5LiD5YWr5Lmd6Zu25aO56LSw5Y+B6IKG5LyN6ZmG5p+S5o2M546WMDEyMzQ1Njc4OQ=='
dec size == data size
dec: '一二三四五六七八九零壹贰叁肆伍陆柒捌玖0123456789'
data == dec
用 clang 编译后的.exe文件只有23.5KB,不依赖第三方DLL文件。C语言的代码虽然比较冗长,但编译的结果很小很精致。