不依赖第三方库,原生C代码进行BASE64编码解码

用C语言代码进行BASE64的编码和解码,可以使用第三方库OpenSSL的相关函数,但在编译后的程序运行时依赖 LIBEAY32.DLL 或者 libcrypto-3-x64.dll 文件,缺点显而易见:编译后的程序在缺乏这些.DLL文件的系统里无法正常运行。要么使用静态编译,在编译的参数里增加:-static -lssl -lcrypto -lz -lpthread -lgdi32,使得生成的exe程序具备可移植性,能在别人的Windows系统里正常运行,但程序的体积增加不少。

我在寻求不依赖第三方库,仅使用C语言自带库的来进行BASE64编码解码的原生代码。于是在网上找到这个:

Base64 Encode and Decode in C

作者:John,发表日期:2017年11月18日

该代码用 gcc 或 clang 均可成功编译,运行起来看起来没问题。

但作者只是示范了对英文字符进行编码解码,当我尝试对中文编码解码时,发现编码没问题,倒是解码出了问题,多出一个不可识别的字符:

不依赖第三方库,原生C代码进行BASE64编码解码_第1张图片

而且解码字符串末尾多出来的字符随着每次运行都不一样。

于是怀疑是解码字符串在分配内存环节上有问题。

作者在代码里对声明 out_len 变量一行作了注释:+1是为了留多一个字节的空间来加上“\0”终止符。

	// +1 for the NULL terminator.
	out_len = b64_decoded_size(enc)+1;

我尝试一下把这一行代码末尾的“+1”去掉,变成:out_len = b64_decoded_size(enc);

这样一来,解码后的字符串在分配内存上就刚刚好,没有多余的空间,解码后的字符串末尾就不会有奇怪的字符了。

完整的代码如下:

#include 
#include 
#include 
#include 

const char b64chars[] = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
int b64invs[] = { 62, -1, -1, -1, 63, 52, 53, 54, 55, 56, 57, 58,
	59, 60, 61, -1, -1, -1, -1, -1, -1, -1, 0, 1, 2, 3, 4, 5,
	6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20,
	21, 22, 23, 24, 25, -1, -1, -1, -1, -1, -1, 26, 27, 28,
	29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42,
	43, 44, 45, 46, 47, 48, 49, 50, 51 };


size_t b64_encoded_size(size_t inlen) {
	size_t ret;

	ret = inlen;
	if (inlen % 3 != 0)
		ret += 3 - (inlen % 3);
	ret /= 3;
	ret *= 4;
	return ret;
}

char *b64_encode(const unsigned char *in, size_t len) {
	char   *out;
	size_t  elen;
	size_t  i;
	size_t  j;
	size_t  v;

	if (in == NULL || len == 0)
		return NULL;

	elen = b64_encoded_size(len);
	out  = malloc(elen+1);
	out[elen] = '\0';

	for (i=0, j=0; i> 18) & 0x3F];
		out[j+1] = b64chars[(v >> 12) & 0x3F];
		if (i+1 < len) {
			out[j+2] = b64chars[(v >> 6) & 0x3F];
		} else {
			out[j+2] = '=';
		}
		if (i+2 < len) {
			out[j+3] = b64chars[v & 0x3F];
		} else {
			out[j+3] = '=';
		}
	}
	return out;
}

size_t b64_decoded_size(const char *in) {
	size_t len;
	size_t ret;
	size_t i;

	if (in == NULL)
		return 0;

	len = strlen(in);
	ret = len / 4 * 3;

	for (i=len; i-->0; ) {
		if (in[i] == '=') {
			ret--;
		} else {
			break;
		}
	}
	return ret;
}

void b64_generate_decode_table(){
	int    inv[80];
	size_t i;

	memset(inv, -1, sizeof(inv));
	for (i=0; i= '0' && c <= '9')
		return 1;
	if (c >= 'A' && c <= 'Z')
		return 1;
	if (c >= 'a' && c <= 'z')
		return 1;
	if (c == '+' || c == '/' || c == '=')
		return 1;
	return 0;
}

int b64_decode(const char *in, unsigned char *out, size_t outlen) {
	size_t len;
	size_t i;
	size_t j;
	int    v;

	if (in == NULL || out == NULL)
		return 0;

	len = strlen(in);
	if (outlen < b64_decoded_size(in) || len % 4 != 0)
		return 0;

	for (i=0; i> 16) & 0xFF;
		if (in[i+2] != '=')
			out[j+1] = (v >> 8) & 0xFF;
		if (in[i+3] != '=')
			out[j+2] = v & 0xFF;
	}
	return 1;
}


int main(int argc, char **argv)
{
    // 自动切换至UTF-8环境输出
    if (GetConsoleOutputCP() != CP_UTF8) SetConsoleOutputCP(CP_UTF8); 

	// const char *data = "ABC123Test Lets Try this' input and see What \"happens\"";
	const char *data = "一二三四五六七八九零壹贰叁肆伍陆柒捌玖0123456789";
	char       *enc;
	char       *out;
	size_t      out_len;

	printf("data:    '%s'\n", data);

	enc = b64_encode((const unsigned char *)data, strlen(data));
	printf("encoded: '%s'\n", enc);

	printf("dec size %s data size\n", b64_decoded_size(enc) == strlen(data) ? "==" : "!=");

	// +1 for the NULL terminator.
	// out_len = b64_decoded_size(enc)+1;
    // 原作者在这里末尾+1,会导致解码的字符串多出一个额外字符,现在去掉“+1”
	out_len = b64_decoded_size(enc);
	out = malloc(out_len);

	if (!b64_decode(enc, (unsigned char *)out, out_len)) {
		printf("Decode Failure\n");
		return 1;
	}
	out[out_len] = '\0';

	printf("dec:     '%s'\n", out);
	printf("data %s dec\n", strcmp(data, out) == 0 ? "==" : "!=");
	free(out);

	return 0;
}

运行结果:

data:    '一二三四五六七八九零壹贰叁肆伍陆柒捌玖0123456789'
encoded: '5LiA5LqM5LiJ5Zub5LqU5YWt5LiD5YWr5Lmd6Zu25aO56LSw5Y+B6IKG5LyN6ZmG5p+S5o2M546WMDEyMzQ1Njc4OQ=='
dec size == data size
dec:     '一二三四五六七八九零壹贰叁肆伍陆柒捌玖0123456789'
data == dec

不依赖第三方库,原生C代码进行BASE64编码解码_第2张图片

用 clang 编译后的.exe文件只有23.5KB,不依赖第三方DLL文件。C语言的代码虽然比较冗长,但编译的结果很小很精致。

你可能感兴趣的:(C,1024程序员节,c语言,算法,开发语言)