解码base64_linuxC++Base64编解码
Base64的由来
⽬前Base64已经成为⽹络上常见的传输8Bit字节代码的编码⽅式之⼀。在做⽀付系统时,系统之间的报⽂交互都需要使⽤Base64对明⽂进⾏转码,然后再进⾏签名或加密,之后再进⾏(或再次Base64)传输。那么,Base64到底起到什么作⽤呢?
在参数传输的过程中经常遇到的⼀种情况:使⽤全英⽂的没问题,但⼀旦涉及到中⽂就会出现乱码情况。与此类似,⽹络上传输的字符并不全是可打印的字符,⽐如⼆进制⽂件、图⽚等。Base64的出现就是为了解决此问题,它是基于64个可打印的字符来表⽰⼆进制的数据的⼀种⽅法。
电⼦邮件刚问世的时候,只能传输英⽂,但后来随着⽤户的增加,中⽂、⽇⽂等⽂字的⽤户也有需求,但这些字符并不能被服务器或⽹关有效处理,因此Base64就登场了。随之,Base64在URL、Cookie、⽹页传输少量⼆进制⽂件中也有相应的使⽤。
Base64的编码原理
Base64的原理⽐较简单,每当我们使⽤Base64时都会先定义⼀个类似这样的数组:
['A', 'B', 'C', ... 'a', 'b', 'c', ... '0', '1', ... '+', '/']
上⾯就是Base64的索引表,字符选⽤了"A-Z、a-z、0-9、+、/" 64个可打印字符,这是标准的Base64协议规定。在⽇常使⽤中我们还会看到“=”或“==”号出现在Base64的编码结果中,“=”在此是作为填充字符出现,后⾯会讲到。
具体转换步骤
第⼀步,将待转换的字符串每三个字节分为⼀组,每个字节占8bit,那么共有24个⼆进制位。
第⼆步,将上⾯的24个⼆进制位每6个⼀组,共分为4组。
第三步,在每组前⾯添加两个0,每组由6个变为8个⼆进制位,总共32个⼆进制位,即四个字节。
第四步,根据Base64编码对照表(见下图)获得对应的值。
0 A 17 R 34 i 51 z
1 B 18 S 35 j 52 0
2 C 19 T 36 k 53 1
3 D 20 U 37 l 54 2
4 E 21 V 38 m 55 3
5 F 22 W 39 n 56 4
6 G 23 X 40 o 57 5
7 H 24 Y 41 p 58 6
8 I 25 Z 42 q 59 7
9 J 26 a 43 r 60 8
10 K 27 b 44 s 61 9
11 L 28 c 45 t 62 +
12 M 29 d 46 u 63 /
13 N 30 e 47 v
14 O 31 f 48 w
15 P 32 g 49 x
16 Q 33 h 50 y
从上⾯的步骤我们发现:
Base64字符表中的字符原本⽤6个bit就可以表⽰,现在前⾯添加2个0,变为8个bit,会造成⼀定的浪费。因此,Base64编码之后的⽂本,要⽐原⽂⼤约三分之⼀。
为什么使⽤3个字节⼀组呢?因为6和8的最⼩公倍数为24,三个字节正好24个⼆进制位,每6个bit位⼀组,恰好能够分为4组.
⽰例说明
以下图的表格为⽰例,我们具体分析⼀下整个过程。
第⼀步:“M”、“a”、"n"对应的ASCII码值分别为77,97,110,对应的⼆进制值是01001101、01100001、01101110。
如图第⼆三⾏所⽰,由此组成⼀个24位的⼆进制字符串。
第⼆步:如图红⾊框,将24位每6位⼆进制位⼀组分成四组。
第三步:在上⾯每⼀组前⾯补两个0,扩展成32个⼆进制位,此时变为四个字节:00010011、00010110、00000101、00101110。分别对应的值(Base64编码索引)为:19、22、5、46。
第四步:⽤上⾯的值在Base64编码表中进⾏查,分别对应:T、W、F、u。因此“Man”Base64编码之后就变为:TWFu。
位数不⾜情况
上⾯是按照三个字节来举例说明的,如果字节数不⾜三个,那么该如何处理?
两个字节:两个字节共16个⼆进制位,依旧按照规则进⾏分组。此时总共16个⼆进制位,每6个⼀组,则第三组缺少2位,⽤0补齐,得到三个Base64编码,第四组完全没有数据则⽤“=”补上。因此,上图中“BC”转换之后为“QKM=”;
⼀个字节:⼀个字节共8个⼆进制位,依旧按照规则进⾏分组。此时共8个⼆进制位,每6个⼀组,则第⼆组缺少4位,⽤0补齐,得到两个Base64编码,⽽后⾯两组没有对应数据,都⽤“=”补上。因此,上图中“A”转换之后为“QQ==”;
————————————————
版权声明:本⽂为CSDN博主「⼆师兄--程序新视界」的原创⽂章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原⽂出处链接及本声明。
原⽂链接:blog.csdn/wo541075754/article/details/81734770
C++ 编解码⽰例
//类型宏定义
typedef unsigned char uint8;
typedef unsigned long uint32;
//定义编码字典
static uint8 alphabet_map[] = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
//定义解码字典
static uint8 reverse_map[] =
{
255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 62, 255, 255, 255, 63,
52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 255, 255, 255, 255, 255, 255,
255, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14,
15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 255, 255, 255, 255, 255,
255, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40,
41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 255, 255, 255, 255, 255
};
/*
* 编码
* 传⼊需要编码的数据地址和数据长度
* 返回:解码后的数据
*/
uint8* base64_encode(const uint8 *text, uint32 text_len)
{
/
/计算解码后的数据长度
//由以上可知 Base64就是将3个字节的数据(24位),拆成4个6位的数据,然后前两位补零
//将其转化为0-63的数据然后根据编码字典进⾏编码
int encode_length = text_len/3*4;
if(text_len%3>0)
{
encode_length += 4;在线url网址编码解码
}
//为编码后数据存放地址申请内存
uint8 *encode = (uint8*)malloc(encode_length);
//编码
uint32 i, j;
for (i = 0, j = 0; i+3 <= text_len; i+=3)
for (i = 0, j = 0; i+3 <= text_len; i+=3)
{
encode[j++] = alphabet_map[text[i]>>2]; //取出第⼀个字符的前6位并出对应的结果字符
encode[j++] = alphabet_map[((text[i]<<4)&0x30)|(text[i+1]>>4)]; //将第⼀个字符的后2位与第⼆个字符的前4位进⾏组合并到对应的结果字符
encode[j++] = alphabet_map[((text[i+1]<<2)&0x3c)|(text[i+2]>>6)]; //将第⼆个字符的后4位与第三个字符的前2位组合并出对应的结果字符
encode[j++] = alphabet_map[text[i+2]&0x3f]; //取出第三个字符的后6位并出结果字符
}
/
/对于最后不够3个字节的进⾏填充
if (i < text_len)
{
uint32 tail = text_len - i;
if (tail == 1)
{
encode[j++] = alphabet_map[text[i]>>2];
encode[j++] = alphabet_map[(text[i]<<4)&0x30];
encode[j++] = '=';
encode[j++] = '=';
}
else //tail==2
{
encode[j++] = alphabet_map[text[i]>>2];
encode[j++] = alphabet_map[((text[i]<<4)&0x30)|(text[i+1]>>4)];
encode[j++] = alphabet_map[(text[i+1]<<2)&0x3c];
encode[j++] = '=';
}
}
return encode;
}
uint8* base64_decode(const uint8 *code, uint32 code_len)
{
//由编码处可知,编码后的base64数据⼀定是4的倍数个字节
assert((code_len&0x03) == 0); //如果它的条件返回错误,则终⽌程序执⾏。4的倍数。
//为解码后的数据地址申请内存
uint8 *plain = (uint8*)malloc(code_len/4*3);
//开始解码
uint32 i, j = 0;
uint8 quad[4];
for (i = 0; i < code_len; i+=4)
{
for (uint32 k = 0; k < 4; k++)
{
quad[k] = reverse_map[code[i+k]];//分组,每组四个分别依次转换为base64表内的⼗进制数
}
assert(quad[0]<64 && quad[1]<64);
plain[j++] = (quad[0]<<2)|(quad[1]>>4); //取出第⼀个字符对应base64表的⼗进制数的前6位与第⼆个字符对应base64表的⼗进制数的前2位进⾏组合
if (quad[2] >= 64)
break;
else if (quad[3] >= 64)
{
plain[j++] = (quad[1]<<4)|(quad[2]>>2); //取出第⼆个字符对应base64表的⼗进制数的后4位与第三个字符对应base64表的⼗进制数的前4位进⾏组合 break;
}
else
{
plain[j++] = (quad[1]<<4)|(quad[2]>>2);
plain[j++] = (quad[2]<<6)|quad[3];//取出第三个字符对应base64表的⼗进制数的后2位与第4个字符进⾏组合
}
}
}
return plain;
}
使⽤:
//获取⽂件长度
struct stat statbuff;
if(stat(filePath.c_str(), &statbuff) < 0){
return ;
}else{
std::cout << statbuff.st_size << std::endl;
}
//申请⼀块内存⽤于读取⽂件数据
char *filePtr = (char *)malloc(statbuff.st_size);
//将⽂件中的数据读出来
int fd = open(filePath.c_str(),O_RDONLY);
char buffer[1024];
int count = 0;
if(fd > 0)
{
memset(buffer,0,1024);
int len = 0;
while ((len = read(fd,buffer,1000)) >0 )
{
memcpy(filePtr + count,buffer,len);
count += len;
}
}
close(fd);
//对数据进⾏编码
unsigned char* encodeData = base64_encode((unsigned char*)filePtr,count);
//将编码数据放到string中⽅便后⾯求长度
data = (char*) encodeData;
//对数据进⾏解码
unsigned char* encode = base64_decode((unsigned char*).c_str(),(int)data.length());
//将数据还原重新写到另外⼀个⽂件中
int fd_w = open(fileName2,O_CREAT|O_WRONLY,S_IRUSR | S_IWUSR);
if(fd_w > 0)
{
write(fd_w,(char*)encode,count);
}
close(fd_w);
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论