解码base64_linuxC++Base64编解码--688IT编程网

解码base64_linuxC++Base64编解码

Base64的由来

⽬前Base64已经成为⽹络上常见的传输8Bit字节代码的编码⽅式之⼀。在做⽀付系统时，系统之间的报⽂交互都需要使⽤Base64对明⽂进⾏转码，然后再进⾏签名或加密，之后再进⾏（或再次Base64）传输。那么，Base64到底起到什么作⽤呢？

在参数传输的过程中经常遇到的⼀种情况：使⽤全英⽂的没问题，但⼀旦涉及到中⽂就会出现乱码情况。与此类似，⽹络上传输的字符并不全是可打印的字符，⽐如⼆进制⽂件、图⽚等。Base64的出现就是为了解决此问题，它是基于64个可打印的字符来表⽰⼆进制的数据的⼀种⽅法。

电⼦邮件刚问世的时候，只能传输英⽂，但后来随着⽤户的增加，中⽂、⽇⽂等⽂字的⽤户也有需求，但这些字符并不能被服务器或⽹关有效处理，因此Base64就登场了。随之，Base64在URL、Cookie、⽹页传输少量⼆进制⽂件中也有相应的使⽤。

Base64的编码原理

Base64的原理⽐较简单，每当我们使⽤Base64时都会先定义⼀个类似这样的数组：

['A', 'B', 'C', ... 'a', 'b', 'c', ... '0', '1', ... '+', '/']

上⾯就是Base64的索引表，字符选⽤了"A-Z、a-z、0-9、+、/" 64个可打印字符，这是标准的Base64协议规定。在⽇常使⽤中我们还会看到“=”或“==”号出现在Base64的编码结果中，“=”在此是作为填充字符出现，后⾯会讲到。

具体转换步骤

第⼀步，将待转换的字符串每三个字节分为⼀组，每个字节占8bit，那么共有24个⼆进制位。

第⼆步，将上⾯的24个⼆进制位每6个⼀组，共分为4组。

第三步，在每组前⾯添加两个0，每组由6个变为8个⼆进制位，总共32个⼆进制位，即四个字节。

第四步，根据Base64编码对照表（见下图）获得对应的值。

0　A 17　R 　34　i 　51　z

1　B 18　S 　35　j 　52　0

2　C 19　T 　36　k 　53　1

3　D 20　U 　37　l 　54　2

4　E 21　V 　38　m 　55　3

5　F 22　W 　39　n 　56　4

6　G 23　X 　40　o 　57　5

7　H 24　Y 　41　p 　58　6

8　I 25　Z 　42　q 　59　7

9　J 26　a 　43　r 　60　8

10　K 27　b 　44　s 　61　9

11　L 28　c 　45　t 　62　+

12　M 29　d 　46　u 　63　/

13　N 30　e 　47　v

14　O 31　f 　48　w 　

15　P 32　g 　49　x

16　Q 33　h 　50　y

从上⾯的步骤我们发现：

Base64字符表中的字符原本⽤6个bit就可以表⽰，现在前⾯添加2个0，变为8个bit，会造成⼀定的浪费。因此，Base64编码之后的⽂本，要⽐原⽂⼤约三分之⼀。

为什么使⽤3个字节⼀组呢？因为6和8的最⼩公倍数为24，三个字节正好24个⼆进制位，每6个bit位⼀组，恰好能够分为4组.

⽰例说明

以下图的表格为⽰例，我们具体分析⼀下整个过程。

第⼀步：“M”、“a”、"n"对应的ASCII码值分别为77，97，110，对应的⼆进制值是01001101、01100001、01101110。

如图第⼆三⾏所⽰，由此组成⼀个24位的⼆进制字符串。

第⼆步：如图红⾊框，将24位每6位⼆进制位⼀组分成四组。

第三步：在上⾯每⼀组前⾯补两个0，扩展成32个⼆进制位，此时变为四个字节：00010011、00010110、00000101、00101110。分别对应的值（Base64编码索引）为：19、22、5、46。

第四步：⽤上⾯的值在Base64编码表中进⾏查，分别对应：T、W、F、u。因此“Man”Base64编码之后就变为：TWFu。

位数不⾜情况

上⾯是按照三个字节来举例说明的，如果字节数不⾜三个，那么该如何处理？

两个字节：两个字节共16个⼆进制位，依旧按照规则进⾏分组。此时总共16个⼆进制位，每6个⼀组，则第三组缺少2位，⽤0补齐，得到三个Base64编码，第四组完全没有数据则⽤“=”补上。因此，上图中“BC”转换之后为“QKM=”；

⼀个字节：⼀个字节共8个⼆进制位，依旧按照规则进⾏分组。此时共8个⼆进制位，每6个⼀组，则第⼆组缺少4位，⽤0补齐，得到两个Base64编码，⽽后⾯两组没有对应数据，都⽤“=”补上。因此，上图中“A”转换之后为“QQ==”；

————————————————

原⽂链接：blog.csdn/wo541075754/article/details/81734770

C++ 编解码⽰例

//类型宏定义

typedef unsigned char uint8;

typedef unsigned long uint32;

//定义编码字典

static uint8 alphabet_map[] = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";

//定义解码字典

static uint8 reverse_map[] =

{

255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,

255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 62, 255, 255, 255, 63,

52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 255, 255, 255, 255, 255, 255,

255, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14,

15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 255, 255, 255, 255, 255,

255, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40,

41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 255, 255, 255, 255, 255

};

* 编码

* 传⼊需要编码的数据地址和数据长度

* 返回：解码后的数据

uint8* base64_encode(const uint8 *text, uint32 text_len)

{

/计算解码后的数据长度

//由以上可知 Base64就是将3个字节的数据(24位)，拆成4个6位的数据，然后前两位补零

//将其转化为0-63的数据然后根据编码字典进⾏编码

int encode_length = text_len/3*4;

if(text_len%3>0)

{

encode_length += 4;在线url网址编码解码

}

//为编码后数据存放地址申请内存

uint8 *encode = (uint8*)malloc(encode_length);

//编码

uint32 i, j;

for (i = 0, j = 0; i+3 <= text_len; i+=3)

{

encode[j++] = alphabet_map[text[i]>>2]; //取出第⼀个字符的前6位并出对应的结果字符

encode[j++] = alphabet_map[((text[i]<<4)&0x30)|(text[i+1]>>4)]; //将第⼀个字符的后2位与第⼆个字符的前4位进⾏组合并到对应的结果字符

encode[j++] = alphabet_map[((text[i+1]<<2)&0x3c)|(text[i+2]>>6)]; //将第⼆个字符的后4位与第三个字符的前2位组合并出对应的结果字符

encode[j++] = alphabet_map[text[i+2]&0x3f]; //取出第三个字符的后6位并出结果字符

}

/对于最后不够3个字节的进⾏填充

if (i < text_len)

{

uint32 tail = text_len - i;

if (tail == 1)

{

encode[j++] = alphabet_map[text[i]>>2];

encode[j++] = alphabet_map[(text[i]<<4)&0x30];

encode[j++] = '=';

}

else //tail==2

{

encode[j++] = alphabet_map[text[i]>>2];

encode[j++] = alphabet_map[((text[i]<<4)&0x30)|(text[i+1]>>4)];

encode[j++] = alphabet_map[(text[i+1]<<2)&0x3c];

encode[j++] = '=';

}

return encode;

}

uint8* base64_decode(const uint8 *code, uint32 code_len)

{

//由编码处可知，编码后的base64数据⼀定是4的倍数个字节

assert((code_len&0x03) == 0); //如果它的条件返回错误，则终⽌程序执⾏。4的倍数。

//为解码后的数据地址申请内存

uint8 *plain = (uint8*)malloc(code_len/4*3);

//开始解码

uint32 i, j = 0;

uint8 quad[4];

for (i = 0; i < code_len; i+=4)

{

for (uint32 k = 0; k < 4; k++)

{

quad[k] = reverse_map[code[i+k]];//分组，每组四个分别依次转换为base64表内的⼗进制数

}

assert(quad[0]<64 && quad[1]<64);

plain[j++] = (quad[0]<<2)|(quad[1]>>4); //取出第⼀个字符对应base64表的⼗进制数的前6位与第⼆个字符对应base64表的⼗进制数的前2位进⾏组合

if (quad[2] >= 64)

break;

else if (quad[3] >= 64)

{

plain[j++] = (quad[1]<<4)|(quad[2]>>2); //取出第⼆个字符对应base64表的⼗进制数的后4位与第三个字符对应base64表的⼗进制数的前4位进⾏组合 break;

}

else

{

plain[j++] = (quad[1]<<4)|(quad[2]>>2);

plain[j++] = (quad[2]<<6)|quad[3];//取出第三个字符对应base64表的⼗进制数的后2位与第4个字符进⾏组合

}

return plain;

}

使⽤：

//获取⽂件长度

struct stat statbuff;

if(stat(filePath.c_str(), &statbuff) < 0){

return ;

}else{

std::cout << statbuff.st_size << std::endl;

}

//申请⼀块内存⽤于读取⽂件数据

char *filePtr = (char *)malloc(statbuff.st_size);

//将⽂件中的数据读出来

int fd = open(filePath.c_str(),O_RDONLY);

char buffer[1024];

int count = 0;

if(fd > 0)

{

memset(buffer,0,1024);

int len = 0;

while ((len = read(fd,buffer,1000)) >0 )

{

memcpy(filePtr + count,buffer,len);

count += len;

}

close(fd);

//对数据进⾏编码

unsigned char* encodeData = base64_encode((unsigned char*)filePtr,count);

//将编码数据放到string中⽅便后⾯求长度

data = (char*) encodeData;

//对数据进⾏解码

unsigned char* encode = base64_decode((unsigned char*).c_str(),(int)data.length());

//将数据还原重新写到另外⼀个⽂件中

int fd_w = open(fileName2,O_CREAT|O_WRONLY,S_IRUSR | S_IWUSR);

if(fd_w > 0)

{

write(fd_w,(char*)encode,count);

}

close(fd_w);

688IT编程网

解码base64_linuxC++Base64编解码

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

解码base64_linuxC++Base64编解码

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式