C语言实现Base64编码/解码 ﹏ヽ暗。殇╰゛Y 2023-01-23 15:59 199阅读 0赞 Bse64是一种以64个可打印字符对二进制数据进行编码的编码算法。base64在对数据进行编码时以三个8位字符型数据为一组,取这三个字符型数据的ASCII码,然后以6位为一组组成4个新的数据,这4个新的数据有6位,所以它的最大值为2^6=64。我们以4个6位数据的十进制数从base64表中得到最终编码后的字符。 Base64 编码表 <table style="width:500px;"> <tbody> <tr> <td>Value</td> <td>Char </td> <td>Value</td> <td>Char </td> <td>Value</td> <td>Char </td> <td>Value</td> <td>Char </td> </tr> <tr> <td>0</td> <td>A</td> <td>16</td> <td>Q</td> <td>32</td> <td>g</td> <td>48</td> <td>w</td> </tr> <tr> <td>1</td> <td>B</td> <td>17</td> <td>R</td> <td>33</td> <td>h</td> <td>49</td> <td>x</td> </tr> <tr> <td>2</td> <td>C</td> <td>18</td> <td>S</td> <td>34</td> <td>i</td> <td>50</td> <td>y</td> </tr> <tr> <td>3</td> <td>D</td> <td>19</td> <td>T</td> <td>35</td> <td>j</td> <td>51</td> <td>z</td> </tr> <tr> <td>4</td> <td>E</td> <td>20</td> <td>U</td> <td>36</td> <td>k</td> <td>52</td> <td>0</td> </tr> <tr> <td>5</td> <td>F</td> <td>21</td> <td>V</td> <td>37</td> <td>l</td> <td>53</td> <td>1</td> </tr> <tr> <td>6</td> <td>G</td> <td>22</td> <td>W</td> <td>38</td> <td>m</td> <td>54</td> <td>2</td> </tr> <tr> <td>7</td> <td>H</td> <td>23</td> <td>X</td> <td>39</td> <td>n</td> <td>55</td> <td>3</td> </tr> <tr> <td>8</td> <td>I</td> <td>24</td> <td>Y</td> <td>40</td> <td>o</td> <td>56</td> <td>4</td> </tr> <tr> <td>9</td> <td>J</td> <td>25</td> <td>Z</td> <td>41</td> <td>p</td> <td>57</td> <td>5</td> </tr> <tr> <td>10</td> <td>K</td> <td>26</td> <td>a</td> <td>42</td> <td>q</td> <td>58</td> <td>6</td> </tr> <tr> <td>11</td> <td>L</td> <td>27</td> <td>b</td> <td>43</td> <td>r</td> <td>59</td> <td>7</td> </tr> <tr> <td>12</td> <td>M</td> <td>28</td> <td>c</td> <td>44</td> <td>s</td> <td>60</td> <td>8</td> </tr> <tr> <td>13</td> <td>N</td> <td>29</td> <td>d</td> <td>45</td> <td>t</td> <td>61</td> <td>9</td> </tr> <tr> <td>14</td> <td>O</td> <td>30</td> <td>e</td> <td>46</td> <td>u</td> <td>62</td> <td>+</td> </tr> <tr> <td>15</td> <td>P</td> <td>31</td> <td>f</td> <td>47</td> <td>v</td> <td>63</td> <td>/</td> </tr> </tbody> </table> 由于base64编码是将编码前的3\*8位数据,分解成4个6位的数据,所以经过base64编码后的字符串长度是4的倍数。但往往我们进行编码的数据长度并不是3的倍数,这就造成了“编码”后的位数不为4的倍数,比如Brisk共5×8=40位,以6位为一组可以分为7组,这样“编码”后就有7个字符,但base64编码后的字符长度应该是4的倍数,显然这里就出问题了,那么怎么办呢?前面的不可以抛弃掉,所以就只有“追加”了,所以Brisk经过base64编码后的长度应该是8个字符,而第8个编码后的字符是'=',再比如对单个字符a进行base64编码,由于它的长度不是3的倍数,以3个字节为一组它只能分一组,再以6位为一位它只能分两组,所以经过“编码”后它的长度是2,但base64编码后的个数应该是4的倍数,所以它的长度应该是4,所以在后面补上两个‘=’,由于一个数求余3后有三个不同的结果,0、1、2,所以在对一个数据进行base64进行编码后它的长度为: (1)当进行编码的数据长度是3的倍数时,len=strlen(str\_in)/3\*4; (2)当进行编码的数据长度不是3的倍数时,len=(strlen(str\_in)/3+1)\*4; 我们以Brisk这个例子来说明一下base64编码的过程。首先我们以3个字符为一组将Brisk进行分组,Brisk被氛围两组:Bri 和 sk;然后我们取出这两个分组中每个字节的ASCII码,B:66 r:114 i:105 s:115 k:107。它们对应的二进制数为 B:01000010 r:01110010 i:01101001 s:01110011 k:01101011; 第一组,我们以6位为一组对每一个3字节分组进行再分组就变成了010000 100111 001001 101001。所对应的十进制数是16 39 9 41,对应base64表中的结果是 Q n J p; 第二组,011100 110110 101100(不够补0),所以对应的十进制数是 28 54 44,对应base64表中的结果是 c 2 s,最终结果为QnJpc2s=(因为第二组“编码”后只有三个字节)。 解码的过程是一个逆过程,我们将经过编码后的字符按4个字符为一组,然后对照base64表得到相应的十进制数,再将其通过拆分和组合,组成3个8位数据,这个数据就是解码后的数据,下面给一个c语言实现编码和解码的代码。 /*base64.h*/ #ifndef _BASE64_H #define _BASE64_H #include <stdlib.h> #include <string.h> unsigned char *base64_encode(unsigned char *str); unsigned char *bae64_decode(unsigned char *code); #endif /*base64.c*/ #include "base64.h" unsigned char *base64_encode(unsigned char *str) { long len; long str_len; unsigned char *res; int i,j; //定义base64编码表 unsigned char *base64_table="ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"; //计算经过base64编码后的字符串长度 str_len=strlen(str); if(str_len % 3 == 0) len=str_len/3*4; else len=(str_len/3+1)*4; res=malloc(sizeof(unsigned char)*len+1); res[len]='\0'; //以3个8位字符为一组进行编码 for(i=0,j=0;i<len-2;j+=3,i+=4) { res[i]=base64_table[str[j]>>2]; //取出第一个字符的前6位并找出对应的结果字符 res[i+1]=base64_table[(str[j]&0x3)<<4 | (str[j+1]>>4)]; //将第一个字符的后位与第二个字符的前4位进行组合并找到对应的结果字符 res[i+2]=base64_table[(str[j+1]&0xf)<<2 | (str[j+2]>>6)]; //将第二个字符的后4位与第三个字符的前2位组合并找出对应的结果字符 res[i+3]=base64_table[str[j+2]&0x3f]; //取出第三个字符的后6位并找出结果字符 } switch(str_len % 3) { case 1: res[i-2]='='; res[i-1]='='; break; case 2: res[i-1]='='; break; } return res; } unsigned char *base64_decode(unsigned char *code) { //根据base64表,以字符找到对应的十进制数据 int table[]={0,0,0,0,0,0,0,0,0,0,0,0, 0,0,0,0,0,0,0,0,0,0,0,0, 0,0,0,0,0,0,0,0,0,0,0,0, 0,0,0,0,0,0,0,62,0,0,0, 63,52,53,54,55,56,57,58, 59,60,61,0,0,0,0,0,0,0,0, 1,2,3,4,5,6,7,8,9,10,11,12, 13,14,15,16,17,18,19,20,21, 22,23,24,25,0,0,0,0,0,0,26, 27,28,29,30,31,32,33,34,35, 36,37,38,39,40,41,42,43,44, 45,46,47,48,49,50,51 }; long len; long str_len; unsigned char *res; int i,j; //计算解码后的字符串长度 len=strlen(code); //判断编码后的字符串后是否有= if(strstr(code,"==")) str_len=len/4*3-2; else if(strstr(code,"=")) str_len=len/4*3-1; else str_len=len/4*3; res=malloc(sizeof(unsigned char)*str_len+1); res[str_len]='\0'; //以4个字符为一位进行解码 for(i=0,j=0;i < len-2;j+=3,i+=4) { res[j]=((unsigned char)table[code[i]])<<2 | (((unsigned char)table[code[i+1]])>>4); //取出第一个字符对应base64表的十进制数的前6位与第二个字符对应base64表的十进制数的后2位进行组合 res[j+1]=(((unsigned char)table[code[i+1]])<<4) | (((unsigned char)table[code[i+2]])>>2); //取出第二个字符对应base64表的十进制数的后4位与第三个字符对应bas464表的十进制数的后4位进行组合 res[j+2]=(((unsigned char)table[code[i+2]])<<6) | ((unsigned char)table[code[i+3]]); //取出第三个字符对应base64表的十进制数的后2位与第4个字符进行组合 } return res; } /*一个测试程序*/ #include "base64.h" #include <stdio.h> #include <string.h> int main(int argc,char **argv) { unsigned char *buf =NULL; if(strcmp(argv[1],"-d") == 0) { buf = base64_decode(argv[2]); printf("%s\n",buf); } else { buf = base64_encode(argv[1]); printf("%s\n",buf); } free(buf); return 0; } ———————————————— 版权声明:本文为CSDN博主「Alen.Wang」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。 原文链接:https://blog.csdn.net/qq\_26093511/article/details/78836087
还没有评论,来说两句吧...