上一篇文章介绍sproto的构建流程(http://www.cnblogs.com/RainRill/p/8986572.html),这一篇文章介绍sproto如何使用,参考https://github.com/cloudwu/sproto。
A端主动给B端发送请求:调用request_encode对lua表进行编码,再用sproto.pack打包。
B端收到A端的请求:用sproto.unpack解包,再调用request_decode解码成lua表。
B端给A端发送返回包:用response_encode对lua表进行编码,然后用sproto.pack打包。
A端收到B端的返回包:用sproto.unpack解包,再调用request_decode解码成lua表。
不管是是request_encode还是response_encode,最终都会调用c层的encode接口,request_decode和response_decode都会调用c层decode接口。encode负责将lua数据表编码成二进制数据块,而decode负责解码,二者是互补操作。同样,pack和unpack也是互补操作。
1 -- lualib/sproto.lua 2 function sproto:request_encode(protoname, tbl) 3 ... 4 return core.encode(request,tbl) , p.tag 5 end 6 7 function sproto:response_encode(protoname, tbl) 8 ... 9 return core.encode(response,tbl) 10 end 11 12 13 14 function sproto:request_decode(protoname, ...) 15 ... 16 return core.decode(request,...) , p.name 17 end 18 19 function sproto:response_decode(protoname, ...) 20 ... 21 return core.decode(response,...) 22 end 23 24 25 sproto.pack = core.pack 26 sproto.unpack = core.unpack
1. encode编码
先放一个例子(在github上有),分析源码时会用到:
person { name = "Alice" , age = 13, marital = false } 03 00 (fn = 3) 00 00 (id = 0, value in data part) 1C 00 (id = 1, value = 13) 02 00 (id = 2, value = false) 05 00 00 00 (sizeof "Alice") 41 6C 69 63 65 ("Alice")
encode的目的是按指定协议类型将lua表里的数据转化成c中的类型,然后按特定格式编码成一串二进制数据块。
最终调用sproto_encode api编码,有5个参数:st,sproto指定类型的c结构;buffer、size,存放编码结果的缓冲区和大小,如果缓冲区不够,会扩充缓冲区,重新编码;cb,对应lsproto.c中encode api,是一个c接口,负责获取lua表中指定key的值,或数组中指定索引位置的值;ud,额外信息,包含lua与c之间交互用的虚拟栈、sproto中对应类型的c结构等。
第3-6行,编码结果分两部分:头部header和数据data,header长度是固定的,等于2字节field总数+field的数目*2字节每个field长度。如下图:header指针指向缓冲区首地址,data指向header+header_sz位置,接下
来编码每个field信息时,data指针会往后移动,而header指针保持不动。
第63-65行,将field的总数按大端格式打包长2字节大小(示例中的03 00),data指向header+header_sz处,最后用memmove将头部和数据块连在一起。
接下来就是编码每一个field数据,根据field类型做不同的处理:
第11-13行,如果是array,调用encode_array编码,稍后介绍。
第33-37行,如果是string或自定义类型,调用encode_object编码,稍后介绍。
第16-32行,如果是integer或boolean类型,调用cb(lsproto.c中的encode)获取lua表中对应field名字的数值,保存到args.value(即u中)。第21行,变量value等于(原来的值+1)*2,因为编码后的0有特殊作用,为了区分原来值是0的情况。
第58-59行,最后将value按大端格式编码2字节,存到header指定的位置。比如示例中的1C 00,(13+1)*2=28=1C, 02 00,(0+1)*2=2=02,注:lua中的false会编码成0,true编码成1。如果是array、string或自定义类型,value是0,编码后是00 00,代表数值在data部分。
第47-56行,如果某些tag没有设置值,需要把tag信息编码到header里。
1 // lualib/sproto/sproto.c
2 int sproto_encode(const struct sproto_type *st, void * buffer, int size, sproto_callback cb, void *ud) {
3 uint8_t * header = buffer;
4 uint8_t * data;
5 int header_sz = SIZEOF_HEADER + st->maxn * SIZEOF_FIELD;
6 data = header + header_sz;
7 ...
8 for (i=0;i<st->n;i++) {
9 struct field *f = &st->f[i];
10 int type = f->type;
11 if (type & SPROTO_TARRAY) {
12 args.type = type & ~SPROTO_TARRAY;
13 sz = encode_array(cb, &args, data, size);
14 } else {
15 switch(type) {
16 case SPROTO_TINTEGER:
17 case SPROTO_TBOOLEAN: {
18 sz = cb(&args);
19 if (sz == sizeof(uint32_t)) {
20 if (u.u32 < 0x7fff) {
21 value = (u.u32+1) * 2;
22 sz = 2; // sz can be any number > 0
23 } else {
24 sz = encode_integer(u.u32, data, size);
25 }
26 } else if (sz == sizeof(uint64_t)) {
27 sz= encode_uint64(u.u64, data, size);
28 } else {
29 return -1;
30 }
31 break;
32 }
33 case SPROTO_TSTRUCT:
34 case SPROTO_TSTRING:
35 sz = encode_object(cb, &args, data, size);
36 break;
37 }
38 if (sz > 0) {
39 uint8_t * record;
40 int tag;
41 if (value == 0) {
42 data += sz;
43 size -= sz;
44 }
45 record = header+SIZEOF_HEADER+SIZEOF_FIELD*index;
46 tag = f->tag - lasttag - 1;
47 if (tag > 0) {
48 // skip tag
49 tag = (tag - 1) * 2 + 1;
50 if (tag > 0xffff)
51 return -1;
52 record[0] = tag & 0xff;
53 record[1] = (tag >> 8) & 0xff;
54 ++index;
55 record += SIZEOF_FIELD;
56 }
57 ++index;
58 record[0] = value & 0xff;
59 record[1] = (value >> 8) & 0xff;
60 lasttag = f->tag;
61 }
62 }
63 header[0] = index & 0xff;
64 header[1] = (index >> 8) & 0xff;
datasz = data - (header+header_sz);
data = header +header_sz;
memmove(header + SIZEOF_HEADER + index * SIZEOF_FIELD, data, datasz);
65 }
如果是string或自定义类型,调用encode_object编码,4个参数是:cb,即lsproto.c中encode接口;args,额外参数;data,存放编码结果的缓冲区,由4个字节的长度+具体数据组成;size,缓冲区长度
第9行,填充4字节的长度放到data的首地址处,比如示例中05 00 00 00
第5行,数据从data+SIZEOF_LENGTH开始存放,前4个字节存放数据长度
第26行,如果是字符串,拷贝字符串到指定位置,比如示例中41 6C 69 63 65("Alice")
第31行,如果是自定义类型,对子类型再次调用sproto_encode递归处理
1 // lualib-src/sproto/sproto.c 2 static int 3 encode_object(sproto_callback cb, struct sproto_arg *args, uint8_t *data, int size) { 4 int sz; 5 args->value = data+SIZEOF_LENGTH; 6 args->length = size-SIZEOF_LENGTH; 7 sz = cb(args); 8 ... 9 return fill_size(data, sz); 10 } 11 12 static inline int 13 fill_size(uint8_t * data, int sz) { 14 data[0] = sz & 0xff; 15 data[1] = (sz >> 8) & 0xff; 16 data[2] = (sz >> 16) & 0xff; 17 data[3] = (sz >> 24) & 0xff; 18 return sz + SIZEOF_LENGTH; 19 } 20 21 // lualib-src/sproto/lsproto.c 22 static int 23 encode(const struct sproto_arg *args) { 24 ... 25 case SPROTO_TSTRING: { 26 memcpy(args->value, str, sz); 27 ... 28 } 29 case SPROTO_TSTRUCT: { 30 ... 31 r = sproto_encode(args->subtype, args->value, args->length, encode, &sub); 32 } 33 }
如果是array类型,调用encode_array进行编码,遍历数组,对每一个元素进行编码,同样把数据长度编码成4个字节填充到前面。例如:
children = {
{ name = "Alice" , age = 13 },
{ name = "Carol" , age = 5 },
}
26 00 00 00 (sizeof children)
0F 00 00 00 (sizeof child 1)
02 00 (fn = 2)
00 00 (id = 0, value in data part)
1C 00 (id = 1, value = 13)
05 00 00 00 (sizeof "Alice")
41 6C 69 63 65 ("Alice")
0F 00 00 00 (sizeof child 2)
02 00 (fn = 2)
00 00 (id = 0, value in data part)
0C 00 (id = 1, value = 5)
05 00 00 00 (sizeof "Carol")
43 61 72 6F 6C ("Carol")
注: 如果数组元素是整数,在长度和数据之间会多用一个字节用来标记是小整数(小于2^32)还是大整数,小整数用4个字节(32位)存放,大整数用8个字节(64位)存放,例如:
numbers = { 1,2,3,4,5 }
15 00 00 00 (sizeof numbers)
04 ( sizeof int32 )
01 00 00 00 (1)
02 00 00 00 (2)
03 00 00 00 (3)
04 00 00 00 (4)
05 00 00 00 (5)
小结:编码后的二进制数据块由头部和数据两部分组成。头部包含field总数,以及每个field值。数据部分由长度和具体的数值组成。如果field值为0,表示数据在数据部分(array、string或自定义类型);如果field值最后一位为1,表示该field没数据;否则field值可直接转化对应lua数据(integer或boolean类型)。
2. decode解码
了解了encode编码过程,decode解码过程就是编码的逆过程,将二进制数据块解码成lua表。5个参数:st,sproto类型的c结构;data和size,待解码的二进制数据块和长度;cb,是一个c接口,即lsproto.c中decode,负责将c类型的数据push到lua虚拟栈里,然后供lua层使用;ud,额外参数,包括cb中需要用的lua虚拟栈。
第9-12行,获取头两字节表示field总数fn,stream指向头部,datastream指向数据块
第17行,对每一个field进行解码
第20行,获取field的值value。如果value最后一位为1,说明之后value/2个tag都没数据(第22-25行);
第26行,计算value的实际值,currentdata指向当前数据块(第27行)。如果小于0,说明是array、string或自定义类型,说明数据在数据部分,计算出数据长度sz,然后把datastream移到下一个field对应的数据块的位置(28-33行)。
第34-37行,找出tag对应的field信息,赋值给args,调用cb时根据args信息进行相应转化。
第61-66行,如果是integer或boolean类型,value即数据本身,调用cb,设置lua虚拟栈指定表的指定key的位置。
第49-58行,如果是string或自定义类型,先从数据部分中获取数据(52行),再调用cb。
第39-42行,如果是array类型,调用decode_array解码
1 // lualib-src/sproto/sproto.c 2 int 3 sproto_decode(const struct sproto_type *st, const void * data, int size, sproto_callback cb, void *ud) { 4 struct sproto_arg args; 5 int total = size; 6 uint8_t * stream; 7 uint8_t * datastream; 8 stream = (void *)data; 9 fn = toword(stream); 10 stream += SIZEOF_HEADER; 11 size -= SIZEOF_HEADER ; 12 datastream = stream + fn * SIZEOF_FIELD; 13 size -= fn * SIZEOF_FIELD; 14 args.ud = ud; 15 16 tag = -1; 17 for (i=0;i<fn;i++) { 18 uint8_t * currentdata; 19 struct field * f; 20 int value = toword(stream + i * SIZEOF_FIELD); 21 ++ tag; 22 if (value & 1) { 23 tag += value/2; 24 continue; 25 } 26 value = value/2 - 1; 27 currentdata = datastream; 28 if (value < 0) { 29 uint32_t sz; 30 sz = todword(datastream); 31 datastream += sz+SIZEOF_LENGTH; 32 size -= sz+SIZEOF_LENGTH; 33 } 34 f = findtag(st, tag); 35 36 args.tagname = f->name; 37 ... 38 if (value < 0) { 39 if (f->type & SPROTO_TARRAY) { 40 if (decode_array(cb, &args, currentdata)) { 41 return -1; 42 } 43 } else { 44 switch (f->type) { 45 case SPROTO_TINTEGER: { 46 ... 47 break; 48 } 49 case SPROTO_TSTRING: 50 case SPROTO_TSTRUCT: { 51 uint32_t sz = todword(currentdata); 52 args.value = currentdata+SIZEOF_LENGTH; 53 args.length = sz; 54 if (cb(&args)) 55 return -1; 56 break; 57 } 58 } 59 } else if (f->type != SPROTO_TINTEGER && f->type != SPROTO_TBOOLEAN) { 60 return -1; 61 } else { 62 uint64_t v = value; 63 args.value = &v; 64 args.length = sizeof(v); 65 cb(&args); 66 } 67 } 68 return total - size; 69 }
3. pack打包 与unpack解包
将lua表编码成特定的二进制数据块后,再用pack打包。其原理是:每8个字节为一组,打包后由第一个字节+原数据不为0的字节组成,第一个字节的每一位为0时表示原字节为0,否则就是跟随的某个字节。当第一个字节是FF时,有特殊含义,假设下一字节为N,表示接下来(N+1)*8个字节都是原数据。例如:
unpacked (hex): 08 00 00 00 03 00 02 00 19 00 00 00 aa 01 00 00
packed (hex): 51 08 03 02 31 19 aa 01
51 = 0101 0001,从右到左数,表示该组第1,5,7个位置一次是08,03,02,其余位置都是0。
调用sproto_pack打包,4个参数:srcv、srcsz原数据块和长度;bufferv、bufsz存放打包后数据的缓冲区和长度。
第5-6行,ff_srcstart,ff_desstart分别指向ff代表的源地址和目的地址
第11行,8个一组进行打包
第17-19行,不足8个,用0填充
第22行,调用pack_seg,打包成特定格式,存放在buffer里
第33,40行,如果ff_n>0,调用write_ff,按照ff的含义,重新打包,然后存放在buffer里。
1 int 2 sproto_pack(const void * srcv, int srcsz, void * bufferv, int bufsz) { 3 uint8_t tmp[8]; 4 int i; 5 const uint8_t * ff_srcstart = NULL; 6 uint8_t * ff_desstart = NULL; 7 int ff_n = 0; 8 int size = 0; 9 const uint8_t * src = srcv; 10 uint8_t * buffer = bufferv; 11 for (i=0;i<srcsz;i+=8) { 12 int n; 13 int padding = i+8 - srcsz; 14 if (padding > 0) { 15 int j; 16 memcpy(tmp, src, 8-padding); 17 for (j=0;j<padding;j++) { 18 tmp[7-j] = 0; 19 } 20 src = tmp; 21 } 22 n = pack_seg(src, buffer, bufsz, ff_n); 23 bufsz -= n; 24 if (n == 10) { 25 // first FF 26 ff_srcstart = src; 27 ff_desstart = buffer; 28 ff_n = 1; 29 } else if (n==8 && ff_n>0) { 30 ++ff_n; 31 if (ff_n == 256) { 32 if (bufsz >= 0) { 33 write_ff(ff_srcstart, ff_desstart, 256*8); 34 } 35 ff_n = 0; 36 } 37 } else { 38 if (ff_n > 0) { 39 if (bufsz >= 0) { 40 write_ff(ff_srcstart, ff_desstart, ff_n*8); 41 } 42 ff_n = 0; 43 } 44 } 45 src += 8; 46 buffer += n; 47 size += n; 48 } 49 if(bufsz >= 0){ 50 if(ff_n == 1) 51 write_ff(ff_srcstart, ff_desstart, 8); 52 else if (ff_n > 1) 53 write_ff(ff_srcstart, ff_desstart, srcsz - (intptr_t)(ff_srcstart - (const uint8_t*)srcv)); 54 } 55 return size; 56 }
了解打包原理后,解包就是打包的逆过程,变得很容易了。调用sproto_unpack解包:
第11-27行,如果第一个字节是ff,计算出可直接拷贝的字节数n,然后拷贝到buffer。
第30-50行,计算第一个字节的每一位(总共8位),如果是1,复制跟随的一个字节给buffer(32-41行);否则,设置buffer为0(42-49行)。
1 // lualib-src/sproto/sproto.c 2 int 3 sproto_unpack(const void * srcv, int srcsz, void * bufferv, int bufsz) { 4 const uint8_t * src = srcv; 5 uint8_t * buffer = bufferv; 6 int size = 0; 7 while (srcsz > 0) { 8 uint8_t header = src[0]; 9 --srcsz; 10 ++src; 11 if (header == 0xff) { 12 int n; 13 if (srcsz < 0) { 14 return -1; 15 } 16 n = (src[0] + 1) * 8; 17 if (srcsz < n + 1) 18 return -1; 19 srcsz -= n + 1; 20 ++src; 21 if (bufsz >= n) { 22 memcpy(buffer, src, n); 23 } 24 bufsz -= n; 25 buffer += n; 26 src += n; 27 size += n; 28 } else { 29 int i; 30 for (i=0;i<8;i++) { 31 int nz = (header >> i) & 1; 32 if (nz) { 33 if (srcsz < 0) 34 return -1; 35 if (bufsz > 0) { 36 *buffer = *src; 37 --bufsz; 38 ++buffer; 39 } 40 ++src; 41 --srcsz; 42 } else { 43 if (bufsz > 0) { 44 *buffer = 0; 45 --bufsz; 46 ++buffer; 47 } 48 } 49 ++size; 50 } 51 } 52 } 53 return size; 54 }
sproto协议是为lua量身定制的,非常适合用lua为脚本语言的框架。