• go语言序列化json/gob/msgp/protobuf性能对比


    基础知识

    json和gob是go语言自带的序列化方式,都在encoding包下面。

    go自带的json使用反射机制,效率低。easyjson在解析json数据的时候,并不是使用反射机制,而只针对预先定义好的json结构体对输入的json字符串进行纯字符串的截取,并将对应的json字段赋值给结构体。easyjson提供提供了代码生成工具easyjson -all <file>.go,可以一键生成go文件中定义的结构体对应的解析。

    messagepack是一种十分高效的编码方式,在文件头加入“//go:generate msgp”,使用go generate xx.go命令生成文件。

    protobuf有多个实现版本,官方版本使用了反射性能相对较差,对CPU和内存要求非常高的情况下可以使用FlatBuffers,一般推荐使用gogo-protobuf就足够用了。

    要使用easyjson、msgp(全称message pack)和protobuf需要先安装:

    go get github.com/mailru/easyjson

    go get github.com/tinylib/msgp

    go get github.com/gogo/protobuf/protoc-gen-gogofaster

    安装后在$GOPATH/bin下生成easyjson、msgp、 protoc-gen-gogofaster三个可执行文件(如果用的是go1.7及以上版本,go get不会默认执行go install,执行go get后还需要手动执行go install,比如执行go install github.com/mailru/easyjson才会生成easyjson这个可执行文件)。

    使用easyjson和msgp需要先写一个go文件,定义好要序列化的结构体。

    person.go

    //go:generate msgp
    //easyjson不需要上面这一行 package serialize type Person struct { DocId uint32 Position string Company string City string SchoolLevel int32 Vip bool Chat bool Active int32 WorkAge int32 }

    执行命令 easyjson -all ./serialize/person.go 会生成person_easyjson.go。

    执行命令 go generate ./serialize/person.go 会生成person_gen.go和person_gen_test.go。Person结构体的序列化和反序列化函数就在person_gen.go文件里。

    要使用protobuf需要先编写.proto文件,为保证对比的公平性,我们定义一个Doc,它跟Person的字段完全相同。

    doc.proto

    syntax = "proto3";
    package serialize;
    
    message  Doc {
        uint32 doc_id = 1;
        string position = 2;
        string company = 3;
        string city = 4;
        int32 school_level = 5;
        bool vip = 6;
        bool chat = 7;
        int32 active = 8;
        int32 work_age=9;
    }
    

     执行命令  protoc -I=. doc.proto --gogofaster_out=. 会生成doc.pb.go,Doc的序列化和反序列化函数就在这个文件里。

    单元测试package serialize

    package serialize
    
    import (
    	"bytes"
    	"encoding/gob"
    	"encoding/json"
    	"fmt"
    	"testing"
    
    	"github.com/gogo/protobuf/proto"
    	easyjson "github.com/mailru/easyjson"
    	"github.com/tinylib/msgp/msgp"
    )
    
    var doc = Doc{DocId: 123, Position: "搜索工程师", Company: "百度", City: "北京", SchoolLevel: 2, Vip: false, Chat: true, Active: 1, WorkAge: 3}
    var person = Person{DocId: 123, Position: "搜索工程师", Company: "百度", City: "北京", SchoolLevel: 2, Vip: false, Chat: true, Active: 1, WorkAge: 3}
    
    func TestJson(t *testing.T) {
    	bs, _ := json.Marshal(doc)
    	fmt.Printf("json encode byte length %d
    ", len(bs))
    	var inst Doc
    	_ = json.Unmarshal(bs, &inst)
    	fmt.Printf("json decode position %s
    ", inst.Position)
    } 
    
    func TestEasyJson(t *testing.T) {
    	bs, _ := person.MarshalJSON()
    	fmt.Printf("easyjson encode byte length %d
    ", len(bs))
    	var inst Person
    	_ = easyjson.Unmarshal(bs, &inst)
    	fmt.Printf("easyjson decode position %s
    ", inst.Position)
    } 
    
    func TestGob(t *testing.T) {
    	var buffer bytes.Buffer
    	encoder := gob.NewEncoder(&buffer)
    	_ = encoder.Encode(doc)
    	fmt.Printf("gob encode byte length %d
    ", len(buffer.Bytes()))
    	var inst Doc
    	decoder := gob.NewDecoder(&buffer)
    	_ = decoder.Decode(&inst)
    	fmt.Printf("gob decode position %s
    ", inst.Position)
    }
    
    func TestGogoProtobuf(t *testing.T) {
    	bs, _ := proto.Marshal(&doc)
    	fmt.Printf("pb encode byte length %d
    ", len(bs))
    	var inst Doc
    	_ = proto.Unmarshal(bs, &inst)
    	fmt.Printf("pb decode position %s
    ", inst.Position)
    } 
    
    func TestMsgp(t *testing.T) {
    	var buf bytes.Buffer
    	_ = msgp.Encode(&buf, &person)
    	fmt.Printf("msgp encode byte length %d
    ", len(buf.Bytes()))
    	var inst Person
    	_ = msgp.Decode(&buf, &inst)
    	fmt.Printf("msgp decode position %s
    ", inst.Position)
    }
    

      

    基准测试

    func BenchmarkJsonEncode(b *testing.B) {
    	for i := 0; i < b.N; i++ {
    		json.Marshal(doc)
    	}
    }
    
    func BenchmarkJsonDecode(b *testing.B) {
    	bs, _ := json.Marshal(doc)
    	var inst Doc
    	b.ResetTimer()
    	for i := 0; i < b.N; i++ {
    		json.Unmarshal(bs, &inst)
    	}
    }
    
    func BenchmarkEasyJsonEncode(b *testing.B) {
    	for i := 0; i < b.N; i++ {
    		person.MarshalJSON()
    	}
    }
    
    func BenchmarkEasyJsonDecode(b *testing.B) {
    	bs, _ := person.MarshalJSON()
    	var inst Person
    	b.ResetTimer()
    	for i := 0; i < b.N; i++ {
    		easyjson.Unmarshal(bs, &inst)
    	}
    }
    
    func BenchmarkGobEncode(b *testing.B) {
    	for i := 0; i < b.N; i++ {
    		var buffer bytes.Buffer
    		encoder := gob.NewEncoder(&buffer)
    		encoder.Encode(doc)
    	}
    }
    
    func BenchmarkGobDecode(b *testing.B) {
    	var buffer bytes.Buffer
    	encoder := gob.NewEncoder(&buffer)
    	encoder.Encode(doc)
    	var inst Doc
    	b.ResetTimer()
    	for i := 0; i < b.N; i++ {
    		buffer.Reset()
    		decoder := gob.NewDecoder(&buffer)
    		decoder.Decode(&inst)
    	}
    }
    
    func BenchmarkPbEncode(b *testing.B) {
    	for i := 0; i < b.N; i++ {
    		proto.Marshal(&doc)
    	}
    }
    
    func BenchmarkPbDecode(b *testing.B) {
    	bs, _ := proto.Marshal(&doc)
    	var inst Doc
    	b.ResetTimer()
    	for i := 0; i < b.N; i++ {
    		proto.Unmarshal(bs, &inst)
    	}
    }
    
    func BenchmarkMsgpEncode(b *testing.B) {
    	for i := 0; i < b.N; i++ {
    		var buf bytes.Buffer
    		msgp.Encode(&buf, &person)
    	}
    }
    
    func BenchmarkMsgpDecode(b *testing.B) {
    	var buf bytes.Buffer
    	msgp.Encode(&buf, &person)
    	var inst Person
    	b.ResetTimer()
    	for i := 0; i < b.N; i++ {
    		buf.Reset()
    		msgp.Decode(&buf, &inst)
    	}
    }
    

    在跑基础测试时我们通过-benchmem 把内存的使用情况也输出。

        速度 ns/op 内存开销 B/op
    序列化 json 982 224
    easyjson 643 720
    gob 5714 1808
    gogo-protobuf 114 48
    msgpack 311 160
    反序列化 json 2999 256
    easyjson 951 32
    gob 338 288
    gogo-protobuf 173 32
    msgpack 131 32

     结论:

    第一梯队:gogo-protobuf序列化比msgp快2倍多,反序列化相差不多。

    第二梯队:easyjson比json的主要优势体现在反序列化方面,快了3倍,序列化快的不多。gob的反序列化比json快了9倍,但序列化却比json慢了5倍多。

  • 相关阅读:
    fstab是什么?被谁用?怎么写?
    一个驱动导致的内存泄漏问题的分析过程(meminfo->pmap->slabtop->alloc_calls)
    Ubuntu下doxygen+graphviz使用概录
    记录Ubuntu下使用docker使用
    hidraw设备简要分析
    一个版本烧录过程中记录:fdisk、mkfs.ext4、make_ext4fs、img2simg、simg2img
    bootrom/spl/uboot/linux逐级加载是如何实现的?
    Linux uevent分析、用户接收uevent以及mdev分析
    sched_yield()和nanosleep()对进程调度的影响
    Linux Thermal Framework分析及实施
  • 原文地址:https://www.cnblogs.com/zhangchaoyang/p/15256978.html
Copyright © 2020-2023  润新知