golang数据传输格式-序列化与反序列化
作者:尹正杰
版权声明:原创作品,谢绝转载!否则将追究法律责任。
想必计算机专业毕业的小伙伴应该都知道数据想要持久化存储,必须将其存在I/O设备里面,这些I/O设备可以是光盘,U盘,机械硬盘,移动硬盘等等。那么这些数据是以哪种方式进程存取的呢?这就是我们聊的数据传输格式。
数据格式(data format)是描述数据保存在文件或记录中的规则。可以是字符形式的文本格式,或二进制数据形式的压缩格式。字符形式的文本格式占用的存贮空间多但透明度高,二进制数形式的压缩格式占用的存贮空间少但缺少透明度。数据结构是计算机存储、组织数据的方式。数据结构是指相互之间存在一种或多种特定关系的数据元素的集合。通常情况下,精心选择的数据结构可以带来更高的运行或者存储效率。
数据结构往往同高效的检索算法和索引技术有关。[1] 数据结构要在网络中传输或保存到文件,就必须对其编码和解码;目前存在很多编码格式:JSON,XML,gob,Google 缓冲协议等等。Go 语言支持所有这些编码格式。不过本篇博客将讨论前三种格式。
一.XML
XML作为一种数据交换和信息传递的格式已经十分普及。而随着 Web服务日益广泛的应用,现在XML在日常的开发工作中也扮演了愈发重要的角色。如同 json 包一样,也有 Marshal() 和 UnMarshal() 从 XML 中编码和解码数据;但这个更通用,可以从文件中读取和写入(或者任何实现了 io.Reader 和 io.Writer 接口的类型)和 JSON 的方式一样,XML 数据可以序列化为结构,或者从结构反序列化为 XML 数据;
接下来我们将对“yinzhengjie.xml”文件进行反序列化,其文件内容如下:
1 <?xml version="1.0" encoding="UTF-8"?> <!--第一行是 XML 声明。它定义 XML 的版本 (1.0) 和所使用的"UTF-8"编码。--> 2 <UserInformation> <!--第一行描述文档的根元素(像在说:“本文档是记录用户信息的”):--> 3 <string age="18">yinzhengjie</string> <!--本行和以下两行都是跟的子元素,当然你可以给它嵌套更多的子子孙孙。注意,这里的标签名称是“string”,这个标签名称你也可以自己随意更改的哟!--> 4 <string age="20">尹正杰</string> 5 </UserInformation> <!--最后一行定义根元素的结尾-->
1.Xml数据格式的反序列化
1 /* 2 #!/usr/bin/env gorun 3 @author :yinzhengjie 4 Blog:http://www.cnblogs.com/yinzhengjie/tag/GO%E8%AF%AD%E8%A8%80%E7%9A%84%E8%BF%9B%E9%98%B6%E4%B9%8B%E8%B7%AF/ 5 EMAIL:y1053419035@qq.com 6 */ 7 8 package main 9 10 import ( 11 "encoding/xml" 12 "io/ioutil" 13 "log" 14 "fmt" 15 ) 16 17 var ( 18 InputFile = "E:\Code\Golang\Golang_Program\数据格式进阶\yinzhengjie.xml" 19 ) 20 21 22 type RootElement struct { //这是定义根元素的,我们需要做的就是讲XML数据的结构先定义出来,就是为了方便主函数一会直接通过这个结构去读取数据。 23 XMLName xml.Name `xml:"UserInformation"` //这个我们指定XML的根元素,我们也可以叫它最外层标签。 24 ResourceString []ChildElement `xml:"string"` //上面是指定父标签的话,这个应该就不用多做解释吧,当然是子标签了啦。如果你的子表情有多个属性的,或是有多个同类型的标签的话,就可以用切片来存储。 25 } 26 27 type ChildElement struct { //这个结构体是定义子元素的结构的。 28 XMLName xml.Name `xml:"string"` //注意,这里是我们的子元素的一级标签,因此该标签的名称必须填写正确,不然反序列化的时候就会报错。 29 StringName string `xml:"age,attr"` //这个是定义,一级标签的属性的,我们需要用attr来进行表示,于此同时,我们还需要输入属性的关键字“age” 30 InnerText string `xml:",innerxml"` //这行就是定义标签里面的具体内容经的,对了,其中关键字“,innerxml”里的逗号不要忘记哟。 31 } 32 33 func main() { 34 GolangXml, err := ioutil.ReadFile(InputFile) //我们把数据一次性读取到一个切片中。 35 if err != nil { 36 log.Fatal(err) 37 } 38 39 var result RootElement 40 fmt.Printf("序列化之前GolangXml = [%v] ",result) 41 err = xml.Unmarshal(GolangXml, &result) //然后对数据进行反序列化。 42 if err != nil { 43 log.Fatal(err) 44 } 45 fmt.Printf("序列化之后GolangXml = [%v] ",result) 46 fmt.Println(result.ResourceString) 47 } 48 49 50 51 #以上代码执行结果如下: 52 序列化之前GolangXml = [{{ } []}] 53 序列化之后GolangXml = [{{ UserInformation} [{{ string} 18 yinzhengjie} {{ string} 20 尹正杰}]}] 54 [{{ string} 18 yinzhengjie} {{ string} 20 尹正杰}]
2.Xml数据格式的序列化
1 /* 2 #!/usr/bin/env gorun 3 @author :yinzhengjie 4 Blog:http://www.cnblogs.com/yinzhengjie/tag/GO%E8%AF%AD%E8%A8%80%E7%9A%84%E8%BF%9B%E9%98%B6%E4%B9%8B%E8%B7%AF/ 5 EMAIL:y1053419035@qq.com 6 */ 7 8 package main 9 10 import ( 11 "encoding/xml" 12 "io/ioutil" 13 "log" 14 "fmt" 15 "strings" 16 "os" 17 ) 18 19 var ( 20 InputFile = "E:\Code\Golang\Golang_Program\数据格式进阶\yinzhengjie.xml" 21 OutputFile = "E:\Code\Golang\Golang_Program\数据格式进阶\yinzhengjie.xml.bak" 22 ) 23 24 25 type RootElement struct { //这是定义根元素的,我们需要做的就是讲XML数据的结构先定义出来,就是为了方便主函数一会直接通过这个结构去读取数据。 26 XMLName xml.Name `xml:"UserInformation"` //这个我们指定XML的根元素,我们也可以叫它最外层标签。 27 ResourceString []ChildElement `xml:"string"` //上面是指定父标签的话,这个应该就不用多做解释吧,当然是子标签了啦。如果你的子表情有多个属性的,或是有多个同类型的标签的话,就可以用切片来存储。 28 } 29 30 type ChildElement struct { //这个结构体是定义子元素的结构的。 31 XMLName xml.Name `xml:"string"` //注意,这里是我们的子元素的一级标签,因此该标签的名称必须填写正确,不然反序列化的时候就会报错。 32 StringName string `xml:"age,attr"` //这个是定义,一级标签的属性的,我们需要用attr来进行表示,于此同时,我们还需要输入属性的关键字“age” 33 InnerText string `xml:",innerxml"` //这行就是定义标签里面的具体内容经的,对了,其中关键字“,innerxml”里的逗号不要忘记哟。 34 } 35 36 func main() { 37 GolangXml, err := ioutil.ReadFile(InputFile) //我们把数据一次性读取到一个切片中。 38 if err != nil { 39 log.Fatal(err) 40 } 41 42 var result RootElement 43 err = xml.Unmarshal(GolangXml, &result) //然后对数据进行反序列化。 44 if err != nil { 45 log.Fatal(err) 46 } 47 for key,value := range result.ResourceString{ 48 if strings.EqualFold(value.StringName,"18") { //只修改属性值为"18"节点的内部文本innerText 49 result.ResourceString[key].InnerText = "666666666666666" //注意修改的不是value对象,而是直接使用result中的真实对象 50 fmt.Println("内容修改完毕!") 51 } 52 } 53 XmlOutput,err := xml.MarshalIndent(result,"","") //保存修改后的内容 54 if err == nil { 55 HeaderBytes := []byte(xml.Header) //加入XML头信息 56 XmlData := append(HeaderBytes,XmlOutput...) //拼接XML头和实际XML内容 57 ioutil.WriteFile(OutputFile,XmlData,os.ModeAppend) //写入文件 58 fmt.Println(string(XmlData)) 59 fmt.Println("文件写入成功!") 60 }else { 61 fmt.Println(err) 62 } 63 } 64 65 66 67 #以上代码执行结果如下: 68 内容修改完毕! 69 <?xml version="1.0" encoding="UTF-8"?> 70 <UserInformation><string age="18">666666666666666</string><string age="20">尹正杰</string></UserInformation> 71 文件写入成功!
执行以上代码之后,会生成一个新的文件,即“yinzhengjie.xml.bak”文件。其内容如下:
1 <?xml version="1.0" encoding="UTF-8"?> 2 <UserInformation><string age="18">666666666666666</string><string age="20">尹正杰</string></UserInformation>
更多关于学习XML知识的话,我推荐两个学习的网站给大家:
a>.http://www.xml.org/
b>.http://www.w3school.com.cn/xml/
二.JSON
JSON(JavaScript Object Notation)是一种轻量级的数据交换格式。人类阅读和写作很容易。机器解析和生成很容易。它基于JavaScript编程语言的一个子集 , 标准ECMA-262第3版 - 1999年12月。JSON是完全独立于语言的文本格式,但是使用C语言家族的程序员熟悉的约定,包括C,C ++,C#,Java,JavaScript,Perl,Python等等。这些属性使JSON成为理想的数据交换语言。
1.Json数据格式的序列化
在golang语言中,我们用json.Marshal() 进行序列化。json.Marshal() 的函数签名是 func Marshal(v interface{}) ([]byte, error)。出于安全考虑,在 web 应用中最好使用 json.MarshalforHTML() 函数,其对数据执行HTML转码,所以文本可以被安全地嵌在 HTML <script> 标签中。序列化是在内存中把数据转换成指定格式(data -> string),反之亦然(string -> data structure)编码也是一样的,只是输出一个数据流(实现了 io.Writer 接口);解码是从一个数据流(实现了io.Reader)输出到一个数据结构。
JSON 与 Go 类型对应如下:
a>.bool 对应 JSON 的 booleans;
b>.float64 对应 JSON 的 numbers;
c>.string 对应 JSON 的 strings;
d>.nil 对应 JSON 的 null;
不是所有的数据都可以编码为 JSON 类型:只有验证通过的数据结构才能被编码:
a>.JSON 对象只支持字符串类型的 key;要编码一个 Go map 类型,map 必须是 map[string]T(T是json 包中支持的任何类型);
b>.Channel,复杂类型和函数类型不能被编码;
c>.不支持循环数据结构;它将引起序列化进入一个无限循环;
d>.指针可以被编码,实际上是对指针指向的值进行编码(或者指针是 nil);
Go 语言的 json 包可以让你在程序中方便的读取和写入 JSON 数据。接下来我们一起看一下golang是如何使用json包的:
1 /* 2 #!/usr/bin/env gorun 3 @author :yinzhengjie 4 Blog:http://www.cnblogs.com/yinzhengjie/tag/GO%E8%AF%AD%E8%A8%80%E7%9A%84%E8%BF%9B%E9%98%B6%E4%B9%8B%E8%B7%AF/ 5 EMAIL:y1053419035@qq.com 6 */ 7 8 package main 9 10 import ( 11 "encoding/json" 12 "fmt" 13 "log" 14 "os" 15 ) 16 17 var ( 18 OutputFile = "E:\Code\Golang\Golang_Program\数据格式进阶\yinzhengjie.json" 19 ) 20 21 type TenScenicSpots struct { //定义10个景区的名称。 22 FirstScenic string 23 SecondScenic string 24 ThirdScenic string 25 FourthScenic string 26 FifrhScenic string 27 SixthScenic string 28 SeventhScenic string 29 EigthtScenic string 30 NinthScenic string 31 TenthScenic string 32 } 33 34 type TouristInformation struct { //定义游客信息 35 VisitorName string //游客姓名 36 Nationality string //游客国籍 37 City string //想要去的城市 38 ScenicSpot []*TenScenicSpots //想要去看的景区 39 40 } 41 42 func main() { 43 ChaoyangDistrict := &TenScenicSpots{"中华名族园","北京奥林匹克公园","国家体育馆","中国科学技术官","奥林匹克公园网球场","蟹岛绿色生态农庄","国家游泳中心(水立方)","中国紫檀博物馆","北京欢乐谷","元大都城"} 44 DaxingDistrict := &TenScenicSpots{ "北京野生动物园","男孩子麋鹿苑","中华文化园","留民营生态农场","中国印刷博物馆","北普陀影视城","大兴滨河森林公园","呀路古热带植物园","庞各庄万亩梨园","西黄垈村"} 45 District := TouristInformation{"尹正杰", "中国", "北京", []*TenScenicSpots{ChaoyangDistrict, DaxingDistrict}} 46 GolangJson, err := json.Marshal(District) //这个步骤就是序列化的过程。json.Marshal方法会返回一个字节数组,即GolangJson,与此同时,District已经是JSON格式的啦。 47 if err != nil { 48 log.Fatal("序列化报错是:%s",err) 49 } 50 fmt.Printf("JSON format: %s", GolangJson) 51 52 file, _ := os.OpenFile(OutputFile, os.O_CREATE|os.O_WRONLY, 0) 53 defer file.Close() 54 Write := json.NewEncoder(file) //创建一个编码器。 55 err = Write.Encode(District) //由于District已经被json.Marshal方法处理过了,所以我们直接把JSON格式的District传给Write写入器,调用该写入器的Encode方法可以对JSON格式的数据进行编码。如果顺利的话,我们会得到一个nil参数,否则我们会得到编码的错误信息。 56 if err != nil { 57 log.Println("Error in encoding json") 58 } 59 } 60 61 62 63 64 #以上代码执行结果如下: 65 JSON format: {"VisitorName":"尹正杰","Nationality":"中国","City":"北京","ScenicSpot":[{"FirstScenic":"中华名族园","SecondScenic":"北京奥林匹克公园","ThirdScenic":"国家体育馆","FourthScenic":"中国科学技术官","FifrhScenic":"奥林匹克公园网球场","SixthScenic":"蟹岛绿色生态农庄","SeventhScenic":"国家游泳中心(水立方)","EigthtScenic":"中国紫檀博物馆","NinthScenic":"北京欢乐谷","TenthScenic":"元大都城"},{"FirstScenic":"北京野生动物园","SecondScenic":"男孩子麋鹿苑","ThirdScenic":"中华文化园","FourthScenic":"留民营生态农场","FifrhScenic":"中国印刷博物馆","SixthScenic":"北普陀影视城","SeventhScenic":"大兴滨河森林公园","EigthtScenic":"呀路古热带植物园","NinthScenic":"庞各庄万亩梨园","TenthScenic":"西黄垈村"}]}
2.Json数据格式的反序列化
如果我们事先知道 JSON 数据,我们可以定义一个适当的结构并对 JSON 数据反序列化。我们上面做序列化的时候创建了一个“yinzhengjie.json”的文件,里面的数据结果我们是心知肚明的,因此,接下来反序列化就是一件很Easy的事情啦。
1 /* 2 #!/usr/bin/env gorun 3 @author :yinzhengjie 4 Blog:http://www.cnblogs.com/yinzhengjie/tag/GO%E8%AF%AD%E8%A8%80%E7%9A%84%E8%BF%9B%E9%98%B6%E4%B9%8B%E8%B7%AF/ 5 EMAIL:y1053419035@qq.com 6 */ 7 8 package main 9 10 11 import ( 12 "encoding/json" 13 "fmt" 14 "log" 15 "io/ioutil" 16 ) 17 18 var ( 19 InputFile = "E:\Code\Golang\Golang_Program\数据格式进阶\yinzhengjie.json" 20 ) 21 22 type TenScenicSpots struct { //定义10个景区的名称。 23 FirstScenic string 24 SecondScenic string 25 ThirdScenic string 26 FourthScenic string 27 FifrhScenic string 28 SixthScenic string 29 SeventhScenic string 30 EigthtScenic string 31 NinthScenic string 32 TenthScenic string 33 } 34 35 type TouristInformation struct { //定义游客信息 36 VisitorName string //游客姓名 37 Nationality string //游客国籍 38 City string //想要去的城市 39 ScenicSpot []*TenScenicSpots //想要去看的景区 40 41 } 42 43 func main() { 44 var GolangJson TouristInformation //定义反序列化JSON的格式 45 46 file,err := ioutil.ReadFile(InputFile) //得到的文件是一个字节切片哟 47 if err != nil { 48 log.Println(err) 49 } 50 51 err = json.Unmarshal(file,&GolangJson) //将得到的字节进行反序列化 52 if err != nil { 53 log.Fatal("反序列化报错啦:%s",err) 54 } 55 56 fmt.Printf("JSON format: %v ", GolangJson) //将反序列化的文件打印出来。 57 fmt.Println(GolangJson.City) 58 fmt.Println(GolangJson.ScenicSpot[1]) 59 } 60 61 62 63 #以上代码执行结果如下: 64 JSON format: {尹正杰 中国 北京 [0xc042050140 0xc042050280]} 65 北京 66 &{北京野生动物园 男孩子麋鹿苑 中华文化园 留民营生态农场 中国印刷博物馆 北普陀影视城 大兴滨河森林公园 呀路古热带植物园 庞各庄万亩梨园 西黄垈村}
更多关于学习XML知识的话,我推荐两个学习的网站给大家:
a>.http://www.json.org/
b>.http://www.w3school.com.cn/json/
三.Gob
Gob 是 Go 自己的以二进制形式序列化和反序列化程序数据的格式;可以在 encoding 包中找到。这种格式的数据简称为 Gob (即 Go binary 的缩写)。类似于 Python 的 "pickle" 和 Java 的"Serialization"。
Gob 通常用于远程方法调用参数和结果的传输,以及应用程序和机器之间的数据传输。 它和 JSON 或 XML 有什么不同呢?Gob 特定地用于纯 Go 的环境中,例如,两个用 Go 写的服务之间的通信。这样的话服务可以被实现得更加高效和优化。 Gob 不是可外部定义,语言无关的编码方式。因此它的首选格式是二进制,而不是像 JSON 和 XML 那样的文本格式。 Gob 并不是一种不同于Go 的语言,而是在编码和解码过程中用到了 Go 的反射。
Gob 文件或流是完全自描述的:里面包含的所有类型都有一个对应的描述,并且总是可以用 Go 解码,而不需要了解文件的内容。
只有可导出的字段会被编码,零值会被忽略。在解码结构体的时候,只有同时匹配名称和可兼容类型的字段才会被解码。当源数据类型增加新字段后,Gob 解码客户端仍然可以以这种方式正常工作:解码客户端会继续识别以前存在的字段。并且还提供了很大的灵活性,比如在发送者看来,整数被编码成没有固定长度的可变长度,而忽略具体的 Go 类型。
Golang的解码和编码就相对简单啦,就我个人而言,我对golang专有的gob格式还是那么的情有独钟。它的使用方法很简单,我们可以一起看一下它的解码和编码的过程,具体代码 如下:
1.Gob的编码(序列化)
1 /* 2 #!/usr/bin/env gorun 3 @author :yinzhengjie 4 Blog:http://www.cnblogs.com/yinzhengjie/tag/GO%E8%AF%AD%E8%A8%80%E7%9A%84%E8%BF%9B%E9%98%B6%E4%B9%8B%E8%B7%AF/ 5 EMAIL:y1053419035@qq.com 6 */ 7 8 package main 9 10 import ( 11 "bytes" 12 "encoding/gob" 13 "log" 14 "io/ioutil" 15 ) 16 17 var ( 18 OutputFile = "E:\Code\Golang\Golang_Program\数据格式进阶\yinzhengjie.gob" 19 ) 20 21 type P struct { 22 X, Y, Z int 23 Name string 24 } 25 26 func main() { 27 var GolngGob bytes.Buffer 28 29 enc := gob.NewEncoder(&GolngGob) //生成一个的编码器 30 31 yzj := P{100, 200, 300, "Yinzhengjie"} 32 err := enc.Encode(yzj) //编码结构体和数据 33 if err != nil { 34 log.Fatal("encode error:", err) 35 } 36 ioutil.WriteFile(OutputFile, GolngGob.Bytes(), 0644) //我们把编码后的数据写入文件 37 }
执行以上代码之后会生成一个“yinzhengjie.gob”文件,这个文件的内容是二进制编码的,因此我们用gbk编码或是utf-8编码格式直接去打开的话可能不是很理想。因此我们可以通过gob的反序列化来进行读取操作,具体代码请参考以下代码。
2.Gob的解码(反序列化)
1 /* 2 #!/usr/bin/env gorun 3 @author :yinzhengjie 4 Blog:http://www.cnblogs.com/yinzhengjie/tag/GO%E8%AF%AD%E8%A8%80%E7%9A%84%E8%BF%9B%E9%98%B6%E4%B9%8B%E8%B7%AF/ 5 EMAIL:y1053419035@qq.com 6 */ 7 8 package main 9 10 import ( 11 "encoding/gob" 12 "log" 13 "os" 14 "fmt" 15 ) 16 17 var ( 18 InputFile = "E:\Code\Golang\Golang_Program\数据格式进阶\yinzhengjie.gob" 19 ) 20 21 type P struct { 22 X, Y, Z int 23 Name string 24 } 25 26 type Q struct { 27 X, Y,Z*int32 28 Name string 29 } 30 31 func main() { 32 file,err := os.Open(InputFile) 33 dec := gob.NewDecoder(file) //生成一个解码器 34 35 var GolangGob Q 36 fmt.Printf("解码前GolangGob的内容为[%v] ",GolangGob) 37 err = dec.Decode(&GolangGob) //开始按照我们定义好的GolangGob结构体开始解码。 38 if err != nil { 39 log.Fatal("decode error:", err) 40 } 41 fmt.Printf("解码后GolangGob的内容为[%v] ",GolangGob) 42 43 fmt.Printf("详细内容为:【%d,%d,%d,%q】 ", *GolangGob.X, *GolangGob.Y, *GolangGob.Z, GolangGob.Name) //注意传参的顺序哟! 44 } 45 46 47 48 #以上代码执行结果如下: 49 解码前GolangGob的内容为[{<nil> <nil> <nil> }] 50 解码后GolangGob的内容为[{0xc04203c838 0xc04203c83c 0xc04203c840 Yinzhengjie}] 51 详细内容为:【100,200,300,"Yinzhengjie"】
四.数据传输进阶知识-golang中的密码学
通过网络传输的数据必须加密,以防止被 hacker(黑客)读取或篡改,并且保证发出的数据和收到的数据检验和一致。 鉴于 Go 母公司的业务,我们毫不惊讶地看到 Go 的标准库为该领域提供了超过 30 个包:
1>.hash 包:实现了 adler32 、 crc32 、 crc64 和 fnv 校验;
2>.crypto 包:实现了其它的 hash 算法,比如 md4 、 md5 、 sha1 等。以及完整地实现了 aes 、blowfish 、 rc4 、 rsa 、 xtea 等加密算法。
想要了解更多关于golang加密方法的可以参考:http://www.cnblogs.com/yinzhengjie/p/7368030.html