• Python模块struct 数据格式转换


    Python是一门非常简洁的语言,对于数据类型的表示,不像其他语言预定义了许多类型(如:在C#中,光整型就定义了8种),它只定义了六种基本类型:字符串,整数,浮点数,元组,列表,字典。通过这六种数据类型,我们可以完成大部分工作。但当Python需要通过网络与其他的平台进行交互的时候,必须考虑到将这些数据类型与其他平台或语言之间的类型进行互相转换问题。打个比方:C++写的客户端发送一个int型(4字节)变量的数据到 Python写的服务器,Python接收到表示这个整数的4个字节数据,怎么解析成Python认识的整数呢? Python的标准模块struct就用来解决这个问题。

      struct模块的内容不多,也不是太难,下面对其中最常用的方法进行介绍:

     struct.pack

      struct.pack用于将Python的值根据格式符,转换为字符串(因为Python中没有字节(Byte)类型,可以把这里的字符串理解为字节流,或字节数组)。其函数原型为:struct.pack(fmt, v1, v2, ...),参数fmt是格式字符串,关于格式字符串的相关信息在下面有所介绍。v1, v2, ...表示要转换的python值。下面的例子将两个整数转换为字符串(字节流):

    1. import struct  
    2.   
    3. a = 20  
    4. b = 400  
    5.   
    6. str = struct.pack("ii", a, b)  #转换后的str虽然是字符串类型,但相当于其他语言中的字节流(字节数组),可以在网络上传输  
    7. print 'length:', len(str)  
    8. print str  
    9. print repr(str)  
    10.   
    11. #---- result  
    12. #length: 8  
    13. #    ----这里是乱码  
    14. #'\x14\x00\x00\x00\x90\x01\x00\x00'  

    格式符"i"表示转换为int,'ii'表示有两个int变量。进行转换后的结果长度为8个字节(int类型占用4个字节,两个int为8个字节),可以看到输出的结果是乱码,因为结果是二进制数据,所以显示为乱码。可以使用python的内置函数repr来获取可识别的字符串,其中十六进制的 0x00000014, 0x00001009分别表示20和400。

    struct.unpack

      struct.unpack做的工作刚好与struct.pack相反,用于将字节流转换成python数据类型。它的函数原型为:struct.unpack(fmt, string),该函数返回一个元组。 下面是一个简单的例子:

    1. str = struct.pack("ii"20400)  
    2. a1, a2 = struct.unpack("ii", str)  
    3. print 'a1:', a1  
    4. print 'a2:', a2  
    5.   
    6. #---- result:  
    7. #a1: 20  
    8. #a2: 400  

    struct.calcsize

      struct.calcsize用于计算格式字符串所对应的结果的长度,如:struct.calcsize('ii'),返回8。因为两个int类型所占用的长度是8个字节。

    struct.pack_into, struct.unpack_from

       这两个函数在Python手册中有所介绍,但没有给出如何使用的例子。其实它们在实际应用中用的并不多。Google了很久,才找到一个例子,贴出来共享一下:

    1. import struct  
    2. from ctypes import create_string_buffer  
    3.   
    4. buf = create_string_buffer(12)  
    5. print repr(buf.raw)  
    6.   
    7. struct.pack_into("iii", buf, 012, -1)  
    8. print repr(buf.raw)  
    9.   
    10. print struct.unpack_from('iii', buf, 0)  
    11.   
    12. #---- result  
    13. #'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00'  
    14. #'\x01\x00\x00\x00\x02\x00\x00\x00\xff\xff\xff\xff'  
    15. #(1, 2, -1)  

    关于格式字符串

      在Python手册中,给出了C语言中常用类型与Python类型对应的格式符:

    格式符 C语言类型 Python类型
    x pad byte no value  
    c char string of length 1  
    b signed char integer  
    B unsigned char integer  
    ? _Bool bool  
    h short integer  
    H unsigned short integer  
    i int integer  
    I unsigned int integer or long  
    l long integer  
    L unsigned long long  
    q long long long  
    Q unsigned long long long  
    f float float  
    d double float  
    s char[] string  
    p char[] string  
    P void * long

    具体内容请参考Python手册 struct 模块

  • 相关阅读:
    死锁
    面试题: JVM的四大引用
    面试题:对象怎么定位
    面试题: Spring框架的好处
    VTK 图形基本操作进阶_表面重建技术(等值面提取)
    VTK 图形基本操作进阶_表面重建技术(三角剖分)
    VTK 图形基本操作进阶_多分辨率策略(模型细化的三种方法)
    VTK 图形基本操作进阶_多分辨率策略(模型抽取的三种方法)
    VTK 图形基本操作进阶_连通区域分析
    VTK 图形基本操作进阶_网格模型的特征边 与 封闭性检测
  • 原文地址:https://www.cnblogs.com/fenix/p/2434173.html
Copyright © 2020-2023  润新知