python之struct详解--688IT编程网

python之struct详解

⽤处

1. 按照指定格式将Python数据转换为字符串，该字符串为字节流，如⽹络传输时，不能传输int，此时先将int转化为字节流，然后再发送;

2. 按照指定格式将字节流转换为Python指定的数据类型;

3. 处理⼆进制数据，如果⽤struct来处理⽂件的话，需要⽤’wb’,’rb’以⼆进制(字节流)写，读的⽅式来处理⽂件;

4. 处理c语⾔中的结构体;

struct模块中的函数

函数return explain

pack(fmt,v1,v2…)string按照给定的格式(fmt)，把数据转换成字符串(字节流)，并将该字符串返回.

pack_into(fmt,buffer,offset,v1,v2…)None 按照给定的格式(fmt)，将数据转换成字符串(字节流)，并将字

节流写⼊以offset开始的buffer中.(buffer为可写的缓冲区，可⽤array模块)

unpack(fmt,v1,v2…..)tuple按照给定的格式(fmt)解析字节流，并返回解析结果

pack_from(fmt,buffer,offset)tuple按照给定的格式(fmt)解析以offset开始的缓冲区，并返回解析结果

calcsize(fmt)size of

fmt

计算给定的格式(fmt)占⽤多少字节的内存，注意对齐⽅式

格式化字符串

当打包或者解包的时，需要按照特定的⽅式来打包或者解包.该⽅式就是格式化字符串，它指定了数据类型，除此之外，还有⽤于控制字节顺序、⼤⼩和对齐⽅式的特殊字符.

对齐⽅式

为了同c中的结构体交换数据，还要考虑c或c++编译器使⽤了字节对齐，通常是以4个字节为单位的32位系统，故⽽struct根据本地机器字节顺序转换.可以⽤格式中的第⼀个字符来改变对齐⽅式.定义如下

Character Byte order Size Alignment

@(默认)本机本机本机，凑够4字节

=本机标准none，按原字节数

<⼩端标准none，按原字节数

>⼤端标准none，按原字节数

!network(⼤端)标准none，按原字节数

如果不懂⼤⼩端，见.

格式符

格式符C语⾔类型Python类型Standard size

x pad byte(填充字节)no value

c char string of length 11

b signed char integer1

B unsigned char integer1

_Bool bool1

h short integer2

H unsigned short integer 2i int

integer 4I(⼤写的i)unsigned int integer 4l(⼩写的L)long

integer 4L unsigned long long 4q long long

long 8Q unsigned long long long 8f float float 4d double float 8s char[]string p char[]string P

void *

long

格式符C语⾔类型

Python类型Standard size 注- -!

1. _Bool在C99中定义，如果没有这个类型，则将这个类型视为char,⼀个字节;

2. q和Q只适⽤于64位机器;

3. 每个格式前可以有⼀个数字，表⽰这个类型的个数，如s格式表⽰⼀定长度的字符串,4s表⽰长度为4的字符串;4i表⽰四个int;

4. P⽤来转换⼀个指针，其长度和计算机相关;

5. f和d的长度和计算机相关;

进制转化:

Python 没有专门处理字节的数据类型。但由于b'str'可以表⽰字节，所以，字节数组＝⼆进制str 。⽽在C 语⾔中，我们可以很⽅便地⽤struct 、union 来处理字节，以及字节和int ，float 的转换。

在Python 中，⽐⽅说要把⼀个32位⽆符号整数变成字节，也就是4个长度的bytes ，你得配合位运算

符这么写：

# 获取⽤户输⼊⼗进制数dec = int (input ("输⼊数字："))print ("⼗进制数为：", dec )

print ("转换为⼆进制为：", bin (dec ))print ("转换为⼋进制为：", oct (dec ))print ("转换为⼗六进制为：", hex (dec ))

>>> n = 10240099

>>> b1 = (n & 0xff000000) >> 24

>>> b2 = (n & 0xff0000) >> 16

>>> b3 = (n & 0xff00) >> 8

>>> b4 = n & 0xff

>>> bs = bytes([b1, b2, b3, b4])

>>> bs

b'\x00\x9c@c'

⾮常⿇烦。如果换成浮点数就⽆能为⼒了。

好在Python提供了⼀个struct模块来解决bytes和其他⼆进制数据类型的转换。

struct的pack函数把任意数据类型变成bytes：

>>> import struct

>>> struct.pack('>I', 10240099)

b'\x00\x9c@c'

pack的第⼀个参数是处理指令，'>I'的意思是：

>表⽰字节顺序是big-endian，也就是⽹络序，I表⽰4字节⽆符号整数。

后⾯的参数个数要和处理指令⼀致。

struct

阅读: 58181

准确地讲，Python没有专门处理字节的数据类型。但由于b'str'可以表⽰字节，所以，字节数组＝⼆进制str。⽽在C语⾔中，我们可以很⽅便地⽤struct、union来处理字节，以及字节和int，float的转换。

在Python中，⽐⽅说要把⼀个32位⽆符号整数变成字节，也就是4个长度的bytes，你得配合位运算符这么写：

>>> n = 10240099

>>> b1 = (n & 0xff000000) >> 24

>>> b2 = (n & 0xff0000) >> 16

>>> b3 = (n & 0xff00) >> 8

>>> b4 = n & 0xff

>>> bs = bytes([b1, b2, b3, b4])

>>> bs

b'\x00\x9c@c'

⾮常⿇烦。如果换成浮点数就⽆能为⼒了。

好在Python提供了⼀个struct模块来解决bytes和其他⼆进制数据类型的转换。

struct的pack函数把任意数据类型变成bytes：

>>> import struct

>>> struct.pack('>I', 10240099)

b'\x00\x9c@c'

pack的第⼀个参数是处理指令，'>I'的意思是：

>表⽰字节顺序是big-endian，也就是⽹络序，I表⽰4字节⽆符号整数。

后⾯的参数个数要和处理指令⼀致。

unpack把bytes变成相应的数据类型：

>>> struct.unpack('>IH', b'\xf0\xf0\xf0\xf0\x80\x80')

(4042322160, 32896)

根据>IH的说明，后⾯的bytes依次变为I：4字节⽆符号整数和H：2字节⽆符号整数。

所以，尽管Python不适合编写底层操作字节流的代码，但在对性能要求不⾼的地⽅，利⽤struct就⽅便多了。

struct模块定义的数据类型可以参考Python官⽅⽂档：

Windows的位图⽂件（.bmp）是⼀种⾮常简单的⽂件格式，我们来⽤struct分析⼀下。

⾸先⼀个bmp⽂件，没有的话⽤“画图”画⼀个。

读⼊前30个字节来分析：

>>> s = b'\x42\x4d\x38\x8c\x0a\x00\x00\x00\x00\x00\x36\x00\x00\x00\x28\x00\x00\x00\x80\x02\x00\x00\x68\x01\x00\x00\x01\x00\x18\x00'

BMP格式采⽤⼩端⽅式存储数据，⽂件头的结构按顺序如下：

两个字节：'BM'表⽰Windows位图，'BA'表⽰OS/2位图；⼀个4字节整数：表⽰位图⼤⼩；⼀个4字节整数：保留位，始终为0；⼀个4字节整数：实际图像的偏移量；⼀个4字节整数：Header的字节数；⼀个4字节整数：图像宽度；⼀个4字节整数：图像⾼度；⼀个2字节整数：始终为1；⼀个2字节整数：颜⾊数。

所以，组合起来⽤unpack读取：

>>> struct.unpack('<ccIIIIIIHH', s)

(b'B', b'M', 691256, 0, 54, 40, 640, 360, 1, 24)

结果显⽰，b'B'、b'M'说明是Windows位图，位图⼤⼩为640x360，颜⾊数为24。

请编写⼀个bmpinfo.py，可以检查任意⽂件是否是位图⽂件，如果是，打印出图⽚⼤⼩和颜⾊数。

# -*- coding: utf-8 -*-

import base64,struct

bmp_data = base64.b64decode('Qk1oAgAAAAAAADYAAAAoAAAAHAAAAAoAAAABABAAAAAAADICAAASCwAAEgsAAAAAAAAAAAAA/3//f/9//3//f/9//3//f/9//3//f/9//3 def bmp_info(data):

str = struct.unpack('<ccIIIIIIHH',data[:30]) #bytes类也有切⽚⽅法

if str[0]==b'B' and str[1]==b'M':

print("这是位图⽂件")

return {

'width': str[-4],

'height': str[-3],

'color': str[-1]

}

else:

print("这不是位图⽂件")

if __name__ == '__main__':

bmp_info(bmp_data)

print('ok')

>>> from struct import*

>>> pack('hhl', 1, 2, 3)

b'\x00\x01\x00\x02\x00\x00\x00\x03'

>>> unpack('hhl', b'\x00\x01\x00\x02\x00\x00\x00\x03')

(1, 2, 3)

>>> calcsize('hhl')

Unpacked fields can be named by assigning them to variables or by wrapping the result in a named tuple:

>>>

>>> record =b'raymond \x32\x12\x08\x01\x08'

>>> name, serialnum, school, gradelevel = unpack('<10sHHb', record)

>>> from collections import namedtuple

>>> Student = namedtuple('Student', 'name serialnum school gradelevel')

>>> Student._make(unpack('<10sHHb', record))

Student(name=b'raymond ', serialnum=4658, school=264, gradelevel=8)

The ordering of format characters may have an impact on size since the padding needed to satisfy alignment requirements is different:

>>>

>>> pack('ci', b'*', 0x12131415)

b'*\x00\x00\x00\x12\x13\x14\x15'

>>> pack('ic', 0x12131415, b'*')c语言struct头文件

b'\x12\x13\x14\x15*'

>>> calcsize('ci')

>>> calcsize('ic')

688IT编程网

python之struct详解

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

python之struct详解

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式