python⼆进制⽂件解析_python⼆进制⽂件的转译详解⾸先导⼊所需的包:import struct
struct有以下⼏个主要的函数:
# 按照给定的格式(fmt),把数据封装成字符串(实际上是类似于c结构体的字节流)
pack(fmt, v1, v2, ...)
# 按照给定的格式(fmt)解析字节流string,返回解析出来的tuple
unpack(fmt, string)
# 计算给定的格式(fmt)占⽤多少字节的内存
calcsize(fmt)
例如:我需要读取⼀个名为filename,存放着形状为[100,1025]的浮点数的⽂件。可以采⽤以下办法
import numpy as np
import struct
# 加载测试数据
f = open('filename','rb')
# 102500为⽂档中包含的数字个数,⽽⼀个浮点数占4个字节
data_raw = struct.unpack('f'*ad(4*102500))
f.close()
verify_data = np.asarray(verify_data_raw).reshape(-1,1025)
同理如果想转把⼆进制转成double型:
import numpy as np
import struct
f = open('data8.dat','rb')
d_str = f.read()
python怎么读取dat文件
f.close()
d_len = len(d_str)
d_len2 = d_len//8
#有时还需考虑字节顺序,如为big-endian,则以上语句改为 data = struct.unpack('>'+str(d_len/4)+'f',d_str)
data = struct.unpack(d_len2*'d',d_str)
注意:fmt前的数字必须为int型,即int*'d' 否则会报‘can't multiply sequence by non-int of type 'float'' 的错误
具体函数细节请查询 struct官⽅⽂档
下⾯提供了了fmt表⽰⽅法
FORMAT
PYTHON TYPE
STANDARD SIZE
no value
c
string of length 1 1
b
integer
1
B
integer
1
bool
1
h
integer
2
H
integer
2
i
integer
4
I
integer
4
l
integer
4
L
integer
4
q
integer
Q
integer
8
f
float
4
d
float
8
s
string
p
string
P
integer
为了同c中的结构体交换数据,还要考虑有的c或c++编译器使⽤了字节对齐,通常是以4个字节为单位的32位系统,故⽽struct根据本地机器字节顺序转换.可以⽤格式中的第⼀个字符来改变对齐⽅式.定义如下:
CHARACTER
BYTE ORDER
SIZE
ALIGNMENT
@
native
native
native
=
native
standard
none
<
little-endian
standard
none
big-endian
standard
none
!
network (= big-endian)
standard
none
< : Little-Endian就是低位字节排放在内存的低地址端(栈顶),⾼位字节排放在内存的⾼地址端(栈底)
>:Big-Endian就是⾼位字节排放在内存的低地址端,低位字节排放在内存的⾼地址端。
!: ⽹络字节序:TCP/IP各层协议将字节序定义为Big-Endian,因此TCP/IP协议中使⽤的字节序通常称之为⽹络字节序。以上就是本⽂的全部内容,希望对⼤家的学习有所帮助,也希望⼤家多多⽀持脚本之家。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论