zlib.error:解压缩时出错-3:不正确的标头检查
我有一个gzip文件,我正尝试通过Python读取它,如下所示:
import zlib
do = zlib.decompressobj(16+zlib.MAX_WBITS)
fh = open('abc.gz', 'rb')
cdata = fh.read()
fh.close()
data = do.decompress(cdata)
它抛出此错误:
zlib.error: Error -3 while decompressing: incorrect header check
我该如何克服?
-
更新:dnozay的答案解释了该问题,应该是公认的答案。
您有此错误:
zlib.error: Error -3 while decompressing: incorrect header check
这很可能是因为您试图检查不存在的标头,例如您的数据遵循
RFC 1951
(deflate
压缩格式)而不是RFC 1950
(zlib压缩格式)或RFC 1952(gzip压缩格式)。选择windowBits
但是
zlib
可以解压缩所有这些格式:- (解压缩)deflate格式,使用wbits = -zlib.MAX_WBITS
- (解压缩)zlib格式,使用wbits = zlib.MAX_WBITS
- (解压缩)gzip格式,使用wbits = zlib.MAX_WBITS | 16
请参阅http://www.zlib.net/manual.html#Advanced(部分inflateInit2)中的文档
例子
测试数据:
>>> deflate_compress = zlib.compressobj(9, zlib.DEFLATED, -zlib.MAX_WBITS) >>> zlib_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS) >>> gzip_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS | 16) >>> >>> text = '''test''' >>> deflate_data = deflate_compress.compress(text) + deflate_compress.flush() >>> zlib_data = zlib_compress.compress(text) + zlib_compress.flush() >>> gzip_data = gzip_compress.compress(text) + gzip_compress.flush() >>>
明显的测试
zlib
:>>> zlib.decompress(zlib_data) 'test'
测试
deflate
:>>> zlib.decompress(deflate_data) Traceback (most recent call last): File "<stdin>", line 1, in <module> zlib.error: Error -3 while decompressing data: incorrect header check >>> zlib.decompress(deflate_data, -zlib.MAX_WBITS) 'test'
测试
gzip
:>>> zlib.decompress(gzip_data) Traceback (most recent call last): File "<stdin>", line 1, in <module> zlib.error: Error -3 while decompressing data: incorrect header check >>> zlib.decompress(gzip_data, zlib.MAX_WBITS|16) 'test'
数据还与gzip模块兼容:
>>> import gzip >>> import StringIO >>> fio = StringIO.StringIO(gzip_data) # io.BytesIO for Python 3 >>> f = gzip.GzipFile(fileobj=fio) >>> f.read() 'test' >>> f.close()
自动标头检测(zlib或gzip)
加入
32
到windowBits
将触发标题检测>>> zlib.decompress(gzip_data, zlib.MAX_WBITS|32) 'test' >>> zlib.decompress(zlib_data, zlib.MAX_WBITS|32) 'test'
使用
gzip
代替或者您可以忽略zlib
并gzip
直接使用模块;但请记住,在引擎盖下,gzip
使用zlib
。fh = gzip.open('abc.gz', 'rb') cdata = fh.read() fh.close()
试试这个
gzip
模块,下面的代码直接来自python
docs。import gzip f = gzip.open('/home/joe/file.txt.gz', 'rb') file_content = f.read() f.close()