Tar.extractall() не распознает неожиданный EOF

Библиотека Python tarfile не обнаруживает сломанный tar.

[email protected]$ wc -c good.tar
143360 good.tar

[email protected]$ head -c 130000 good.tar > cut.tar

[email protected]$ tar -tf cut.tar 
...
tar: Unexpected EOF in archive
tar: Error is not recoverable: exiting now

Очень хорошо, инструмент командной строки распознает неожиданный EOF.

[email protected]$ python
Python 2.7.6 (default, Mar 22 2014, 22:59:56) 
>>> import tarfile
>>> tar=tarfile.open('cut.tar')
>>> tar.extractall()

Не нравится. Библиотека Python декодирует файл, но не вызывает никаких исключений.

Как обнаружить неожиданный EOF с помощью библиотеки Python? Я хочу избежать модуля subprocess.

Параметр errorlevel не помогает. Я попробовал errorlevel = 1 и errorlevel = 2.

Ответы

Ответ 1

Я написал работу. Он работает с моими tar файлами. Я предполагаю, что он поддерживает не все типы объектов, которые могут быть сохранены в файле tar.

# -*- coding: utf-8 -*-
from __future__ import absolute_import, division, unicode_literals, print_function
import os
import tarfile

class TarfileWhichRaisesOnEOF(tarfile.TarFile):
    def extractall(self, path=".", members=None):
        super(TarfileWhichRaisesOnEOF, self).extractall(path, members)
        if members is None:
            members = self

        for tarinfo in members:
            if not tarinfo.isfile():
                continue
            file=os.path.join(path, tarinfo.name)
            size_real=os.path.getsize(file)
            if size_real!=tarinfo.size:
                raise tarfile.ExtractError('Extracting %s: Size does not match. According to tarinfo %s and on disk %s' % (
                    tarinfo, tarinfo.size, size_real))

Ответ 2

Это исправлено в Python 3 - a OSError создается независимо от установки errorlevel.