.NET GZipStream сжимает и распаковывает
Что не так с этим кодом ниже. Я всегда получаю FALSE, то есть после сжатия, распакованные данные не соответствуют исходному значению.
public static bool Test()
{
string sample = "This is a compression test of microsoft .net gzip compression method and decompression methods";
System.Text.ASCIIEncoding encoding = new System.Text.ASCIIEncoding();
byte[] data = encoding.GetBytes(sample);
bool result = false;
//Compress
MemoryStream cmpStream;
cmpStream = new MemoryStream();
GZipStream hgs = new GZipStream(cmpStream, CompressionMode.Compress);
hgs.Write(data, 0, data.Length);
byte[] cmpData = cmpStream.ToArray();
MemoryStream decomStream;
decomStream = new MemoryStream(cmpData);
hgs = new GZipStream(decomStream, CompressionMode.Decompress);
hgs.Read(data, 0, data.Length);
string sampleOut = System.BitConverter.ToString(data);
result = String.Equals(sample, sampleOut) ;
return result;
}
Я буду очень признателен, если вы сможете указать, где я делаю ошибку.
Ответы
Ответ 1
Попробуйте этот код:
public static bool Test()
{
string sample = "This is a compression test of microsoft .net gzip compression method and decompression methods";
System.Text.ASCIIEncoding encoding = new System.Text.ASCIIEncoding();
byte[] data = encoding.GetBytes(sample);
bool result = false;
// Compress
MemoryStream cmpStream = new MemoryStream();
GZipStream hgs = new GZipStream(cmpStream, CompressionMode.Compress);
hgs.Write(data, 0, data.Length);
byte[] cmpData = cmpStream.ToArray();
MemoryStream decomStream = new MemoryStream(cmpData);
hgs = new GZipStream(decomStream, CompressionMode.Decompress);
hgs.Read(data, 0, data.Length);
string sampleOut = encoding.GetString(data);
result = String.Equals(sample, sampleOut);
return result;
}
Проблема в том, что вы не использовали ASCIIEncoder, чтобы вернуть строку для sampleData.
EDIT: здесь очищенная версия кода, которая поможет с закрытием/удалением:
public static bool Test()
{
string sample = "This is a compression test of microsoft .net gzip compression method and decompression methods";
System.Text.ASCIIEncoding encoding = new System.Text.ASCIIEncoding();
byte[] data = encoding.GetBytes(sample);
// Compress.
GZipStream hgs;
byte[] cmpData;
using(MemoryStream cmpStream = new MemoryStream())
using(hgs = new GZipStream(cmpStream, CompressionMode.Compress))
{
hgs.Write(data, 0, data.Length);
hgs.Close()
// Do this AFTER the stream is closed which sounds counter intuitive
// but if you do it before the stream will not be flushed
// (even if you call flush which has a null implementation).
cmpData = cmpStream.ToArray();
}
using(MemoryStream decomStream = new MemoryStream(cmpData))
using(hgs = new GZipStream(decomStream, CompressionMode.Decompress))
{
hgs.Read(data, 0, data.Length);
}
string sampleOut = encoding.GetString(data);
bool result = String.Equals(sample, sampleOut);
return result;
}
Ответ 2
Закройте GZipStream
после вызова Write
.
Без вызова Close
существует вероятность того, что некоторые данные буферизованы и еще не записаны в базовый поток.
Ответ 3
Для решения проблемы было три проблемы.
1. После того, как WRITE GZipStream НЕОБХОДИМО ЗАКРЫТЬ: hgs.Close();
-
Чтение GZipStream необходимо использовать цикл WHILE и записывать меньший буфер несжатых данных в MemoryStream:: outStream.Write(...);
-
Преобразование распакованного байтового [] массива необходимо использовать для преобразования кодировки:: string sampleOut = encoding.GetString(data);
Вот окончательный код: -
public static bool Test()
{
string sample = "This is a compression test of microsoft .net gzip compression method and decompression methods";
System.Text.ASCIIEncoding encoding = new System.Text.ASCIIEncoding();
byte[] data = encoding.GetBytes(sample);
bool result = false;
// Compress
MemoryStream cmpStream = new MemoryStream();
GZipStream hgs = new GZipStream(cmpStream, CompressionMode.Compress, true);
hgs.Write(data, 0, data.Length);
hgs.Close();
//DeCompress
byte[] cmpData = cmpStream.ToArray();
MemoryStream decomStream = new MemoryStream(cmpData);
data = new byte[data.Length];
hgs = new GZipStream(decomStream, CompressionMode.Decompress, true);
byte[] step = new byte[16]; //Instead of 16 can put any 2^x
MemoryStream outStream = new MemoryStream();
int readCount;
do
{
readCount = hgs.Read(step, 0, step.Length);
outStream.Write(step, 0, readCount);
} while (readCount > 0);
hgs.Close();
string sampleOut = encoding.GetString(outStream.ToArray());
result = String.Equals(sample, sampleOut);
return result;
}
У меня действительно возникли проблемы с работой сжатия/распаковки с объектом Microsoft.NET GZipStream. Наконец, я думаю, что правильно понял. большое спасибо всем, поскольку решение исходило от всех вас.
Ответ 4
Здесь моя очищенная версия окончательного решения:
[Test]
public void Test_zipping_with_memorystream()
{
const string sample = "This is a compression test of microsoft .net gzip compression method and decompression methods";
var encoding = new ASCIIEncoding();
var data = encoding.GetBytes(sample);
string sampleOut;
byte[] cmpData;
// Compress
using (var cmpStream = new MemoryStream())
{
using (var hgs = new GZipStream(cmpStream, CompressionMode.Compress))
{
hgs.Write(data, 0, data.Length);
}
cmpData = cmpStream.ToArray();
}
using (var decomStream = new MemoryStream(cmpData))
{
using (var hgs = new GZipStream(decomStream, CompressionMode.Decompress))
{
using (var reader = new StreamReader(hgs))
{
sampleOut = reader.ReadToEnd();
}
}
}
Assert.IsNotNullOrEmpty(sampleOut);
Assert.AreEqual(sample, sampleOut);
}