Jun. 22nd, 2005
Размер имеет значение
Jun. 22nd, 2005 02:39 pmУдачно сравнил 7-zip (он же, для юникса) с Винраром.
Жал порядка 22 метров, специфика данных была в том, что они при последовательном чтении (ну, например, как tar выдает), после середины практически повторялись. Т.е. делились на 2 похожих блока.
Как уважаемым господам известно, оба архиватора весьма умны и повадливы на всякие хитрости. Но (!) 7-зип позволяет ставить объем временных словарей до 192Мб, рар - до 4Мб. Результат создания непрерывного архива потряс меня своей иллюстративностью:
Для 22 метров исходных данных размер архива перестал падать, когда словарь стал 32 метра. До 32 было 16, и четкой границы я отловить не смог.
Так, в конце концов, какой результат-то? 7-зип сжал в 2.23 раза лучше! Рар выдал архив 4651 К, 7-зип - 2085К. Иногда bzip2 тоже жмет лоучше рара (чаще хуже), но не настолько же... Так что размер имеет значение.
Вывод: ставьте словарь по размеру не меньше исходных данных.
Жал порядка 22 метров, специфика данных была в том, что они при последовательном чтении (ну, например, как tar выдает), после середины практически повторялись. Т.е. делились на 2 похожих блока.
Как уважаемым господам известно, оба архиватора весьма умны и повадливы на всякие хитрости. Но (!) 7-зип позволяет ставить объем временных словарей до 192Мб, рар - до 4Мб. Результат создания непрерывного архива потряс меня своей иллюстративностью:
- Если обоим поставить словари по 4 метра - жмут примерно одинаково;
- если 7-зупу увеличивать (рару больше, к солалению некуда), то он начинает жать заметно лучше;
- в итоге, когда объем словаря больше или равен какой-то монотонно неубывающей (надеюсь :) ) функции от объема исходных данных, сжатие достигает своего апогея.
Для 22 метров исходных данных размер архива перестал падать, когда словарь стал 32 метра. До 32 было 16, и четкой границы я отловить не смог.
Так, в конце концов, какой результат-то? 7-зип сжал в 2.23 раза лучше! Рар выдал архив 4651 К, 7-зип - 2085К. Иногда bzip2 тоже жмет лоучше рара (чаще хуже), но не настолько же... Так что размер имеет значение.
Вывод: ставьте словарь по размеру не меньше исходных данных.