УДК 004.627
Петрянин Д. Л., Юрков Н. К.
Пензенский государственный университет, Пенза, Россия
СРАВНИТЕЛЬНЫЙ АНАЛИЗ АРХИВАТОРОВ
Архиватор — программа, осуществляющая сжатие и/или упаковку одного и более файлов в архив или серию архивов, для удобства переноса или хранения, а также распаковку архивов.
На сегодняшний день количество архиваторов насчитывается около 5 0... Некоторые из них устарели и практически не используются. Каждый архиватор обладает своими достоинствами и недостатками, такими как скорость сжатия и степень сжатия. Эти характеристики — обратно зависимые величины. То есть, чем больше скорость сжатия, тем меньше степень сжатия, и наоборот.
В настоящее время архивирование (сжатие) данных является трудоемкой задачей. Дело в том, что большинство пользователей или владельцев (авторов) информации хранят различную информацию в сжатом виде (в архивах), что уменьшает размер и в некоторой степени защищает ее. Защита подразумевает собой защиту от некоторых вирусов, т.к. сжатие данных - это есть кодирование информации в некоторой степени. А само сжатие данных обычно происходит значительно медленнее, чем обратная операция (разархивирование).
Для сравнительного анализа архиваторов были взяты:
2 типа данных (текст (DOC), фото (JPG)) по 100 файлов для каждого из них (различного размера) - всего 200 файлов;
12 архиваторов (RAR, 7z, ZIP, ARJ, UC2, GZ, LHA (LZH), TGZ, DST, UHA, RK и CAB).
Сначала сжимаем поочередно 100 файлов DOC всеми архиваторами.
По результатам эксперимента сжатия построим диаграмму с результатами архиваторов, у которых достигнут минимальный размер сжатия файлов (рис. 1) . Архиваторы ZIP, ARJ, UC2, GZ, LHA (LZH),
TGZ, RK и CAB имеют нулевой результат, поэтому на диаграмме не отображены.
80 60 % 40 20 0
■ RAR
■ 7z
■ DST
■ UHA
Рис. 1 Результаты сжатия 100 файлов DOC (поочередно)
Затем произведем сжатие всех 100 файлов DOC вместе всеми архиваторами.
По результатам эксперимента сжатия построим диаграмму с результатами архиваторов достигнут минимальный размер сжатия файлов (рис. 2).
>s
(О
VO
«Г
ш
S
X
о.
(О
о.
О)
(О
о.
12000000
10000000
80000000
60000000
40000000
20000000
0
■ TGZ
■ ARJ
■ UC2
■ LZH
■ zip
■ GZ
■ RK
у которых
Рис. 2 Результаты сжатия 100 файлов DOC (в одном архиве)
Время, затраченное на сжатие и выбор лучшего архиватора для типа файлов DOC составило 3 часа 48 минут 50 секунд.
Далее сжимаем поочередно 100 файлов JPG всеми архиваторами.
По результатам эксперимента сжатия построим диаграмму с результатами архиваторов, у которых достигнут минимальный размер сжатия файлов (рис. 3) . Архиваторы RAR, 7z, ZIP, ARJ, UC2, GZ, LHA
(LZH), TGZ, UHA, и CAB имеют нулевой результат, поэтому на диаграмме не отображены.
Рис. 3 Результаты сжатия 100 файлов JPG (поочередно)
После этого произведем сжатие всех 100 файлов JPG вместе всеми архиваторами.
По результатам эксперимента сжатия построим диаграмму с результатами архиваторов достигнут минимальный размер сжатия файлов (рис. 4).
у которых
Рис. 4 Результаты сжатия 100 файлов JPG (в одном архиве)
Время, затраченное на сжатие и выбор лучшего архиватора для типа файлов JPG составило 1 час 40 минут 52 секунды.
В данном эксперименте использовались два типа данных (DOC и JPG) и получили следующие результаты:
При сжатии поочередно 100 файлов типа DOC - лучший результат показал архиватор 7z, а при сжатии всех файлов в один архив - UHA.
При сжатии поочередно и в один архив 100 файлов типа JPG - лучший результат показал архиватор
RK.
По результатам всех экспериментов общее время сжатия составило 5 часов 29 минут и 42 секунды.
При большом количестве разных типов данных это время увеличиться в несколько десятков раз и сделать выбор нужного архиватора становится затруднительно!
Так как максимальная степень сжатия - величина не постоянная, поэтому использовать базы данных для выбора нужного архиватора для сжатия файлов не эффективно. Необходимо разработать новый алгоритм для решения данных задач.