Научная статья на тему 'ПОРІВНЯННЯ МЕТОДІВ ЕФЕКТИВНОГО КОДУВАННЯ ПОВІДОМЛЕНЬ'

ПОРІВНЯННЯ МЕТОДІВ ЕФЕКТИВНОГО КОДУВАННЯ ПОВІДОМЛЕНЬ Текст научной статьи по специальности «Экономика и бизнес»

CC BY
108
9
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Sciences of Europe
Область наук
Ключевые слова
ENCODING / MESSAGE / DATA COMPRESSION / FILE TYPES / LOSS / DICTIONARY / ARCHIVER / КОДУВАННЯ / ПОВіДОМЛЕННЯ / СТИСНЕННЯ ДАНИХ / ТИПИ ФАЙЛіВ / ВТРАТИ / СЛОВНИК / АРХіВАТОР

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Розенвассер Д.М., Педяш В.В.

Стаття присвячена вирішенню актуальної проблеми ефективного стиснення даних. Розглядаються існуючі методи стиснення даних, а також сучасні архіватори. На основі проведених досліджень та випробувань розроблено програмне забезпечення, яке надає можливість ефективного стиснення даних за допомогою використання найкращих можливостей з кожного розглянутого архіватора. Програма об'єднує сучасні архіватори та забезпечує ефективне використання ресурсів цих архіваторів для кожного типу файлів.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COMPARISON OF MESSAGES EFFECTIVE CODING METHODS

The article is devoted to solving the actual problem of effective data compression. Existing methods of data compression, as well as modern archivers are considered. Based on the research and testing carried out, software has been developed that makes it possible to effective data compression using the best capabilities for each archiver under consideration. The program combines modern archivers and ensures the efficient use of the resources of these archivers for each file type.

Текст научной работы на тему «ПОРІВНЯННЯ МЕТОДІВ ЕФЕКТИВНОГО КОДУВАННЯ ПОВІДОМЛЕНЬ»

TECHNICAL SCIENCES

ПОР1ВНЯННЯ МЕТОД1В ЕФЕКТИВНОГО КОДУВАННЯ ПОВ1ДОМЛЕНЬ

Розенвассер Д.М.

Одеська нацюнальна академ1я зв'язку м. О.С. Попова

Педяш В.В.

Одеська нацюнальна академ1я зв'язку м. О.С. Попова COMPARISON OF MESSAGES EFFECTIVE CODING METHODS

Rozenvasser D.

O.S. Popov Odesa National Academy of Telecommunications

Pedyash V.

O.S. Popov Odesa National Academy of Telecommunications

АНОТАЦ1Я

Стаття присвячена виршенню актуально! проблеми ефективного стиснення даних. Розглядаються ic-нуючi методи стиснення даних, а також сучасш архiватори. На оcновi проведених дослвджень та випробу-вань розроблено програмне забезпечення, яке надае можливють ефективного стиснення даних за допомо-гою використання найкращих можливостей з кожного розглянутого архiватора. Програма об'еднуе cучаcнi архiватори та забезпечуе ефективне використання ресурав цих архiваторiв для кожного типу файлiв.

ABSTRACT

The article is devoted to solving the actual problem of effective data compression. Existing methods of data compression, as well as modern archivers are considered. Based on the research and testing carried out, software has been developed that makes it possible to effective data compression using the best capabilities for each archiver under consideration. The program combines modern archivers and ensures the efficient use of the resources of these archivers for each file type.

Ключовi слова: кодування, повщомлення, стиснення даних, типи файлiв, втрати, словник, архiватор.

Keywords: encoding, message, data compression, file types, loss, dictionary, archiver.

Завжди юнувала i icHye на сьогодшшнш день проблема з po3MipoM повiдомлень при передаваннi та збертанш iнформацiï. Розвиток комп'ютерного обладнання nproBiB до збiльшення швидкоcтi пере-дачi та об'eмiв зберiгання даних. Може виникнути думка, що використання ефективних методiв стиснення даних не потрiбно на фонi цього технолопч-ного розвитку. З iншого боку збшьшуеться обсяг самих повiдомлень. Збшьшення обсягу поввдом-лень чаcтiше ввдбуваеться швидше за збiльшення швидкоcтi передача Окрiм цього люди повиннi оплатити передачу шформацп, навiть у фiзичних ноciïв e обмеження на кшьшсть перезапиciв. Саме ефективне стиснення може значно збшьшити шви-дкicть передачi iнформацiï каналами зв'язку, збшь-шити ресурс твердих накопичyвачiв при вщносно низьких затратах на придбання обладнання та про-грамного забезпечення. Також стиснення e також додатковою мiрою захисту конфiденцiальноï шфо-рмацiï шд час ïï передачi. Так як зменшуеться кшьшсть iнформацiï, що передаеться, то зменшуеться варпсть ïï передача Тому ефективне стиснення даних допомагае отримати перевагу у найрiзноманiт-нiших сферах, якi пов'язаш з даними.

Стиснення застосовуеться для зменшення шль-коcтi бiт у порiвняннi з джерелом, необхiдних для збертання або передачi заданоï шформацп. Це надае передачi шформацп б№шу швидкicть та мож-ливють ïï зберiгати бiльш оперативно та економно. Оператившсть означае, що операщя отримання да-ноï' iнформацiï з пристрою ïï збер^ання проходить

швидше, а це можливо, якщо швидшсть розпакову-вання даних вище за швидшсть зчитування даних з rocia iнформацiï. Для стиснення iнформацiï часто використовують програми-архiватори даних такi як ZIP, RAR , PA, 7ZIP та шшг

Для рiзних форматш даних використовують рь знi типи стиснення. Найчастше для музики, вщео та аyдiо використовують стиснення з втратами, або незворотнього кодування, але для текcтовоï' шформацп, фрагменпв баз даних або файлiв, як повиннi виконуватися таке кодування призведе до втрати частини шформацп, або навгть до неможливосп ко-ректноï роботи цих файлiв. Тому для цих видiв да-них використовують методи оборотнього стис-нення, при яких гарантоване повне вiдновлення по-чаткового повiдомлення.

Мета даноï роботи полягае у тому, щоб досль дити сучасш архiватори, створити алгоритм та роз-робити програмне забезпечення, яке дозволяе тд-вищити ефектившсть стиснення файлiв шляхом обирання найбшьш оптимального архiватора для конкретних видiв iнформацiï. Стиснення та його види Стиснення шформацп - це проблема, яка мае досить довгу юторш, набагато довше, нiж icторiя розвитку комп'ютерних технологш, яка зазвичай супроводжувала icторiю розвитку проблеми кодування i шифрування iнформацiï. Bci алгоритми стиснення працюють з вхвдним потоком iнформацiï, мiнiмальною одиницею якого е бгт [1].

Стиснення даних засноване на усуненш надмь рносп, що мicтитьcя у вихiдних даних:

- часовi - в одновимфних даних, одновимф-них сигналах, аудю та шш.;

- просторовi - кореляцiя мiж сусiднiми тксе-лями або елементами даних;

- спектральт - кореляцiя м1ж компонентами кольору або свiтла;

- психовiзуальнi - використовують перцеп-тивнi властивосп зорово! системи людини.

Найпростiшим прикладом надмiрностi е повторения фрагменлв в текстi. Така надмiрнiсть за-звичай усуваеться шляхом замiни послщовносл, що повторюеться посиланням на вже закодований фрагмент iз зазначенням його довжини. 1нший тип надмiрностi пов'язаний з тим, що деяк значення в стислих даних зустрiчаються часлше, н1ж iншi. Скорочення обсягу даних досягаеться шляхом замши даних, як часто зус^чаються короткими ко-довими словами, а даних, яш зустрiчаються рвдко -довгими (ентропшне кодування).

Стиснення без втрат даних, яш не володшть властивiстю надмiрностi (наприклад, випадковий сигнал або бший шум, зашифрованi поввдомлення), принципово неможливо.

Основними техтчними характеристиками процесiв стиснення i результатами !х роботи е:

- стутнь стиснення обсягiв вхiдного i вихщ-ного потокiв;

- ступiнь стиснення - час, необхщний для стиснення певного обсягу шформацп вхвдного потоку, поки з нього не буде отриманий екивалент-ний вихвдний потiк;

- як1сть стиснення - значення, що показуе, насшльки упакований вихiдний потiк, шляхом повторного стиснення до нього з використанням того ж або шшого алгоритму.

Основною характеристикою алгоритму стис-нення даних е коефiцiент стиснення, тобто величина, яка визначае рiзницю мiж обсягом вихiдних даних i стиснутих даних i може бути розрахована за наступною формулою:

Sr

(1)

де к - ступiнь стиснення, - об'ем вихвдних даних, & - об'ем даних, що стиснули.

Стиснення можливо подшити на двi категорп:

1) Стиснення з втратами;

2) Стиснення без втрат.

• Стиснення без втрат

Найпростiшi алгоритми стиснення, також зван оптимальними алгоритмами кодування, е ста-тистичними i заснованi на розподш ймовiрностей елементiв вхiдного поввдомлення (текст, зобра-ження, файл). На практищ частота появи елементiв у вхщному повiдомленнi використовуеться як на-ближення до iмовiрностi. Iмовiрнiсть - це абстрактна математична концепцiя, пов'язана з несшнчен-но! експериментально! вибiркою даних, а частота виникнення - це значення, яке можна розрахувати для шнцевих наборiв даних. При досить велишй ш-лькостi елементiв в наборi експериментальних даних можна сказати, що частота появи елемента бли-зька (з деякою точшстю) до його ймовiрностi.

Якщо згаданi ймовiрностi pi3Hi, то можна 3ic-тавити коротшi кодовi слова для найбшьш ймовiр-них елементiв (загальнi) i, навпаки, замiнити елеме-нти, яш навряд чи зустрiчаються, довшими кодо-вими словами.

Оптимальний алгоритм кодування робить це так, щоб середня довжина кодового слова була мь нiмальною, тобто, якщо довжина кодування коро-тше, воно стае незворотшм. Це робиться за допомо-гою префшсних алгоритмiв Шеннона-Фано i Хаффмана.

Недолж обох методiв полягае в тому, що вони не здатш кодувати повiдомлення бiльш економно, шж один бiт на елемент поввдомлення (букву).

Арифметичне кодування е одним з алгоршшв ентропiйного стиснення. На вщм1ну ввд алгоритму Хаффмана, вш не мае жорсткого постшно! вщпо-вiдностi мiж вхвдними символами i групами бiтiв вихвдного потоку. Це дае алгоритму велику гнуч-шсть в поданнi дрiбних частот зустрiчальностi сим-вол1в. Як правило, вш перевершуе алгоритм Хаффмана по ефективносп стиснення i дозволяе стискати даш з ентропiею менше 1 бгга на кодова-ний символ.

1снуе iнший фундаментальний пiдхiд - словни-кове кодування, де на кожному крощ операцп алгоритму стиснення помщаеться наступний символ як е ^i спецiальним прапором без стиснення), або кордону слова з попереднього тексту, яш вщповвда-ють наступним символам, як1 вказано у файл! Роз-пакування стислих файлiв здiйснюеться дуже шви-дко, тому щ алгоритми використовуються для створення програм, як1 саморозпаковуються. Слов-никовi алгоритми менш математично обгрунтованi, але бiльш практичнi.

Серед словникiв першим був алгоритм LZ77, розроблений iзраlльськими математиками Джейкобом Зивом i Абрахамом Лемпелем, опублшований в 1977 рощ. Багато програм стиснення використовують ту чи шшу модифжацш LZ77.

Стиснення з втратами

Алгоритми стиснення з втратами включають зменшення розмiру файлу, зазвичай шляхом вида-лення дрiбних деталей, як1 вимагають великого обсягу даних для збери-ання з повною точнiстю. При стисненш з втратами неможливо вщновити вихщ-ний файл через вилучення важливих даних. Стиснення з втратами найчастше використовуеться для збер^ання зображень i звуково! шформацп.

Рекомендаций CCITT G.711 пропонують два алгоритму для перетворення аудiосигналiв: ц-закон i A-закон. Кодування ц-закону широко використовуеться в Сполучених Штатах i Японп, а кодування A-закону використовуеться в Gвропi. Обидва цих алгоритму перетворять вихвдн вибiрки вихвдно! послiдовностi сигнал1в PCM в байтовi вибiрки. Ко-жен зразок вихвдно! послiдовностi перетворюеться в один байт.

Блочне кодування е одним з найпростших ме-тодiв кодування, як1 вимагають незначних обчис-лювальних витрат для стиснення зображень. Спо-чатку представлений Delp i Mitchell. Основна вдея BTC полягае в тому, щоб виконати квантування зi

збереженням моменту для блошв шксел1в так, щоб як1сть зображення залишалося на задов!льному pi-bhî, i в той же час зменшувалася потреба в простор! для збертання. Навггь якщо коефщент стиснення алгоритму поступаеться стандартному алгоритму стиснення JPEG, BTC набув популярносп завдяки свош практичнш корисносп.

Дискретне косинусне перетворення (DCT) е найбшьш популярним шструментом обробки сиг-нал1в для стиснення зображень i звушв, яке трапля-еться в таких стандартах, як JPEG.

Щоб виконати DCT-перетворення для зображення, спочатку потр1бно отримати шформацш про фото зображення (значення шкселя у вигляд! цшого числа, що мае д1апазон 0-255), яке д1лимо на блоки матриц NxN, а попм застосовуемо дискретне косинусне перетворення до цього блоку даних.

Дискретне перетворення мае таю властивосл:

- некорельован коефщенти. Коефщенти не залежать одне ввд одного, тобто точшсть одного коефщента не залежить ввд будь-якого шшого;

- енерпя «ущшьнення». Перетворення збе-ртае основну шформацш в невеликш кшькосп ко-ефщентш. Ця властивють найбшьш помггна на фо-тореалютичних зображеннях.

Ввдео по суп являе собою тривим1рний масив кольорових шксел1в. Два вим1ру означають верти-кальну та горизонтальну розширення кадру, а тре-тш вим1р - час. Кадр - це масив вах шксел!в, яких бачить камера в даний момент часу, або просто зо-браження.

Стиснення не було б можливим, якби кожен кадр був ушкальним, а розташування шксел!в було абсолютно випадковим, але це не так. Отже, ви можете стиснути, по-перше, саме зображення - напри-клад, фотограф1я блакитного неба без сонця факти-чно зводиться до описом граничних точок i град1е-нта заповнення. По-друге, ви можете стиснути схож1 сум!жш кадри. В кшцевому рахунку, алгори-тми стиснення зображень i ввдео схож1, якщо розг-лядати ввдео як тривим1рне зображення з часом в якосл третьо! координати.

Одшею з найбшьш потужних технологш збшь-шення ступеня стиснення ввдеоданих е компенсащя руху. У будь-як1й сучаснш систем! стиснення ввдео наступн! кадри в потощ використовують схож!сть областей в попередшх кадрах для зб!льшення ступеня стиснення.

Однак через рух будь-яких об'екпв в кадр! (або само! камери) використання под!бност! сусвдшх ка-др!в виявилося неповним. Технолопя компенсацй' руху дозволяе знаходити схож! обласп, нав!ть якщо вони змщеш щодо попереднього кадру.

Аналiз програм ;i|)\iii;uiiï даних

Використовуючи ус! попередньо описан! методики стиснення даних, а шод! й !х об'еднання, роз-роблен! програмн! засоби для ефективного стиснення р!зно! шформаци. У дан!й робот! було розг-лянуто 3 види арх!ватор!в: 7Zip, WinRAR, PowerArchiver.

WinRAR - арх!ватор файл!в для 32- i 64-розря-дних операц!йних систем Windows (також юнують або !снували версй' для Android, Linux, FreeBSD,

macOS, MS-DOS, Windows Mobile), що дозволяе створювати, змiнювати i розпаковувати архiви RAR i ZIP, а також розпаковувати архiви безлiчi iнших форматiв [2].

Особливост! при роботi з архiвами RAR:

- П!дтримка файлiв розмiром до 16 ексабайт.

- Розм!р зм!нного словника в!д 1 МБ до 1 ГБ (в 32-розрядно! версп для Windows - до 256 МБ). Розм!р за замовчуванням - 32 МБ.

- Замють застосовуваних за замовчуванням 32-розрядних контрольних сум CRC32 можна вико-ристовувати значно надшшше 256-розрядне хешу-вання BLAKE2sp.

- Можлив!сть шифрування архiвiв з викори-станням алгоритму AES в режимi CBC з довжиною ключа 256 6!т (у версп 4 - 128 6!г).

- Додавання в арх!ви додаткових, заснова-них на кодах Р!да - Соломона, даних для в!днов-лення арх!ву в раз! його пошкодження, а також створення спец!альних том!в для в!дновлення, що дозволяють в!дновити багатотомний арх!в при по-шкодженш або нав!ть повн!й в!дсутност! його окре-мих том!в.

- Додавання в арх!ви особливо! додатково! шформаци для прискорення !х в!дкриття.

- Створення багатотомних (що складаються з декшькох частин) арх!в!в зазначеного або автоматично обираеться розм!ру.

- Створення безперервних (solid) арх!в!в, що дозволяють досягати значно б!льш високого ступеня стиснення при упаковщ декшькох файл!в, особливо однотипних.

- Щдтримка розширених можливостей NTFS, наприклад жорстких i символ!чних поси-лань.

7-Zip арх!ватор - вшьний файловий арх!ватор з високим ступенем стиснення даних. П!дтримуе де-к!лька алгоритм!в стиснення i безл!ч формапв даних, включаючи власний формат 7z c високоефек-тивним алгоритмом стиснення LZMA. Програма розробляеться з 1999 року, вона безкоштовна i мае в!дкритий вих!дний код, велика частина якого вь льно поширюеться на умовах л!ценз!! GNU LGPL, за винятком коду Розпакувальник UnRAR, який мае обмеження. Основна платформа - Windows (в тому числ! Windows CE), де доступш дв! версй' програми: з граф!чним !нтерфейсом i верс!я для командного рядка. Консольна верс!я була перенесена спшьно-тою розробник!в для систем стандарту POSIX п!д загальною назвою p7zip.

Основн! характеристики 7-Zip:

- Дуже висока ступ!нь стиснення в формат! 7z завдяки використанню вдосконаленого алгоритму Лемпела-Зива.

- Для формапв ZIP i GZIP стутнь стиснення на 2-10% вище, н!ж у PKZIP i WinZip.

- Можлив!сть створення арх!в!в для формату

7z.

- Можлив!сть створення багатотомних (по-р!заних на частини) арх!в!в (за винятком самороз-паковуються) для формату 7z.

- Можливють шифрування алгоритмом AES-256 для форматш 7z i ZIP.

- Пiдтримуе апаратне прискорення, досту-пне на процесорах, що реалiзують набiр iнструкцiй AES-NI.

- 1нтегращя в оболонку Microsoft Windows i Windows NT.

- Модулi для программ FAR Manager, Total Commander i Unreal Commander.

- Вбудована утилгга для тестування продуктивности

- Багатомовний графiчний штерфейс (тiльки для Windows) з функщями двовiконну файлового менеджера.

- Потужна верс1я для командного рядка.

7-Zip використовуе багатопоточнiсть i дозво-

ляе зад1яти для стиснення, в залежносп ввд алгоритму або формату, рiзну кiлькiсть потоков. При ство-реннi архiвiв, в яких файли стискаються незалежно один ввд одного (наприклад ZIP), програма може використовувати до восьми потоков одночасно. Для алгоритму стиснення LZMA архiватор одночасно може використовувати до двох потоков. Неможли-вiсть використання бшьшо! !х кiлькостi поясню-еться посл1довним характером безперервного стиснення. Алгоритм стиснення LZMA2 не мае цього недолшу [3].

При стисненш в формап 7z також використо-вуються спещальш фiльтри-нормалiзатори. Так, для бiльш оптимального стиснення 32-бпного x86-коду використовуються нормалiзують конвертери BCJ i BCJ2. Крiм того, програма мае оптимiзуе дельта-конвертер для деяких титв мультимедiйних даних, наприклад незжатих 24-биних зображень. Зазвичай формат 7z дае на 4-25% краще стиснення, шж формат ZIP.

PowerArchiver - ушверсальний архiватор з тд-тримкою вах популярних форматiв. Дозволяе ро-бити з архiвами найрiзноманiтнiшi до: створення, перегляд, вилучення файлiв; додавання файлiв; створення архiвiв, якi мають можливють самороз-паковки i багатотомних архiвiв; шифрування методами Blowfish 128-bit, DES 64-bit, Triple DES 128bit i AES 128-bit; вщновлення пошкоджених zip-архiвiв i багато iншого. Щдтримуе формати ZIP, RAR, 7-ZIP, CAB, LHA (LZH), TAR, TAR.GZ, TAR.BZ2, BH, ARJ, ARC, ACE, ZOO, GZ, BZIP2, XXE, MIME, UUE, XPI, EAR , WAR, REP, JAR, BK, QWK, Quake PK3, сини WinAMP, архiви в форматах ZIP i CAB, CD-образи ISO, BIN, IMG i NRG. Можливе пвдключення антивiрусноl програми для перевiрки архiвних файл1в [4].

Основнi функцй:

- Створення ZIP, CAB i PAE зашифрованих архiвiв за допомогою майстра.

- Шдтримка необмеженого розмiру ZIP архь

вiв.

- Використання профiлiв стиснення для збе-рiгання налаштувань компресп.

- Повна пвдтримка AES-шифрування з рiз-ним ступенем стiйкостi (128-bit / 192-bit / 256-bit).

- Повна шдтримка AES-шифрування для 7-zip i багатотомних 7-Zip архiвiв.

- Завантаження apxibib або резервних копш на FTP / SFTP (SSH) сайти з пiдтримкою профшв i функцй' тайм-ауту.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- 1нтегращя з провiдником Windows для швидкого створення та розпаковування aрхiвiв.

- Можливють редагування файл1в в aрхiвi, використовуючи одну операцш.

- Друк списку фaйлiв в текстовий файл або файл формату HTML.

- 1нструмент для ввдновлення пошкоджених aрхiвiв.

- Конвертaцiя мiж архивами (наприклад, з ZIP в CAB або з LHa aрхiву в ZIP aрхiв i т.д.).

- Одночасне витяг кшькох aрхiвiв.

- Пакетний режим для створення дек1лькох рiзних ZIP-aрхiвiв вiдрaзу.

Види (фай. мв

У наш час широко використовуються файли самих рiзних тишв. Серед них: doc, exe, bmp, pdf, wav, jpeg, mp3, xls, txt, html, tif. Деяш з них це «чи-сл» дaнi, тобто без використання методiв стиснення до них, а деяш вже у стиснутому вид! Тому до останшх aрхiвaцiя дie набагато менше нж на по-переднiх, тому що надлишковють у стиснутих файлах вже сильно зменшена.

TXT - текстовi документи, збереженi у формап TXT можуть бути створенi, ввдкрип i вiдредaговaнi з використанням рiзномaнiтних програм обробки редагування i слова тексту, розроблених для систем Linux, Microsoft Windows на комп'ютерах i Mac платформ. Змют цих .txt файл1в не ввдформатова-ний ASCII текст, який може бути збережений як .txt докуменпв в файли малого розмiру [5].

JPEG - один з популярних растрових грaфiч-них формапв, який застосовують для збер^ання фотозображень i подiбних до них зображень. Файли даних JPEG, зазвичай мають розширення (суфжси) .jpg, jfif, .jpe або .jpeg. Однак з них .jpg е найпопуляршшим на всiх платформах. MIME-типом е image / jpeg [6].

Пакуються з використанням кодування серш i кодiв Хаффмана. Стандарт JPEG допускае також використання значно бшьш ефективного арифме-тичного кодування, однак через патентш обме-ження (патент на описаний в стандарта JPEG ариф-метичний QM-кодер належить IBM) на практищ воно використовуеться рщко.

EXE - розширення фaйлiв, яш виконуються, що застосовуеться в операцшних системах DOS, Windows, Symbian OS, OS / 2 i в деяких шших, вщ-поввдне ряду формапв. Крiм об'ектного коду може мютити рiзнi метaдaнi (ресурси, цифровий тдпис) [7].

Portable Document Format (PDF) - мiжплaтфор-мений ввдкритий формат електронних документiв, спочатку розроблений фiрмою Adobe Systems з використанням низки можливостей мови PostScript. В першу чергу призначений для подання полiгрaфiч-но1 продукцп в електронному виглядi. Для перегляду юнуе безлiч програм, а також офщшна безко-штовна програма Adobe Reader [8,9].

MP3 - це розроблений командою MPEG формат файлу для збертання аудюшформаци. MP3 е

одним з найбшьш поширених i популярних форма-тiв цифрового кодування звуково1' iнформацiï. Вiн широко використовуеться в файлообмшних мережах для ощночного скачування музичних творiв. У форматi MP3 використовуеться алгоритм стис-нення з втратами, розроблений для ютотного змен-шення розмiрy даних, необхвдних для ввдтворення запису i забезпечення якосп ввдтворення звуку, що точно ввдповвдае оригiнальномy (на думку бшьшо-cтi cлyхачiв), але з ввдчутними втратами якоcтi при прослуховуванш на якicнiй звyковiй систем! Принцип стиснення полягае в зниженш точноcтi деяких частин звукового потоку, що практично невиразно для слуху на найбшьш поширенш апаратyрi низько1' точноcтi вiдтворення звуку (наприклад, дом^юча бiльшicть портативних пристро1'в, звукових карт, музичних центрiв, автомагнiтол та шших не спець ально1' апаратури), а також для людей старшого в^, у зв'язку з природними вжовими змiнами слухового апарату, проте в бiльшоcтi випадк1в чiтко помтт на аyдiотехнiки високо1' точноcтi ввдтво-рення звуку. Даний метод називають пcиховiзyаль-ним кодуванням. При створенш MP3 iз cереднiм бь трейтом 128 кбiт/c в резyльтатi виходить файл, роз-мiр якого приблизно дорiвнюe 1/11 ввд оригiнального файлу з CD-Audio (без стиснення бь трейт 1411,2 кбiт/c). МР3-файли можуть створюва-тися з високим або низьким бiтрейтом, що впливае на яшсть файлу-результату [10].

BMP (англ. BitMap Picture) - апаратно-незале-жне побiтове зображення Windows - пвдтримуеться будь-якими Windows-cyмicними програмами. Структура файлу BMP використовуеться Windows для збертання растрових зображень. Наприклад, в цьому форматi зберiгаютьcя малюнки фону, ткто-грами та iншi раcтровi зображення Windows. Формат зводить до мшмуму iмовiрнicть помилок або неправильно1' iнтерпретацiï растрових даних. Осно-вним недолгом даного формату е те, що тшьки ве-рciï формату з 4- та 8-бгтовим кольором шддаються стисненню. Отже, 24-бiтовi файли BMP будуть дуже великими. Крiм того, застосування файлiв BMP обмежене платформами Windows та OS/2. Все це робить неможливим застосування даного формату у мереж! У той же час цей формат використовуеться при створенш графiчних файлiв у графiч-них редакторах та при скануванш зображень. Ко-жен файл BMP мютить заголовок файлу, заголовок зображення, раcтровi даш та карту кольорiв (крiм зображення 24-бгтовим кольором). Заголовок файлу ВМР мicтить iнформацiю про тип та розмiр файлу, а також про розташування в ньому даних. Шсля заголовку файлу слвдуе структура, що задае iнформацiю про розмiр, колiр та cтиcненнi зображення [11].

WAVE або WAV е короткою формою Wave Audio File Format (рвдше iменованоï як Аудю для Windows). Цей формат е стандартом для збер^ання аудю потоку на ПК. Вш е сферою докладання формату RIFF для збертання аудю в «ланцюжках», це дуже нагадуе формати 8SVX та AIFF, використову-ванi комп'ютерами Amiga й Macintosh ввдповвдно. Це також основний формат на системах Windows для зберiгання звичайного нестиснутого звуку. Як правило, для цього застосовуеться кодування методом лшшно1' iмпyльcно-кодовоï модyляцiï [12].

Файл HTML ввдноситься до веб-cторiнок, при створенш яких, використовувалася мова розмгтки HTML. Зазвичай це не стиснений ASCII текст. Також може використовуватися UTF-8 [13].

Файл DOC (з англ. Microsoft Word Document) е документом, створеним в одному з найпопулярш-ших програмних комплекав для роботи з тексто-вими документами Microsoft Word. Варто ввдзна-чити, що будь-яш верси пакепв Microsoft Office, включають в себе наявшсть програмного забезпечення Word. Формат DOC може збертати в cобi до-статньо велику кшьшсть рiзноманiтноï iнформацiï, сюди входить рiзна iнформацiя про форматування тексту, даш про вирiвнювання, вiдcтyпи, списки, абзаци i так дал! Подiбнi файли формату можуть мютити не тшьки текстовий документ з певною ш-формащею, але й вciлякi зображення, таблищ, а також сценарп та дiаграми [14].

Файл XLS - електронна таблиця, створена в Microsoft Excel - найпопуляршшому додатку для роботи з таблицями. Даш в докуменп зберiгаютьcя в осередках, кожна з яких мае певну адресу [15].

Кожна клiтинка може мютити як фiкcованi данi, так й формули, часто пов'язанi з даними в ш-ших осередках. Крiм того, документ може мютити зображення, а також дiаграми, побудоваш на оcновi даних у певних осередках.

TIFF (англ. Tagged Image File Format) - формат збер^ання растрових графiчних зображень. TIFF став популярним форматом для збер^ання зображень з великою глибиною кольору. Вш використовуеться при скануванш, надсилання факcимiльних поввдомлень, розпiзнаваннi тексту, у полiграфiï, широко пвдтримуеться графiчними додатками. TIFF був обраний в якосп основного графiчного формату операцiйноï системи NeXTSTEP i з не1' пвд-тримка цього формату перейшла в Mac OS X. Формат був розроблений Aldus Corporation у сшвпращ з Microsoft для використання з PostScript [16]. Формат TIFF частше шших використовуеться у пол^-рафп. Це найпопyлярнiший растровий формат для друку.

Випробування pijinix ар\1вачор1в

Таблиця 1

Випробування aрхiвaторa 7zip__

Тип файлу Розмiр до стиснення, байт Розмiр шсля стис-нення, байт У скшьки рaзiв був стиснений файл ввд-носно початкового Коментaрi

doc 2 450 944 198 127 ~12.37

exe 1 110 476 1 089 529 ~1.01 немае стиснення

bmp 2 359 352 528 788 ~4.46

pdf 4 401 474 4 211 153 ~1.04 немае стиснення

wav 609 964 480 438 ~1.27 погане стиснення

jpeg 775 702 772 879 ~1.00 немае стиснення

mp3 8 414 449 8 259 672 ~1.01 немае стиснення

xls 2 054 144 346 622 ~5.9

txt 848 410 294 929 ~2.87

html 400 444 71 708 ~5.58

tif 101 098 68 829 ~1.47

Таблиця 2

Випробування архиватора Zip__

Тип файлу Розмiр до стиснення, байт Розмiр шсля стис-нення, байт У скшьки рaзiв був стиснений файл ввд-носно початкового Коментaрi

doc 2 450 944 312 192 ~7.8

exe 1 110 476 1 092 954 ~1.01 немае стиснення

bmp 2 359 352 675 844 ~3.49

pdf 4 401 474 4 285 599 ~1.02 немае стиснення

wav 609 964 571 114 ~1.06 немае стиснення

jpeg 775 702 772 482 ~1.00 немае стиснення

mp3 8 414 449 8 294 635 ~1.01 немае стиснення

xls 2 054 144 533 632 ~3.85

txt 848 410 340 239 ~2.50

html 400 444 90 172 ~4.44

tif 101 098 70 130 ~1.44

Таблиця 3

Випробування архиватора WinRaR__

Тип файлу Розмiр до стиснення, байт Розмiр шсля стис-нення, байт У скшьки рaзiв був стиснений файл ввд-носно початкового Комеш^

doc 2 450 944 211573 —11.58

exe 1 110 476 1 093 377 —1.01 немае стиснення

bmp 2 359 352 561 769 —4.20

pdf 4 401 474 4 241 040 —1.03 немае стиснення

wav 609 964 489 983 —1.24 погане стиснення

jpeg 775 702 773 637 —1.00 немае стиснення

mp3 8 414 449 8 260 582 —1.01 немае стиснення

xls 2 054 144 442 205 —4.64

txt 848 410 310 000 —2.73

html 400 444 78 403 —5.10

tif 101 098 68 912 —1.46

Таблиця 4

Випробування архиватора Power archiver (Extreme parameters)_

Тип файлу Розмiр до стиснення, байт Розмiр шсля стис-нення, байт У скшьки рaзiв був стиснений файл ввд-носно початкового Комеш^

doc 2 450 944 182 804 —13.40

exe 1 110 476 1 093 715 —1.01 немае стиснення

bmp 2 359 352 486 335 —4.85

pdf 4 401 474 3 306 264 —1.33 погане стиснення

wav 609 964 479 009 —1.27 погане стиснення

jpeg 775 702 630 344 —1.23 погане стиснення

mp3 8 414 449 помилка

xls 2 054 144 324 898 —6.32

txt 848 410 245 502 —3.45

html 400 444 51 441 —7.78

tif 101 098 68 158 —1.48

Таблиця 5

Випробування aрхiвaторa Power archiver (Normal parameters)_

Тип файлу Розмiр до стиснення, байт Розмiр шсля стис-нення, байт У скшьки рaзiв був стиснений файл ввд-носно початкового Комеш^

doc 2 450 944 199 829 —12.2

exe 1 110 476 1 090 685 —1.02 немае стиснення

bmp 2 359 352 528 044 —4.47

pdf 4 401 474 3 317 254 —1.33 погане стиснення

wav 609 964 481 422 —1.27 погане стиснення

jpeg 775 702 637 750 —1.22 погане стиснення

mp3 8 414 449 помилка

xls 2 054 144 351038 —5.85

txt 848 410 245 502 —3.45

html 400 444 51 441 —7.78

tif 101 098 68 566 —1.47

Порiвняемо ус рашше отримаш результати, та оберемо нaйкрaщi коефщенти стиснення.

Таблиця 6

_Порiвняння aрхiвaторiв 7zip, WinRar та PA_

Тип Рекомендований ар- Розм1р до стис- Розм1р шсля стис- У скшьки раз!в був стиснений файл

файлу х1ватор нення, байт нення, байт вщносно початкового

doc 7zip 2 450 944 198 127 —12.37

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

exe PA 1 110 476 1 090 685 —1.02

bmp PA 2 359 352 528 044 —4.47

pdf PA 4 401 474 3 317 254 —1.33

wav 7zip 609 964 480 438 —1.27

jpeg PA 775 702 637 750 —1.22

mp3 7zip 8 414 449 8 259 672 —1.01

xls 7zip 2 054 144 346 622 —5.9

txt PA 848 410 245 502 —3.45

html PA 400 444 51 441 —7.78

tif PA 101 098 68 566 —1.47

Розробка програми

На основi отриманих даних була розроблена програма для оптимально!' aрхiвaцiï. Програма була розроблена на мовi C#. Для кожного файлу який ко-ристувач перемiщуе у не! вона обирае оптималь-ний aрхiвaтор та вiдкривaе його для користувача. Якщо прогрaмi не було визначено тип файлу, який користувач бажае за aрхiвувaти, то вона за замовчу-ванням пропонуе використовувати WinRaR так як вiн пiдтримуе саму б№шу рiзномaнiтнiсть фaйлiв, якi можуть за допомогою нього бути зaaрхiвовaнi.

Також для фaйлiв типу txt програма пропонуе на вибiр 2 типи можливих aрхiвaторiв: арифмети-чне кодування (найб№ш оптимальне рiшення) та Power arch (як бшьш зручний у використaннi). Для типiв фамв exe, bmp, pdf, jpeg, html, tif програмою рекомендований aрхiвaтор Power arch, для doc, wav, mp3, xls рекомендований aрхiвaтор 7zip. При над-ходженнi невiдомого типу файлу було виршено використовувати WinRaR так як вiн мае саму велику кiлькiсть фaйлiв, що може тдтримувати.

Перетащите сюда ф-эйл/ы для сжатия... D '.DesktopNPre-alla'.ReadMe rus.lxl ~> Anlmelic (alla versic Or use Power Archiver

D AD eskto p\ P r e-a lia Ve adme. t st — > Arifmelic [alfa version]...

Рис. 1. Демонстраця роботи програми оптимальноï арх1вацН

Висновки. У сучасний час файли досягли дуже великих обсяпв, розмiр файлiв зростае шви-дше шж можливоcтi носив. Тому були розроблеш програми арх1ватори, яш могли без втрати даних зменшити обсяг необх1дний для !х збереження.

На даний час пропонують використовувати рь знi архiватори. Кожен архiватор мае деякi переваги над шшими, але не icнуе архiватора, який був би у всьому набагато кращим за сво!х конкурентiв.

Тому у данш роботi було проведено досль дження того, який коефщент стиснення найкращий у кожного архiватора до певних типiв файлiв. З кожного арх1ватора було обране найкраще й об'ед-нано до програми, яка допомагае обирати найопти-мальнiший архиватор до конкретних титв файл1в щоб досягти найкращого результату по мюцю, який займае файл тсля обробки.

Лiтература

1. Data compression https://searchstorage.techtarget.com/definition/ compression (дата звернення 11.11.2020).

2. WinRAR: https://www.win-rar.com/education.html (дата звернення 11.11.2020).

3. 7-Zip: https://www.7-zip.org/ (дата обращения 11.11.2020).

4. PowerArchiver: https://www.powerarchiver.com/ (дата звернення 11.11.2020).

5. .TXT Расширение файла: https://www.reviv-ersoft.com/ru/file-extensions/txt (дата звернення 11.11.2020).

6. JPEG: https://uk.wikipedia.org/wiki/JPEG (дата звернення 11.11.2020).

7. .EXE: https://www.online-convert.com/file-format/exe (дата звернення 11.11.2020).

8. Параметры Adobe PDF: https://helpx.adobe.com/ru/indesign/using/pdf-options.html (дата звернення 11.11.2020).

9. Portable Document Format: https://ru.wikipedia.org/wiki/Portable_Document_For mat (дата звернення 11.11.2020).

10. MP3: https://uk.wikipedia.org/wiki/MP3 (дата обращения 11.11.2020).

11. BMP (Bitmap Picture): https://ru.bmstu.wiki/BMP_(Bitmap_Picture) (дата звернення 11.11.2020).

12. Формат WAV: https://audiocoding.ru/formats/wav/ (дата звернення 11.11.2020).

13. Файл формата HTML — что это?: https://filesreview.com/ru/info/html (дата звернення 11.11.2020).

14. Файл формата DOC — что это?: https://filesreview.com/ru/info/doc (дата звернення 11.11.2020).

15. Файл с расширением .xls: https://open-file.ru/types/xls (дата звернення 11.11.2020).

16. Формат файлов TIFF в деталях: http://docscan.ru/allabout/tiff_file_format.html (дата звернення 11.11.2020).

i Надоели баннеры? Вы всегда можете отключить рекламу.