Головна » Реферати » Реферати 1 курс » Економічна інформатика

Архівація даних



Вступ



Хотите править дрессированными животными мира postal? Игру postal 3 торрент скачать можно легко на высокой скорости без ограничений. Кроме того, арсенал игрока постал 3 невероятно широк, начиная с обычного пистолетика, и заканчивая переносной ядерной бомбой.
З розвитком комп'ютера стали збільшуватися й обсяги інформації збереженої в ньому, що у свою чергу привело до розвитку технологій по збереженню цієї інформації в стиснутому виді, тобто в архівах. Для цього була придумана безліч програм здійснюючих архівацію інформації.
Однак у роботі з цією інформацією іноді небажано розкривати повний архів, щоб взяти один чи два необхідних чи файли ж просто подивитися, що в архіві за інформація.
Програми-архіватори, за винятком одиниць, не надають зручних оболонок позволяющих просто, швидко й у наочній формі розібратися з вмістом архівів.
Архіватори -- це програми, що дозволяють створювати й обробляти архівні копії файлів. При цьому з архівні копії мають менший розмір, чим оригінали. За допомогою спеціальних алгоритмів стиску з файлів віддаляється вся надлишкова інформація, а при застосування зворотних алгоритмів розпакування архівна копія відновлюється в первісному виді.
Найбільш відомі программи-архіватори для MS-DOS: ARJ (розроблювач -- Robert K. Jung), pkzip (компанія PKWARE Inc.), lha (Haruyasu Yoshizaki), zoo (Rahul Dhesi). Безумовним лідером в усьому світі за останні 5 років став архіватор RAR. В даний час RAR активно витісняє ZIP як основну утиліту стиску FTP архівів у мережі INTERNET. RAR я є єдиною всесвітньо використовуваною програмою, створеної російським програмістом (за винятком TETRIS). Всі архіватори відрізняються використовуваними алгоритмами стиску, форматами архівних файлів, швидкістю роботи і т.д.

1. Ідея кодування з стисненням


Тепер давайте поміркуємо як же і на чому можливо економити місце при стисненні файлів. В деяких файлах зустрічаються досить довгі ланцюги однакових байтів.
Уявіть собі такий файл:
aaaaabbbccccccccccccccadddddddddddddddd {end of file}.
Файл займає на диску 39 байт. Зрозуміло, що інформація в файлі дещо надлишкова і зберігання файлу в такому вигляді недоцільне. Зовсім інша справа, якщо файл буде мати такий вигляд:
5a3b14ca16d {end of file}.
В такому випадку файл буде займати лише 11 байт. Слідуючи з цього файл можна записати більш економічно 39/11= 3.5 разів. На цьому ж прикладі можна описати ще один спосіб економії дискового місця. Як видно файл складається всього з чотирьох символів. Якщо спів ставити кожному з них пару бітів, то отримаємо:
a – "00",
b – "01",
c – "10",
d – "11".
Іншими словами файл можна закодувати таким чином, що кожен символ буде кодуватися не вісьмома, а двома бітами. І тоді економія буде чотирикратною (8/2=4). Слід зауважити, що цей варіант буде спільний і однаково ефективний навіть якщо в файлі немає жодного однакового ланцюга. Зауважте, що для застосування такого алгоритму кількісний склад представлений в файлі байт повинен бути неповним. Наприклад, якщо в файлі представлені 200 різних символів, то для однозначної ідентифікації кожного з них доведеться використати всі вісім біт ( семи не вистачить, так як комбінації з семи біт можуть приймати лише 128 значень), що не дозволить досягнути ніяких результатів при використанні цього способу стиснення.
Отже, якщо ви зрозуміли суть приведених прикладів, то вам в повинні бути зрозумілі ідеї, згідно яким проходить стиснення файлів. Зауважте, що знаючи, яким саме правилом користувались при стисненні, архіви можна буде розпаковувати і отримувати початкові файли. Це варіанти архівації без втрати якості.
З деяких пір користувачу стало недостатньо тільки текстів. І користувачі отримали можливість зберігати на своїх жорстких дисках музику, зображення, відео. Всі ці файли також зберігаються в вигляді послідовності байтів. І якщо в тексті втрата хоча б одної букви або знака може мати фатальні наслідки, то в зображенні чи в відео кліпі інформація інколи наскільки надлишкова, що неминуче видалення частини інформації ніяким чином не вплине на сприйняття людини (за рахунок обмежень, які накладаються зором и слухом). Звідси і ряд методів стиснення з втратою якості.

2. Алгоритм Хаффмана


Це алгоритм архівації без втрати якості. В розглянутих вище прикладах передбачувалось, що, або ж початковий файл складається в основному з однорідних ланцюгів байтів, або ж кількість використовуваних символів достатньо мала ( тобто файл складається з невеликої кількості елементів таблиці ASCII). Уявимо собі самий простий випадок, коли в файлі представлена більша частина таблиці ASCII і майже немає однорідних послідовностей. В такому випадку припустимий результат можливо отримати тільки якщо різні байти (символи) зустрічаються в даному файлі з різною частотою. Тоді найбільш часто трапляючись символи можуть бути закодовані меншим числом біт, а ті що зустрічаються досить рідко навпаки більшим числом біт. В результаті отриманий після кодування файл с більшою вірогідністю буде меншого об'єму, ніж початковий.
Перш ніж описати алгоритм перекодування, який дозволяє найбільш часто зустрічаємі символи (байти) кодувати не вісьмома, а набагато меншим числом біт, потрібно вказати на обмеження, який має кожен, навіть самий ефективний алгоритм без втрати якості.
Можна уявити, що всі файли – це тексти, написані на алфавіті, який складається з 256 літер (так воно власне і є). Розглянемо всю множину файлів, розмір не перевищує n байт (де n будь – яке число). І припустимо, що існує деякий алгоритм кодування, який любий файл стискує з "додатною" ефективністю. Тоді множина всіх їх архівів які входять в склад всіх файлів, розмір яких менше n байт. Згідно нашому припущенню існує відповідність між двома закінченими множинами, кількість елементів яких не співпадає. Звідси можливо зробити досить вагомі висновки: 1) не існує архіватора, який би однаково добре пакував будь-які файли, 2) для будь-якого архіватора знайдуться файли, в результаті стиснення яких будуть отримані архіви в кращому випадку не меншого розміру чим початкові файли.
Тепер почнемо описання алгоритму Хаффмана. Розглянемо його на прикладі наступного файлу:
cccacbcdaaabdcdcddcddccccccccccc {end of file}
Розпишемо частоти кожного з символів:
a – 4,
b – 2,
c – 19,
d – 7.
Весь файл займає 32 байта. Кожен з символів в початковому файлі кодується згідно таблиці ASCII вісьмома бітами:
a – 01100001,
b – 01100010,
c – 01100011,
d – 01100100,
Крок №1. Розмістимо ці чотири символи в порядку зменшення їх частот:
{(c,19),(d,7),(a,4),(b,2)}
Крок №2. На наступному рядку запишемо набір, отриманий з попереднього наступним чином: замість двох останніх символів з їх частотами запишемо новий елемент, котрий замість назви символу буде мати запис "Вершина #n", а замість частоти – сума частот останніх двох елементів попереднього набору;
відсортуємо отриманий набір по спаданню.
{(c,19),(d,7),( "Вершина #1", 6)}
Крок №3. Переходимо на крок №2до тих пір, поки набір не буде складатися тільки з одного елемента: ("Вершина #last_number", summa_vseh_chastot):
{(c,19), ("Вершина #2", 13)}
{( "Вершина #3", 32)} (візуальна ілюстрація див. Малюнок №1)
Що ж отримали? Розгляньте малюнок. Ви бачите дерево, яке росте з листків! Якщо з'єднати лінією кожен з елементів "вершина #x" з тими елементами попередніх наборів, сума частот яких зберігається в другій частині елемента "вершина #x", то ми отримаємо так би мовити дерево(в програмуванні подібні структури називаються бінарними деревами).
Суть цієї деревовидної структури в тому, щоб кожному з символів спів ставити різне число біт в залежності від його частоти (як вже казалося, в нетиснутому файлі символи зберігаються в виді груп по вісім біт). Якщо уважно придивитись в цей малюнок, ви побачите, що кожна з гілок відмічена або нулем або одиницею. Таким чином, якщо уявно пройтись по дереву від кореня до якої-небудь вершини, маючої символ, то послідовність нулів та одиниць, які зустрічаються на вашому шляху, буде комбінацією біт для цього символу. Наприклад, символ "с" як найбільш часто зустрічаємий буде кодуватися одним бітом "0", символ "d" двома бітами "10" і т.д. (див. Малюнок №2)

3. Архівація даних. Архіватор WinRar


a. видалення файлів після архівування;
Ця команда доступна як у режимі керування файлами, так і в режимі керування архівами. У режимі керування файлами вона видаляє виділені файли і папки в Кошик, тому випадково вилучені дані згодом можна буде відновити. Однак у режимі керування архівами виділені файли і папки віддаляються остаточно, тому ви повинні робити це обережно. Для запуску цієї команди використовуйте меню "Команди", кнопку панелі інструментів "Видалити", клавіші чи
.
Остаточно видаляти файли, не поміщаючи їх у Кошик, можна й у режимі керування файлами. Для цього замість клавіші
використовуйте комбінацію клавіш .
b. створення SFX-архіву;
Архіви, що саморозпаковуються
Щосаморозпаковується (SFX, від англ. SelF-eXtractіng) архів - це архів, до якого приєднаний здійсненний модуль. Цей модуль дозволяє витягати файли простим запуском архіву як звичайної програми. Таким чином, для витягу вмісту SFX-архіву не потрібно додаткових зовнішніх програм. Проте , WіnRAR може працювати з SFX-архівом так само, як і з будь-яким іншим, тому якщо ви не хочете запускати SFX-архів (наприклад, коли не можете гарантувати, що в ньому немає вірусів), те для чи перегляду витягу його вмісту можна використовувати WіnRAR.
SFX-архіви, як і будь-які інші здійсненні файли, звичайно мають розширення .EXE.
SFX-архіви зручні в тих випадках, коли потрібно передати комусь архів, але ви не упевнені, що в адресата є відповідний архиватор для його розпакування. Ви також можете використовувати SFX-архіви для поширення своїх власних програм. Наприклад, дистрибутив WіnRAR базується на GUІ SFX-модулі RAR Default.sfx.
Щоб створити SFX-архів з командного рядка, ви можете використовувати ключ - sfx при створенні нового чи архіву команду S для перетворення існуючого архіву в SFX. При створенні нового архіву в оболонці WіnRAR включите опцію "Створити SFX-архів" у діалозі введення імені параметрів і архіву. Якщо ж потрібно створити SFX-архів із вже існуючого, то ввійдіть у нього і натисніть кнопку "SFX".
c. додавання інформації про відновлення;
Щоб додати інформацію для відновлення, у режимі оболонки WіnRAR ви можете включити опцію "Інформація для відновлення" у діалозі введення імені архіву і його параметрів. Ще один спосіб - уключити відповідну опцію в профілі архівації за замовчуванням. У цьому випадку інформація для відновлення буде додаватися в архів після будь-якої зміни архіву.
Інформація для відновлення може містити до 32768 секторів для відновлення. Якщо ушкоджені дані складають безупинна ділянка, то кожен сектор відновлення може відновити 512 байт ушкодженої інформації. Це значення може знизитися у випадку багаторазового ушкодження.
У режимі оболонки ці параметри можна установити за допомогою команди "Захистити архів" чи вказавши розмір інформації для відновлення на вкладці "Додатково" діалогу "Ім'я і параметри архіву".
Інформація для відновлення збільшує розмір архіву.
Для відновлення ушкодженого архіву, захищеного за допомогою інформації для відновлення, в оболонці WіnRAR служить команда "Відновити". У командному рядку використовується команда "r". Відновлений архів одержує ім'я _recover.rar. Якщо ушкоджений архів не захищений інформацією для чи відновлення якщо його неможливо цілком відновити через велике ушкодження, то відбувається друга стадія процесу відновлення, у ході якої реконструюється тільки структура архіву. Файли з невірною контрольною сумою (CRC) після цієї операції відновити не удасться, однак стає можливим відновити неушкоджені файли, що раніше були недоступні через порушення структури архіву. Цей метод працює тільки зі звичайними, але не з безупинними архівами. Після закінчення другого етапу реконструйованому архіву привласнюється ім'я _reconst.rar.
d. вказування розміру тома;
Тома - це фрагменти архіву, що складає з декількох частин. Тома підтримуються тільки у форматі RAR, ви не можете створювати тому ZІ. Звичайно томи використовуються для збереження великого архіву на декількох чи дискетах інших змінних носіях.
Перший тім у послідовності має звичайне розширення .rar, а розширення наступних томів нумеруються как. r00, .r01, r02 і т.д. Тома можуть бути також безупинними і що саморозпаковуються. Перший самораспаковывающийся тім має інше (тобто не .rar) розширення, наприклад, .exe для SFX-томів DOS чи OS/2.
Уже створені багатотомні архіви не допускають зміни, тобто в них не можна додавати, чи обновляти видаляти файли.
Для розпакування томів необхідно починати витяг з першого тому (з расширением. rar). Якщо томи знаходяться на незмінному носії (наприклад, на твердому диску), то спочатку потрібно переписати всі
e. додавання коментарів;
В архіви RAR і ZІ можна додавати необов'язкову текстову інформацію. Ця інформація називається коментарем архіву. Щоб додати коментар вручну до вже існуючого архіву в режимі оболонки WіnRAR, використовуйте команду "Додати архівний коментар", для читання коментарю з файлу в режимі командного рядка - команду "c" чи ключ "-z".
Коментар можна також указати безпосередньо при архівації файлів у діалозі "Ім'я і параметри архіву".
Якщо ви відкриваєте в WіnRAR архів, що містить коментар, а в діалозі Загальних установок включена опція "Показувати коментар", то праворуч від списку файлів буде відображатися вікно з коментарем. Ви можете змінити ширину цього вікна, перетаскуючи мишею його лівий край.
WіnRAR також уміє відображати кольорові ANSі-комментарии, що містять так називані Escape-послідовності ANSІ. Для того щоб створити такий коментар, потрібний спеціальний редактор; сам WіnRAR створювати Escape-послідовності ANSІ не може.
f. встановлення паролю.
Обидва формати - RAR і ZІР - підтримують шифрування. Щоб зашифрувати файли, необхідно вказати пароль - до архівації в командному рядку, чи у меню безпосередньо на вкладці "Додатково" діалогу "Ім'я і параметри архіву". У командному рядку це робиться за допомогою ключа -p. Для введення пароля в оболонці WіnRAR натисніть (та ж дія відбувається при виборі команди "Пароль" у меню "Файл" чи при щиглику мишею на маленькому значку ключа в лівому нижньому куті вікна WіnRAR). Для введення пароля в діалозі "Ім'я і параметри архіву" необхідно натиснути кнопку "Установити пароль" на вкладці "Додатково".
Не забувайте видаляти введений пароль після того, як він стає непотрібним, інакше ви можете випадково запакувати які-небудь файли з паролем, абсолютно не наміряючись цього робити. Щоб видалити пароль, уведіть порожній рядок у діалозі введення чи пароля закрийте WіnRAR і знову його запустите. Коли пароль уведений, значок ключа змінює свій колір з жовтого на червоний. Крім того, якщо ви починаєте архівацію з використанням пароля, заголовок діалогу введення імені і параметрів архіву двічі мигне.
Якщо ви ввели пароль безпосередньо в діалозі "Ім'я і параметри архіву", то вам не потрібно скасовувати його самостійно - пароль буде діяти тільки протягом однієї операції архивирования, по закінченні якої скинеться автоматично.
При витягу зашифрованих файлів можна ввести пароль заздалегідь, хоча це і необов'язково. Якщо пароль не був уведений перед початком витягу і WіnRAR знайшов зашифрований файл, він запитає пароль у користувача.




Повна інформація про роботу

реферат "Архівація даних" з предмету "Економічна інформатика". Робота є оригінальною та абсолютно унікальною, тобто знайти її на інших ресурсах мережі Інтернет просто неможливо. Дата та час публікації: 15.10.2010 в 22:45. Автором даного матеріалу є Барановський Дмитро. З моменту опублікування роботи її переглянуто 3209 та скачано 51 раз(ів). Для ознайомлення з відгуками щодо роботи натисніть [перейти до коментарів]. По п'ятибальній шкалі користувачі порталу оцінили роботу в "5.0" балів.

Барановський Дмитро...

Виконував дуже старанно, намагався детально розкрити всі пункти. Наш найвимогливіший викладач в університеті (Віктор Анатолійович) оцінив на 100 балів...


Подібні матеріали