1.1 Понятие архивации

 

Архивные файлы – это документы, рисунки и др. файлы, которые специально сжаты (упакованы) с целью более рационального размещения на дискете или для передачи по электронной почте через интернет. При этом архивный файл занимает в несколько раз меньше места (иногда в 10 - 100 раз!) и может быть свободно размещен на дискете или более быстро отправлен по электронной почте (вместо 10мин. – 1-2 мин.)

Архивные файлы широко используются для передачи информации в Интернете и по электронной почте, причем благодаря сжатию информации повышается скорость её передачи. Это особенно важно при передаче информации по телефонной линии.

Архиваторы - это специальные программы, которые позволяют работать с архивными файлами, т.е. запаковывать и распаковывать архивные файлы.

Необходимость архивации связана также с необходимостью резервного копирования информации на диски и дискеты с целью сохранения ценной информации и программного обеспечения компьютера для защиты от повреждения и уничтожения (умышленного или случайного, под действием компьютерного вируса).

Архиваторы позволяют сжимать информацию в памяти компьютера при помощи специальных математических методов. При этом создается копия файла меньшего размера. В одном архиве может хранится сразу несколько файлов или даже несколько папок. Это даёт возможность разместить больше информации на диске или дискете.

Коэффициент сжатия характеризует процентное отношение сжатого (архивного) файла по отношению к исходному. Т.е. Kсжатия=(Laрхив/Lисхоный ) 100%

Однако удобнее использовать обратное отношение, которое показывает во сколько раз архивный файл меньше исходного. Kуменьшения = Lисхоный/ Laрхив

Существует два основных метода архивации:

Алгоритм Хаффмана. Алгоритм основан на том факте, что некоторые символы из стандартного 256-символьного набора в произвольном тексте могут встречаться чаще среднего периода повтора, а другие, соответственно, – реже. Следовательно, если для записи распространенных символов использовать короткие последовательности бит, длиной меньше 1 байта, а для записи редких символов – более длинные, то суммарный объем файла уменьшится. Например буквы а,о,е,и – встречаются очень часто в русском тексте, объем каждой буквы равен 1 байт (8 бит), их можно заменить на цифры 0,1,2,3, которые можно разместить в 2-х битах. Т.е. сжатие будет равен 25%, т.е. сжатие в 4 раза.

Алгоритм Лемпеля-Зива. Классический алгоритм Лемпеля-Зива – LZ77, названный так по году своего опубликования. Он формулируется следующим образом : «если в более раннем тексте уже встречалась подобная последовательность байт, то в архивный файл записывается только ссылка на эту последовательность (смещение, длина), а не сам текст». Так фраза «КОЛОКОЛ_ОКОЛО_КОЛОКОЛЬНИ» [24] закодируется в последовательность «КОЛО(-4,3)_О(-6,4)_(-7,7)ЬНИ» [13]. Коэффициент сжатие - 54%. Аналогично сжимается изображение. Большие области одного цвета заменяются на ссылку: (цвет, длина) Графические файлы сжимаются очень хорошо– в 100–200 раз

Типы архивных файлов В файловой системе компьютера архивные файлы имеют строго заданный тип (расширение). Так, наиболее часто встречающиеся архивы имеют тип: ZIP, RAR, ARJ. Кроме них на компьютерах используются архивы: CAB, LZH, TAR, GZ, UUE, BZ2, ISO…

 

1.2 Архивный файл

 

Архивный файл представляет собой набор из одного или нескольких файлов, помещенных в сжатом виде в единый файл, из которого их можно при необходимости извлечь в первоначальном виде. Архивный файл содержит оглавление, позволяющее узнать, какие файлы содержаться в архиве. В оглавлении архива для каждого содержащегося в нем файла храниться следующая информация:

- имя файла;

- сведения о каталоге, в котором содержится файл;

- дата и время последней модификации файла;

- размер файла на диске и в архиве;

- код циклического контроля для каждого файла, используемый для проверки целостности архива;

Определить с помощью, какой программы был заархивирован тот или другой архивный файл, можно при помощи расширения. Например:

- game.rar – заархивирован при помощи архиватора WinRAR;

- game.arj – заархивирован при помощи архиватора ARJ;

- game.zip - заархивирован при помощи архиватора ZIP.

Невольно возникает вопрос, зачем столько архиваторов и все для одной лишь цели – сжать объем файла. Разные программы отличаются форматом архивных файлов, скоростью работы, степенью сжатия файлов при помещении в архив, удобством использования.

 

1.3 Архиваторы MS DOS

 

С развитием компьютера стали увеличиваться и объемы информации хранимой в нем, что в свою очередь привело к развитию технологий по хранению этой информации в сжатом виде, то есть в архивах. Для этого было придумано множество программ осуществляющих архивацию информации.

Однако в работе с этой информацией иногда нежелательно раскрывать полный архив, чтобы взять один или два требуемых файла или же просто посмотреть, что в архиве за информация.

Программы-архиваторы, за исключением единиц, не предоставляют удобных оболочек позволяющих просто, быстро и в наглядной форме разобраться с содержимым архивов.

Наиболее известные программы-архиваторы для MS-DOS: ARJ (разработчик - Robert K. Jung), PKZIP(компания PKWARE Inc.), IHA (Haruyasu Yoshizaki), ZOO (Rahul Dhesi). Безусловным лидером во всем мире за последние 5 лет стал архиватор RAR. В настоящее время RAR активно вытесняет ZIP как основную утилиту сжатия FTP архивов в сети INTERNET. RAR является единственной всемирно используемой программой, созданной русским программистом (за исключением TETRIS). Все архиваторы отличаются используемыми алгоритмами сжатия, форматами архивных файлов, скоростью работы и т.д.

ARJ

Программа ARJ (разработчик - Robert K. Jung) относится к числу наиболее известных продуктов своего класса. Она выполняет все функции по обслуживанию своих, архивов, может помещать файлы в архив, извлекать файлы из архива, и делать «саморизвлекающиеся» файлы и так далее.

Назначение архиватора ARJ

Программа ARJ позволяет:

-   создавать архивные файлы из отдельных или всех файлов текущего каталога и его подкаталогов, загружая в один архив до 32000 файлов;

-   добавлять и заменять файлы в архиве;

-   извлекать и удалять файлы из архива;

-   просматривать содержимое архива;

-   создавать многотомный архив;

-   защищать каждый из помещенных в архив файлов 32-битовым циклическим кодом, тестировать архив, проверяя сохранность в нем информации;

-   получать помощь по работе на 3 международных языках;

-   вводить в архив комментарии к файлам;

-   запоминать в архиве пути к файлам;

-   сохранять в архиве несколько поколений (версий) одного и того же файла;

-   переупорядочивать архивный файл по размерам файлов, именам, расширениям, дате и времени модификации, коэффициенту сжатия и др.;

-   осуществлять поиск строк в архивированных файлах;

-   восстанавливать файлы из разрушенных архивов;

-   создавать самораспаковывающиеся архивы как на одном томе, так и на нескольких томах;

-   просматривать содержимое текстовых файлов, содержащихся в архиве;

-   обеспечивать защиту информации в архиве и доступ к файлам, помещенным в архив, по паролю.

По умолчанию программа ARJ обеспечивает достаточно большую скорость работы и близкую к максимальной степень сжатия. Но при желании можно получить еще на несколько процентов большую степень сжатия файлов за счет несколько более медленной работы. Для этого следует указать режим –JM.

RAR

Архиватор RAR был создан как достаточно универсальное средство сжатия файлов, содержащих самую различную информацию, объединяющее достоинства и удобства программ двух классов архиватора командной строки и полноэкранной оболочки для просмотра и других манипуляций с архивами.

В некоторых случаях использование RAR не может быть заменено ни одним из существующих архиваторов, а логичный и простой интерфейс делает его удобным средством работы с архивами.

По своим техническим характеристикам RAR не уступает широко распространенным и популярным архиваторам, а по некоторым показателям превосходит их.

На файлах типа .EXE, .COM, .LIB, .OBJ, .OVR и аналогичных им RAR как правило обеспечивает максимальную по сравнению с другими архиваторами степень сжатия, превосходя их примерно на 0.5 - 3%

На отдельных файлах (больших .LIB, некоторых других) выигрыш может достигать 5-7% от упакованного размера. Метод сжатия обычно существенно не влияет на результат.

Текстовая информация сжимается примерно на уровне других архиваторов (зависит от вида текста и метода сжатия) на файлах до 32 килобайт размером. На больших текстовых файлах RAR обычно превосходит большинство других архиваторов.

При упаковке файлов баз данных существенно влиять на размер и время работы может метод сжатия (m0 - m5).

Степень сжатия графической информации сильно зависит от рода файлов.

При создании непрерывного (solid) архива, содержащего много небольших однотипных файлов, степень сжатия на 10 - 40 % и более превосходит достигаемую при упаковке в обычный архив.

Помимо стандартных функций RAR обеспечивает

Полноэкранный интерфейс:

-   выбор упаковываемых и распаковываемых файлов;

-   эмуляция структуры подкаталогов в архиве;

-   работа с "мышью";

-   сохранение параметров в файле конфигурации;

-   просмотр упакованных и обычных файлов в текстовом или 16-ричном виде.

Специальные функции:

-   разбиение архива на части (volumes) для переноса на дискеты;

-   создание и модифицирование самораспаковывающихся архивов (SFX);

-   создание самораспаковывающихся архивных томов (SFX);

-   создание непрерывных (solid) архивов с повышенной степенью сжатия;

-   защита информации по паролям;

-   защита архивов от модификации;

-   сохранение информации об авторе архива;

-   восстановление структуры поврежденных архивов;

-   добавление комментариев ко всему архиву и к отдельным файлам;

-   встроенная поддержка ANSI escape последовательностей в комментариях.

Ограничения

-   Количество файлов, добавляемых при выполнении одной операции архивирования, ограничено примерно 6000 - 7000.

-   Количество файлов в архиве не ограничено.

-   При работе в полноэкранном режиме не может выводиться более чем 4000 файлов в одном подкаталоге.

-   Если количество файлов в подкаталоге превышает 2000, сортировка имен при просмотре в полноэкранном режиме отключается.

Непрерывные (solid) архивы

При упаковке большого числа однотипных файлов можно получить существенное увеличение степени сжатия, если вместо обычного, создать непрерывный архив.

Чтобы получить непрерывный архив, необходимо в командной строке RAR при создании архива указать ключ -s:

rar a -s solid.rar

В непрерывном архиве при упаковке каждого файла (кроме первого) используется информация, содержащаяся в предыдущих файлах. По этой причине архивы такого типа нельзя модифицировать. Выигрыш в степени сжатия по сравнению с обычными архивами тем выше, чем меньше средний размер файла и больше их количество. Наиболее типичный выигрыш на больших пакетах программ от 2 до 15 %, но в отдельных случаях наблюдалось уменьшение размера архива (по сравнению с созданным обычным методом) в 1.5 - 2 раза.

Можно также создавать непрерывные архивные тома и непрерывные самораспаковывающиеся архивные тома. Распаковку непрерывных архивных томов нужно всегда начинать с первого тома из последовательности.

Основной недостаток предложенного метода в том, что для распаковки одного файла архиватору необходимо обработать все файлы, предшествующие данному (при этом выдается сообщение: Skipped <имя файла>). Поэтому непрерывные архивы удобнее всего использовать в том случае, когда предполагается распаковка сразу всего архива, например для поставки больших пакетов программ (в этом случае могут быть удобны непрерывные самораспаковывающиеся архивные тома).

Кроме того, при повреждении одного из файлов в непрерывном архиве, будет испорчена информация во всех остальных файлах, следующих за ним.

Если при создании непрерывного архива (также как и при создании архивных томов) сжатие файла не дало результата (упакованный размер больше исходного), то повторное запоминание файла проводиться не будет. Так что размер файла в таких архивах может превышать исходный. Но реально такое может произойти обычно только при упаковке уже сжатых каким-либо архиватором файлов.

Для повышения степени сжатия при добавлении к непрерывному архиву файлы сортируются по расширению.

Работа с внешними архивами

В полноэкранном режиме RAR позволяет работать с архивами форматов широко распространенных архиваторов ZIP, ARJ, LZH.

Для этих архивов поддерживаются следующие операции:

-          распаковка с созданием подкаталогов;

-          распаковка в текущий подкаталог;

-          тестирование архива;

-          удаление файлов из архива;

-          полноэкранный просмотр файлов в архиве;

-          создание SFX архивов;

-          добавление комментариев к архиву (только ZIP,ARJ);

-          добавление комментариев к файлам архива (только ZIP,ARJ);

-          распаковка в указанный подкаталог.

Для таких архивов можно обычным образом задать пароль (ALT-P) и подкаталог для временных файлов (ALT-W).

Для простого просмотра архивов ZIP, ARJ, LZH достаточно одного архиватора RAR, но для выполнения архивных операций соответствующие программы (PKUNZIP, PKZIP, ZIP2EXE, ARJ, LHA) должны быть указаны в PATH.

Просмотр файлов в RAR архиве

Если при просмотре файлов в RAR архиве используется встроенный viewer, то распаковка файла осуществляется динамически по мере надобности. При использовании внешней утилиты просмотра предварительно распаковывается весь файл.



Информация о работе «Программы для работы с архивами данных»
Раздел: Информатика, программирование
Количество знаков с пробелами: 75121
Количество таблиц: 9
Количество изображений: 12

Похожие работы

Скачать
355353
1
0

... базы данных и не должно ущемлять необоснованным образом законные интересы автора или иного правообладателя. Глава 3. Защита авторских прав на программы для ЭВМ и базы данных.   Согласно 4 части Гражданского кодекса РФ, ст.1261 компьютерным программам предоставляется такая же правовая охрана, как и произведениям литературы. Это значит, что автор программы для ЭВМ обладает рядом исключительных ...

Скачать
23613
0
1

... . В начале своего появления сканеры взаимодействовали с программами посредством уникального для каждой модели сканера интерфейса, что серьезно затрудняло включение поддержки работы со сканером в прикладные программы. Для решения этой проблемы был разработан TWAIN - индустриальный стандарт интерфейса программного обеспечения для передачи изображений из различных устройств в Windows и Macintosh. ...

Скачать
40793
1
2

... ·  Если Windows программа имеет графический интерфейс, то и Линукс программа должна иметь его тоже; ·  Функциональность Linux программы должна соответствовать основным функция Windos программы; С учётом поставленных критерий и принципов была осуществлена методика подбора программ аналогов для заполнения информационной базы, в которой они будут участвовать в качестве списков соответствий программ ...

Скачать
35887
0
0

... Communicator), Microsoft Internet Mail. Для того, чтобы почтовая программа могла работать с вашей почтой, её надо сначала настроить. Мы произведём настройку, и изучим основные функции почтовой программы Mail Box из пакета для работы с Internet (Netscape Communicator). Итак, настройка: Перед нами графический интерфейс (рис. 1) программы Mail Box с открытым письмом. Для того, чтобы ...

0 комментариев


Наверх