Архивация и архиваторы

Методы архивирования

Алгоритм Хаффмана

Алгоритм Хаффмана

Алгоритм основан на том факте, что некоторые символы из стандартного 256-символьного набора в произвольном тексте могут встречаться чаще среднего периода повтора, а другие, соответственно, – реже. Следовательно, если для записи распространенных символов использовать короткие последовательности бит, длиной меньше 1 байта, а для записи редких символов – более длинные, то суммарный объем файла уменьшится. Например буквы а,о,е,и – встречаются очень часто в русском тексте, объем каждой буквы равен 1 байт (8 бит), их можно заменить на цифры 0,1,2,3, которые можно разместить в 2-х битах. Т.е. коэффициент сжатия будет равен 25%

Алгоритм Лемпеля-Зива

Классический алгоритм Лемпеля-Зива – LZ77, названный так по году своего опубликования. Он формулируется следующим образом : «если в более раннем тексте уже встречалась подобная последовательность байт, то в архивный файл записывается только ссылка на эту последовательность (смещение, длина), а не сам текст». Так фраза “КОЛОКОЛ_ОКОЛО_КОЛОКОЛЬНИ” [24] закодируется в последовательность “КОЛО(-4,3)_О(-6,4)_(-7,7)ЬНИ” [13]. Коэффициент сжатия - 54%. Аналогично сжимается изображение. Большие области одного цвета заменяются на ссылку: (цвет, длина)

Типы архивов

Непрерывный архив

Непрерывный архив

архив RAR, запакованный специальным способом, при котором все сжимаемые файлы рассматриваются как один последовательный поток данных

Самораспаковывающийся архив

Самораспаковывающийся архив

архив, к которому присоединен исполнимый модуль. Этот модуль позволяет извлечь файлы, запустив архив как обычную программу

Программы – архиваторы

Программы, осуществляющие упаковку и распаковку файлов

Примеры

WinZip

WinZip

наиболее популярный архиватор, используемый в Интернете. Часто является бесплатным или входит еще в какую – нибудь программу в качестве бесплатного бонуса

WinRar

WinRar

Обладая лучшими характеристиками он постепенно теснит другие форматы, но с авторитетом WinZip пока сладить не может. Удобный (русифицированный) интерфейс и достаточно высокая скорость работы в сочетании с низкими системными требованиями обещают WinRar хорошее будущее

WinAce 2.0

WinAce 2.0

свежая версия старого архиватора, пополнившаяся очень интересными функциями и новым алгоритмом сжатия. Этот архиватор использует самый большой размер словаря для архивирования (4 Мб), что во многом объясняет его высокие результаты

Архивация файлов

Архивный файл

это специальным образом организованный файл, содержащий в себе один или несколько файлов в сжатом или несжатом виде и служебную информацию об именах файлов, дате и времени их создания или модификации, размерах и т.п

Архивация (упаковка)

помещение (загрузка) исходных файлов в архивный файл в сжатом или не сжатом виде

Разархивация (распаковка)

процесс восстановления файлов из архива точно в таком виде, какой он имел до загрузки в архив. При распаковке файлы извлекаются из архива и помещаются на диск или в оперативную память

Сжатие информации

Степень сжатия файлов

характеризуется коэффициентом Кс, определяемым как отношение объема сжатого файла Vc к объему исходного файла Vо, выраженное

характеризуется коэффициентом Кс, определяемым как отношение объема сжатого файла Vc к объему исходного файла Vо, выраженное в процентах

процесс преобразования информации, хранящийся в файле, к виду, при котором уменьшается избыточность в ее представлении и соответственно требуется меньший объем памяти для хранения

происходит за счет устранения избыточности различными способами

Цели архивации

Высвобождения места на жестком диске компьютера

Высвобождения места на жестком диске компьютера

Сокращения объема файлов, пересылаемых по электронной почте

Сокращения объема файлов, пересылаемых по электронной почте

a
Размещение данных на едином носителе

Размещение данных на едином носителе

Размещение 1 объемного файла на нескольких носителях, когда он не помещается на 1 носитель

Размещение 1 объемного файла на нескольких носителях, когда он не помещается на 1 носитель

Распаковка сжатых файлов

Распаковка сжатых файлов