Укажите по какой формуле определяют коэффициент сжатия файла k если объем исходного файла v0
Все алгоритмы сжатия оперируют входным потоком информации с целью получения более компактного выходного потока при помощи некоторого преобразования. Основными техническими характеристиками процессов сжатия и результатов их работы являются:
·степень сжатия – отношение объемов исходного и результирующего потоков;
·скорость сжатия – время, затрачиваемое на сжатие некоторого объема информации входного потока, до получения из него эквивалентного выходного потока;
·качество сжатия – величина, показывающая, на сколько сильно упакован выходной поток при применении к нему повторного сжатия по тому же или другому алгоритму.
Алгоритмы, которые устраняют избыточность записи данных, называются алгоритмами сжатия данных, или алгоритмами архивации. В настоящее время существует огромное множество программ для сжатия данных, основанных на нескольких основных способах.
Все алгоритмы сжатия данных делятся на:
) алгоритмы сжатия без потерь, при использовании которых данные на приемной восстанавливаются без малейших изменений;
)алгоритмы сжатия с потерями, которые удаляют из потока данных информацию, незначительно влияющую на суть данных, либо вообще невоспринимаемую человеком.
Существует два основных метода архивации без потерь:
алгоритм Хаффмана (англ. Huffman), ориентированный на сжатие последовательностей байт, не связанных между собой,
алгоритм Лемпеля-Зива (англ. Lempel, Ziv), ориентированный на сжатие любых видов текстов, то есть использующий факт неоднократного повторения "слов" – последовательностей байт.
Практически все популярные программы архивации без потерь (ARJ, RAR, ZIP и т.п.) используют объединение этих двух методов – алгоритм LZH.
Алгоритм основан на том факте, что некоторые символы из стандартного 256-символьного набора в произвольном тексте могут встречаться чаще среднего периода повтора, а другие, соответственно, – реже. Следовательно, если $+o записи распространенных символов использовать короткие последовательности бит, длиной меньше 8, а для записи редких символов – длинные, то суммарный объем файла уменьшится.
Алгоритм Лемпеля-Зива. Классический алгоритм Лемпеля-Зива -LZ77, названный так по году своего опубликования, предельно прост. Он формулируется следующим образом: если в прошедшем ранее выходном потоке уже встречалась подобная последовательность байт, причем запись о ее длине и смещении от текущей позиции короче чем сама эта последовательность, то в выходной файл записывается ссылка (смещение, длина), а не сама последовательность.
Примеры решения задач
Задание | Пусть куб из твердого вещества со стороной равной испытывает всестороннее давление. Сторона куба при этом уменьшается на . Выразите коэффициент сжатия куба, если оказываемое на него давление изменяется по отношению к начальному на |
Решение | Сделаем рисунок. |
В соответствии с определением коэффициента сжатия запишем:
Так как изменение стороны куба, вызванное давлением равно , то объем куба после сжатия ( ) можно представить как:
Следовательно, относительное изменение объема запишем как:
Величина мала, поэтому считаем, что равны нулю, тогда можно положить, что:
Подставим относительное изменение объема из (1.4) в формулу (1.1), имеем:
Задание | В герметичном сосуде находится жидкость. Температурный коэффициент расширения жидкости равен . Температуру увеличивают на величину при этом давление увеличивается на . Каков коэффициент сжимаемости данной жидкости? |
Решение | Изменение объема жидкости при нагревании можно найти как: |
Так как жидкость находится в герметичном сосуде, то будет расти давление. Найдем модуль коэффициент сжимаемости по формуле:
Коэффициент сжатия изображения вычисляется как отношение информационных энтропий по Шеннону для исходного изображения, и изображения, реконструированного после преобразования.
Информационная энтропия вычисляется по формуле:
где р – вероятность появления каждого значения пиксела, вычисляется как отношение суммарного числа появлений каждого значения пиксела к общему числу пикселов (размер изображения)
Мера потерянного объема информации
Изображения исходное и реконструированные сохраняются в компьютере в формате BMP. Отношение занимаемого объема памяти (в байтах) реконструироввнного к исходному и есть эта характеристика.
Общий вид лабораторного стенда.
На рис. 5.1 представлена лицевая панель лабораторного стенда
12 |
11 |
7 |
8 |
6 |
9 |
5 |
3 |
4 |
2 |
1 |
Рис.5.1 Лицевая панель
1. Меню программы
2. Окно вывода исходного изображения
3. Окно вывода изображения, реконструированного после ДВП
4. Кнопка переключения вида изображения
5. Область настройки ДВП
6. Окна вывода рассчитанных характеристик
7. Окно вывода изображения, реконструированного после ДКП
8. Графики рассчитанных характеристик
9. Изображение используемой вейвлет-функции
10. Кнопка включения полного восстановления
7 |
12. Окно отображения коэффициентов ДКП
Методика проведения лабораторной работы
Домашнее задание
В этом разделе приводится пример варианта домашнего задания к лабораторной работе.
1. Изучить внешний вид лабораторного стенда, конспект лекций и рекомендуемую литературу.
2. Зарисовать основные Вейвлет-функции: Хаара, Добеши, Койфлет и биортогональные вейвлеты. Описать различия.
3. Сформировать матрицу 4*4 и подсчитать информационную энтропию по Шеннону.
где N – номер по списку журнала преподавателя (для 1-го и 2-го варианта брать значения по модулю)
4. Провести расчет двумерного преобразования Хаара для составленной матрицы по формуле:
и обратного преобразования:
Пример выполнения пункта 4:
Выполнив обратное преобразование сравните матрицу с исходной, если совпала, то замените 3-4 элемента нулями и подсчитайте новую информационную энтропию и коэффициент сжатия (отношение исходной энтропии к полученной).
При проектировании информационных систем часто необходимо минимизировать затраты на передачу и хранение информации. Добиться этого можно с помощью кодирования, устраняющего избыточность информации. При решении практических задач такое кодирование называют сжатием информации. При сжатии информации, изначально представленной в дискретном виде, говорят о сжатии данных. При этом часто говорят, что сжимается файл или поток данных. Для описания методов сжатия данных используются следующие основные понятия и характеристики.
Компрессор или кодер – программа (устройство), которая сжимает исходные данные, т.е. преобразует входной несжатый файл в выходной сжатый файл. Программа (устройство), выполняющая обратное преобразование (восстановление исходных данных из сжатого файла), называется декомпрессором или декодером. Компрессор и декомпрессор вместе образуют кодек.
Методы сжатия данных делятся на неадаптивные, адаптивные, полуадаптивные и локально адаптивные методы. Неадаптивный метод сжатия данных (метод неадаптивного сжатия данных) – метод сжатия данных, в котором не предусмотрена возможность изменения операций, параметров и настроек в зависимости от характера сжимаемой информации. Метод, в котором предусмотрена возможность изменения операций, параметров и настроек в зависимости от характера сжимаемых данных, называется адаптивным методом. Если для изменения операций, параметров и настроек предварительно собирается некоторая статистика сжимаемой информации, то метод сжатия называется полуадаптивным (говорят, что реализуется двухпроходное сжатие: на первом проходе выполняется анализ информации, а на втором – собственно сжатие). Метод сжатия называется локально адаптивным, если в нем предусмотрена возможность изменения параметров в зависимости от локальных особенностей входного файла.
Методы сжатия данных делятся также на методы сжатия без потерь и с потерями информации. Метод сжатия без потерь (метод неискажающего сжатия) позволяет восстановить сжатую информацию без искажений. Метод сжатия с потерями (метод искажающего сжатия) предусматривает искажение сжимаемой информации для получения требуемых характеристик сжатия (скорости, качества, простоты и т.д.).
Симметричный метод сжатия – это метод, при использовании которого кодер и декодер выполняют одни и те же действия, но в противоположных направлениях. Если либо кодер, либо декодер выполняет значительно большую работу, то соответствующий метод сжатия называется асимметричным.
Для определения производительности метода сжатия данных часто используют коэффициент сжатия, фактор сжатия, качество сжатия, время сжатия и время восстановления. Коэффициент сжатия – величина, получающаяся в результате деления размера выходного (сжатого) файла на размер входного (несжатого) файла. Фактор сжатия – величина, обратная коэффициенту сжатия. Качество сжатия определяется по формуле
выражается в процентах и показывает на сколько процентов уменьшается размер исходного файла после сжатия. Время сжатия – это время, затрачиваемое на сжатие данных. Время восстановления – это время, необходимое для восстановления данных из сжатого файла.
Для того чтобы сэкономить место на внешних носителях (жёстких дисках, «флэшках») или ускорить передачу данных по компьютерным сетям, можно сжать данные — уменьшить их информационный объём, сократить размер файла.
Как вы уже знаете, рисунки часто хранятся в сжатом виде. Кроме того, сжатие почти всегда используется при хранении и передаче звука и видео — упаковку и распаковку этих данных выполняют специальные программы-кодеки.
Рис. 2.39
Каждая буква на рис. 2.39 занимает 8 бит. Определите информационный объём файла в байтах.
Теперь запишем те же самые данные иначе: сначала количество повторений первого символа, а затем — сам первый символ, потом так же для второго символа (рис. 2.40).
Рис. 2.40
Каждая ячейка на рис. 2.40 занимает 8 бит. Определите информационный объём файла в байтах.
Объём файла уменьшился, это значит, что мы сжали данные.
Коэффициент сжатия — это отношение размера исходного файла IO к размеру сжатого файла IСЖ: kсж = IO / IСЖ
Определите коэффициент сжатия файла в рассмотренном выше примере.
Почему же этот файл удалось так удачно сжать? Всё дело в том, что в нём были длинные цепочки повторяющихся символов, и мы применили алгоритм, который очень удачно их сжимает. Этот алгоритм называется кодированием цепочек одинаковых символов (по-английски — RLE 1) : Run Length Encoding).
1) Алгоритм RLE можно успешно использовать для сжатия рисунков, в которых большие области закрашены одним цветом.
В файле записаны 100 различных символов. Определите коэффициент сжатия файла с помощью алгоритма RLE. Что означает полученное число?
Данные можно сжать, если в них есть какие-то закономерности (избыточность), например одинаковые символы, стоящие рядом, или одинаковые цепочки символов («слова»). Поэтому хорошо сжимаются данные, в которых таких закономерностей много, например тексты и рисунки. Хуже всего сжимаются случайные данные, в которых нет ничего закономерного.
Программы для сжатия данных выявляют избыточность данных и устраняют её, поэтому сжимать второй раз уже сжатые данные чаще всего бесполезно.
Следующая страница Сжатие без потерь
Cкачать материалы урока
Узнаём степень сжатия архива
Для определения степени сжатия на компьютере должен быть установлен архиватор WinRar. Если он у вас не установлен, то вот в этой подобной пошаговой инструкции рассказывается о том, где его бесплатно скачать и как установить.
Вызовите контекстное меню, кликнув правой клавишей мышки на интересующем архиве, для которого требуется определить степень сжатия.
В нём выберите пункт Свойства.
В открывшемся окне перейдите во вкладку Архив. Там в строке Степень сжатия будет указан интересующий нас параметр.
Если у вас остались вопросы, вы можете задать их в комментариях.
В свою очередь, Вы тоже можете нам очень помочь.
Просто поделитесь статьей в социальных сетях с друзьями.
Поделившись результатами труда автора, вы окажете неоценимую помощь как ему самому, так и сайту в целом. Спасибо!
- Помогла понравилась статья? Поделись ею в соцсетях!
- Спасибо!
Привет.
Не секрет, что в экономике ныне дела обстоят не лучшим образом, цены растут, а доходы падают. И данный сайт также переживает нелёгкие времена 🙁
Если у тебя есть возможность и желание помочь развитию ресурса, то ты можешь перевести любую сумму (даже самую минимальную) через форму пожертвований, или на следующие реквизиты:
Оказавшие помощь:
Сергей И. – 500руб
– 468руб
– 294руб
Мария М. – 300руб
Валерий С. – 420руб
– 600руб
Полина В. – 240руб
Любое вещество под воздействием внешнего давления может сжиматься, то ест в той или иной степени изменят свой объем. Так, газы при увеличении давления могу очень существенно уменьшать свой объем. Жидкость подвержена изменению объема при изменении внешнего давления в меньшей степени. Еще меньше сжимаемость у твердых тел. Сжимаемость отражает зависимость физических свойств вещества от расстояний между его молекулами (атомами). Сжимаемость характеризуют при помощи коэффициента сжатия (Тоже самое: коэффициент сжимаемости, коэффициент всестороннего сжатия, коэффициент объемного упругого расширения).
Коэффициент сжатия — это физическая величина, равная относительному изменению объема, деленному на изменение давления, которое вызывает изменение объема вещества.
Встречаются различные обозначения коэффициента сжатия, чаще всего это буквы или . В виде формулы коэффициент сжатия запишем как:
где знак минус отражает тот факт, что увеличение давления ведет к уменьшению объема и наоборот. В дифференциальной форме коэффициент определяют как:
Объем связан с плотностью вещества, поэтому для процессов изменения давления при постоянной массе, можно записать:
Величина коэффициента сжатия зависит от природы вещества, его температуры и давления. Помимо всего выше сказанного коэффициент сжатия зависит от вида процесса, в котором происходит изменение давления. Так, в изотермическом процессе коэффициент сжатия отличается от коэффициента сжатия в адиабатном процессе. Изотермический коэффициент сжатия определяют как:
где — частная производная при T=const.
Адиабатический коэффициент сжатия можно найти как:
где — частная производная при постоянной энтропии (S). Для твердых веществ коэффициент сжимаемости изотермический и адиабатический различается очень мало и этим различием часто пренебрегают.
Между адиабатическим и изотермическим коэффициентами сжимаемости существует связь, которая отражается уравнением:
где и — теплоемкости при постоянном объеме и давлении.
Пошаговая инструкция
В этом пошаговом руководстве я покажу Вам, как узнать степень сжатия файлов архива. Для этого щелкнем правой кнопкой мыши по заархивированному файлу и выбираем графу «Свойства».
В новом диалоговом окне переходим во вкладку «Архив» и в графе «Степень сжатия» Вы видите процент сжатия документа. Это все! Если информация помогла Вам – жмите Спасибо!
Приветствую!
В этой подробной пошаговой инструкции, с фотографиями, мы покажем вам, как узнать степень сжатия файлов в архиве.
Воспользовавшись этой инструкцией, вы с легкостью справитесь с данной задачей.
Единицы измерения коэффициента сжатия
Основной единицей измерения коэффициента сжимаемости в системе СИ является:
=см 2 /дин
4.Показатель степени сжатия файлов
Сжатие информации в архивных файлах производится за счет устранения избыточности различными способами, например за счет упрощения кодов, исключения из них постоянных битов или представления повторяющихся символов или повторяющейся последовательности символов в виде коэффициента повторения и соответствующих символов. Алгоритмы подобного сжатия информации реализованы в специальных программах-архиваторах (наиболее известные из которых arj/arjfolder, pkzip/pkunzip/winzip, rar/winrar) применяются определенные Сжиматься могут как один, так и несколько файлов, которые в сжатом виде помещаются в так называемый архивный файл или архив.
Целью упаковки файлов обычно являются обеспечение более компактного размещения информации на диске, сокращение времени и соответственно стоимости передачи информации по каналам связи в компьютерных сетях. Поэтому основным показателем эффективности той или иной программы-архиватора является степень сжатия файлов.
Степень сжатия файлов характеризуется коэффициентом Кс, определяемым как отношение объема сжатого файла Vc к объему исходного файла Vо, выраженное в процентах (в некоторых источниках используется обратное соотношение):
Степень сжатия зависит от используемой программы, метода сжатия и типа исходного файла.
Наиболее хорошо сжимаются файлы графических образов, текстовые файлы и файлы данных, для которых коэффициент сжатия может достигать 5 – 40%, меньше сжимаются файлы исполняемых программ и загрузочных модулей Кс = 60 – 90%. Почти не сжимаются архивные файлы. Это нетрудно объяснить, если знать, что большинство программ-архиваторов используют для сжатия варианты алгоритма LZ77 (Лемпеля-Зива), суть которого заключается в особом кодировании повторяющихся последовательностей байт (читай – символов). Частота встречаемости таких повторов наиболее высока в текстах и точечной графике и практически сведена к нулю в архивах.
Кроме того, программы для архивации все же различаются реализациями алгоритмов сжатия, что соответственно влияет на степень сжатия.
В некоторые программы-архиваторы дополнительно включаются средства, направленные на уменьшение коэффициента сжатия Кс. Так в программе WinRAR реализован механизм непрерывного (solid) архивирования, при использовании которого может быть достигнута на 10 – 50% более высокая степень сжатия, чем дают обычные методы, особенно если упаковывается значительное количество небольших файлов однотипного содержания.
Характеристики архиваторов – обратно зависимые величины. То есть, чем больше скорость сжатия, тем меньше степень сжатия, и наоборот.
На компьютерном рынке предлагается множество архиваторов – у каждого свой набор поддерживаемых форматов, свои плюсы и минусы, свой круг почитателей, свято верящих в то, что используемый ими архиватор самый лучший. Не будем никого и ни в чем разубеждать – просто попытаемся беспристрастно оценить самые популярные архиваторы в плане функциональности и эффективности. К таковым отнесем WinZip, WinRAR, WinAce, 7-Zip – они лидируют по количеству скачиваний на софтовых серверах. Рассматривать остальные архиваторы вряд ли целесообразно, поскольку процент применяющих их пользователей (судя по числу скачиваний) невелик.
Читайте также: