|
|
16 июня 2011
Оглавление: 1. PAQ 2. История 3. Результаты тестов
Далее представлен список наиболее значимых изменений к алгоритму PAQ. В дополнение более мелкие множественные улучшения опущены.
- PAQ1 был выпущен 6 января, 2002 года Мэттом Махони. Он использовал фиксированные веса и не включал разрежённые и аналоговые модели.
- PAQ1SSE/PAQ2 был выпущен 11 мая, 2003 года Сергеем Осначем. Он значительно улучшил сжатие добавлением Вторичной Оценки Символа между предсказателем и кодировщиком. Вторичная Оценка Символа подавала на вход небольшой контекст и текущее предсказание и на выходе получалось новое предсказание из таблицы. Табличное значение затем обновлялось для отражения текущего бита.
- PAQ3N был выпущен 9 октября, 2003. Была добавлена разрежённая модель.
- PAQ4, выпущенный 15 ноября, 2003 Мэттом Махони, использовал адаптивное взвешивание. PAQ5 и PAQ6 были незначительными улучшениями, включающими аналоговую модель. К этому времени PAQ конкурировал с лучшими PPM-компрессорами и привлёк внимание сообщества людей, занимающихся сжатием данных, что привело к многочисленным улучшениям до апреля 2004. Берто Дестасио доводил модели и поправил последовательность обхода счётчиков. Йохан де Бок внёс улучшения в интерфейс пользователя. Дэвид А. Скотт улучшил арифметический кодер. Фабио Буффони ускорил программу.
- В период с 20 мая,2004 по 27 июля,2004 Александр Ратушняк выпустил семь версий архиватора PAQAR, в котором степень сжатия была значительно повышена путём добавления многих новых моделей, многочисленных миксеров с выбором весов по контексту, добавлением Вторичной Оценки Символа на выход каждого миксера и, наконец, добавлением предварительной обработки исполняемых файлов архитектуры процессоров Intel. PAQAR оставался на вершине программ сжатия данных без потерь до конца 2004 года, но был гораздо медленнее своих предшественников.
- С 18 января по 7 февраля 2005 года Пшемыслав Скибиньский выпустил четыре версии PAsQDa, базировавшиеся на PAQ6 и PAQAR и дополненные английским словарным препроцессором. Он достиг наилучшего результата на Калгари Корпусе, но не на большинстве других тестов.
- Модифицированная Мэттом Махони версия PAQ6 взяла приз на Калгари Корпус Челлендж 10 января 2004. Это событие перекрылось десятью последовательными версиями PAQAR Александра Ратушняка. Наиболее поздняя увидела свет 5 июня 2006 года, она состояла из сжатых вместе данных и текста программы и занимала 589 862 байта.
- PAQ7 был выпущен в декабре 2005 года Мэттом Махони. PAQ7 это полностью переписанный PAQ6 и его варианты. Степень сжатия была схожа с PAQAR, но время выполнения в 3 раза меньше. Но ему не хватало x86 и словаря, поэтому он был не так хорош для сжатия исполняемых модулей Microsoft Windows и английских текстов, как PAsQDa. Хотя он включал модели для цветных BMP, TIFF и JPEG-файлов, поэтому сжимал их лучше. Главное отличие PAQ7 было в том, что он использовал нейронную сеть для комбинирования моделей, в отличие от уменьшающего градиент миксера. Другой чертой PAQ7 была возможность сжимать встроенные в файлы Excel, Word и PDF изображения Bitmap и JPEG.
- PAQ8A был выпущен 27 января 2006 и PAQ8C 13 февраля. Это был экспериментальный пре-релиз ожидаемого PAQ8. Он исправлял некоторые компромиссные решения в PAQ7, в частности, слабое сжатие в некоторых случаях. PAQ8A также включал в себя модели для x86-исполняемых файлов.
- PAQ8F был выпущен 28 февраля 2006 года. PAQ8F содержал три улучшения по сравнению с PAQ8A: более эффективное использование памяти в контекстной модели, новую непрямую контекстную модель и новый интерфейс пользователя для поддержки технологии drag-n-drop под Windows. Он не содержал английского словаря, как PAQ8B/C/D/E варианты.
- PAQ8G был выпущен 3 марта 2006 года Пшемыславом Скибиньским. PAQ8G это PAQ8F, но со словарями и переработанной моделью препроцессора текстовых данных, которая не улучшала сжатие на нетекстовых файлах.
- PAQ8H появился 22 марта, 2006 года благодаря Александру Ратушняку и был обновлён 24 марта, 2006 года. PAQ8H был улучшением PAQ8G в некоторых моделях.
- Павел Л. Голобородько выпустил PAQ8I 18 августа, 2006 года, с исправлением ошибок 24 августа, 4 сентября, и 13 сентября. Он содержал добавление модели полутоновых чёрно-белых изображений для PGM файлов.
- Билл Петтис выпустил PAQ8J 13 ноября, 2006 года. Программа базировалась на PAQ8F с некоторыми улучшениями текстовой модели, заимствованными из PAQ8HP5. Хотя она не включала в себя словари из PAQ8G или PGM модели из PAQ8I.
- Серж Оснач выпустил серию улучшений модели : PAQ8JA 16 ноября 2006 года, PAQ8JB 21 ноября и PAQ8JC 28 ноября.
- PAQ8JD увидел свет 30 декабря 2006 года стараниями Билла Петтиса. Программа была портирована на Win32 и 32- и 64-битную платформу Linux.
- Билл Петтис произвёл PAQ8K 13 февраля 2007 года. В него были добавлены дополнительные модели для бинарных файлов.
- PAQ8L появился 13 марта 2007 года. Модель для Динамическиого Марковского Сжатия была добавлена к существующему набору моделей Мэттом Махони.
- PAQ8O был выпущен 24 августа 2007 года Андреасом Морфисом. Он содержит улучшенные bmp и jpg модели по отношению к PAQ8L. Опционально может быть откомпилирован с поддержкой SSE2 и для 64-битных Linux. На 64-битном ядре алгоритм даёт заметный рост производительности.
- PAQ8P был выпущен 25 августа 2008 года Андреасом Морфисом. Содержит улучшенную bmp модель и добавляет WAV модель.
- PAQ8PX появился 25 апреля 2009 года благодаря Яну Ондрусу. Он содержит различные усовершенствования, такие как лучшее сжатие WAV и EXE файлов.
- PAQ9A был выпущен 31 декабря 2007 года Мэттом Махони. Новая экспериментальная версия. Не включает моделей для специфичных типов файлов и имеет LZP препроцессор.
Приз Хаттера
Серия архиваторов PAQ8HP1-PAQ8HP8 была написана Александром Ратушняком с 21 августа 2006 года по 18 января 2007 года в качестве претендентов на Приз Хаттера. Приз Хаттера это сжатие текстовых данных размером 100 MB Английского текста. PAQ8HP серия произошла от PAQ8H. Программы включали в себя словари для предварительной обработки текста и специализированный тюнинг моделей для теста. Нетекстовые модели были удалены из программ. Словарь был сгруппирован из синтаксически и семантически близких слов с общими суффиксами. Синтаксическая группировка позволяла сжимать текстовые данные потому, что близкие по написанию слова часто появлялись вместе, и их словарные коды легко моделировались на старших битах. Семантическая группировка позволяла легче сжимать словарь. В тесте учитывался размер программы вместе со сжатым словарём.
27 октября 2006 года Приз Хаттера был анносирован Джейсом Боуери. Приз получен 30 октября 2006 года после выхода PAQ8HP5 в размере 3416 евро.
23 мая 2009 года Александр Ратушняк стал третьим победителем Приза Хаттера с модификацией PAQ8HP12.
Просмотров: 3534
|