Алгоритми трансформування вихідних зображень з урахуванням ортогональних перетворень. Алгоритм пошуку переміщених блоків зображення

Перетворення, які використовуються для стиснення зображень, повинні бути швидкими і, по можливості, легко реалізованими на комп'ютері. Це передусім передбачає, що такі перетворення мають бути лінійними.Тобто перетворені величини С(є лінійними комбінаціями (сумами з деякими множниками чи вагами) вихідних величин (пікселів) dj,причому відповідним множником або вагою служить деяке число Wij(Коефіцієнт перетворення). Значить, С( -]Г\- djWij,де г, j= 1,2,..., п.Наприклад, при п= 4 це перетворення можна записати в матричній формі, яка в загальному випадку набуде наступного вигляду: С = W D. Кожен вектор-стовпець матриці W називається «базисним вектором».

Важливим завданням є визначення коефіцієнтів перетворення wij.Основна вимога полягає в тому, щоб після перетворення величина с\була б великою, проте інші величини С2,сз,... стали б малими. Основне співвідношення С(= Ylj djWijприпускає, що С(буде більшим, якщо ваги Wijпосилюватимуть відповідні величини dj.Це станеться, наприклад, якщо компоненти векторів wijі djмають близькі значення та однакові знаки. Навпаки, С(буде малим, якщо ваги будуть малими, і половина з них матиме знак, протилежний знаку відповідного числа dj.Тому, якщо виходять великі с*, то вектори W(jмають схожість із вихідним вектором dj, а малі С(означають, що компоненти wijсильно відрізняються від dj.Отже, базисні вектори wijможна інтерпретувати як інструмент для отримання деяких характерних ознак вихідного вектора.

На практиці ваги Wijне повинні залежати від вихідних даних. Інакше їх доведеться додавати в стислий файл для використання декодером. Це міркування, і навіть те що, що вихідні дані є пікселами, тобто, неотрицательными величинами, визначає спосіб вибору базисних векторів. Перший вектор, який породжує с\,повинен складатися з близьких, можливо, чисел, що збігаються. Він посилюватиме невід'ємні величини пікселів. А решта векторів базису повинні наполовину складатися з позитивних чисел, а на іншу половину - з негативних. Після множення на позитивні величини та їх складання результат буде малим числом. (Це особливо вірно, коли вихідні дані близькі, а ми знаємо, що сусідні пікселі мають, зазвичай, близькі величини.) Нагадаємо, що базисні вектори є деяким інструментом для отримання особливостей вихідних даних. Тому хорошим вибором будуть базисні вектори, які сильно відрізняються один від одного і тому можуть отримувати різні особливості. Це призводить до думки, що базисні вектори мають бути взаємно ортогональними.Якщо матриця перетворення W складається з ортогональних векторів, то перетворення називається ортогональним.Інше спостереження, що дозволяє правильно вибирати базисні вектори, полягає в тому, що ці вектори повинні мати все більші частоти зміни знака, щоб видобувати, так би мовити, високочастотні характеристики даних, що стискуються при обчисленні перетворених величин.

Перший базовий вектор (верхній рядок W) складається з одних одиниць, тому його частота дорівнює нулю. Всі інші вектори мають дві +1 і дві -1, тому вони дадуть невеликі перетворені величини, які частоти (виміряні кількістю змін знаків у рядку) зростають. Ця матриця подібна до матриці перетворення Адамара-Уолша (див. рівняння (3.11)). Наприклад, перетворимо початковий вектор (4,6,5,2)

Результат цілком підбадьорливий, оскільки число с\стало більшим (порівняно з вихідними даними), а два інших числа стали малими. Обчислимо енергії вихідних та перетворених даних. Початкова енергія дорівнює 4 2 + б 2 + 5 2 + 2 2 = 81, а після перетворення енергія стала 17 2 + З 2 + (-5) 2 + I 2 - 324, що вчетверо більше. Енергію можна зберегти, якщо помножити матрицю перетворення W коефіцієнт 1/2. Новий твір W-(4,6,5,2) т дорівнюватиме (17/2,3/2, -5/2,1/2). Отже, енергія зберігається і концентрується у першій компоненті, і вона тепер становить 8.5 2 /81 = 89% загальної енергії вихідних даних, у яких першої компоненти припадало лише 20%.

Інша перевага матриці W полягає в тому, що вона робить зворотне перетворення. Вихідні дані (4,6,5,2) відновлюються за допомогою твору W-(17/2,3/2, -5/2,1/2).

Тепер ми можемо оцінити переваги цього перетворення. Квантуємо перетворений вектор (8.5,1.5,-2.5,0.5) за допомогою його округлення до цілого та отримуємо (9,1,-3,0). Робимо зворотне перетворення та отримуємо вектор (3.5,6.5,5.5,2.5). В аналогічному експерименті ми просто видалимо два найменші числа і отримаємо (8. 5,0, -2.5,0), а потім зробимо зворотне перетворення цього грубо квантованого вектора. Це призводить до відновлених даних (3,5.5,5.5,3), які дуже близькі до вихідних. Отже, наш висновок: навіть це просте та інтуїтивне перетворення є гарним інструментом для «вичавлювання» надмірності з вихідних даних. Більш витончені перетворення дають результати, які дозволяють відновлювати дані з високим ступенем схожості навіть при грубому квантуванні.

Алгоритми цифрової компресії зображень з використанням ортогональних перетворень

на правах рукопису

Умняшкін Сергій Володимирович

УДК 004.932: 004.421: 519.722

Математичні методита алгоритми цифрової

компресії зображень з використанням

ортогональних перетворень

Спеціальність 05.13.11 - "Математичне та програмне забезпечення обчислювальних машин, комплексів та комп'ютерних мереж"

Москва – 2001 2

Робота виконана у Московському державному інституті електронної техніки (технічному університеті)

Науковий консультант: доктор фізико-математичних наук, професор Поспелов А.С.

Офіційні опоненти:

Лікар фізико-математичних наук, професор Ососков Г.А.

Лікар фізико-математичних наук, професор Селіщев С.В.

Лікар технічних наукпрофесор Коекін А.І.

Провідна організація: ФГУП НДІ Радіо (м.Москва)

Захист відбудеться 19 лютого 2002 року у 1430 р. на засіданні спеціалізованої вченої ради Д.212.134.02 у Московському державному інституті електронної техніки за адресою: 103498, Москва, м. Зеленоград, МІЕТ (ТУ).

З дисертацією можна ознайомитись у бібліотеці МІЕТ (ТУ).

Вчений секретар дисертаційної /Воробйов Н.В./ ради професор

Загальна характеристика роботи

Актуальністьтеми. Зберігання і передача зображень при безпосередньому цифровому поданні як матриці пікселів (точок зображення) викликає необхідність обробки колосальних обсягів даних.

Однак безпосереднє уявлення зображення є неефективним: внаслідок значної корелюваності елементів матриці незалежне кодування пікселів породжує надлишкові коди. Тому особливу актуальність серед інших завдань цифрової обробки зображень набуває завдання стиснення зображень, що полягає у пошуку шляхів реалізації ефективного кодування візуальних даних.

Мета роботи. Складність алгоритмів, що використовуються для компресії зображень, неухильно зростає – це стосується не тільки обсягу обчислень, але й ідейних основ побудови алгоритмів, більшість яких ґрунтується на використанні дискретних ортогональних перетворень для попередньої обробки даних. Разом з тим завдання стиснення зображень ставиться практикою, що вимагає при її вирішенні постійної уваги до можливостей реальної апаратури. Метоюроботи були дослідження теоретичних питаньефективне кодування зображень з використанням ортогональних перетворень, а також розробка відповідних алгоритмів стиснення, придатних для практичного застосування на базі універсальних обчислювальних засобів загального призначення.

Напрямок досліджень. Проведені в дисертаційній роботі дослідження включали розгляд наступних питань:

1. Дослідження та розробка методів теоретичного аналізута синтезу дискретних перетворень для схем компресії корелюваних даних;

2. Розробка нових швидких алгоритмів обчислення дискретного перетворенняКрестенсона-Леві (ДПКЛ) та алгоритму стиснення напівтонових зображень, заснованого на статистичному кодуванні спектрів ДПКЛ;

3. Дослідження специфіки та формалізація загальної схеми компресії, що використовує поблочну обробкуфрагментів зображення за допомогою ортогонального перетворення з подальшим квантуванням та статистичним кодуванням коефіцієнтів-трансформант;

4. Розробка алгоритмів вейвлет-компресії зображень та вивчення можливостей фрактального кодування в галузі вейвлет-спектру;

5. Розробка алгоритму стиснення відеопослідовностей (динамічних зображень), придатного для використання у вигляді програмної реалізації на базі універсальних обчислювальних засобів загального призначення (мультимедійних персональних комп'ютерів).

Методи дослідження. Як основний теоретичний інструмент досліджень використовувалися методи математичного та функціонального аналізу, лінійної алгебри, теорії ймовірностей та математичної статистики, теорії інформації. Значну частину досліджень являли собою також комп'ютерні експерименти з обробки реальних нерухомих та динамічних зображень, спрямовані на отримання необхідних статистичних даних та визначення характеристик підсумкових алгоритмів стиснення. Проведені експерименти підтвердили вірність теоретичних рішень та ефективність запропонованих алгоритмів компресії.

Наукова новизна. В результаті виконання дисертаційної роботи одержано нові методи аналізу ефективності ортогональних перетворень, призначених для стиснення корелейованих даних; спеціально для стиснення даних введено до розгляду (вперше побудовано) дискретне псевдокосинусне перетворення (ДПКП). Розроблено нові швидкі алгоритми обчислення ДПКЛ, на базі якого вперше отримано схему компресії статичних зображень, що має аналогічні методу JPEG характеристики.

Для обробки нерухомих та динамічних зображень запропоновано як нові алгоритми, так і загальні теоретичні підходи, що формалізують процедури аналізу та синтезу схем компресії цифрових зображень на основі дискретних ортогональних перетворень.

На захист дисертації виносяться такі основні результати:

Метод оцінки декорелюючої ефективності ортогональних перетворень та засновані на ньому алгоритми кластеризації корелюваних ДПКП та швидкий алгоритм його обчислення;

Новий швидкий алгоритм ДПКЛ та його модифікація – алгоритм із неповним обчисленням; алгоритм поєднаних обчислень ДПКЛ для обробки речових масивів у базисі (1,exp(-2i/3));

Метод компресії зображень, що ґрунтується на спеціальному способі арифметичного кодування спектрів ДПКЛ блоків зображення;

Детерміновані та ймовірнісні оцінки коефіцієнтів дискретного косинусного перетворення (ДКП);

Алгоритм контекстного кодування спектрів ДКП зображень;

Загальна схема компресії зображень на основі векторного адаптивного квантування в області ортогональних перетворень;

Алгоритми вейвлет-компресії статичних зображень;

Алгоритм пошуку переміщених блоків зображення;

Експериментальна методика побудови розбиття спектрів у сфері незалежного кодування;

Алгоритм відеокомпресії.

Практична цінність. У цілому нині зміст роботи носить прикладну спрямованість, тому отримані теоретичні результати також є досягнення цілей, що з розробкою конкретних алгоритмів і схем компресії цифрових зображень. Застосування отриманих алгоритмів стиснення зображень можливе для широкого класу систем зберігання та передачі візуальної інформації, насамперед у мультимедійних та мережевих комп'ютерних додатках. Розроблені алгоритми, як підтверджують експерименти, мають високі характеристики за швидкістю, якістю обробки та стиснення даних, які відповідають сучасному світовому рівню.

Реалізація результатів роботи. Теоретичні результати роботи та алгоритми стиснення відеозображень запроваджено в ГУ НВК «Технологічний Центр» МІЕТ (http://www.tcen.ru) та використано у науково-виробничій діяльності НВП «Технологія» (Москва).

Апробація роботи. Основні результатироботи доповідалися та обговорювалися на наступних наукових конференціях та нарадах:

1. VII саратівська зимова школаз теорії функцій та наближень (СГУ, січень 1994 р.).

2. Міжнар. конференція з теорії функцій та наближень, присвячена 90-річчю акад. С.М.Микольського (Москва, МІ РАН, травень 1995 р.).

3. Всеросійські науково-технічні конференції "Електроніка та інформатика" (Москва, МІЕТ, 1995-2000 р.).

4. Міжнар. конференція з теорії наближення функцій, присвячена пам'яті проф. П.П.Коровкіна (Калуга, КДПУ, 26-29 червня 1996 р.).

5. Міжнародні конференції «Методи оптимізації обчислень» (Київ, 1997, 2001 р.).

6. Міжнародна конференція "Проблеми математичної освіти", посв. 75-річчю чл.-кор. РАН проф. Л.Д.Кудрявцева (1998 р.).

7. Міжнародна конференція «Теорія наближень та гармонійний аналіз» (Тула, 26-29 травня 1998 р.).

8. Міжнародна конференція «Інформаційні технології в інноваційних проектах» (Іжевськ, 20-22 квітня 1999 р.).

9. VII Міжнародна конференція “Математика. економіка. Екологія. Освіта» – Міжнародний симпозіум «Ряди Фур'є та їхні програми»

(Новоросійськ, 1999 р.).

10. VII Міжнародна конференція “Математика. Комп'ютер. Освіта"

11. Міжнародна конференція, присвячена 80-річчю від дня народження С.Б.Стечкіна (Єкатеринбург, 28 лютого – 3 березня 2000 р.).

Публікації. Основний зміст дисертації відображено у 30 роботах.

Структура та обсяг дисертації. Дисертаційна робота містить сторінки (з яких 26 сторінок – додатки) і складається із вступу, шести розділів, висновків та 6 додатків. Бібліографічний список включає 178 найменувань. У додатках наведено чисельні результати низки експериментів з обробки зображень, а також довідкову інформацію та копії документів про використання результатів дисертаційної роботи.

У вступі(28 сторінок) обґрунтовуються актуальність, наукова новизна, практична цінністьдосліджень. Коротко викладається зміст глав.

У першому розділі(35 сторінок) наводяться необхідні для подальшого викладу попередні відомості, надається короткий огляд та класифікація основних підходів до реалізації ефективного кодування зображень.

Використання алгоритмів стиснення із втратами даних для напівтонових зображень носить повсюдний характер: припустившись наявності помилки у відновленому зображенні, можна досягти набагато вищого рівня компресії даних. Найчастіше якість обробки зображень оцінюють X = (xi, j) - матриця вихідного зображення, X = (xi, j) - матриця зображення, отриманого після обробки (стиснення та відновлення даних). Для логарифмічної величини СКО використовується загальноприйнятий захід PSNR (peak signal to noise ratio – відношення пікового значення сигналу до шуму). . Квантування є основним інструментом, який використовується при стисненні з втратами даних. По суті, квантування є виділення з вхідних даних певної основної частини інформації, коли її менша частина опускається.

Застосовується як скалярне, і векторне квантування.

Переведення зображення в узагальнену спектральну область за допомогою лінійного перетворення F може значно знизити міжелементну кореляцію в матриці-трансформанті Y=F(X) порівняно з кореляцією елементів у матриці дискретного зображення. Тоді незалежне покомпонентне кодування матриці Y, а не матриці X стає більш ефективним . Можна також дати енергетичне трактування мети використання перетворень, яка в такому розумінні полягає в концентрації максимальної частини енергії вихідного дискретного сигналу (матриці X) мінімальній кількостіспектральних коефіцієнтів (елементів матриці Y) Між розподілом енергії в узагальненому спектрі і властивостями перетворень, що декорують, є певний зв'язок. Вивчення ефективності властивостей, що декорують, таким чином, є важливим завданням при виборі перетворення для застосування в схемі компресії.

Реальні фотографічні зображення є двовимірними сигналами, що мають неоднорідності (особливості) в областях контурів об'єктів, тому базис функцій, що використовуються для розкладання, повинен мати на вихідному зображенні хорошу локалізацію. Однак у фонових областях зображення може розглядатися як реалізація стаціонарного сигналу, що робить кращим використання для розкладання частотнолокалізованого базису (відомо, що коефіцієнти Фур'є розкладання по тригонометричній системі стаціонарного сигналу некорельовані).

Домогтися одночасно високої роздільної здатності в частотній і в часовій областях неможливо через принцип невизначеності Гейзенберга. Виходом є використання функціональних базисів вейвлетів (сплесків), які мають змінну час-частотну роздільну здатність. Підходи, пов'язані з використанням сплесків, на сьогоднішній день є домінуючими у обробці нерухомих зображень, поступово витісняючи традиційний інструмент декореляції – дискретне косинусне перетворення.

У першому розділі зазначається, що з оптимізації алгоритмів стиснення даних із втратами часто використовується підхід, заснований на мінімізації RD функції Лагранжа. Нехай X – деякий вхідний набір даних, якому в результаті виконання процедури стиснення-відновлення ставиться у відповідність вихідний набір даних тієї ж природи, Y=F(X,u), де u=(u1,…,un) – набір параметрів алгоритму, що управляють. стискування F. Вважаємо X, Y елементами деякого простору з метрикою D(X,Y), безліч всіх можливих значень управляючого вектора u позначимо U. Завдання оптимізації кодування полягає в тому, щоб для заданого набору вхідних даних X і максимально допустимих бітових витрат Rb знайти такі параметри u* = u1,..., un алгоритму F, щоб помилка кодування даних D(X,Y)=D(X,F(X,u)) приймала мінімальне значення. Тобто, де R(X,u) – число біт, необхідне для кодування набору даних X з параметрами u.

Пошук рішення завдання(1) у більшості випадків зводиться до громіздких чисельних процедур ітераційного характеру. Якщо не задаватися обмеженням R(X,u)Rb, то для визначення оптимальних параметрів кодування u*, що відповідають вирішенню задачі (1) для деякого (заздалегідь невідомого) значення Rb, використовується спрощений варіант мінімізації RD-функції Лагранжа:

де - Невід'ємний параметр, що задається зовні. Параметр функції J(u) встановлює баланс між якістю і рівнем стиснення даних. Значення =0 відповідає найменшій помилці кодування, збільшуючи значення, отримуємо при оптимізації параметрів алгоритму F (2) меншу довжину коду, але більшу помилку. Тим самим можна налаштовувати алгоритм кодування на необхідні характеристики. Для пошуку розв'язання задачі (1) мінімізація (2) повторюється ітераційно, з різними значеннями– дана процедура називається RD-оптимизации1.

У першому розділі також коротко відзначаються особливості, пов'язані з обробкою (стисненням-відновленням) динамічних зображень. Основним використовуваним перетворенням для відеокомпресії поки що залишається ДКП, як простіше за обсягом обчислень у порівнянні з вейвлет-перетвореннями.

Як і статичної компресії, алгоритми кодування відео найчастіше є складнішими проти алгоритмами декодування.

Реалізація програмної компресії відео в реальному масштабі часу, та Berger T. Rate Distortion Theory. - Endlewood Cliffs, NJ: Prentice Hall, 1971.

ким чином, накладає суттєві обмеження на допустиму складність обчислень.

Другий розділ(52 сторінки) присвячена вивченню ефективності та синтезу ортогональних перетворень, призначених для використання у стиску даних. Запропонований новий метод аналізу ефективності ґрунтується на наступних міркуваннях. Нехай відома коваріаційна матриця KX вихідного вектора даних X = (x0, x1, ..., x N 1) T, вектор-спектр Y отриманий в результаті деякого ортогонального перетворення з матрицею W: Y = WX.

Середня безумовна ентропія коефіцієнта вектор-спектру може бути записана у вигляді:

де fk(mk,k,x) – функція щільності розподілу ймовірностей для спектральної характеристики yk (k-ої компоненти вектора Y), mk – математичне очікування, k – середньоквадратичне відхилення, f k0 (x) = f k (0,1, x ). Чим менша середня ентропія (3), тим ефективнішим буде наступне незалежне кодування компонентів спектра. Наклавши обмеження, при якому для класу для оптимального перетворення Карунена-Лоева (коли матриця W=Wopt складена з власних векторів KX і матриця KY=WKXWT має діагоN 1 N нальний вигляд) декорелюючої ефективності будемо розглядати величину середньої надлишкової ентропії H ( ) = H cp (W, K X) H cp (Wopt, K X), яка виражається через елементи матриць K X = (cov(xi, x j))i, j = 0 та W = (wi, j)i, j =0 наступним чином :

Чим більше значення H(W,KX), тим менша ефективність декорелюючого перетворення з матрицею W. Чисельні розрахунки величини (4) для різних перетворень і видів коваріаційних матриць показали результати, що повністю узгоджуються з відомими даними, які отримані іншими методами, наприклад, Перл (Pearl J. On coding and filtering stacionary signals by discrete Fourier transforms // IEEE Trans. Inf. Theory. - 1973. - Vol. ITP. 229-232.).

Великий інтерес для аналізу представляє модель дискретного сигналу (вектора X), що має статистику дискретного марковського процесу першого порядку, коли матриця коварії має такий вигляд:

Ця модель часто використовується для опису міжрядкової та міжстовпцевої кореляції в дискретних зображеннях. При =1, коли всі компоненти у вихідному векторі X однакові (для будь-яких двох відліків вектора коефіцієнт кореляції дорівнює одиниці), розрахунок введеного критерію (4) для матриці (5) неможливий, т.к. у цьому випадку маємо det K X = 0. Разом з тим, на фонових областях зображення 1. У розділі 2 доведено таку теорему.

Теорема 2.1. Для будь-якої ортогональної матриці W (NN) такий, що j = 0,1, ... N 1: w0, j = (базисна функція з нульовим індексом є нормована постійна складова N) і ковариационной матриці (5) Різні дослідження, у тому числі проведені у розділі 2, показують, що серед дискретних перетворень, що мають швидкі алгоритми обчислень (для розмірності N арифметичних операцій, що реалізуються за ~NlogN), найбільш близькі до оптимального перетворення Карунена-Лоева характеристики декореляції для марківського процесу (5) дає використання ДКП.

Проте незважаючи на наявність добре опрацьованих швидких алгоритмів обчислення, ДКП принципово вимагає для реалізації виконання операцій множення і за обсягом обчислень помітно поступається, наприклад, перетворенням Хаара, Уолша, Крестенсона-Леві. p align="justify"> Окремим питанням, розгляду якого приділено значну увагу в розділі 2, є побудова нового перетворення, що має як високі характеристики декореляції для моделі (5), так і значно швидші, ніж для ДКП, алгоритми обчислення. Отримане результаті дискретне псевдокосинусное перетворення визначено для векторів розмірності N, яка допускає розкладання N=N1…Nn, причому k Nk(2,3,4). Уявлення N=N1…Nn необхідно записати мінімальною кількістю множників Nk, маючи в своєму розпорядженні їх без спадання, тобто. k, m>k: NkNm. Наприклад, для N=8 маємо N1=2, N2=4 (але не N1=4, N2=2 і N1=N2=N2=2). Тоді матриця ДПКП WN (у даному випадкунижній індекс вказує на розмірність перетворення) будується як прямий твір2 WN = WN 1 … WN n елементарних матриць ДПКП WN k (W2,W3,W4), k=1,…,n, де елементарні матриці ортогональні Під тензорним (прямим) твором матриць D=(dl,m) (l=0,…,-1; m=0,…,-1) та отримані в результаті певних модифікацій з матриць ДКП відповідної розмірності. Елементарні матриці представлені у вигляді добутку деякої діагональної матриці D на матрицю С, а структура дозволяє реалізувати множення на довільний вектор U тільки за допомогою операцій складання і віднімання чисел (множення на 2 еквівалентно додавання, 2x=x+x). Саме:

З властивостей тензорного твору випливає уявлення WN = D N C N, C N = C N 1 … C N n. Матриці C2, C3, C4, D2, D3, D4 наведені вище. Таким чином, реалізація ДПКП Y = WN X = D N C N X полягає в реалізації множення матриці CN на вектор, Y = C N X, і подальшому нормуванні отриманого вектора Y, Y = D N Y. Для обчислення ДПКП зручно використовувати швидкі алгоритми, засновані на факторизованому представленні :

поодинока матриця розмірності N j N j. Оскільки матриці TN j) складаються з певним чином розріджених матриць-блоків C N j, множення матриці TN j) на вектор також зводиться тільки до операцій складання та віднімання чисел. Швидкі алгоритми зворотного ДПКП будуються аналогічно, т.к. в силу орT) () Зазначимо, що необхідне при обчисленні ДПКП та зворотного ДПКП нормування (множення на матрицю DN) для схеми стиснення зі скалярним квантуванням коефіцієнтів перетворення не тягне за собою ускладнення обчислень.

Нормування може бути об'єднане при стисненні даних з етапом скалярного вектора Y індивідуального кроку квантування qj=q/djj (де d jj – елемент діагональної нормувальної матриці D N). При деквантуванні yj = m~j множник для елемента yj слід вибирати у вигляді mj=qdjj.

Як показали розрахунки величини середньої надмірної ентропії (4) і залишкової кореляції по Перл, для даних, що мають статистику марківського процесу першого порядку (5), ДПКП має більшу ефективність у декореляції порівняно з іншими швидкими перетвореннями, реалізація яких також зводиться тільки до операцій складання та віднімання чисел.

Третій розділ(48 стор.) присвячена вивченню питань застосування для стиснення зображень дискретного перетворення Крестенсона-Леві (ДПКЛ) та є розвитком досліджень кандидатської роботи автора.

Для обґрунтування справедливості даного уявленнядив. с.84-85 з монографії «Абстрактні алгебраїчні системи та цифрове оброблення сигналів» / Вариченко Л.В., Лабунець В.Г., Раков М.А. - Київ: Наукова думка, 1986. - 248 с.

Ідея запропонованого в п'ятому розділі алгоритму стиснення заснована на роботах Lewis-Knowles6 (LK) та Xiong-Ramchandran-Orchard7 (XRO). При коді Lewis A.S., Knowles G. Image Compression Using the 2-D Wavelet Transform // IEEE Trans.

Image Proc. - 1992. - Vol. 1. - №2. - P.244-250.

ванні топології S XRO для всіх вузлів дерева, крім листя, використовувалася бінарна карта (ni): якщо ni=0, то дерево в даному вузлі підрізається, а якщо ni=1, то принаймні безпосередні нащадки зберігаються. Сказане ілюструється на рис. 2А. Статистичне кодування ознак (ni) у алгоритмі XRO не використовується. Разом про те, ознаки (ni) сусідніх (за становищем усередині саббэнда) вузлів є корельованими величинами. Щоб врахувати цю кореляцію, у розробленому алгоритмі ознаки для сусідніх вузлів (ni) iC j пропонується групувати в єдиний елемент даних, так що карта підрізання гілок (топологія дерева) описується новим абеткою даних із символами Ni = (ni1, ni2, ni3, ni4) =ni1+2ni2+4ni3+8ni4, які, крім того, кодуються статистично. Новий розширений ознака Nj виявляється пов'язаним з вузлом j вищого рівня, див. рис. 2Б.

Підрізання гілок Рисунок 2. Спосіб підрізування гілок при пошаровому перегляді вузлів: А – алгоритм XRO, Б – пропоноване кодування топології. Ci=(i1,i2,i3,i4) Ідея, яка сягає роботи LK і в тому ж вигляді використовується в XRO, полягає в наступному: чим більше абсолютна величинавейвлеткоефіцієнта wi (або енергія, wi2) вузла-батька i, тим менш ймовірно поява у даного вузла нульової (тобто підрізаної) гілки. Більш точне передбачення появи нульової гілки можна скласти, якщо використовувати Xiong Z., Ramchandran K. and Orchard M.T. Space-frequency Quantization for Wavelet Image Coding // IEEE Trans. Image Proc. - V.6 - May 1997, P. 677-693.

прогнозної величини Pi суму, що включає, крім wi2, також квадрати значень до вузла i. Для прогнозної величини вузла i пропонується використати таку суму абсолютних величин вейвлет-коефіцієнтів:

де множини для індексів підсумовування визначаються серед сусідів вузла i в саббенді відповідно до рис. 3. Вагові коефіцієнти, що входять до суми, були отримані в результаті статистичної обробки ряду тестових зображень з метою виявлення максимуму вибіркового значення для коефіцієнта кореляції між прогнозною величиною (10) та енергією проквантованих вейвлет-коефіцієнтів безпосередніх нащадків Сi: Pi, w2 max.

Запропонований алгоритм вейвлет-компресії використовує кілька статистичних моделей. Функцію арифметичного кодера, яка оцінює за внутрішніми статистичними моделями кількість біт, необхідне для кодування символу з k-му потоці, позначимо H(k,c). Позначення Hspec відноситься до потоків, у яких кодуються проквантовані вейвлет-коефіцієнти, Hmap - до потоків, в яких кодуються ознаки початку нульової гілки. Дерева спектра обробляються послідовно; після оптимізації топології чергового дерева його необхідно закодувати, і цим зробити адаптацію статистичних моделей арифметичного кодера.

Крок 0. /* ініціалізація */ i Ln1: /* проглядаються всі вузли передостаннього рівня */ /*коригування проквантованих коефіцієнтів*/ /* розрахунок RD-функцій збереження та підрізання листя */ Крок 2. i Ll: /*перегляд поточного рівня зі спробою підрізання гілок */ Якщо i0 то /* не досягли початку дерева */ /* визначення оптимальної топології гілок */ /*коригування проквантованих коефіцієнтів*/ /* підготовка для перегляду наступного рівня */ інакше /* i=0, досягли початку дерева */ /* визначення оптимальної топології дерева */ Крок 3. /* формування та видача результату */ Кінець Перегляд вузлів дерева проводиться від листя до кореня. На першому (підготовчому) кроці проглядаються ті вузли i, які мають лише безпосередніх нащадків (Ci=Ui), формуються масиви із значень RDфункцій, що відповідають варіантам підрізання (J U i) та збереження (J U i) листя. Попередньо, на кроці 1.1, для кожного вузла-аркуша аналізується можливість додаткової мінімізації Лагранжа, що характеризує скалярне квантування вейвлет-коефіцієнтів. Ця процедура заснована на відомих властивостях розподілу ймовірностей вейвлеткоефіцієнтів, відповідно до яких бітові витрати R на кодування коефіцієнта апріорі тим менші, чим менше його абсолютне значення (з цієї причини для випадку w = 0 процедура додаткової мінімізації не застосовується). На другому кроці, що виконується для всіх вузлів i наступних рівнів, iLl (l=n-2,…,0), проводиться вибір RD-оптимального способу підрізання гілок (кроки 2.1-2.2), що починаються з вузлів jCi. Кроки 2.3 і 2. несуть той самий зміст, як і кроки 1.1, 1.2. Зазначимо, що введення додаткової оптимізації скалярного квантування (кроки 1.1 і 2.3) дозволяє при тому рівні стиснення додатково підвищити PSNR на 0,02-0,03 дБ.

Для всіх вузлів, за винятком кореневого, вибір моделі кодування ознак Ni (на кроці 2.1) проводиться з використанням правила, що визначається функцією IndMap(i). Для кодування ознаки N0, пов'язаної з коренем дерева, використовується окремий потік даних, якому умовно надано номер 0 (див. крок 2.6).

Як випливає з наведеного опису алгоритму оптимізації, найважливішу роль його роботі відіграють функції IndMap(Pi) і IndSpec(i), які задають правила вибору потоків для кодування даних. Перша функція робить вибір моделі кодування ознаки Ni = (ni1, ni2, ni3, ni4) за середнім значенням прогнозних величин Pi (10), i = i1, i2, i3, i4, і має такий вигляд:

Пороги (t1, t2, t3) = (0.3; 1.1; 4.0) для вибору моделей знаходилися в результаті мінімізації довжини вихідного бітового коду R (t1, t2, t3) при обробці відомих тестових зображень Lena, Barbara, Goldhill. Експерименти показали також, що введення більшого числамоделей для ознак не має сенсу.

Друга ключова функція алгоритму вейвлет-стиснення, IndSpec(i), являє собою правило вибору моделі для кодування вейвлет-коефіцієнтів, що не потрапили в нульові гілки. Для кодування спектральних коефіцієнтів ефективнішим виявляється використання прогнозної величини, отриманої як по батьківському вузлу, а й у вейвлеткоэффициентам вузлів, що у тому самому саббенде, поруч із обробляемым8. У алгоритмі, що розглядається, послідовність кодування і декодування вузлів вейвлет-спектру визначається схемою малюнка 4 (цифри позначають порядок обробки саббендів). Для використання у функції IndSpec(j) прогнозна величина поточного вузла j (позначений чорним) формується s j = 0.36 Pi + 1.06 w j y + w jx + 0.4 w jd, де jy – вузол-сусід по вертикалі, jx – Ідея використання контексту сусідніх вейвлет- коефіцієнтів запропонована в роботі Chrysafis С., Ortega A. Efficient Context-Based Entropy Coding for Lossy Wavelet Image Compression // Proc. Data Compression Conference. - Snowbird (Utah), 1997. - P. 241-250.

вузол-сусід по горизонталії, jd - вузол-сусід по діагоналі (які вже оброблені, див. рис. 4), Pi визначається для вузла-батька i (jCi) по (10). При цьому результати обробки тестових зображень.

Нульова модель відноситься до кодування спектральних коефіцієнтів при функціях, що масштабують, і знову відокремлена. Перша модель включає найбільш низькочастотні вейвлет-коефіцієнти (рівня L1), а також коефіцієнти, для яких прогноз sj - найбільший.

Характеристики, що дає Таблиця. 1. Величина PSNR (в дБ), запропонований алгоритм компресії одержана при стисненні тестових зображень для стандартних тестових зображень за запропонованим алгоритмом ній, наведені в табл. 1. В експерименті Lena Barbara Goldhill ментах застосовувалися п'ятикрокові вейвлет-перетворення з роботи Wei D., Pai H.-T., і Bovik A. C., Antisymmetric Biorthogonal Coiflets for Image Coding // Proc. IEEE International Conference on Image Processing. - Chicago, 1998. - V. 2. - P. 282-286. Порівняння досягнутих характеристик із результатами застосування інших відомих алгоритмів показує, що запропонований алгоритм має дуже високі показники.

Завершальні дослідження глави 5 відносяться до побудови гібридної схеми кодування вейвлет-спектру, коли на додаток до описаного вище способу підрізання гілок вейвлет-коефіцієнтів допускається також можливість векторного самоквантування гілок, яке може трактуватися як фрактальне кодування в області вейвлет-перетворень. Отриманий у результаті гібридний алгоритм вимагає істотно великих обчислень, проте фрактальна складова кодування при цьому виявилася практично повністю пригніченою базовою схемою вейвлет-компресії, що ґрунтується на підрізанні гілок. Необхідно відзначити, однак, що поєднання двох підходів у гібридному алгоритмі було зроблено нескладним способом, і можливості подальшого розвитку залишають тут широке поле для досліджень.

Шоста глава (45 стор.) присвячена дослідженню алгоритмів стиснення динамічних зображень з метою побудови схеми відеокомпресії, придатної для програмної реалізації, що забезпечує обробку в реальному масштабі часу на базі персональних комп'ютерів.

Кадром відеопослідовності назвемо матрицю пікселів з M1 рядків і M2 стовпців: B=(bk,l), k=0,1,…,M1-1, l=0,1,…,M2-1, а під відеопослідовністю розумітимемо упорядкований набір кадрів B0, B1,…,Bi,…. Назвемо (y,x)-блоком кадру B (y, x – цілі численні координати) деяку підматрицю By,x=(bk,l), де k=y,y+1,…,y+N1-1, l=x , x +1, ..., y + N2-1. У розробленому алгоритмі кожен кадр відеопослідовності розбивається при обробці на суміжні матриці-блоки (Bm,n) розміром 88, m,n=0,8,16. блок Bim, n, вважаємо, що блок Bim, n - це переміщений фрагмент Biy, x Див., наприклад, Davis G.M., A wavelet-based analysis of fractal image compression // IEEE Trans. Image Proc. - 1998. - V.7 - №2. - P.141-154.

попереднього кадру, і для кодування (m,n)-блоку зображення достатньо встановити координати блоку в попередньому кадрі, y і x, або зміни координат y-m і x-n. Окремим випадком переміщеного блоку є нерухомий блок, коли m=y, n=x. Якщо блоку Bim n не можна знайти схожий у попередньому кадрі, блок повинен кодуватися як новий. Для вибору способу кодування чергового оброблюваного блоку Bim n знову керуємося критерієм мінімуму функції Лагранжа J(b)=D(b)+R(b). Припустимо, що аргумент b= відповідає кодуванню переміщеного (нерухомого) блоку, а b=1 – нового. Тобто. якщо J(1)>J(0), то блок кодується як переміщений, і як новий – інакше.

При використанні RD-оптимізації завдання пошуку переміщених блоків формулюється в такий спосіб. Для заданого (m,n)-блоку Bim, n i-ого кадру знайти в попередньому відновленому кадрі такий (y,x)-блок B iy,x, щоб мінімальне значення приймала RD-функція Лагранжа Тут враховано, що координати знайденого блоку будуть кодуватись як відносні, тобто. вектор переміщень r=(y-m,x-n). Щоб пошук можна було здійснити у реальному масштабі часу, як область необхідно розглядати лише точки (v,u), досить близько розташовані до точки (m,n). Підвищення ефективності пошуку за рахунок розширення області досягається застосуванням різних алгоритмів спрямованого пошуку, орієнтованих на мінімізацію помилки уявлення переміщеного блоку Bim, n Biy,1, що відповідає окремому випадку (11) при =0. Для того, щоб врахувати внесок бітових витрат у RD-функцію J*, будемо проводити мінімізацію (11) поетапно, на кожному з етапів наближено вважаючи, що вектори переміщень, що розглядаються, тягнуть однакові витрати на статистичне кодування. Крім того, для підвищення універсальності ітераційних алгоритмів пошуку малі переміщення шукатимемо точніше. Дійсно, якщо деякий блок зображення перемістився на значну відстань порівняно з попереднім кадром, то відповідний фрагмент зображення сприймається людським оком змащене, і точно визначення вектора переміщення немає необхідності. Малі ж переміщення блоків не тільки переважають, але й повинні точно відстежуватися в силу специфіки візуального сприйняття. Пропонований алгоритм RD-пошуку має такий вигляд.

Крок 0. Обчислення значення RD-функції нерухомого блоку r=(0,0):

Крок 1. Близький перебір точний пошук невеликих переміщень.

1.1. Серед дев'яти (y, x) блоків попереднього кадру, 1.2. Серед дев'яти (y, x) блоків попереднього кадру, 1.3. ОбчисленняЗначення RD-функції Крок 2. Грубий пошук великих переміщень.

2.1. Серед восьми (y, x) блоків попереднього кадру, 2.2. Серед дев'яти (y,x)-блоків попереднього кадру (y 4, x 4)((0,0), (2,2), (2,2), (2,2), (2,2), (3,0), (0,3), (3,0), ( 0,3)) 2.3. Обчислення значення RD-функції Крок 3. Вибір найкращого варіанта переміщення блоку.

Кінець Для обчислення значення функції J0 необхідно врахувати бітові витрати на кодування ознаки переміщеного блоку: J 0 = J * log2 (mov), де mov - частота появи переміщених блоків вже оброблених даних.

Основний обсяг обчислень у наведеному алгоритмі пов'язаний із підрахунком відхилень B im, n Biy, x. При обчислення одна пробна точка переходить з кроку 0 на крок 1.1, одна - з кроку 1.1 на 1.2, одна - з кроку 2.1 на 2.2. Через війну обчислення відхилення потрібно здійснити 33 разу.

Для підвищення ефективності наведеного алгоритму пошуку для вектора (y, x) оброблюваного блоку слід будувати прогноз по векторам () та () двох вже оброблених сусідніх блоків (відповідно сусіда по вертикалі та сусіда по горизонталі). Власне прогноз – це відносні координати y 0, x 0, які визначають перенесення центру області пошуку: з точки (m,n) до точки (m, n) = m + y 0, n + x 0. Експерименти показують, що число нових блоків зображення скорочується на 5...25%, якщо прийняти таке правило складання прогнозу:

Наслідуючи ідеологію стандарту MPEG, обробку нових блоків також здійснюємо за допомогою квантування з наступним статистичним кодуванням коефіцієнтів двовимірного ДКП. Нехай S=F(Вm,n) – результат ДКП блоку Вm,n. Позначимо SQ = (k, l = round (sk, l / qk, l)) k, l = 0, SQ = (sk, l = qk, l ~ k, l) k, l = 0, де Q = (qk, l) k, l = 0 – одна з матриць квантування JPEG. Для статистичного кодування матриці S застосований алгоритм контекстного кодування, розглянутий у розділі 4, який введений додатковий етап RD-оптимізації. Нехай знову ZQ = (z0,…, z63) – вектор, отриманий в результаті зигзагоподібного зчитування даних із матриці SQ за правилом, що визначається стандартом JPEG (SQ ZQ), G (ZQ) = (g k )C=1 (0,…, 63) – множина індексів ненульових елементів вектора ZQ, тобто. z g k 0 якщо gkG; gkG: z g k = 0. RD-оптимізація статистичного кодування можлива за рахунок подовження нульових серій шляхом скорочення кількості елементів у множині G (додаткового обнулення компонентів вектора ZQ). Для того, щоб у результаті не відбулося помітного ускладнення алгоритму кодування, аналізуватимемо лише можливість збільшення фінальної нульової серії, що дає найбільший внесок у мінімізацію функції J(ZQ)=D(ZQ)+R(ZQ). Нехай ZQ - Вектор, отриманий з вектора ZQ в результаті обнулення останніх компонент (zk) k = g m +1, тобто.

G (ZQ) = (g k) m = 1 G (ZQ), m = 1, ..., C. Тоді найпростіша RD-оптимізація полягає в пошуку такого індексу g m * G (ZQ), що Розглянута вище процедура кодування нового блоку зображення передбачає використання заданої матриці квантування Q. Універсальний алгоритм кодування повинен оперувати деяким набором матриць квантування (Qj) з можливістю вибору необхідної для певних умов.

Якщо набір досить великий, то підбір матриці квантування Q за принципом мінімуму функції JQ (12) перетворюється на громіздку процедуру, яка не реалізується в реальному масштабі часу стандартними засобами. Крім того, при великому діапазоні можливих значень індексу j його кодування кожного нового блоку окремо тягне неприпустимо високі додаткові бітові витрати. Тому в якості вихідного набору було обрано лише кілька матриць з множини, що рекомендується JPEG, які відповідають найкращому, найгіршому та деяким проміжним рівням якості. В експериментах вибиралося число матриць | (Qj) | = 4. Для прискорення виконання операцій поділу, які необхідні при квантуванні, елементи матриць (Qj) були заокруглені до найближчого значення 2k, k=0,1,… набагато швидше.

З урахуванням бітових витрат, які необхідні для кодування індексу матриці квантування, функція Лагранжа, що відповідає кодуванню нового блоку зображення, визначається так:

J = min (J Q log 2 Q) log 2 new, де JQ знаходиться відповідно до (12), Q – частота появи матриці Q, new – частота появи нових блоків у ході попередньої обробки.

При дослідженні характеристик підсумкового алгоритму відеокомпресії для оцінки величини помилки кодування у відновленій послідовності B0, B1, ..., B K 1 використовувалося відношення пікового значення сигналу до шуму, яке визначалося таким чином:

де M1 та M2 задають розмір кадру в пікселях. Для експериментів було обрано широко відомі тестові послідовності News, Container ship, Hall monitor, Akiyo, Claire. Всі вони мають розмір кадру 144 176 пікселів. Перед проведенням експериментів оригінальні послідовності були проріджені: тільки кожен третій кадр, B3k (k = 0, ..., 24), використовувався для формування тих 25-кадрових послідовностей відео, які потім і були піддані обробці. Дане тимчасове проріджування було покликане змоделювати швидкість відеозахоплення 10 кадрів на секунду замість оригінальних (для всіх вищеназваних послідовностей) 30 кадрів на секунду. Обробці піддавалася тільки Яскрава Y-складова, і тільки за складністю яскравості аналізувалася помилка Програмне стиснення відеопослідовностей при цьому вдалося здійснити в реальному масштабі часу.

Результати чисельних експериментів, отримані аспірантом Ф.В.Стрелковим, відображені в таблиці 2. У дужках наведено значення PSNR (13), досягнуте на тих же проріджених 25-кадрових тестових відеопослідовності з використанням загальнодоступного кодера MPEG-http://www.mpeg .org/MSSG. Довжина файлу стислих даних, отриманого в кожному експерименті, точно дорівнює добутку величини бітового потоку даних (наведена в таблиці) на множник 2.5. У всіх тестах запропонована схема компресії дає високі результати, перевищуючи характеристики зазначеного кодера MPEG-2, незважаючи на те, що кодек mpeg2encode використовував для пошуку переміщених блоків зображення повний перебір в області 2323 пікселів.

Таблиця 2. Характеристики стиснення запропонованого алгоритму Описаний алгоритм відеокомпресії було реалізовано програмно в рамках робіт, що проводилися в ГУ НВК «Технологічний Центр» Московського державного інститутуелектронної техніки та в НВП «Технологія»

Впровадження розроблених бібліотек відеокомпресії здійснено у низці програмних систем, серед яких найбільший практичний інтерес представляє система відео контролю та реєстрації Visual Security (див.

http://www.tcen.ru/vs).

Підсумок дослідженням, проведеним у дисертаційній роботі, підбивається у заключному розділі – «Основні висновки та висновок» (3 стор.).

У представленій дисертаційній роботі досліджено різні аспекти застосування дискретних ортогональних перетворень для цифрової компресії зображень як з боку суто формального теоретичного аналізу, так і з боку тих вимог та обмежень, які практика накладає на конкретні обчислювальні схеми та алгоритми. Загалом зміст роботи має прикладну спрямованість, тому більшість теоретичних результатів підкріплено обчислювальними експериментамирезультати яких, у свою чергу, не тільки служили ілюстрацією або перевіркою теорії, але часто давали поштовх і являли собою вихідний матеріалдля подальших розвідок. За результатами проведених у дисертаційній роботі досліджень можна зробити такі висновки.

1. Ортогональні перетворення є основним інструментом для декореляції даних при компресії зображень. У випадку, коли математична модельдискретного сигналу задається підступною матрицею, для аналізу ефективності декорелюючої обробки доцільно застосування запропонованого в роботі критерію середньої надлишкової ентропії.

2. Спеціально для стиснення корельованих даних отримано та вперше введено до розгляду дискретне псевдокосинусне перетворення (ДПКП). У схемі компресії, що передбачає наявність етапу скалярного квантування коефіцієнтів перетворення, серед розглянутих швидких перетворень, реалізація яких зводиться тільки до операцій складання-віднімання (Уолша, Хаара, псевдокосинусна), ДПКП дає найкращі результати декореляції для дискретного сигналу, що описується марком.

3. З використанням отриманих швидких алгоритмів ДПКЛ, що враховують специфіку обробки речових масивів, запропонована схема компресії зображень на основі арифметичного кодування коефіцієнтів ДПКЛ досягає характеристик, які за якістю обробки та обчислювальної складності близькі до варіанта JPEG на основі ДКП.

4. При використанні статистичного кодування коефіцієнтів ДКП методом JPEG наявність «стрибків» дискретного сигналу найменш бажано у центральній області фрагментів обробки.

5. Високу ефективність застосування в різних схемахта алгоритми стиснення даних має метод багатомодельного (багатострумового) арифметичного кодування, а одним із ключових моментів у розробці схем компресії є визначення правил для вибору поточної моделі кодування за контекстом вже оброблених даних. Так, застосування у схемі JPEG запропонованого у розділі 4 алгоритму багатомодельного контекстного арифметичного кодування коефіцієнтів ДКП підвищує ефективність стиснення даних на 10%.

6. При стисканні зображень з використанням багатомодельного кодування деревоподібних структур вейвлет-спектрів правило вибору моделей слід будувати за комбінованим контекстом, який враховує як оточення самого вейвлет-коефіцієнта в саббенді, так і оточення коефіцієнта-батька. Отриманий на цій основі новий ефективний алгоритм компресії цифрових зображень із втратами, розроблений за результатами вивчення статистичних властивостейСпектр дискретних вейвлетперетворень, показує високі характеристики стиснення при складності реалізації, прийнятною для широкого кола додатків.

7. Для усунення міжкадрової (тимчасової) надмірності відеоданих найбільш переважним для практичного застосування серед досліджених алгоритмів блокової компенсації переміщень слід визнати запропонований гібридний алгоритм спрямованого пошуку, при якому малі переміщення шукаються точно і ретельно, а значні переміщення більш грубо.

8. При використанні запропонованого алгоритму відеокомпресії, який був розроблений на основі RD-оптимізаційного підходу з урахуванням вимог та специфіки програмної реалізації, досягається стиснення та відновлення відео в реальному масштабі часу на базі сучасних персональних комп'ютерів, за високої якості обробки.

Загалом у дисертаційній роботі отримано нові наукові результати, теоретичні положення яких дозволили значною мірою розвинути та формалізувати процедури аналізу та синтезу схем компресії цифрових зображень, заснованих на використанні дискретних ортогональних перетворень. Вироблені підходи та рекомендації призвели до побудови конкретних схем та алгоритмів компресії, багато з яких були реалізовані програмно та експериментально підтвердили ефективність свого застосування.

Список основних робіт на тему дисертації 1. Єфімов А.В., Умняшкін С.В. Швидкі алгоритми обчислення дискретного перетворення Крестенсона-Леві та оцінки його спектральних характеристик // Теор. функцій та прибл.: Тр. 7-й саратів. зим. шк. (1994 р.). Ч. 2. - Саратов: Изд.-во СГУ, 1995. - С. 9-20.

2. Єфімов А.В., Поспєлов А.С., Умняшкін С.В. Застосування перетворення Крестенсона-Леві у задачах цифрової обробки інформації //Міжнар.

конф. "Функціональні простори, теорія наближень, нелінійний аналіз", присв. 90-річчю акад. С.М.Микольського (27 квіт. - 3 травня 1995 р.): Тез.

доп. - М: Вид-во МФТІ, 1995. - С.124-125.

3. Умняшкін С.В. Застосування дискретного перетворення Крестенсона-Леві (ДПКЛ) для кодування зображень: порівняння з дискретним перетворенням Фур'є (ДПФ) // Всерос. наук.-тих. конф. "Електроніка та інформатика" 15-17 лист. 1995: Тез. доп. - М: МГІЕТ (ТУ), 1995. - С. 265-266.

4. Умняшкін С.В. Оцінка дисперсії елементів спектра дискретного косинусного перетворення стаціонарного марківського процесу першого порядку //Міжун. конф. з теор. прибл. функці., присв. пам'яті проф. П.П.Коровкіна (Калуга, 26-29 червня 1996 р.): Тез. доп. -Т.2.-Твер: ТДУ, 1996. - С. 217-218.

5. Умняшкін С.В. Оцінка ефективності використання унітарних перетворень для кодування дискретних сигналів // Інформатика та зв'язок: Зб.

Наукових праць за ред. В.А.Бархоткіна. М.: МІЕТ. - 1997. С.73-78.

6. Умняшкін С.В. Оцінка ефективності застосування дискретних перетворень для стиснення даних // "Електроніка та інформатика - 97". Друга всеросійська науково-технічна конференція з міжнародною участю (Зеленоград, 25-26 листопада 1997): Тез. док. Частина 2. – С.79.

7. Єфімов А.В., Поспєлов А.С., Умняшкін С.В. Теоретичні основита деякі особливості застосування дискретних мультиплікативних перетворень у завданнях стиснення цифрових зображень // Праці міжнародної конференції “Питання оптимізації обчислень” (6-8 жовтня 1997 р., м. Київ) Київ: Інститут кібернетики ім. В.М.Глушкова. 108-112.

8. Єфімов А.В., Поспєлов А.С., Умняшкін С.В. Деякі властивості мультиплікативних ортонормованих систем, що використовуються в цифровій обробці сигналів // Праці математичного інституту ім. В.А.Стеклова РАН.

- Т.219. – 1997. – З 137-182.

9. Єфімов А.В., Умняшкін С.В. Про деякі властивості узагальненої системи Хаара та оцінку ефективності застосування ортогональних перетворень для стиснення даних // Функціональні простори. Диференціальні оператори. Проблеми математичної освіти: Праці міжн. конф., присв. 75-річчю чл.-кор. РАН проф. Л.Д.Кудрявцева. - Том 1. - М.: Ріс. ун-т дружби народів, 1998. – С. 70-73.

10. Умняшкін С.В. Про модифікацію дискретного косинусного перетворення // Теорія наближень та гармонійний аналіз: Тез. доп. міжнар. конф.

11. Умняшкін С.В. Про модифікацію дискретного косинусного перетворення // Изв. Тул. держ. ун-ту. Сер. Математика. Механіка. Інформатики. Тула: ТулДУ, 1998. Т. 4. Вип. 1. С. 143-147.

12. Умняшкін С.В., Кочетков М.Є. Аналіз ефективності використання дискретних ортогональних перетворень для цифрового кодування корелюваних даних // Вісті ВНЗ. Електроніка - №6. – 1998. – С. 79-84.

13. Умняшкін С.В. Про кластеризацію корелюваних даних. / / Інформаційні технології в інноваційних проектах. Міжнар. конф. (М.Іжевськ, 20-22 квіт. 1999р.): Матеріали доповідей. – Іжевськ, ІжДТУ, 1999. – С. 59-65.

14. Умняшкін С.В. Алгоритм кластеризації корелюваних даних // VII Міжнар. конф. Математика. економіка. Екологія. Освіта. Міжнар. симп. Ряди Фур'є та їх застосування: Тез. док. - Ростов: Зростання. держ. економ. акад., 1999. - С. 211-212.

15. Єфімов А.В., Поспєлов А.С., Умняшкін С.В. Деякі питання застосування мультиплікативних систем та перетворень у задачах цифрової обробки зображень // VII Міжнар. конф. Математика. економіка.

Екологія. Освіта. Міжнар. симп. Ряди Фур'є та їх застосування: Тез.

док. - Ростов: Зростання. держ. економ. акад., 1999. - С. 154-155.

16. Умняшкін С.В. Псевдокосинусне перетворення для стиснення дискретних сигналів // Інформаційні технології та проблеми мікроелектроніки.

Зб. наук. тр. - М.: МІЕТ. - 1999. - С.158-170.

17. Умняшкін С.В. Алгоритм компресії нерухомих зображень на основі дискретного вейвлет-перетворення//VII міжнародна конференція «Математика. Комп'ютер. Освіта» (Дубна, ОІЯД, 24-29 січ. 2000):

Тез. док. - Москва: Прогрес-Традиція, 2000. - С.327.

18. Єфімов А.В., Умняшкін С.В. Про структуру деяких прямих та зворотних вейвлет-перетворень // Теорія наближень функцій та операторів: Тез.

доп. Міжнар. конф., присв. 80 років. від дня народж. С.Б.Стечкіна (Єкатеринбург, 28 лют. - 3 бер. 2000). -Екатеринб.: УрДУ, 2000. - С.74-75.

19. Умняшкін С.В., Стрєлков Ф.В., Жуков В.Г. Трикрокові алгоритми пошуку переміщених блоків зображення // Інформаційні технології та системи управління. Зб. наук. тр. за ред. В.А.Бархоткіна. - М: МІЕТ, 2000.

- С. 47-55.

20. Умняшкін С.В. Цифрова компресія зображень з допомогою дискретного перетворення Крестенсона-Леви // Міжгалузевий науковотехнічний журнал «Оборонний комплекс – науково-технічному прогресу Росії», №2, 2000. С.28-39.

21. Умняшкін С.В., Космач М.В. Оптимізація кодування цифрових зображень методом JPEG //Изв. вуз. Електроніка -№4-5. -2000. -С.139-141.

22. Умняшкін С.В. Компенсація переміщення об'єктів під час стиснення відеоданих // «Електроніка та інформатика – XXI століття» Третя міжнародна науково-технічна конференція: Тез. док. - М.: МІЕТ, 2000. - С. 365-366.

23. Умняшкін С.В. Алгоритм пошуку переміщених блоків для кодування цифрових відеозображень // Міжгалузі. н.-т. журнал «Оборонний комплекс - науково-технічний прогрес Росії», №3, 2001. - C. 38-41.

24. Умняшкін С. В. Використання контекстного арифметичного кодування для підвищення стиснення даних за схемою JPEG // Вісті вузів. Електроніка - №3. - 2001. - С. 96-99.

25. Умняшкін С. В. Вейвлет-компресія цифрових зображень з прогнозуванням статистичних моделей // Ізв. вишів. Електроніка - №5. – 2001. С.86-94.

26. Умняшкін С. В. Алгоритм фрактального кодування зображень у галузі вейвлет-перетворень // Комп'ютерна математика. Оптимізація обчислень: Збірник наукових праць. – Том 1. – Кив: Інститут кібернетики ім.

В.М.Глушкова, 2001. - С. 385-391.

27. Umnyashkin S.V. Image compression based on mixed predictive modeling of wavelet trees // Reports from Vxj University (Sweden) – Mathematics, природничі науки і технології. - Nr.11 (September), 2001. - 18 pages.

28. Umnyashkin S.V., Strelkov F.V. RD-оптимізована scheme for real-time video compression // Reports from Vxj University (Sweden) – Mathematics, природничі науки і технології. - Nr.12 (September), 2001. - 15 pages.

29. Розробка алгоритмів та програмного забезпечення для реалізації цифрового аналізу та компресії відеозображень у реальному масштабі часу на базі програмно-апаратного комплексу загального призначення: Звіт про НДР (закл.)/НВП «Технологія»; рук. - Умняшкін С.В. - «Вартовий»; № держ.

реєстр. 01990011697; Інв. №01077. - Москва, 1999. - 74 с.

30. Дослідження та розробка алгоритмів програмного стиснення даних із втратами для цифрової обробки відеозображень: Звіт про НДР (закл.) / НВП «Технологія»; рук. - Умняшкін С.В. - «Дозор»; № держ. реєстр.

01200004624; Інв. №100704. - Москва, 2000. - 48 с.

Підписано до друку: 25 грудня 2001 року Замовлення №332. Тираж 100 екз. Уч.-вид.л. 2.4. Формат 6084 1/
рівняння Автореферат дисертації на здобуття наукового ступеня доктора фізико-математичних наук Москва 2007 Робота виконана в Науково-дослідному інституті прикладної математики та автоматизації...»

«КОРНИЛІВ Дмитро Олександрович ДОСЛІДЖЕННЯ ВЛАСТИВОСТЕЙ ФУЛЕРЕНОВ І НАНОТРУБОК МЕТОДОМ МОЛЕКУЛЯРНОЇ ДИНАМІКИ Спеціальність 01.04.07 – Фізика конденсованого стану Автореферат дисертації на здобуття наукового ступеня кандидата фізико-матема 2 політехнічний університет Науковий керівник: доктор...»

«ЧИРИКІВ АНТОН МИХАЙЛОВИЧ НОВІ ТЕОРЕМИ ЄДИНИ ДЛЯ СТІПЕННИХ РЯДІВ 01.01.01 - речовий, комплексний та функціональний аналіз Автореферат дисертації на здобуття наукового ступеня е кандидата фізико-математичних наук1 Педагогічного Університетуім. Герцена Науковий керівник, доктор фізико-математичних наук, професор Широков Микола...»

«Сидоров Евгений Николаевич ОСОБЕННОСТИ ОПТИЧЕСКИХ СВОЙСТВ СИЛЬНО ЛЕГИРОВАННОГО GaAs:Te В УСЛОВИЯХ КОРРЕЛИРОВАННОГО РАСПРЕДЕЛЕНИЯ ПРИМЕСИ Специальность 01.04.10 – физика полупроводников АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико–математических наук Томск – 2010 Работа выполнена в Омском филиале Института физики полупроводников им. А.В. Ржанова СО РАН Науковий керівник: кандидат фізико-математичних наук Давлеткільдєєв Надим Анварович Офіційні...»

«ЛЯШЕДЬКО АНДРЕЙ ДМИТРІЄВИЧ Термооптичні спотворення в неодимових лазерах на основі пластинчастих активних елементів з поздовжнім діодним накачуванням Спеціальність: 01.04.21 – лазерна фізика АВТОРЕФЕРАТ дисертації на здобуття наукового ступеня кандидата фіз фізики ім. А.М. Прохорова РАН Науковий керівник: доктор фізико-математичних наук Цвєтков...»

«УДК: 535.326, 534.18 П'ятакова Зоя Олександрівна АКУСТООПТИЧНА ВЗАЄМОДІЯ У ДВОМЕРНИХ ФОТОННИХ КРИСТАЛАХ Спеціальність 01.04.03 – радіофізика М.В. Ломоносова Науковий керівник: кандидат...»

«КРУТИКОВА Алла Олександрівна СПЕКТРАЛЬНИЙ АНАЛІЗ КОМПОЗИТНИХ МАТЕРІАЛІВ НА ОСНОВІ НАНОКРИСТАЛИЧНОГО КРЕМНІЮ Спеціальність: 02.00.02 – Аналітична хімія М.В. Ломоносова Науковий керівник: доктор хімічних наук, професор Іщенко Анатолій Олександрович Офіційні...»

«МАТВЕЄНКО Сергій Іванович ПЕРІОДИЧНІ СТРУКТУРИ У НИЗКОРОЗМІРНИХ КОРЕЛЮВАНИХ СИСТЕМАХ Спеціальність 01.04.02 - теоретична фізика АВТОРЕФЕРАТ дисертації на здобуття наукового ступеня доктора теоретичної фізикиїм .... »

«УДК 004.896 АКСЕНОВ Костянтин Олександрович ТЕОРІЯ І ПРАКТИКА ПІДТРИМКИ ПРИЙНЯТТЯ РІШЕНЬ В ОБЛАСТІ ПРОЦЕСІВ ПЕРЕТВОРЕННЯ РЕСУРСІВ Спеціальність 05.13.01 – Системний аналіз, керування та обробка інформації автоматизованих системуправління ФДАОУ ВПО Уральський федеральний університет імені першого Президента Росії Б. Н. Єльцина. Науковий...»

«Восков Олексій Леонідович РОЗРАХУНОК ФАЗОВИХ РІВНОВАГ МЕТОДОМ ВИПУКЛИХ ОБОЛОЧОК Спеціальність 02.00.04 – фізична хімія АВТОРЕФЕРАТ дисертації на здобуття наукового ступеня кандидата хімічних наук Москва – 2010 фізичної хіміїХімічний факультет Московського державного університету імені М. В. Ломоносова. Науковий керівник: доктор хімічних наук, професор Воронін Геннадій Федорович Офіційні...»

«Кравченко Ігор Віталійович ОСОБЛИВОСТІ СТРУКТУРУВАННЯ ШАЛОВИХ І ДИСПЕРСНИХ СИСТЕМ НЕСУМІСНИХ ПОЛІМЕРІВ ПРИ ДВИГУНОМ ПЕРЕЧІ. Чисельне модель 02.00.06 - Високомолекулярні з'єднання Автореферат дисертації на здобуття наукового ступеня кандидата фізико-математичних наук Москва 2010 www.sp-department.ru Робота виконана в Установі Російської академії наук Інститут проблем хімічної фізики РАН. ..»

«Грибов Андрій Геннадійович АНАЛІЗ ІНФОРМАЦІЙНИХ ОБМІНІВ У СИСТЕМАХ УПРАВЛІННЯ Спеціальність 05.13.01 – Системний аналіз, управління та обробка інформації (промисловість) АВТОРЕФЕРАТ дисертації на здобуття наукового ступеня кандидат фізико-матема А.А. Дородніцина РАН у Відділі прикладних проблем оптимізації. Науковий керівник: доктор фізико-математичних наук...»

«Джардималиева Гульжиан Искаковна (СО)ПОЛИМЕРИЗАЦИЯ И ТЕРМИЧЕСКИЕ ПРЕВРАЩЕНИЯ МЕТАЛЛОСОДЕРЖАЩИХ МОНОМЕРОВ КАК ПУТЬ СОЗДАНИЯ МЕТАЛЛОПОЛИМЕРОВ И НАНОКОМПОЗИТОВ 02.00.06 – высокомолекулярные соединения АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора химических наук Черноголовка – 2009 www.sp-department.ru Работа выполнена в Институте проблем химической фізики РАН доктор хімічних наук, професор Науковий консультант: Допомогайло Анатолій Дмитрович доктор хімічних...»

«ГАВРИЛОВ Алексей Андреевич ИССЛЕДОВАНИЕ ЛИНЕЙНЫХ И СЕТЧАТЫХ СЛУЧАЙНЫХ ПОЛИМЕРНЫХ СИСТЕМ МЕТОДАМИ КОМПЬЮТЕРНОГО МОДЕЛИРОВАНИЯ Специальности 02.00.06 высокомолекулярные соединения, 01.04.07 – физика конденсированного состояния Автореферат диссертации на соискание ученой степени кандидата физико-математических наук Москва – 2013 Работа выполнена на кафедре физики полимеров и кристаллов фізичного факультетуМосковського Державного Університету імені М. В. Ломоносова....»

«НГУЕН СУАН НГІА ДІЕЛЕКТРИЧНА РЕЛАКСАЦІЯ НАДМОЛЕКУЛЯРНИХ СТРУКТУР У БІОЛОГІЧНИХ РІДИНАХ НА НИЗЬКИХ ТА ІНФРАНІЗКИХ ЧАСТОТАХ Спеціальність - 01.04.04. Фізична електроніка АВТОРЕФЕРАТ дисертації на здобуття наукового ступеня кандидата фізико-математичних наук Санкт-Петербург – 2011 Робота виконана у державній освітній установі вищої професійної освіти Санкт-Петербурзький державний політехнічний університет Науковий керівник:...»

«Наймушина Катерина Олександрівна. УДК 538.945 ЗАСТОСУВАННЯ МЕТОДУ РЕНТГЕНОЕЛЕКТРОННОЇ СПЕКТРОСКОПІЇ ДЛЯ ДОСЛІДЖЕННЯ ХІМІЧНОГО БУДУВАННЯ СКЛАДНИХ МЕДНИХ ОКСИДІВ У СВЕРХПРОВІДНОМУ СТАНІ 1. – прилади та методи експериментальної фізики АВТОРЕФЕРАТ дисертації на здобуття наукового ступеня кандидата фізико-математичних наук Іжевськ – 2004 Робота виконана в лабораторії електронної спектроскопії Інституту фізики поверхні при Удмуртському державному...»

«Дашков Євген Володимирович Про пропозиційні обчислення, що представляють поняття доказовості 01.01.06 – математична логіка, алгебра та теорія чисел АВТОРЕФЕРАТ дисертації на здобуття наукового ступеня кандидата фізико-математичних наук Москва – 2012 державного університету імені М. В....»

«Русаков Дмитро Михайлович СХЕМИ ПРОГРАМ З КОНСТАНТАМИ Спеціальність 01.01.09 – дискретна математика та математична кібернетика АВТОРЕФЕРАТ дисертації на здобуття наукового ступеня кандидата фізико-математичних наук. . Ломоносова. Науковий...»

«РЕМЄЄВА АЛЬФІЯ НІЛІВНА МЕТОДИКА НАВЧАННЯ ФІЗИЦІ У КЛАСАХ СОЦІАЛЬНОЕКОНОМІЧНОГО ПРОФІЛЮ 13.00.02 – теорія та методика навчання та виховання (фізика) АВТОРЕФЕРАТ дисертації на здобуття вченої педагогічних наукЧелябінськ - 2008 Робота виконана на кафедрі теорії та методики навчання фізики державної освітньої установи вищої професійної освіти Стерлітамакська державна педагогічна академія Науковий керівник: доктор...»

Спеціальність ВАК РФ05.13.11
Кількість сторінок 382

Дисертація додати до кошика 500p

ПОНЯТТЯ ТА ПРОБЛЕМИ

1.1. Основні підходи до проблеми компресії зображень

1.1.1. Математична модель дискретного зображення

1.1.2. Міра помилки відновлення зображень

1.1.3. Вихідні ідеї методів компресії статичних зображень

1.1.4. Варіант JPEG, що базується на застосуванні ДКП

1.1.5. Проблема вибору базисів розкладання

1.2. Використання вейвлет-перетворень для компресії статичних зображень

1.2.1. Основні поняття, визначення, специфіка вейвлет-перетворень

1.2.2. Двовимірні вейвлет-перетворення

1.2.3. Основні ідеї сучасних алгоритмів вейвлет-компресії зображень

1.3. Особливості обробки відеопослідовностей

1.4. Загальна постановка задачі оптимізації кодування із втратами

Введення дисертації (частина автореферату) на тему "Математичні методи та алгоритми цифрової компресії зображень з використанням ортогональних перетворень"

Проблеми, пов'язані зі зберіганням, обробкою та передачею зорових образів (зображень), супроводжували людство протягом усієї його історії. Поява телебачення безпосередньо пов'язало завдання обробки зображень із завданнями обробки електричних сигналів, а розвиток цифрової електроніки призвело до того, що перехід від аналогових форм подання сигналів до цифрових став характерною рисою сучасних електронних систем. У зв'язку з цим питання цифрової обробки зображень (ЦОІ) набувають сьогодні особливої актуальності.

Дискретне чорно-біле напівтонове зображення можна задати деякою матрицею, елементи якої (точки зображення, також звані пікселями) являють собою отримані в результаті деякої просторової дискретизації відліки функції, що описує розподіл яскравості на безперервному зображенні. Цифровим зображенням називатимемо матрицю, отриману в результаті квантування поелементного (з кінцевим числом рівнів) значень відліків дискретного зображення. Для опису кольорового зображення (дискретного або цифрового) потрібно вже три матриці, що відповідають трьом компонентам яскравості в обраному колірному просторі, наприклад RGB (red, green, blue). Опис зображення у вигляді матриць яскравості будемо називати безпосереднім уявленням.

Обробка, зберігання, передача цифрових зображень за безпосереднього представлення вимагають колосальних обсягів даних. Так, наприклад, для запису одного кадру високоякісного кольорового зображення розміром 1024x1024 точки, при кодуванні кожного відліку 24 бітами (8 біт на колірну компоненту), потрібно 3 мегабайта даних. Звичайно, при перегляді відеороликів допустима менша роздільна здатність екрану, проте, для демонстрації цифрового відеофільму в реальному масштабі часу необхідна передача даних зі швидкістю близько 160 мегабіт/с. Сказане пояснює той величезний інтерес, який проявляється у всьому світі до пошуків шляхів ефективного кодування зображень.

Вже на початку розвитку цифрових методів обробки зображень (кінець п'ятдесятих - початок шістдесятих років) надмірність безпосереднього представлення зображень була очевидною, проте найпростіші способи, що застосовувалися для стиснення даних, такі як диференціальна імпульсно-кодова модуляція з наступним статистичним кодуванням, давали більш ніж скромний. Постановка питання застосування частотних методів для стиснення зображень стала можливою завдяки появі у 1965 року роботи Кулі і Тьюки , що містила опис алгоритму швидкого обчислення дискретного перетворення Фур'є (ДПФ). Ідею заміни зображення як безпосереднього об'єкта кодування відліками його двовимірного спектру ДПФ було висунуто 1968 року. Кодування за допомогою використання ДПФ ґрунтується на тому, що для більшості зображень природного походженняЗначення багатьох коефіцієнтів ДПФ порівняно малі. Такі коефіцієнти можна часто взагалі відкинути, або відвести з їхньої кодування малу кількість біт, без ризику внести значні спотворення. В 1969 Претт, Ендрюс і Кейн запропонували використовувати для кодування зображень замість перетворення Фур'є перетворення Адамара , що в багатьох практичних випадках дозволяє значно зменшити обсяг необхідних обчислень. Після цього було здійснено дослідження щодо застосування для кодування зображень дискретних перетворень Карунена-Лоева і Хаара. Перетворення Карунена-Лоева є оптимальним у тому сенсі, що забезпечує мінімальну середньоквадратичну помилку кодування при відкиданні частини коефіцієнтів-трансформант, проте вимагає, на жаль, знання статистичних характеристик зображень, що обробляються, і не має швидкого алгоритму обчислення ; перетворення

Хаара, навпаки, характеризується дуже ефективним алгоритмом обчислення, але дає, зазвичай, порівняно велику похибку кодування . У 1971 році Шибата та Еномото запропонували спеціально для використання в кодуванні зображень так зване похилий перетворення векторів з 4-х або 8-ми компонентів. Незабаром після цього Претт, Чен та Уїлч розробили узагальнений алгоритм похилого перетворення векторів великої довжини та двовимірних масивів.

Всі переваги кодування зображень з використанням ортогональних перетворень випливають з особливостей розподілу енергії серед елементів-трансформант - завдяки цьому узагальнений двовимірний спектр1 більш зручний для кодування, ніж зображення у вихідному поданні . Внаслідок значних кореляційних зв'язків між елементами зображення природної природи основна енергія в дискретному спектрі має тенденцію концентруватись у відносно невеликій кількості відліків, що відповідають повільно осцилюючим базовим функціям. Тому, без істотної шкоди для подальшого відновлення зображення, малі за величиною спектральні коефіцієнти можна взагалі обнулити, а елементи спектру, що залишилися, оцифрувати (проквантувати і закодувати). Тут доречно відзначити, що використання алгоритмів стиснення з втратами даних для реальних зображень фотографічного характеру (тобто напівтонових) носить принциповий характер, оскільки, припустившись деякої помилки у відновленому зображенні, можна досягти набагато більш високого рівня стиснення даних. Помилка може бути настільки мала, що не сприйматиметься людським оком. Крім того, зображення, отримані

1 Скрізь термін спектр ми розумітимемо узагальнено, як результат унітарного перетворення (не обов'язково по ДПФ) одномірного або двовимірного набору даних. сканером або цифровим пристроємвідеовводу, неминуче мають шумову складову, точне збереження якої при кодуванні не має сенсу.

Як показано Ахмедом та ін., У застосуванні до кодування зображень, для яких підходить марківська статистична модель, дискретне косинусне перетворення (ДКП), що має швидкий алгоритм обчислень, наближається за ефективністю спектрального представлення даних до перетворення Карунена-Лоева (див. також ). Цей факт став причиною того, що саме ДКП послужило основою при розробці стандарту стиснення нерухомих зображень JPEG. Зазначений стандарт став плодом багаторічних зусиль. колективу фахівців, утвореного у 1987 році з представників двох авторитетних міжнародних організацій: ISO та ITU. Поява об'єднаної групи JPEG була викликана зростанням кількості розробників і користувачів різних систем ЦОІ і уніфікації формату стисненого представлення цифрових зображень, що випливала з цього. Вироблена в результаті специфікація стала документом, якого сьогодні дотримуються майже всі розробники програмних систем ЦОІ загального призначення. З 1994 року виробляються спеціалізовані мікросхеми, що реалізують стиснення та відновлення по JPEG апаратно та забезпечують обробку кольорових зображень у реальному масштабі часу (480x640 пікселів, 30 кадрів/с). З точки зору досяжного рівня стиснення, варіант JPEG, заснований на використанні ДКП, не є найкращим серед існуючих методів ефективного кодування зображень. Так, методи, що базуються на використанні вейвлет-перетворень2 можуть забезпечити значно вищі рівні стиснення - з цієї причини в розширеному стандарті JPEG2000,

У вітчизняній літературі замість прямого перекладу слова wavelet часто використовується також термін сплеск. існуючим у вигляді попередньої (draft) специфікації з 2000 року3 вже передбачена можливість застосування вейвлет-перетворень. Однак говорити про те, що стиснення зображень з використанням ДКП себе повністю виживає, на сьогоднішній день передчасно, оскільки порівняно з вейвлет-перетвореннями обчислювальні витрати, необхідні для реалізації ДКП, набагато менші. Більш докладний огляд сучасних методів компресії зображень і відмінностей у підходах, що використовуються, буде дано в розділі 1 цієї роботи.

Важливість проблеми компресії даних при обробці зображень важко переоцінити - досить проаналізувати зростання кількості відповідних публікацій, що спостерігається в останнє десятиліття. Так, значну частину змісту щомісячного журналу IEEE Transactions on Image Processing, що видається з 1992 року, становлять статті, присвячені саме цій темі. Не можна не помітити також і той факт, що алгоритми стиснення зображень і теорія, що лежить в їх основі, розробляються в основному за кордоном, перш за все, в США. Звичайно, говорити про відсутність вітчизняних робіт у цій галузі не можна, проте необхідність значного розширення російського фронту досліджень не викликає жодних сумнівів.

Складність алгоритмів, що використовуються для компресії зображень, неухильно зростає - це стосується не тільки обсягу обчислень, а й ідейних основ побудови алгоритмів: у їхньому фундаменті складним чином переплітаються функціональний аналіз, теорія ймовірностей, теорія інформації, дискретна математика та алгебра. Разом з тим завдання ставляться практикою, що вимагає при їх вирішенні неухильної та постійної уваги до можливостей реальної апаратури.

3 2 січня 2001 року частина 1 «JPEG 2000 Image Compression System: Part I Core Coding System» остаточно затверджена для прийняття офіційним міжнародним стандартом ISO/IEC 15444-1.

Таким чином, завдання дисертаційної роботи було визначено як дослідження теоретичних питань ефективного кодування зображень з використанням ортогональних перетворень та розробка відповідних алгоритмів стиснення, придатних для практичного застосування на базі універсальних обчислювальних засобів загального призначення. Новизна роботи визначається вперше запропонованими для вирішення поставленого завдання алгоритмами та методами, що виносяться на захист (див. нижче). Актуальність обумовлена прикладною спрямованістю роботи та винятковою важливістю проблеми стиснення даних у ЦОІ.

У першому розділі дисертації наводяться необхідні для подальшого викладу попередні відомості, надається короткий огляд та класифікація основних підходів до реалізації ефективного кодування зображень. Використання алгоритмів стиснення із втратами даних для напівтонових зображень носить повсюдний характер: припустившись наявності помилки у відновленому зображенні, можна досягти набагато вищого рівня компресії даних. Найчастіше якість обробки зображень прийнято оцінювати за середньоквадратичною помилкою (СКО):

СКО = X у) 2 > де ~ матриця вихідного зображення, Л

Х = (х/у) - матриця зображення, отриманого після обробки (стиснення та відновлення даних). Для логарифмічної величини СКО використовується загальноприйнятий захід PSNR (peak signal to noise ratio)

255 значення сигналу до шуму), PSNR = 201g-[дБ].

Методи стиснення зображень зручно розглядати як загальної схеми, що з трьох основних етапів: зниження міжелементної кореляції даних, квантування елементів даних, статистичне кодування. Квантування є основним прийомом стискування із втратами. По суті справи,

N-1M-1 квантування є виділення з вхідних даних деякої основної частини інформації, коли її менша частина опускається. Застосовується як скалярне, і векторне квантування. У скалярному випадку елементи набору даних, що обробляється, квантуються незалежно один від одного.

Переведення зображення в узагальнену спектральну область за допомогою деякого лінійного перетворення може значно знизити міжелементну кореляцію в матриці-трансформанті У=77(Х) в порівнянні з кореляцією елементів в матриці дискретного зображення X. Тоді незалежне покомпонентне кодування вектора У, а не вектора X, стає ефективнішим. Можна також дати енергетичне трактування мети використання перетворень, яка в такому розумінні полягає в концентрації максимальної частини енергії вихідного дискретного сигналу (матриці X) мінімальної кількості спектральних коефіцієнтів (елементів матриці У). Між розподілом енергії в узагальненому спектрі і властивостями перетворень, що декорують, є певний зв'язок. Вивчення ефективності властивостей, що декорують, таким чином, є важливим завданням при виборі перетворення для застосування в схемі компресії.

Реальні фотографічні зображення є двовимірними сигналами, що мають неоднорідності (особливості) на областях контурів об'єктів, тому базис функцій, що використовуються для розкладання, повинен мати хорошу локалізацію в області зображення. Однак у фонових областях зображення може розглядатися як реалізація стаціонарного сигналу, що робить переважним використання для розкладання частотно-локалізованого базису (відомо, що коефіцієнти тригонометричного розкладання стаціонарного сигналу некорельовані). Домогтися одночасно високої роздільної здатності в частотній і в часовій областях неможливо через принцип невизначеності Гейзенберга.

Можливим виходом є використання функціональних базисів вейвлетів (сплесків), які мають змінну час-частотну роздільну здатність. Підходи, пов'язані з використанням сплесків, на сьогоднішній день є домінуючими в обробці нерухомих зображень, поступово витісняючи традиційний інструмент декореляції – дискретне косинусне перетворення (ДКП).

У першому розділі наголошується, що для оптимізації алгоритмів стиснення даних із втратами часто використовується підхід, заснований на мінімізації RD-функції Лагранжа. Нехай X - деякий вхідний набір даних, якому в результаті виконання процедури стиснення-відновлення ставиться у відповідність< выходной набор данных той же природы, Y=F(X,и), где u=(u\,.,un) - набор управляющих параметров алгоритма сжатия F. СчитаемX, Y элементами некоторого пространства Q с метрикой D(X, Y), множество всех возможных значений управляющего вектора и обозначим U. Задача оптимизации кодирования состоит в том, чтобы для заданного набора входных данных X и максимально допустимых битовых затрат Rb найти такие параметры и* = (щ,.,и*п) алгоритма F, чтобы ошибка кодирования данных D(X,Y)=D(X,F(X,\i)) принимала бы минимальное значение. То есть

D(X,F(X, u)) = D(X, u) = minZ)(X,u), asU(0.1)

Пошук розв'язання задачі (0.1) у більшості випадків зводиться до громіздких чисельних процедур ітераційного характеру. Якщо не задаватися обмеженням R(X,u)

У першому розділі також коротко відзначаються особливості, пов'язані з обробкою (стисненням-відновленням) динамічних зображень. Основним перетворенням, що використовується для відеокомпресії, поки залишається ДКП, як більш просте в плані обсягу обчислень в порівнянні з вейвлет-перетвореннями. Як і статичної компресії, алгоритми кодування відео найчастіше є складнішими проти алгоритмами декодування. Реалізація програмної компресії відео в реальному масштабі часу таким чином накладає суттєві обмеження на допустиму складність обчислень.

Другий розділ присвячений вивченню методів теоретичного аналізу декорелюючої ефективності перетворень, призначених для використання в стиску даних. Запропоновано новий метод, який ґрунтується на оцінці величини безумовної ентропії коефіцієнтів перетворення та спирається на наступні міркування. Нехай відома матриця Кваріаційна Кх вихідного вектора даних

Х = (х0,л;1,.,д:Дг1)г, вектор-спектр У отриманий в результаті деякого ортогонального перетворення з матрицею У=ЛУХ. Опускаючи викладки, середню безумовну ентропію коефіцієнтів вектор-спектру можемо записати:

Нср = - X | /к (щ, х)\про%/к (тк,ок,х)4х =

0.3) Л к=0 к=0 функція щільності розподілу ймовірностей для

1 Аг-1 1 1\-11 1

Л°(х)1о/Лх>/х; 1 лг де /к(ткоьх) спектральної характеристики ук (Аг-ой компоненти вектора У), /і^-математичне очікування, ок - середньоквадратичне відхилення, /к(х) = Чим менше середня ентропія (0.3), тим ефективніше буде наступне незалежне кодування компонентів спектра.

Як критерій декорелюючої ефективності пропонується розглядати отриману з формули (0.3) в результаті певних перетворень величину середньої надмірної ентропії, яка виражається через елементи матриць Кх = (соу(хг., г і = (і;,., ^Т1,.) наступним чином :

1\ ^ ае1^х к = 0 у- = 0 ^

Величина (0.4) неотрицательна, причому що більше її значення, тим нижче ефективність декоррелирующего перетворення з матрицею Численні розрахунки величини (0.4) щодо різноманітних перетворень і видів коваріаційних матриць показали результати, що повністю узгоджуються з відомими даними .

N-2 рК-1 рМ-2

Ця модель часто використовується і для опису міжрядкової та міжстовпцевої кореляції в дискретних зображеннях. При р=1, коли усі компоненти у вихідному векторі X однакові (для будь-яких двох відліків вектора коефіцієнт кореляції дорівнює одиниці), розрахунок введеного критерію (0.4) для матриці (0.5) неможливий, т.к. у цьому випадку маємо<ЫКХ = 0. Вместе с тем, на фоновых областях изображения р->1. У розділі 2 доводиться така теорема.

Теорема 2.1. Для будь-якої ортогональної матриці (Л/х/У) такий, що

V/ = ОД,. ,ЛГ -1: >у0. = -(базисна функція з нульовим індексом є лА/У нормована постійна складова) та коварійної матриці (0.5) лм/ 2 N-1 N-1

1іпДЯ(\У,Кх)= - \о%

Різні дослідження, у тому числі проведені в розділі 2, показують, що серед дискретних перетворень, що мають швидкі алгоритми обчислень (для розмірності N арифметичних операцій, що реалізуються за -Шо^Ы) найбільш близькі до оптимального перетворення Карунена-Лоева характеристики декореляції для марківського процесу (0.5 ) дає використання ДКП. Незважаючи на наявність добре опрацьованих швидких алгоритмів обчислення, ДКП принципово вимагає для реалізації виконання операцій множення і за обсягом обчислень помітно поступається, наприклад, перетворенням Хаара, Уолша, Крестенсона-Леві. p align="justify"> Окремим питанням, розгляду якого приділено значну увагу в розділі 2, є побудова (синтез) нового перетворення, що має як високі характеристики декореляції для моделі (0.5), так і значно швидші, ніж для ДКП, алгоритми обчислення. Отримане в результаті дискретне псевдокосинусне перетворення (ДПКП) визначено для векторів такої розмірності А, для якої можливе розкладання N = N1. -Ип, причому У до (2,3,4). Тоді матриця ДПКП (у разі нижній індекс свідчить про розмірність перетворення) будується як пряме (тензорне) твір елементарних матриць ДПКП (\¥2,\¥з,\У4): = \¥Лг1 ®. ® \Ул,п, причому елементарні матриці ортогональні і являють собою отримані в результаті певних модифікацій матриці ДКП відповідної розмірності4. Елементарні матриці представлені у вигляді добутку деякої діагональної матриці Б на матрицю С, а структура дозволяє реалізувати множення на довільний вектор і, СІ, тільки за допомогою операцій складання і віднімання чисел.

З властивостей тензорного твору випливає уявлення = ОдгСд, де діагональна матриця ®, а матриця

Див =Сщ ®.®Сип. Структури матриць С2, С3, С4, В2, Б3, Б4 наводяться в розділі 2. Таким чином, реалізація ДПКП У = Уд, Х = Б^С^Х полягає в реалізації множення матриці См на вектор, У = С^Х, і подальшому нормуванні отриманого вектора У: У = Б^У. Для обчислення ДПКП зручно використовувати швидкі алгоритми, засновані на факторизованому поданні для матриці Оу у вигляді твору слабозаповнених матриць5: Сдг = ТдГ] ТдГ~1) ■.■ ТдР, де Т#> =1^ ^ 1„м «. »1^,

1дг. - Поодинока матриця розмірності ТУ. хА/" -. Оскільки матриці Тд/)

J J J складаються з певним чином розріджених матриць-блоків, множення матриці Тд/) на вектор також зводиться тільки до операцій складання та віднімання чисел. Швидкі алгоритми зворотного ДПКП будуються

4 Під тензорним (прямим) добутком матриць (/=0,.,7]-1; т= 0,.,А-1) і О^^) (к-0,., у-1; 7=0, .,/¿-1) розуміємо матрицю

8=В®С=К/))= . ,а = 0Х., щ- \, р = 0Х., 1йг \.

5 Для обґрунтування справедливості цього подання див. с.84-85 з монографії. аналогічно, т.к. в силу ортогональності ДПКП:

Зазначимо, що необхідне при обчисленні ДГШП та зворотного ДПКП нормування (множення на матрицю Ду) для схеми стиснення зі скалярним квантуванням коефіцієнтів перетворення не тягне за собою ускладнення обчислень . Нормування може бути об'єднане при стисканні даних з етапом скалярного квантування у^ - гоіпс1(у7/с() шляхом вибору для кожного елемента у. перетвореного індивідуального кроку квантування qj=qldjj (де

Елемент діагональної нормувальної матриці Б^). При відновленні вектора У~ У, у ту ■, множники для елементів у ^ слід вибирати також індивідуально, у вигляді

Як показав теоретичний аналіз, для моделі (0.5) ДПКП має більшу ефективність декореляції в порівнянні з іншими швидкими перетвореннями, реалізація яких також зводиться тільки до операцій складання та віднімання чисел.

Третій розділ присвячено вивченню питань застосування для стиснення зображень дискретного перетворення Крестенсона-Леві (ДПКЛ) та є розвитком досліджень кандидатської роботи автора.

Система функцій Крестенсона-Леві (хт на напівінтервалі хе = і(Л О на діагоналі матриці розмірності рпхрп знаходяться р матриць розміру рпЛхрпЛ інші елементи матриці - нульові). Матриця п) =(Щк) (,Д=0,1,.,/ -1) має такий вигляд: м>м = ч ди"к~1, де кх=к(то&р), ]п =[¡1 рп~1\то&р), ^=ехр(-2т/р), 8 ™ = \ Прит ( . 0, при т. Ф 7

Дискретні (цифрові) напівтонові зображення описуються у вигляді речової матриці X. При обробці речових векторів (матриць) спектр ДПКЛ розпадається на пари комплексно сполучених елементів, тому частину елементів спектра можна не обчислювати. Облік цих особливостей дозволив запропонувати для обробки речових масивів алгоритми ДПКЛ та зворотного ДПКЛ з неповним обчисленням. При обробці речових наборів даних можливе також застосування суміщених перетворень, аналогічно тому, як це робиться при обчисленнях дискретного перетворення Фур'є. При цьому з двох речових векторів X та X2 формують комплексний вектор Х=Х1+/Х2 та виконують перетворення.

Якщо використовувати комплексних чисел г=хНу подання у базисі (1 г=а+Рд е~2л"/3), то обчислення ДПКЛ (при р= 3) може бути виконано без використання операцій множення (нормуючий множник

1/4р", див. (0.7) - не враховується), за допомогою операцій складання та віднімання (даний факт встановлений А.В.Єфімовим). Використання в алгоритмах з неповним обчисленням базису (1,д) тягне за собою ряд особливостей, які розглядаються в розділі 3. При розмірності матриці зображення ЗпхЗг обчислення ДПКЛ або зворотного ДПКЛ за алгоритмами з неповним обчисленням вимагає виконання 7(п+г)-3"+г"1 операцій складання (віднімання), операції множення та поділу не використовуються. базису (1,<7) в вычислительном плане является более эффективным и для алгоритмов совмещенных вычислений. Специфика, которую налагает использование ДПКЛ и базиса (1,#), а также необходимые для реализации совмещённых ДПКЛ и обратного ДПКЛ формулы , получены в главе 3.

Для обробки нерухомих зображень у кандидатській роботі автора було запропоновано алгоритм компресії, в якому вихідне зображення розбивається для обробки на елементарні фрагменти X, 9x9 пікселів, і кожна матриця-фрагмент обробляється за допомогою ДПКЛ (за алгоритмом з неповним обчисленням). У розділі 3 наведено короткий опис алгоритму компресії, який підтвердив обґрунтованість використання дискретного перетворення Крестенсона-Леві для стиснення зображень. Характер помилок, що вносяться в процесі стиснення-відновлення, різний для заснованого на ДКП методу JPEG і для запропонованої схеми: при використанні JPEG має місце "розмивання", в той час як нова схема стиснення призводить до "зубчастості" зображення. Тим не менш, суб'єктивне якість сприйняття при використанні обох розглянутих способів стиснення приблизно однаково. Оцінки величини спотворень за величиною PSNR, виконані для низки тестових зображень розмірності 720x504=362880 точок, також дали близькі результати: для одних зображень може спостерігатися незначна перевага заснованого на ДКП стандарту JPEG, для інших зображень найкраща якість відновлення можлива при використанні нового методу. Відмінності невеликі, особливо при низьких рівнях стиснення. Оцінки обчислювальних витрат показують, що алгоритм на основі ДПКЛ не поступається JPEG і частини, що стосується обчислювальної складності реалізації. Алгоритм компресії зображень, що використовує ДПКЛ і має порівняні з JPEG характеристики, є результатом, вперше отриманим автором.

У четвертому розділі розглядаються питання розробки схем стиснення, що використовують пофрагментну обробку зображень. Зазвичай для подібних схем найефективнішим є використання ДКП, тому вивченню його властивостей, необхідні побудови алгоритмів компресії, присвячена значна частина четвертої глави. Т.к. двовимірне ДКП є роздільним перетворенням (зводиться до одновимірним перетворенням вздовж рядків і вздовж стовпців оброблюваної матриці), то багато властивостей двовимірного ДКП випливають із властивостей одновимірного.

Для коефіцієнтів одновимірного ДКП, що визначається формулою, отримано наступне співвідношення (Ь*Ю): кк (0.8) вт- #

2И де А/=ху-Ху 1 - перші різниці відліків вихідного вектора даних Х = (л; 0, д: 1,., л: лг1) Т. Формула (0.8) показує, що різниці А,- мають різний характер впливу спектр ДКП. Так, різниця Аш-хш-х^/2-\ (при парному IV) входить у всі коефіцієнти у2ш з максимальними за модулем (поодинокими) вагами. Різниця між відліками х0 і взагалі не входить у (0.8), що принципово відрізняє ДКП від його «прабатька» - дискретного перетворення Фур'є, амплітудний спектр якого інваріантний до циклічних зрушень (х0->х)->.->Хл>-1- >*о) компонент вектора даних X.

У припущенні некорелюваності різниць6 А; і рівності нулю їх математичних очікувань Е(А/)=0 досліджувалися також імовірнісні оцінки, зокрема величина сумарної дисперсії змінних складових спектра ДКП: Е - ¿,0(ук). Ця сума надається через к= 1 дисперсії перших різниць вектора даних наступним чином: Е = -^ | S (j) D (Aj), де ¿"(у) - деякий ваговий коефіцієнт. Доведена

Теорема 4.1: для коефіцієнтів $(/) правильне співвідношення: Ця теорема знову підтверджує, що і для ймовірнісної моделі вектора X різниця Ат (в даному випадку, її дисперсія) робить найбільший внесок. Чим ближче номер різниці до N/2, тим більше значення ваги £(/") і тим більший внесок вносить різницю А в енергію змінних складових. Дослідження спектрів ДКП для деяких характерних

6 Для марківської моделі (0.5) це припущення неправильне. сигналів також підтвердило, що при використанні прийомів кодування спектрів з JPEG (зокрема кодування серій нулів - run-length encoding) ефективність кодування погіршуватиметься у випадку, коли інформаційна насиченість дискретного сигналу буде припадати на центральні відліки вектора.

Крім вивчення загальних властивостей ДКП, у четвертому розділі досліджується можливість оптимізації кодування за схемою JPEG, що зберігає формат вихідних даних. У розвиток ідей роботи Crouse-Ramchandran запропоновано алгоритм , що здійснює додаткову оптимізацію скалярного квантування коефіцієнтів ДКП, що тягне за собою деяке підвищення характеристик стиснення за стандартом JPEG за рахунок малого ускладнення процедури оптимізації.

Для стиснення статичних зображень з використанням ДКП 8x8 у четвертому розділі розроблено новий алгоритм, який відрізняється від JPEG етапом ентропійного кодування, для якого використовується кілька статистичних моделей та алгоритм багатопотокового арифметичного кодування. Вибір моделі провадиться певним чином за контекстом вже оброблених даних. Запропонований алгоритм арифметичного контекстного кодування коефіцієнтів ДКП підвищує стиснення даних на 10% порівняно зі стандартною схемою JPEG (еталоном служила програма JPEG Optimizer™ v.4.0, див. http://xat.com).

Значну увагу у четвертому розділі приділено вивченню загальних теоретичних та практичних аспектів застосування векторного квантування (ВК) для компресії зображень у галузі перетворень, не обов'язково з використанням ДКП. Для цього спектри фрагментів зображення необхідно розбити на певні зони, кожна з яких відповідає окремому потоку даних, що піддається ВК. Сформулюємо зад^ту розбиття корелированного набору даних, який представимо у вигляді вектора Y, на кластери (класи) . Вихідними параметрами є коваріаційна матриця Ку вектора У та обмеження на максимальну невизначеність (ентропію) НтаХ для кожного кластера у розбиття. Потрібно знайти таке розбиття безлічі випадкових компонентів У=(70,.,ГЛг1) на підмножини

У(А) = ^„.„У^], к=1,.,М, щоб:

Ъ*"^ . (О,) я(у^)квазіоптимальних способу : алгоритм «Вирощування кластерів» і алгоритм «Виділення сильних зв'язків». Обидва запропоновані способи чисельного пошуку рішення (0.9) засновані на мінімізації ентропії міжкластерних зв'язків

Нсв(\а\.,\(м)) = ^Н(\(к))-Н(У). Ближчі до оптимального к=1 задовольняє (0.9)) розбиття показав другий з названих алгоритмів.

На закінчення, у четвертому розділі запропонована загальна схема компресії, що використовує адаптивне ЫЭ-оптимизированное ВК області спектрів фрагментів зображення. Тобто. формалізовано загальну схему стиснення статичних зображень з використанням векторного квантування в області ортогональних перетворень, орієнтовану на пофрагментну обробку зображення.

П'ята глава присвячена вивченню та розробці алгоритмів компресії нерухомих зображень у галузі вейвлет-перетворень. Нехай тепер

W = позначає матрицю дискретного вейвлет-спектру, отриману в результаті двовимірного л-крокового вейвлет-перетворення матриці дискретного зображення. Кількість кроків вейвлет-перетворення визначає число частотних рівнів у спектрі, для кроків маємо л+1 рівень. При цьому коефіцієнти вейвлет-розкладання можна впорядкувати у вигляді сукупності деревоподібних структур (7), корінням яких є елементи, що лежать у низькочастотному діапазоні спектру (саббенді), див. малюнок. Подібне упорядкування визначає для вейвлет-коефіцієнтів (вузлів дерева) зв'язку виду «батько-нащадки». Ідейні основи розробленого алгоритму стиснення сягають корінням у роботи Lewis-Knowles і Xiong-Ramchandran-Orchard; при цьому основне завдання, яке стоїть перед алгоритмом компресії, полягає в пошуку RD-оптимальної топології (тобто структури S, яка виходить після підрізування гілок вихідного дерева Т), що мінімізує функцію Лагранжа для фіксованого значення Я: J(S*) = тт [Д£) + ЯR(S)].

Ідея, яка сягає роботи і в тому ж вигляді використовується в , полягає в наступному: чим більша абсолютна величина вейвлеткоэффициента I wj (або енергія, wf) вузла-батька /, тим менш імовірна поява у даного вузла нульової (тобто підрізаної) ) гілки, що слід використовувати для кодування топології дерева S. Більш точне передбачення появи нульової гілки можна скласти, якщо використовувати як прогнозну величину Р, суму, що включає в себе, крім wf, також квадрати значень вейвлет-коефіцієнтів, сусідніх у саббенді до вузла i. Проведені в розділі 5 експериментальні дослідження статистичних залежностей показали доцільність використання для прогнозної величини Р(виваженої суми з абсолютних значень коефіцієнтів-сусідів.) Необхідні значення вагових множників були встановлені в результаті статистичної обробки вейвлет-спектрів реальних фотографічних зображень Для кодування топології «підрізаного» дерева £ кожному вузлу г дерева приписується ознака наявності (гц = 0) або відсутності (пг-1) в даному вузлі підрізаної гілки.Встановлено, що для підвищення ефективності статистичного кодування топології ) слід певним чином групувати в нові елементи даних (Ту,) Останні піддаються адаптивному арифметичному кодуванню, причому використовується кілька статистичних моделей, контекстне (тобто за вже закодованими даними) правило вибору моделі задається певним чином за прогнозними величинами (Т5,- ).

Для кодування скалярно проквантованих вейвлет-коефіцієнтів, які не потрапили в нульові (підрізані) гілки, також використовують декілька статистичних моделей. Запропоноване правило контекстного вибору моделей враховує як значення прогнозної величини Р(вузла-батька, так і значення вейвлет-коефіцієнтів сусідніх вузлів, які знаходяться в тому ж саббенді, поряд з оброблюваним, але вже закодовані). Wj = XQш \ ^ (Wjlд), відповідного вузлу у дерева Б, здійснюється за величиною л, = 0.36Р н-1.0б (1 У

М?; ]<1 где ]у - узел-сосед по вертикали, х - узел-сосед по горизонтали,/^ - узел-сосед по диагонали. Значения весовых множителей, фигурирующие в прогнозной величине зу, были получены в результате экспериментов по обработке реальных изображений.

Порівняння результатів, отриманих в експериментах обробки реальних зображень, з результатами застосування інших відомих алгоритмів вейвлет-компресії зображень показує, що запропонований алгоритм має дуже високі показники. Так, для відомого тестового зображення Lena при рівні стиснення 0.5 біт піксель (16 разів) помилка PSNR=37.66 дБ.

Завершальні дослідження глави 5 відносяться до побудови гібридної схеми кодування вейвлет-спектру, коли на додаток до описаного вище способу підрізання гілок вейвлет-коефіцієнтів допускається також можливість векторного «самоквантування» гілок, яке може трактуватися як фрактальне кодування в області вейвлет-перетворень наприклад, ). Отриманий у результаті гібридний алгоритм вимагає значно більшого обсягу обчислень, проте фрактальна складова кодування при цьому виявилася практично повністю пригніченою базовою схемою вейвлет-компресії, заснованої на підрізуванні гілок. Необхідно відзначити, однак, що «змичка» підходів у гібридному алгоритмі була зроблена нескладним способом і можливості подальшого розвитку залишають тут широке поле для досліджень.

Шоста глава присвячена дослідженню алгоритмів стиснення динамічних зображень з метою побудови схеми відеокомпресії, придатної для програмної реалізації в реальному масштабі часу на базі персональних комп'ютерів.

Кадром відеопослідовності називаємо матрицю пікселів з Mi рядків і М2 стовпців: B=(bkj), А:=0,1,.,МГ1, /=0,1,.,М2-1, а під терміном відеопослідовність розуміємо впорядкований набір кадрів В0 ,! * 1,. , Вг,. Назвемо (у, х)-блоком кадру (у, х-цілочисленні координати) деяку підматрицю BytX=(bkii), де k=y,y+\,.y+Ni-\, 1=х>х+\,. у+ИгА. У розробленому алгоритмі кожен кадр відеопослідовності розбивається при обробці на суміжні матриці-блоки (BWj) розміром 8x8, т,п=0,8,16. Якщо будь-який блок відеопослідовності виявився у певному сенсі «схожий» на оригінальний блок Вт, вважаємо, що блок В1т>п - це переміщений фрагмент B^J попереднього кадру, і для кодування (т,п)блоку зображення достатньо задати координати блоку в попередньому кадрі, у них, або зміни координат у-т і х-п. як новий. Такої ідеології випливають сучасні міжнародні стандарти відеокомпресії MPEG, Н.261-Н263, причому всі вони спираються також на використання ДКП для кодування нових блоків.

Розробка нового алгоритму відеокомпресії проводилась у рамках загального підходу до RD-оптимізації стиснення із втратами. У розробленому алгоритмі вибору способу кодування чергового оброблюваного блоку В1т п керуємося критерієм мінімуму функції Лагранжа для блоку: J(b)-D(b)+?iR(b). Припустимо, що аргумент Ъ=0 відповідає кодуванню переміщеного (нерухомого) блоку, а ¿=1 - нового. Тоді якщо J(l)>/(0), то блок кодується як переміщений, і як новий - інакше.

При використанні RD-оптимізації завдання пошуку переміщених блоків формулюється в такий спосіб . Для заданого (т, я)-блоку В1т п ¿-ого кадру знайти в попередньому відновленому кадрі такий (у,х)-блок л., щоб мінімальне значення набувала RD-функція Лагранжа

Щу-т,х-п) = mintein-B^ +AK(w-m,v-n)l (0.10) tt,v)e£2 і " "

В-В т, п у, х

Тут враховано, що координати знайденого блоку кодуватимуться як відносні, тобто. вектором переміщень г=(у-т,х-п).) Гарантовано знайти мінімум (0.10) можливо лише при повному переборі елементів (і,у)е£1, а для того, щоб алгоритм пошуку можна було реалізувати в реальному масштабі часу , Як область Про необхідно розглядати лише точки (у, і), досить близько розташовані до точки (т, п). Підвищення ефективності пошуку за рахунок розширення області С2 досягається застосуванням різних алгоритмів спрямованого пошуку, орієнтованих на мінімізацію помилки уявлення переміщеного блоку ||в"га>п, що відповідає окремому випадку (0.11) при Я = 0. Алгоритми спрямованого пошуку знаходять мінімум (0.11) приблизно, проте за рахунок істотного розширення області пошуку зазвичай дозволяють знайти більшу кількість переміщених блоків, при аналогічній повному перебору складності.

У шостому розділі запропоновано новий алгоритм спрямованого пошуку переміщеного блоку , орієнтований на наближене рішення задачі (0.10) для довільного значення X. Відмінною особливістю запропонованого алгоритму і те, що малі переміщення блоків зображення шукаються точніше , т.к. повинні суворо відстежуватися через специфіку візуального сприйняття. Для підвищення ефективності отриманого в розділі 6 алгоритму пошуку для вектора переміщення (А,АХ) блоку, що обробляється, слід будувати прогноз по векторам переміщення (д^Л^) і (д*Д) двох вже оброблених «сусідів» (відповідно сусіда по вертикалі і сусіда по горизонталі). Власне прогноз - це відносні координати (у0, * 0), які визначають перенесення центру області пошуку: з точки (т, п) до точки (ш, п) = (т + у0, п + х °). Експериментально підтверджено, що кількість нових блоків зображення скорочується на 5.25%, якщо прийняти наступне правило складання прогнозу:

0,0), обидва сусідні блоки - нові

Д^Д^), по горизонталі - новий, по вертикалі - переміщений (Ану, Акх), по горизонталі - переміщений, по вертикалі - новий ((д; , ДУХ) + (ТАК, ДАХ),) / 2, обидва сусіди - переміщені блоки

Наслідуючи ідеологію стандарту MPEG, у розробленій схемі компресії обробка нових блоків також здійснюється за допомогою квантування з наступним статистичним кодуванням коефіцієнтів двовимірного ДКП. Результат ДКП блоку Ось>і позначимо S, S=F(BW>„). Також позначимо: Se=fe;/=round(5M/^i;))^=0, Q = кД/=0 - одна з матриць квантування JPEG. Для статистичного кодування матриці S застосований алгоритм контекстного кодування, запропонований у розділі 4, який введений додатковий етап RD-оптимізації. Нехай ZQ =(z0,.,z63)

Вектор, отриманий в результаті зигзагоподібного зчитування даних із матриці SQ за правилом, що визначається стандартом JPEG (S0<->ZQ). RDоптимізація статистичного кодування можлива за рахунок подовження нульових серій компонент у векторі ZQ шляхом їхнього додаткового обнулення. Для того, щоб у результаті не відбулося помітного ускладнення алгоритму кодування, в оптимізованому варіанті алгоритму контекстного кодування ДКП-коефіцієнтів аналізується лише можливість збільшення фінальної нульової серії, що дає найбільший внесок у додаткову мінімізацію функції J(Zq)=D(Zq)+ÀR( Zq). У цьому вважається, що матриця Q, визначальна квантування коефіцієнтів ДКП, задана. Універсальний алгоритм кодування повинен оперувати деяким набором матриць квантування (Q/) з можливістю вибору необхідної матриці для конкретних вимог до якості та рівня стиснення. Якщо набір матриць досить великий, то підбір матриці квантування Q за принципом мінімуму функції J(Zq) перетворюється на громіздку процедуру, яка не реалізується в реальному масштабі часу стандартними засобами. Крім того, при великому діапазоні можливих значень індексу j його кодування кожного нового блоку окремо тягне неприпустимо високі додаткові бітові витрати. Тому в якості вихідного набору було обрано лише кілька матриць з множини, що рекомендується JPEG, які відповідають найкращому, найгіршому та деяким проміжним рівням якості. У дослідах використовувалося число матриць |(Q/)|=4. Для прискорення виконання операцій поділу, які необхідні при квантуванні, елементи матриць (Q,) були заокруглені до найближчого значення 2к, k=G,\,. Такий підхід дозволяє замінити операції цілочисленного поділу та множення зсувами розрядів двійкового представлення чисел, які зазвичай виконуються реальною апаратурою набагато швидше.

Крім використання алгоритму контекстного кодування коефіцієнтів ДКП (з розділу 4), у шостому розділі запропоновано альтернативний алгоритм статистичного кодування, в якому проквантовані спектри ДКП розбиваються на фіксовані області, що формують окремі (незалежні) потоки даних для арифметичного кодування, та запропоновано експериментальну методику для побудови розбиття спектрів на такі сфери. Незважаючи на те, що в загальній схемі компресії відео вибір був зроблений на користь першого алгоритму кодування спектрів, застосування арифметичного кодування з фіксованим розбиттям спектрів на області незалежного кодування може виявитися кращим при використанні інших (відмінних від ДКП) перетворень, а також у схемах компресії , що використовують векторні квантування спектрів. Наприклад, у схемі, яка розглянута у розділі 4. (Використання векторного квантування в алгоритмах реального масштабу часу важко.)

При дослідженні характеристик підсумкового алгоритму відеокомпресії для оцінки величини помилки кодування у відновленій послідовності В0,В1,.,ВЛ:~1 використовувалося відношення пікового значення сигналу до шуму, яке визначалося таким чином:

PSNR = 101g ¿III

ДБ], де Mi та M2 задають розмір кадру в пікселях. Для експериментів було обрано широко відомі тестові послідовності News, Container ship, Hall monitor, Akiyo, Claire. Результати чисельних експериментів, отримані аспірантом Ф.В.Стрелковим, показали, що у всіх тестах запропонована схема компресії дає високі результати, перевершуючи характеристики кодера MPEG-2, розробленого групою MSSG (mpeg2encode, версія 1.1, див. http://www.mpeg .org/MSSG). Програмне стискування відеопослідовностей при цьому здійснюється в реальному масштабі часу.

Підсумок дослідженням, проведеним у дисертаційній роботі, підбивається у заключному розділі - «Основні висновки та висновок».

На захист дисертації виносяться такі основні результати:

Метод оцінки декорелюючої ефективності ортогональних перетворень та засновані на ньому алгоритми кластеризації корелюваних даних;

ДПКП та швидкий алгоритм його обчислення;

Новий швидкий алгоритм ДПКЛ та його модифікація – алгоритм з неповним обчисленням; алгоритм поєднаних обчислень ДПКЛ для обробки речових масивів у базисі (1,ехр(-2то/3));

Детерміновані та ймовірнісні оцінки коефіцієнтів ДКП;

Алгоритм контекстного кодування спектрів ДКП зображень;

Алгоритми вейвлет-компресії статичних зображень;

Алгоритм пошуку переміщених блоків зображення;

Експериментальна методика побудови розбиття спектрів у сфері незалежного кодування;

Алгоритм відеокомпресії.

Основні результати, викладені у дисертації, опубліковані у 30 роботах. Усі теоретичні результати, що наводяться в дисертації, з 11 написаних у співавторстві робіт отримані особисто автором. У тих випадках, коли експериментальні чисельні дані (таблиці, графіки), що наводяться, із спільних робіт були отримані співавторами, на це явно зазначено по ходу викладу при цитуванні результатів.

Запропонований у шостому розділі алгоритм відеокомпресії був реалізований програмно в рамках робіт, що проводилися в ГУ НВК «Технологічний Центр» Московського державного інституту електронної техніки та в НВП «Технологія». Впровадження розроблених бібліотек відеокомпресії здійснено у ряді програмних систем, що проводять обробку відеозображень (у тому числі кодування) в реальному масштабі часу, серед яких найбільший практичний інтерес представляє система відео контролю та реєстрації Visual Security (див. http://www.tcen.ru /Vs). Копії документів про використання та впровадження результатів дисертаційної роботи є у додатку 6.

Висновок дисертації на тему "Математичне та програмне забезпечення обчислювальних машин, комплексів та комп'ютерних мереж", Умняшкін, Сергій Володимирович

ВИСНОВКИ І ВИСНОВОК

У представленій дисертаційній роботі досліджено різні аспекти застосування дискретних ортогональних перетворень для цифрової компресії зображень як з боку суто формального теоретичного аналізу, так і з боку тих вимог та обмежень, які практика накладає на конкретні обчислювальні схеми та алгоритми. У цілому нині зміст роботи носить прикладну спрямованість, тому більшість теоретичних результатів підкріплено обчислювальними експериментами, результати яких, своєю чергою, як служили ілюстрацією чи перевіркою теорії, але часто давали поштовх і були вихідний матеріал для подальших пошуків.

За результатами проведених у дисертаційній роботі досліджень можна зробити такі висновки.

1. Ортогональні перетворення є основним інструментом для декореляції даних при компресії зображень. У разі коли математична модель дискретного сигналу задається коварійною матрицею, для аналізу ефективності декорелюючої обробки доцільно застосування запропонованого в роботі критерію середньої надмірної ентропії.

2. Спеціально для стиснення корельованих даних отримано та вперше введено до розгляду дискретне псевдокосинусне перетворення (ДтСП). У схемі компресії, що передбачає наявність етапу скалярного квантування коефіцієнтів перетворення, серед розглянутих швидких перетворень, реалізація яких зводиться тільки до операцій складання-віднімання (Уолша, Хаара, псевдокосинусна), ДПКП дає найкращі результати декореляції для дискретного сигналу, що описується марком.

5. Високу ефективність застосування в різних схемах та алгоритмах стиснення даних має метод багатомодельного (багатострумового) арифметичного кодування, а одним із ключових моментів у розробці схем компресії є визначення правил для вибору поточної моделі кодування за контекстом вже оброблених даних. Так, застосування у схемі JPEG запропонованого у розділі 4 алгоритму багатомодельного контекстного арифметичного кодування коефіцієнтів ДКП підвищує ефективність стиснення даних на 10%.

6. При стисканні зображень з використанням багатомодельного кодування деревоподібних структур вейвлет-спектрів правило вибору моделей слід будувати за комбінованим контекстом, який враховує як оточення самого вейвлет-коефіцієнта в саббенді, так і оточення коефіцієнта-батька. Отриманий на цій основі новий ефективний алгоритм компресії цифрових зображень із втратами, розроблений за результатами вивчення статистичних властивостей спектрів дискретних вейвлет-перетворень, показує високі характеристики стиснення при складності реалізації, прийнятної для широкого кола додатків.

7. Для усунення міжкадрової (тимчасової) надмірності відеоданих найбільш доцільним для практичного застосування серед досліджених алгоритмів блокової компенсації переміщень слід визнати запропонований гібридний алгоритм спрямованого пошуку, при якому малі переміщення шукаються точно і ретельно, а значні переміщення - грубіше.

Результати проведених досліджень відбито у 30 друкованих працях, доповідалися та обговорювалися на багатьох всеросійських та міжнародних конференціях. Загалом у дисертаційній роботі отримано нові наукові результати, теоретичні положення яких дозволили значною мірою розвинути та формалізувати процедури аналізу та синтезу схем компресії цифрових зображень, заснованих на використанні дискретних ортогональних перетворень.

Вироблені підходи та рекомендації призвели до побудови конкретних схем та алгоритмів компресії, багато з яких були реалізовані програмно та експериментально підтвердили ефективність свого застосування. Результати досліджень з відеокомпресії, які проводилися в рамках очолюваних автором НДР та фінансувалися Міністерством науки і промисловості РФ, запроваджено у вигляді алгоритмів у програмно-апаратній системі Visual Security (див. додаток №6).

Список літератури дисертаційного дослідження доктор фізико-математичних наук Умняшкін, Сергій Володимирович, 2001 рік

1. Абстрактні алгебраїчні системи та цифрове оброблення сигналів / Вариченко Л.В., Лабунець В.Г., Раков М.А. Київ: Наукова думка, 1986. –248 с.

2. Алексєєв А.Г. Кластеризація корельованого набору даних // «Мікроелектроніка та інформатика 99». VI всерос. міжвуз. н.-т. конф. ст. та асп.: Тез. док. - М: МІЕТ, 1999. - С.133.

3. Ахмед Н., Pao К. Ортогональні перетворення під час обробки цифрових сигналів: Пер. з англ. М.: Зв'язок, 1980. – 248 с.

4. Ватолін Д. С. Гібридна схема фрактальної компресії та квантування векторів для малих блоків // Праці міжнародної конференції Graphicon-98. Москва, 1998, стор 205-212.

5. Віленкін Н.Я. Про один клас повних ортогональних систем // Изв. АН СРСР. Сер. мат. 1947. – Т.П. – С. 363-400.

6. Воробйов В.І., Грибунін В.Г. Теорія та практика вейвлет-перетворення. -С.-Пб.: Вид-во воєн. ун-ту зв'язку, 1999. 204 с.

7. Гашніков М. В., Глумов Н. К, Сергєєв В. В. Інформаційна технологія компресії зображень у системах оперативного дистанційного зондування // Із Самарського центру РАН. 1999. – № 1. – С. 99-107.

8. Голд Би., Рейдер Ч. Цифрова обробка сигналів: Пер. з англ. М: Рад. радіо, 1973. – 368 с.

9. Блакитне Б.І., Єфімов A.B., Скворцов В. А. Ряди та перетворення Уолша: Теорія та застосування. М.: Наука, 1987. – 344 с.

10. Горлов С.К., Користін А.В., Родін В.А. Про одну реалізацію методу стиснення відображень за допомогою нелінійної апроксимації сум Фур'є-Хаара// Теор. функцій та прибл.: Тр. 7-й Саратов, зим. шк. (1994 р.). Ч. 2.-Саратов: Вид.-во СГУ, 1995.

11. Дмитрієв В.І. Прикладна теорія інформації: Навч. для студ. вишів. -М.: Вищ. шк., 1989. 320 с.

12. Єфімов A.B., Поспєлов A.C., Умняшкін C.B. Деякі властивості мультиплікативних ортонормованих систем, що використовуються в цифровій обробці сигналів // Праці математичного інституту ім. В.А.Стеклова РАН. Т.219. – 1997. – З 137-182.

13. Єфімов A.B., Умняшкін C.B. Швидкі алгоритми обчислення дискретного перетворення Крестенсона-Леві та оцінки його спектральних. Показників// Теор. функцій та прибл.: Тр. 7-й Саратов, зим. шк. (1994 р.). Ч. 2. - Саратов: Изд.-во СГУ, 1995. С. 9-20.

14. Жуков В.Г. Дослідження методів порівняння переміщених блоків зображень у алгоритмах стиснення відеопослідовностей. //Мікроелектроніка та інформатика-99. Всерос. міжвуз. н.-т. конф. студентів та аспірантів: Тези доповідей. М.: МЙЕТ,1999. – С. 137.

15. Жуків ДМ. Еквівалентність одновимірного та двовимірного перетворення Крестенсона-Леві // Методи цифрової обробки зображень: Зб. наук. тр. МІЕТ. М: МІЕТ, 1982 - С. 65-70.

16. Задирака В.К., Євтушенко В.М. Оптимальний спосіб зонного кодування з використанням Слент-перетворення // Кібернетика та системний аналіз. 1994. - №4. - с. 56-60.

17. Дослідження та розробка алгоритмів програмного стиснення даних із втратами для цифрової обробки відеозображень: Звіт про НДР (закл.) / HI 111 «Технологія»; рук. -Умняшкін C.B. "Дозор"; № держ. per. 01200004624; Інв. №100704. – Москва, 2000. – 48 с.

18. Кендел М. Рангові кореляції. М: Статистика, 1975. - 216 с.

19. Коваленко КН., Філіппова А.А. Теорія ймовірностей та математична статистика. М: Вища. школа, 1982. – 256 с.

20. Корн Г., Корн Т. Довідник з математики для науковців та інженерів: Пер. з англ. М.: Наука, 1970. – 720 с.

21. Кочетков М.Є. Компресія цифрових зображень з використанням векторного квантування в області ортогональних дискретних перетворень: Дисс. канд. техн. наук. М., 1999. -191 с.

22. Кочетков М.Є., Умняшкін C.B. Багатопотокова реалізація алгоритму арифметичного кодування/М.: МДІЕТ (ТУ), 1998. 21 с. Депоновано у ВІНІТІ 25.12.98 № 3884-В98.

23. Кочетков М.Є., Умняшкін C.B. Про порівняння критеріїв з оцінки ефективності декорелюючих перетворень / М.: МГИЭТ (ТУ), 1998. 34 з. - Деп. у ВІНІТІ 13.04.98, № 1069-В98.

24. Лесін В.В., Лісовець Ю.П. Основи методів оптимізації: Навч. допомога. - М: Вид-во МАІ, 1998. 344 с.

25. Лісовець Ю.П., Поспєлов А. С. Мультиплікативні голографічні перетворення для обробки зображень // Методи цифрової обробки зображень: Зб. наук. тр. М: МІЕТ, 1982 - С. 100-109.

26. Літош І.П. Об'єднання алгоритмів фрактальної та вейвлет-компресії цифрових зображень// «Мікроелектроніка та інформатика -2001». У1П всерос. міжвуз. н.-т. конф. ст. та асп.: Тез. док. -М.: МІЕТ, 2001. -С.147.

27. Марков А.А. Стиснення цифрових зображень з використанням \vavelet-перетворень // «Мікроелектроніка та інформатика 2000». VII всерос. міжвуз. н.-т. конф. ст. та асп.: Тез. док. -М.:МІЕТ, 2000. -С. 114.

28. Мудре А.Є. Численні методи для ПЕОМ мовами Бейсік, Фортран та Паскаль. - Томськ: МП "РАСКО", 1991. -272с.

29. Новіков І.Я., Стечкін С.Б., Основні конструкції сплесків // Фундаментальна і прикладна математика. 1997. – Том 3. – №4. -С.999-1028.

30. Нуссбаумер Г. Швидке перетворення Фур'є та алгоритми обчислення згорток: Пер. з англ. М: Радіо і зв'язок, 1985. - 248 с.

31. Пєєв Є., Боянов К, Бєлчева О. Методи та засоби за компресія на зображення // Автоматика та інформатика.-1994.-28, №3.-стор.3-14.

32. Пєтухов А.П. Введення у теорію базисів сплесків. СПб.: Вид-во СПбДТУ, 1999. 132 с.

33. Поспєлов А. С. Методи обробки цифрової відеоінформації з використанням перетворень голографічного типу// Зб. тр. міжнар. совіщ. за програмою. та мат. методів вирішення фіз. завдань (Дубна, 14-19 червня 1993 р.). Повідомлення ОІЯІР11-94-100. – З, 71-73.

34. Поспєлов А. С. Деякі математичні завдання та алгоритми цифрової обробки інформації з використанням дискретних перетворень: Дис. на соїск. уч. степ, д-ра фіз.-мат. наук. М., 1992. -398 с.

35. Застосування цифрового оброблення сигналів: Пер. з англ. / За ред. Е. Оппенгейма. М: Світ, 1980. – 552 с.

36. Прет У. Цифрова обробка зображень: Пер. з англ. М: Мир, 1982. -Кн.1 і 2.-312 і 480 с.

37. Прет У, Кеш Д., Ендрюс X. Кодування зображень за допомогою перетворення Адамара // ТІІЕР. 1969. – Т.57. - №1. – С. 66-77.

38. Птачок М. Цифрове телебачення. Теорія та техніка / Пер. з чешок, за ред. Л.С.Віленчика. М.: Радіо та зв'язок, 1990. -528 с.

39. Розанов Ю.А. Випадкові процеси. М.: Наука, 1971. – 288 с.

40. Свішников A.A. Прикладні методи теорії випадкових функцій. М.: Наука, 1968.-463 с.

41. Трахтман В.А. Спектральний аналіз у базисі функцій Віленкіна-Крестенсона// Радіотехніка та електроніка. -1975. -Т. 20. -№1. -С.130-138.

42. Трахтман AM, Трахтман В.А. Основи теорії дискретних сигналів кінцевих інтервалах. М: Рад. Радіо, 1975.

43. Умняшкін C.B. Алгоритм кластеризації корелюваних даних // VII Міжнародна конференція. Математика. економіка. Екологія.

44. Освіта. Міжнародний симпозіум. Ряди Фур'є та їх застосування: Тези доповідей. Ростов: Зростання. держ. економ, акад., 1999. – С. 211-212.

45. Умняшкін C.B. Алгоритм пошуку переміщених блоків для кодування цифрових відеозображень // Міжгалузевий науково-технічний журнал «Оборонний комплекс науково-технічного прогресу Росії», №3,2001.-С. 38-41.

46. Умняшкін З. У. Алгоритм фрактального кодування зображень у сфері вейвлет-перетворень // Комп'ютерна математика. Оптажзарахування обчислень: Збірник наукових праць. Том 1. - Кшв: Інститут шбсрнетики ім. В.М.Глушкова, 2001. – С. 385-391.

47. Умняшкін C.B. Швидкі алгоритми обчислення дискретного мультиплікативного перетворення / М: МГІЕТ (ТУ), 1995. 15 с. - Деп. у ВІНІТІ 16.02.95, № 442-В95.

48. Умняшкін C.B. Швидкий алгоритм обчислення дискретного перетворення Крестенсона-Леві для обробки речових масивів/М.: МГІЕТ (ТУ), 1995. 19 с. - Деп. у ВІНІТІ 05.12.95, № 3212-В95.

49. Умняшкін С. В. Використання контекстного арифметичного кодування для підвищення стиснення даних за схемою JPECj // Вісті вузів. Електроніка №3. – 2001. – С. 96-98.

50. Умняшкін C.B. Компенсація переміщення об'єктів під час стиснення відеоданих // «Електроніка та інформатика XXI століття» Третя міжнародна науково-технічна конференція: Тез. док. - М: МІЕТ, 2000.-С. 365-366.

51. Умняшкін С. В. Вейвлет-компресія цифрових зображень з прогнозуванням статистичних моделей // Известия вузів. Електроніка №5. – 2001. – С.86-94.

52. Умняшкін C.B. Метод кодування дискретних зображень з урахуванням перетворення Крестенсона-Леви // Мікроелектроніка та інформатика -96: Тез. доп. міжвуз. наук.-тих. конф. М.: МДІЕТ (ТУ), 1996. - С.167.

53. Умняшкін C.B. Про кластеризацію корелюваних даних. / / Інформаційні технології в інноваційних проектах. Міжнародна конференція (м. Іжевськ, 20-22 квітня 1999 р.): Матеріали доповідей. -Іжевськ, ІжДТУ, 1999. С. 59-65.

54. Умняшкін C.B. Про квантування елементів спектра дискретного перетворення Крестенсона-Леві/М.: МДІЕТ (ТУ), 1995. 12 с. - Деп. у ВІНІТІ 16.02.95, № 441-В95.

55. Умняшкін C.B. Про модифікацію дискретного косинусного перетворення // Теорія наближень та гармонійний аналіз: Тез. доп. міжнар. конф. (Тула, 26-29 травня 1998 р.). Тула: ТулДУ, 1998. – С.264-265.

56. Умняшкін C.B. Про модифікацію дискретного косинусного перетворення // Изв. Тул. держ. ун-ту. Сер. Математика. Механіка. Інформатики. Тула: ТулДУ, 1998. Т. 4. Вип. 1. С. 143-147.

57. Умняшкін C.B. Про оцінку декорелюючих властивостей дискретних перетворень // Мікроелектроніка та інформатика 97: Тези доп. міжвузівської науково-технічної конференції Частина 2. – М. МДІЕТ (ТУ), 1997.-С. 110:

58. Умняшкін C.B. Особливості використання дискретного перетворення Крестенсона-Леві для обробки речовинних масивів // Мікроелектроніка та інформатика: Тез. доп. міжвуз. наук.-тих. конф. 1214 квіт. 1995 М.: МДІЕТ (ТУ), 1995. - С. 188-189.

59. Умняшкін C.B. Оцінка ефективності використання унітарних перетворень для кодування дискретних сигналів //Інформатика та зв'язок: Зб. наук. тр. за ред. В.А.Бархоткіна. М.: МІЕТ. - 1997. С.73-78.

60. Умняшкін C.B. Застосування дискретного перетворення Крестенсона-Леві у цифровій обробці зображень. Дис. канд. техн. наук. -Москва, 1997. – 198 с.

61. Умняшкін C.B. Псевдокосинусне перетворення для стиснення дискретних сигналів // Інформаційні технології та проблеми мікроелектроніки. Зб. наук. тр. -М: МІЕТ. -1999. С.158-170.

62. Умняшкін С. В. Схема RD-оптимізованої компресії для обробки відеоданих у реальному масштабі часу// Прийнято до публікації в журнал «Известия вузів. Електроніка». №6. – 2001.

63. Умняшкін C.B. Цифрова компресія зображень з використанням дискретного перетворення Крестенсона-Леві // Міжгалузевий науково-технічний журнал «Оборонний комплекс - науково-технічний прогрес Росії», №2,2000. С.28-39.

64. Умняшкін C.B., Космач М.В. Оптимізація кодування цифрових зображень методом JPEG // Известия вузів. Електроніка №4-5. -2000. – С. 139-141.

65. Умняшкін C.B., Кочетков М.Є. Аналіз ефективності використання дискретних ортогональних перетворень для цифрового кодування корелюваних даних // Вісті ВНЗ. Електроніка №6. – 1998. – С. 79-84.

66. Умняшкін C.B., Стрєлков Ф.В., Жуков В.Г. Трикрокові алгоритми пошуку переміщених блоків зображення // Інформаційні технології та системи управління. Зб. наук. тр. за ред. В.А.Бархоткіна. - М: МІЕТ, 2000. С. 47-55.

67. Хармут X. Теорія секвентного аналізу. Основи та застосування: Пер. з англ.- М: Світ, 1980. 574 с.

68. Цифрова обробка телевізійних та комп'ютерних зображень / За ред. Ю.Б.Зубарєва та В.Пдворковича. М.: Міжнародний Центр наукової та технічної інформації, 1997. – 212 с.

69. Чен Ш.-К. Принципи проектування систем зорової інформації. -М: Світ, 1994. 408 с.

70. Ендрюс Г. Застосування обчислювальних машин для обробки зображень/Пер. з англ. за ред. Б.Ф.Кур'янова. М: Енергія. – 1977. –161 с.

71. Яворський Б.М., Детлаф А.А. Довідник з фізики для інженерів та студентів вузів.-Видання 7-е, виправлене.-М.: Наука, 1977.-944 с.

72. Ярославський JI.II. Введення у цифрову обробку зображень. М: Рад. радіо, 1979.-312 с.

73. Ярославський Л.П. Цифрова обробка сигналів в оптиці та голографії. Введення у цифрову оптику. М.: Радіо та зв'язок. – 1987. –296 с.

74. Ahmed N., Natarajan Т., Rao K.R. On image processing and discrete cosine transform // IEEE Trans. Комп'ютери. -1974. V. C-23 - №1. – P.90-93.

75. Allen J.B. andRabiner L. R. Виявлений приклад до короткого часу Fourier analysis, synthesis//Proc. IEEE 1977.-Vol. 65. -№ Ію-Р. 1558–1564.

76. Anderson J.В., Huang T.S. Piecewise Fourier перетворення на зображення bandwidth compression // IEEE Trans. Commun. -1972. - V. COM-20 №3. -P.488-491.

77. Andrews H. C., Hunt B.R. Digital Image Restoration.- Englewood Cliffs (NJ): Prentice Hall, 1977. XVIII, 238 p.

78. Andrews H. C., Pratt W.K. Fourier transform coding of images // Hawaii International Conference on System Science, January 1968. P. 677-679.

79. Andrews H.C., Pratt W.K. Transform image coding // Proc. Комп'ютер processing in communications. New York: Polytechnic Press, 1969. -P. 63-84.

80. Antonini M., BarlaudM., Mathieu P., іDaubechies I., Image coding using wavelet transform// IEEE Trans. Image Proc. Vol. 1. - №2, 1992. -P. 205-220.

81. Barnsley F., Jacquin A. Application of recurrent iterated function systems to images//Proc. SPIE.- 1988.-Vol. 1001.-P. 122-131.

82. Berger T. Rate Distortion Theory. Endlewood Cliffs, NJ: Prentice Hall, 1971.

83. Bierling M. Displacement estimation by hierarchical block-matching // Proc. SPIE Conf. On Vis. Commun. And Image Proc. Cambrige, 1988. – P. 942-951.

84. Bilgin A., Sementilli.P. і Marcellin M. Progressive image coding using trellis quantization // IEEE Trans. Image Proc. 1999.-V.8.-№11.-P. 1638–1643.

85. Chernov V.M., Dmitriyev A. G. Image Compression За допомогою дискретних ортогональних перетворень з «гойдужними» Basis Functions // Комп'ютерна оптика. 1999. – Вип. 19. – С. 184-187.

86. Cheung С.К., Ро L.M. Як hybrid adaptive search algorithm for fast block motion estimation // Proc. IEEE International Symp. on Signal Proc. and its App. (Aug.1996). Vol.1. 1996 – P.365-368.

87. Chrestenson H.E. A class of generalized Walsh functions // Pacific. J. Math. -1955.-V.5.-№l.-P. 17-32.

88. Chrysafis C. Wavelet image compression rate distortion optimizations and complexity reductions: PhD (Electrical Engineering) Thesis. University of Southern California, Los Angeles, 2000. - 144 pages.

89. Chrysafis C., Ortega A. Efficient Context-Based Entropy Coding for Lossy Wavelet Image Compression // Proc. Data Compression Conference. -Snowbird (Utah), 1997. P. 241-250.

90. З ho N., Lee S. Fast algorithm and implementation of 2-D discrete cosine transform // IEEE Trans. Circuits and Systems. 1991. -V.38. – P.297-305.

91. ChouP.A., Lookabaugh Т., GrayR.M. Entropy-constrained vector-quantization 11 IEEE Trans. ASSP. 1989. – Vol. 37. -№1. -P.31-42.

92. Coding of moving pictures and audio (MPEG-4). Стандарт ISO/IEC 14496: 1999.

93. Cohen A., Daubechies I., Feauveau J.-C., Biorthogonal bases of compactly supported wavelets // Comm. Pure Appl. Math. 1992. – V. 45. – №5. – P. 485560.

94. Coifman R., і Wickerhauser M. V., Entropy-based Algorithms для Best Basis Selection // IEEE Trans. Інформація Theory. 1992. – Vol. 38. - №2 – P. 713718.

95. Cooley J. W., Tukey J.W. На algoritm for machine computation of complex Fourier series // Mach. Comput. 1965. – V. 19. – P. 297-301.

96. Cosman P.C., GrayRM., і VetterliM. Vector Quantization of Image Subbands: A survey // IEEE Trans. Image Proc. 1996. – V. 5. – №5. – P. 202225.

97. Costantini R. та ін. A Low-Complexity Video Coder базується на Discrete Walsh Hadamard Transform //Proc. European Signal Processing Conference 2000 (Tampere, Finland, September 5-8). -2000. -P.1217-1221.

98. Crouse M. and Ramchandran K. Виконує трехholding і quantizer selection для transform image-coding: entropy-constrained analysis and applications to baseline JPEG // IEEE Trans, on Image Processing. 1997. – Vol. 6. -№2 – P. 285-297.

99. Davis G.M., A wavelet-based analysis of fractal image compression // IEEE Trans. Image Proc. 1998. – V.7-№2. -P.141-154.

100. Davis G., Nosratinia A. Wavelet-базований Image Coding: An Overview // Applied and Computational Control, Signals and Circuits. -1998. -V.l. -№1. -P. 205269.

101. Deever A. і Hemami S. What's your sign?: Efficient sign coding for embedded wavelet image coding 11 Прос.

102. Duhamel P., Guillemont C. Polynomial transform computation of 2-D DCT // Proc. ASSP "90. 1990. - P.1515-1518.

103. ЕфімовА. V. Multiplicative function systems and their applications in discrete information processing // Approximation and function spaces/ Banach center publications (Warsaw). 1989. – V.22. - P. 111-117.

104. Ефлмов В.М., Колесніков А.Н. Image compression with preliminary interpolation of the signal // Pattern Recognition and Image Analysis. 1996. – Vol. 6. - №1.

105. EliottD.F., Rao K.R. Fast transforms: algorithms, analyses, applications. -London: Academic Press inc., 1982. 488 p.

106. Enomoto II, Shibata K. Orthogonal transform coding system for television signals // IEEE Trans. Electromagnetic Compatibility. 1971. - Special issue on Walsh functions. -V. EMC-13. - №3. – P. 11-17.

107. Feig E. Fast scaled DCT algorithm // Proc. SPIE Int. Soc. Opt. Eng. 1990. -Vol. 1244.-P. 2-13.

108. Fischer TR, and WangM. Entropy-захищений трелліс кодований quantization// IEEE Trans. Inf. Theory. 1992. – Vol. 38 - №2 – P. 415-426.

109. Fisher Y. Fractal Compression: Theory and Application до Digital Images. -New York: Spinger Verlag, 1994. 341 p.

110. Good J. The interaction algorithm and practical Fourier analysis // J. Royal Stat. Soc. (London). 1958. – V. B-20. – P. 361-372.

111. Gray R.M. Vector Quantization // IEEE ASSP Magazine. -Apr. 1984. -P.4-29

112. Gray R„ Neuhoff D. Quantization // IEEE Trans. Inf. Theory. Oct. 1998. – Vol. 44.-No. 6.-P. 2325-2383.

113. HabibiA., WintzP.A. Image coding by linear transformation and block quantization//IEEE Trans. Comm. Tech. -1971. -V. COM-19. №1. -P.50-63.

114. Hamidi M., Pearl J. Comparison of cosine and Fourier transforms Markov-I signals 11 IEEE Trans. ASSP. V.24. – 1976. – P.428-429.

115. Hauque M.A. A 2-dimensional fast cosine transform // IEEE Trans. ASSP. -1985. V. 33. - №6. – P.1532-1538.

116. Huang J. Y., Schultheiss. Block quantization of correlated Gaussian random variables// IEEE Trans. Commumications. -1963. -V. CS-11 (Sept.) -P. 289296.

117. Information technology Generic coding of moving pictures and associated audio information: Video. //Recommendation ITU-T H.262. - Standard ISO/IEC 13818-2-2000.

118. ISO/IEC JTC1 Committee Draft 10918-1. Digital compression and coding of continuous-tone still images. Part 1. Requirements and guidelines. -1991.

119. ISO/IEC JTC1 Committee Draft 10918-2. Digital compression and coding of continuous-tone still images. Part 2. Compliance Testing. 1991.

120. Jacquin A. Fractal image coding спирається на теорію з iterated contractive image transformations // Proc. SPIE Visual Comm. And Image Proc. 1990. – P.227-239.

121. Jacquin A. Image coding based on fractal theory of iterated contractive image transformations // IEEE Trans. Image Proc. 1992. – Vol.1. - №1. -P. 18-30.

122. Jafarkhani H., Farvardin N., і Lee C.-C., Adaptive image coding based on the discrete wavelet transform 11 Proc. IEEE Int. Conf. Image Proc. Vol. 3-Austin (TX), 1994. - P. 343-347.

123. Jain J.R. та Jain A.K. Displacement measurement and its application in interframe image coding // IEEE Trans. Comm. 1981. – Vol. 29. - №12. -P.1799-1806.

124. JoshiR.L., Fischer T.R., і Bamberger R.H. Optimum classification in subband coding of images // Proc. IEEE Int. Conf. Image Proc. Vol. 2 – Austin (TX), 1994.-P. 883-887.

125. Joshi R.L. et al., Comparison of different methods of classification in subband coding of images// IEEE Trans. Image Processing. 1997. – Vol. 6. – Nov. – P. 1473-1486,1997.

126. JPEG2000. Part 1. Final Committee Draft Version 1.0. ISO/IEC JTC1/SC29 WG1.-205 сторінок.

127. Kasner J.H., Marcellin M. W. Adaptive wavelet coding of images // Proc. IEEE Int. Conf. Image Proc. Vol. 3 – Austin (TX), 1994. – P. 358-362.

128. Koga T. et al, Motion compensated interframe coding for video conferencing // Proceedings of the National Telecommunications Conference, New Orleans, Louisiana, Nov. 29 Dec. 3. – 1981. – Vol. 4. – P. G5.3.1-G5.3.5.

129. Kossentini F., Chung W.C., та Smith M.J.T. // IEEE Transactions on Image Processing. -1999. -Vol. 8.-№2.-P. 145-154.

130. Kurosaki M., WakiH. A JPEG-compliant colorimage compression/decompression LSI // Mitshubisi Elec. Adv. -1994. -V.68, Sept. -P.17-18.

131. Levy P. Sur une generalization des fonctions ortogonales de M. Rademacher II Comment, math. helv. 1944. – V.16. – P. 146-152.

132. Lewis AS, Knowles G. Image Compression За допомогою 2-D Wavelet Transform . II IEEE Trans. Image Proc. 1992. – Vol. 1. - №2. – P.244-250.

133. Linde Y., Buzo A., Gray R.M. An algorithm for vector quantizer design // IEEE Trans. On Comm. – 1980. – V.28. №1. - P.8 ^ 95.

134. LoPresto S.M., Ramchandran K., OrchardM.T. Image Coding базується на Mixture Modeling of Wavelet Coefficients and Fast Estimation-Quantization Framework // Proc. Data Compression Conference. Snowbird (Utah), 1997. – P. 221-230.

135. MallatS., Multiresolution aproximation and wavelet ортоnormal bases of L2(R) // Trans. AMS. 1989. – V.315. -P.69-87.

136. Marcellin M. та ail. An Overview of JPEG-2000 // Proc. Data Compression Conference, J. A. Storer andM. Cohn, eds. Snowbird, Utah, Mar. 28 березня. 30, 2000. Snowbird, 2000. – P. 523-541.

137. MarchallX. Motion estimation and compensation for very low bitrate video coding: Docteur of Sciences Appliquées. Université Catholique de Louvalin. -Louvalin-la-Neuve, 1998. - 228 pages.

138. Nasrabadi N.M., King R.A. Image coding using vector quantization: A review // IEEE Trans, on Communication. 1988. - V. 36. -No.8. – P. 957-971.

139. Nelson M., Gailly J A. The Data Compression Book (Second Edition). New York: M & T Books, 1995. - 541 p.

140. Pearl J. On coding and filtering stacionary signals by discrete Fourier transforms // IEEE Trans. Inf. Theory. 1973. – Vol. IT-19. – P. 229-232.

141. Pratt W.K, Andrews H.C. Application of Fourier-Hadamard transformation to bandwidth compression // Picture bandwidth compression / Ed.: Huang TS, Tretiak O.J. New York: Gordong and Breach, 1972. – P. 515-554.

142. Pratt W.K, Chen W.H., Welch L.R. Slant transform image coding // IEEE Trans. Commun. -1974. -V. COM-22. P.1075-1093.

143. Queluz M.P., Motion estimation for video coding: review // HF Magazine - December 1995. Special Issue on Video Coding. – No. 4. – pp. 5-28.

144. Ramachandran K, Vetteri M. Best wavelet packet bases in rate-distortion sense // IEEE Trans. Image Proc. 1993. -V.2. -№2. – P. 160-175.

145. Rao K.R., Narasimhan M.A., Reviduri K. Image data processing з Hadamard-Haar transform// IEEE Trans. Комп'ютери. 1975. – V. C-23. - №9. – P. 888-896.

146. Rao K.R., Yip P. Discrete cosine transform algorithms, advantages, applications. - London: Academic Press Inc., 1990.

147. Роска Т., Борос Т., Радванії А., Тіран П. і ChuaL.O. Detecting Moving and Standing Objects Using Cellular Neural. Networks // International Journal of Circuit Theory and Applications. Vol. 20. – 1992. – P.613-628.

148. Said A. та Pearlman W.A. Новий швидкий і ефективний image codec базується на set partitioning в hierarchical trees // IEEE Trans, on Circuits and Systems for Video Technology. 1996. – Vol. 6. - №3, June. – P. 243-250.

149. Shapiro J.M. Embedded image coding using zerotrees of wavelet coefficients 11 IEEE Trans. Signal Processing, vol. 41, pp. 3445-3462, Dec 1993.

150. Stefanoiu D. Introduction to signal processing with wavelets // Studies on Information and Control. -1994. V.3. - №1. – P. 97-110.

151. Storer J. A. Data compression: Methods and theory. Rockville (Md): Computer science press, 1988. - X, 413 p.

152. Umnyashkin S. V. Image compression ґрунтується на змішаному послідовному моделюванні wavelet trees // Reports from Vaxjo University (Sweden) Mathematics, natural sciences and technology. – Nr. 11 (September), 2001. - 18 pages

153. Umnyashkin S. V., Strelkov F. V. У RD-оптимізованих сферах для реального часу video compression // Reports from Vaxjo University (Sweden) Matematics, natural sciences and technology. – Nr. 12 (Січ), 2001. - 15 pages.

154. Van de Walle A., Merging fractal image compression and wavelet transform methods 11 Fractals. 1997. – vol. 5 (Supplementary Issue), April. - P.3-15.

155. Vetterly M., Herley C., Wavelets та Filter Banks: Theory and Design // IEEE Trans. Signal Proc. 1992. – V.40. - №9. – P.2207-2232.

156. Video codec for audiovisual services at p x 64 kbit/s. //Recommendation ITU-T H.261. -1993.

157. Video coding for low bit rate communication // Recommendation ITU-T H.263. Стандарт ISO/IEC 13818-2: 1998.

158. Wallace G.K. JPEG algoritm for image compression standard // Communications of the ACM. 1991. -V.34. -№4. – P. 30-44.356

159. WeiD., PaiH.-T., andBovikA. C., Antisymmetric Biorthogonal Coiflets для Image Coding // Proceedings IEEE International Conference on Image Processing. Chicago, 1998. – Vol. 2. – P. 282-286.

160. Witten I., Neal RM, Cleary J. G. Arithmetic coding for data compression // Comm. ACM. 1987. – Vol.30. - №6. – P. 520-540.

161. Woods J. W., Huang T.S. Picture bandwidth compression by linear transformation and block quantization // Picture bandwidth compression / Ed.: Huang TS, Tretiak O.J. -New York: Gordong and Breach, 1972. P.555-573.

162. Xiong Z., Ramchandran K. та OrchardM.T. Space-frequency Quantization for Wavelet Image Coding // IEEE Trans. Image Proc. V.6 – May 1997, P. 677693.

163. Xiong Z., Ramchandran K., і Orchard M. Wavelet пакети image coding using space-frequency quantization // IEEE Trans. Image Proc. 1998. – Vol. 7.-№6. – P. 892-898.

164. Xiong Z., Ramchandran K., Orchard M., Zhang Y.-Q. A comparative Study of DCT-і Wavelet-Based Image Coding // IEEE Trans. На Circuits and Systems for Video Technology. -1999. V.9 – №5. – P.692-695.

165. Zhang Z. and Wei V.K., на онлайн універсальної згоди з'єднання даних algoritm via continious codebook refinement. Part I. Basic results // IEEE Trans. Inform. Theory. Vol.42. – May 1996. – P.803-821.

Зверніть увагу, наведені вище наукові тексти розміщені для ознайомлення та отримані за допомогою розпізнавання оригінальних текстів дисертацій (OCR). У зв'язку з чим у них можуть бути помилки, пов'язані з недосконалістю алгоритмів розпізнавання. У PDF файлах дисертацій та авторефератів, які ми доставляємо, таких помилок немає.

Перетворення, які використовуються для стиснення зображень, повинні бути швидкими і, по можливості, легко реалізованими на комп'ютері. Це передусім передбачає, такі перетворення мають бути лінійними. Тобто, перетворені величини є лінійними комбінаціями (сумами з деякими множниками або вагами) вихідних величин (пікселів), причому відповідним множником або вагою є деяке число (коефіцієнт перетворення). Значить, де . Наприклад, при цьому перетворення можна записати в матричній формі

яка у випадку набуде такий вид: . Кожен вектор-стовпець матриці називається "базисним вектором".

Важливим завданням є визначення коефіцієнтів перетворення. Основна вимога полягає в тому, щоб після перетворення величина була б великою, а решта величин стали б малими. Основне співвідношення передбачає, що буде більшим, якщо ваги посилюватимуть відповідні величини . Це станеться, наприклад, якщо компоненти векторів мають близькі значення і однакові знаки. Навпаки, буде малим, якщо ваги будуть малими, і половина їх матиме знак, протилежний знаку відповідного числа . Тому, якщо виходять великі , то вектори мають подібність до вихідного вектора , а малі означають, що компоненти сильно відрізняються від . Отже, базисні вектори можна інтерпретувати як інструмент вилучення деяких характерних ознак вихідного вектора.

На практиці ваги не повинні залежати від вихідних даних. Інакше їх доведеться додавати в стислий файл для використання декодером. Це міркування, і навіть те що, що вихідні дані є пікселами, тобто, неотрицательными величинами, визначає спосіб вибору базисних векторів. Перший вектор, той, який, породжує, повинен складатися з близьких, можливо, чисел, що збігаються. Він посилюватиме невід'ємні величини пікселів. А решта векторів базису повинні наполовину складатися з позитивних чисел, а на іншу половину - з негативних. Після множення на позитивні величини та їх складання результат буде малим числом. (Це особливо вірно, коли вихідні дані близькі, а ми знаємо, що сусідні пікселі мають, зазвичай, близькі величини.) Нагадаємо, що базисні вектори є деяким інструментом для отримання особливостей вихідних даних. Тому хорошим вибором будуть базисні вектори, які сильно відрізняються один від одного і тому можуть отримувати різні особливості. Це призводить до думки, що базисні вектори повинні бути взаємно ортогональні. Якщо матриця перетворення складається з ортогональних векторів, перетворення називається ортогональним. Інше спостереження, що дозволяє правильно вибирати базисні вектори, полягає в тому, що ці вектори повинні мати все більші частоти зміни знака, щоб видобувати, так би мовити, високочастотні характеристики даних, що стискуються при обчисленні перетворених величин.

Цим властивостям задовольняє наступна ортогональна матриця:

. (3.5)

Перший базовий вектор (верхній рядок ) складається з одних одиниць, тому його частота дорівнює нулю. Всі інші вектори мають дві +1 і дві -1, тому вони дадуть невеликі перетворені величини, які частоти (виміряні кількістю змін знаків у рядку) зростають. Ця матриця подібна до матриці перетворення Адамара Уолша (див. рівняння (3.11)). Наприклад, перетворимо початковий вектор (4,6,5,2):

Результат цілком підбадьорливий, оскільки число стало більшим (порівняно з вихідними даними), а два інших числа стали малими. Обчислимо енергії вихідних та перетворених даних. Початкова енергія дорівнює , а після перетворення енергія стала , що вчетверо більше. Енергію можна зберегти, якщо помножити матрицю перетворення коефіцієнт 1/2. Новий твір буде рівним. Отже, енергія зберігається і концентрується у першій компоненті, і вона тепер складає від загальної енергії вихідних даних, у яких частку першої компоненти припадало всього 20%.

Інша перевага матриці полягає в тому, що вона робить зворотне перетворення. Вихідні дані (4,6,5,2) відновлюються за допомогою твору.

Тепер ми можемо оцінити переваги цього перетворення. Квантуємо перетворений вектор (8.5,1.5,–2.5,0.5) за допомогою його округлення до цілого та отримуємо (9,1,–3,0). Робимо зворотне перетворення та отримуємо вектор (3.5,6.5,5.5,2.5). В аналогічному експерименті ми просто видалимо два найменші числа і отримаємо (8.5,0,-2.5,0), а потім зробимо зворотне перетворення цього грубо квантованого вектора. Це призводить до відновлених даних (3,5.5,5.5,3), які дуже близькі до вихідних. Отже, наш висновок: навіть це просте та інтуїтивне перетворення є гарним інструментом для «вичавлювання» надмірності з вихідних даних. Більш витончені перетворення дають результати, які дозволяють відновлювати дані з високим ступенем схожості навіть при грубому квантуванні.

Одні художники відображають сонце у жовте
плями, а інші жовті плями в сонці.
- Пабло Пікассо